17
Estadística Estadística Descriptiva. IES “Fuerte de Cortadura” Página 1 de 17 ESTADÍSTICA DESCRIPTIVA 1. Introducción. 2. Conceptos generales. 3. Frecuencias y tablas. 4. Gráficos estadísticos. 4.1 Diagrama de barras. 4.2 Histograma. 4.3 Poligonal de frecuencias. 4.4 Diagrama de sectores. 5. Medidas de centralización. 5.1. Media. 5.2. Moda. 5.3. Mediana. 6. Medidas de posición. 7. Medidas de dispersión. 7.1. Rango o recorrido. 7.2. Varianza y desviación típica. 7.3. Coeficiente de variación. 8. Interpretación de los parámetros estadísticos x y σ Ejemplos Problemas 1 Introducción La Estadística es la parte de la Matemática que estudia los fenómenos que se prestan a cuantificación, que generan conjuntos de datos. La misión del estadístico es la de simplificar al máximo la información disponible, a fin de que pueda ser clara y útil. Además, si el fenómeno lo permite, tratará de inferir las leyes que expliquen el comportamiento de ese fenómeno. Por tanto, podemos distinguir dos aspectos de la Estadística: El de la Estadística descriptiva, que se ocupa de examinar todos los elementos de un conjunto, describir la información disponible con la ayuda de tablas y gráficos, y de resumirla al máximo mediante los parámetros estadísticos. El de la Estadística inferencial, que trata de generalizar, para todo un conjunto (población), los resultados obtenidos al estudiar una parte del mismo (muestra) Tampoco puede olvidarse que la Estadística debe su nombre al Estado. En el siglo pasado se entendió que la Estadística era la "Ciencia del Estado", esto es, que para gobernar de manera racional a los pueblos se hacía preciso disponer de conocimientos acerca de su población y riqueza, conocimiento que debía proporcionar la Estadística. Más tarde, la nueva ciencia desbordó este ámbito. Hoy, la aplicación de la Estadística es universal y sirve tanto para contrastar el efecto de los medicamentos, como para contribuir a la toma de importantes decisiones. 2 Conceptos generales La Estadística, como sabes, tiene por objeto el desarrollo de técnicas para el conocimiento numérico de un conjunto de datos empíricos (recogidos mediante experimentos o encuestas) Vamos a definir algunos conceptos básicos: EJEMPLOS Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y que serán sujetos de nuestro estudio Los 18690 alumnos de una cierta universidad. Muestra: Es un subconjunto, extraído de la población, cuyo estudio sirve para inferir características de toda la población. Al número de elementos de la muestra se le llama tamaño de la muestra. Un censo es una muestra que consiste en elegir a toda la población. 650 alumnos de esa universidad, elegidos al azar. Individuo: Es cada uno de los elementos de la población o muestra. Cada uno de los alumnos matriculados en esa universidad Caracteres o variables: Caracteres son los aspectos que deseamos estudiar en los individuos de una población. Cada carácter puede tomar distintos valores o modalidades. Una variable estadística recorre todos los valores de un cierto carácter. Edad, sexo, número de años que ha estado matriculado, estatura,...son caracteres. Cada uno de ellos lleva asociada una variable. La edad toma valores entre 17 años y 45 años, por ejemplo El sexo toma los valores o modalidades V y M Clasificación de las variables estadísticas: Cualitativas: No toman valores numéricos El sexo, la carrera que estudian. Cuantitativas discretas: Toman valores numéricos aislados Número de años matriculados, número de hermanos. Cuantitativas continuas: Pueden tomar todos los valores en un intervalo. Estatura, peso.

ESTADÍSTICA DESCRIPTIVA - Junta de Andalucía · PDF file3. Frecuencias y tablas. ... El de la Estadística descriptiva, ... Volvamos ahora al momento en qué sólo teníamos una

Embed Size (px)

Citation preview

Estadística Estadística Descriptiva.

IES “Fuerte de Cortadura” Página 1 de 17

ESTADÍSTICA DESCRIPTIVA

1. Introducción. 2. Conceptos generales.

3. Frecuencias y tablas. 4. Gráficos estadísticos.

4.1 Diagrama de barras.

4.2 Histograma.

4.3 Poligonal de frecuencias. 4.4 Diagrama de sectores.

5. Medidas de centralización. 5.1. Media.

5.2. Moda. 5.3. Mediana.

6. Medidas de posición. 7. Medidas de dispersión.

7.1. Rango o recorrido. 7.2. Varianza y desviación típica.

7.3. Coeficiente de variación.

8. Interpretación de los parámetros estadísticos x y σ

Ejemplos Problemas

1 Introducción

La Estadística es la parte de la Matemática que estudia los fenómenos que se prestan a cuantificación, que generan conjuntos de datos. La misión del estadístico es la de simplificar al máximo la información disponible, a fin de que pueda ser clara y útil. Además, si el fenómeno lo permite, tratará de inferir las leyes que expliquen el comportamiento de ese fenómeno. Por tanto, podemos distinguir dos aspectos de la Estadística:

El de la Estadística descriptiva, que se ocupa de examinar todos los elementos de un conjunto, describir la información disponible con la ayuda de tablas y gráficos, y de resumirla al máximo mediante los parámetros estadísticos.

El de la Estadística inferencial, que trata de generalizar, para todo un conjunto (población), los resultados obtenidos al estudiar una parte del mismo (muestra)

Tampoco puede olvidarse que la Estadística debe su nombre al Estado. En el siglo pasado se entendió que la Estadística era la "Ciencia del Estado", esto es, que para gobernar de manera racional a los pueblos se hacía preciso disponer de conocimientos acerca de su población y riqueza, conocimiento que debía proporcionar la Estadística. Más tarde, la nueva ciencia desbordó este ámbito. Hoy, la aplicación de la Estadística es universal y sirve tanto para contrastar el efecto de los medicamentos, como para contribuir a la toma de importantes decisiones.

2 Conceptos generales

La Estadística, como sabes, tiene por objeto el desarrollo de técnicas para el conocimiento numérico de un conjunto de datos empíricos (recogidos mediante experimentos o encuestas)

Vamos a definir algunos conceptos básicos:

EJEMPLOS Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y que serán sujetos de nuestro estudio

Los 18690 alumnos de una cierta universidad.

Muestra: Es un subconjunto, extraído de la población, cuyo estudio sirve para inferir características de toda la población. Al número de elementos de la muestra se le llama tamaño de la muestra. Un censo es una muestra que consiste en elegir a toda la población.

650 alumnos de esa universidad, elegidos al azar.

Individuo: Es cada uno de los elementos de la población o muestra.

Cada uno de los alumnos matriculados en esa universidad

Caracteres o variables: Caracteres son los aspectos que deseamos estudiar en los individuos de una población. Cada carácter puede tomar distintos valores o modalidades. Una variable estadística recorre todos los valores de un cierto carácter.

Edad, sexo, número de años que ha estado matriculado, estatura,...son caracteres. Cada uno de ellos lleva asociada

una variable. La edad toma valores entre 17 años y 45 años, por ejemplo El sexo toma los valores o modalidades V y M

Clasificación de las variables estadísticas:

Cualitativas: No toman valores numéricos El sexo, la carrera que estudian.

Cuantitativas discretas: Toman valores numéricos aislados Número de años matriculados, número de hermanos.

Cuantitativas continuas: Pueden tomar todos los valores en un intervalo.

Estatura, peso.

Estadística Estadística Descriptiva.

IES “Fuerte de Cortadura” Página 2 de 17

3 Frecuencias y tablas

Imaginemos que hemos hecho N observaciones de valores de una variable estadística. La lista de N valores no permite apreciar fácilmente lo que sucede con esa variable en el colectivo estudiado, máxime si, como suele ocurrir, N es grande. Si la variable estudiada es cuantitativa, o es ordinal, pueden disponerse ordenadamente las N observaciones, según los valores obtenidos. No obstante, a menudo sucede que un mismo valor se presenta en varios de los N individuos estudiados. Por eso damos las siguientes definiciones: Se llama frecuencia absoluta del valor xi de una variable X al número de veces que se ha presentado dicho valor, en las N observaciones hechas. La representaremos por fi (Es obvio que debe cumplirse: f1 + f2 + f3 + ... + fn = N) Se llama frecuencia absoluta acumulada del valor xi al número de veces que se han presentado los valores inferiores o iguales a xi . La representaremos por Fi . Evidentemente, es la suma de las frecuencias absolutas de todos los valores de X inferiores o iguales a xi. La frecuencia absoluta de un valor nos dice, pues, si se presenta muchas o pocas veces. No obstante, "seis de cada diez veces" puede ser "mucho", mientras que "seis de cada mil veces" puede ser "poco". Por eso, para determinar si un valor es muy frecuente, o no, es mejor utilizar su frecuencia relativa: Se llama frecuencia relativa del valor xi de una variable X, al cociente entre la frecuencia absoluta de xi y el número total de datos (N) que intervienen en la distribución: fri = fi/N (ó hi ). Se llama frecuencia relativa acumulada del valor xi a la suma de las frecuencias relativas de todos los valores de X inferiores o iguales a xi . Se representa por Fri o Hi .Así pues Fri = fr1 + fr2 +...+fri = Fi/N. El valor de la frecuencia relativa debe hallarse entre 0 y 1, por su misma definición. Además, la suma de las frecuencias relativas de todos los valores posibles debe ser 1, pues La frecuencia relativa puede expresarse con una fracción (la fracción fi/N que la define), con un número real entre 0 y 1 (obtenido al pasar a decimal la fracción fi/N), o con un porcentaje (obtenido al multiplicar por 100 el decimal anterior). Si se representa con un porcentaje, deberá hallarse entre 0% y 100%, y todas las frecuencias sumarán el 100%. Volvamos ahora al momento en qué sólo teníamos una "simple lista de valores". Podemos ver qué valores se han presentado, hacer su recuento y calcular sus frecuencias, con una simple tabla. Las tablas estadísticas o de frecuencias están formadas por una columna en la que colocamos los distintos valores de la variable estadística y, por otras en las que aparecen las correspondientes frecuencias y/o porcentajes. Veamos cómo, con un ejemplo. Supongamos que las notas obtenidas por los 40 alumnos de una clase, en una prueba de Matemáticas, han sido éstas:

2 5 8 6 7 3 6 1 9 7 4 6 6 0 2 3 4 4 7 0

4 10 5 8 4 7 3 4 2 8 4 9 5 4 3 5 6 2 6 3 En la tabla que sigue se procede a ordenar, recontar las notas y calcular las frecuencias de cada una:

Nota xi

Frecuencia absoluta fi

Frecuencia absoluta acumulada Fi

Frecuencia relativa hi

Frecuencia relativa acumulada Hi

Porcentajes hix100

0 2 2 1/20 2/40 5

1 1 3 1/40 3/40 2’5

2 4 7 1/10 7/40 10

3 5 12 1/8 12/40 12’5

4 8 20 1/5 20/40 20

5 4 24 1/10 24/40 10

6 6 30 3/20 30/40 15

7 4 34 1/10 34/40 10

8 3 37 3/40 37/40 7’5

9 2 39 1/20 39/40 5

10 1 40 1/40 1 2’5

40 1 100

Estadística Estadística Descriptiva.

IES “Fuerte de Cortadura” Página 3 de 17

En la tabla anterior se incluyen frecuencias de todo tipo, pero normalmente sólo consideraremos las frecuencias absolutas. Las frecuencias acumuladas, relativas y porcentajes no los incluiremos, si no se piden expresamente o no son necesarias para cálculos posteriores. En caso de que la variable sea continua, o bien discreta pero con un número de datos muy grande, en vez de contabilizar las frecuencias de cada valor por separado, suelen agruparse los valores en intervalos, denominados clases o intervalos de clase. Después se identifican todos los elementos que han sido agrupados en un mismo intervalo con el punto medio de éste, llamado marca de clase. Esta es la denominada técnica de agrupación de datos. Ahora bien, ¿cuál es el número idóneo de clases que debemos escoger a la hora de agrupar? ¿cómo realizamos este agrupamiento? No existe una contestación tajante a estas preguntas; existen incluso varios criterios para dar respuesta a estas cuestiones. Con carácter muy general podemos dar varios criterios y etapas para realizar el agrupamiento:

Se localizan los valores extremos a y b y se halla su diferencia r = b - a.

Se decide el número de intervalos que se quiere formar, teniendo en cuenta el número de datos que se poseen. En general entre 5 y 15 intervalos puede ser un número adecuado.

Se toma un intervalo total algo mayor que el recorrido r y que sea múltiplo del número de intervalos, con objeto de que éstos tengan una longitud entera.

Se forman los intervalos de modo que el extremo inferior del primero sea algo menor que a y el extremo superior del último sea algo superior a b. Es deseable que los extremos de los intervalos no coincidan con ninguno de los datos; de hacerlo, incluiremos en el intervalo un extremo y excluiremos el otro (Ej.: [2,5) ó (2,5]) Para evitarlo, puede convenir que dichos extremos tengan valores no enteros. Es conveniente que todos los intervalos tengan la misma longitud; ello facilita los cálculos. Si los datos son muy dispersos habrá que optar por longitudes distintas.

Cuando se elabora una tabla con datos agrupados se pierde algo de información (pues en ella se ignora cada valor concreto, que se difumina en un intervalo). A cambio se gana en claridad y eficacia. Veamos cómo se realiza el agrupamiento, con un ejemplo. A los 100 empleados de una empresa de piezas de precisión, se les ha realizado una prueba de habilidad manual. En una escala de 0 a 100 se han obtenido las siguientes puntuaciones:

27 66 32 36 46 37 75 81 18 33 47 74 37 52 47 66 80 87 37 29

46 15 29 65 76 67 23 35 94 23 25 56 73 78 17 28 76 58 45 36

55 60 17 56 23 82 64 50 51 45 37 62 62 26 69 36 54 42 40 54

27 62 28 90 46 92 36 33 23 66 18 82 47 49 59 45 73 43 47 83

78 65 39 55 53 91 38 35 68 78 91 23 34 43 55 56 74 56 62 38

Observamos que los valores extremos son 15 y 94. La amplitud total entre los datos es de 80 puntos, ya que

ambas puntuaciones están incluidas. Agruparemos los datos en 8 intervalos de amplitud 10: (14,24], (24,34],.., (84,94]. Realizando el recuento con atención, se obtiene la tabla de frecuencias.

Clases Marcas de clase xi

fi

(14,24] 19 10

(24,34] 29 12

(34,44] 39 17

(44,54] 49 18

(54,64] 59 13

(64,74] 69 13

(74,84] 79 13

(84,94] 89 11

100

Estadística Estadística Descriptiva.

IES “Fuerte de Cortadura” Página 4 de 17

4 Gráficos estadísticos

Las tablas estadísticas muestran la información de forma esquemática y están preparadas para cálculos posteriores. La misma información estadística puede mostrarse de forma global y más visual, utilizando los gráficos estadísticos. Los gráficos poseen un fuerte poder de comunicación de los resultados de un estudio estadístico. Como en las tablas, hay que indicar la fuente de los datos y las unidades en qué estos han sido medidos. Asimismo, conviene titularlos y numerarlos. Detallamos a continuación, los tipos de gráficos más frecuentes:

4.1. Diagrama de barras. Consiste en dibujar un rectángulo por cada una de las modalidades de la variable, de modo que las bases sean

todas iguales y apoyadas en el eje de ordenadas, en el que se indican las modalidades, y la altura de cada rectángulo debe ser proporcional a la frecuencia de la modalidad representada.

Este tipo de gráfico está indicado para variables cualitativas y cuantitativas no agrupadas en intervalos.

El número de errores cometidos por 80 personas al realizar una tarea

Errores 0 1 2 3 4 5 6 7 8 9

Nº personas 1 5 12 10 15 17 11 7 0 2

1

5

1210

1517

11

7

02

0

5

10

15

20

0 1 2 3 4 5 6 7 8 9

Erroresfr

ecu

enci

a(n

º d

e p

erso

nas

)

4.2. Histograma. El histograma se usa para variables agrupadas en intervalos, asignando a cada intervalo un rectángulo de superficie proporcional a su frecuencia. Para construir el histograma se representan sobre el eje de abscisas los límites de las clases. Sobre dicho eje se construyen unos rectángulos que tienen por base la amplitud del intervalo y por altura la frecuencia absoluta de cada intervalo, siempre que todos los intervalos tengan igual amplitud. En caso contrario, las alturas de los rectángulos han de ser calculadas teniendo en cuenta que sus áreas

deben ser proporcionales a las frecuencias de cada intervalo (altura = erv alointdelamplitud

f recuencia)

Número de pulsaciones por minuto en un grupo de 30 personas.

Intervalo (puls/min)

fi (nº personas)

[50,56) 1

[56,62) 1

[62,68) 4

[68,74) 9

[74,80) 6

[80,86) 5

[86,92) 4

30

Tiempo empleado por 80 personas en realizar una tarea

Intervalo (min) fi (nº personas)

[0,2) 4

[2,3) 5

[3,4) 10

[4,5) 12

[5,7) 28

[7,10) 21

80

Observa que la amplitud de los intervalos no es la misma. El intervalo 0-2 representa una frecuencia de

4; su altura es 4/2= 2. El intervalo 2-3 representa una frecuencia de 5; su altura es 5/1= 5. El intervalo

3-4 representa una frecuencia de 10; su altura es 10/1= 10. El intervalo 4-5 representa una frecuencia

de 12; su altura es 12/1= 12. El intervalo 5-7 representa una frecuencia de 28; su altura es 28/2= 14. El

intervalo 7-10 representa una frecuencia de 21; su altura es 21/3= 7.

50 56 62 68 74 80 86 92 pulsaciones /minuto

Fre

cuen

cia

(nº

de

per

sonas

)

1

5

9

0 2 3 4 5 7 10 Tiempo (minutos)

14

12

10

8

6

4

2

Estadística Estadística Descriptiva.

IES “Fuerte de Cortadura” Página 5 de 17

4.3. Poligonal de frecuencias. Los histogramas y algunos diagramas de barras, también se pueden representar por una poligonal de

frecuencias, que es la línea que une los puntos correspondientes a las frecuencias de cada valor (extremos superiores de las barras). Si esta poligonal es simple, las ordenadas se sitúan en la marca de clase de cada intervalo. Si se hace una poligonal de frecuencias acumuladas, el primer intervalo empieza en cero y alcanza, en su extremo superior, la ordenada de su frecuencia; el segundo intervalo continúa la misma línea, elevándola en él la frecuencia correspondiente, y así sucesivamente.

La poligonal de frecuencias que representa el número de errores cometidos al realizar una tarea (ver ejemplo del diagrama de barras) se da en la figura adjunta.

1

5

1210

1517

11

7

02

0

5

10

15

20

0 1 2 3 4 5 6 7 8 9

Errores

frec

uen

cia(

de

per

son

as)

Número de pulsaciones por minuto en un grupo de 30 personas. La poligonal de frecuencias que representa el número de pulsaciones por minuto en un grupo de 30 personas (ver ejemplo del histograma) se da en la figura adjunta.

Vamos a construir la poligonal de frecuencias acumuladas correspondiente al ejemplo donde se medía el tiempo empleado por 80 personas al realizar una tarea. Primero construiremos la tabla de frecuencias con las acumuladas y después dibujaremos la poligonal.

Intervalo (min) fi Fi

[0,2) 4 4

[2,3) 5 9

[3,4) 10 19

[4,5) 12 31

[5,7) 28 59

[7,10) 21 80

80 80

4.4. Diagrama de sectores.

Es muy utilizado para variables cualitativas o cuantitativas en las que el número de estados en que clasifiquemos sea pequeño. Cada sector circular debe ser proporcional a la frecuencia de la clase.

Es muy útil para representar situaciones similares y hacer comparaciones.

En un instituto de Secundaria, se han obtenido los siguientes resultados al acabar el curso en la asignarura de Matemáticas:

Notas Nº de alumnos

Suspenso 35

Suficiente 145

Bien 65

Notable 40

Sobresaliente 30

Suspenso

Suficiente

Bien

Notable

Sobresaliente

50 56 62 68 74 80 86 92 pulsaciones /minuto

Fre

cuen

cia

(nº

de

per

sonas

)

1

5

9

Estadística Estadística Descriptiva.

IES “Fuerte de Cortadura” Página 6 de 17

5 Medidas de centralización

Para estudiar un conjunto de datos estadísticos, además de los gráficos y las tablas de frecuencias, conviene dar algunas medidas objetivas que describan de un modo conciso el comportamiento y las características generales de los datos estudiados. Estas medidas, que reciben el nombre de parámetros estadísticos, se suelen agrupar en las siguientes categorías:

Medidas de centralización: están relacionadas con el promedio de los datos. Es un valor lo más representativo posible del conjunto de datos. De ellas, la principal es la media, también se usan la mediana y la moda.

Medidas de posición: indican, una vez ordenados, cuántos elementos quedan a la izquierda o derecha de uno dado. Las más usadas son los cuartiles y los percentiles.

Medidas de dispersión: dan una idea de las desviaciones que sufren los datos respecto de los valores centrales, en especial con relación a la media. A mayor parámetro, más dispersión. Entre estas se encuentran: rangos, varianza, desviación media y desviación típica.

5.1. Media aritmética.

La media aritmética de una serie de valores se obtiene sumándolos, y dividiendo la suma por el número de

datos. Se representa por x . Su cálculo se realiza, según las expresiones que siguen, atendiendo a la presentación de los datos:

Para datos simples (sin agrupar por frecuencias): Si la variable toma los n valores x1, x2, …., xn , la media aritmética adopta la expresión:

n

x

n

x.....xxx

n

1i

i

n21

Para datos agrupados por frecuencias: Si la variable toma los valores x1 , x2 ,...,xn, siendo f1 , f2 ,...,fn las frecuencias absolutas correspondientes de la distribución, la media aritmética se calcula con la expresión:

N

·fx

x

n

1i

ii

n21

nn2211

f.....ff

f·x....f·xf·x

Cuando los datos están agrupados en intervalos, para hallar la media aritmética basta con tomar como valores de la variable xi las marcas de clase respectivas.

La media también se puede calcular como:

n

1i

ii·hxx , siendo hi las frecuencias relativas.

Consideraciones:

La media aritmética es el parámetro de centralización más utilizado.

Presenta la ventaja de tener en cuenta todos los datos de la distribución, además de resultar muy sencillo su cálculo.

Tiene el inconveniente de que si la distribución pose valores extremos, éstos pueden producir una distorsión sobre el valor de la media, alterando el significado de ésta.

No siempre es posible realizar el cálculo de la media aritmética: si los datos son cualitativos o cuando, estando los datos agrupados en clases, alguna de ellas está abierta.

Si se suma una constante a todos los valores de una variable, su media aumenta en dicha constante.

Si se multiplican todos los valores de la variable por una constante, la media queda multiplicada por dicha constante.

5.2. Moda. Se denomina moda de una variable estadística al valor de la variable que tiene mayor frecuencia absoluta.

Se representa por Mo. La moda de una variable discreta es fácil de calcular, basta buscar el valor de la variable que presenta mayor frecuencia. Puede ocurrir que la moda no sea única, es decir, la distribución puede tener 2,3 o más modas, recibiendo el nombre de bimodal, trimodal, etc.

Estadística Estadística Descriptiva.

IES “Fuerte de Cortadura” Página 7 de 17

En el caso de que los datos se encuentren agrupados en intervalos de la misma amplitud, la clase con mayor frecuencia se denomina clase modal. Puede tomarse como moda la marca de clase de la clase modal

Si los datos se agrupan en intervalos de distinta amplitud, la clase modal es aquella a la que le corresponde en

el histograma un rectángulo de mayor altura (altura = erv alointdelamplitud

f recuencia)

Consideraciones:

Puede ocurrir que existan distribuciones que no tengan moda (cuando todos los datos son iguales)

La moda es menos representativa que la media aritmética, pero a veces es más útil que ésta; por ej. cuando se trata de datos cualitativos.

En la moda no intervienen todos los datos de la distribución.

La moda no tiene por qué situarse en la zona central.

La moda representa el valor dominante en la distribución

5.3 Mediana.

La mediana de una variable estadística es el valor que divide el conjunto de datos en dos partes iguales, es decir, el número de datos menores que ella es igual al número de datos mayores. Se representa por Me o M.

Para calcular la mediana distinguimos:

Para datos simples (sin agrupar por frecuencias): En este caso se ordenan los datos de forma creciente y la media será el valor central: Si el número de datos es impar, el valor central es único:2,3,5,6,9,11,12 → Me=6

Si el número de datos es par se toma la media de los dos valores centrales:2,3,5,6,12,13 → 5.5 = 2

6 + 5 = Me

Para datos agrupados por frecuencias: La mediana viene dada por el primer valor de la variable cuya frecuencia absoluta excede a la mitad del

número de datos. En el caso de que la mitad del número de datos coincida con la frecuencia absoluta acumulada

correspondiente a un valor, la mediana es la media entre ese valor y el siguiente.

Para datos agrupados en intervalos: La clase que contiene a la mediana se llama clase mediana o intervalo mediano. Puede tomarse como

mediana, en una primera aproximación, la marca de la clase del intervalo mediano. Si se desea mayor precisión en el cálculo de la mediana, ésta puede obtenerse dentro del intervalo mediano,

mediante la expresión:

i

1i

if

F2

Nc·LMe

siendo:

Li = extremo inferior de la clase mediana

c = amplitud de los intervalos

N = número total de datos

Fi-1 = frecuencia absoluta acumulada de la clase anterior a la clase mediana.

fi = frecuencia absoluta de la clase mediana

La mediana es especialmente útil en los siguientes casos:

a) Cuando entre los datos existe alguno ostensiblemente extremo que afecta a la media.

b) Cuando los datos están agrupados en clases y alguna de ellas es abierta.

Como consecuencia de la definición de mediana, se tiene que el 50% de los datos son menores o iguales que ella y el

50% son mayores o iguales.

La mediana es un parámetro de centralización que depende del orden de los datos y no de su valor.

6 Medidas de posición La mediana de los valores de una variable estadística divide a la distribución en dos partes iguales. Es decir, la

mediana parte la distribución en dos mitades, cada una correspondiente al 50%. Generalizando la idea anterior, se puede pensar en obtener valores que dividen a los datos en diversas partes

iguales. Estás dan lugar a los conceptos que siguen:

Los valores de la variable que superan, exactamente, al 25%, 50% y 75% de los datos se llaman, respectivamente, cuartil primero (Q1 ), segundo (Q2) y tercero (Q3).

Estadística Estadística Descriptiva.

IES “Fuerte de Cortadura” Página 8 de 17

De la misma manera, podemos dividir la distribución en 100 partes, con lo cual podemos llegar a conocer cuál es

el valor de la variable que deja un porcentaje de casos a su izquierda y derecha.

El percentil de orden k o k-ésimo (Pk) de una distribución es un valor que, una vez ordenados los datos de forma

creciente, el k% son iguales o inferiores a él.

Para el cálculo de Q1 se parte de N/4, para el de Q3 de 3N/4 y para el de Pk de kN/100. Después se procede

como en el caso de la mediana, tanto para variable discreta como para variable continua. Así para variables agrupadas en

intervalos se tiene:

i

1i

i1f

F4

Nc·LQ

i

1i

i3f

F4

3Nc·LQ

i

1i

ikf

F100

kNc·LP

Cuartiles y percentiles se denominan parámetros de estructura o de posición.

Se tiene que Q1 = P25 ; Q2 = Me = P50 ; Q3 = P75

7 Medidas de dispersión Consideremos el siguiente ejemplo: se ha aplicado a dos grupos de ocho alumnos de 8º de EGB un test de 100

preguntas sobre capacidad numérica, obteniéndose los siguientes resultados:

Grupo A 46 48 49 50 50 51 52 54

Grupo B 10 18 30 50 50 70 82 90

Si calculamos la media, la moda, y mediana de ambas distribuciones, observamos que todas son 50. En

cambio, los dos grupos de alumnos son bien distintos. Así pues, la investigación acerca de la distribución queda incompleta si sólo se estudian las medidas de centralización, siendo imprescindible conocer si los datos numéricos están agrupados o no alrededor de los valores centrales, en especial con relación a la media aritmética. A esto se llama dispersión.

Las medidas o parámetros de dispersión más usuales se describen a continuación.

7.1. Recorrido o rango. Se llama recorrido o rango de una distribución a la diferencia entre el mayor y el menor valor de la variable

estadística.

En el ejemplo anterior los recorridos son: de A, 54 - 46 = 8, y de B, 90 - 10 = 80. Por tanto, al tener el mismo número

de datos, diremos que la distribución del grupo A está más concentrada que la del grupo B.

Cuanto menor es el recorrido de una distribución, mayor es el grado de representatividad de los valores centrales.

El recorrido tiene la ventaja de su sencillez de cálculo.

Tiene gran aplicación en procesos de control de calidad, y de una manera general, en aquellos procesos que se

pretenda verificar longitudes, pesos, volúmenes, estando prefijados de antemano los límites permitidos.

El recorrido tiene el inconveniente de que sólo depende de los valores extremos.

Para paliar de alguna manera este inconveniente se utiliza en ocasiones otros rangos:

Rango intercuartílico: Q3 - Q1 Rango entre percentiles: P90 - P10

Estos rangos son algo más estables que el rango, ya que tienden a eliminar aquellos valores extremadamente

alejados.

7.2. Varianza y desviación típica. La varianza que denotamos por σ

2 , es la media aritmética de las diferencias la cuadrado de cada dato

respecto a la media de todos ellos. Su fórmula es:

N

·f)x(x

f....ff

·f)x(x.....·f)x(x·f)x(xσ

n

1i

i2

i

n21

n2

n22

212

12

La varianza, al obtenerse a partir del cuadrado de las diferencias de los datos respecto de la media, hace que los valores más alejados tengan mayor peso en el resultado: en consecuencia, distingue mejor que la amplitud la variabilidad de los datos de las distribuciones.

Otra fórmula equivalente, de mayor utilidad práctica, es:

2

n

1i

i2i

2

n21

n2n2

221

212 x

N

·fx

xf...ff

·fx....·fx·fxσ

Estadística Estadística Descriptiva.

IES “Fuerte de Cortadura” Página 9 de 17

La varianza tiene el inconveniente de que su valor viene dado en unidades al cuadrado. Por ejemplo, para datos medidos en centímetros la varianza se expresa en centímetros cuadrados. Esto se resuelve considerando la desviación típica.

La desviación típica, σ, es la raíz cuadrada de la varianza. En consecuencia:

N

·f)x(x

σ

n

1i

i2

i

= 2

n

1i

i2i

xN

·fx

La varianza y la desviación típica también se denotan por s2 y s.

Tanto la varianza como la desviación típica dependen de todos los valores de la distribución. Si a los valores de una variable se les suma la misma constante, la varianza y la desviación típica no varían. Si a los valores de una variable se les multiplica por la misma constante positiva, la varianza queda multiplicada por el cuadrado de la constante y la desviación típica queda multiplicada por dicha constante.

7.3. Coeficiente de variación. Los pesos de los toros de lidia de una ganadería se distribuyen con tx = 510 kg y σt = 25 kg.

Los pesos de los perros de una exposición canina se distribuyen con px = 19 kg y σp = 10 kg.

La desviación típica de la manada de toros bravos es superior que la de los perros (σt= 25 > σp= 10). Sin embargo,

esos 25 kg son poca cosa para el enorme peso de los toros ( es decir, los toros de esa manada son muy parecidos en

peso), mientras que 10 kg en relación con el peso de un perro es mucho.

Para poder comparar la dispersión de dos poblaciones muy distintas, no es buena la desviación típica. Por eso se

define una nueva medida de dispersión, llamada coeficiente de variación:

x

σCV

Al dividir la desviación típica entre su media, x , se está relativizando la variación.

Así como la media y la desviación típica se dan en las unidades en que vienen dados los datos, el coeficiente de

variación es un número abstracto (no tiene unidades).

Cuanto más pequeño sea este coeficiente de variación, los datos están más concentrados alrededor de la media,

siendo ésta más representativa.

En el ejemplo de los toros y los perros, sus respectivos coeficientes de variación son:

049.0510

25CVt 526.0

19

10CVp

A veces el coeficiente de variación se da en tantos por ciento.

En este caso sería: CVt = 0.049x100 = 4.9 % CVp = 0.526x100 = 52.6%

Con este parámetro se ve claramente que el peso de los perros de la exposición canina es mucho más disperso que el

de los toros de la manada.

8 Interpretación de los parámetros estadísticos x y σ La desviación típica y la media son las dos medidas más utilizadas para describir

un conjunto de datos.

La media: Es el valor del promedio, el que se obtendría al repartir igualitariamente un todo entre sus elementos. Gráficamente es el centro de gravedad de la distribución. Es decir, si las barras tuvieran peso, la media es el punto donde habría que sostener la tablilla en que se sitúan para mantenerse en equilibrio. Análogamente ocurre con las distribuciones dadas mediante histogramas.

La desviación típica: Nos dice cómo de alejados de la media, cómo de dispersos, se encuentran los datos. Es una medida de las diferencias habidas en ese reparto supuesto igualitario; a mayor desviación típica menor igualdad. Utilizando la media aritmética y la desviación típica conjuntamente podemos obtener resultados muy

importantes sobre la distribución. Observemos la siguiente familia de distribuciones. Todas ellas tienen la misma media. Sus desviaciones

típicas, sin embargo, son distintas:

x

Estadística Estadística Descriptiva.

IES “Fuerte de Cortadura” Página 10 de 17

1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

1 2 3 4 5 1 2 3 4 5 1 2 3 4 5

En la primera, todos los valores están acumulados en la media. Su desviación típica es cero (no hay dispersión. Al pasar a la segunda aumenta la dispersión, pues algunos individuos están separados de la media. Y, en general, para pasar de cada una a la siguiente, algunos individuos se alejan de la media y, por tanto,

aumenta la dispersión.

* Ejemplos

1) Un alumno obtuvo las siguientes calificaciones en Matemáticas: 3,8,5,8,3,9 y 6: N = 7

Nota media:

7

6938583x

7

42=6 Moda: Mo= 3 M’o = 8

Mediana: 3, 3, 5, 6, 8, 8, 9 → Me = 6 Cuartiles: Percentiles:

(1/4)·N = (1/4)7 = 1.75 → Q1 = 3 (30/100)·7 = 2.1 → P30 = 5 Q2 = Me = 6 (3/4)·N = (3/4)·7 = 5.25 → Q3 = 8 (67/100)·7 = 4.69 → P67 = 8

Recorrido: 9 – 3 = 6

Rango intercuartílico: Q3 – Q1 = 8 – 3 = 5

Varianza: n

)x(x

σ

n

1i

2i

2

7

6)(96)(86)(86)(66)(56)(36)(3 2222222 = 5.14

ó 22222222

2

n

1i

2i

2 67

9886533x

n

x

σ

= 5.14

Desviación típica: σ = 5.14 = 2.26

Coeficiente de variación: CV = 2.26/6 = 0,376 37.6%

2) Las calificaciones en la asignatura de Historia del Arte de los 40 alumnos de una clase viene dada por:

Calificaciones 1 2 3 4 5 6 7 8 9

Nº de alumnos 2 2 4 5 8 9 3 4 3

xi fi Fi xifi xi2fi

1 2 2 2 2

2 2 4 4 8

3 4 8 12 36

4 5 13 20 80

5 8 21 40 200

6 9 30 54 324

7 3 33 21 147

8 4 37 32 256

9 3 40 27 243

40 212 1296

Media : 5'340

212

343985422

9x38x47x36x95x84x53x42x21x2x

Moda: Mo = 6

Mediana: (1/2)·40 = 20 → Me = 5

Cuartiles:

Q1 deja la cuarta parte de la distribución a la izquierda; como N/4=40/4=10 , se verifica que Q1 = 4.

Q2 = Me = 5

Q3 deja tres cuartas partes de la distribución a la izquierda; como 3N/4 = 340/4 = 30, se tiene que Q3 =(6+7)/2 = 6.5

Estadística Estadística Descriptiva.

IES “Fuerte de Cortadura” Página 11 de 17

Percentiles:

P10 deja el 10% de la distribución a la izquierda; como 10N/100 = 4,se obtiene P10 =2.5

P30 deja el 30% de la distribución a la izquierda; como 30N/100 = 12,se obtiene P30 =4

P40 deja el 40% de la distribución a la izquierda; como 40N/100 = 16,se obtiene P40 =5

P70 deja el 70% de la distribución a la izquierda; como 70N/100 = 28, se obtiene P70= 6

Recorrido: 9 – 1 = 8

Recorrido intercuartílico: Q3 – Q1 = 6.5 – 4 = 2.5

Varianza: N

f)x(x

σ

n

1i

i2

i

2

= 2

n

1i

i2i

xN

·fx

= 25.3

40

1296 = 4.31

Desviación típica: σ = 2.084.31

Coeficiente de variación: CV = 2.08/ 5.3 = 0,392 39.2%

3) La estación meteorológica de Pueblaseca registró 88 días de lluvia el pasado año, según se muestra en la tabla siguiente:

Litros/m2 (0,5) [5,10) [10,15) [15,20) [20,25) [25,30) [30,35]

Nº de días 3 7 19 23 18 12 6

Clases xi fi Fi xifi xi2fi

(0,5) 2.5 3 3 7.5 18.75

[5,10) 7.5 7 10 52.5 393.75

[10,15) 12.5 19 29 237.5 2968.75

[15,20) 17.5 23 52 402.5 7043.75

[20,25) 22.5 18 70 405 9112.5

[25,30) 27.5 12 82 330 9075

[30,35] 32.5 6 88 195 6337.5

88 1630 34950

Media: N

·fx

x

n

1i

ii

88

1630 = 18’52 l/m2

Moda: El mayor valor de la frecuencia, 23, da como clase modal el intervalo [15,20). En una primera aproximación, la

moda es la marca de clase del intervalo anterior, es decir, Mo=17.5. Mediana: En la citada distribución, el nº total de datos es 88. El intervalo mediano es [15,20), ya que contiene el dato número 44. Utilizando la expresión que permite calcular la mediana aplicada al intervalo anterior, se tiene:

i

1i

if

F2

N

c·LMe

218.26l/m23

292

88

5·15

Cuartiles:

Q1 deja la cuarta parte de la distribución a la izquierda: como N/4 = 22, resulta que la clase que contiene el primer cuartil es

[10,15). Aplicando una expresión análoga a la de la mediana, se tiene:

13.219

10225·10

f

F4

N

c·LQi

1i

i1

Q3 deja tres cuartas partes de la distribución a la izquierda: 3N/4 = 66, resulta que la clase que contiene el tercer cuartil es

[20,25). Se tiene que:

23.918

52665·20

f

F4

3N

c·LQi

1i

i3

Percentiles:

P40 deja el 40% de la distribución a la izquierda; como 40N/100= 35.2, resulta que la clase que contiene el percentil de orden

40 es [15,20). Aplicando la expresión correspondiente:

16.323

2935.25·15

f

F100

40N

c·LPi

1i

i40

Estadística Estadística Descriptiva.

IES “Fuerte de Cortadura” Página 12 de 17

P90 deja el 90% de la distribución a la izquierda; como 90N/100=79.2, resulta que la clase que contiene el percentil de orden 90

es [25,30). Por tanto:

28.812

7079.25·25

f

F100

90N

c·LPi

1i

i90

Rango o recorrido: 35 – 0 = 35

Rango intercuartílico: Q3 – Q1 = 23.9 – 13.2 = 10.7

Varianza: N

f)x(x

σ

n

1i

i2

i

2

= 2

n

1i

i2i

xN

·fx

= 218.52

88

34950 = 54.06

Desviación típica: : σ = 7.3554.06

Coeficiente de variación: 7.35/ 18.52 = 0,396 39.6%

* Problemas

1) Clasifica las variables que siguen en cualitativas y cuantitativas, indica el tipo, y pon ejemplos de los valores que

puede tomar cada una:

a) Temperatura registrada cada hora del día

b) El número de miembros de cada una de las familias de un cierto país

c) En un centro, conjunto musical preferido por los alumnos.

d) Número de espectadores que han asistido a un pabellón durante los partidos de baloncesto de toda la liga.

e) Las velocidades con las que circulan los automóviles por un determinado lugar

f) En un centro, número de alumnos de cada clase.

g) El sexo de los habitantes de una ciudad

h) Duración de las llamadas telefónicas hechas en una cabina.

i) En un grupo de 2º de Bachillerato, lugar preferido para realizar un viaje fin de curso.

j) La talla de ropa que utilizan los habitantes de las Islas Canarias

k) Opinión de los españoles sobre una decisión política

Dígase cuál es la población estudiada en cada uno de los casos citados en el problema anterior.

2) En una población de 25 familias se ha observado la variable número de coches y se han obtenido los siguientes

datos: 0,1,2,3,1,0,1,1,1,4,3,2,2,1,1,2,2,1,1,1,2,1,3,2,1. Elabora la tabla de frecuencias de la distribución de X.

3) Las medidas de concentración de ozono en la atmósfera de una ciudad fueron las siguientes:

3,5 1,4 6,6 6,0 4,2 4,4 5,3 5,6 6,8 2,5 5,4 4,4

5,4 4,7 3,5 4,0 2,4 3,0 5,6 4,7 6,5 3,0 4,1 3,4

6,8 1,7 5,3 4,7 7,4 6,0 6,7 11,7 5,5 1,1 5,1 5,6

5,5 1,4 3,9 6,6 6,2 7,5 6,2 6,0 5,8 2,8 6,1 4,1

9,4 3,4 5,8 3,1 5,8 7,6 1,4 3,7 2,0 3,7 6,8 3,1

a) Agrupa estos datos en intervalos de clase de longitud 1 y en clases de longitud 2

b) Realiza una tabla con las frecuencias absolutas, relativas y acumuladas, porcentajes y porcentajes acumulados

para cada uno de los casos.

4) En una clase de 28 alumnos las notas de Matemáticas han sido las siguientes:

MD NT NT SB NT NT SF SF MD MD BI NT SF IS

SB MD NT NT MD SF BI SB IS MD SF SF BI BI

donde: MD: Muy deficiente ( de 0 a 3 puntos) IS: Insuficiente (de 3 a 5 puntos)

SF: Suficiente ( de 5 a 6 puntos) BI: Bien ( de 6 a 7 puntos)

NT: Notable ( de 7 a 9 puntos) SB: Sobresaliente (de 9 a 10 puntos)

Determina los intervalos de clase de cada nota y agrupa los datos según los intervalos determinados. Presenta estos

datos en una tabla con las frecuencias absolutas, relativas y acumuladas, porcentajes y porcentajes acumulados.

5) Completa los datos que faltan en la siguiente tabla estadística, donde f, F y h representan, respectivamente, la

frecuencia absoluta, acumulada y relativa.

x 1 2 3 4 5 6 7 8

f 4 4 7 5 7

F 16 28 38 45

h 0,08 0,16 0,14

Estadística Estadística Descriptiva.

IES “Fuerte de Cortadura” Página 13 de 17

6) Completa los datos que faltan en las tablas estadísticas siguientes:

Calificación fi hi Nº de hijos fi hi xi fi Fi hi

Insuficiente 0.375 0 0.2 1 3

Suficiente 20 1 15 2 4

Notable 16 2 3 16 0.15

Sobresaliente 3 5 4 7

TOTAl 80 4 4 5 5 28

5 0.02 6 38

TOTAL 7 7 45

8

TOTAL

7) Las producciones de trigo (en toneladas) de unas granjas son las que figuran en la tabla adjunta:

Granja A B C D E F

Producción 16 12 20 17 3 12

Representa gráficamente estos datos en un diagrama de barras.

8) Las dianas logradas en un campeonato por 25 tiradores fueron:

8, 10, 12, 12, 10, 10, 11, 11, 10, 13, 9, 11, 10, 9, 9, 11, 12, 9, 10, 9, 10, 9, 10, 8, 10

Resume los datos anteriores en una tabla de frecuencias absolutas y relativas, y dibuja el correspondiente

diagrama de barras.

9) Se ha realizado un test de habilidad numérica a los alumnos de una clase. Los resultados obtenidos son:

Puntuaciones [10,15) [15,20) [20,25) [25,30) [30,35) [35,40) [40,45) [45,50]

Nº de alumnos 4 6 6 10 8 10 3 3

Representa los datos mediante un histograma.

10) Se ha aplicado un test a los empleados de una fábrica, obteniéndose la siguiente tabla:

Puntuaciones (38,44] (44,50] (50,56] (56,62] (62,68] (68,74] (74,80]

Nº de trabajadores 7 8 15 25 18 9 6

Construye el histograma y el polígono de frecuencias absolutas acumuladas.

11) Un pediatra realizó un estudio sobre la edad a la que comenzaron a andar 50 niños de su consulta:

Meses 9 10 11 12 13 14 15

Niños 1 4 9 16 11 8 1

Realiza el diagrama de barras, el polígono de frecuencias y el polígono de frecuencias acumuladas.

12) De una muestra de 75 pilas se han obtenido los siguientes datos sobre la duración en horas:

Duración en horas (25,30] (30,35] (35,40] (40,45] (45,50] (50,55]

Nº de pilas 3 5 21 28 12 6

a) Representa los histogramas correspondientes, el de frecuencias y el acumulado.

b) A partir de los histogramas del apartado anterior, construye los dos polígonos de frecuencia.

13) El siguiente histograma representa el número de dianas obtenidas por un grupo de 40 alumnos de un instituto en

unas competiciones de tiro

a) Obtén la tabla de frecuencias asociada a esta representación

b) Representa el polígono de frecuencias acumuladas

2 5 8 11 14 17 20 nº de dianas

de a

lum

nos

0123456789

1011

Estadística Estadística Descriptiva.

IES “Fuerte de Cortadura” Página 14 de 17

14) Halla la tabla de frecuencias asociada a este histograma:

15) Los sueldos mensuales en una empresa son los siguientes:

1 director, 3000 € ; 3 jefes, 2500 €; 6 encargados, 1500 € , y 9 operarios, 800 €

Calcula el sueldo medio

16) La dirección de tráfico ha recogido la siguiente información relativa al número de multas diarias, en un período de

50 días, que sus agentes han impuesto a los conductores que circulan por una autopista.

Nº de multas (0,5] (5,10] (10,15] (15,20]

Días 6 14 20 10

Halla el número medio de multas diarias.

17) En primero de Bachillerato de un centro escolar hay tres grupos, A, B y C, con 30,35 y 25 alumnos,

respectivamente. La nota media en Matemáticas fue, también respectivamente, de 5.3, 6.5 y 5.6. Halla la nota

media de Matemáticas de todos los alumnos de primero.

18) A un conjunto de cinco números cuya media aritmética es 7.31 se le añaden 4.47 y 10.15. ¿Cuál es la media del

nuevo conjunto de números?

19) Para el siguiente conjunto de datos: 10,13,4,7,8,11,10,16,18,12,3,6,9,9,4,13,20,7,5,10,17,10,16,14,8,18

Obtén su media, moda y mediana.

20) Los gastos mensuales en lectura (periódicos, revistas y libros) de 7 personas fueron, en euros, 27, 29 , 9, 28, 27.5, 30

y 28.5.

a) Calcular la media y la mediana de los datos anteriores. ¿Cuál de ellas es más representativa para

estos datos?

b) Si el precio del tabaco sube en un 10 % y se mantiene el consumo, deducir los nuevos valores de la

media y la mediana a partir de los resultados obtenidos en el apartado anterior.

21) Supongamos que los precios de los distintos artículos producidos por una empresa vienen dados por:

Precios 5-15 15-25 25-35 35-45

Frecuencias 15 k 2k 3

a) Deduce el valor de k sabiendo que el precio medio es 25.

b) Calcula la moda y la mediana.

22) Los siguientes datos corresponden a la altura en centímetros de los alumnos de una determinada clase:

150, 169, 171, 172, 172, 175, 176, 177, 178, 179, 181, 182, 183, 184, 184

Calcula la moda, mediana y los cuartiles de la variable. Indica el significado de los parámetros encontrados.

23) Se ha pasado un test de 79 preguntas a 600 personas. El número de respuestas correctas se refleja en la siguiente

tabla:

Respuestas [0,10) [10,20) [20,30) [30,40) [40,50) [50,60) [60,70) [70,80)

Nº de personas 40 60 75 90 105 85 80 65

a) Representa los datos mediante un histograma.

b) Calcula la media y la moda de respuestas correctas.

c) Calcula la mediana y el primer cuartil. ¿Qué miden estos parámetros?

24) La calificación obtenida por un grupo de 200 alumnos en la asignatura de matemáticas es:

Calificación 1 2 3 4 5 6 7 8 9

Nº de alumnos 10 10 20 25 40 45 15 20 15

a) Calcula el rango intercuartílico.

b) Calcular los percentiles de orden 20 y 70.

Estadística Estadística Descriptiva.

IES “Fuerte de Cortadura” Página 15 de 17

25) Dada la siguiente distribución estadística, calcula el primer y tercer cuartil, Q1 y Q3, y los percentiles de orden 40 y

80, P40 y P80.

Clases [30,35) [35,40) [40,45) [45,50) [50,55) [55,60)

fi 7 8 15 20 17 9

26) Habiéndose medido el coeficiente intelectual (C.I.) de los alumnos de un colegio se han obtenido los siguientes

resultados:

C.I. 61-69 69-77 77-85 85-93 93-101 101-109 109-117 117-125

Nº de alumnos 2 10 12 20 25 18 9 4

¿Qué puntuación corresponde al percentil 80? ¿Qué puntuación corresponde a un alumno que es superado por el 30%

de los alumnos? ¿ Qué tanto por cien de los alumnos representan aquellos que tienen un CI en el intervalo 93-123?

27) Para reclasificar a sus empleados, una empresa decide hacer unas pruebas que arrojan los siguientes resultados:

Puntuación 0-30 30-50 50-70 70-90 90-100

Nº de empleados 94 140 160 98 8

La nueva estructura de la empresa exige que el 64% de los empleados pertenezcan a la categoría básica, el

20% a la categoría media, el 10% a la superior y el resto sean cargos directivos. ¿Cuáles deben ser las distintas

puntuaciones mínimas exigidas para que un empleado pase a formar parte de las diferentes categorías, suponiendo

que éstas van aumentando según la puntuación de la prueba?

28) Calcula todos los parámetros de dispersión para las siguientes distribuciones estadísticas:

a) Calificaciones de 20 estudiantes:

6, 3, 2, 5, 7, 5, 9, 7, 6, 1, 4, 6, 6, 4, 2, 10, 8, 7, 5, 9.

b) Goles por partido en la liga de fútbol 86-87:

Goles 0 1 2 3 4 5 6 7 8

Nº de partidos 32 71 80 62 36 15 6 2 2

c) Prueba, con puntuación de 0 a 10, a 20 personas:

Intervalo [0,2) [2,4) [4,6) [6,8) [8,10)

Nº de personas 2 4 8 5 1

29) Las puntuaciones obtenidas en un test de razonamiento abstracto por 20 alumnos son las siguientes:16, 22, 21, 20,

23, 22, 17, 15, 13, 22, 17, 18, 20, 17, 22, 16, 23, 21, 22, 18. Hallar la moda, la media, los percentiles de orden 30 y

70, el recorrido y la varianza

30) Un inversor ha adquirido 1000 acciones de una determinada sociedad en cinco sesiones diferentes de Bolsa. Los

cambios de adquisición se registran en la tabla adjunta. Halla el cambio medio, la mediana, la moda y la desviación

típica.

Cambio 900 870 840 800 700

Nº de acciones 150 300 100 250 200

31) Se ha controlado el peso en 50 recién nacidos, obteniéndose los resultados de la tabla. Hallar los cuartiles, la

desviación típica y el recorrido intercuartílico.

Peso (en kg) 2.5-3 3-3.5 3.5-4 4-4.5

Nº de niños 6 23 12 9

32) Para comprobar la resistencia de unas varillas de nylon, se someten 250 a un test de resistencia, que consiste en

comprobar si se rompen o no cuando se aplica una fuerza sobre 5 puntos diferentes. El número de roturas por

varilla ensayada es:

Nº de varillas 141 62 31 14 1 1

Nº de roturas 0 1 2 3 4 5

a) Calcula el número medio de roturas por varilla y el porcentaje de varillas que sufren más de dos roturas.

b) Halla la moda, media y varianza de la serie.

33) En la siguiente distribución de frecuencias:

X (60,76] (76,92] (92,108] (108,124] (124,140] (140,156]

Frecuencia 12 13 18 19 11 7

¿Cuántos valores hay en el intervalo x,x ? ¿Qué porcentaje del total representan?

Estadística Estadística Descriptiva.

IES “Fuerte de Cortadura” Página 16 de 17

34) La altura (en cm) y el número de zapato que usan seis alumnas de primero de Bachillerato son:

Altura 164 158 162 166 168 172

Zapato 37 37 36 38 39 41

a) Halla la media y la desviación típica de los datos.

b) ¿Qué conjunto es más disperso, el de alturas o el de número de zapato?

35) Las edades, en años, de los asistentes a cierto curso fueron: 37, 35, 38, 36, 37, 40, 38, 25, 38.

a) ¿Cuál es la edad media de los asistentes?

b) La varianza del conjunto de datos anterior es 16.9. Las mismas personas asistirán a otro curso dentro de

dos años. Obtén razonadamente la media, la varianza y la desviación típica del nuevo conjunto de datos a

partir de los correspondientes al conjunto de datos inicial.

36) Considérense los siguientes valores: 2,3,3,5,7. Obtener otro conjunto de 5 datos que incluya los valores 2,3,6, y que

tenga la misma media, la misma mediana y mayor varianza.

37) Inventa seis notas (enteras) cuya media sea 5 y cuya desviación típica sea a) la menor posible,b) la mayor posible .

Justifícalo.

38) Inventa seis notas diferentes (enteras) cuya media sea 5 y cuya desviación típica sea a) la menor posible, b) la

mayor posible.

39) Un test aplicado a 40 alumnos de 2º de ESO ha dado los siguientes resultados:

Puntuaciones Nº de alumnos

(14,20]

(20,26]

(26,32]

(32,38]

(38,44]

(44,50]

(50,56]

2

8

13

8

5

3

1

Se pide:

a) Calcula la moda, la media , la mediana, el recorrido, el rango entre percentiles , la varianza y el coeficiente

de variación de las puntuaciones.

b) Calcula a partir de qué puntuación se encontrará el 30% de la clase con mayor puntuación

c) ¿

d) Si debido a un error en la corrección de los test las puntuaciones deberían ser un 20% inferiores a las de la

tabla ¿cuál es la verdadera media?

40) El número de hijos de 32 matrimonios se distribuye según la tabla adjunta

Nº de hijos Nº de matrimonios

1 1

2 2

3 4

4 3

5 7

6 5

7 6

8 3

9 1

a) Representa gráficamente el diagrama de barras y la poligonal de frecuencias acumuladas

b) Calcula la moda, los cuartiles, la media y la varianza

Estadística Estadística Descriptiva.

IES “Fuerte de Cortadura” Página 17 de 17

41) Se considera una distribución de datos agrupados en intervalos cuyo polígono de frecuencias acumuladas es el de

la figura

Calcular razonadamente: a) Tabla de distribución de frecuencias absolutas

b) Media y desviación típica

c) Mediana

42) Al preguntar a un grupo de personas cuánto tiempo dedicaron a ver televisión durante un fin de semana se

obtuvieron estos resultados:

Tiempo (en horas) [0,0.5) [0.5,1.5) [1.5, 2.5) [2.5,4) [4,8)

Nº de acciones 10 10 18 12 12

Dibuja el histograma correspondiente y halla la media y la desviación típica.

43) La tabla siguiente da las ganancias brutas, en millones de pesetas, durante seis años consecutivos, de dos tiendas

de iguales características situadas en barrios distintos:

Año 1 2 3 4 5 6

Tienda A 5,9 2,5 7,4 8,1 4,8 3,7

Tienda B 4,5 3,8 5,7 3,5 5,5 4,6

a) ¿Qué tienda da mayores beneficios?

b) ¿Qué tienda es más estable?

44) Dos fabricantes de baterías de automóviles ofrecen sus productos a una fábrica de automóviles, al mismo precio.

Ésta, para elegir la más duradera, hace una prueba con 50 baterías de cada marca, obteniendo los siguientes

resultados :

Vida de la batería(en meses) 20 22 24 26 28 30

Marca A (frec. absoluta) 5 8 12 15 7 3

Marca B (frec. absoluta) 1 7 18 19 5 0

Realice los cálculos que considere necesarios para justificar la elección efectuada por la fábrica.

45) Se ha medido el colesterol en cuatro grupos de personas sometidas a diferentes dietas. Las medias y las

desviaciones típicas son las que figuran en esta tabla:

DIETA A B C D

x 211.3 186.6 202.2 188.6

37.4 52.6 39.1 43.1

Las gráficas son, no respectivamente:

Asocia a cada dieta la gráfica que le corresponde.