15
IES Padre Poveda (Guadix) Matemáticas Aplicadas a las CCSS I Departamento de Matemáticas Bloque III: Estadística y Probabilidad Profesor: Ramón Lorente Navarro Unidad 10: Distribuciones Unidimensionales 1 UNIDAD 10 DISTRIBUCIONES UNIDIMENSIONALES 1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA La estadística es la parte de las matemáticas que se ocupa de recoger, organizar y analizar grandes cantidades de datos para estudiar las características o comportamiento de un colectivo. Uno de sus principales objetivos es realizar una síntesis de la información recogida. Para ello se calcularán una serie de valores numéricos o parámetros que permitirán resumir la información que previamente se agrupará en una tabla estadística de frecuencias. De esta manera podremos describir y comparar el comportamiento de diversas distribuciones. Se puede considerar como antecedentes de la estadística cualquier recuento que en sociedades primitivas se pudieran hacer sobre cabezas de ganado, bienes… Sin embargo, formalmente podemos considerar que los antecedentes de la estadística están registrados por los primeros censos como los llevados a cabo en China alrededor del año 2200 a.C. Posteriormente fue avanzando con el conocimiento humano desarrollándose como ciencia a partir de los siglos XV y XVI. TERMINOLOGÍA BÁSICA: Población: Conjunto de elementos que son objeto del estudio estadístico. Individuo: Cada uno de los elementos de la población. Muestra: Subconjunto de la población elegido para realizar un estudio estadístico. Se toma una muestra cuando no es factible observar la característica objeto de estudio en todos los individuos de la población. Por ejemplo, si se quiere conocer la intención de voto en unas elecciones. La muestra debe ser representativa de la población, es decir, las conclusiones obtenidas de su estudio se pueden extender a toda la población. Distinguimos dos tipos de estadística: DESCRIPTIVA: Hace el estudio sobre la población completa. No hay ningún grado de incertidumbre. ESTADÍSTICA INFERENCIAL: Parte de los resultados de una muestra para obtener conclusiones para la población con un determinado grado de fiabilidad. 2. CARACTERES Y VARIABLES ESTADÍSTICAS Carácter estadístico: Propiedad o característica de la población que se desea estudiar. Distinguimos dos tipos de caracteres: CUALITATIVOS: No Se pueden medir. Se describen sus distintas modalidades con palabras: color de los ojos, estado civil, marca de un automóvil, profesión… TIPOS DE CARACTERES También se llaman ATRIBUTOS. CUANTITATIVOS: Se pueden medir, es decir, toman valores numéricos: estatura, coeficiente intelectual… Variables estadísticas: Los caracteres cuantitativos pueden tomar distintos valores. Determinan, por tanto, una variable estadística. DISCRETA: Toma valores aislados: Número de hijos, número de goles TIPOS DE VARIABLES en la liga en los distintos equipos de fútbol. ESTADÍSTICAS CONTINUA: Puede tomar cualquier valor en un intervalo dado: estatura de los alumnos del centro, presión, temperatura…

UNIDAD 10 DISTRIBUCIONES UNIDIMENSIONALES 1. … · De esta manera podremos describir y comparar el comportamiento de diversas distribuciones. Se puede considerar como antecedentes

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: UNIDAD 10 DISTRIBUCIONES UNIDIMENSIONALES 1. … · De esta manera podremos describir y comparar el comportamiento de diversas distribuciones. Se puede considerar como antecedentes

IES Padre Poveda (Guadix) Matemáticas Aplicadas a las CCSS I

Departamento de Matemáticas Bloque III: Estadística y Probabilidad Profesor: Ramón Lorente Navarro Unidad 10: Distribuciones Unidimensionales

1

UNIDAD 10 DISTRIBUCIONES UNIDIMENSIONALES

1. INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA La estadística es la parte de las matemáticas que se ocupa de recoger, organizar y analizar grandes cantidades de datos para estudiar las características o comportamiento de un colectivo. Uno de sus principales objetivos es realizar una síntesis de la información recogida. Para ello se calcularán una serie de valores numéricos o parámetros que permitirán resumir la información que previamente se agrupará en una tabla estadística de frecuencias. De esta manera podremos describir y comparar el comportamiento de diversas distribuciones. Se puede considerar como antecedentes de la estadística cualquier recuento que en sociedades primitivas se pudieran hacer sobre cabezas de ganado, bienes… Sin embargo, formalmente podemos considerar que los antecedentes de la estadística están registrados por los primeros censos como los llevados a cabo en China alrededor del año 2200 a.C. Posteriormente fue avanzando con el conocimiento humano desarrollándose como ciencia a partir de los siglos XV y XVI. TERMINOLOGÍA BÁSICA: Población: Conjunto de elementos que son objeto del estudio estadístico. Individuo: Cada uno de los elementos de la población. Muestra: Subconjunto de la población elegido para realizar un estudio estadístico. Se toma una muestra cuando no es factible observar la característica objeto de estudio en todos los individuos de la población. Por ejemplo, si se quiere conocer la intención de voto en unas elecciones. La muestra debe ser representativa de la población, es decir, las conclusiones obtenidas de su estudio se pueden extender a toda la población. Distinguimos dos tipos de estadística: DESCRIPTIVA: Hace el estudio sobre la población completa.

No hay ningún grado de incertidumbre. ESTADÍSTICA

INFERENCIAL: Parte de los resultados de una muestra para obtener conclusiones para la población con un determinado grado de fiabilidad.

2. CARACTERES Y VARIABLES ESTADÍSTICAS

Carácter estadístico: Propiedad o característica de la población que se desea estudiar. Distinguimos dos tipos de caracteres:

CUALITATIVOS: No Se pueden medir. Se describen sus distintas modalidades con palabras: color de los ojos, estado civil, marca de un automóvil, profesión…

TIPOS DE CARACTERES También se llaman ATRIBUTOS.

CUANTITATIVOS: Se pueden medir, es decir, toman valores numéricos: estatura, coeficiente intelectual…

Variables estadísticas: Los caracteres cuantitativos pueden tomar distintos valores. Determinan, por

tanto, una variable estadística.

DISCRETA: Toma valores aislados: Número de hijos, número de goles TIPOS DE VARIABLES en la liga en los distintos equipos de fútbol. ESTADÍSTICAS

CONTINUA: Puede tomar cualquier valor en un intervalo dado: estatura de los alumnos del centro, presión, temperatura…

Page 2: UNIDAD 10 DISTRIBUCIONES UNIDIMENSIONALES 1. … · De esta manera podremos describir y comparar el comportamiento de diversas distribuciones. Se puede considerar como antecedentes

IES Padre Poveda (Guadix) Matemáticas Aplicadas a las CCSS I

Departamento de Matemáticas Bloque III: Estadística y Probabilidad Profesor: Ramón Lorente Navarro Unidad 10: Distribuciones Unidimensionales

2

Por tanto: CUALITATIVOS O ATRIBUTOS

TIPOS DE CARACTERES DISCRETA

CUANTITATIVOS⇒VARIABLE ESTADÍSTICA CONTINUA

3. ORGANIZACIÓN DE DATOS. TABLAS ESTADÍSTICAS DE FRECUENCIAS Frecuencia absoluta in de una modalidad o valor ix : Número de veces que se repite ese valor o

modalidad.

Frecuencia absoluta acumulada iN : ii nnnN +++= ...21 , es decir, ∑=

=i

kki nN

1

Frecuencia relativa if de una modalidad o valor ix : Es el cociente entre su frecuencia absoluta y el

número total de datos N , es decir, Nnifi =

Frecuencia relativa acumulada iF : ii fffF +++= ...21 , o bien, NNiFi =

En toda tabla estadística de frecuencias se cumple: ∑=

=n

ii Nn

1 ∑

=

=n

iif

11

3.1 TABLA PARA CARACTERES CUALITATIVOS

Ejemplo: Al observar el color de pelo de 110 alumnos de un instituto observamos que hay 16 con tono rubio, 24 morenos, 35 castaños, 10 pelirrojos y 25 con otras coloraciones. Formamos la tabla estadística de frecuencias:

COLOR DE PELO in if Rubio Moreno Castaño Pelirrojo Otros

16 24 35 10 25

16/110≈0.15 24/110≈0.22 35/110≈0.32 10/110≈0.09 25/110≈0.22

110=N 1

3.2 TABLA PARA DATOS NO AGRUPADOS Ejemplo: Un profesor tiene anotadas en su cuaderno las notas de los 30 alumnos/as de una clase:

5 3 4 1 2 8 9 9 7 6 6 7 9 8 7 7 1 0 1 5 9 9 8 0 8 8 8 8 5 7

Formamos la tabla estadística de frecuencias:

Notas ( )ix in iN if iF 0 1 2 3 4 5 6 7 8 9

2 3 1 1 1 3 2 5 7 5

2 5 6 7 8

11 13 18 25 30

2/30≈0.07 3/30= 0.1

1/30≈0.03 1/30≈0.03 1/30≈0.03 3/30= 0.1

2/30≈0.07 5/30≈0.17 7/30≈0.23 5/30≈0.17

2/30≈0.07 5/30≈0.17 6/30= 0.2

7/30≈0.23 8/30≈0.27 11/30≈ 0.37 13/30≈ 0.43 18/30= 0.6 25/30≈ 0.83

30/30= 1 30=N 1

Esta tabla se usa con variables estadísticas discretas con una cantidad no excesiva de datos.

Page 3: UNIDAD 10 DISTRIBUCIONES UNIDIMENSIONALES 1. … · De esta manera podremos describir y comparar el comportamiento de diversas distribuciones. Se puede considerar como antecedentes

IES Padre Poveda (Guadix) Matemáticas Aplicadas a las CCSS I

Departamento de Matemáticas Bloque III: Estadística y Probabilidad Profesor: Ramón Lorente Navarro Unidad 10: Distribuciones Unidimensionales

3

3.3 TABLA PARA DATOS AGRUPADOS EN INTERVALOS O CLASES Si la variable estadística es continua, o bien es discreta pero con gran cantidad de datos, éstos deben agruparse en intervalos o clases. Marca de clase: Valor medio de cada intervalo. Se obtiene haciendo la semisuma de los extremos del

intervalo. Es el valor representativo de ese intervalo o clase. Usualmente se toman todos los intervalos con la misma amplitud salvo que existan valores muy dispersos. En general, se considerarán los intervalos cerrados a la izquierda y abiertos a la derecha. Ejemplo: A los 100 empleados de una empresa de piezas de precisión se les ha realizado una prueba

de habilidad manual. En una escala de 0 a 100 se han obtenido las siguientes puntuaciones:

27 66 32 55 46 37 75 81 18 33 47 74 37 52 47 66 80 87 37 29 46 15 29 90 76 67 23 35 94 23 25 56 73 78 17 28 76 58 45 36 55 60 17 56 23 82 64 50 51 45 37 65 62 26 69 36 54 42 40 54 27 62 28 65 46 92 36 33 23 66 18 82 47 49 59 45 73 43 47 83 78 65 39 36 53 91 38 35 68 78 91 23 34 43 55 56 74 56 62 38

Formamos la tabla estadística de frecuencias:

Habil. Manual ix in iN if iF

[15, 25) [25, 35) [35, 45) [45, 55) [55, 65) [65, 75) [75, 85) [85, 95)

20 30 40 50 60 70 80 90

10 12 17 17 14 13 11 6

10 22 39 56 70 83 94

100

10/100≈0.10 12/100≈0.12 17/100≈0.17 17/100≈0.17 14/100≈0.14 13/100≈0.13 11/100≈0.11 6/100≈0.06

10/100=0.10 22/100=0.22 39/100=0.39 56/100=0.56 70/100=0.70 83/100=0.83 94/100=0.94 100/100=1

100=N 1

4. REPRESENTACIONES GRÁFICAS Permiten comunicar mediante un gráfico los resultados de un estudio estadístico. 4.1 DIAGRAMA DE BARRAS

Se usa con caracteres cualitativos (atributos), o cuantitativos discretos. En el eje horizontal se ponen las distintas modalidades del carácter en el caso de los atributos, o bien los valores xi que toma la variable estadística discreta. A continuación se escriben las frecuencias absolutas en el eje vertical y se levanta una barra o rectángulo correspondiente a cada modalidad o valor xi de altura su correspondiente frecuencia ni . El diagrama de barras de los ejemplos de los apartados 3.1 y 3.2 sería:

0

5

10

15

20

25

30

35

40

Rubio Moreno Castaño Pelirrojo OtrosColor de pelo

Núm

ero

de a

lum

nos

0

1

2

3

4

5

6

7

8

0 1 2 3 4 5 6 7 8 9Notas

Núm

ero

de a

lum

nos

Page 4: UNIDAD 10 DISTRIBUCIONES UNIDIMENSIONALES 1. … · De esta manera podremos describir y comparar el comportamiento de diversas distribuciones. Se puede considerar como antecedentes

IES Padre Poveda (Guadix) Matemáticas Aplicadas a las CCSS I

Departamento de Matemáticas Bloque III: Estadística y Probabilidad Profesor: Ramón Lorente Navarro Unidad 10: Distribuciones Unidimensionales

4

4.2 HISTOGRAMA Se utiliza con caracteres cuantitativos agrupados en intervalos o clases. En cada intervalo o clase se forma un rectángulo que tiene por base la amplitud del intervalo y como altura su in correspondiente. Por tanto los rectángulos están unidos entre sí. El histograma del ejemplo del apartado 3.3 sería:

02468

1012141618

[15,25) [25,35) [35,45) [45,55) [55,65) [65,75) [75,85) [85,95)

Puntuación en prueba de habilidad manual

Núm

ero

de e

mpl

eado

s

4.3 POLÍGONO DE FRECUENCIAS Se usa con todo tipo de caracteres. Es una línea poligonal que une los extremos de las barras que forman el diagrama de barras o los puntos medios de la parte superior de los rectángulos del histograma. El polígono de frecuencias de los tres ejemplos anteriores quedaría así:

0

5

10

15

20

25

30

35

40

Rubio Moreno Castaño Pelirrojo OtrosColor de pelo

Núm

ero

de a

lum

nos

0

1

2

3

4

5

6

7

8

0 1 2 3 4 5 6 7 8 9Notas

Núm

ero

de a

lum

nos

02468

1012141618

[15,25) [25,35) [35,45) [45,55) [55,65) [65,75) [75,85) [85,95)

Puntuación en prueba de habilidad manual

Núm

ero

de e

mpl

eado

s

4.4 DIAGRAMA DE SECTORES

Se utiliza, en la mayoría de los casos, con caracteres cualitativos. Se divide el círculo en sectores circulares de modo que su área sea proporcional a la frecuencia absoluta ni de la modalidad considerada del carácter estudiado. El diagrama de sectores del ejemplo 3.1 sería:

Rubio: 00 36.52

36011016

≈⇒= αα

Moreno: 00 55.78

36011024

≈⇒= αα Otros Rubio

Castaño: 00 55.114

36011035

≈⇒= αα Pelirrojo Moreno

Pelirrojo: 00 73.32

36011010

≈⇒= αα Castaño

Otros: 00 82.81

36011025

≈⇒= αα

Page 5: UNIDAD 10 DISTRIBUCIONES UNIDIMENSIONALES 1. … · De esta manera podremos describir y comparar el comportamiento de diversas distribuciones. Se puede considerar como antecedentes

IES Padre Poveda (Guadix) Matemáticas Aplicadas a las CCSS I

Departamento de Matemáticas Bloque III: Estadística y Probabilidad Profesor: Ramón Lorente Navarro Unidad 10: Distribuciones Unidimensionales

5

4.5 PICTOGRAMA Son dibujos alusivos a la distribución que se utilizan para comparar datos no agrupados en intervalos o clases. Su principal problema es que tienen muy poca precisión.

4.6 CARTOGRAMA Consiste en representar sobre un mapa cualquier tipo de dato relacionado con un área geográfica.

4.7 PIRÁMIDES DE POBLACIÓN Son dos histogramas horizontales que comparten el eje vertical que contiene los intervalos de clase. En uno de ellos, se representan los datos correspondientes a la distribución por edades del sexo masculino y en el otro, los del sexo femenino.

5. MEDIDAS DE POSICIÓN Tienen como objetivo resumir, en pocos valores numéricos, la información contenida en las tablas estadísticas de frecuencias. Estos valores representativos del conjunto de datos reciben el nombre de parámetros o medidas de posición.

5.1 MEDIDAS DE TENDENCIA CENTRAL

Aportan valores numéricos que se interpretan como resumen global de la distribución. • MEDIA ARITMÉTICA

Valor que se obtiene al dividir la suma de todos los valores de la variable, multiplicados por sus frecuencias absolutas, entre el número total de éstos.

Nnxnxnxx nn ⋅+⋅+⋅

=...2211 de modo abreviado

N

nxx

n

iii∑

=

⋅= 1 (También ∑

=

⋅=n

iii fxx

1

)

Si la distribución está agrupada en intervalos o clases, ix será la marca de clase de cada intervalo.

Media ponderada:

Pesosp

p

pxx

i

n

ii

n

iii

p

⋅=

=

=

1

1

Page 6: UNIDAD 10 DISTRIBUCIONES UNIDIMENSIONALES 1. … · De esta manera podremos describir y comparar el comportamiento de diversas distribuciones. Se puede considerar como antecedentes

IES Padre Poveda (Guadix) Matemáticas Aplicadas a las CCSS I

Departamento de Matemáticas Bloque III: Estadística y Probabilidad Profesor: Ramón Lorente Navarro Unidad 10: Distribuciones Unidimensionales

6

Cálculo práctico de la media aritmética: Caso 1: Datos no agrupados Ejemplo: El número de hijos de las familias de 40 alumnos de 1º de Bachillerato viene dado por la

tabla:

Es decir, el número medio de hijos por familia es de 2.6

Caso 2: Datos agrupados en intervalos o clases Ejemplo: La duración en horas de 30 bombillas viene dada por la tabla:

Es decir, la duración media de cada bombilla es de 596 horas.

• MODA

Es el valor de la variable estadística, o la modalidad en el caso de atributos, con mayor frecuencia absoluta. La moda puede no ser única, es decir, la distribución puede tener dos modas, tres…, en cuyo caso reciben en nombre de bimodal, trimodal… Estas distribuciones se llaman plurimodales. Cálculo práctico de la moda:

Caso 1: Datos no agrupados o atributos Ejemplo 1: Si observamos la tabla de frecuencias del punto 3.1:

COLOR DE PELO in

Rubio Moreno Castaño Pelirrojo Otros

16 24 35 10 25

110=N

Es decir, la moda de la distribución es tener color de pelo castaño. Ejemplo 2: El número de hijos de las familias de 40 alumnos de 1º de Bachillerato viene dado por

la tabla:

Nº hijos ( )ix in ii nx ⋅ 1 2 3 4 5

7 14 9 8 2

7 28 27 32 10

40=N 104

Número horas ix in ii nx ⋅ [310, 420) [420, 530) [530, 640) [640, 750) [750, 860) [860, 970)

365 475 585 695 805 915

1 9

11 5 3 1

365 4275 6435 3475 2415 915

30=N 17880

6.240

104

5

1 ==⋅

=∑=

N

nxx i

ii

59630

17880

6

1 ==⋅

=∑=

N

nxx i

ii

CastañoMo =

Según el estadístico Lidny Yule, un parámetro de centralización o de dispersión debe verificar: • Definirse de

modo objetivo. • Usar todas las

observaciones. • Tener un

significado concreto.

• Ser sencillo de calcular.

• Prestarse al cálculo algebraico.

• Ser poco sensible a fluctuaciones muestrales.

Page 7: UNIDAD 10 DISTRIBUCIONES UNIDIMENSIONALES 1. … · De esta manera podremos describir y comparar el comportamiento de diversas distribuciones. Se puede considerar como antecedentes

IES Padre Poveda (Guadix) Matemáticas Aplicadas a las CCSS I

Departamento de Matemáticas Bloque III: Estadística y Probabilidad Profesor: Ramón Lorente Navarro Unidad 10: Distribuciones Unidimensionales

7

Es decir, la moda de la distribución es tener dos hijos por familia.

Caso 2: Datos agrupados en intervalos o clases Intervalo o clase modal (IMo): la que tiene mayor frecuencia absoluta. Como una primera aproximación puede tomarse como MODA la marca de clase de la clase modal, pero si se desea una mayor precisión se obtendrá con la expresión:

( ) ( )11

1

+−

−+−−

+=iiii

iii nnnn

nnCLMo

Ejemplo: La duración en horas de 30 bombillas viene dada por la tabla:

Es decir, la moda de la distribución es que una bombilla dure 557.5 horas. Fíjate, una aproximación menos precisa hubiese sido tomar la marca de clase .585=Mo

• MEDIANA Es el valor de la variable estadística que divide a la población en dos partes iguales, es decir, el 50% de las observaciones serán inferiores a dicho valor y el otro 50% serán superiores. Es, por tanto, el valor que ocupa el lugar central en un conjunto ordenado de datos. Cálculo práctico de la mediana:

En cualquier caso, lo primero que se hará es calcular .2N

Caso 1: Datos no agrupados

Observamos el primer valor de las frecuencias absolutas acumuladas iN igual o superior a 2N

y se

obtiene la mediana Me como se describe en los dos ejemplos siguientes: Ejemplo 1: Ejemplo 2:

Nº hijos ( )ix in 1 2 3 4 5

7 14 9 8 2

40=N

Número horas ix in [310, 420) [420, 530) [530, 640) [640, 750) [750, 860) [860, 970)

365 475 585 695 805 915

1 9

11 5 3 1

30=N

ix in Ni

1 2 3 4 5

7 14 9 8 2

7 21 30 38 40

40=N

ix in Ni

1 2 3 4 5

7 13 10 7 3

7 20 30 37 40

40=N

2=Mo

Siendo: →iL Límite inferior de la clase modal →C Amplitud de la clase modal →in Frecuencia absoluta clase modal

Intervalo Modal: [ )640,530=MoI

( ) ( ) 5.557511911

911110530 =−+−

−+=Mo

20240

2==

N

2=Me

20240

2==

N

5.22

32=

+=Me

5.2=Me

Método gráfico de cálculo de la moda (semejanza) ni Mo En distribuciones agrupadas

Page 8: UNIDAD 10 DISTRIBUCIONES UNIDIMENSIONALES 1. … · De esta manera podremos describir y comparar el comportamiento de diversas distribuciones. Se puede considerar como antecedentes

IES Padre Poveda (Guadix) Matemáticas Aplicadas a las CCSS I

Departamento de Matemáticas Bloque III: Estadística y Probabilidad Profesor: Ramón Lorente Navarro Unidad 10: Distribuciones Unidimensionales

8

Fíjate:

1º) Se calcula 2N

y observamos la tabla en iN (frecuencias absolutas acumuladas).

2º) Si no coincide con ningún valor de MeNi ⇒ es el valor del primer valor ix tal que .2 iNN<

3º) Si iNN=

2 entonces .

21++

= ii xxMe

Observación: Si el número de datos es pequeño no hace falta obtener la tabla estadística de frecuencias:

Número impar de datos: Número par de datos: 20, 23, 25, 20, 29, 26, 25, 25, 23 2, 3, 8, 3, 7, 8, 5, 4, 3, 2 ⇓ ⇓ 20, 20, 23, 23, 25, 25, 25, 26, 29 2, 2, 3, 3, 3, 4, 5, 7, 8, 8 ⇓ ⇓

25=Me 5.32

43=

+=Me

Caso 2: Datos agrupados en intervalos o clases

Una vez calculado 2N

se determina el Intervalo mediano o clase mediana IMe , que es el que va a

contener a la mediana. Aunque se podría tomar su marca de clase como una primera aproximación a la mediana, ésta se puede obtener con mayor precisión a partir de la expresión:

i

i

i n

NN

CLMe12 −−

+=

Ejemplo: Una estación meteorológica registró 88 días de lluvia el pasado año, según se muestra

en la tabla siguiente:

Ejemplo: Obtén la mediana de este conjunto de datos agrupados por intervalos:

Litros/ m2 ix in iN

[0, 5) [5, 10)

[10, 15) [15, 20) [20, 25) [25, 30) [30, 35)

2.5 7.5

12.5 17.5 22.5 27.5 32.5

3 7

19 23 18 12 6

3 10 29 52 70 82 88

88=N

[ )1, +ii LL ix in iN

[0, 1) [1, 3) [3, 6) [6, 10)

[10, 12)

0.5 2

4.5 8

11

1 6 7

12 2

1 7

14 26 28

28=N

Siendo: →iL Límite inferior de la clase mediana →C Amplitud de la clase mediana →in Frecuencia absoluta clase mediana →iN Frecuencia absoluta acumulada clase mediana

Obtención del intervalo mediano:

⇒== 44288

2N [ )20,15=MeI

Por tanto:

26.1823

2944515 ≈−

+=Me ⇒ 26.18≈Me

Método gráfico de cálculo de la mediana (semejanza) Ni N/2 Ni-1 Li Me Li+1 En distribuciones agrupadas

Obtención del intervalo mediano:

⇒== 14228

2N [ )6,3=MeI

En este caso ⇒ 6=Me Fíjate, si aplicamos la fórmula:

67

71433 =−

+=Me ⇒ 6=Me

Método gráfico de cálculo de la mediana en este caso

N/2 = Ni Ni-1 Li Me =Li+1 En distribuciones agrupadas

Page 9: UNIDAD 10 DISTRIBUCIONES UNIDIMENSIONALES 1. … · De esta manera podremos describir y comparar el comportamiento de diversas distribuciones. Se puede considerar como antecedentes

IES Padre Poveda (Guadix) Matemáticas Aplicadas a las CCSS I

Departamento de Matemáticas Bloque III: Estadística y Probabilidad Profesor: Ramón Lorente Navarro Unidad 10: Distribuciones Unidimensionales

9

5.2 MEDIDAS DE TENDENCIA NO CENTRAL (CUANTILES) Los cuantiles son medidas de posición ya que va a suministrar valores entre los cuales se encuentra parte de la distribución. Van a dividir a la distribución en partes iguales y van a recibir distintos nombres, según el número de partes en que se divida la distribución.

• CUARTILES Son 3 valores de la variable, ,,, 321 QQQ que dividen a la población en 4 partes iguales. Entre dos cuartiles consecutivos se encuentra 1/4 (25%) de la población. 25% 25% 25% 25% 1Q 2Q 3Q Es evidente que .2 MeQ = Fíjate:

1Q deja por debajo el 25% de los datos.

2Q deja por debajo el 50% de los datos.

3Q deja por debajo el 75% de los datos. Cálculo práctico de cuartiles: El procedimiento es análogo al del cálculo de la mediana, tanto en el caso de datos no agrupados como en el caso de datos agrupados en intervalos o clases. Caso 1: Datos no agrupados Observamos el primer valor de las frecuencias absolutas acumuladas iN igual o inferior a

242,

4NNN

= o bien 4

3Nsegún se desee obtener 21,QQ o 3Q respectivamente, y se procede de la

misma forma que con la mediana.

Caso 2: Datos agrupados en intervalos o clases

Una vez calculado 24

2,4

NNN= o bien

43N

, según se desee obtener 21,QQ o 3Q

respectivamente, se determina el intervalo en el que se va a encontrar el cuartil correspondiente. Aunque se podrían tomar sus marcas de clase como una primera aproximación de los cuartiles, éstos se pueden obtener con mayor precisión a partir de las expresiones:

i

i

i n

NN

CLQ1

14 −−

+= MeQ =2 i

i

i n

NN

CLQ1

34

3−−

+=

• DECILES

Son 9 valores de la variable, ,,...,, 921 DDD que dividen la población en 10 partes iguales. Entre dos deciles consecutivos se encuentra 1/10 (10%) de la población. 10% 10% 10% 10% 10% 10% 10% 10% 10% 10% 1D 2D 3D 4D 5D 6D 7D 8D 9D Cálculo práctico de deciles: El procedimiento es análogo al del cálculo de los cuartiles, tanto en el caso de datos no agrupados como en el caso de datos agrupados en intervalos o clases.

Page 10: UNIDAD 10 DISTRIBUCIONES UNIDIMENSIONALES 1. … · De esta manera podremos describir y comparar el comportamiento de diversas distribuciones. Se puede considerar como antecedentes

IES Padre Poveda (Guadix) Matemáticas Aplicadas a las CCSS I

Departamento de Matemáticas Bloque III: Estadística y Probabilidad Profesor: Ramón Lorente Navarro Unidad 10: Distribuciones Unidimensionales

10

Caso 1: Datos no agrupados Observamos el primer valor de las frecuencias absolutas acumuladas iN igual o inferior a

109,...,

102,

10NNN

según se desee obtener 921 ,...,, DDD respectivamente, y se procede de la misma

forma que con los cuartiles. Caso 2: Datos agrupados en intervalos o clases

Una vez calculado ,109,...,

102,

10NNN

según se desee obtener 921 ,...,, DDD respectivamente, se

determina el intervalo en el que se va a encontrar el decil correspondiente. Aunque se podrían tomar sus marcas de clase como una primera aproximación de los deciles, éstos se pueden obtener con mayor precisión a partir de la expresión:

i

i

ik n

NkN

CLD110 −−

+= { }9...,,2,1∈k

• PERCENTILES O CENTILES

Son 99 valores de la variable, ,,...,, 9921 PPP que dividen la población en 100 partes iguales. Entre dos percentiles consecutivos se encuentra 1/100 (1%) de la población. 1% 1% 1% 1% 1% 1% 1% 1% 1% 1P 2P 3P 4P 5P kP 96P 97P 98P 99P Cálculo práctico de percentiles: El procedimiento es análogo al del cálculo de los cuartiles y deciles, tanto en el caso de datos no agrupados como en el caso de datos agrupados en intervalos o clases. Caso 1: Datos no agrupados Observamos el primer valor de las frecuencias absolutas acumuladas iN igual o inferior a

10099,...,

1002,

100NNN

según se desee obtener 9921 ,...,, PPP respectivamente, y se procede de la

misma forma que con los cuartiles y deciles. Ejemplo: En una empresa se lleva a cabo un estudio sobre la calidad de su producción. La

distribución siguiente informa sobre el número de piezas defectuosas encontradas en 100 cajas examinadas con 50 unidades cada una de ellas.

a) Obtén el valor de los cuartiles. b) Calcula los deciles 3 y 8. c) Obtén los percentiles 27 y 84.

Nº piezas defectuosas ( )ix Nº cajas ( )in Ni

0 1 2 3 4 5 6 7 8 9

10

6 9

10 11 14 16 16 9 4 3 2

6 15 25 36 50 66 82 91 95 98

100 100=N

Page 11: UNIDAD 10 DISTRIBUCIONES UNIDIMENSIONALES 1. … · De esta manera podremos describir y comparar el comportamiento de diversas distribuciones. Se puede considerar como antecedentes

IES Padre Poveda (Guadix) Matemáticas Aplicadas a las CCSS I

Departamento de Matemáticas Bloque III: Estadística y Probabilidad Profesor: Ramón Lorente Navarro Unidad 10: Distribuciones Unidimensionales

11

⇒1Q 254

1004

==N

⇒ 5.21 =Q ⇒2Q 502

1002

==N

⇒ 5.42 ==MeQ

⇒3Q 754

3004

3==

N⇒ 63 =Q

⇒3D 3010300

103

==N

⇒ 33 =D ⇒8D 8010800

108

==N

⇒ 68 =D

⇒27P 271002700

10027

==N

⇒ 327 =P ⇒84P 841008400

10084

==N

⇒ 784 =P

Caso 2: Datos agrupados en intervalos o clases

Una vez calculado 10099,...,

1002,

100NNN

según se desee obtener 9921 ,...,, PPP respectivamente, se

determina el intervalo en el que se va a encontrar el percentil correspondiente. Aunque se podrían tomar sus marcas de clase como una primera aproximación de los percentiles, éstos se pueden obtener con mayor precisión a partir de la expresión:

i

i

ik n

NkN

CLP1100 −−

+= { }99...,,2,1∈k

Ejemplo: En el ejemplo de la estación meteorológica obtener el valor de los cuartiles, del decil 7 y

del percentil 34.

⇒1Q [ )15,1022488

4 1=⇒== QIN 16.13

1910225101 ≈

−+=⇒Q ⇒ 16.131 ≈Q

⇒2Q [ )20,1544288

2 2=⇒== QI

N 26.1823

29445152 =−

+=⇒Q ⇒ 26.182 ≈=MeQ

⇒3Q [ )25,20664

2644

33=⇒== QI

N 89.2318

52665203 ≈−

+=⇒Q ⇒ 89.233 ≈Q

⇒7D [ )25,206.6110616

107

7=⇒== DIN

67.2218

526.615207 ≈−

+=⇒D ⇒ 67.227 ≈D

⇒34P [ )20,1592.291002992

10034

34=⇒== PI

N 2.1523

2992.2951534 =−

+=⇒P ⇒ 2.1534 =P

Litros/ m2 ix in iN

[0, 5) [5, 10)

[10, 15) [15, 20) [20, 25) [25, 30) [30, 35)

2.5 7.5

12.5 17.5 22.5 27.5 32.5

3 7

19 23 18 12 6

3 10 29 52 70 82 88

88=N

En primer lugar, hay que obtener el intervalo o clase en el que se encuentra cada uno de los cuantiles que vamos a calcular.

Page 12: UNIDAD 10 DISTRIBUCIONES UNIDIMENSIONALES 1. … · De esta manera podremos describir y comparar el comportamiento de diversas distribuciones. Se puede considerar como antecedentes

IES Padre Poveda (Guadix) Matemáticas Aplicadas a las CCSS I

Departamento de Matemáticas Bloque III: Estadística y Probabilidad Profesor: Ramón Lorente Navarro Unidad 10: Distribuciones Unidimensionales

12

6. MEDIDAS DE DISPERSIÓN Nos permiten conocer el grado de agrupamiento de los datos en torno a las medidas de centralización. 6.1 MEDIDAS DE DISPERSIÓN ABSOLUTAS

Se utilizan en estudios individualizados de distribuciones.

• RECORRIDO O RANGO Se define como la diferencia entre el mayor y el menor valor de la variable:

mínmáxE xxR −= mínx máxx

• RECORRIDO O RANGO INTERCUARTÍLICO Se define como la diferencia entre el tercer y el primer cuartil: 50%

13 QQRI −= mínx 1Q Me 3Q máxx

Nos proporciona la longitud del intervalo en el que se encuentran el 50% de las observaciones centrales.

• DESVIACIÓN MEDIA RESPECTO A LA MEDIA Se define como:

• VARIANZA Se define como:

( )

N

nxxn

iii∑

=

⋅−= 1

2

2σ o bien 21

2

2 xN

nxn

iii

−⋅

=∑=σ

También se representa con .2S

• DESVIACIÓN TÍPICA Se define como la raíz cuadrada de la varianza:

2σσ = Es la medida de dispersión más utilizada. Nos proporciona la dispersión de los datos respeto a la media aritmética en su misma dimensión. También se representa con .S

6.2 MEDIDAS DE DISPERSIÓN RELATIVAS Permiten comparar distintos grados de dispersión de distribuciones heterogéneas. Se va a estudiar únicamente el coeficiente de variación.

• COEFICIENTE DE VARIACIÓN Se define como:

x

Cvσ

= siempre que .0≠x Se puede dar en porcentaje

Permite comparar dos poblaciones o muestras para determinar en cual de ellas es más representativa su media. Cuanto menor sea el valor obtenido del coeficiente de variación más representativa será la media en esa población o muestra.

N

nxxD

n

iii

x

∑=

⋅−= 1

Page 13: UNIDAD 10 DISTRIBUCIONES UNIDIMENSIONALES 1. … · De esta manera podremos describir y comparar el comportamiento de diversas distribuciones. Se puede considerar como antecedentes

IES Padre Poveda (Guadix) Matemáticas Aplicadas a las CCSS I

Departamento de Matemáticas Bloque III: Estadística y Probabilidad Profesor: Ramón Lorente Navarro Unidad 10: Distribuciones Unidimensionales

13

Ejemplo: Calcula las medidas de dispersión anteriores en la siguiente distribución de frecuencias:

ix in iN ii nx ⋅ ii nx ⋅2 xxi − ii nxx ⋅− 1 2 3 4 5

7 14 9 8 2

7 21 30 38 40

7 28 27 32 10

7 56 81

128 50

1.6 0.6 0.4 1.4 2.4

11.2 8.4 3.6

11.2 4.8

40=N 104 322 39.2

415 =−=−= mínmáxE xxR

5.125.313 =−=−= QQRI

ya que ⇒== 10440

4N ;21 =Q ⇒== 30

4120

43N

5.32

433 =

+=Q

98.040

2.39

5

1 ==⋅−

=∑=

N

nxxD i

ii

x ya que 6.240

104

5

1 ==⋅

=∑=

N

nxx i

ii

29.176.605.86.240

322 22

5

1

2

2 =−=−=−⋅

=∑= x

N

nxi

ii

σ

14.129.12 ≈== σσ

44.06.229.1

≈==x

Cvσ %44⇒

Si la distribución se agrupa en intervalos se hará igual pero tomando las marcas de clase.

Ejemplo: En unas caballerizas los pesos de los caballos se distribuyen con una media de

kgx 400= y una desviación típica .30 kg=σ En una tienda de mascotas el peso de los perros tienen una media de kgx 22= y una desviación típica .12 kg=σ Compara la dispersión en términos absolutos y relativos de los pesos de estos animales.

Caballerizas: 075.040030

30400

===⇒⎭⎬⎫

==

xC

kgkgx

σ%5.7⇒

Tienda de mascotas: 545.02212

1222

≈==⇒⎭⎬⎫

==

xC

kgkgx

σ%5.54⇒

La desviación típica de los pesos de los caballos es mayor que la de los perros. Sin embargo, la diferencia no es muy notable en el caso de los equinos pero sí lo es en el de los canes, al contrario de lo que puede parecer a primera vista si observamos los datos absolutos. Los caballos tienen pesos similares, mientras que los perros son muy heterogéneos. El cálculo del coeficiente de variación nos permite confirmar nuestras conclusiones anteriores y además cuantifica esta situación: el peso de los caballos varía en un %5.7 mientras que el de los chuchos lo hace en un %.5.54

Page 14: UNIDAD 10 DISTRIBUCIONES UNIDIMENSIONALES 1. … · De esta manera podremos describir y comparar el comportamiento de diversas distribuciones. Se puede considerar como antecedentes

IES Padre Poveda (Guadix) Matemáticas Aplicadas a las CCSS I

Departamento de Matemáticas Bloque III: Estadística y Probabilidad Profesor: Ramón Lorente Navarro Unidad 10: Distribuciones Unidimensionales

14

7. DIAGRAMA DE TALLOS Y HOJAS. DIAGRAMA DE CAJAS Y BIGOTES. 7.1 DIAGRAMA DE TALLOS Y HOJAS.

Es una forma rápida de resumir los datos de una distribución estadística y mantener a la vista todas las observaciones individuales. Ejemplo: El número de corbatas que se han vendido en unos grandes almacenes en 15 días son:

45 47 24 42 43 51 58 60 45 47 47 67 82 51 55 Se ordenan de menor a mayor: 24 42 43 45 45 47 47 47 51 51 55 58 60 67 82 Se forma el diagrama de tallos y hojas:

También se puede formar primero el diagrama de tallos y hojas y, posteriormente, ordenarlos.

Ejemplo: Los resultados obtenidos en Matemáticas II de la Prueba de Acceso a la Universidad en un

determinado centro en el curso 2015/2016 fueron: 10 8 9.5 8 9.9 10 9.9 9 10 9.4 7.4 9.5 9.2 8 3.5 10 Se ordenan de menor a mayor:

3.5 7.4 8 8 8 9 9.2 9.4 9.5 9.5 9.9 9.9 10 10 10 10

Formamos el diagrama de tallos y hojas y la tabla estadística de frecuencias:

En este caso se han agrupado los datos de la tabla en intervalos.

Número corbatas ( )ix in iN 24 42 43 45 47 51 55 58 60 67 82

1 1 1 2 3 2 1 1 1 1 1

1 2 3 5 8

10 11 12 13 14 15

15=N

2 4 4 2 3 5 5 7 7 7 5 1 1 5 8 6 0 7 8 2

3 5 4 5 6 7 4 8 0 0 0 9 0 2 4 5 5 9 9

10 0 0 0 0

Puntuación( )ix

Nº alumnos( in ) iN

[0, 1) [1, 2) [2, 3) [3, 4) [4, 5) [5, 6) [6, 7) [7, 8) [8, 9)

[9, 10]

0 0 0 1 0 0 0 1 3

11

0 0 0 1 1 1 1 2 5

16 16=N

Podemos obtener la tabla estadística de frecuencias a partir del diagrama de tallos y hojas:

HojasTallo↑↑

HojasTallo↑↑

Page 15: UNIDAD 10 DISTRIBUCIONES UNIDIMENSIONALES 1. … · De esta manera podremos describir y comparar el comportamiento de diversas distribuciones. Se puede considerar como antecedentes

IES Padre Poveda (Guadix) Matemáticas Aplicadas a las CCSS I

Departamento de Matemáticas Bloque III: Estadística y Probabilidad Profesor: Ramón Lorente Navarro Unidad 10: Distribuciones Unidimensionales

15

7.2 DIAGRAMA DE CAJAS Y BIGOTES. Sintetiza la información de una distribución dividiéndola en cuatro partes con igual número de datos. Los cuartiles marcan los puntos de división. Las cajas encierran los datos comprendidos entre cuartiles y los bigotes el 25% de los datos que están por debajo y por encima del primer y tercer cuartil respectivamente. Ejemplo: Obtener el diagrama de cajas y bigotes de la distribución:

xmín= 2 3 Q1 = 4 5 Me = 6 Q3 = 7 8 xmáx= 9

Si calculamos el rango intercuartílico: 34713 =−=−= QQRI se obtienen los posibles valores atípicos. Para ello se calculan los límites internos del conjunto de datos:

5.035.145.111 −=⋅−=−= IRQf 5.1135.175.132 =⋅+=+= IRQf

Nos indican que todos los valores que tome la variable estadística y que sean inferiores a

1f y superiores a 2f , es decir exteriores al intervalo ( )21, ff , se considerarán atípicos (anómalos). Valores atípicos son aquellos que se alejan significativamente del resto de las observaciones de una distribución de frecuencias. Puede ocurrir por diversas causas: error en la toma de datos, suceso extraordinario… Lo representaremos con . En nuestro ejemplo la variable no toma ningún valor atípico por lo que los extremos de los bigotes van de la caja a los valores xmín y xmáx. Un valor atípico suele ser leve (moderado) pero si excede de IRQ 31 − o IRQ 33 + , llamados límites externos, se considerará un valor atípico extremo y lo representaremos con ∗ .

ix in iN 2 4 6 7 9

3 5 7 4 2

3 8

15 19 21

21=N

Hay que calcular máxmín xxQMeQ ,,,, 31

425.5421

4; 11 =⇒== QNQ

65.10221

2; 22 =⇒=== QNMeQ

775.15463

43; 33 =⇒== QNQ

o