Medidas descriptivas · (asimetría negativa) Media, Mediana y Moda. Estadísticos de posición:...

Preview:

Citation preview

Medidas descriptivas

• Los fenómenos biológicos no suelen ser

constantes, por lo que será necesario

que junto a una medida que indique el

valor alrededor del cual se agrupan los

datos, se asocie una medida que haga

referencia a la variabilidad que refleje

dicha fluctuación.

• La tendencia central de los datos.

• La dispersión o variación con respecto a

este centro.

• Los datos que ocupan ciertas posiciones.

• La simetría de los datos.

• La forma en la que los datos se agrupan.

Medidas representativas de un

conjunto de datos estadísticos

Estadísticos de tendencia

central

• la media

• la mediana

• la moda

En ciertas ocasiones estos tres

estadísticos suelen coincidir, aunque

generalmente no es así. Cada uno de

ellos presenta ventajas e inconvenientes.

La media

• Es la medida mas popular.

• Es decir, tenemos una muestra de n observaciones: x1, x2,…,xn. Su media muestral es:

• De forma compacta:n

)x...xx( n21 +++=x

=

=n

1i

ixn

1x

Suma de las observaciones

Número de observacionesMedia =

=+++++

=

= =

6

xxxxxx

6

xx 654321i

61i

• Ejemplo:

La media de la muestra de seis

observaciones:

7, 3, 9, -2, 4, 6

esta dada por:

7 3 9 4 64.5

2−

16 empleados

5.116

)3(2)2(7)1(4)0(3

16

x...xx

16

xx 1621i

161i =

+++=

++=

= =

Medidas de Posición Central: la media

Cuando muchas observaciones toman el mismo valor, estas se pueden

resumir en una tabla de frecuencias. Supongamos que el número de

Hijos en una muestra de 16 empleados fuera el siguiente:

NUMERO DE HIJOS 0 1 2 3

NUMERO DE EMPLEADOS 3 4 7 2

• Ejemplo:

Propiedades de la media

• La suma de los desvíos de los valores de la

variable, calculado con respecto de la media

aritmética es = 0

=−

=−

0)(

0)(

ii

i

nXx

Xx

• La media aritmética

del producto de una

constante por una

variable es = a la

constante por la

media aritmética de

la variable:

Xaxa .. =

• La media aritmética

de la suma de dos

variables es = a la

suma de sus

respectivas medias

aritméticas:YXyx +=+

Mediana

• Es el valor de la serie de datos que se sitúa justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores).

• Los datos deben ordenarse de menor a mayor

• No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en su cálculo toda la información de la serie de datos (no pondera cada valor por el número de veces que se ha repetido).

La mediana

Nro. de observaciones es impar

26,26,28,29,30,32,60

Los salarios de siete empleados fueron

los siguientes (en 1000s) :

28, 60, 26, 32, 30, 26, 29.

¿Cuál es la mediana?

Supongamos que se agrega al grupo el

Salario de un empleado más ($31,000).

¿Cuál es la mediana?

Nro. de observaciones es par

26,26,28,29, 30,31, 32,60

Hay dos valores en el medio!

Primero, ordenar los salarios.

Luego, localizar el valor en el medio.

26,26,28,29, 30,31,32,6029.5,

• Ejemplo:

Primero, ordenar los salarios.

Luego, localizar el valor en el medio.

La moda es el valor que ocurre con

mayor frecuencia en un grupo de

observaciones.

La modaCuando la muestra

es grande, los datos

se agrupan en intervalos

y obtenemos el

Intervalo modal

La Moda

En un conjunto de observaciones puede haber más de una

moda.

Ejemplo

El gerente de una tienda de ropa posee la siguiente

información sobre el talle de los pantalones que

se vendieron ayer:

31, 34, 36, 33, 28, 34, 30, 34, 32, 40.

La Moda es 34

En muchos casos, la moda nos da

información mas valiosa que la

mediana: 33.2.

La Moda

Ejemplo

• Vamos a utilizar la

distribución de

frecuencias con

datos de la estatura

(altura a la cruz) de

los terneros de un

lote a remate.

VariableFrecuencias absolutas

Frecuencias relativas

(Valor) Simple Acumulada Simple Acumulada

1,20 1 1 3,3% 3,3%

1,21 4 5 13,3% 16,6%

1,22 4 9 13,3% 30,0%

1,23 2 11 6,6% 36,6%

1,24 1 12 3,3% 40,0%

1,25 2 14 6,6% 46,6%

1,26 3 17 10,0% 56,6%

1,27 3 20 10,0% 66,6%

1,28 4 24 13,3% 80,0%

1,29 3 27 10,0% 90,0%

1,30 3 30 10,0% 100,0%

• Media aritmética:

• Luego:

• Por lo tanto, la estatura media de este

grupo de es de 1,253 m.

( ) ( ) ( )30

330,1421,1120,1 +++=

x

253,1=x

• Mediana: La mediana

de esta muestra es 1,26

m, ya que por debajo

está el 50% de los

valores y por arriba el

otro 50%. Esto se puede

ver al analizar la

columna de frecuencias

relativas acumuladas.

Como el valor 1,26 se repite en 3 ocasiones, la media

se situaría exactamente entre el primer y el segundo

valor de este grupo, ya que entre estos dos valores se

encuentra la división entre el 50% inferior y el 50%

superior.

Variable

Frecuencias absolutas

Frecuencias relativas

(Valor) SimpleAcumula

daSimple

Acumulada

1,20 1 1 3,3% 3,3%

1,21 4 5 13,3% 16,6%

1,22 4 9 13,3% 30,0%

1,23 2 11 6,6% 36,6%

1,24 1 12 3,3% 40,0%

1,25 2 14 6,6% 46,6%

1,26 3 17 10,0% 56,6%

1,27 3 20 10,0% 66,6%

1,28 4 24 13,3% 80,0%

1,29 3 27 10,0% 90,0%

1,30 3 30 10,0%100,0

%

• Moda: Hay 3 valores

que se repiten en 4

ocasiones: el 1,21, el

1,22 y el 1,28, por lo

tanto esta seria

cuenta con 3 modas.

VariableFrecuencias absolutas

Frecuencias relativas

(Valor) Simple Acumulada Simple Acumulada

1,20 1 1 3,3% 3,3%

1,21 4 5 13,3% 16,6%

1,22 4 9 13,3% 30,0%

1,23 2 11 6,6% 36,6%

1,24 1 12 3,3% 40,0%

1,25 2 14 6,6% 46,6%

1,26 3 17 10,0% 56,6%

1,27 3 20 10,0% 66,6%

1,28 4 24 13,3% 80,0%

1,29 3 27 10,0% 90,0%

1,30 3 30 10,0% 100,0%

Media y Mediana

• La media es sensible a observaciones extremas y a outliers.

• La mediana solo es sensible a cambios en su entorno que la cruzan. Por ello, se dice que la mediana es un estimador robusto de la tendencia central.

• La media y la mediana de una distribución simétrica se encuentran muy cerca. Si la distribución es exactamente simétrica, la media y la mediana coinciden.

Distribuciones simétricas

y asimétricas

• Una distribución es simétrica si el lado derecho e izquierdo del histograma con respecto a la mediana son aproximadamente iguales.

• Un distribución es asimétrica hacia laderecha si el lado derecho del histograma seextiende sobre un mayor número de valores(intervalos) que el lado izquierdo.

• Una distribución es asimétrica hacia la izquierda si el lado izquierdo del histograma se extiende sobre un mayor número de valores (intervalos) que el lado derecho.

Asimetría hacia la derecha

Asimetría hacia la izquierda

Aspecto general de una

distribución

• La figura muestra la distribución de ventas de libros

por individuo en la feria del libro. Esta distribución es

asimétrica hacia la derecha. Es decir hay muchas

ventas de 3 o 4 libros y pocas ventas de 10 libros.

0

5

10

15

20

25

1 2 3 4 5 6 7 8 9 10 11 12

• Si una distribución es simétrica, la media,

mediana y modo coinciden

• Si una distribución no es simétrica, las tres

medidas difieren.

Asimetría hacia la derecha

(asimetría positiva)

Media

MedianaModo

Media

Mediana

Modo

Asimetría hacia la izquierda

(asimetría negativa)

Media, Mediana y Moda

Estadísticos de posición:

Cuartiles (Ql)

• Son un caso

particular de los

percentiles. Hay 3, y

se definen como:753

502

251

PQ

M PQ

PQ

ed

=

==

=

Estadísticos de Posición:

Percentiles• Los percentiles son otro conjunto de medidas de tendencia no central

de una distribución.

• Dividen los datos ordenados en 100 partes iguales.

• El percentil 25 es el primer cuartil ...

• Ejemplo

– Supongamos que el 78% de los resultados del GMAT es menor o igual a 600 puntos. Entonces, 600 es el percentil 78 de la distribución.

600200 800

78% de todos los resultados 22%

• En el caso de una variable continua, el

intervalo donde se encuentra ,

se calcula buscando el que deja debajo

de si al k% de las observaciones.

Dentro de él, Pk se obtiene según la

relación:

( iik llP − −1

i

i

i

ik a . n

Nk

n

lP1

1

100−

+=

– Percentiles frecuentemente utilizados

• Primer decil = percentil 10

• Primer cuartil, Q1, = percentil 25

• Segundo cuartil,Q2, = percentil 50

• Tercer cuartil, Q3, = percentil 75

• Noveno decil = percentil 90

Ejemplo

Encontrar los cuartiles del siguiente conjunto de

datos:

7, 8, 12, 17, 29, 18, 4, 27, 30, 2, 4, 10, 21, 5, 8

– Solución

• Primero, ordenar las observaciones

2, 4, 4, 5, 7, 8, 10, 12, 17, 18, 18, 21, 27, 29, 30

Como máximo, (.25)(15) = 3.75

observaciones deberían aparecer por

debajo del primer cuartil.

Como máximo, (.75)(15)=11.25

observaciones deberían aparecer por

encima del primer cuartil.

Primer cuartil

Si el numero de observaciones es par,

los resultados se encuentran entre dos observaciones.

En ese caso, hay que elegir el punto medio entre ambas observaciones.

15 observaciones

Deciles

• Se definen como los valores de la variable

que dividen a las observaciones en 10

grupos de igual tamaño.

• Más precisamente, definimos D1,D2, ..., D9

como:

,91,2,i PD ii == 10

Ejemplo

• Dada la siguiente

distribución en el

número de crías de

cien perras, calcular

sus cuartiles

xi ni Ni

0 14 14

1 10 24

2 15 39

3 26 65

4 20 85

5 15 100

n = 100

Solución

• Primer cuartil:

• Segundo cuartil:

• Tercer cuartil:

2Q luego ;394/N Primera ;254

1i === nn

3;654/2;504

2=== 2i Q luego nN Primera

n

4;854/3;754

3=== 3i Q luego nN Primera

n

xi ni Ni

0 14 14

1 10 24

2 15 39

3 26 65

4 20 85

5 15 100

n = 100

Recommended