20

DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

Embed Size (px)

Citation preview

Page 1: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN
Page 2: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

DISTRIBUCIONES UNIVARIADAS:ESTADISTICOS DE RESUMEN –

MEDIDAS DE DISPERSIÓN

Page 3: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

Objetivos del módulo 4:

Presentar algunos estadísticos de posición. cuartiles, quintiles, deciles y percentiles.

Familiarizarse con el uso de los estadísticos de posición.

Introducir el concepto de dispersión, homogeneidad y heterogeneidad de la distribución.

Presentar algunos estadísticos apropiados para medir la dispersión. Varianza, desvío y coeficiente de variación.

Page 4: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

Noción de dispersión (i)

Por ej. Supongamos que estamos estudiando dos organizaciones de trabajo: una cooperativa donde todos los miembros reciben el mismo salario ($7000) y una empresa en la cual los salarios van desde $1500 hasta $30000. Sin embargo, al hallar el promedio de salarios de esta segunda empresa, coincidentemente el mismo es de $ 7000. Entonces, a la luz del promedio, ambas organizaciones tendrían un comportamiento similar en relación a los salarios que pagan, en ambas el promedio es de $ 7000. Sin duda, este resultado no nos convencería en absoluto si estuviéramos haciendo el estudio… necesitamos saber algo más sobre cómo se distribuyen los salario en un lugar y otro. Necesitamos saber qué tan dispersos están los salarios de cada trabajador en relación a ese “centro” que es la media.

Page 5: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

Noción de dispersión (ii)Al igual que en el módulo anterior se va a tomar como

referencia principal las variables cuantitativas, es decir, se usarán términos como «variable» y «valores», aunque algunas de estos indicadores también se aplican a caracteres cualitativos o atributos (escalas de medición ordinal y nominal).

Las «medidas de dispersión» son aquellas que nos permiten determinar la distancia o desviación que existe entre los valores de la variable. Como toda distancia es el recorrido entre dos puntos habrá que ver entonces cuáles puntos se usan de referencia en cada una de las medidas que mencionaremos a continuación.

Page 6: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

CLASIFICACIÓN1. ABSOLUTA: DESVIACION TIPICA ó «raiz

cuadrada de la VARIANZA». Este es un indicador de la dispersión de los datos respecto a su promedio (MEDIA).

2. RELATIVA: La desviación típica generalmente se expresa en porcentaje a través de su conversión en un COEFICIENTE DE VARIACION. Esta medida es la que nos permite comparar la dispersión de una variable en dos poblaciones distintas o el grado de heterogeneidad u homogeneidad de una población a partir de la comparación de diferentes atributos (variables)

Page 7: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

Medidas de tendencia central y medidas de dispersión

De hecho el DESVÍO ESTANDAR y su expresión en términos relativos:

COEFICIENTE DE VARIACION, son indicadores del grado de

REPRESENTATIVIDAD DE LA MEDIA respecto a todos los puntos de la

distribución.

Page 8: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

Usos de las medidas de dispersión

1. comparaciones de diferentes medias Por ejemplo: Si se conoce el valor promedio de aprobación de una Facultad en dos períodos distintos, no alcanza con encontrar su promedio y evaluar sus diferencias, habrá que ver también cuan dispersos se encuentran los datos en torno a una u otra medida.

2. Dan cuenta de la “representatividad” de un promedio, en función de observar si estas distancias medidas en valores relativos (coeficiente de variación) o absolutos (desvío estándar) son grandes o pequeñas. Que sean pequeñas es un indicador de homogeneidad de la población observada, grande, de heterogeneidad.

Page 9: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

Usos de las medidas de dispersión

3. Si miramos varias distribuciones de sus características y ordenamos las mismas de acuerdo a la magnitud del coeficiente de variación, podremos así concluir cuales son las características que dotan a la población de más homogeneidad (CV más bajos) y de mayor heterogeneidad (CV altos)

Page 10: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

Supuestos

Igual que antes, si la variable no es por lo menos interval debe pasarse a otros indicadores de centralidad y dispersión. En el

caso de las medidas de dispersión, estos otros

indicadores serán el RANGO y el RANGO INTERCUARTÍLICO.

Page 11: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

PROCEDIMIENTOS DE CÁLCULO:medidas de dispersión absoluta: desviación típica o estándar 1. se calcula la varianza y se le saca su

raíz cuadrada, siendo la varianza igual a la media aritmética de las desviaciones cuadráticas con respecto a la media. calculo la media resto la media a cada observación y la elevo al

cuadrado Elevo todas las diferencias al cuadrado y las sumo

Divido el resultado entre NSaco la raiz cuadrada del resultado (S)

Page 12: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

PROCEDIMIENTOS DE CÁLCULO:medidas de dispersión absoluta: desviación típica o estándar

.

N

XXS

n

ii

1

2

2

)(

S = raiz cuadrada de la varianza

Page 13: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

ejemploSe tomo una muestra de edades de la clase

del Curso de Estadística I la cual se distribuye de la siguiente manera: 38, 26, 22, 41, 22.

la media es de: 29,8La varianza de los datos es (38-29,8)2 + (26-29,8)2 + (22-29,8)2 + (41-

29,8)2 + (22-29,8)2 = 328,8 = 65,765

Page 14: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

tablas de distribución de frecuencias simplesEn el caso de las tablas de frecuencias simples, igual que en el cálculo de la media, podemos reducir los términos del cálculo de la sumatoria de las distancias

cuadráticas de la fórmula anterior, ponderando cada distancia al cuadrado por

su respectiva frecuencia. Por tanto, en este caso la varianza puede ser expresada

como el promedio de la suma ponderada de las distancias con respecto a la media

Page 15: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

Formula para tabla de frecuencias simples

N

fXXS

n

iii

1

2)(2

Page 16: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

Materias aprobadas Xi

fi fr (Xi –

media)2

Xi – media)2

* fi

3 3 0,15 3,42 10,27

4 6 0,30 0,72 4,34

5 5 0,25 0,02 0,11

6 4 0,20 1,32 5,29

7 1 0,05 4,62 4,62

8 1 0,05 9,92 9,92

20 1 (suma) 34,55

Page 17: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

Tablas de frecuencias con datos agrupados en clases

i

n

iic

n

fXXS 1

2)(2

Page 18: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

Materias aprobadasLi-1 - Li

Xc fi (Xi –

media)2

Xi –

media)2

* fi

3 - 6 4,5 140,81 11,34

6 - 9 7,5 64,41 26,46

20

37,80

Page 19: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

COEFICIENTE DE VARIACIONmedida de dispersión relativa

El CV es el cociente entre la desviación estándar y la media

Se utiliza para comparar la variabilidad de características que tienen diferentes unidades de medidas.

Ej: Supongamos que a un investigador le interesa saber si dos poblaciones varían más en poder adquisitivo (medido en dólares por ingresos) o en educación (medida a través de los años de estudio). Resulta difícil comparar pesos contra años, por lo que puede acudir al coeficiente de variación.

Page 20: DISTRIBUCIONES UNIVARIADAS: ESTADISTICOS DE RESUMEN – MEDIDAS DE DISPERSIÓN

COEFICIENTE DE VARIACIONmedida de dispersión relativa

Por lo tanto esta medida es útil cuando:Los datos están en unidades diferentes

(como dólares y años de estudios)Los datos están en las mimas unidades,

pero las medias muy distantes, ejemplo de ello son los ingresos de los gerentes ejecutivos y los trabajadores no calificados.