Medidas de Variabilidad 9

Embed Size (px)

Citation preview

  • 8/17/2019 Medidas de Variabilidad 9

    1/10

     

    1

     

    MEDIDAS DE VARIABILIDAD 

    http://www.uovirtual.com.mx/moodle/lecturas/metoinve/9.pdf

  • 8/17/2019 Medidas de Variabilidad 9

    2/10

     

    2

    Medidas de variabilidad

    ¿Qué son las medidas de variabilidad?

    Las medidas de variabilidad de una serie de datos, muestra o población, permiten identificar que

    tan dispersos o concentrados se encuentran los datos respecto a una medida de tendencia central.

    La puntuación media en una distribución es importante en muchos contextos de investigación. Pero

    también lo es otro conjunto de estadísticos que cuantifican que tan variables, o que tan dispersas,

    tienden a ser las puntuaciones. ¿Las puntuaciones varían mucho, o tienden a tener valores muy

    similares. A veces, la variabilidad en las puntuaciones es la cuestión central en una investigación.

    La variabilidad es un concepto cuantitativo, de modo que nada de esto se aplica a las

    distribuciones de datos cualitativos.

    Hay varias razones para analizar la variabilidad en una serie de datos. Primero, al aplicar una

    medida de variabilidad podemos evaluar la medida de tendencia central utilizada. Una medida de

    variabilidad pequeña indica que los datos están agrupados muy cerca, digamos, de la media. La

    media, por lo tanto es considerada bastante representativa de la serie de datos. Inversamente, una

    gran medida de variabilidad indica que la media no es muy representativa de los datos.

    Una segunda razón para estudiar la variabilidad de una serie de datos es para comparar comoestán esparcidos los datos en dos o más distribuciones. Por ejemplo, la calificación promedio de

    dos estudiantes, A = {90, 80, 75, 75 } y B = {90, 55, 85, 90 }, es de 80. Basados en esto podríamos

    pensar que sus calificaciones son idénticas. Pero si revisamos el detalle de sus calificaciones

    vemos que esta conclusión no es correcta.

    Desviación media

    La desviación media mide la cantidad promedio que varían los datos respecto a su media. La

    definición es:

    Desviación media. Es la media aritmética de los valores absolutos de las desviaciones de los datos

    respecto a su media.

  • 8/17/2019 Medidas de Variabilidad 9

    3/10

     

    3

    La fórmula de la desviación media ( Dm ) es:

    Dm =Σ| X - |

    n

    Ejemplo:

    El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la línea de

    producción son en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. ¿Cuál es la desviación media de las

    observaciones muestreadas?

    X X - |X - |

    85.4 + 0.4 0.4

    85.4 + 0.4 0.4

    85.3 + 0.3 0.3

    84.9 - 0.1 0.1

    84.0 - 1.0 1.0

    Σ = 2.2

     

    Dm =Σ| X - |

    =2.2

    = 0.44n 5

    Desviación Media Para Datos Agrupados

    En el caso de que los datos se encuentren agrupados en una distribución de frecuencia la fórmula

    es :

    Dm =Σf | X - |

    n

  • 8/17/2019 Medidas de Variabilidad 9

    4/10

  • 8/17/2019 Medidas de Variabilidad 9

    5/10

     

    5

    Las desviaciones estándar de la población y muestra se calculan simplemente sacando la raíz

    cuadrada a la respectiva varianza.

    desviación estándar de una población σ = σ 2

     

    desviación estándar de una muestra S = S2

    Ejemplo

    El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la línea de

    producción son (en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. ¿Cuál es la varianza y la desviación estándar

    de las observaciones muestreadas?

    X X2 

    85.4 7293.16

    85.3 7276.09

    84.9 7208.01

    85.4 7293.16

    84.0 7056.00

    Σx= 425.0 Σx2= 36126.42

     

    S2=Σx2 -

    (Σx)2 

    =36126.42 -

    (425)2

    = 0.355n 5

    n - 1 5 - 1

    S = S2  = 0.355 = 0.5958

     

    Varianza y Desviación Estándar para datos agrupados

    Si los datos están agrupados en una distribución de frecuencia, la varianza y la desviación

    estándar de la muestra se pueden aproximar sustituyendo Sfx² por Sx² y Sfx por Sx. Las fórmulas

    quedarían de la siguiente manera:

  • 8/17/2019 Medidas de Variabilidad 9

    6/10

     

    6

    σ2= 

    Σfx2 -(Σfx)2 

    S2=Σfx2 -

    (Σfx)2 

    N n

    N n - 1varianza de una

    poblaciónvarianza de una

    muestra

    desviación estándar de una población σ = σ 2

     

    desviación estándar de una muestra S = S2

    Ejemplo:

    Calcular la varianza y la desviación estándar de la siguiente distribución de frecuencia del número

    de meses de duración de una muestra de 40 baterías para coche.

    Duración de las baterías (meses) Número de baterías

    15 - 19 2

    20 - 24 1

    25 - 29 4

    30 - 34 15

    35 - 39 10

    40 - 44 5

    45 - 49 3

    Primeramente, calculamos la marca de clase, para después calcular los productos fX y fx2  para

    proceder finalmente a calcular las sumatorias fX y fx2 y aplicar las fórmulas.

  • 8/17/2019 Medidas de Variabilidad 9

    7/10

     

    7

    LI  LS  X F FX  FX2 

    15 19 17 2 34 588

    20 24 22 1 22 484

    25 29 27 4 108 2916

    30 34 32 15 480 15360

    35 39 37 10 370 13690

    40 44 42 5 210 8820

    45 49 47 3 141 6627

    n =40 ΣfX = 1365 Σfx2 = 48475

     

    S2=Σfx2 -

    (Σfx)2 

    =48475 -

    (1365)2

    = 48.573n 40

    n - 1 40 - 1

    S = S2  = 48.573 = 6.969

     

    Desviación cuartilar

    La desviación cuartilar es la mitad de la diferencia entre el tercer cuartil y el primer cuartil.

    La fórmula para calcular la desviación cuartilar es:

    Q =Q3 - Q1

    2

  • 8/17/2019 Medidas de Variabilidad 9

    8/10

     

    8

    El primer cuartil es el valor correspondiente al punto abajo del cual está el 25% de las

    observaciones. El tercer cuartil es el valor abajo del cual están el 75% de las observaciones. Por lo

    tanto el 50% central de las observaciones está localizado entre Q3 y Q1.

    Los pasos para calcular Q3 y Q1 son:

    1. Calcular el valor de n / 4 para Q1, y (¾)n para Q3

    2. Localizar el intervalo de clase donde se encuentran Q3 y Q1. Esto se hace encontrando el

    primer intervalo de clase donde la frecuencia acumulada es igual o mayor que el valor calculado en

    el primer paso.

    3. Aplicar la siguiente fórmula con los valores del intervalo encontrado

    Q1 = LSR +( n/4 - FA ) tic

    F

    Q3 = LSR +( 3n/4 - FA ) tic

    F

    Luego se aplica la fórmula del rango intercuartilar y de la desviación cuartilar.

    Ejemplo:

    Calcular mediana de la siguiente distribución de frecuencia del número de meses de duración de

    una muestra de 40 baterías para coche.

    duración de las baterías (meses) Número de baterías

    15 - 19 2

    20 - 24 1

    25 - 29 4

    30 - 34 15

  • 8/17/2019 Medidas de Variabilidad 9

    9/10

     

    9

    35 - 39 10

    40 - 44 5

    45 - 49 3

    En la tabla de la distribución de frecuencia se busca el primer intervalo cuya FA se igual o mayor

    que n/4 para Q1, y el primer intervalo cuya FA se igual o mayor que 3n/4 para Q3 :

    El valor de n / 4 = 40 / 4 = 10

    El valor de 3n/4 = 3(40)/4 = 30

    Los intervalos de Q3 y Q1 son:

    LI  LS  LSR  X  F  FR  FA 

    15 19 19.5 17 2 .05 2

    20 24 24.5 22 1 .025 3

    25 29 29.5 27 4 .1 7

    30  34  34.5  32  15 .375  22  Q1

    35  39  39.5  37  10 .25  32  Q3

    40 44 44.5 42 5 .125 37

    45 49 49.5 47 3 .075 40

    Se aplican las fórmulas:

    Q1 = LSR +( n/4 - FA ) tic

    = 34.5 +( 10 - 22 ) 5

      = 30.5F 15

    Q3 = LSR +( 3n/4 - FA ) tic

    = 39.5 +( 30 - 32 ) 5

    = 38.5F 10

    Se aplica la fórmula de la desviación cuartilar.

  • 8/17/2019 Medidas de Variabilidad 9

    10/10

     

    10

    Q =Q3 - Q1

    =38.5 - 30.5

      = 42 2