37
ESTADÍSTICA I MEDIDAS DE VARIACIÓN O DE DISPERSIÓN Lic. Mariza Cárdenas Pineda

6Medidas de Variacion

Embed Size (px)

DESCRIPTION

sdasd

Citation preview

  • ESTADSTICA I

    MEDIDAS DE

    VARIACIN O DE

    DISPERSIN

    Lic. Mariza Crdenas Pineda

  • VARIACIN O

    DISPERSIN

    Varianza Desviacin Estndar

    o Tpica

    Coeficiente

    de Variacin

    Varianza de

    la Poblacin

    Varianza de

    la Muestra

    Desviacin

    Estndar de

    la Poblacin

    Alcance o

    rango

    Alcance Intercuartil

    Desviacin

    Estndar de

    la Muestra

  • MEDIDAS DE DISPERSIN

    Las medidas de centralizacin proporcionan una informacin

    incompleta del conjunto de datos.

    Ejemplo: sean X e Y las notas de dos grupos de cuarenta alumnos,

    con distribuciones de frecuencias:

    xi ni

    0 20

    20 20

    yi ni

    9 3

    10 34

    11 3

    Para ambas variables la media es

    10, pero en el segundo caso 10 es

    un valor ms representativo de los

    datos que en el primero.

    Las medidas de dispersin nos permiten valorar si el valor de la medida

    de tendencia central es , o no es , representativo.

  • Alcance o Rango

    Diferencia entre la mayor y la menor de las

    observaciones

    Alcance = xmayor xmenor

    No toma en cuenta la forma en que estn

    distribuidos los datos.

    7 8 9 10 11

    12

    Alcance: 12 - 7 = 5

    7 8 9 10 11

    12

    Alcance: 12 - 7 = 5

    minmax xxr

  • Cuartiles

    Los datos se ordenan de menor a mayor.

    El alcance intercuartil es la distancia entre el tercer cuartil Q3 y el primer cuartil Q1.

    25% 25% 25% 25%

    1Q 2Q 3Q

    Observacin

    Menor

    Observacin

    Mayor

  • Medida de Variacion

    Diferencia entre el primero y tercer Cuartil

    No es afectado por valores extremos

    3 1Interquartile Range 17.5 12.5 5Q Q

    Rango Intercuartil

    Data in Ordered Array: 11 12 13 16 16 17 17 18 21

  • Es uno de los parmetros ms importantes en estadstica

    paramtrica, se puede decir que, teniendo conocimiento de la

    varianza de una poblacin, se ha avanzado mucho en el

    conocimiento de la poblacin misma.

    La varianza nos mide la mayor o menor representatividad de la

    media aritmtica

    - Si la varianza es grande nos indica gran dispersin, la media

    aritmtica no es representativa.

    - Si casi todos los valores estn muy cercanos a la media

    aritmtica entonces la varianza se acercar a cero, con lo que se

    dice que la serie es concentrada.

    VARIANZA

  • VARIANZA S2

    2

    2 1

    N

    i

    i

    X

    N

    Importante Medida de Variacion

    MuestraVariacion respecto a la media

    Varianza de una Muestra:

    Varianza de una Poblacin:

    2

    2 1

    1

    n

    i

    i

    X X

    Sn

  • Desviacin cuadrtica promedio con relacin a la media de la Poblacin

    Varianza de la Poblacin

    N

    fx 22 )(

    clase de marcax

  • VARIANZA DE LA

    POBLACINDatos Agrupados

    2

    2 1

    N

    i

    i

    X

    N

  • VARIANZA DE LA MUESTRADatos agrupados

    clase de marcax

    2

    2 1

    1

    n

    i

    i

    X X

    Sn

  • Simbologa

    S2 :Varianza de la muestra

    2 : Varianza de la Poblacin

    VARIANZA

    1

    1

    2

    2

    n

    xx

    s

    n

    i

    i

    N

    xxN

    i

    i

    1

    2

    2

    1

    1

    2

    2

    n

    fxx

    si

    m

    i

    i

    N

    fx i

    m

    i

    i

    1

    2

    2

    Datos No Agrupados Datos Agrupados

  • DESVIACION ESTANDAR Es la ms Importante Medida de Variacin

    MuestraVariacion respecto a la Media

    Tiene la misma unidad que los datos originales

    Desviacin Estandar de una muestra :

    Desviacin Estandar de una poblacin:

    2

    1

    1

    n

    i

    i

    X X

    Sn

    2

    1

    N

    i

    i

    X

    N

  • La desviacin estndar o tpica siempre es positiva porque la

    varianza tambin lo es.

    La desviacin estndar o tpica es la medida de dispersin ptima,

    ms exacta, ms estable y ms utilizada, sirviendo de base para las

    medidas de asimetra, estadsticos tpicas y correlacin.

    Cuanto ms se acerca a cero la desviacin ms concentrada es la

    serie.

    Suele decirse que cuando la desviacin estndar o tpica es

    menor que la media aritmtica la serie es concentrada y s la

    desviacin estndar o tpica es mayor que la media aritmtica la

    serie es dispersa.

    DESVIACIN ESTNDAR O

    TPICA

  • Desviacin Estndar de la Poblacin

    Datos Agrupados

    N

    fxf 22 )(

    clase de marcax

  • Desviacin Estndar de la Muestra

    Datos Agrupados

    1

    )( 22

    n

    fxxfss

    clase de marcax

  • Ejemplo Desviacin Estndar

    de Datos Agrupados

    CLASE MARCA FRECUENCIA M X FREC. (Marca - Media)2

    x Frecuencia

    1 - 3 2 1 2 66.94 66.94

    4 - 6 5 3 15 26.85 80.55

    7 - 9 8 5 40 4.76 23.80

    10 - 12 11 7 77 0.67 4.69

    13 - 15 14 4 56 14.58 58.31

    16 - 18 17 2 34 46.49 92.98

    22 224 327.27

    MEDIA 10.18 VARIANZA 15.584

    DESV. ESTAND. 3.948

  • COEFICIENTE DE

    VARIACIN

    El coeficiente de variacin es la razn de la desviacin estndar a la media aritmtica, expresada como

    porcentaje:

    %)100(x

    sCV

    4-17

  • Interpretacin y usos de la

    Desviacin Estndar

    Teorema de Chebyshev: para cualquier conjunto de observaciones, la proporcin mnima de valores que est dentro de k desviaciones estndar desde la media es al menos 1 - 1/k2 , donde k es una constante mayor que 1.

    4-14

  • Interpretacin y usos de la

    Desviacin Estndar Regla emprica: para una distribucin de

    frecuencias simtrica de campana:

    Cerca de 68% de las observaciones estar dentro

    de 1 de la media ();

    Cerca de 95% de las observaciones estar dentro

    de 2 de la media ();

    Casi todas (alrededor de 99.7%) las observaciones

    estarn dentro de 3 de la media ().

    4-15

  • Muestra el tipo de distribucin de una serie de datos mediante

    un indicador ms representativo que se le conoce como el ndice

    de Asimetra.

    El ndice de asimetra de Pearson se define como

    MEDIDAS DE ASIMETRIA

    s

    MexAs

    )(3

    Interpretacin:Si As = 0, La distribucin es simtrica, esto es

    Si As > 0, La distribucin es asimtrica positiva, esto es

    Si As < 0, La distribucin es asimtrica negativa, esto es

    MoMex

    xMeMo

    MoMex

  • ASIMETRIA:

    la curva que forman los valores de la serie

    presenta la misma forma a izquierda y derecha de

    un valor central (media aritmtica).

    N AccidentesDas

    .10 25

    .11 28

    .12 29

    .14 32

    .15 29

    .18 28

    .20 23

    N AccidentesDas

    .10 30

    .11 25

    .12 22

    .14 20

    .15 18

    .18 16

    .20 12

    N AccidentesDas

    .10 5

    .11 8

    .12 9

    .14 10

    .15 12

    .18 15

    .20 18

  • MEDIDAS DE CURTOSIS

  • Compara la dispersin de los datos observados

    cercanos al valor central con la dispersin de los datos

    cercanos a ambos extremos de la distribucin

    Se aplica cuando la distribucin es simtrica.

    Se calcula mediante:

    MEDIDAS DE CURTOSIS

    5.01090

    2575

    PP

    PPK

    Interpretacin:Si K tiende a 0 la distribucin es normalSi K tiende a 0.5 es leptocrticaSi K tiende a -0.5 es platicrtica

  • CURTOSIS : Analiza el grado de concentracin que presentan los

    valores alrededor de la zona central de la distribucin.

    Para detectar tanto asimetra como curtosis, es til dibujarel histograma. Adems, para asimetra se comparan lasmedidas de posicin, Media, Mediana y moda.

  • Histograma del nmero de accidentes de

    trnsito por da en Cal, 2000

    0

    10

    20

    30

    40

    .10 .11 .12 .14 .15 .18 .20

    N accidentes

    Da

    s

    Histograma del nmero de accidentes por das en

    Bogot, ao 2002

    0

    5

    10

    15

    20

    .10 .11 .12 .14 .15 .18 .20

    N accidentes

    Da

    s

    Histograma del nmero de accidentes de

    trnsito en Pereira, ao 2002

    0

    10

    20

    30

    40

    .10 .11 .12 .14 .15 .18 .20

    N accidentes

    Da

    s

  • Curva de Distribucin

    Normal

    -3 -2 -1 +1 +2 +3

  • -3 -2 -1 +1 +2 +3

    34.13%34.13%

    13.60%13.60%

    2.135%2.135%

    0.135%0.135%

    68.26%

    95.46%

    99.73%

  • -3 -2 -1 +1 +2 +3

    xZRe

    Resultado Estndar

  • -3 -2 -1 +1 +2 +3

    120

    10080 ZRe

    Z

    x

    Re?

    160

    20

    100

    oZ

    x

    Re?

    80

    20

    100

    320

    100160ZRe

    100 16080

  • Ejemplo de Dispersin

    Relativa

    2

    10x

    An Distribuci

    s 5

    100x

    Bn Distribuci

    s

    Cul de las dos tiene menor dispersin?

  • %2010010

    2

    An Distribuci

    CV %5100100

    5

    Bn Distribuci

    CV

    La distribucin B tiene menor dispersin

    Ejemplo de Dispersin

    Relativa

  • Muestra el tipo de distribucin de una serie de datos mediante

    un indicador ms representativo que se le conoce como el ndice

    de Asimetra.

    El ndice de asimetra de Pearson se define como

    MEDIDAS DE ASIMETRIA

    s

    MexAs

    )(3

    Interpretacin:Si As = 0, La distribucin es simtrica, esto es

    Si As > 0, La distribucin es asimtrica positiva, esto es

    Si As < 0, La distribucin es asimtrica negativa, esto es

    MoMex

    xMeMo

    MoMex

  • Medidas de dispersin

    Caracterizar una distribucin solamente a travs de unamedida central no es apropiado.

    Las distribuciones del ingreso de dos provincias con elmismo ingreso medio por hogar son muy distintas siuna de ellas tiene extremos de pobreza y de riqueza,mientras que la otra tiene poca variacin de ingresosentre familias.

    Estamos interesados en la dispersin o variabilidad de losingresos, adems de estarlo en sus centros.

  • Ejemplo de dos conjuntos de datos con igual media

    Datos con alta dispersinDatos con baja dispersin

    Medidas de dispersin

  • Distribucin normal estandarizada

    Si x es una observacin de una distribucin de media y

    de desviacin estndar , el valor estandarizado de x es:

    La distribucin normal estandarizada es la distribucin

    normal N(0,1): su media es 0 y su desviacin estndar es 1.

    Si una variable x tiene una distribucin normal N( , ),

    entonces z posee una distribucin normal estandarizada.

    xz

  • -3 -2 -1 +1 +2 +3

    120

    10080 ZRe

    Z

    x

    Re?

    160

    20

    100

    oZ

    x

    Re?

    80

    20

    100

    320

    100160ZRe

    100 16080