Upload
alfred-llanos
View
238
Download
1
Embed Size (px)
DESCRIPTION
sdasd
Citation preview
ESTADSTICA I
MEDIDAS DE
VARIACIN O DE
DISPERSIN
Lic. Mariza Crdenas Pineda
VARIACIN O
DISPERSIN
Varianza Desviacin Estndar
o Tpica
Coeficiente
de Variacin
Varianza de
la Poblacin
Varianza de
la Muestra
Desviacin
Estndar de
la Poblacin
Alcance o
rango
Alcance Intercuartil
Desviacin
Estndar de
la Muestra
MEDIDAS DE DISPERSIN
Las medidas de centralizacin proporcionan una informacin
incompleta del conjunto de datos.
Ejemplo: sean X e Y las notas de dos grupos de cuarenta alumnos,
con distribuciones de frecuencias:
xi ni
0 20
20 20
yi ni
9 3
10 34
11 3
Para ambas variables la media es
10, pero en el segundo caso 10 es
un valor ms representativo de los
datos que en el primero.
Las medidas de dispersin nos permiten valorar si el valor de la medida
de tendencia central es , o no es , representativo.
Alcance o Rango
Diferencia entre la mayor y la menor de las
observaciones
Alcance = xmayor xmenor
No toma en cuenta la forma en que estn
distribuidos los datos.
7 8 9 10 11
12
Alcance: 12 - 7 = 5
7 8 9 10 11
12
Alcance: 12 - 7 = 5
minmax xxr
Cuartiles
Los datos se ordenan de menor a mayor.
El alcance intercuartil es la distancia entre el tercer cuartil Q3 y el primer cuartil Q1.
25% 25% 25% 25%
1Q 2Q 3Q
Observacin
Menor
Observacin
Mayor
Medida de Variacion
Diferencia entre el primero y tercer Cuartil
No es afectado por valores extremos
3 1Interquartile Range 17.5 12.5 5Q Q
Rango Intercuartil
Data in Ordered Array: 11 12 13 16 16 17 17 18 21
Es uno de los parmetros ms importantes en estadstica
paramtrica, se puede decir que, teniendo conocimiento de la
varianza de una poblacin, se ha avanzado mucho en el
conocimiento de la poblacin misma.
La varianza nos mide la mayor o menor representatividad de la
media aritmtica
- Si la varianza es grande nos indica gran dispersin, la media
aritmtica no es representativa.
- Si casi todos los valores estn muy cercanos a la media
aritmtica entonces la varianza se acercar a cero, con lo que se
dice que la serie es concentrada.
VARIANZA
VARIANZA S2
2
2 1
N
i
i
X
N
Importante Medida de Variacion
MuestraVariacion respecto a la media
Varianza de una Muestra:
Varianza de una Poblacin:
2
2 1
1
n
i
i
X X
Sn
Desviacin cuadrtica promedio con relacin a la media de la Poblacin
Varianza de la Poblacin
N
fx 22 )(
clase de marcax
VARIANZA DE LA
POBLACINDatos Agrupados
2
2 1
N
i
i
X
N
VARIANZA DE LA MUESTRADatos agrupados
clase de marcax
2
2 1
1
n
i
i
X X
Sn
Simbologa
S2 :Varianza de la muestra
2 : Varianza de la Poblacin
VARIANZA
1
1
2
2
n
xx
s
n
i
i
N
xxN
i
i
1
2
2
1
1
2
2
n
fxx
si
m
i
i
N
fx i
m
i
i
1
2
2
Datos No Agrupados Datos Agrupados
DESVIACION ESTANDAR Es la ms Importante Medida de Variacin
MuestraVariacion respecto a la Media
Tiene la misma unidad que los datos originales
Desviacin Estandar de una muestra :
Desviacin Estandar de una poblacin:
2
1
1
n
i
i
X X
Sn
2
1
N
i
i
X
N
La desviacin estndar o tpica siempre es positiva porque la
varianza tambin lo es.
La desviacin estndar o tpica es la medida de dispersin ptima,
ms exacta, ms estable y ms utilizada, sirviendo de base para las
medidas de asimetra, estadsticos tpicas y correlacin.
Cuanto ms se acerca a cero la desviacin ms concentrada es la
serie.
Suele decirse que cuando la desviacin estndar o tpica es
menor que la media aritmtica la serie es concentrada y s la
desviacin estndar o tpica es mayor que la media aritmtica la
serie es dispersa.
DESVIACIN ESTNDAR O
TPICA
Desviacin Estndar de la Poblacin
Datos Agrupados
N
fxf 22 )(
clase de marcax
Desviacin Estndar de la Muestra
Datos Agrupados
1
)( 22
n
fxxfss
clase de marcax
Ejemplo Desviacin Estndar
de Datos Agrupados
CLASE MARCA FRECUENCIA M X FREC. (Marca - Media)2
x Frecuencia
1 - 3 2 1 2 66.94 66.94
4 - 6 5 3 15 26.85 80.55
7 - 9 8 5 40 4.76 23.80
10 - 12 11 7 77 0.67 4.69
13 - 15 14 4 56 14.58 58.31
16 - 18 17 2 34 46.49 92.98
22 224 327.27
MEDIA 10.18 VARIANZA 15.584
DESV. ESTAND. 3.948
COEFICIENTE DE
VARIACIN
El coeficiente de variacin es la razn de la desviacin estndar a la media aritmtica, expresada como
porcentaje:
%)100(x
sCV
4-17
Interpretacin y usos de la
Desviacin Estndar
Teorema de Chebyshev: para cualquier conjunto de observaciones, la proporcin mnima de valores que est dentro de k desviaciones estndar desde la media es al menos 1 - 1/k2 , donde k es una constante mayor que 1.
4-14
Interpretacin y usos de la
Desviacin Estndar Regla emprica: para una distribucin de
frecuencias simtrica de campana:
Cerca de 68% de las observaciones estar dentro
de 1 de la media ();
Cerca de 95% de las observaciones estar dentro
de 2 de la media ();
Casi todas (alrededor de 99.7%) las observaciones
estarn dentro de 3 de la media ().
4-15
Muestra el tipo de distribucin de una serie de datos mediante
un indicador ms representativo que se le conoce como el ndice
de Asimetra.
El ndice de asimetra de Pearson se define como
MEDIDAS DE ASIMETRIA
s
MexAs
)(3
Interpretacin:Si As = 0, La distribucin es simtrica, esto es
Si As > 0, La distribucin es asimtrica positiva, esto es
Si As < 0, La distribucin es asimtrica negativa, esto es
MoMex
xMeMo
MoMex
ASIMETRIA:
la curva que forman los valores de la serie
presenta la misma forma a izquierda y derecha de
un valor central (media aritmtica).
N AccidentesDas
.10 25
.11 28
.12 29
.14 32
.15 29
.18 28
.20 23
N AccidentesDas
.10 30
.11 25
.12 22
.14 20
.15 18
.18 16
.20 12
N AccidentesDas
.10 5
.11 8
.12 9
.14 10
.15 12
.18 15
.20 18
MEDIDAS DE CURTOSIS
Compara la dispersin de los datos observados
cercanos al valor central con la dispersin de los datos
cercanos a ambos extremos de la distribucin
Se aplica cuando la distribucin es simtrica.
Se calcula mediante:
MEDIDAS DE CURTOSIS
5.01090
2575
PP
PPK
Interpretacin:Si K tiende a 0 la distribucin es normalSi K tiende a 0.5 es leptocrticaSi K tiende a -0.5 es platicrtica
CURTOSIS : Analiza el grado de concentracin que presentan los
valores alrededor de la zona central de la distribucin.
Para detectar tanto asimetra como curtosis, es til dibujarel histograma. Adems, para asimetra se comparan lasmedidas de posicin, Media, Mediana y moda.
Histograma del nmero de accidentes de
trnsito por da en Cal, 2000
0
10
20
30
40
.10 .11 .12 .14 .15 .18 .20
N accidentes
Da
s
Histograma del nmero de accidentes por das en
Bogot, ao 2002
0
5
10
15
20
.10 .11 .12 .14 .15 .18 .20
N accidentes
Da
s
Histograma del nmero de accidentes de
trnsito en Pereira, ao 2002
0
10
20
30
40
.10 .11 .12 .14 .15 .18 .20
N accidentes
Da
s
Curva de Distribucin
Normal
-3 -2 -1 +1 +2 +3
-3 -2 -1 +1 +2 +3
34.13%34.13%
13.60%13.60%
2.135%2.135%
0.135%0.135%
68.26%
95.46%
99.73%
-3 -2 -1 +1 +2 +3
xZRe
Resultado Estndar
-3 -2 -1 +1 +2 +3
120
10080 ZRe
Z
x
Re?
160
20
100
oZ
x
Re?
80
20
100
320
100160ZRe
100 16080
Ejemplo de Dispersin
Relativa
2
10x
An Distribuci
s 5
100x
Bn Distribuci
s
Cul de las dos tiene menor dispersin?
%2010010
2
An Distribuci
CV %5100100
5
Bn Distribuci
CV
La distribucin B tiene menor dispersin
Ejemplo de Dispersin
Relativa
Muestra el tipo de distribucin de una serie de datos mediante
un indicador ms representativo que se le conoce como el ndice
de Asimetra.
El ndice de asimetra de Pearson se define como
MEDIDAS DE ASIMETRIA
s
MexAs
)(3
Interpretacin:Si As = 0, La distribucin es simtrica, esto es
Si As > 0, La distribucin es asimtrica positiva, esto es
Si As < 0, La distribucin es asimtrica negativa, esto es
MoMex
xMeMo
MoMex
Medidas de dispersin
Caracterizar una distribucin solamente a travs de unamedida central no es apropiado.
Las distribuciones del ingreso de dos provincias con elmismo ingreso medio por hogar son muy distintas siuna de ellas tiene extremos de pobreza y de riqueza,mientras que la otra tiene poca variacin de ingresosentre familias.
Estamos interesados en la dispersin o variabilidad de losingresos, adems de estarlo en sus centros.
Ejemplo de dos conjuntos de datos con igual media
Datos con alta dispersinDatos con baja dispersin
Medidas de dispersin
Distribucin normal estandarizada
Si x es una observacin de una distribucin de media y
de desviacin estndar , el valor estandarizado de x es:
La distribucin normal estandarizada es la distribucin
normal N(0,1): su media es 0 y su desviacin estndar es 1.
Si una variable x tiene una distribucin normal N( , ),
entonces z posee una distribucin normal estandarizada.
xz
-3 -2 -1 +1 +2 +3
120
10080 ZRe
Z
x
Re?
160
20
100
oZ
x
Re?
80
20
100
320
100160ZRe
100 16080