Upload
rosa-maria-luna-crespo
View
218
Download
0
Embed Size (px)
Citation preview
La Distribución Normal.La Distribución Normal.
• Un problema frecuente en el campo biológico, es saber si nuestras observaciones se encuentran dentro de los parámetros normales esperados para la población en estudio.
SOLUCIÓN: Medir características de un individuo y, si los valores encontrados son los habituales para otras estimaciones realizadas es posible decir que son valores normales.
Estadística Biología Marina 2003
Para establecer los límites entre lo habitual y lo raro, es necesario conocer
la distribución de la variable en estudio, en individuos normales.
• Si presentamos la distribución de una variable en un histograma de frecuencias, es posible fijar los límites entre los que se encuentra la mayoría de los datos, y fuera de estos límites se encontrarían muy pocos datos (no normales).
Estadística Biología Marina 2003
En la Práctica:
Ejemplo:Ejemplo:• Datos del nivel de glucosa de
salmones en un cultivo son comparados con la distribución de ya conocida de esta variable.
• Fijamos límites donde podemos discriminar individuos sanos, fuera de estos límites se encuentran muy pocos.
Estadística Biología Marina 2003
Fre
qu
en
cy
Category/class
- Datos Observados
- Datos Esperados en base a una distribución normal
““La distribución Normal, La distribución Normal, considerarse como modelo considerarse como modelo
adecuado para la distribución de adecuado para la distribución de un gran número de variables en un gran número de variables en
el campo biológicoel campo biológico “ “
Estadística Biología Marina 2003
Características:Características:
• Su grafico semeja una campana simétrica, cuyas colas se extienden hacia el infinito tanto en dirección negativa como en la positiva (es asintótica con respecto al eje horizontal).
Estadística Biología Marina 2003
• El promedio, la mediana, el la moda de la distribución tienen el mismo valor.
• Las distribución queda completamente definida por el promedio y la desviación estándar.
• Cualesquiera sean los valores de μ y σ, el área bajo la curva comprendida entre el promedio más y menos 1, 2 y 3 desviaciones estándar es aproximadamente:
1 = 0.6826 2 = 0.9546 3 = 0.9973
Estadística Biología Marina 2003
Estadística Biología Marina 200
3
• Su una población de 1000 pesos corporales de cangrejos, está distribuida de forma normal, tiene una de 70 Kg, la mitad de la población (500) es mayor a 70 Kg, y la otra es menor a 70 Kg.
• Esto es cierto debido a que la distribución normal es SIMÉTRICA.
Proporciones de la Curva NormalProporciones de la Curva Normal
• De esta forma para cualquier valor de Xi de una población normal con media y desviación estándar , el valor de :
• Nos dice cuantas desviaciones estándar desde la media se encuentra nuestro valor Xi buscado.
Este cálculo es llamado “NORMALIZACIÓN o ESTANDARIZACIÓN”
Estadística Biología Marina 2003
Xi
Z
Así quedan nuestros datos:Así quedan nuestros datos:
Estadística Biología Marina 2003
Pro
bab
ilit
y
-3 -2 -1 0 1 2 3
Z
Zx
Normalizados (Z-transformados)
no- normalizados
La distribución resultante tiene = 0, 2 = 1
• La media de un set de valores estándares normales es 0 y la varianza en 1.
• La tabla B.2 (de Zar 1999), nos indica que proporción de una distribución normal cae más allá un valor dado de Z.
Estadística Biología Marina 2003
Ejemplo: para un valor de Z = 0.78.
El valor de la tabla es…
Para un valor de Z = 0.78.
El valor de la tabla es 0.2177, valor que representa la proporción de la curva que se encuentra mas “alla” de 0.78.
Otro Ejemplo:Otro Ejemplo:
• Una distribución normal del largo de fémures de leopardo tiene: = 60mm y = 10mm.
• ¿Qué proporción de la población de huesos presenta un largo mayor a 66mm
Estadística Biología Marina 2003
Z = 66mm-60mm = 0.60
10mm
Vemos la Tabla…
P (Xi>66mm) = P (Z>0.60) = 0.2743 o 27.43 %
• Si la población esta compuesta por 2000 huesos, ¿cuántos de ellos van a ser mayores que 66mm?
(0.2743) (2000) = 549
• ¿Que proporción de la población es menor que 66mm?
P (Xi < 66mm)= 1.000-P(Xi>66mm)
= 1.000 – 0.2743 = 0.7257
Estadística Biología Marina 2003
Test estadístico para la NormalidadTest estadístico para la Normalidad
• Tiene como objetivo determinar si los datos provienen de una distribución normal.
• También es llamado “test de bondad de ajuste para Normalidad”.
Estadística Biología Marina 2003
0
2
4
6
8
10
12
61 64 67 70 73 76 79
Largo de la lengua (mm)
Frec
uenc
ia a
bsol
uta
¿ Los valores observados se distribuyen de manera normal?
Un adelanto…Un adelanto…
En todo test estadístico se plantean 2 hipótesis:• Ho o Hipótesis Nula.• Ha o Hipótesis Alternativa.
En este caso:• Ho: Los datos de la muestra se distribuyen de
forma normal• Ha: Los datos de la muestra se no distribuyen de
forma normal
Estadística Biología Marina 2003
Para decidir con que hipótesis nos Para decidir con que hipótesis nos quedamos, tener en cuenta:quedamos, tener en cuenta:
1. Cada test estadístico produce un valor determinado
2. Este valor tiene asociado una probabilidad
3. La probabilidad (P) se compara con un valor prefijado ( = 0.05), de esta forma:
Estadística Biología Marina 2003
Si P Rechazamos Ho
Si P > Fallamos en rechazar Ho
Existen diferentes test de Existen diferentes test de normalidad… normalidad…
• Test de Kolmogorov-Smirnov:– Se fija en la distribución y no en la ubicación con el
eje X– Convierte Frecuencias Relativas observadas a
valores de Z– Luego determina si la distribución es normal
Es también es conocido como test de Lilliefors
Estadística Biología Marina 2003
Veamos como se aplica:Veamos como se aplica:
Estadística Biología Marina 2003
Se realizaron mediciones del largo de la lengua (mm) de pumas salvajes capturados en la Pampilla
Pasos a seguir:Pasos a seguir:1. Inspección de Datos
Estadística Biología Marina 2003
Comparar la distribución absoluta con una
distribución normal.
La distribución acumulada observada se compara con la
distribución acumulada esperada
Los datos individuales se grafican v/s los
valores esperados de la distribución de Z
Estadística Biología Marina 2003
2. Test de bondad de ajuste para normalidad
a) Organizar los datos en una tabla de frecuencia
Estadística Biología Marina 2003
Intervalo Xi fi Fi
< 62.5 62 0 0
62.5 – 63.5 63 2 2
63.5 – 64.5 64 2 4
64.5 – 65.5 65 3 7
65.5 – 66.5 66 5 12
66.5 – 67.5 67 4 16
67.5 – 68.5 68 6 22
68.5 – 69.5 69 5 27
69.5 – 70.5 70 8 35
70.5 – 71.5 71 7 42
71.5 – 72.5 72 7 49
72.5 – 73.5 73 10 59
73.5 – 74.5 74 6 65
74.5 – 75.5 75 3 68
75.5 – 76.5 76 2 70
76.5 – 77.5 77 0 70
> 77.5 78 0 70
b) Calcular la frecuencia relativa acumulada
relFi=(Fi*1)/n
Estadística Biología Marina 2003
Intervalo Xi fi Fi rel Fi
< 62.5 62 0 0 0.0000
62.5 – 63.5 63 2 2 0.0286
63.5 – 64.5 64 2 4 0.0571
64.5 – 65.5 65 3 7 0.1000
65.5 – 66.5 66 5 12 0.1714
66.5 – 67.5 67 4 16 0.2286
67.5 – 68.5 68 6 22 0.3143
68.5 – 69.5 69 5 27 0.3857
69.5 – 70.5 70 8 35 0.5000
70.5 – 71.5 71 7 42 0.6000
71.5 – 72.5 72 7 49 0.7000
72.5 – 73.5 73 10 59 0.8429
73.5 – 74.5 74 6 65 0.9286
74.5 – 75.5 75 3 68 0.9714
75.5 – 76.5 76 2 70 1.0000
76.5 – 77.5 77 0 70 1.0000
> 77.5 78 0 70 1.0000
c) Calcular la frecuencia relativa acumulada esperada relFi (esp):
Estadística Biología Marina 2003
-Calculo de Zi
-P asociada a Z
-Calculo de la relFi
esperada con P(Z)
Intervalo Xi fi Fi rel Fi Z P(Z) rel Fi
< 62.5 62 0 0 0.0000 -2.32 0.0102 0.0102
62.5 – 63.5 63 2 2 0.0286 -2.02 0.0115 0.0217
63.5 – 64.5 64 2 4 0.0571 -1.71 0.0219 0.0436
64.5 – 65.5 65 3 7 0.1000 -1.41 0.0357 0.0793
65.5 – 66.5 66 5 12 0.1714 -1.11 0.0542 0.1335
66.5 – 67.5 67 4 16 0.2286 -0.81 0.0755 0.2090
67.5 – 68.5 68 6 22 0.3143 -0.50 0.0995 0.3085
68.5 – 69.5 69 5 27 0.3857 -0.20 0.1122 0.4207
69.5 – 70.5 70 8 35 0.5000 0.10 0.1191 0.5398
70.5 – 71.5 71 7 42 0.6000 0.40 0.1156 0.6554
71.5 – 72.5 72 7 49 0.7000 0.70 0.1026 0.7580
72.5 – 73.5 73 10 59 0.8429 1.01 0.0858 0.8438
73.5 – 74.5 74 6 65 0.9286 1.31 0.0611 0.9049
74.5 – 75.5 75 3 68 0.9714 1.61 0.0414 0.9463
75.5 – 76.5 76 2 70 1.0000 1.91 0.0256 0.9719
76.5 – 77.5 77 0 70 1.0000 2.21 0.0145 0.9864
> 77.5 78 0 70 1.0000 2.52 0.0136 1.0000
DSInterSup
Zi).(lim
d) Calcular las diferencias entre las frecuencias relativas acumuladas.
Intervalo Xi fi Fi rel Fi Z P(Z) rel Fi Di Di'
< 62.5 62 0 0 0.0000 -2.32 0.0102 0.0102 0.0102 0.0102
62.5 – 63.5 63 2 2 0.0286 -2.02 0.0115 0.0217 0.0069 0.0217
63.5 – 64.5 64 2 4 0.0571 -1.71 0.0219 0.0436 0.0135 0.0150
64.5 – 65.5 65 3 7 0.1000 -1.41 0.0357 0.0793 0.0207 0.0222
65.5 – 66.5 66 5 12 0.1714 -1.11 0.0542 0.1335 0.0379 0.0335
66.5 – 67.5 67 4 16 0.2286 -0.81 0.0755 0.2090 0.0196 0.0376
67.5 – 68.5 68 6 22 0.3143 -0.50 0.0995 0.3085 0.0058 0.0799
68.5 – 69.5 69 5 27 0.3857 -0.20 0.1122 0.4207 0.0350 0.1064
69.5 – 70.5 70 8 35 0.5000 0.10 0.1191 0.5398 0.0398 0.1541
70.5 – 71.5 71 7 42 0.6000 0.40 0.1156 0.6554 0.0554 0.1554
71.5 – 72.5 72 7 49 0.7000 0.70 0.1026 0.7580 0.0580 0.1580
72.5 – 73.5 73 10 59 0.8429 1.01 0.0858 0.8438 0.0009 0.1438
73.5 – 74.5 74 6 65 0.9286 1.31 0.0611 0.9049 0.0237 0.0620
74.5 – 75.5 75 3 68 0.9714 1.61 0.0414 0.9463 0.0251 0.0177
75.5 – 76.5 76 2 70 1.0000 1.91 0.0256 0.9719 0.0281 0.0005
76.5 – 77.5 77 0 70 1.0000 2.21 0.0145 0.9864 0.0136 0.0136
> 77.5 78 0 70 1.0000 2.52 0.0136 1.0000 0.0000 0.0000
)(relFirel espFiDi )(i1 relFrel espiFDi
Estadística Biología Marina 200
3
• El test estadístico es D=max…
• El valor crítico para este test es D,n y se encuentra en la Tabla B9 de Zar (1999).
• SI D D,n entonces se rechaza Ho.
– En este ejemplo Dmax = 0.1580
D0.05,70=0.15975
“Los datos de largo de lengua de Pumas capturados en la Pampilla se ajustan a una
distribución normal (test de lilliefors P >0.05)”
Presentación gráfica del test K-SPresentación gráfica del test K-S
Estadística Biología Marina 2003
62 64 66 68 70 72 74 76 78Largo de la lengua (mm)
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0F
recu
enci
a re
lativ
a ac
umul
ada
Observada
Esperada
Di = 0.0580Di’ = 0.1580
rel Fi - 1 = 0.6000
rel Fi(esp) = 0.7580
rel Fi = 0.7000
Concepto de Sesgo y CurtosisConcepto de Sesgo y Curtosis
• Al analizar los polígonos de frecuencia poner atención en dos elementos esenciales:
– Su Simetría
– Su apuntamiento
Estadística Biología Marina 2003
Sesgo o Asimetría (g1)Sesgo o Asimetría (g1)
• Nos permite conocer cuanto se parece nuestra distribución a una distribución normal
• Constituye un indicador del lado de la curva donde se agrupan los datos.
Estadística Biología Marina 2003
• Si es 0 la curva es simétrica
• Si es positivo existen más valores agrupados a la izquierda
• Si es negativo existen más valores agrupados a la derecha
Estadística Biología Marina 2003
g1 = 0g1 = 0
g1 < 1g1 < 1
g1 > 1g1 > 1
La Curtosis (g2)La Curtosis (g2)
• Es un indicador del grado de apuntamiento de nuestra curva.
Estadística Biología Marina 2003
• Si es 0 la curva es normal
• Si es positivo la curva es las levantada o apuntada
• Si es negativo la curva es más plana
Estadística Biología Marina 2003
g2 = 0g2 = 0
g2 < 1g2 < 1
g2 > 1g2 > 1
Utilidad del Sesgo y la CurtosisUtilidad del Sesgo y la Curtosis
• Generalmente estos estadísticos no son informados.
• Pero en ecología, en estudios de depredación, competencia y efectos de factores físicos o químicos, pueden ser útiles
Veamos el siguiente caso:
Estadística Biología Marina 2003
SesgoSesgo• Distribución de tallas de anfípodos Hyale sp
La tallas se distribuyen de forma normal
Media = 75.5mm
g1 = - 0.03
n = 5000
Estadística Biología Marina 2003
0
5
10
15
20
25
30
0 25 50 75 100 125 150 175 200
Talla (mm)
Fre
cuen
cia
rela
tiva
0
5
10
15
20
25
30
0 25 50 75 100 125 150 175 200
Talla (mm)
Fre
cuen
cia
rela
tiva
• Llegada de nuevo depredador que come selectivamente individuos de talla superior a 140mm.
La distribución se vuelve asimétrica aumentado el sesgo
Media = 125.5mm
g1 = - 0.27
n = 4330
CurtosisCurtosis
Estadística Biología Marina 2003
0
5
10
15
20
25
30
0 25 50 75 100 125 150
Talla (mm)F
recu
enci
a re
lativ
a
0
5
10
15
20
25
30
0 25 50 75 100 125 150
Talla (mm)
Fre
cuen
cia
rela
tivaDistribución de tallas de anfípodos Hyale sp
La tallas se distribuyen de forma normal
Media = 75.5mm
g2 = - 0.02
n = 5000
• El nuevo depredador come selectivamente individuos de tallas entre 45 a 120mm.
• Los anfípodos mas chicos y grandes no son afectados.
La curtosis declina y la distribución se hace más plana
Media = 75.5mm
g2 = - 1.15
n = 1800