Upload
yeraldo-tejada-mendoza
View
214
Download
2
Embed Size (px)
DESCRIPTION
probabilidad aplicada para hidrologia ingenieria civil curso hidrilogia
Citation preview
DISTRIBUCIONES DE PROBABILIDAD EN HIDROLOGIA
DISTRIBUCIONES DE PROBABILIDAD EN HIDROLOGIA
El comportamiento de las variables aleatorias discretas o continuas se describe con la ayuda de Distribuciones de Probabilidad.
La variable se designa por mayscula y un valor especifico de ella por minscula.
Por P(x = a) se denota la probabilidad de que un evento asuma el valor a; similarmente P(a ( x ( b) denota la probabilidad de que un evento se encuentre en el intervalo (a,b). Si conocemos la probabilidad P(a ( x ( b) para todos los valores de a y b, se dice que conocemos la Distribucin de Probabilidades de la variable x.
Si x es un nmero dado y consideramos la probabilidad P(X ( x):
)
(
)
(
x
X
P
x
F
=
y llamamos F(x) la funcin de distribucin acumulada
Ejemplo:
Se tienen las probabilidades de que haya 0,1, 2, 3, ...,7, das nublados por semana en un determinado lugar, con ellos calcule la distribucin de probabilidades
x
P(x)
F(x)
0
0.05
0.05
1
0.15
0.20
2
0.25
0.45
3
0.20
0.65
4
0.15
0.80
5
0.10
0.90
6
0.08
0.98
7
0.02
1.00
Total
1.0
0.00
0.05
0.10
0.15
0.20
0.25
0.30
01234567
# dias nublados
f(x)
0.00
0.20
0.40
0.60
0.80
1.00
1.20
02468
# dias nublados
F(x)
Si se tiene una variable aleatoria continua, la figura presenta el histograma de 85 aos de registro de caudales de crecientes (mximos instantneos) en el ro Magdalena, agrupados en 9 intervalos de clase.
x
P(x)
F(x)
1
0.05
0.05
2
0.10
0.15
3
0.15
0.30
4
0.20
0.50
5
0.10
0.60
6
0.10
0.70
7
0.15
0.85
8
0.10
0.95
9
0.05
1.00
Total
1.00
0.00
0.05
0.10
0.15
0.20
0.25
123456789
Qmx instntaneo *10 (m/s)
f(x)
0.00
0.20
0.40
0.60
0.80
1.00
1.20
0246810
Qmx instntaneo *10 (m/s)
F(x)
Cuando el nmero de observaciones se incrementa, el tamao de los intervalos decrece y se puede tener algo s
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
12345678910
Qmx instntaneo *10 (m/s)
f(x)
0.00
0.20
0.40
0.60
0.80
1.00
1.20
051015
Qmx instntaneo *10 (m/s)
F(x)
Donde f(x) es la llamada funcin de densidad de probabilidades y tiene las siguientes caractersticas
i)
-
=
1
)
(
dx
x
f
ii)
=
b
a
dx
x
f
b
x
a
P
)
(
)
(
iii)
0
)
(
=
b
b
dx
x
f
Lo que implica que las probabilidades se definen solo como AREAS bajo la funcin de densidad de probabilidad (FDP) entre lmites finitos.
MOMENTOS DE LAS DISTRIBUCIONES
Las propiedades de las distribuciones pueden ser definidas completamente en trminos de los momentos. Los momentos en estadstica son similares a los momentos en fsica (rotacin respecto al origen)
-
=
dx
x
f
x
M
r
r
)
(
Para la variable continua
=
=
n
j
r
r
x
f
x
M
1
)
(
Para la variable discreta
O respecto a la media (eje de rotacin diferente al origen)
-
-
=
dx
x
f
x
M
r
r
)
(
)
(
m
Para la variable continua
=
-
=
n
j
r
r
x
f
x
M
1
)
(
)
(
m
Para la variable discreta
PARMETROS ESTADISTICOS
Los estadsticos extraen informacin de una muestra, indicando las caractersticas de la poblacin. Los principales estadsticos son los momentos de primer, segundo y tercer orden correspondiente a la media, varianza, y asimetra respectivamente.
Media (:
Es el valor esperado de la variable misma. Primer momento respecto al origen. Muestra la tendencia central de la distribucin
-
=
dx
x
f
x
)
(
m
el valor estimado de la media a partir de la muestra es
=
=
n
i
i
x
n
x
1
1
Varianza (:
Mide la variabilidad de los datos. Es el segundo momento respecto a la media.
-
-
=
dx
x
f
x
)
(
)
(
2
2
m
s
El valor estimado de la varianza a partir de la muestra es
=
-
-
=
n
i
i
x
x
n
S
1
2
2
)
(
1
1
en la cual el divisor es n-1 en lugar de n, es para asegurar que la estadstica de la muestra no sea sesgada, es decir, que no tenga tendencia, en promedio, a ser mayor o menor que el valor verdadero.
Las unidades de la varianza son la media al cuadrado, la desviacin estndar ( es una medida de la variabilidad que tiene las mismas dimensiones que la media y simplemente es la raz cuadrada de la varianza, se estima por S.
El significado de la desviacin estndar se ilustra en la siguiente figura
0.00
0.20
0.40
0.60
0.80
1.00
0246810
x
f(x)
0.501.001.302.00
Efectos de la funcin de densidad de probabilidad causados por cambios en la desviacin estndar.
Coeficiente de Variacin
Coeficiente de variacin
m
s
=
Cv
es una medida adimensional de la variabilidad su estimado es
x
S
Cv
=
Coeficiente de asimetra (
La distribucin de los valores de una distribucin alrededor de la media se mide por la asimetra. Se obtiene a partir del tercer momento alrededor de la media, dividindolo por el cubo de la desviacin estndar para que sea adimensional.
-
-
=
-
dx
x
f
x
x
E
)
(
)
(
]
)
[(
3
3
m
m
Tercer momento respecto a la media
]
)
`[(
1
3
3
m
s
g
-
=
x
E
Un estimativo del coeficiente de asimetra est dado por
3
1
3
*
)
2
)(
1
(
)
(
S
n
n
x
x
n
C
n
i
s
-
-
-
=
=
Ejemplo
Encontrar el valor medio de la precipitacin si se tiene
xi medioFrecuenciaFrecuencia x f(x)
Absoluta
Relativa
(fx)
100110105100.110.5
110120115160.1618.4
12013012590.0911.25
130140135100.113.5
140150145200.229
150160155150.1523.25
160170165200.233
Total =
100
= 138.9
Intervalo
(mm)
x
ANALISIS DE FRECUENCIA
El anlisis de frecuencia es una herramienta utilizada para, predecir el comportamiento futuro de una variable aleatoria (P,Q,T), por ejemplo, los caudales en un sitio de inters, a partir de la informacin histrica de caudales. Es un mtodo basado en procedimientos estadsticos que permite calcular la magnitud del caudal asociado a un perodo de retorno.
Su confiabilidad depende de la longitud y calidad de la serie histrica, adems de la incertidumbre propia de la distribucin de probabilidades seleccionada.
Cuando se pretende realizar extrapolaciones, perodo de retorno mayor que la longitud de la serie disponible, el error relativo asociado a la distribucin de probabilidades utilizada es ms importante, mientras que en interpolaciones la incertidumbre est asociada principalmente a la calidad de los datos a modelar; en ambos casos la incertidumbre es alta dependiendo de la cantidad de datos disponibles (Ashkar, et al. 1994).
La extrapolacin de frecuencias extremas en una distribucin emprica de crecientes es extremadamente riesgosa (Garcon, 1994).
Para determinar la magnitud de eventos extremos cuando la distribucin de probabilidades no es una funcin fcilmente invertible se requiere conocer la variacin de la variable respecto a la media. Chow en 1951 propuso determinar esta variacin a partir de un factor de frecuencia
T
K
que puede ser expresado:
s
m
T
T
K
X
+
=
y se puede estimar a partir de los datos
s
K
x
X
T
T
+
=
Para una distribucin dada, puede determinarse una relacin entre K y el perodo de retorno T.
Esta relacin puede expresarse en trminos matemticos o por medio del uso de una tabla.
El anlisis de frecuencia consiste en determinar los parmetros de las distribuciones de probabilidad y determinar con el factor de frecuencia la magnitud del evento para un perodo de retorno dado.
A continuacin se describen las principales distribuciones de probabilidad utilizadas en hidrologa, la forma de estimar sus parmetros, el factor de frecuencia y los lmites de confianza. Estos ltimos son indicadores de incertidumbre de las extrapolaciones.
Los Lmites de confianza, determinan el rango de valores de las variables, si el rango es grande la incertidumbre es alta y si es pequeo, habr ms confiabilidad en el valor estimado.
DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES CONTINUAS
DISTRIBUCION NORMAL
La distribucin normal es una distribucin simtrica en forma de campana, tambin conocida como Campana de Gauss. Aunque muchas veces no se ajusta a los datos hidrolgicos tiene amplia aplicacin por ejemplo a los datos transformados que siguen la distribucin normal.
Funcin de densidad:
La funcin de densidad est dada por
=
-
-
x
x
x
f
Y
Y
y
s
m
p
s
Lnx
y
=
Donde, (y : media de los logaritmos de la poblacin (parmetro escalar), estimado
y
(y : Desviacin estndar de los logaritmos de la poblacin, estimado
Y
S
.
Estimacin de parmetros:
=
=
n
i
i
x
n
y
1
)
ln(
1
2
1
2
1
)
)
(ln(
1
1
-
-
=
=
n
i
i
y
y
x
n
s
Factor de frecuencia:
Puede trabajarse en el campo original y en el campo transformado.
2. Campo transformado: Si se trabaja en el campo transformado se trabaja con la media y la desviacin estndar de los logaritmos, as:
Y
TR
kS
y
X
+
=
)
ln(
)
(
y
Ln
TR
e
X
=
De donde, con
k
variable normal estandarizada para el
R
T
dado,
y
media de los logaritmos y
Y
S
es la desviacin estndar de los logaritmos.
3. Campo original: Si se trabaja con los X sin transformar
T
K
se calcula como:
V
V
V
T
C
C
Ln
C
Ln
k
Exp
K
1
2
)
1
(
))
1
(
(
*
2
2
1
2
-
+
-
+
=
k
es la variable normal estandarizada para el
R
T
dado,
x
S
C
V
=
es el coeficiente de variacin,
x
media de los datos originales y
S
desviacin estndar de los datos originales.
Limites de confianza:
En el campo transformado.
T
Tr
S
t
X
Ln
)
1
(
)
(
a
-
2
1
2
2
1
)
(
+
=
=
T
y
E
K
n
S
S
d
d
En donde, n numero de datos,
S
es el error estndar,
T
K
variable normal estandarizada.
EJEMPLO: En un ro se tienen 30 aos de registros de Q mximos instantneos anuales con
x
=15 m3/s,
S
=5 m3/s (media y desviacin estndar para los datos originales).
Y
x
=2.655,
Y
S
=0.324 (media y desviacin estndar de los datos transformados). Encontrar el caudal para un periodo de retorno de 100 aos y los limites de confianza para un ( = 5%. Calcular la probabilidad de que un caudal de 42.5 m3/s no sea igualado o excedido P (Q( 42,5).
Solucin:
n = 30
x
= 15 m3/s
Y
x
=2.655
S
= 5 m3/s
Y
S
= 0.324
En el campo original
V
V
V
C
C
C
Ln
k
Exp
Kt
1
2
)
1
ln(
))
1
(
(
*
2
2
1
2
-
+
-
+
=
33
.
0
15
5
=
=
=
x
S
C
V
)
99
.
0
(
)
100
1
1
(
1
1
1
1
1
-
-
-
=
-
=
-
=
F
F
T
F
k
R
De la tabla de factores de Frecuencia de la distribucin Log-normal con una significacin
01
.
0
=
a
se obtiene
33
.
2
=
k
33
.
0
1
2
)
33
.
0
1
ln(
))
33
.
0
1
(
(
*
33
.
2
2
2
1
2
-
+
-
+
=
Ln
Exp
K
T
KT = 3.056
s
m
Q
/
_
30
.
30
056
.
3
*
5
15
3
100
=
+
=
s
m
Q
/
_
30
.
30
3
100
=
En el campo transformado se tiene que:
324
.
*
33
.
2
655
.
2
)
ln(
100
+
=
+
=
Y
TR
kS
X
Q
40992
.
3
100
)
(
Exp
Q
=
s
m
Q
/
_
26
.
30
)
(
3
100
=
Limites de confianza
E
TR
S
t
Q
Ln
)
1
(
)
(
a
-
2
1
2
2
1
_____
)
(
+
=
=
k
n
S
S
y
E
d
d
2
1
2
2
33
.
2
1
+
=
d
93
.
1
=
d
11
.
0
30
324
.
0
93
.
1
=
=
E
S
65
.
1
95
.
0
)
1
(
=
=
-
t
t
a
Ledo en una tabla de Probabilidad acumulada de la Distribucin Normal Estndar.
)
11
.
0
(
65
.
1
41
.
3
)
11
.
0
(
65
.
1
)
28
.
30
(
=
Ln
EMBED Equation.3
1815
.
0
41
.
3
[3.2285 3.5915]
[e3.2285 e3.5915]
[25.24 36.29]Intervalos de confianza para
100
TR
Q
b) Calcular la probabilidad de 42.5 m3/s no se igualado o excedido P(Q( 42.5).
749
.
3
)
5
.
42
(
=
Ln
378
.
3
324
.
0
)
655
.
2
749
.
3
(
=
-
=
=
z
t
F(3.378) = 0.9996 Ledo de la tabla de la normal
P(Q( 42.5) = 99.9%
DISTRIBUCION GUMBEL O EXTREMO TIPO I
Una familia importante de distribuciones usadas en el anlisis de frecuencia hidrolgico es la distribucin general de valores extremos, la cual ha sido ampliamente utilizada para representar el comportamiento de crecientes y sequas (mximos y mnimos).
Funcin de densidad:
-
-
-
-
-
=
a
b
a
b
a
)
(
exp
)
(
exp
1
)
(
x
x
x
f
En donde ( y ( son los parmetros de la distribucin.
-
-
-
=
=
a
b
)
(
exp
exp
)
(
)
(
x
dx
x
f
x
F
Estimacin de parmetros
a
b
p
a
5772
.
0
6
-
=
=
x
S
Donde
S
y
x
son la media y la desviacin estndar estimadas con la muestra.
Factor de frecuencia:
-
+
-
=
1
ln
ln
5772
.
0
6
R
R
T
T
T
K
p
Donde
R
T
es el periodo de retorno. Para la distribucin Gumbel se tiene que el caudal para un perodo de retorno de 2.33 aos es igual a la media de los caudales mximos.
Limites de confianza
E
Tr
S
t
X
)
1
(
a
-
n
S
S
E
=
d
2
1
2
]
1
.
1
1396
.
1
1
[
T
T
K
K
+
+
=
d
KT es el factor de frecuencia y
)
1
(
a
-
t
es la variable normal estandarizada para una probabilidad de no excedencia de 1-(.
EJEMPLO: Para el ejemplo anterior encontrar el Q de 100 aos de periodo de retorno y los intervalos de confianza. x= 15 m3/s, s = 5 m3/s
S
K
X
Q
T
TR
+
=
100
{
}
)]
99
ln(
100
ln[ln
577
.
0
6
-
+
-
=
p
T
K
14
.
3
=
T
K
s
m
Q
TR
/
_
7
.
30
5
*
14
.
3
15
3
100
=
+
=
Intervalos de confianza
65
.
1
95
.
0
)
1
(
=
=
-
t
t
a
Ledo en una tabla de Probabilidad acumulada de la Distribucin Normal Estndar.
d
=
+
+
[
.
(
.
)
.
(
.
)
]
1
1
1396
3
14
1
1
3
14
2
1
2
93
.
3
=
d
s
m
S
S
E
E
/
58
.
3
30
)
5
(
)
93
.
3
(
3
=
=
E
Tr
S
t
X
)
1
(
a
-
(
)
58
.
3
64
.
1
7
.
30
[24.83 m3/s 36.58 m3/s]Intervalo de confianza para
100
TR
Q
DISTRIBUCION GAMA DE TRES PARAMETROS O PEARSON TIPO 3
Esta distribucin ha sido una de las ms utilizadas en hidrologa. Como la mayora de las variables hidrolgicas son sesgadas, la funcin Gamma se utiliza para ajustar la distribucin de frecuencia de variables tales como crecientes mximas anuales, Caudales mnimos, Volmenes de flujo anuales y estacionales, valores de precipitaciones extremas y volmenes de lluvia de corta duracin. La funcin de distribucin Gamma tiene dos o tres parmetros.
Funcin de densidad:
(
)
-
-
-
G
=
-
a
a
b
a
b
0
1
0
exp
1
)
(
x
x
x
x
x
f
donde,
x0 ( x ( ( para ( ( 0
( ( x ( x0 para ( ( 0
( y ( son los parmetros de escala y forma, respectivamente , y x0 es el parmetro de localizacin.
Estimacin de parmetros:
b
a
a
b
;
2
;
2
0
2
-
=
=
=
x
x
Cs
s
Cs
S
C
es el coeficiente de asimetra,
S
y
x
son la media y la desviacin estndar de la muestra respectivamente.
3
1
3
*
)
2
)(
1
(
)
(
S
n
n
x
x
n
C
n
i
s
-
-
-
=
=
Factor de frecuencia:
5
4
3
2
2
3
2
6
3
1
6
6
)
1
(
6
)
6
(
3
1
6
)
1
(
+
+
-
-
-
+
-
+
S
S
S
S
S
T
C
C
z
C
z
C
z
z
C
z
z
K
El valor de
z
para un periodo de retorno dado puede calcularse siguiendo el procedimiento de la Distribucin normal.
Este valor de
T
K
se encuentra tabulado de acuerdo al valor de
S
C
calculado con la muestra.
Intervalos de confianza:
E
Tr
S
t
X
)
1
(
a
-
n
S
S
E
=
d
Donde S es la desviacin estndar de la muestra, n es el nmero de datos y ( se encuentra tabulado en funcin del
R
S
T
y
C
_
_
EJEMPLO: Se tiene una estacin con 30 aos de registros de caudales mximos instantneos con Media de 4144 pie3/s y desviacin estndar de 3311 pie3/s. Si el coeficiente de asimetra de los caudales es de 1.981 pie3/s cual es caudal para un periodo de retorno de 100 aos y su intervalo de confianza.
SK
Q
Q
TR
+
=
100
K es F(1.981, 100) de tablas se obtiene K=3.595(1.9,100) = 3.553 (2.0,100) = 3.605
(
)
(
)
s
pie
Q
TR
/
_
16050
3311
595
.
3
4144
3
100
=
+
=
Intervalos de confianza
E
Tr
S
t
X
)
1
(
a
-
n
S
S
E
=
d
( = F(1.981,100) de tablas se obtiene ( =8.4922(1.9,100) = 8.2196
(2.0,100) = 8.5562
Se
=
(
)
(
.
)
3311
8
4922
30
Se = 5133.56 pie3/s
t(1-() = t(0.95) = 1.645 (Ledo de la tabla de la normal)
16050 ( (5133.56) (1.645)
[7605.29 pie3/s 24494.71pie3/s]Intervalos de confianza para QTr100
DISTRIBUCION LOG GAMMA O LOGPEARSON DE 3 PARAMETROS
Si los logaritmos Y de una variable aleatoria X se ajustan a una distribucin Pearson tipo III, se dice que la variable aleatoria X se ajusta a una distribucin Log Pearson Tipo III. Esta distribucin es ampliamente usada en el mundo para el anlisis de frecuencia de Caudales mximos. Esta se trabaja igual que para la Pearson Tipo III pero con Xy y Sy como la media y desviacin estndar de los logaritmos de la variable original X.
Funcin de densidad:
(
)
-
-
-
G
=
-
a
a
b
a
b
0
1
0
)
ln(
exp
)
ln(
1
)
(
y
x
y
x
x
x
f
Donde,
y0 ( y ( ( para ( ( 0
( ( y ( y0 para ( ( 0
( y ( son los parmetros de escala y forma, respectivamente , y y0 es el parmetro de localizacin.
Estimacin de parmetros:
b
a
a
b
;
2
;
2
0
2
-
=
=
=
y
y
x
x
Cs
s
Cs
S
C
es el coeficiente de asimetra, ,
y
y
s
y
x
son la media y la desviacin estndar de los logaritmos de la muestra respectivamente.
Factor de frecuencia:
y
y
Tr
S
K
x
Y
Ln
*
+
=
)
(
5
4
3
2
2
3
2
6
3
1
6
6
)
1
(
6
)
6
(
3
1
6
)
1
(
+
+
-
-
-
+
-
+
S
S
S
S
S
T
C
C
z
C
z
C
z
z
C
z
z
K
Donde z es la variable normal estandarizada
Este valor de K se encuentra tabulado de acuerdo al valor de
S
C
calculado con la muestra.
Intervalos de confianza:
E
Tr
S
t
X
)
1
(
a
-
Se
S
n
y
=
d
Donde
Y
S
es la desviacin estndar de los logaritmos de la muestra, n es el nmero de datos y ( se encuentra tabulado en funcin de
R
S
T
y
C
_
_
.
Tambin puede calcularse como:
a
ab
K
K
K
T
T
U
T
-
+
=
2
,
a
a
ab
K
K
K
T
T
l
T
-
-
=
2
,
*
a
(
)
1
2
1
2
-
-
=
n
z
a
a
n
z
K
b
T
2
2
a
-
=
Donde
(
)
a
a
-
=
1
t
z
U
T
TR
SK
Q
Q
a
,
+
=
L
T
TR
SK
Q
Q
a
,
+
=
HIDROLOGIA 2013
x