19
Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP HAS 2014 1 Probabilidades en hidrología. El objetivo de este apunte es introducir al alumno de ingeniería en una temática compleja como lo es la hidrología probabilística. Este documento ha sido adaptado para que incluso aquellos que han tenido una formación deficiente en estadística y no cuenten con los conocimientos y herramientas podrán sacar provecho de él. Este apunte, toma referencias a distintas obras, siendo las dos principales “Hydrologie de surface(1963, originalmente escrito en francés por M. Roche, ingeniero de EDF y profesor de l’école ingénierie de Paris) y de la obra Hidrología probabilística (1998, de Eduardo Varas ex profesor de hidrología de la PUC de chile y ex director de EOOCC de la UDP y por el Profesor Philippe Bois ex profesor de L'École Nationale Supérieure d'Hydraulique et de Mécanique de Grenoble e Investigador en el Laboratorio de Trasferencias en hidrología LTHE de Grenoble). Este apunte ha sido transcrito y parcialmente modificado, espacialmente para la Escuela de Obras Civiles y Medio Ambiente de la UDP, por el profesor del curso. CONCEPTOS DE BASE A) Noción de evento (símbolos a, b...) La palabra empleada en el sentido trivial: cuando una cosa se produce (evento realizado, ocurrido, sucede), pude producirse (evento posible), etc. Denotamos que el evento a no se produce por el símbolo (evento contrario). Un cierto número de operaciones llamadas « lógicas » pueden ser definidas sobre los eventos, desde donde se destacan: Suma lógica, reunión o simplemente unión: símbolo a + b, significa que a o bien b se producen. Esta suma es igualmente un evento. Producto lógico o intercepción: símbolo a·b, significa que a y b se producen. Esto es igualmente un evento, etc., Sobre esto no se insistirá en el apunte. B) Noción de probabilidad Prueba, test, ensayo: Sea una colección de eventos posibles a, b... la prueba es la operación elemental que permite realizar uno de esos eventos, o varios de ellos de forma simultánea. Probabilidad de un evento elemental: número positivo comprendido entre 0 et 1 atribuido a un evento dado, o por la estructura misma del problema estudiado, o por el estudio estadístico de una colección o muestra experimental de eventos. C) Variable aleatoria Llamamos variable aleatoria X a aquella que puede tomar valores x1, ..., xi, …, xn con las probabilidades p1, ..., pi, …, pn (símbolo de variable aleatoria será v.a.). Caso discreto - caso continuo: Se dice que una v.a. es discreta cuando ella puede solamente tomar un número finito de valores de valores. Se dice que una v.a. es continua cuando ella puede tomar cualquier valor dentro de un intervalo finito o infinito. Para la v.a. continua, definimos la probabilidad elemental: probabilidad para la cual X esté comprendida entre x y x+dx, la cual denotamos como f(x)dx. Al símbolo f(x) la llamaremos densidad de probabilidades. La probabilidad que x esté comprendida dentro del intervalo (x1, x2) es denotada como: [ 1 ≤≤ 2 ]=∫ () Para que f(x) represente verdaderamente una densidad de probabilidades, se deberá cumplir que el valor de la integral extendida a todo el intervalo de variaciones posibles de x sea igual a 1. Supondremos en lo que sigue que la v.a. puede tomar todos los valores posibles desde - a +, sin considerar que esto es una condición restrictiva.

Hidrologia probabilistica UDP

Embed Size (px)

DESCRIPTION

hidrologia

Citation preview

Page 1: Hidrologia probabilistica UDP

Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP

HAS 2014 1

Probabilidades en hidrología.

El objetivo de este apunte es introducir al alumno de ingeniería en una temática compleja como lo es la hidrología

probabilística. Este documento ha sido adaptado para que incluso aquellos que han tenido una formación deficiente en

estadística y no cuenten con los conocimientos y herramientas podrán sacar provecho de él.

Este apunte, toma referencias a distintas obras, siendo las dos principales “Hydrologie de surface” (1963, originalmente

escrito en francés por M. Roche, ingeniero de EDF y profesor de l’école ingénierie de Paris) y de la obra Hidrología

probabilística (1998, de Eduardo Varas ex profesor de hidrología de la PUC de chile y ex director de EOOCC de la UDP y

por el Profesor Philippe Bois ex profesor de L'École Nationale Supérieure d'Hydraulique et de Mécanique de Grenoble e

Investigador en el Laboratorio de Trasferencias en hidrología LTHE de Grenoble). Este apunte ha sido transcrito y

parcialmente modificado, espacialmente para la Escuela de Obras Civiles y Medio Ambiente de la UDP, por el profesor

del curso.

CONCEPTOS DE BASE

A) Noción de evento (símbolos a, b...)

La palabra empleada en el sentido trivial: cuando una cosa se produce (evento realizado, ocurrido, sucede), pude

producirse (evento posible), etc. Denotamos que el evento a no se produce por el símbolo �̅� (evento contrario). Un

cierto número de operaciones llamadas « lógicas » pueden ser definidas sobre los eventos, desde donde se destacan:

Suma lógica, reunión o simplemente unión: símbolo a + b, significa que a o bien b se producen. Esta suma es igualmente

un evento.

Producto lógico o intercepción: símbolo a·b, significa que a y b se producen. Esto es igualmente un evento, etc., Sobre

esto no se insistirá en el apunte.

B) Noción de probabilidad

Prueba, test, ensayo: Sea una colección de eventos posibles a, b... la prueba es la operación elemental que permite

realizar uno de esos eventos, o varios de ellos de forma simultánea.

Probabilidad de un evento elemental: número positivo comprendido entre 0 et 1 atribuido a un evento dado, o por la

estructura misma del problema estudiado, o por el estudio estadístico de una colección o muestra experimental de

eventos.

C) Variable aleatoria

Llamamos variable aleatoria X a aquella que puede tomar valores x1, ..., xi, …, xn con las probabilidades p1, ..., pi, …, pn (símbolo de variable aleatoria será v.a.). Caso discreto - caso continuo: Se dice que una v.a. es discreta cuando ella puede solamente tomar un número finito de valores de valores. Se dice que una v.a. es continua cuando ella puede tomar cualquier valor dentro de un intervalo finito o infinito. Para la v.a. continua, definimos la probabilidad elemental: probabilidad para la cual X esté comprendida entre x y x+dx, la cual denotamos como f(x)dx. Al símbolo f(x) la llamaremos densidad de probabilidades.

La probabilidad que x esté comprendida dentro del intervalo (x1, x2) es denotada como: 𝑃[𝑥1 ≤ 𝑥 ≤ 𝑥2] = ∫ 𝒇(𝒙) 𝒅𝒙𝒙𝟐

𝒙𝟏

Para que f(x) represente verdaderamente una densidad de probabilidades, se deberá cumplir que el valor de la integral extendida a todo el intervalo de variaciones posibles de x sea igual a 1. Supondremos en lo que sigue que la v.a. puede

tomar todos los valores posibles desde - a +, sin considerar que esto es una condición restrictiva.

Page 2: Hidrologia probabilistica UDP

Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP

HAS 2014 2

D) Frecuencia – muestreo:

Decimos que un evento es favorable cuando él responde (cuanto toma, o alcanza) un valor que esperábamos, el cual

habíamos fijado antes (de manera arbitraria o no) de la prueba. Por ejemplo, en un análisis de caudales en un río, si

estamos interesados en caudales superiores a 1000 m3/s, todo caudal que cumpla esta condición será un evento

favorable.

Si disponemos de un muestreo de N eventos, obtenidos o por pruebas, o por observaciones realizadas a intervalos de

tiempo regulares de un fenómeno natural, él puede contener n eventos favorables, es decir estos coinciden con el

evento esperado. Por ejemplo, sobre un muestreo de 30 caudales medios anuales, encontramos que 5 son superiores a

1000 m3/s. Llamaremos frecuencia experimental, o simplemente frecuencia el cociente F=n/N , aquí 1/6 (1 una muestra

de cada 6 supera los 1000 m3/s).

Ahora supongamos que contamos con otro muestra de 30 caudales observados en la misma estación (decimos -en

estadística- que la muestra ha sido tomada de la misma población). Encontraremos para los 1000 m3/s, una frecuencia

experimental probablemente diferente, y ocurrirá lo mismo para otros muestreos u observaciones que realizamos para

en la misma estación para otros 30 caudales (la frecuencia no será la misma, pero será cercana). Como conclusión, la

frecuencia definida es entonces igualmente una v.a.: su ley de probabilidades la llámanos ley de muestreo.

Se puede demostrar que (esto se llama teorema de Bernoulli o ley de las grandes números) la frecuencia calculada sobre

la muestra tenderá hacia la probabilidad cuando N aumenta de manera indefinida (convergencia en el sentido de la

probabilidades)

En el caso continuo, calculamos, o la frecuencia de número inferior a (no excedencia) (n correspondiente al número,

contenido en la muestra, un ranking ordenados de manera creciente), o la frecuencia de número superior a (n es el

numero en un ranking ordenado de manera decreciente). En el primer caso la frecuencia se denota como Fx ó F(x): ella

corresponde, para una población infinita, a la probabilidad de no excedencia: 𝑃[𝑋 < 𝑥] = ∫ 𝒇(𝒙) 𝒅𝒙𝒙

−∞ . En el segundo

caso se denota la frecuencia como F1(x): ella es correspondiente a la probabilidad de excedencia: 𝑃[𝑋 > 𝑥] =

∫ 𝒇(𝒙) 𝒅𝒙∞

𝒙. En general se designan, cuando se realizan los cálculos, las probabilidades por los símbolos F(x) y F1(x) que

les llamamos frecuencias teóricas; F(x) es igualmente llamada función de repartición o función de distribución.

Entonces tenemos que: 𝑓(𝑥) =𝑑𝑓

𝑑𝑥

Figura 1. Función de repartición de distribución

Valores de la variable aleatoria

Frec

uen

cia

o p

rob

abili

dad

Page 3: Hidrologia probabilistica UDP

Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP

HAS 2014 3

Se destaca que la suma de las frecuencias F y F1 calculadas de esta manera es superior a 1, lo cual es ilógico. Si los 10

valores (esto solo como ejemplo), ordenados en orden decreciente. La frecuencia experimental de excedencia atribuida

al número 3 es 3/10. Dentro de la clasificación inversa, la frecuencia de no excedencia es 8/10 y la frecuencia del evento:

el valor en cuestión es excedido, igualado o no sobre pasado (no excedido) corresponde a 1,1, lo cual es manifiestamente

debería ser igual a la unidad. En este documento no se discutirá sobre este punto, pero señalamos que para evitar esta

anomalía se adopta: o una frecuencia experimental como valor (n-1/2)/N, o bien n/(N+1), o por ultimo calculando las

dos frecuencias F y 1-F1 con la fórmula de finida como n/N pero trazando curvas en escalinatas.

PARAMETROS ESTADISTICOS O ESTADIGRAFICOS

La estadística nos permite contar con un número indicadores que nos entregan información sobre el comportamiento

de un conjunto muy grandes de datos (observaciones), entonces un parámetro estadístico nos indica alguna

característica de la población.

Estadígrafo de posición:

a) El valor esperado de una variable aleatoria es un parámetro estadístico que se conoce como media μ. Se define

como promedio o media aritmética

La estimación de la media de una muestra se denota por 𝑥 ̅, y se calcula como:

�̅� =1

𝑛∑ 𝑥𝑖

𝑛

𝑖=1

b) Mediana: es un valor tal que la probabilidad de tener valores mayores o menores que la mediana es 0,5; es

decir, es igualmente probable tener valores mayores o menores que la mediana. Si la distribución es simétrica,

la mediana coincide con el promedio.

c) Moda: es el valor más frecuente o probable de la muestra o de la población.

Estadígrafo de dispersión:

También nos interesa conocer la dispersión o variación de los valores en una muestra.

Rango: es la diferencia entre la observación máxima y la mínima.

Varianza y desviación estándar: La varianza es el promedio de la suma de los cuadrados de las diferencias entre cada

uno de los valores de la muestra y el promedio. Esta caracteriza la variabilidad de la media s2.

𝑠2 =1

𝑛 − 1∑(𝑥𝑖 − �̅�)

2𝑛

𝑖=1

n-1 se utiliza para asegura que la estadística no está sesgada.

Coeficiente de variación: En hidrología es usual utilizar un estimador adimensional de la desviación estándar, este es

definido como el cociente entre la deviación estándar y el promedio. Este parámetro presenta problemas de definición

que se presenta en este parámetro cuando el promedio de la muestra es cercano a cero, o bien negativo. Estos casos

ocurren frecuentemente cuando la variable analizada es la temperatura.

Parámetro de simetría: La simetría de una distribución alrededor de una media se mide utilizando la asimetría u

oblicuidad una estimación del coeficiente de asimetría es (el más usado):

Cs =n ∑ (xi − x̅)3n

i=1

(n − 1)(n − 2)3

Page 4: Hidrologia probabilistica UDP

Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP

HAS 2014 4

El parámetro de asimetría puede ser calculado:

C3 =n ∑ 𝑥𝑖

3ni=1 − 3 ∑ 𝑥𝑖

ni=1 ∑ 𝑥𝑖

2ni=1 +

2𝑛

∑ 𝑥𝑖ni=1

(n − 1)(n − 1)

BASE ESENCIAL DEL CALCULO DE PROBABILIDADES

a) Probabilidades totales: Si muchos eventos se excluyen de forma mutua, la probabilidad por la cual uno u otro

de esos eventos se producen es igual a la suma de las probabilidades relativas de cada uno de ellos (operación

de unión en los conjuntos disjuntos, que no tiene elementos en común).

b) Probabilidades compuestas: La probabilidad para que dos eventos a y b sean realizados simultáneamente es

igual a la probabilidad de uno de ellos multiplicado por la probabilidad del otro, considerando que el primero

fue realizado.

Pr (a·b) = Pr (a) ·Pr (b/a)

El segundo factor del segundo miembro se enuncia elípticamente: probabilidad de b conocido a; se; llama la

probabilidad condicional. Esta propiedad se puede extender al caso de varios eventos.

Figura 2.El evento visto desde la perspectiva de la teoría de conjuntos.

Decimos que los eventos a y b son independientes si la probabilidad de b no es influenciada por la de a, es decir si

Pr(b/a)=Pr(b). Tenemos entonces: Pr(a·b)=Pr(a)·Pr(b). El teorema de las probabilidades compuestas exige ser aplicado con

discernimiento: si su aplicación formal es siempre correcta, un operador inexperto podría introducir condiciones

restrictivas que llevarían a errores garrafales. Tomemos el caso del análisis de una crecida a partir de una precipitación

dada; supondremos que en nuestro análisis el hidrograma unitario (HU) tipo para la cuenca es conocido. Este es

completamente determinado por la altura de precipitaciones H y para las condiciones previas de humedad del suelo

(saturación) definidas en nuestro caso por una variable que llamaremos la capacidad aparente media de absorción de

la lluvia Cam. Si H10 representa una tormenta décadal (lluvia con periodo de retorno de diez anos), como en un estudio

de crecidas, estamos interesados en las probabilidades de excedencia, del evento correspondiente a H ≥ H10 : su

probabilidad es igual a 1/10 (en términos anuales). Con la ayuda de esta precipitación, hacemos el análisis de la

Evento 1 Evento 2

Operación unión: 1 punto del conjunto está

dentro de E1 o dentro de E2 (suma lógica)

Operación de intercepción: 1 punto del conjunto está

dentro de E1 y dentro de E2 (producto lógico)

Page 5: Hidrologia probabilistica UDP

Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP

HAS 2014 5

respuesta de la cuenca mediante el HU para un valor medio de Cam: probabilidad de 1/2. Sabemos que Cam y H son

prácticamente variables independientes; el operador aplica el teorema de las probabilidades compuestas y anuncia (con

mucho orgullo) que debemos atribuir a la crecida encontrada una probabilidad de 1/20. Pero este resultado es falso. En

efecto, hay crecidas de igual importancia dadas por lluvias superiores que Hw y Cam inferiores al valor medio y

inversamente.

En realidad, el resultado depende de la manera como las dos variables elementales se componen para entregar la

variable resultante (en este caso la crecida). Este punto será precisado más adelante.

Ley de probabilidades de una variable

Después de la definición axiomática de la probabilidad (repartición de una masa unitaria sobre un conjunto de puntos,

finitos o infinitos, discretos o continuos), toda función monótona creciente que toma valores entre 0 y 1 para los límites

asignados a la variable, puede ser considerada como representante de una ley de probabilidades : a una función tal se

le llama función de repartición, F(x) y nosotros hemos visto que dentro del caso continuo, si la derivada existe en cada

punto, la función derivada se llama de densidad de probabilidades f(x) . De hecho, dentro de la aplicación, la noción de

probabilidad correspondería a la de un juego de azar (tirage au sort en francés) y las leyes que pretenden determinar la

observación o la experimentación no están construidas de cualquier manera (hay una “estructura”).

El juego de azar más simple podría ser el de cara y sello al lanzar una moneda en al que consideramos que la variable aleatoria puede tomar los valores de 0 ó 1 con la misma probabilidad de ½. Todas las otras leyes de probabilidades se deducen de este modelo (que es súper simplificado, pero válido) y se van complicando progresivamente: - Por generalización (ejemplo: el juego de cara y sello a variables de Bernoulli reemplazando las probabilidades de ½ y ½ por p y q); Por adición (ley binominal: suma de las variables de Bernoulli); Por pasaje al límite (convergencia en ley); Por cambio de variables, etc. Nuestro propósito no es emular solamente las leyes más utilizadas, sino las más relevantes para este curso. LEYES DE DISTRIBUCION DE PROBABILIADES A continuación se presentan las leyes de distribución de probabilidades discretas (Binominal y de Poisson), posteriormente algunas leyes de distribución del tipo continuo (Gauss, Galton, Pearson, Exponencial) en la que se incluye la de valores extremos (Gumbel, de dos componentes)

A) Funciones discretas Ley o distribución Binominal Este modelo corresponde a una representación de la realización de múltiples ensayos (pruebas o test) del tipo Bernoulli (el tipo Bernoulli corresponde al modelo más simple de una función de distribución discreta, en el cual la v.a. tiene sólo dos estados posibles: éxito/fracaso). Cuando una v.a. x puede tomar dos valores para n ensayos. La probabilidad que la variable tome uno de los valores (éxito/fracaso) es p. Entonces, si la variable x tiene una distribución binominal, ella puede ser descrita por la siguiente función de densidad:

𝑃(𝑥) = (𝑛𝑥

) 𝑝𝑥(1 − 𝑝)𝑛−𝑥 , para x=0, 1, 2,…, n.

Con:

(𝑛𝑥

) =𝑛!

𝑥! (𝑛 − 𝑥)!

Page 6: Hidrologia probabilistica UDP

Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP

HAS 2014 6

Donde:

p es la probabilidad de uno de los valores, definida como un éxito, 0 p 1; n es el número de eventos y x número de éxitos. Dado que el valor esperado de una suma de v.a. es igual a la suma de los valores esperados y que la varianza de una suma de variables independientes es igual a la suma de las varianzas, se puede calcular fácilmente el valor esperado y la varianza de la v.a. x, como:

E(x)= n·p y 𝜎𝑥2 = 𝑛 · 𝑝(1 − 𝑝)

Figura 3.Distribución de probabilidades para una función binominal. A la izquierda: 10 eventos con una probabilidad del 50% y a la

derecha también 10 eventos pero con una probabilidad de éxito del 10%.

Ejemplo (tomado el libro hidrología probabilística de Varas y Bois) Todas las obras de ingeniería se ven sometidas ocasionalmente a los efectos de sucesos de ocurrencia esporádica, tales como crecidas, terremotos, o huracanes. El proyectista siempre necesita evaluar los riesgos asociados al valor de diseño seleccionado. Si se supone que la ocurrencia de estos fenómenos es independiente entre si y que la probabilidad de ocurrencia permanece constante, cada uno de los sucesos corresponde a un ensayo tipo Bernoulli y su conjunto puede representarse por la distribución binomial. Por ejemplo, supóngase que la probabilidad de tener en un año cualquiera una crecida mayor que un valor crítico seleccionado como valor de diseño es 0,02. ¿Cuál será, entonces la probabilidad de que se produzcan dos o más crecidas mayores que el valor crítico, durante los 30 años de vida útil de la estructura?. SOL: Sea x el número de crecidas mayor que el valor crítico. Entonces x tiene una distribución binomial con parámetros p=0,02 y n=30. La posibilidad de tener dos o más éxitos en 30 ensayos es igual al complemento de la suma de no tener éxitos y de tener un éxito:

p(x>2) = Pr(x=0) + Pr(x=1) = (0,02)0 · (0,98)30 + 30·(0,02)1 · (0,98)29 = 0,872 Es decir, se tiene una probabilidad de 0,13 de sobrepasar el valor del diseño crítico dos o más veces durante la vida de la estructura. Es preciso notar que la probabilidad de falla durante toda la vida útil es alta, aun cuando la probabilidad de falla en un año cualquiera sea pequeña. Por tal motivo, para tener diseños con un grado alto de confiabilidad, o bien pequeños riesgos, se deben diseñar obras con valores de diseño con períodos de retorno alto. Se puede calcular que si el periodo de retorno es igual a la vida útil de la obra, el riesgo de falla es de orden de 0,6

Page 7: Hidrologia probabilistica UDP

Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP

HAS 2014 7

Ley o distribución Poisson La distribución de Poisson representa los éxitos ocurridos como si fueran puntos de una línea continua. Esta línea recta en general representa una línea de tiempo. La distribución de Poisson permite en general representar situaciones en las cuales hay una enumeración, ya que la variable toma valores enteros positivos. El proceso de Poisson es la secuencia de tiempo discreto de ocurrencia de eventos (que sobrepasan un umbral). La ley de Poisson expresa la probabilidad de observar un número de n eventos (que superan, sobrepasan o exceden el umbral) durante una duración determinada (que en un ejemplo específico llamaremos Td) Posibles ejemplos de la utilización de esta distribución es por ejemplo el número de intervalos de lluvia en un temporal, cálculo de probabilidades de crecidas de ríos consideradas como “raras”, es decir caudales que se exceden donde T>10 años. La función de probabilidades de masa de Poisson es:

𝑝(𝑥) =𝜆𝑥𝑒−𝜆

𝑥! , para x=0, 1, 2,…, n.

Donde: λ = parámetro constante positiva x = cualquier entero positivo e = una constante = 2.7182

Figura 4.Distribución de probabilidades para une repartición de Poisson.

Ejemplo de aplicación para la crecidas de un río (tomado de los apuntes de Hydrologie statistique de R. Ababou) Para el estudio de las crecidas de un río se puede aplicar la Ley de Poisson en al caso de análisis de eventos raros (poco frecuentes) que pasen un cierto umbral, en este caso el parámetro λ se calcula mediante: λ=Td/Tr , con Td: periodo de análisis y Tr: periodo de retorno (umbral a exceder), luego la probabilidad de exceder x veces p (X=x)

𝑝(𝑋 = 𝑥) =(

𝑇𝑑

𝑇𝑟)

𝑥𝑒

−(𝑇𝑑𝑇𝑟

)

𝑥!

Para el río l’Oued Mdez se requiere evaluar la probabilidad de observar al menos dos veces una crecida asociada a un periodo de retorno de 25 años (Tr=25 años), para un periodo de observación de 25 años. SOL: Para este problema Td= 25 años, Tr=25 años, x=2, luego λ=1. La probabilidad de observar al menos dos caudales superiores a un Tr=25 años para un periodo (Td) de previsión de 25 años, es igual a la probabilidad de no observar 0 ó 1 (ni 0 ni 1).

𝑝(𝑋 = 2) = 1 − 𝑃0 − 𝑃1 = 1 −(1)0𝑒−(1)

0!−

(1)1𝑒−(1)

1!= 1 − 𝑒−(1) − 𝑒−(1) = 0,264

Page 8: Hidrologia probabilistica UDP

Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP

HAS 2014 8

Entonces hay un 26% de chances de sobre pasar en dos ocasiones el caudal (umbral) asociado a un periodo de retorno 25 años, sobre un periodo de 25 años. Los datos de registro de caudales (caudales que efectivamente fueron medidos) en este río mostraron que en realidad este caudal, Q(Tr=25 años)=825 m3/s fue excedido 2 veces en 23 años.

B) Funciones continuas Ley de Gauss (distribución normal o de Gauss, campana de Gauss): Puede ser presentada como ley limite binominal para un número infinito de pruebas (de test). Esta es una de las distribuciones de mayor uso en análisis estadísticos. Presenta una forma simétrica respecto del valor medio. Función de densidad de probabilidades:

𝑓(𝑥) =1

𝜎√2𝜋𝑒

−(𝑥−𝜇)2

2𝜎2

Entonces:

𝑷(𝑿𝒙) = ∫ 𝒇(𝒙)𝒅𝒙𝒙

−∞

=𝟏

𝝈√𝟐𝝅∫ 𝒆

−(𝒙−𝝁)𝟐

𝟐𝝈𝟐

𝒙

−∞

𝒅𝒙

Donde, µ: promedio (media); σ: desviación estándar (típica); σ2: varianza; π=3,1415…; e=2,7182…

Esta función presenta un valor máximo en: (𝜇, 1

𝜎√2𝜋)

Queda definida por dos parámetros: media (µ) y desviación estándar (σ), para cada valor de la media y desviación estándar tendremos una f(x) distinta. Se representa N(µ, σ) como una familia de funciones de densidad normales. Ella tiene la forma:

Figura 3. Ley de Gauss o distribución Normal.

También se puede encontrar en la literatura que el valor 𝑢 =𝑥−�̅�

𝜎 designa la separación (la variación, distancia) entre

el valor x y la media medida (o normalizada) en función de la desviación estándar. Esta medida se llama normalización, estandarización o tipificación de la variable x. Corresponde a un cambio de variable que nos lleva a una distribución normal estándar.

Page 9: Hidrologia probabilistica UDP

Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP

HAS 2014 9

𝐹(𝑥) =1

√2𝜋∫ 𝑒−

12

𝑢2

𝑑𝑢𝑢

La distribución Gaussiana corresponde a una distribución simétrica respecto de la media, la cual es al mismo tiempo la media y la moda. El uso de esta distribución es muy amplio en hidrología y climatología para la representación de la distribución estadística de valores medios (por ejemplo: lluvias medias anuales o caudales medios anuales). Esta propiedad de la ley de Gauss no es fortuita, ella proviene del teorema del límite central, que corresponde a una importante propiedad en hidrología, este es:

“Si Zn es una combinación lineal de una v.a. Xj independiente, cualquiera sea la ley de distribución a seguir por cada uno de X, la ley de distribución de Zn tiende hacia una distribución normal cuando n aumenta indefinidamente”

Ejemplo (tomado el libro hidrología probabilística de Varas y Bois) Sea x una v.a. con distribución normal con promedio 2 y varianza 9. ¿Cuál es la probabilidad de que x sea mayor que 8? SOL:

𝑷(𝒙 ≥ 𝟖) = ∫ 𝒇(𝒙)𝒅𝒙

𝟖

=𝟏

𝟑√𝟐𝝅∫ 𝒆

−(𝒙−𝟐)𝟐

𝟐·𝟑𝟐

𝒙

−∞

𝒅𝒙

Luego, P(x≥8)=0,02275 Ley de Galton (Log-normal) Existen procesos físicos y ambientales que no presentan una distribución de probabilidades simétrica con respecto a su valor medio es decir tiene un sesgo (en este caso será a la derecha). En particular hay dos procesos que son de interés en ingeniería: la precipitación y el régimen de caudales. Podemos generalizar la ley de Gauss y transformarla en asimétrica, mediante algunos cambios apropiados de variables. El más conocido de estos cambios de variables consiste en tomar como variable gaussiana el logaritmo o una función lineal del logaritmo de la variable estudiada. Así obtenemos la ley de Galton, llamada también distribución Logarítmica Normal (Log-normal o Ley de Gibrat-Gauss) para estos casos. Esta distribución corresponde a la de una variable aleatoria (precipitaciones o caudales) cuyo logaritmo está normalmente distribuido. Por lo tanto, si la variable X es una v.a. con una distribución normal, entonces X tiene una distribución log-normal.

Función de densidad de probabilidades: 𝑓(𝑥) =1

𝑥𝜎√2𝜋𝑒

−(ln (𝑥−𝜇))2

2𝜎2

Al tomar z=a·log(x-x0)+b, la distribución se trasforma en:

𝐹(𝑧) =1

√𝜋∫ 𝑒−𝑧2

𝑧

−∞

𝑑𝑧

Una forma de representación más sencilla es, considerando el cambio de variable: u= a·log(x-x0)+b

𝐹(𝑢) =1

√2𝜋∫ 𝑒−

𝑢2

2

𝑢

−∞

𝑑𝑢

Sin embargo, la trasformación más utilizada es, considerando el cambio de variable: y=log (x)

𝐹(𝑦) =1

√2𝜋∫ 𝑒

−12

(𝑦−�̅�𝜎𝑦

)2𝑦

−∞

𝑑𝑦

Page 10: Hidrologia probabilistica UDP

Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP

HAS 2014 10

Atención: �̅� y 𝜎𝑦, no son las media y la desviación estándar de x!!!!

Figura 4. Ley de Galton o distribución Log-Normal, para el cambio de variable y = ln(x)

Ley de Pearson (gamma)

La ley de Pearson general parte de la base de la función llamada Gamma (llamada también integral Euleriana de segunda

especie):

𝛤(𝑎) = ∫ 𝑒−𝑥𝑥𝑎−1𝑑𝑥

0

Que responde a la relación fundamental: 𝛤(𝑎) = (𝑎 − 1)𝛤(𝑎 − 1) y a es un numero entero (n), se puede decir que

𝛤(𝑛) = (𝑛 − 1)! , entonces 𝛤(1) = ∫ 𝑒−𝑥𝑑𝑥 = 1

0

La ley de Pearson más utilizada en hidrología es la de tipo III, la cual posee gran flexibilidad y diversidad de formas, dependiendo de los valores de sus parámetros, estos parámetros son: α, β, y ɣ (ver figura 5). Esta función es asimétrica y esta definida para valores positivos de la variable, lo que concuerda con las propiedades de la mayoría de los registros hidrológicos, o variables físicas en hidrología.

𝑓(𝑥) =1

𝛼𝛤(𝛽)(

𝑥−𝛾

𝛼)

𝛽−1𝑒

−(𝑥−𝛾

𝛼) x ≥ ɣ

Donde, α, β, ɣ son parámetros de la distribución y 𝛤(𝛽) es la función gamma de β Los parámetros de la distribución pueden estimarse en función del promedio (�̅�), desviación estándar (s) y coeficiente de asimetría (Cs) de la muestra, por medio de las siguientes expresiones:

𝛼 = 𝜎/√𝛽

𝛽 = (2

𝐶𝑠)

2

𝛾 = 𝜇 − 𝜎√𝛽

La función de distribución acumulada de este modelo se expresa como:

𝐹(𝑥) = ∫1

𝛼𝛤(𝛽)(

𝑥 − 𝛾

𝛼)

𝛽−1

𝑒−(

𝑥−𝛾𝛼

)𝑑𝑥

𝑥

0

Dependiendo de los valores de los parámetros esta distribución puede tomar formas más simples conocidas como modelos gamma de uno o dos parámetros. Casos especiales de esta distribución son los modelos exponencial y log-normal.

Page 11: Hidrologia probabilistica UDP

Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP

HAS 2014 11

Figura 5. Ley tipo Pearson III para diferentes parámetros y asimetrías.

Ley exponencial

Si 𝒇(𝒙) = 𝝀𝑒−𝜆𝑥, donde: λ = 1/μ entonces Esta función de distribución tiene la forma:

𝑭(𝒙) = 𝟏 − 𝒆−𝝀𝒙 Los intervalos de tiempo entre dos crecidas sucesivas o dos eventos de lluvia muestran una distribución de este tipo y la variable λ representa en este caso es la tasa media de ocurrencia.

Figura 6. Ley exponencial

Dentro de las leyes de distribuciones, existen algunas que se ajustan mejor a los valores extremos, pero estas

distribuciones pueden ser diversas, como: Gumbel (más utilizada), Exponencial, Féchet, entre otras.

Ley de Gumbel (o del valor extremo)

Esta ley de distribución ha sido creada para el estudio de distribución de frecuencias de labores extremos (máximo o

mínimos anuales). Corresponde a una función asimétrica como la log-normal (ley de Galton).

Un evento extremo se define como cualquier v.a. que alcance o sobrepase un cierto nivel dado (en general para T>10

años).

Page 12: Hidrologia probabilistica UDP

Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP

HAS 2014 12

Consideramos que sobre N observaciones de una serie de datos fluviométricos o meteorológicos dentro de cada ano, N

puede ser considerada como eventos independientes. Si se designa por h(x) el número medio anual de valores diarios

superiores a x, la probabilidad para que todos los valores diarios sean inferiores a x, (es decir para que el máximo anual

sea inferior a x) es igual a: [1 −ℎ(𝑥)

𝑁]

𝑵, si N es suficientemente grande, se puede aproximar a : P=exp[-h(x)], con

h(x)=exp(-b) luego la función de distribución será:

𝐹(𝑥) = 𝑒−exp (−𝑏)

O bien:

1 − 𝐹(𝑥) = 1 − 𝑒−𝑒𝑏

Figura 6. Ajuste de una distribución tipo Gumbel para valores extremos de lluvias. A la izquierda para un periodo lluvioso y a la

derecha para otro seco.

Esta distribución de ha usado ampliamente para describir escurrimientos anuales. Los diagramas de distribución de caudal son generalmente asimétricos, como el que se muestra en la figura 6. Estos pueden ser aproximados de forma bastante cercana con la distribución de Gumbel que posee una asimetría fija de 1.14. Es usada para calcular escurrimientos excedentes máximos anuales. Los escurrimientos máximos anuales se calculan eligiendo el escurrimiento máximo anual obtenido a partir de mediciones diarias. Este escurrimiento máximo anual es agrupado con los escurrimientos máximos de varios años. La distribución probabilística de estos escurrimientos máximos anuales puede ser representada por Gumbel. Entonces, para el caso particular de análisis de caudales el parámetro b se calcula:

𝑏 =𝑥−�̅�+0,45𝜎

0,7797𝜎, con x la magnitud del caudal (m3/s), �̅� es el caudal promedio y σ la desviación estándar del caudal.

Cuando la ley de Gumbel no representa bien una distribución de valores extremos, una alternativa es el uso de la ley de Jenkinson, que corresponde a Gumbel, pero adiciona un parámetro suplementario. Esta ley queda fuera de este apunte y se espera que el alumno puede revisarla de manera autónoma. Ejemplo (tomado el libro hidrología probabilística de Varas y Bois) Si le caudal de escurrimiento de la cuenca del río Biobío tiene un caudal promedio de 1340 (m3/s) con una varianza de 58.400 (m3/s). Calcule cual es la probabilidad de que el caudal sea igual o exceda los 2100 (m3/s) usando la distribución de Gumbel

SOL: El primer paso es la estimación de la variable b: 𝑏 =𝑥−�̅�+0,45𝜎

0,7797𝜎=

2100−1340+0,45·241,6

0,7797·241,6= 4,61

Luego, 1 − 𝐹(𝑥) = 1 − 𝑒− exp(−4,61) = 0,0099

Esto resultado se interpreta como: un caudal de esa magnitud (2100 m3/s) puede ocurrir aproximadamente 1 vez cada

100 años (el periodo de retorno de Q=2100 m3/s es T=100 años).

Precipitación diaria (mm) Precipitación diaria (mm)

Page 13: Hidrologia probabilistica UDP

Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP

HAS 2014 13

La posibilidad que un cierto caudal sea excedido, o se observe el período de retorno, es una función directa del

parámetro b, entonces se puede determinar la probabilidad de forma inmediata en función del parámetro b.

Tabla 1. Parámetro b y Probabilidad de excedencia y de retorno asociada

Parámetro b

Probabilidad de excedencia

Periodo de retorno (Intervalo de recurrencia)

0,367 0,50 2 1,367 0,20 5 2,250 0,10 10 2,970 0,05 20 3,199 0,04 25 3,902 0,02 50 4,601 0,01 100 5,296 0,005 200

En general el análisis de frecuencia nos ayuda a determinar eventos extremos (sequias, tormentas de alta magnitud y caudales de crecidas). En general la magnitud de un evento es inverso a la frecuencia de ocurrencia. Para el análisis de frecuencia de ocurrencia utilizamos las leyes o distribución de probabilidad. En estos análisis las hipótesis de trabajo (supuestos) son: i) eventos independientes; ii) distribución idéntica y; iii) el fenómeno que lo produjo es estocástico. El interés del ingeniero en estos análisis es el diseño de presas, puentes, estructuras de crecidas, reconocimiento de áreas de inundación, etc. PERIODO DE RETORNO Por definición un evento extremo ocurre si una v.a. X es mayor o igual que un cierto nivel x. El intervalo de recurrencia

es el tiempo entre ocurrencias de X≥ x. El periodo de retorno T de un evento X ≥ x es el valor esperado, su valor promedio medido sobre un número de

ocurrencias suficientemente grandes. El periodo de retorno de un evento (caracterizado por una magnitud dada)

también puede definirse como el intervalo de ocurrencia promedio entre eventos que igualan o exceden una magnitud

especifica.

EJEMPLO: Determine el periodo de retorno de un caudal anual de 8000 (m3/s) para un registro de caudales máximos

anuales correspondiente al río Biobío en puente viejo, para el periodo 1982-2003. Este caudal de 8000 m3/s está

asociado una altura de escurrimiento en el río donde está a la altura de la ciudad de Santa Juana existe desbordamiento.

Tabla 2. Caudales máximos anuales para el río Biobío en Puente Viejo

Ano Caudal (m3/s) Ano Caudal (m3/s)

1982 6763 1993 8455

1983 9284 1994 7184

1984 6134 1995 5161

1985 6489 1996 2733

1986 8833 1997 7719

1987 5286 1998 1839

1988 4113 1999 4031

1989 6366 2000 7733

1990 5088 2001 10180

1991 11428 2002 10537

1992 7286 2003 11401

Page 14: Hidrologia probabilistica UDP

Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP

HAS 2014 14

SOL: Durante el periodo de registro (22 años), el caudal de 8000 (m3/s) es excedido 7 veces y los intervalos de recurrencia

que son 6 varían desde un año (es decir esta caudal se superó un ano y el siguiente también) hasta 8 años (del 1993 al

2000). Por lo que aproximadamente el periodo de retorno asociado a este caudal será: T=22/6= 3,6 años. Entones en

promedio une vez cada 3,6 años la localidad de Santa Juana es inundada por el río Biobío.

Tabla 3. Años de excedencia e intervalos de ocurrencias

Figura 7. Caudales máximos anuales del río Biobío en Puente Viejo para el periodo 1982-2003

La probabilidad p = P(X≥x) de ocurrencia del evento X≥x en cualquier observación puede relacionarse con el periodo de retorno en la siguiente forma. Para cada observación existen dos opciones: o que el evento sobrepase o iguale el límite prestablecido, x (que significa un éxito, o probabilidad p) es decir X≥x, o que no lo sobre pase (correspondiente a un fracaso, o probabilidad 1-p) es decir X<x. En este caso las observaciones son independientes y entonces el valor esperado puede definirse como una distribución binominal (ya explicada en este documento). En este apunte no se explica la manera de como a partir de la distribución binominal se puede llegar a la relación mostrada arriba (si tiene interés en esto, ver Chow página 393): T=1/p; es decir la probabilidad de ocurrencia de un evento en el cualquier observación es el inverso de su periodo de retorno: P(X≥x) = 1/T. Si retomamos el ejemplo del río Biobío, la probabilidad de que el caudal máximo ese a igual o exceda los x=8000 m3/s, en cualquier anos es aproximadamente p=1/T = 1/3,6 = 0,278 A menudo otras preguntas son posadas: por ejemplo, cual es la probabilidad de que un evento con periodo de retorno de T anos ocurra al menos una vez en N años? Para el cálculo de esto, primero se considera la situación de que no ocurra un evento de T años en N años. Esto requerirá una secuencia de N fallas sucesivas, de tal manera que:

P(X<x cada año durante N años) = (1-p)n, para el cual su complemento será:

P(X≥x al menos una vez en N años)=1-(1-p)n

luego, como p=1/T P(X≥x al menos una vez en N años)=1-(1-1/T)n

Ano de excedencia 1983 1986 1991 1993 2001 2002 2003 Promedio

Intervalo de ocurrencia (años )

3 5 2 8 1 1 3,3

2 5 2 8 1 2

3

4

5 6 7

1 1

Page 15: Hidrologia probabilistica UDP

Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP

HAS 2014 15

Si seguimos con el ejemplo del Biobío, queremos estimar la probabilidad de que el caudal máximo anual Q exceda los 8000 m3/s al menos una vez durante los próximos tres años. En este caso P(Q≥8000 en cualquier año)=0,278, luego utilizando la ecuación anterior: P(Q≥8000 m3/s al menos une vez durante los próximos tres años)= 1 - (1-0,278)3 = 0,624 (un 62,4%)

PRUEBAS DE BONDAD DE AJUSTE: La bondad del ajuste de una distribución de probabilidades puede hacerse comparando los valores teóricos y muéstrales de las funciones de frecuencia relativa. A continuación se presentan, loe métodos gráficos y cuantitativos Métodos gráficos Para verificar un modelo propuesto, se recurre usualmente a comparaciones gráficas entre el modelo y los datos, ya sea utilizando la función densidad de probabilidad, o bien, la distribución acumulada. En ambos casos, la comparación grafica permite una visualización rápida del ajuste del modelo e indica las zonas en las cuales el ajuste es deficiente. Para estudiar el ajuste de los datos al modelo, se procede a graficar la curva de distribución acumulada. Para facilitar la decisión se acostumbra usar un papel especial de modo que el modelo probabilístico se representa en él por una receta. Para ello, se deforma la escala de las abscisas de modo de estirar los extremos de la distribución. Para preparar un gráfico de probabilidades para un conjunto de valores se sigue el siguiente procedimiento. 1. Se obtiene un papel especial, llamado papel de probabilidades (ver figuras 8 y 9), diseñado para el modelo en

estudio. 2. Se ordenan las observaciones en orden creciente en magnitud 3. Se grafican las observaciones en el papel de probabilidades, asignándoles a cada una, una probabilidad o posición

de ploteo. existen varias posiciones de ploteo. en la actualidad una de las preferidas es la propuesta por Weibull, que entrega un estimador no sesgado de probabilidad. En este caso probabilidad se calcula con la siguiente expresión.

𝑃(𝑥 ≤ 𝑋) =𝑚

𝑛 + 1

Siendo m= número de orden Siendo n= número de datos Se utiliza también el concepto de periodo de retorno (T) que se define como el tiempo para el cual en promedio se produce un evento igual o superior al considerado. Es decir,

𝑇 =1

1 − 𝑃(𝑥 ≤ 𝑋)

O bien,

𝑇 =𝑛 + 1

𝑛 − 𝑚

4. Si los puntos graficados se ajustan a una recta, entonces el modelo elegido representa un buen ajuste y se traza la recta en forma visual. Si los puntos no representan una tendencia lineal, entonces el modelo elegido no es adecuado. Una desviación sistemática indica un ajuste pobre.

Las figuras siguientes se presentan papeles de probabilidad para modelos normal y de valores extremos respectivamente.

Page 16: Hidrologia probabilistica UDP

Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP

HAS 2014 16

Figura XX. Papel de distribución normal

Figura 8. Papel de distribución de Gauss (Normal)

Page 17: Hidrologia probabilistica UDP

Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP

HAS 2014 17

Figura 9. Papel de distribución valore extremos Gumbel (tipo I)

Page 18: Hidrologia probabilistica UDP

Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP

HAS 2014 18

Métodos cuantitativos Los métodos anteriores permiten juzgar en forma gráfica la bondad del ajuste de los datos a un determinado modelo probabilístico. Sin embargo, en ciertas ocasiones es preferible contar con procedimientos cuantitativos, que permitan una decisión objetiva sobre el ajuste. A continuación se describen dos procedimientos cuantitativos: el test chi-cuadrado y el test Kolmogorov-Smirnov. Los test de hipótesis sobre modelos de distribución cuentan con las siguientes etapas generales: Primero, se calcula un estadígrafo a partir de los datos observados. Luego se calcula la probabilidad de obtener el estadígrafo calculado, en el supuesto que el modelo sea correcto. Esto se realiza refiriéndose a una tabla probabilística que entregue los percentiles del modelo de distribución del estadígrafo. Finalmente, si la probabilidad de obtener el valor del estadígrafo calculado es baja, se concluye que el modelo supuesto no provee una adecuada representación de la muestra. Debe hacerse notar que este procedimiento permite rechazar un modelo por no ser adecuado, pero no permite probar que el modelo probabilístico elegido sea el correcto. Test Chi-cuadrado (𝑋2) Es el test más usado para medir la bondad de ajuste de un modelo y es aplicable estrictamente a cualquier tipo de distribución siempre que los parámetros de ella, hayan sido estimados mediante el método de máxima verosimilitud. El test consiste en comparar, en intervalos previamente definidos de la variable aleatoria, el número de casos observados en ese intervalo con el teórico, el cual es función del modelo probabilístico en estudio. Si 01, 02,…, 0𝐾 son las frecuencias absolutas observadas y 𝐸1, 𝐸2,…,𝐸𝐾 son las frecuencias teóricas, en cada una de las clases, se define un estadígrafo.

𝑋2 = ∑(0𝑖 − 𝐸𝑖)2

𝐸𝑖

𝑘

𝑖=1

Las variables 𝑿𝟐 tienden a tener una distribución chi-cuadrado con K-S-1 grados de libertad, siendo K el número de clases o intervalos definidos y S el número de parámetros estimados en el modelo. Para que el ajuste de la distribución a la muestra sea aceptable, se requiere que el valor chi-cuadrado sea menor o, a lo sumo, igual al valor teórico que toma la distribución chi-cuadrado para un cierto nivel de significación (normalmente 5%). Las tablas de distribución chi-cuadrado permiten conocer el valor teórico de chi en función de los grados de libertad y del nivel de probabilidad deseado. Se recomienda elegir un número reducido de clases de modo que el valor teórico de casos observados en cada clase sea por lo menos igual a 5. Test de Kolmogrov-Smirnov Este procedimiento es un test no paramétrico que permite probar si dos muestras provienen del mismo modelo probabilístico. Supóngase que se tienen dos muestras de tamaño total N=m+n compuestas por observaciones 𝑥1, 𝑥2, 𝑥3……..𝑥 e 𝑦1, 𝑦2, 𝑦3……..𝑦𝑛. El test supone que las variables x e y son mutuamente independientes y que cada x proviene de la misma población continua 𝑃1 y que las variables y provienen de otra población continua 𝑃2. La hipótesis nula es que ambas distribuciones son idénticas, es decir, son dos muestras de la misma población. El test se basa en calcular el estadígrafo J definido como el valor máximo de la diferencia absoluta entre dos funciones distribución acumulada. En general, el estadígrafo se calcula usando las distribuciones empíricas de las muestras, de la siguiente manera:

𝐹𝑚(𝑎) =𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑋 ≤ 𝑎

𝑚

𝐺𝑛(𝑎) =𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑌 ≤ 𝑎

𝑛

Page 19: Hidrologia probabilistica UDP

Introducción a la Hidrología probabilística. Hidrología, Escuela de Ingeniería en Obras Civiles y Medio Ambiente, UDP

HAS 2014 19

𝐽 =𝑚 ∗ 𝑛

𝑑

𝑚𝑎𝑥−∞ < 𝑎 < ∞

(|𝐹𝑚(𝑎) − 𝐺𝑛(𝑎)|)

La dócima es rechazar la hipótesis nula si J es mayor o igual que un valor crítico que depende de m, n y del nivel de significancia. Se cuenta con tablas de los valores críticos (Hollander y Wolfe, 1973) Si los tamaños de las muestras son grades se puede demostrar que:

𝑄() = 𝑃 (𝐽 < ) = ∑ (−1)𝐽 exp(−2𝑗22)𝐽=+∞𝐽=−∞ para > 0

m= tamaño de la muestra de la variable X

n=tamaño de la muestra de la variable Y

d= mínimo común múltiple de m y n La dócima es rechazar 𝐻𝑂 si 𝐽 ≥ 𝑞*, donde q* queda definido por:

𝑄(𝑞∗) = 1 − 𝑎 Hollander y Wolfe (1973) presentan tablas de Q() para varios valores de