49
Aspectos geom´ etricos del transporte ´ optimo y algunas aplicaciones Jorge Salazar ESPOL - Facultad de Ciencias Naturales y Matem´ aticas (Proyecto Prometeo - Senescyt)

Aspectos geométricos del transporte óptimo y algunas ...repositorio.educacionsuperior.gob.ec/bitstream/28000/4988/2/Anexo 2... · Gaspard Monge, 1746-1818 \M emoire sur la th eorie

  • Upload
    vudan

  • View
    226

  • Download
    0

Embed Size (px)

Citation preview

Aspectos geometricos del transporte optimo yalgunas aplicaciones

Jorge Salazar

ESPOL - Facultad de Ciencias Naturales y Matematicas(Proyecto Prometeo - Senescyt)

Gaspard Monge, 1746-1818

“Memoire sur la theorie des deblais e de remblais”, 1781.

material extraıdo de la mina material utilizado en la construccion

(Tomado del libro Optimal Transport, Old and New de C. Villani.)

El problema original de Monge

El material extraıdo de varias minas debe sertransportado a los sitios de construccion.

La produccion de cada mina y la cantidad necesariaen cada construccion son conocidas.

A que destino se debe enviar el material de cadamina, de forma a minimizar el costo del transporte?

El costo en el problema de Monge era determinadopor el producto de la distancia veces la cantidad dematerial transportado.

Leonid Vital’evich Kantorovich, 1912-1986

Trabajo en varias areas de matematicas, desarrollo la programacionlineal, muy utilizada en economıa. Premio Nobel en economıa en1975, compartido con T. Koopmans.

En los anos 1940’s desarrollo:

I Teorema de la dualidad: minimizar costo = maximizarganancia.

I Conjuntos cıclicamente monotonos.

I Distancia entre medidas (planes de tranferencia).

I funciones concavas/convexas en el sentido del costo.

Solo anos mas tarde: coneccion con el problema de Monge.

1980’s

I John Mather: Medidas estacionariasminimizantes son soluciones de un problemavariacional. Sistemas dinamicos Lagrangianos.

I Yann Brenier: Define operadores de proyeccionsobre transformaciones preservando la medida,en mecanica de fluidos incompresibles, a travesde un emparejamiento optimo. Ecuacionesdiferenciales parciales.

I Mike Cullen: Ecuaciones semi-geostroficas enfrentes atmosfericos. Reinterpretacion delcambio de variable de Hoskins en terminos delemparejamiento optimo y la minimizacion comouna condicion de estabilidad.

Nuevo milenio

Objetivo:Descripcion cualitativa del transporte optimo.

L. Caffarelli, C. Evans, W. Gangbo, R. McCann yotros trabajaron en describir mejor la estructura deltransporte optimo y encontraron otras aplicaciones.F. Otto introduce un formalismo ligado a lageometrıa diferencial.

En la actualidad existe una interaccion muyfructıfera entre el transporte optimo, la geometrıa,el analisis funcional y las ecuaciones diferenciales.

Exactamente que es el transporte optimo?

Transporte de que?

Transporte de medidas! Medidas de probabilidad

Intuitivamentemente, una medida es un objeto que nospermite integrar (sumar). Por ejemplo, la medida de longitud,es decir la nocion de longitud, no la longitud comoresultado de la medicion de un objeto unidimensional.

Integrando, obtenemos nuevas medidas. La medida de massa,por ejemplo, se obtiene integrando (sumando) la densidadsobre un volumen.

La temperatura se “mide”... Sin embargo, la temperatura noes una medida, ya que no se puede sumar: Podemos hablar dela temperatura en tal o cual punto de esta sala, no podemoshablar de la “cantidad total” de temperatura en la sala. Porotro lado, el calor (o energıa calorıfica) si es una medida.

Medidas de probabilidad (discusion heurıstica)Una medida de probabilidad es un sistema que asigna, a cadaevento (=parte del todo), un “peso” o “proporcion” , llamadamedida del evento, que es un numero real entre 0 y 1 (no tieneunidades).La union de dos eventos disjuntos tiene su medida igual a la sumade las medidas de los dos eventos individuales. El conjunto todotiene medida 1 y el conjunto vacıo tiene medida 0.

16 bolas cada una con “peso” 1/16

La paradoja de Bertrand

Consideremos una circunferencia de radio 2 cm yescojamos una cuerda de esta circunferencia al azar.

Cual es la probabilidad de que esta cuerda intersecteel cırculo concentrico de radio 1 cm?

Tres interpretaciones/tres soluciones

El frase “la cuerda intersecta el cırculo interior” no es un eventoen el sentido de las probabilidades, en cuanto no se determine elespacio de probabilidad y la medida de probabilidad.

Espacio de probabilidad

El ejemplo de Bertrand nos muestra que debemosdefinir cuidadosamente lo que queremos decircuando decimos “al azar.”Para eso, introduzimos un espacio de probabilidad.Empezando por definir un conjunto Ω (no vacıo) yuna familia de subconjuntos de Ω con una ciertaestructura, que interpretamos como “eventos”(todo lo que puede suceder).

σ−algebra

es una familia de subconjuntos de Ω, denotemoslaU , con las siguientes propiedades:

1. ∅ ∈ U y Ω ∈ U .

2. Si A ∈ U , entonces Ω \ A ∈ U .

3. Si A1,A2 ∈ U , entonces A1 ∪ A2 ∈ U .

4. Si A1,A2, ... ∈ U , entonces⋃∞

i=1 Ai ∈ U .

Les elementos de U se llaman eventos.

Espacios de probabilidad finitos

Normalmente, cuando el espacio es finito, U es la familia de todoslos subsconjuntos.

16 bolas (numeradas), U tiene 216 elementos!

Medida de probabilidad

es toda funcion P : U → [0, 1] que verifica

1. P(∅) = 0 y P(Ω) = 1.

2. Si A1,A2 ∈ U y A1 ∩ A2 = ∅, entonces

P (A1 ∪ A2) = P (A1) + P (A2) .

3. Si A1,A2, · · · ∈ U y Ai ∩ Aj = ∅, para todoi 6= j , entonces

P

( ∞⋃k=1

Ak

)=

∞∑k=1

P (Ak) .

Valor medio/esperanza matematica

Cuando integramos una variable aleatoria (funcion numerica) conrespecto a una medida de probabilidad, no obtenemos el total,obtenemos el “promedio”, que en probabilidades se conoce comovalor medio o esperanza matematica.Ejemplo: Supongamos que calentamos todas las bolas a una ciertatemperatura y dejamos que se enfrıen por irradiacion del calor. Lacantidad de calor irradiado (en el primer segundo) es unapropriedad de cada bola. El valor medio del calor irradiado porcada bola es:∑

bolas

calor irradiado por la bola × “peso” de la bola

Transformaciones y medida imagenSi a las bolas de la urna anterior “asociamos” su color, obtenemosun nuevo espacio (conjunto) de 8 elementos (colores). Laproporcion de bolas de cada color es una medida de probabilidadsobre el espacio de colores. A esta medida se la conoce comomedida imagen.

Transporte de la medida

La medida original es transportada hacia la medida imagen.

c/ bola rep. 1/16 del total colores con proporciones diferentes

Cambio de variable

Si para fines de trasmision del calor, las bolas sediferencian unicamente por el color, i.e. que lasbolas del mismo color tienen el mismo “coeficientede difusion”, entonces podemos encontrar el valormedio integrando sobre los colores:

∑colores

calor irradiado por c/bola color X × proporci on color X

El cambio de variable es una forma de emparejamiento y sera retomado

mas adelante.

Transporte de medidas/Ejemplos

Siempre que tenemos una transformacion de un espacio en otro,podemos transportar la medida del primer espacio sobre el segundo.

Transformacion = suma de los dos dıgitos

Ejemplos en el caso continuo

Ejemplos en el caso continuo

Transformaciones admisibles

Ahora, supongamos que las medidas estan fijas,tanto en el espacio de salida como en el de llegada.Consideramos todas las transformaciones quetransportan la primera medida en la segunda.Llamamos a estas transformaciones

transformaciones admisibles.

Ejemplo 1

Ejemplo 2

Transformaciones que conservan la medida

Sea T : (X , µ)→ X , si T#µ = µ, decimos Tconserva la medida. Mas explıcitamente, Tconserva la medida si para todo conjunto medibleA ⊂ X , tenemos

µ(T−1(A)) = µ(A).

Si consideramos que µ es la medida asociada tantoen el domınio como en la imagen, entonces T esadmisible si y solo si conserva la medida

Ejemplo

Costo del transporte

Nuevo elemento: El costo asociado con eltransporte de la “masa” de cada punto x ∈ X(espacio de salida) hacia cada punto y ∈ Y (espaciode llegada).i.e., a cada elemento del espacio producto(x , y) ∈ X ×Y asociamos el costo del transporte dex a y .

Ejemplo de costos

Costo total del transporte

En el ejemplo anterior, existen 34 = 81 transformaciones delespacio 00, 01, 10, 11 en el espacio 0, 1, 2.De entre ellas, 12 son admisibles. Es decir, exactamente 12transformaciones transportan la medida uniforme,

P1(00) = P1(10) = P1(01) = P1(11) = 1/4,

en la medida

P2(0) = P2(2) = 1/4, P2(1) = 1/2.

Las transformaciones admisibles son aquellas en que 0 y 2tienen exactamente una preimagen cada uno y 1 tieneexactamente dos preimagenes.

Ejemplo

en este caso, C(T ) = 1× 1/4 + 2× 1/4 + 2× 1/4 + 1× 1/4 = 2

El problema de Monge

A cada transformacion admisible T , asociamos elcosto total del transporte, denotado C(T ).

El problema de Monge consiste en encontrar unatransformacion admisible que minimize elcosto total del transporte.

Costo total mınimoEs facil ver que la transformacion siguiente (llamemosla T0)

minimiza el costo total, que es

C(T0) = 1× 1/4 + 2× 1/4 + 2× 1/4 + 1× 1/4 = 3/2

Note que en este caso, la aplicacion minimizante no es unica.

Ampliando el horizonte

El costo del transporte podrıa reduzirse sipermitimos que la “masa” del conjunto de salida sedisperse. (Partes de la produccion de un sitio vanpara diferentes destinos.)

Esto aumenta la posibilidad de que el problemaadmita una solucion. (Existen mas candidatos.)

Medidas sobre el espacio producto

Dispersion = medida sobre el espacio productoX × Y , siendo X y Y los espacios de salida yllegada, respectivamente.

X

Medidas marginales

Medida producto

Emparejamiento/Plan de transferencia

Supongamos que los espacios de salida y llegada,digamos (X , µ) y (Y , ν), son dados.

Una medida sobre el espacio producto X × Y , talque las medidas marginales sobre X y Y son µ y ν(respectivamente), se conoce con el nombre deplan de transferencia, tambien se lo llamaemparejamiento.

Emparejamiento/EjemploProblema: Siendo X = Y = [0, 1], el intervalo unidad con la medida de longitud, encontrar una medida sobre el

cuadrado unidad [0, 1]× [0, 1] de forma que ambas medidas marginales sean la medida de longitud en [0, 1].

Medidas admisibles/Nuevo problema

En vez de minimizar el costo sobre todas lastransformaciones admisibles, vamos a minimizar elcosto sobre todos los planes de transferencia(medidas admisibles sobre X × Y).

El costo asociado a una medida, digamos Π, sedefine de forma natural:

C(Π) =

∫X×Y

C (x , y)Π(dx , dy)

Objetivo:Minimizar C(Π), sobre todos los Π admisibles.

Planes de transferencia “deterministas”

Note que una transformacion admisible T : X → Y corresponde aun plan de transferencia “concentrado” en el grafico de T .

El nuevo problema es una extension del problema de Monge.

El costo optimo de transferencia

entre (X , µ) y (Y , ν) es (para los problemas deMonge y Monge-Kantorovich, resp.)

I (µ, ν) = inf C(T ) o J(µ, ν) = inf C(Π),

donde los ınfimos son tomados sobre las transf.admisibles en el 1er caso y sobre los planes detransferencia en el 2do.Siendo M-K una extension del problema de Monge,tenemos

J(µ, ν) ≤ I (µ, ν).

Plan de transferencia optimo

I En el contexto adecuado (espacios deprobabilidad metricos, costo semicontinuoinferiormente y otras hipotesis tecnicas), elproblema M-K siempre tiene solucion. i.e.Existe Π0 tal que

C(Π0) = J(µ, ν).

I Bajo ciertas condiciones, J(µ, ν) = I (µ, ν).

I Pocos son los casos en que podemos afirmar queel problema de Monge tiene solucion.

I En algunos casos podemos afirmar que elproblema de Monge no tiene solucion.

Como caracterizar un plan de transferencia optimo?

Existen dos nociones fundamentales

I Conjuntos cıclicamente monotonos. (Imposiblemejorar un plan sin recalcularlo completamente.)

I Problema dual de Kantorovich. (El punto devista del transportista.)

Cadena de panaderıas y cafeterıas

puntos rojos = panaderıas puntos azules = cafeterıas

Conjuntos cıclicamente monotonos

Γ ⊆ X × Y es cıclicamente monotono si para todafamilia (x1, y1), ..., (xN , yN) de elementos de Γ ,tenemos

N∑i=1

(xi , yi) ≤N∑i=1

(xi , yi+1)

Problema dual

Un transportista propone hacerse cargo del transporte. Compra elpan a ψ(x) en las panaderıas y lo vende en las cafeterıas a φ(y).Resultado: La cadena paga φ(y)−ψ(x) por el transporte de x a y .

El problema del transportista es maximizar la ganancia que es

G (ψ, φ) =

∫Yφ(y)ν(dy)−

∫Xψ(x)µ(dx),

manteniendose competitivo:

φ(y)− ψ(x) ≤ C (x , y), ∀(x , y)

Teorema de la dualidad de Kantorovich

Bajo hipotesis bastante generales, el problema dual tambien tienesolucion y

min

∫X×Y

C (x , y)Π(dx , dy) = max

∫Yφ(y)ν(dy)−

∫Xψ(x)µ(dx)

Π es optimo si y solo si esta concentrado en un conjuntocıclicamente monotono.

Existe un par (ψ, φ) tal que

φ(y)− ψ(x) = C (x , y)

en un conjunto de medida total con respecto al plan optimo.

Ademas, existe una caracterizacion geometrica en terminos de unanocion de concavidad/convexidad de las funciones ψ e φ adaptadaal costo.

Redes electricas

Redes electricas