Download pdf - Tema 2 Conjuntos convexos - Inicioverso.mat.uam.es/~joser.berrendero/cursos/Matematicas-IO/io-tema2... · Tema 2 Conjuntos convexos Jos e R. Berrendero Departamento de Matem aticas

Tema 2Conjuntos convexos

Jose R. Berrendero

Departamento de MatematicasUniversidad Autonoma de Madrid

Contenidos del tema 2

I Conjuntos convexos. Propiedades basicas y ejemplos.

I Cierre e interior de un conjunto convexo.

I Teorema de la proyeccion.

I Teoremas de separacion.

I Caracterizacion de puntos extremos y direcciones extremas deS = {x : Ax = b, x ≥ 0}.

I Teorema de representacion.

Conjuntos afines y convexos

y = θx1 + (1− θ)x2 = x2 + θ(x1 − x2), x1, x2 ∈ Rn.22 2 Convex sets

PSfrag replacements x1

x2

θ = 1.2θ = 1

θ = 0.6

θ = 0θ = −0.2

Figure 2.1 The line passing through x1 and x2 is described parametricallyby θx1 +(1− θ)x2, where θ varies over R. The line segment between x1 andx2, which corresponds to θ between 0 and 1, is shown darker.

an affine set contains every affine combination of its points: If C is an affine set,x1, . . . , xk ∈ C, and θ1 + · · ·+ θk = 1, then the point θ1x1 + · · ·+ θkxk also belongsto C.

If C is an affine set and x0 ∈ C, then the set

V = C − x0 = {x− x0 | x ∈ C}is a subspace, i.e., closed under sums and scalar multiplication. To see this, supposev1, v2 ∈ V and α, β ∈ R. Then we have v1 + x0 ∈ C and v2 + x0 ∈ C, and so

αv1 + βv2 + x0 = α(v1 + x0) + β(v2 + x0) + (1 − α− β)x0 ∈ C,

since C is affine, and α + β + (1 − α − β) = 1. We conclude that αv1 + βv2 ∈ V ,since αv1 + βv2 + x0 ∈ C.

Thus, the affine set C can be expressed as

C = V + x0 = {v + x0 | v ∈ V },i.e., as a subspace plus an offset. The subspace V associated with the affine set Cdoes not depend on the choice of x0, so x0 can be chosen as any point in C. Wedefine the dimension of an affine set C as the dimension of the subspace V = C−x0,where x0 is any element of C.

Example 2.1 Solution set of linear equations. The solution set of a system of linearequations, C = {x | Ax = b}, where A ∈ Rm×n and b ∈ Rm, is an affine set. Toshow this, suppose x1, x2 ∈ C, i.e., Ax1 = b, Ax2 = b. Then for any θ, we have

A(θx1 + (1 − θ)x2) = θAx1 + (1 − θ)Ax2

= θb+ (1 − θ)b

= b,

which shows that the affine combination θx1 + (1 − θ)x2 is also in C. The subspaceassociated with the affine set C is the nullspace of A.

We also have a converse: every affine set can be expressed as the solution set of asystem of linear equations.

I Conjunto afın: si x1, x2 ∈ S , entonces θx1 + (1− θ)x2 ∈ S ,para todo θ ∈ R.

I Conjunto convexo: si x1, x2 ∈ S , entoncesθx1 + (1− θ)x2 ∈ S , para todo θ ∈ [0, 1].

Ejemplos de conjuntos convexos

I Hiperplanos: S = {x : p>x = α}, donde p ∈ Rn, α ∈ R.

I Semiespacios: S = {x : p>x ≤ α}, donde p ∈ Rn, α ∈ R.

I Interseccion arbitraria de convexos: Si Si es convexo paratodo i ∈ I , entonces S =

⋂Ii=1 Si es un conjunto convexo.

I Un poliedro (interseccion finita de semiespacios) es unconjunto convexo. Por ejemplo, S = {x : Ax ≤ b, x ≥ 0} esun conjunto convexo.

I Una bola B(x , r) = {x ∈ Rn : ‖x − x‖ < r} es un conjuntoconvexo (para cualquier norma).

Combinaciones afinesCombinacion afın de x1, . . . , xk ∈ Rn:

y = λ1x1 + · · ·+ λkxk ,

donde λ1 + · · ·+ λk = 1.

Cierre afın de S :

afin(S) =

{k∑

i=1

λixi : xi ∈ S ,k∑

i=1

λi = 1

}.

I Un conjunto es afın si y solo S = afin(S).

I Un conjunto es afın si y solo si es la traslacion de unsubespacio vectorial (unico)

I La dimension afın de un conjunto es la dimension de su cierreafın (que a su vez es la dimension del correspondientesubespacio vectorial).

Combinaciones convexas y cierre convexo

Combinacion convexa de x1, . . . , xk ∈ Rn:

y = λ1x1 + · · ·+ λkxk ,

donde λ1 + · · ·+ λk = 1 y λi ≥ 0, para todo i = 1, . . . , n.

Cierre convexo de S :

conv(S) =

{k∑

i=1

λixi : xi ∈ S , λi ≥ 0,k∑

i=1

λi = 1

}.

I Un conjunto S es convexo si y solo si S = conv(S).

I conv(S) es el menor conjunto convexo que contiene a S .

Cierre convexo

−2 −1 0 1 2

−2

−1

01

2

−2 −1 0 1 2−

2−

10

12

Teorema de Caratheodory

Cualquier punto del cierre convexo de un conjunto de Rn se puedeponer como combinacion lineal convexa de a lo mas n + 1 puntosdel conjunto.

Teorema: Sea S ⊂ Rn. Si x ∈ conv(S), entonces x =∑n+1

i=1 λixi ,con

∑n+1i=1 λi = 1, λi ≥ 0, xi ∈ S , para todo i = 1, . . . , n + 1.

Demostracion: Sea x ∈ conv(S), entonces x =∑k

i=1 λixi , con∑k

i=1 λi = 1, λi > 0,xi ∈ S .

1. Si k ≤ n + 1, hemos terminado.

2. Si k > n + 1, x2 − x1, . . . , xk − x1 son linealmente dependientes.

3. Existen µi (alguno estrictamente positivo) tales que∑k

i=1 µixi = 0.

4. Tenemos que x =∑k

i=1(λi − αµi )xi , donde

α = min{λj/µj : µj > 0} := λr/µr > 0.

5. Hemos conseguido expresar x como combinacion convexa de k − 1 elementos.Volvemos al paso 1. En un numero finito de iteraciones habremos terminado.

Interior relativo

Sea S ⊂ Rn un convexo cuyo cierre afın es afin(S). El interiorrelativo de S se define como el conjunto de puntos x ∈ S talesque existe r > 0 con B(x , r) ∩ afin(S) ⊂ S .

I ¿Cual es el interior relativo de{x ∈ R3 : −1 ≤ x1 ≤ 1, −1 ≤ x2 ≤ 1, x3 = 0}?

Teorema: Un conjunto convexo no vacıo en Rn tiene interiorrelativo no vacıo.

Teorema: El interior de un conjunto convexo en Rn es vacıo si ysolo si el conjunto esta contenido en un hiperplano de Rn.

Cierre e interior de un conjunto convexo

Lema: Sea S ⊂ Rn un conjunto convexo con int(S) 6= ∅. Seax1 ∈ S , x2 ∈ int(S). Entonces, θx1 + (1− θ)x2 ∈ int(S), para todoθ ∈ [0, 1).

Demostracion: Sea y = θx1 + (1− θ)x2.

1. Existe ε > 0 tal que B(x2, ε) ⊂ S .

2. Sea y ∈ B(y , η), con η = ε(1− θ).

3. Como x1 ∈ S , existe x1 ∈ S tal que

‖x1 − x1‖ <η − ‖y − y‖

θ⇔ ‖y − y‖+ θ‖x1 − x1‖ < η.

4. Sea x2 = (y − θx1)/(1− θ)⇔ y = θx1 + (1− θ)x2.

5. Se verifica

‖x2 − x2‖ =‖y − θx1 − y + θx1‖

1− θ≤

1

1− θ(‖y − y‖+ θ‖x1 − x1‖) <

η

1− θ= ε.

6. Por 1 y 5, x2 ∈ S. Por 4, y ∈ S . Como B(y , η) ⊂ S , y ∈ int(S).

Cierre e interior de un conjunto convexo

1. Si S ⊂ Rn es convexo, entonces tanto int(S) como S sonconjuntos convexos.

2. Si S ⊂ Rn es convexo, entonces int(S) = int(S). Si ademasint(S) 6= ∅, entonces S = int(S).

3. Si S ⊂ Rn es convexo, entonces ∂S = ∂S .

Teorema de la proyeccion

Teorema: Sea S ⊂ Rn un conjunto convexo, no vacıo y cerrado.Sea y ∈ Rn. Existe un unico x ∈ S (la proyeccion de y sobre S)tal que

‖y − x‖ ≤ ‖y − x‖, para todo x ∈ S .

Ademas, x es la proyeccion de y sobre S si y solo si

(y − x)>(x − x) ≤ 0. (1)

I ¿Como queda la condicion (??) cuando S es un conjunto afın?

I La aplicacion P : Rn → S , que a cada y le hace correspondersu proyeccion P(y) sobre S , es continua.

Teorema del hiperplano separador

Teorema: Sea S ⊂ Rn un conjunto convexo, no vacıo y cerrado.Sea y /∈ S . Entonces existe p ∈ Rn, p 6= 0, y α ∈ R tales que

I p>x ≤ α, para todo x ∈ S .

I p>y > α

Demostracion:

1. Sea x la proyeccion de y sobre S .

2. Se verifica (y − x)>(x − x) ≤ 0, para todo x ∈ S .

3. Definimos p = y − x y α = p>x . Comprobamos que cumplenlas condiciones requeridas:

I Si x ∈ S , p>x = (y − x)>(x − x) + α ≤ α.I p>y = (y − x)>(y − x) + α = ‖y − x‖2 + α > α.

Teorema del hiperplano soporte

Teorema: Sea S ⊂ Rn un conjunto convexo con interior no vacıo.Sea x ∈ ∂S , la frontera de S . Entonces existe p ∈ Rn, p 6= 0, talque p>(x − x) ≤ 0, para todo x ∈ S .

Demostracion:

1. x /∈ int(S) = int(S).

2. Para todo k ∈ N, existe yk ∈ B(x , 1/k) ∩ Sc

3. Existe pk ∈ Rn, ‖pk‖ = 1, con p>k yk > p>k x para todo x ∈ S.

4. Tenemos yk → x . Para una subsucesion, pk → p con ‖p‖ = 1.

5. Tomando lımites en 3, p>(x − x) ≤ 0, para todo x ∈ S .

Separacion de dos convexos disjuntos

Teorema: Sean S1, S2 ⊂ Rn conjuntos convexos, no vacıos, talesque S1 ∩ S2 = ∅. Entonces existe p ∈ Rn, p 6= 0, tal que

inf{p>x : x ∈ S1} ≥ sup{p>x : x ∈ S2}.

Demostracion: La idea es considerar

S = {x ∈ Rn : x = x1 − x2, x1 ∈ S1, x2 ∈ S2}

y aplicar los teoremas de separacion.

Teoremas de la alternativa

Teorema (Gordan): Sea A una matriz m × n. Uno y solo uno delos sistemas siguientes tiene solucion:

I Ax < 0 para algun x ∈ Rn.

I A>p = 0, p ≥ 0 y p 6= 0 para algun p ∈ Rm.

Demostracion:

I (1) tiene solucion ⇒ (2) no la tiene.

Sea x la solucion de (1) y supongamos que p fuese una solucion de (2).Consideramos p>Ax .

I (1) no tiene solucion ⇒ (2) sı la tiene.

Los conjuntos S1 = {z ∈ Rm : z = Ax , x ∈ Rn} y S2 = {z ∈ Rm : z < 0} sonconvexos, no vacıos y disjuntos. Existe p 6= 0 con p>Ax ≥ p>z para x ∈ Rn yz < 0. Se demuestra que p resuelve (2).

Teoremas de la alternativa

Ejemplo: ¿Existen x1, x2 y x3 tales que x1 + x2 + x3 < 0, x1 > 0 y2x1 − x2 − x3 < 0?

Teorema (Farkas): Sea A una matriz m× n y c ∈ Rn. Uno y solounos de los sistemas siguientes tiene solucion:

1. Ax ≤ 0 y c>x > 0 para algun x ∈ Rn.

2. A>y = c , y ≥ 0 para algun y ∈ Rm.

Demostracion: Ejercicio

Probar que (1) no tiene solucion cuando (2) sı la tiene es muy facil. Cuando (2) no

tiene solucion considera S = {x ∈ Rn : x = A>y , y ≥ 0} y observa que c /∈ S .

Teorema de representacion de poliedros

Los resultados hasta el final del tema se refieren al poliedroS = {x : Ax = b, x ≥ 0}, el conjunto factible de un problema deoptimizacion lineal (en forma estandar).

Suponemos que A es una matriz m × n (m < n) con rangor(A) = m.

Vamos a representar los puntos de S en terminos de los puntosextremos (vertices) de S y sus direcciones extremas.

Cualquier punto de S se puede expresar como unacombinacion convexa de sus puntos extremos mas unacombinacion lineal positiva de sus direcciones extremas.

Soluciones factibles basicas

Podemos dividir las columnas de A es dos grupos B y N, donde Bes m ×m con r(B) = m.

Ax = b ⇔ (B,N)

(xBxN

)= b ⇔ BxB + Nxn = b

Si hacemos xN = 0, xB = B−1b y se verifica B−1b ≥ 0, obtenemosunos puntos especiales de S que se llaman soluciones factiblesbasicas.

Algunas soluciones del sistema compatible indeterminado Ax = b,con r(A) = r(A, b) = m < n se consiguen fijando n −m incognitascomo 0 y despejando las m incognitas restantes. Si estassoluciones son no negativas, son soluciones factibles basicas.

Puntos extremos

Definicion: Sea S ⊂ Rn un conjunto convexo no vacıo. Se diceque x ∈ S es un punto extremo de S si x = λx1 + (1− λ)x2, conx1, x2 ∈ S , λ ∈ (0, 1), implica que x = x1 = x2.

Es decir, x es un punto extremo si no esta en el interior (relativo)del segmento definido por otros dos puntos del conjunto.

Piensa ejemplos de conjuntos convexos: con un unico puntoextremo, con un numero finito mayor que uno de puntos extremos,con infinitos puntos extremos, sin puntos extremos.

Direcciones extremas

Definicion: Sea S ⊂ Rn un conjunto convexo no vacıo. Se diceque d ∈ Rn, d 6= 0, es una direccion de S si para todo x ∈ S ypara todo λ ≥ 0, se cumple x + λd ∈ S .

¿Que condiciones caracterizan las direcciones deS = {x : Ax = b, x ≥ 0}?

Definicion: Sea S ⊂ Rn un conjunto convexo no vacıo. Se diceque d ∈ Rn, d 6= 0, es una direccion extrema de S sid = λ1d1 + λ2d2, con d1, d2 direcciones de S , λ1, λ2 > 0, implicaque d1 = αd2, para algun α > 0.

Piensa ejemplos de conjuntos convexos: con dos direccionesextremas, con una unica direccion extrema, sin direccionesextremas.

Caracterizacion de puntos extremos

Teorema: x es un punto extremo de S si y solo si x es unasolucion factible basica.

Demostracion: (⇐) Ejercicio. Demostramos (⇒).

1. Reordenando las coordenadas x = (x1, . . . , xk , 0, . . . , 0)>, con xi > 0. Spg.k ≥ 1 (el caso x = 0 es trivial).

2. Reordenamos igual las columnas de A: A = (a1, . . . , ak , resto de columnas).

3. Veamos que a1, . . . , ak son linealmente independientes. Si no fuera ası existirıaun vector λ 6= 0 tal que Aλ = 0.

4. Para α > 0 suficientemente pequeno, x1 = x + αλ y x2 = x − αλ pertenecen aS ⇒ x = (x1 + x2)/2 no es punto extremo.

5. Si k < m, anadimos columnas de manera que las columnas deB = (a1, . . . , ak , ak+1, . . . , am) formen una base.


La demostracion implica que un punto extremo no puede tenermas de m coordenadas estrictamente positivas. El recıproco no escierto (veremos algun ejemplo mas adelante en los ejercicios).

Si una solucion factible basica tiene k < m coordenadasestrictamente positivas se llama solucion factible basicadegenerada.

En el caso degenerado puede haber dos bases distintas B y B ′ querepresenten el mismo punto extremo (¿por que?).


Teorema: El numero de puntos extremos de S es finito(¿Por que?)

Teorema: S tiene al menos un punto extremo.(La demostracion es muy parecida a la del teorema deCaratheodory.)

Ejemplo: Obtener las soluciones factibles basicas del problema:

minimizar −x1 + 2x2

s.a. x1 + 2x2 ≤ 22x1 + x2 ≤ 1

x1 ≥ 0x2 ≥ 0

Caracterizacion de direcciones extremas

Es facil demostrar que d es una direccion de S si y solo si Ad = 0 yd ≥ 0. El resultado siguiente caracteriza las direcciones extremas:

Teorema: d ∈ Rn es una direccion extrema de S si y solo siA = (B,N), donde B es una matriz m ×m basica, de manera que

B−1aj ≤ 0 para alguna de las columnas de N y d = α(−B−1aj

ej

)para algun α > 0, donde ej ∈ Rn−m es un vector de ceros salvo un1 en la posicion correspondiente a aj .

Demostracion:(⇐) Ejercicio.

(⇒) No la hacemos. Es totalmente analoga a la del teorema de caracterizacion de

puntos extremos.

Ejemplo: Calcula las direcciones extremas del conjunto

S = {(x1, x2) ∈ R2 : x2 − x1 ≤ 1, x2 ≤ 2, x1 ≥ 0, x2 ≥ 0}.

Teorema de representacion

Teorema: Sean x1, . . . , xk los puntos extremos de S y seand1, . . . , d` sus direcciones extremas. Entonces,

x ∈ S ⇔ x =k∑

i=1

λixi +∑j=1

µjdj ,

donde λi ≥ 0, µj ≥ 0,∑k

i=1 λi = 1.

Consecuencias:

I Si S es acotado, cualquier punto de S es combinacion linealconvexa de sus puntos extremos.

I S tiene al menos una direccion extrema si y solo si S no esacotado.

¿Es el numero de direcciones extremas siempre un numero finito?

Demostracion del teorema de representacion

C = {x ∈ Rn : x =k∑

i=1

λixi +∑j=1

µjdj , λi ≥ 0, µj ≥ 0,k∑

i=1

λi = 1}

I C 6= ∅I C es convexo y cerrado.

I C ⊂ S

I Para probar S ⊂ C , supongamos que existe z ∈ S con z /∈ C .

I Existe p ∈ Rn (p 6= 0) y α ∈ R tales que p>z > α y p>x ≤ α para todo x ∈ C .

I Como consecuencia, p>dj ≤ 0 y p>xi ≤ α⇒ p>z > p>xi , i = 1, . . . , k.

I Sea x el punto extremo tal que p>x = maxi p>xi .

I Consideramos la particion A = (B,N) en parte basica y no basicacorrespondiente a x .

I Se comprueba 0 < p>z − p>x = (p>N − p>B B−1N)zN , lo que implica que para

algun j > m se tiene zj > 0 y pj − p>B B−1aj > 0.

I Se demuestra que yj := B−1aj � 0. (Por reduccion al absurdo ya que si yj ≤ 0,

entonces dj =(−yj

ej

)es una direccion extrema y por tanto pj − p>B B−1aj ≤ 0.)

Demostracion del teorema de representacion

I Definimos el vector

x =(b

0

)+ α

(−yjej

),

donde b = B−1b y α = min{

biyij

: yij > 0}

:= bryrj> 0.

I Comprobamos x ∈ S , xr = 0, xj > 0.

I Las columnas a1, a2, . . . , ar−1, ar+1, aj son linealmente independientes, es decir,x es un punto extremo de S.

I Pero p>x = p>x + α(pj − p>B B−1aj ) > p>x .

I Una contradiccion ya que habıamos supuesto p>x = maxi p>xi .