32
Cap´ ıtulo 6 Controlabilidad y Observabilidad. Estabilizaci´ on 6.1. Controlabilidad: definiciones Vamos a comenzar con una definici´ on muy general del concepto de controlabilidad para abarcar todo tipo de sistemas de control. En la Lecci´ on 4 vimos que para definir un sistema de control necesitamos: 1. Un conjunto de tiempos T que puede ser continuo o discreto. 2. Un conjunto U en el que las funciones de entrada toma sus valores: u(⋅) ∶ T → U . 3. Un conjunto U que define el espacio de funciones de entrada: u(⋅) ∈ U . 4. El espacio de estados X : conjunto en el que est´ an definidos los estados del sistema. 5. El conjunto Y que define el espacio donde las salidas est´ an definidas: y(⋅) ∶ T → Y 6. La funci´ on de transici´ on de estados ψ ∶ T×T× X ×U → X (t, t 0 ,x,u(⋅)) x(t)= ψ(t; t 0 ,x,u(⋅)) 7. La funci´ on de salidas: y(t)= η(t, x(t),u(t)), t ∈T . 135

Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

Capıtulo 6

Controlabilidad y Observabilidad.Estabilizacion

6.1. Controlabilidad: definiciones

Vamos a comenzar con una definicion muy general del concepto de controlabilidadpara abarcar todo tipo de sistemas de control. En la Leccion 4 vimos que para definir unsistema de control necesitamos:

1. Un conjunto de tiempos T que puede ser continuo o discreto.

2. Un conjunto U en el que las funciones de entrada toma sus valores: u(⋅) ∶ T → U .

3. Un conjunto U que define el espacio de funciones de entrada: u(⋅) ∈ U .

4. El espacio de estados X: conjunto en el que estan definidos los estados del sistema.

5. El conjunto Y que define el espacio donde las salidas estan definidas: y(⋅) ∶ T → Y

6. La funcion de transicion de estados

ψ ∶ T × T ×X × U Ð→ X(t, t0, x, u(⋅)) → x(t) = ψ(t; t0, x, u(⋅))7. La funcion de salidas: y(t) = η(t, x(t), u(t)), t ∈ T .

135

Page 2: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

136 Controlabilidad y Observabilidad. Estabilizacion

Ası pues, identificaremos cada sistema con la 7-upla Σ = (T , U,U ,X,Y,ψ, η) y nos referi-remos a ella como el sistema Σ. Al conjunto T ×X lo llamaremos el espacio de eventos (ofases ,[5]) y hablaremos del evento o fase (t, x) ∈ T ×X para indicar que x es el estado delsistema en el instante t.

Con estos conceptos ya introducidos podemos dar una definicion del concepto decontrolabilidad. Mas adelante lo concretaremos para sistemas definidos por ecuacionesdiferenciales.

Definicion 6.1 Dado un sistema de control Σ = (T , U,U ,X,Y,ψ, η), sea (t0, x0) ∈ T ×Xun evento dado.

(a) El evento (t, x) ∈ T ×X es alcanzable desde el evento (t0, x0) ∈ T ×X si existe uncontrol u(⋅) ∈ U definido en [t0, t] tal que ψ(t; t0, x0, u(⋅)) = x; es decir, si, siendo elestado del sistema x0 en el instante t0, existe un control definido en [t0, t] tal que elestado del sistema en t es x. Tambien se dice que (t0, x0) puede controlarse hasta(t, x).

(b) Σ se dice que es controlable en el intervalo [t0, t1] si para cualquier par de estadosx0, x1 ∈X el evento (t0, x0) es controlable hasta el evento (t1, x1).

(c) Si x0, x1 ∈ X, T ∈ T , (T ≥ 0) y existen t0, t1 ∈ T tales que t1 − t0 = T y (t1, x1)es alcanzable desde (t0, x0) entonces se dice que el estado x1 es alcanzable desde elestado x0 en tiempo T . Tambien se dice que x0 es controlable hasta x1 en tiempoT . Si cualquier estado x1 ∈ X es alcanzable desde (controlable hasta) cualquier otroestado x2 ∈ X en tiempo T entonces se dice que el sistema Σ es alcanzable(controlable) en tiempo T .

(d) El estado x1 es alcanzable desde el estado x0 (o x0 es controlable hasta x1) si existeT ∈ T tal que x1 es alcanzable desde x0 en tiempo T ( o x0 es controlable hastax1 en tiempo T ). Si cualquier estado x1 ∈ X es alcanzable desde (controlable hasta)cualquier otro estado x2 ∈ X entonces se dice que el sistema Σ es alcanzable(controlable).

Un conjunto que juega un papel muy importante en la teorıa de control es el conjuntode alcanzabilidad (o controlabilidad)

Definicion 6.2 Sea x ∈X y T ∈ T . Al conjunto

RT (x) ∶= z ∈X ∶ z es alcanzable desde x en tiempo T.se le llama conjunto de estados alcanzables desde x en tiempo T . Y el conjunto dealcanzabilidad desde x se define como

R(x) ∶= z ∈X ∶ z es alcanzabe desde x en algun tiempo .

Page 3: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

6.1 Controlabilidad: definiciones 137

Por lo tanto, el conjunto de alcanzabilidad desde x es:

R(x) = ⋃T ∈T RT (x).

Una consecuencia inmediata de estas definiciones es

Proposicion 6.3 El sistema Σ es alcanzable/controlable (en tiempo T ) si y solo si R(x) =X (respectivamente RT (x) =X) para todo x ∈X.

Para sistemas diferenciales: T ⊂ R, U ⊂ Rm, X ⊂ Rn , Y ⊂ Rp son conjuntos abiertos,U = PC(T ,X) es el conjunto de funciones continuas a trozos, η ∶ T ×X × U → Y es unafuncion continua y x(t) = ψ(t; t0, x0, u(⋅)) es la solucion del sistema

x(t) = f(t, x(t), u(t)), t ∈ T , t ≥ t0 (6.1)

que cumple la condicion inicial x(t0) = x0. Teniendo en cuenta la Definicion 6.1 podemosdar la siguiente definicion de controlabilidad/alcanzabilidad de los sistemas diferenciales.

Definicion 6.4 Sea x0 ∈X y t0 ∈ T .(i) Un estado x1 ∈ X se dice que es alcanzable/controlable desde x0 en tiempo T si

existe un control u(⋅) ∈ PC([t0, t0 + T ],X) tal que la solucion del sistema (6.1) conla condicion inicial x(t0) = x0 esta definita en [t0, t0 + T ] y cumple x(t0 + T ) = x1.

(ii) Un estado x1 ∈ X se dice que es alcanzable/controlable desde x0 si es alcanza-ble/controlable para algun tiempo T .

(iii) El sistema (6.1) se dice que es alcanzable/controlable desde x0 en [t0, tf ] si cualquierestado x1 ∈X es alcanzable/controlable desde x0 en tiempo T = tf − t0.

El sistema (6.1) se dice que es alcanzable/controlable controlable en [t0, tf ] si para cual-quier par de estados x0, x1 ∈ X la solucion del sistema (6.1) con la condicion inicialx(t0) = x0 cumple que x(t1) = x1.

La estructura de los conjuntos de alcanzabilidad para los sistemas diferenciales nolineales no tiene por que ser, en general, simple; y desde luego para los sistemas no linealescasi nunca es un subespacio vectorial incluso cuando X = Rn y U = Rm. Por ejemplo, parael sistema

x1(t) = u1(t)2

x2(t) = u2(t)2

con U = R2, el conjunto de alcanzabilidad desde el origen es el primer cuadrante del plano:

R((0,0)) = R+ ×R+ = (x1, x2) ∈ R2 ∶ x1 ≥ 0, x2 ≥ 0.Veremos que, sin embargo, para los sistemas lineales los conjuntos de alcanzabilidad sonsubespacios vectoriales.

Terminamos esta seccion con la siguiente definicion que completa la nocion de contro-labilidad/estabilidad:

Page 4: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

138 Controlabilidad y Observabilidad. Estabilizacion

Definicion 6.5 Se dice que el sistema (6.1) es accesible desde x si su conjunto de al-canzabilidad desde x, R(x), tiene interior no vacıo. Y se dice que fuertemente accesibledesde x si RT (x) tiene interior no vacıo para todo T > 0.

6.2. Controlabilidad de los sistemas lineales

Para los sistemas lineales hay criterios que permiten detectar con cierta facilidadcuando son controlables. En primer lugar, para los sistemas lineales el conjunto RT (x)de los estados alcanzables desde x en tiempo T tiene una estructura muy deseable. Lademostracion se puede dar para los sistemas lineales mas generales sin mas que hacer usode las propiedades vistas en la Leccion 4.

Proposicion 6.6 Si Σ = (T , U,U ,X,Y,ψ, η) es un sistema de control lineal y x0 ∈ Xentonces Rt(x0) es un subespacio vectorial para todo t ∈ T .

Demostracion.- Recordemos que x ∈ Rt(x0) si existen t0, t1 ∈ T y u(⋅) ∈ U definidaen [t0, t] tales que x = ψ(t; t0, x0, u(⋅)). Supongamos ahora que x, y ∈ Rt(x0) y α,β ∈ K(un cuerpo arbitrario). Como X es un espacio vectorial sobre K, y x, y ∈ X tenemos queαx + βy ∈X. Ahora bien, como x, y ∈Rt(x0):

x(t) = ψ(t; t0, x0, u(⋅)), y(t) = ψ(t; t0, x0, v(⋅)), u(⋅), v(⋅) ∈ U ,y entonces, como U es tambien un espacio vectorial sobre K, w(⋅) = αu(⋅) + βv(⋅) ∈ U y

αx(t) + βy(t) = αψ(t; t0, x0, u(⋅)) + βψ(t; t0, x0, v(⋅)) = ψ(t; t0, x0, αu(⋅) + βv(⋅)) == ψ(t; t0, x0,w(⋅)).porque ψ(t; t0, ⋅, ⋅) ∶ X × U → X es una aplicacion lineal. Ademas, si u(⋅) y v(⋅) estandefinidas en [t0, t] tambien w(⋅) esta definida en este intervalo. En consecuencia αx(t) +βy(t) ∈Rt(x0) y ası, Rt(x0) es un subespacio vectorial de X.

Nos centramos ahora en los sistemas diferenciales lineales. Dado que la controlabilidadsolo afecta a la relacion entre los estados y los controles o entradas, podemos considerarsolo la ecuacion de estados

x(t) = A(t)x(t) +B(t)u(t) t ∈ T , (6.2)

que con la condicion inicial x(t0) = x0, t0 ∈ T , tiene como unica solucion:

x(t) = ψ(t; t0, x0, u(⋅)) = Φ(t, t0)x0 + ∫ t

t0Φ(t, s)B(s)u(s)ds. (6.3)

Denotamos con R(tf , t0) = ∫ tf

t0Φ(tf , s)B(s)u(s)ds ∶ u(⋅) ∈ U (6.4)

Page 5: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

6.2 Controlabilidad de los sistemas lineales 139

que es el subespacio de los estados alcanzables en tiempo tf − t0 desde el estado x0 = 0en t0. En efecto, x1 es alcanzable desde x0 = 0 en tiempo tf − t0 si y solo si existe uncontrol u(⋅) tal que la solucion del sistema (6.2) con la condicion inicial x(t0) = 0 cumplex(tf) = x1. Y, teniendo en cuenta (6.3), (6.4) y que x0 = 0, esto sucede si y solo si

x1 = x1 −Φ(t, t0)x0 = ∫ tf

t0Φ(tf , s)B(s)u(s)ds ∈R(tf , t0).

En otras palabras, el estado del sistema en el instante tf es x1 si y solo si el vectorx1−Φ(t, t0)x0 esta en el subespacio R(tf , t0). Ahora bien, por la Definicion 6.4, el sistema(6.2) es controlable en [t0, tf ] si para cualesquiera estados x0, x1 ∈ Rn se tiene que x(t0) = x0

y x(tf) = x1. En consecuencia

Proposicion 6.7 El sistema (6.2) es controlable en [t0, tf ] ⊂ T si y solo si R(tf , t0) = Rn.

El subespacio vectorial R(tf , t0) admite una caracterizacion algebraica independien-te de los controles. Esto es muy util para saber cuando un sistema es controlable peroes, al mismo, tiempo una propiedad muy especial de los sistemas lineales. Comenzamosdefiniendo una aplicacion lineal cuya imagen es R(tf , t0):

Lr ∶ PC([t0, tf ],Rn) Ð→ Rn

u(⋅) → ∫ tf

t0Φ(tf , s)B(s)u(s)ds (6.5)

Para lo que sigue puede consultarse [5, Sec. A7]. El conjunto PC([t0, t1],Rn) es un espaciode Hilbert con el producto escalar definido por

< u, v >2= ∫ tf

t0u(t)T v(t)dt, u, v ∈ PC([t0, t1],Rn),

y Lr es una aplicacion lineal continua. La aplicacion adjunta se define como L∗r ∶ Rn Ð→PC([t0, tf ],R) tal que:

< z,Lru >=< L∗rz, u >2, z ∈ Rn, u ∈ PC([t0, tf ],Rn),donde < ⋅, ⋅ > es el producto escalar habitual en Rn. Observese que se ha cambiado la nota-cion utilizada en los capıtulos precedentes (sobre todo en el Capıtulo 2) para el productoescalar. A partir de ahora usaremos indistintamente una notacion u otra segun conven-

ga: para x = (x1, . . . , xn), y = (y1, . . . , yn) vectores de Rn, x ⋅ y =< x, y >= xT y = n∑i=1

xiyi.

Por lo general, cuando las expresiones de los vectores involucrados son largas, se usarapreferentemente la notacion < ⋅, ⋅ >.

Ası pues:

< z,Lru >= zT ∫ tf

t0Φ(tf , s)B(s)u(s)ds = ∫ tf

t0(B(s)TΦ(tf , s)T z)T u(s)ds.

Page 6: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

140 Controlabilidad y Observabilidad. Estabilizacion

Y < L∗rz, u >2= ∫ tf

t0(L∗r(s))Tu(s)ds.

Por lo tanto, siL∗r ∶ Rn Ð→ PC([t0, tf ],Rn)

z → B(⋅)TΦ(tf , ⋅)T z (6.6)

se cumple < z,Lru >=< L∗rz, u >2.

Ahora bien, para operadores de rango finito tenemos el siguiente resultado ([5, Sec.A.7.4])

Lema 6.8 Sea F = R o C. Sea H un espacio de Hilbert sobre F y A ∶ H → Fm unaaplicacion lineal continua con A∗ ∶ Fm →H como aplicacion adjunta. Entonces,

(i) A∗, AA∗ y A∗A son aplicaciones lineales continuas.

(ii) H = ImA∗ ⊕KerA, Fm = ImA⊕KerA∗.

(iii) Ker(AA∗) = KerA∗, Im(AA∗) = ImA.

(iv) Ker(A∗A) = KerA, Im(A∗A) = ImA∗.

Como consecuencia de este Lema tenemos que L∗r es una aplicacion lineal continua yImLrL

∗r = ImLr. Ahora bien, ImLr =R(tf , t0) y

ImLrL∗r = Im(∫ tf

t0Φ(tf , t)B(t)B(t)TΦ(tf , t)Tdt) .

Se denota

W (tf , t0) = ∫ tf

t0Φ(tf , t)B(t)B(t)TΦ(tf , t)Tdt (6.7)

y se le llama matriz grammiana del sistema (6.2). Observese que esta matriz es simetrica(hermıtica si trabajaramos con sistemas de ecuaciones con coeficientes en C). Ademas,para cualquier x ∈ Rn se tiene

xTW (tf , t0)x = ∫ tf

t0xTΦ(tf , t)B(t)B(t)TΦ(tf , t)Txdt =

= ∫ tf

t0∥B(t)TΦ(tf , t)Tx∥2

dt ≥ 0.

Esto significa que la matriz W (tf , t0) ≥ 0; i.e., es semidefinida positiva (o definida nonegativa). Por lo tanto, los valores propios de W (tf , t0) son numeros reales (incluso en elcaso complejo) no negativos. Y son todos positivos si y solo si detW (tf , t0) ≠ 0 porque eldeterminante de una matriz es el producto de sus valores propios.

Toda esta discusion y la Proposicion 6.7 nos permite concluir:

Teorema 6.9 Con las notaciones introducidas se tiene:(i) R(tf , t0) = ImW (tf , t0).

Page 7: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

6.2 Controlabilidad de los sistemas lineales 141

(ii) El sistema (6.2) es controlable en [t0, tf ] ⊂ T si y solo si detW (tf , t0) ≠ 0.

(iii) El sistema (6.2) es controlable en [t0, tf ] ⊂ T si y solo si W (tf , t0) es definidapositiva.

Este importante Teorema nos dice que la controlabilidad de los sistemas lineales no de-pende de los controles que se puedan escoger: el sistema es o no controlable en [t0, tf ]independientemente de u(⋅); solo depende de la matriz de transicion de estados (es decir,de las soluciones del sistema autonomo x(t) = A(t)x(t)) y de la matriz de controles oentradas B(t). Por esto la siguiente definicion tiene sentido

Definicion 6.10 Dadas dos matrices A(⋅) ∈ PC([t0, tf ],Rn×n), B(⋅) ∈ PC([t0, tf ],Rn×m),diremos que el par (A(⋅),B(⋅)) es controlable si el sistema (6.2) es controlable en [t0, tf ].

Hay otra observacion importante que conviene tener presente. La matriz grammianadepende del intervalo [t0, tf ]. Es perfectamente posible que sea definida positiva en esteintervalo (y, por lo tanto, el sistema controlable en [t0, tf ]) y no lo sea en algun intervalomas peqeno (y, por lo tanto, el sistema no puede controlarse en un intervalo de tiempomenor). Y del mismo modo puede no ser definida positiva en [t0, tf ] y serlo en [t0, t′f ] cont′f > tf . Respecto a t0 se pueden hacer comentarios similares.

El Teorema 6.9 nos proporciona una caracterizacion de la controlabilidad de un sistemapero no nos da una funcion de control que nos permita llevar el estado x0 en el instantet0 a cualquier otro x1 en el instante t1. Ese es nuestro siguiente cometido. En realidad,vamos a encontrar un control que nos sirve para controlar el sistema (6.2) en [t0, tf ] con uncoste (o “energıa”) mınimo en el sentido que se explica a continuacion. Para una funcionu(⋅) ∈ PC([t0, tf ],R) definimos su coste como

< u(⋅), u(⋅) >2= ∫ tf

t0u(t)Tu(t)dt = ∫ tf

t0∥u(t)∥2

2dt = ∥u(⋅)∥22 (6.8)

Observese que estamos usando el mismo sımbolo para la norma euclıdea (la que esta dentrode la integral) y la norma L2 de la funcion u(⋅), pero no hay peligro de confusion.

Primero tenemos

Proposicion 6.11 Si el sistema (6.2) es controlable y x0, x1 ∈ Rn entonces la funcion

u(t) = B(t)TΦ(tf , t)TW (tf , t0)−1(x1 −Φ(tf , t0)x0) (6.9)

hace que la solucion del sistema x(t) cumpla x(t0) = x0y x(tf) = x1.

Demostracion.- El problema de condiciones iniciales

x(t) = A(t)x(t) +B(t)u(t)x(t0) = x0 t ∈ [t0, tf ] (6.10)

Page 8: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

142 Controlabilidad y Observabilidad. Estabilizacion

tiene una unica solucion:

ψ(t; t0, x0, u(⋅)) = Φ(t, t0)x0 + ∫ t

t0Φ(tf , s)B(s)u(s)ds.

Debemos comprobar que ψ(tf ; t0, x0, u(⋅)) = x1. En efecto,

ψ(tf ; t0, x0, u(⋅)) =

= Φ(tf , t0)x0 + ∫ tf

t0Φ(tf , s)B(s)B(s)TΦ(tf , s)TW (tf , t0)−1(x1 −Φ(tf , t0)x0)ds =

= Φ(tf , t0)x0 + [∫ tf

t0Φ(tf , s)B(s)B(s)TΦ(tf , s)Tds]W (tf , t0)−1(x1 −Φ(tf , t0)x0) =

= Φ(tf , t0)x0 + (x1 −Φ(tf , t0)x0) = x1.

El control u(⋅) de (6.9) transfiere el evento (t0, x0) al evento (t1, x1) pero no es elunico posible control que lo hace. De hecho, si v(⋅) ∈ KerLr donde Lr es la aplicacionlineal de (6.5) entonces u(⋅) = u(⋅) + v(⋅) tambien transfiere el estado x0 en el instante t0al estado x1 en el instante tf . En otras palabras, tal conjunto de controles es la variedadlineal (subespacio afın) u(⋅) +KerLr ⊂ PC([t0, tf ],Rn). Nuestro objetivo ahora es probarque la funcion de u(⋅) + KerLr de menor coste (6.8) es precisamente la funcion u(⋅) de(6.9).

Proposicion 6.12 Sean x0, x1 ∈ Rn y sea u(⋅) ∈ PC([t0, tf ],Rn) una funcion tal que elproblema

x(t) = A(t)x(t) +B(t)u(t)x(t0) = x0 t ∈ [t0, tf ] (6.11)

cumple x(tf) = x1. Y sea u(⋅) la funcion de (6.9). Entonces

∥u(⋅)∥2 ≤ ∥u(⋅)∥2 (6.12)

con igualdad si y solo si u(t) = u(t) para casi todo t ∈ [t0, tf ].Demostracion.- Sea v(⋅) ∶= u(⋅)−u(⋅) y sean x(t) = ψ(t; t0, x0, u(⋅)) y x(t) = ψ(t; t0, x0, u(⋅))las soluciones de (6.10) y (6.11), respectivamente. Entonces

∫ tf

t0Φ(tf , t)B(s)v(t)dt = ∫ tf

t0Φ(tf , t)B(s)u(t)dt − ∫ tf

t0Φ(tf , t)B(s)u(t)dt =

= (x(tf) −Φ(tf , t0)x0) − (x(tf) −Φ(tf , t0)x0).Commo x(tf) = x1 = x(tf),

∫ tf

t0Φ(tf , t)B(s)v(t)dt = 0. (6.13)

Page 9: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

6.2 Controlabilidad de los sistemas lineales 143

Ahora, como u(t)T v(t) = v(t)T u(t),∥u(⋅)∥2

2 = ∫ tf

t0u(t)Tu(t)dt = ∫ tf

t0(u(t) + v(t))T (u(t) + v(t))dt =

= ∫ tf

t0∥u(t)∥2dt + ∫ tf

t0∥v(t)∥2dt + 2∫ tf

t0u(t)T v(t)dt. (6.14)

Pero por (6.9), teniendo en cuenta que W (tf , t0)T =W (tf , t0) por ser simetrica,

∫ tf

t0u(t)T v(t)dt = [(x1 −Φ(tf , t0)x0]T W (tf , t0)−1∫ tf

t0Φ(tf , t)B(t)v(t)dt.

De (6.13) obtenemos ∫ tf

t0u(t)T v(t)dt = 0; y ası

∥u(⋅)∥22 = ∥u(⋅)∥2

2 + ∥v(⋅)∥22 (6.15)

De aquı se sigue (6.12) y ∥u(⋅)∥22 = ∥u(⋅)∥2

2 si y solo si

∫ tf

t0∥u(t)∥2

2dt = ∫ tf

t0∥u(t)∥2

2dt,

lo cual equivale a que ∥u(t)∥2 = ∥u(t)∥2 para casi todo t ∈ [t0, tf ] tal y como se deseabademostrar.

Notemos que la condicion (6.15) es el teorema de Pitagoras debido a que ∫ tf

t0u(t)T v(t)dt =

0 significa que u(⋅) y v(⋅) son ortogonales. En realidad, la funcion u(⋅) de la variedadu(⋅)+KerLr de coste mın

u(⋅)∈(u(⋅)+ImLr) ∥u(⋅)∥ es, por definicion, aquella que esta a menor dis-

tancia de la funcion 0 ∈ PC([t0, tf ],Rn). La teorıa general nos dice que tal funcion debeestar en el subespacio ortogonal a KerLr. Pero (KerLr)⊥ = ImL∗r por lo que u(⋅) = L∗rξpara algun ξ ∈ Rn. Recordando la definicion de Lr en (6.5), vemos que la funcion u(⋅) en(6.9) tiene esta precisa forma. La Proposicion 6.12 nos dice que es en la funcion u(⋅) dondese alcanza el mınimo coste.

La condicion de controlabilidad a traves de la matriz grammiana exige conocer lamatriz de transicion de estados. Cuando las matrices A(t) y B(t) son de clase C∞ en[t0, tf ] ; es decir, son diferenciables infinitamente, se puede dar un criterio para sabersi un sistema es controlable en terminos de las matrices A(t) y B(t) del sistema. Comopreparacion para ello vamos a construir una sucesion de matrices de la siguiente forma:Para t ∈ [t0, tf ]:

K0(t) ∶= B(t)Kj(t) ∶= −A(t)Kj−1(t) + Kj−1(t), j = 1,2, . . .

(6.16)

Lema 6.13 Si las matrices A(t) y B(t) del sistema (6.2) son infinitamente diferenciablesen un intervalo I ⊂ R y Φ(t, t0) es su matriz de transicion de estados correspondiente a lacondicion inicial x(t0) = x0, se tiene

∂j

∂sj(Φ(t, s)B(s)) = Φ(t, s)Kj(s), j = 0,1,2, . . . (6.17)

Page 10: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

144 Controlabilidad y Observabilidad. Estabilizacion

Observese que si A(t) y B(t) son infinitamente diferenciables en I, Φ(t, t0) tambienlo es.

Demostracion.- Lo haremos por induccion sobre j = 0,1,2, . . .. Si j = 0 no hay nadaque demostrar porque K0(s) = B(s). Supongamos entonces que (6.17) es verdadero hastaj y calculemos

∂j+1

∂sj+1(Φ(t, s)B(s)) = ∂

∂s( ∂j∂sj

(Φ(t, s)B(s))) = ∂

∂s(Φ(t, s)Kj(s)).

Como Φ(t, s)−1 = Φ(s, t), y recordando que para cualquier matriz invertible X(t) se tiened

dtX(t)−1 = −X(t)−1X(t)X(t)−1:

∂j+1

∂sj+1(Φ(t, s)B(s)) = ∂

∂s(Φ(s, t)−1Kj(s)) =

= −Φ(s, t)−1 ∂

∂s(Φ(s, t))Φ(s, t)−1Kj(s) +Φ(s, t)−1K(s)

Por ser Φ(s, t) la matriz de transicion de estados del sistema x(t) = A(t)x(t), es solucion

del sistema diferencial matricial X(t) = A(t)X(t). Es decir,∂

∂s(Φ(s, t)) = A(s)Φ(s, t). Por

lo tanto,

∂j+1

∂sj+1(Φ(t, s)B(s)) = −Φ(s, t)−1A(s)Φ(s, t)Φ(s, t)−1Kj(s) +Φ(s, t)−1K(s) =

= −Φ(t, s)A(s)Kj(s) +Φ(t, s)K(s) == Φ(t, s)(−A(s)Kj(s) + K(s)) = Φ(t, s)Kj+1(s)tal y como se deseaba demostrar.

Una consecuencia de (6.17) es que

Kj(t) = [ ∂j∂sj

(Φ(t, s)B(s))]s=t

porque al ser Φ(t, t) = In tenemos

[ ∂j∂sj

(Φ(t, s)B(s))]s=t = Φ(t, t)Kj(t) =Kj(t).

En lo que sigue usaremos la siguiente notacion: Para t ∈ T y q ≥ 0 entero

Mq(t) = [K0(t) K1(t) ⋯ Kq(t)] . (6.18)

Teorema 6.14 Supongamos que las matrices A(t) ∈ Fn×n y B(t) ∈ Fn×m del sistema(6.2) son infinitamente diferenciables en un intervalo I ⊂ R y sea [t0, tf ] ⊂ I. Si existentc ∈ [t0, tf ] y un entero q ≥ 0 tal que rangMq(tc) = n entonces el sistema (6.2) es controlableen [t0, tf ].

Page 11: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

6.2 Controlabilidad de los sistemas lineales 145

Demostracion.- Si el sistema (6.2) no es controlable en [t0, tf ] entonces la matrizgrammiana del sistema W (tf , t0) en (6.7) no es invertible. Esto implica que existe unvector y ∈ Rn, y ≠ 0 tal que W (tf , t0)y = 0. Y tambien yTW (tf , t0)y = 0. Entonces

0 = yTW (tf , t0)y = ∫ tf

t0yTΦ(tf , t)B(t)B(t)TΦ(tf , t)T ydt = ∫ tf

t0∥B(t)TΦ(tf , t)T y∥2

2dt

y por lo tanto yTΦ(tf , t)B(t) = 0 para todo t ∈ [t0, tf ]. Sea tc ∈ [t0, tf ] cualquiera yz = Φ(tf , tc)T y. Entonces z ≠ 0 porque y ≠ 0 y Φ(tf , tc) es invertible. Ademas yT =zTΦ(tf , tc)−1 = zTΦ(tc, tf) y

0 = yTΦ(tf , t)B(t) = zTΦ(tc, tf)Φ(tf , t)B(t) = zTΦ(tc, t)B(t), ∀t ∈ [t0, tf ].En particular, para t = tc tenemos que Φ(tc, tc) = In y por lo tanto

0 = zTΦ(tc, tc)B(tc) = zTB(tc) = zTK0(tc).Ahora, derivando sucesivamente zTΦ(tc, t)B(t) = 0 respecto de t tenemos que, por el Lema6.13, para j = 1,2, . . .

0 = ∂j

∂tj(zTΦ(tc, t)B(t)) = zTΦ(tc, t)Kj(t).

Para t = tc obtenemos0 = zTKj(tc), j = 1,2 . . .

En definitiva para todo q ≥ 0

0 = zT [K0(tc) K1(tc) ⋯ Kq(tc)] = zTMq(tc),lo que implica que para todo q ≥ 0 y todo tc ∈ [t0, tf ], rangMq(tc) < n. Llegamos ası a unacontradiccion.

Debe observarse que si se cumple rangMq(tc) = n para algun tc ∈ I y q ≥ 0 entoncesel sistema es controlable en cualquier intervalo que contenga a tc y este contenido en I.

Por otra parte, la condicion suficiente rangMq(tc) = n para algun tc ∈ [t0, tf ] y algunentero q ≥ 0 no es, en general, necesaria para que el sistema lineal (6.2) sea controlable.Un ejemplo de sistema controlable que no cumple esta condicion puede verse en [6, pag.11]. Sin embrago, tenemos:

Teorema 6.15 Si A(t) y B(t) son funciones matriciales analıticas en un intervalo I ⊂ Rentonces la condicion rangMq(tc) = n para algun tc ∈ [t0, tf ] ⊂ I y algun entero q ≥ 0 esnecesaria y suficiente para que el sistema (6.2) sea controlable en [t0, tf ].

Demostracion.- Recordemos que una funcion es analıtica en un punto si es desarro-llable en serie de potencias en un entorno de ese punto. Recordemos tambien que en elcaso complejo ser analıtica y diferenciable es lo mismo.

Page 12: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

146 Controlabilidad y Observabilidad. Estabilizacion

Ya sabemos que la condicion rangMq(tc) = n para algun tc ∈ [t0, tf ] ⊂ I y algunentero q ≥ 0 es suficiente para que (6.2) sea controlable. Veamos que tambien es suficiente.Para ello supongamos que el sistema (6.2) es controlable en [t0, tf ] y que A(t), B(t) sonfunciones matriciales analıticas en I ⊃ [t0, tf ]. Supongamos que, sin embargo, para todot ∈ [t0, tf ] y todo entero q ≥ 0, rangMq(t) < n. Sean tc ∈ [t0, tf ] y q ≥ 0, y para este tc y qdefinamos

Pq = z ∈ Rn ∶ zTMq(tc) = 0Como rangMq(tc) < n, tenemos que Pq ≠ 0 para todo q ≥ 0. Es claro que Pq es unsubespacio vectorial de R para cada q ≥ 0 y que se cumple

P0 ⊇ P1 ⊇ P2 ⊇ ⋯Las dimensiones de estos subespacios forman un sucesion no creciente de modo que debehaber un ındice r tal que 0 ≠ Pr = Pr+1 = ⋯. Escojamos un vector z ∈ Pr de modo quezTMj(tc) = 0 para j = 0,1,2, . . .. En particular,

zTB(tc) = zTK0(tc) = zTM0(tc) = 0.

Y si y = Φ(t0, tc)T z entonces yTΦ(t0, tc)B(tc) = 0. Ahora bien, si A(t) y B(t) son analıticasen I tambien Φ(t0, t) lo es. Por lo tanto, si definimos F (t) = Φ(t0, t)B(t) tenemos queF (t) es analıtica en I. Pero zTF (tc) = 0. Teniendo en cuenta que zTMj(tc) = 0 para

j = 0,1,2, . . . se puede ver que zT [ dj

dtjF (t)]

t=tc= 0 de modo que por ser F (t) analıtica

concluımos que zTF (t) = 0 para todo t en un entorno de tc. Como esto sucede para todotc ∈ [t0, tf ], por continuacion analıtica, llegamos a que zTF (t) = 0 para todo t ∈ [t0, tf ]. Esdecir, zTΦ(t0, t)B(t) = 0 para t ∈ [t0, tf ].

Ahora, como el sistema es controlable en [t0, tf ], existe un control u(⋅) que lleva elsistema en el estado x(t0) = z al estado x(tf) = 0. Es decir

0 = Φ(tf , t0)z + ∫ tf

t0Φ(tf , s)B(s)u(s)ds.

Despejando z:

z = −∫ tf

t0Φ(tf , t0)−1Φ(tf , s)B(s)u(s)ds = −∫ tf

t0Φ(t0, tf)Φ(tf , s)B(s)u(s)ds =

= −∫ tf

t0Φ(t0, s)B(s)u(s)ds.

Teniendo en cuenta que ztΦ(t0, t)B(t) = 0 para t ∈ [t0, tf ],zT z = −∫ tf

t0zTΦ(t0, s)B(s)u(s)ds = 0.

En conclusion, ∥z∥22 = zT z = 0, que implica z = 0; llegando a una contradiccion.

Page 13: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

6.2 Controlabilidad de los sistemas lineales 147

Para los sistemas invariantes en el tiempo

x(t) = Ax(t) +Bu(t), t ∈ T (6.19)

con A ∈ Rn×n y B ∈ Rn×m, podemos aplicar directamente la condicion rangMq(tc) = ndirectamente para obtener una caracterizacion de la controlabilidad especialmente sencillade expresar.

Teorema 6.16 El sistema (6.19) es controlable en [t0, tf ] ⊂ T si y solo si

rang [B AB A2B ⋯ An−1B] = n (6.20)

A la matriz C(A,B) = [B AB A2B ⋯ An−1B]se le llama matriz de controlabilidad del sistema (6.19) o del par (A,B).

Demostracion.- Por una parte, para todo t ∈ T , K0(t) = B, y por induccion es facilver que Kj(t) = (−1)jAjB, j = 1,2, . . .. Entonces, la condicion rangMq(tc) = n para alguntc ∈ [t0, tf ] ⊂ I y algun entero q ≥ 0 es equivalente a que

rang [B AB A2B ⋯ AqB] = npara algun entero q ≥ 0. Ahora bien, para j = 0,1,2, . . .

rang [B AB A2B ⋯ AjB] ≤ rang [B AB A2B ⋯ Aj+1B] ,de modo que si q < n,

rang [B AB A2B ⋯ AqB] = n⇔ rang [B AB A2B ⋯ An−1B] = n.Y si q ≥ n entonces, por el Teorema de Cayley-Hamilton1, An = α0In+α1A+⋯+αn−1A

n−1.En consecuencia,

rang [B AB A2B ⋯ AqB] = rang [B AB A2B ⋯ An−1B] .Es decir, el sistema (6.19) (o el par (A,B)) es controlable si y solo si rang C(A,B) = n.

La controlabilidad de los sistemas invariantes en el tiempo es independiente del inter-valo concreto. Por eso, se suele decir que el sistema es controlable sin referencia a ningunintervalo.

Ejemplo 6.17 Consideremos el sistema

x1 = x2, x2 = u1El teorema de Hamilton-Cayley establece que toda matriz satisface su polinomio caracterıstico; es

decir, si det(λIn −A) = λn + an−1λn−1 +⋯ + a1λ + a0 entonces An + an−1A

n−1 +⋯ + a1A + a0In = 0

Page 14: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

148 Controlabilidad y Observabilidad. Estabilizacion

Sea T > 0. Calculese el control de coste mınimo que lleva el sistema de x(0) = [−10] a

x(T ) = 0; y hallese el estado del sistema par dicho control en todo instante t.

Observamos, en primer lugar, que el sistema es controlable porque A = [0 10 0

], b = [01]

y

C(A, b) = [0 11 0

]que es una matriz de rango 2.

Calculamos ahora una matriz fundamental de soluciones. Como A esta en forma de

Jordan, eAt = [1 t0 1

]. Entonces,

Φ(t, t0)x0 = eA(t−t0)x0 = [1 t − t00 1

]La matriz grammiana para t0 = 0 y tf = T serıa:

W (T,0) = ∫ T

0[1 s0 1

] [01] [0 1] [1 0

s 1]ds = ∫ T

0[s2 ss 1

]ds = [T 3/3 T 2/2T 2/2 T

] .Ahora

u(t) = B(t)TΦ(T, t)TW (T,0)−1 ([00] −Φ(T,0) [−1

0]) = 6

T 3(T − 2t)

Finalmente, usando la formula de variacion de las constantes:

x(t) = eAtx0 + ∫ t

0eA(t−s)bu(s)ds =

= [1 t0 1

] [−10] + ∫ t

0[1 t − s0 1

] [01] 6

T 3(T − 2s)ds

= [−10] + 6

T 3 ∫ t

0[Tt − 2ts − sT + 2s2

ts − s2 ]ds

= [−10] + 6

T 3

⎡⎢⎢⎢⎢⎣−1

3t3 + T

2t2

Tt − t2⎤⎥⎥⎥⎥⎦ =

⎡⎢⎢⎢⎢⎢⎢⎢⎣−2( t

T)3 + 3( t

T)2 − 1

6

T( tT− ( t

T)2)

⎤⎥⎥⎥⎥⎥⎥⎥⎦Obteniendo ası la formula de los estados del sistema para t ∈ [0, T ]. Ademas, claramente,x(T ) = 0.

Ejemplo 6.18 Vimos en el Ejemplo 5.18 que las ecuaciones del sistema que se obtiene allinealizar el sistema que rige el movimiento de un satelite en orbita alrededor de la Tierra

Page 15: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

6.2 Controlabilidad de los sistemas lineales 149

en torno a la orbita estacionaria son de la forma (ver (5.33)) x(t) = Ax(t) +Bu(t) con

A =⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

0 1 0 0

3Ω2 0 0 2R0Ω0 0 0 1

0 −2Ω

R00 0

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦, B =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

0 01 00 0

01

R0

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦siendo R0 la distancia a la orbita geoestacionaria y Ω la velocidad angular de la Tierra. Elvector de controles esta formado por las fuerzas que mediante propulsores se puede ejercerdesde el satelite en las direcciones radial y tangencial con el objetivo de compensar las per-turbaciones que pudieran desviar el satelite de su orbita estacionaria: u(t) = (Fr(t), Fθ(t)).

En este ejemplo, se puede calcular “a mano” la matriz de controllabilidad del sistema:

C(A,B) =⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

0 0 1 0 0 2 Ω −Ω2 0

1 0 0 2 Ω −Ω2 0 0 −2 Ω3

0 0 01

R0−2 Ω

R00 0 −4 Ω2

R0

01

R0−2 Ω

R00 0 −4 Ω2

R0

2 Ω3

R00

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦pudiendose comprobar que las cuatro primeras columnas son linealmente independientes.Es decir, rang C(A,B) = 4 y por lo tanto el sistema linealizado es controlable. Calcular sumatriz grammiana o el control de coste mınimo que permite controlarlo en todo momentoes una tarea en la que la ayuda de software se hace imprescindible. En la funcion deMATLAB controlsatelite.m, que se puede encontrar en la pagina web del curso, secalcula la funcion de control de coste mınimo que lleva el sistema desde el reposo en t = 0 al

estado x = [0 0 1 0]T en t = 1. Tambien se explora lo que sucederıa si alguno de los dospropulsores del satelite dejaran de funcionar (¿serıa el sistema linealizado controlable?).

6.2.1. La descomposicion de Kalman y el test PBH

Para los sistemas lineales invariantes en el tiempo, el text del rango (6.20) es muyatractivo por su aparente sencillez. Sin embargo adolece de un defecto practico: las colum-nas de la matriz de controlabilidad tienden a ser cada vez mas linealmente dependientes.Esto es debido a que para cualquier vector x ∈ Rn la sucesion de subespacios < Akx >tiende a un subespacio < y > que es A-invariante; es decir, tal que Ay = αy. Por lo tanto,cerca de la convergencia Akx esta, aproximadamente, en la misma direccion que Ak+1x.Por supuesto, el valor de k para el que esto vaya a suceder puede ser muy grande pero haymatrices (mal condicionadas por lo general) para las que el test del rango puede fallar.Consideremos, por ejemplo, el siguiente codigo de MATLAB:

>> P=hilb(7); D=diag(10.^(-7:-1)); A=P^(-1)*D*P;

>> b=rand(7,1);C=b;

Page 16: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

150 Controlabilidad y Observabilidad. Estabilizacion

>> for j=1:6

C=[C A*C(:,j)];

end

>> rank(C)

ans =

6

En el se define P como una matriz de Hilbert. Se sabe que estas matrices son invertiblespero muy mal condicionadas. En aritmetica exacta los valores propios de A son los de D:10−7, 10−6,. . . , 10−1. La matriz A es, por lo tanto, no derogatoria. Esto significa que paracasi todo vector x ∈ Fn, x ≠ 0, los vectores x, Ax,. . . , A6x son linealmente independientes.Ası pues, el rango de la matriz de controlabilidad de (A, b) deberıa ser 7 para cualquierb ≠ 0 escogido aleatoriamente. Sin embargo, el valor que devuelve MATLAB es 6.

Este problema puede ser difıcilmente evitable cuando la matriz A esta muy mal con-dicionada pero hay otra forma de caracterizar la controlabilidad de (A,B) que puede ser,en ocasiones, mas efectiva. Para demostrar su validez haremos uso de la llamada descom-posicion de Kalman. El objetivo de esta descomposicion es separar, para los sistemas queno son controlables, los estados controlables de los que no lo son.

En esta seccion consideraremos sistemas lineales invariantes en el tiempo:

x(t) = Ax(t) +Bu(t)y(t) = Cx(t) +Du(t) , t ∈ T = R, (6.21)

con A ∈ Rn×n, B ∈ Rn×m, C ∈ Rp×n, D ∈ Rp×m.

Teorema 6.19 (Descomposicion de Kalman) Sea r = rang C(A,B) el rango de lamatriz de controlabilidad del sistema (6.21). Existe una matriz invertible T ∈ Rn×n tal que

T−1AT = [A1 A2

0 A3] , T −1B = [B1

0] (6.22)

donde A1 ∈ Rr×r, B1 ∈ Rr×m y (A1,B1) es controlable.

Demostracion.- Consideremos la matriz de controlabilidad del sistema (6.21):

C(A,B) = [B AB ⋯ An−1B] .Como esta matriz tiene rango r, hay r columnas en ella que son linealmente independientes.Escojamos en C(A,B) r columnas linealmente independientes y formemos con ellas unamatriz T1 ∈ Rn×r. Las columnas de T1 forman un sistema libre de vectores de Rn quepuede ampliarse hasta una base de Rn . Sea T2 ∈ Rn×(n−r) la matriz cuyas columnas seanlos vectores anadidos de forma que T = [T1 T2] sea una matriz invertible.

Observemos lo siguiente: si tj es la j-esima columna de T1 entonces es de la formatj = Akbi para algunos enteros i = 1, . . . ,m y k = 0,1, . . . , n−1 siendo bi la i-esima columna

Page 17: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

6.2 Controlabilidad de los sistemas lineales 151

de B. Por lo tanto, Atj = Ak+1bi. Si k + 1 ≤ n − 1 entonces Atj es una columna de C(A,B)y, en consecuencia, es una combinacion lineal de las columnas de T1. Y si k + 1 = n, porel teorema de Hamilton-Cayley, Ak+1 = An = α0In + α1A + . . . + αn−1A

n−1, de modo queAtj = Anbi es una combinacion lineal de las columnas de C(A,B) y, ası, una combinacionlineal de las columnas de T1. En definitiva, Atj es una combinacion lineal de las columnasde T1. Es decir, Atj = T1aj , 1 ≤ j ≤ r. Si A = [a1 ⋯ ar] entonces,

A [T1 T2] = [AT1 AT2] = [T1 T2] [A1 A2

0 A3] .

Ademas, como las columnas de B son combinaciones lineales de las de T1:

B = [T1 T2] [B1

0] .

Esto prueba (6.21). Ademas:

r = rang C(A,B) = rang(T −1C(A,B)) = rang C(T−1AT,T −1B) == rang [B1 A1B1 ⋯ An−1

1 B1

0 0 ⋯ 0] = rang [B1 A1B1 ⋯ Ar−1

1 B1

0 0 ⋯ 0] ,

donde, en la ultima igualdad, hemos usado de nevo el Teorema de Hamilton-Cayley. Asıpues rang C(A1,B1) = r y por consiguiente (A1,B1) es controlable.

El resultado de este teorema se puede interpretar de la siguiente forma: existe uncambio reversible de las variables de estado:

z = T−1x

de modo que, respecto de estas nuevas variables el sistema (6.21) se escribe como sigue:

⎧⎪⎪⎪⎨⎪⎪⎪⎩z1(t) = A1z1(t) +A2z2(t) +B1u(t)z2(t) = A3z2(t)y(t) = C1z1(t) +C2z2(t) +Du(t) (6.23)

con [C1 C2] = CT . Tal y como muestra la Figura 6.1 mediante este cambio de variablehemos extraıdo un subsistema de orden n − r al que no le afecta el control u y, que por lotanto, es completamente incontrolable (solo tiene componente de movimiento libre). A lamatriz de este sistema (en la nueva base) A3 la llamaremos parte incontrolable del sistema.

Notese que el sistema (6.23) tambien puede verse como un sistema controlable en los

estados z1(t) en los que la funcion de control es [z2(t)u(t) ] con matriz de control [A2 B1]

y con matrices de salida C1 y [C2 D], siendo z2(⋅) la solucion del sistema libre z2(t) =A3z2(t).

La descomposicion de Kalman es la base de la demostracion del siguiente resultadoque caracteriza la controlabilidad de los sistemas lineales sin hacer uso de la matriz decontrolabilidad.

Page 18: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

152 Controlabilidad y Observabilidad. Estabilizacion

(z1)(A1,B1,C1,0) ++

(z2)(A3,0,C2,0)

u(t) C1z1 y(t)A2z2

C2z2

Figura 6.1: Extraccion de la parte incontrolable

Teorema 6.20 (Test PBH2) El sistema (6.21) es controlable si y solo si para todo λ ∈Λ(A) (el conjunto de los valores propios de A) se tiene

rang [λIn −A B] = n. (6.24)

Demostracion.- Veamos que si no se cumple la condicion (6.24) entonces la matriz decontrolabilidad no tiene rango completo. En efecto, supongamos que para algun λ ∈ Λ(A)el rango de [λIn −A B] no es n. Esto significa que las filas de esta matriz son linealmente

dependientes; es decir, existe un vector v ∈ Rn×1 tal que

vT [λIn −A B] = 0.

Entonces vt(λIn −A) = 0 y vTB = 0 simultaneamente. Es decir,

vTA = λvT y vTB = 0.

Pero entonces vTAB = λvTB = 0 e inductivamente vTAkB = (vTA)Ak−1B = λvTAk−1B = 0.Esto implica que

vT [B AB ⋯ An−1B] = 0,

y por lo tanto, las filas de la matriz de controlabilidad son linealmente dependientes. Deaquı se deduce que rang C(A,B) < n y el sistema no es controlable.

Recıprocamente, si el sistema no fuera controlable, por el Teorema de la Descomposi-cion de Kalman, existirıa una matriz invertible T para la que se verificarıa la condicion(6.22). Como A y

[A1 A2

0 A3]

son semejantes, ambas matrices tienen los mismos valores propios. Sea λ0 ∈ Λ(A3) unvalor propio de A3. Entonces det(λ0In−r − A3) = 0 siendo r = rang C(A,B). Como las

2Popov-Belevitch-Hautus

Page 19: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

6.3 Observabilidad de los sistemas lineales 153

filas de λ0In−r − A3 son linealmente dependientes, existe un vector v1 ∈ R(n−r)×1 tal que

vT1 (λ0In−r −A3) = 0. Si ponemos v = [0 v1]T ∈ Rn×1 tenemos que

vT [λ0Ir −A1 −A2 B1

0 λ0In−r −A3 0] = 0.

Por consiguiente,

rang [λ0Ir −A1 −A2 B1

0 λ0In−r −A3 0] < n.

Y como

T −1 [λ0In −A B] [T 00 Im

] = [λ0Ir −A1 −A2 B1

0 λ0In−r −A3 0] ,

tenemos que

rang [λ0In −A B] = rang [λ0Ir −A1 −A2 B1

0 λ0In−r −A3 0] .

Es decir, rang [λ0In −A B] < n. Pero los valores propios de A3 son valores propios deA porque det(λIn − A) = det(λIr − A1)det(λn−r − A3). En definitiva, si (A,B) no escontrolable, hay al menos un valor propio, λ0, de A tal que rang [λ0In −A B] < n; encontradiccion con (6.24).

Una consecuencia interesante del test PBH, que se estudia en la relacion de problemas,es que permite determinar el mınimo numero de controles necesarios para controlar unsistema lineal invariante en el tiempo.

6.3. Observabilidad de los sistemas lineales

El concepto de observabilidad esta relacionado con la capacidad de determinar elestado del sistema a partir de las salidas (conocido el control). Con precision:

Definicion 6.21 El sistema

x(t) = A(t)x(t) +Bu(t),y(t) = C(t)x(t) +D(t)u(t) t ∈ T (6.25)

se dice que es observable en [t0, tf ] si para cualquier entrada u(⋅) ∈ PC([t0, tf ],Rm) elestado inicial del sistema x(t0) = x0 esta determinado de manera unica por la salida y(t)en [t0, tf ].

Un par de observaciones:

Una vez conocido el estado inicial del sistema, el estado del mismo queda determinadode forma unica en [t0, tf ] porque la solucion del problema de condiciones inicialesx(t) = A(t)x(t) +Bu(t), x(t0) = x0 tiene solucion unica.

Page 20: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

154 Controlabilidad y Observabilidad. Estabilizacion

La respuesta del sistema es

y(t) = CΦ(t, t0)x0 + ∫ t

t0CΦ(tf , s)B(s)u(s)ds +D(t)u(t) (6.26)

El segundo termino yr(t) = ∫ t

t0CΦ(tf , s)B(s)u(s)ds+D(t)u(t) es la respuesta forza-

da del sistema y, conocidas las matrices del sistema y la entrada, se puede “calcular”independientemente de x0. Por lo tanto, una vez obtenida yr la relacion entre y(t)y x0 queda determinada por la respuesta del sistema a una entrada cero. Es decir,podemos centrarnoss sin perdida de generalidad en :

y(t) = C(t)Φ(t, t0)x0, para t ∈ [t0, tf ]. (6.27)

De la misma forma que el subespacio de estados alcanzables R(t0, tf) ((6.4)) jugaba unpapel fundamental en el estudio de la controlabilidad de (6.25), y lo caracterizabamoscomo la imagen de la aplicacion lineal Lr definida en (6.5), tambien para la observabilidadtenemos un subespacio y aplicacion lineal que juegan un papel similar. Especıficamente,definimos

Lo ∶ Rn Ð→ PC([t0, tf ],Rp)x0 → C(⋅)Φ(⋅, t0)x0∣[t0,tf ] (6.28)

donde C(⋅)Φ(⋅, t0)x0∣[t0,tf ] representa la restriccion de C(⋅)Φ(⋅, t0)x0 al intervalo [t0, tf ].Definicion 6.22 El estado x0 se dice que es inobservable en [t0, tf ] si la respuesta delsistema a la entrada 0 con la condicion inicial x(t0) = x0 es cero en [t0, tf ]. En otraspalabras, si

y(t) = C(t)Φ(t, t0)x0 = 0 para t ∈ [t0, tf ].Decir que x0 es inobservable en [t0, tf ] equivale a decir que x0 ∈ KerLo; en otras

palabras, el conjunto de estados inobservables en [t0, tf ] es el subespacio KerLo. En con-secuencia tenemos

Proposicion 6.23 El sistema (6.25) es observable en [t0, tf ] si y solo si KerLo = 0.

Ahora bien, vimos que para la aplicacion lineal Lr definida en (6.5) por Lr(u(⋅)) =∫ tf

t0Φ(tf , s)B(s)u(s)ds, su aplicacion adjunta es ( ver (6.6)): L∗r(z) = B(⋅)TΦ(tf , ⋅)T z.

Como para aplicaciones lineales continuas definidas en espacios de Hilbert se tiene que laadjunta de la adjunta de una aplicacion lineal es la propia aplicacion lineal ([5, Sec. A.7.3])tenemos que

L∗o ∶ PC([t0, tf ],Rp) Ð→ Rn

v(⋅) → ∫ tf

t0Φ(t, t0)TC(t)T v(t)dt (6.29)

Page 21: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

6.3 Observabilidad de los sistemas lineales 155

Por otra parte, por el Lema 6.8, KerL∗oLo = KerLo, ImL∗oLo = ImL∗o y tambienImLo ⊕KerLo = Rn. Observemos finalmente que

ImL∗oLo = Im(∫ tf

t0Φ(t, t0)TC(t)TC(t)Φ(t, t0)dt) .

Se denota con

M(tf , t0) = ∫ tf

t0Φ(t, t0)TC(t)TC(t)Φ(t, t0)dt (6.30)

y se le llama matriz grammiana de observabilidad. Su parecido con la matriz grammianade controlabilidad W (tf , t0) es mas que evidente. Como W (tf , t0), M(tf , t0) es una ma-triz simetrica semidefinida positiva, y es definida positiva (detM(tf , t0) ≠ 0) si y solo siImL∗oL0 = Rn. En consecuencia,

Teorema 6.24 El sistema (6.25) es observable en [t0, tf ] si y solo si detM(tf , t0) ≠ 0.

Es destacable, de nuevo, el gran parecido de las caracterizaciones de controlabilidad delTeorema 6.9 y de observabilidad del Teorema 6.24. Diremos mas sobre ello mas adelante.

Corolario 6.25 Supongamos que el sistema (6.25) es observable en [t0, tf ].(i) Si y(⋅) es la respuesta del sistema a una entrada nula en [t0, tf ] con la condicion

inicial x(t0) = x0 entonces

∥y(⋅)∥2 = x0TM(tf , t0)x0.

(ii) Si y(⋅) es la respuesta del sistema a una entrada nula en [t0, tf ] entonces

x0 = (L∗oLo)−1L∗oy(⋅) =M(tf , t0)−1∫ tf

t0Φ(t, t0)TC(t)T y(t)dt.

Demostracion.- (i) Para t ∈ [t0, tf ], y(t) = C(t)Φ(t, t0)x0 de modo que

∥y(⋅)∥22 = ∫ tf

t0y(t)T y(t)dt = ∫ tf

t0x0TΦ(t, t0)TC(t)TC(t)Φ(t, t0)x0dt =

= x0T (∫ tf

t0Φ(t, t0)TC(t)TC(t)Φ(t, t0)dt)x0 = x0TM(tf , t0)x0.

(ii) Teniendo en cuenta la definicion de Lo en (6.28), tenemos

y(⋅) = Lox0 en [t0, tf ].Dado que el sistema es observable, por la Proposicion 6.23, L∗oLo es un isomorfismo en Rny como

L∗oy(⋅) = L∗oLox0,

Page 22: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

156 Controlabilidad y Observabilidad. Estabilizacion

obtenemos x0 = (L∗oLo)−1L∗oy(⋅). Ahora bien, L∗oy(⋅) = ∫ tf

t0Φ(t, t0)TC(t)T y(t)dt yM(tf , t0)

es la matriz de L∗oLo en las bases canonicas. En consecuencia

x0 =M(tf , t0)−1∫ tf

t0Φ(t, t0)TC(t)T y(t)dt (6.31)

tal como se deseaba demostrar.

Recordando que KerLo∗Lo = KerLo y que, la matriz de L∗oLo en las bases canonicasde Rn es la matriz grammiana M(tf , t0), tenemos

Corolario 6.26 El subespacio de estados inobservables en [t0, tf ] es KerM(tf , t0).

Al igual que para los sistemas controlables hay criterios basados en rangos de matricesque sirven para saber si un sistema dado es observable. Los siguientes resultados se dansin demostracion porque son muy parecidas a las de los correspondientes resultados parasistema controlables. Definimos, como en (6.16), la siguiente sucesion de matrices parat ∈ [t0, tf ]:

L0(t) = C(t)Lj(t) = Lj−1(t)A(t) + Lj−1(t), j = 1,2 . . .

(6.32)

Se demuestra por induccion que

Lj(t) = [ ∂j∂sj

(C(s)Φ(s, t))]s=t , j = 1,2, . . .

Teorema 6.27 Supongamos que las matrices A(t) y C(t) del sistema (6.25) son infini-tamente diferenciables en un intervalo I ⊂ R y sea [t0, tf ] ∈ I. Si existen ta ∈ [t0, tf ] y unentero q ≥ 0 tal que

rang

⎡⎢⎢⎢⎢⎢⎢⎢⎣

L0(ta)L1(ta)⋮Lq(ta)

⎤⎥⎥⎥⎥⎥⎥⎥⎦= n, (6.33)

entonces el sistema (6.25) es observable en [t0, tf ].Al igual que en el caso controlable, si se cumple (6.33) para algun ta ∈ I y alqun enteroq ≥ 0 entonces el sistema es observable en cualquier intervalo que contenga a ta y estecontenido en I.

De nuevo, la condicion (6.33) no es necesaria, en general, para la observabilidad delsistema pero sı lo es si A(t) y C(t) son analıticas en I. La demostracion es la misma quepara la controlabilidad.

Page 23: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

6.3 Observabilidad de los sistemas lineales 157

Finalmente, para los sistemas invariantes en el tiempo

x(t) = Ax(t) +Bu(t)y(t) = Cx(t) +Du(t) t ∈ T = R (6.34)

tenemos el siguiente criterio cuya demostracion sigue las mismas pautas que en el caso desistemas controlables.

Teorema 6.28 El sistema (6.34) es observable en [t0, tf ] ⊂ T si y solo si

rang

⎡⎢⎢⎢⎢⎢⎢⎢⎣

CCA⋮

CAn−1

⎤⎥⎥⎥⎥⎥⎥⎥⎦= n. (6.35)

A la matriz

O(A,C) =⎡⎢⎢⎢⎢⎢⎢⎢⎣

CCA⋮

CAn−1

⎤⎥⎥⎥⎥⎥⎥⎥⎦se le llama matriz de observabilidad del sistema (6.34) o del para (A,C) y se demuestraque el subespacio de inobservabilidad es KerO(A,C).

Al igual que con los sistemas controlables, la observabilidad de los sistemas invariantesen el tiempo es independiente del intervalo concreto. Por eso, se suele decir que el sistemaes observable sin referencia a ningun intervalo.

Comparando los Teoremas 6.16 y 6.28 enseguida vemos que el sistema

x(t) = Ax(t) +Bu(t)es controlable si y solo si el sistema

z(t) = AT z(t)y(t) = BT z(t)

es observable. Esto permite una rapida traslacion entre los resultados de controlabildad yobservabilidad de los sistemas invariantes en el tiempo.

Los siguientes resultados se obtienen directamente dualizando los correspondientesresultados sobre controlabilidad de la Seccion 6.2.1

Teorema 6.29 (Descomposicion de Kalman de observabilidad) Sea r = rangO(A,C)el rango de la matriz de observabilidad del sistema (6.34). Existe una matriz invertibleT ∈ Rn×n tal que

T−1AT = [A1 0A2 A3

] , CT = [C1 0] (6.36)

donde A1 ∈ Rr×r, C1 ∈ Rp×r y (A1,C1) es controlable.

Page 24: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

158 Controlabilidad y Observabilidad. Estabilizacion

Teorema 6.30 (Test PBH de observabilidad) El sistema (6.34) es observable si ysolo si para todo λ ∈ Λ(A) (el conjunto de los valores propios de A) se tiene

rang [λIn −AC

] = n. (6.37)

La dualidad de los sistemas lineales invariantes en el tiempo, que permiten trasladarresultados de los sistemas controlables a los observables y al reves, se extiende, sin dema-siada dificultad, a los sistemas lineales no invariantes en el tiempo pero este problema nolo abordaremos aquı.

Ejemplo 6.31 Retomamos el Ejemplo 6.18 sobre el sistema linealizado en torno a laorbita geoestacionaria del Ejemplo 4.4. Las ecuaciones del sistema linealizado en torno alpunto de equilibrio xe = (R0,0,0,0) a control cero son (ver (5.33)) (incluımos ahora lasecuaciones de salida):

x(t) = Ax(t) +Bu(t)y(t) = Cx(t)

con

A =⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

0 1 0 0

3Ω2 0 0 2R0Ω0 0 0 1

0 −2Ω

R00 0

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦, B =

⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

0 01 00 0

01

R0

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦, C = [1 0 0 0

0 0 1 0]

siendo R0 la distancia a la orbita geoestacionaria y Ω la velocidad angular de la Tierra.Vamos a estudiar si el sistema es observable respecto de cada ecuacion de salida indepen-diente.

En primer lugar suponemos que solo se mide la distancia radial a la posicion delsatelite:

y1(t) = [1 0 0 0]x(t) = x1(t) = r(t)La matriz de observabilidad en este caso es:

O(A, c1) =⎡⎢⎢⎢⎢⎢⎢⎢⎣

c1

c1A

c1A2

c1A3

⎤⎥⎥⎥⎥⎥⎥⎥⎦=⎡⎢⎢⎢⎢⎢⎢⎢⎣

1 0 0 00 1 0 0

3Ω2 0 0 2R0Ω

0 −Ω2 0 0

⎤⎥⎥⎥⎥⎥⎥⎥⎦que, claramente, tiene rango 3. Por lo tanto el sistema no es observable y el espacio deinobservabilidad es

KerO(A, c1) = [0 0 x 0]T ∶ x ∈ R.En otras palabras, que la observacion solo de la posicion radial del satelite en cualquierintervalo de tiempo [t0, tf ] no nos permite saber cual era el desplazamiento angular delsatelite en el instante t0.

Page 25: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

6.4 Estabilizacion de los sistemas lineales por feedback de estados 159

Por otra parte, si suponemos que solo se mide el desplazamiento angular

y2(t) = [0 0 1 0]x(t) = x3(t) = θ(t) − (θ0 +Ωt),la matriz de observabilidad del sistema serıa:

O(A, c2) =⎡⎢⎢⎢⎢⎢⎢⎢⎣

c2

c2A

c2A2

c2A3

⎤⎥⎥⎥⎥⎥⎥⎥⎦=⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

0 0 1 00 0 0 1

0 −2Ω

R00 0

−6Ω3

R00 0 −4Ω2

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦que tiene rango 4 y por lo tanto, solo midiendo el desplazamiento angular en cada intervalode tiempo [t0, tf ] podemos conocer los estados del sistema en t0 y, en consecuencia, entodo el intervalo.

6.4. Estabilizacion de los sistemas lineales por feedback deestados

Un buen numero de problemas de control son consecuencia de nuestro deseo de mo-dificar las caracterısticas del sistema para que se comporte de una forma determinada.Una de las herramientas comunmente usadas es el diseno de controladores de “feedback”; es decir, construir sistemas que tomando como entradas las salidas del sistema originalproduzcan en este el comportamiento deseado (realimentamos el sistema original a partirde la informacion proporcionada por el mismo). En la Figura 6.2 se presenta un esquemade realimentacion (feedback): las salidas del sistema Σ (planta)se usan para producir, atraves del sistema Γ (controlador), nuevas entradas para el sistema original Σ. El sistemaΓ se disena de modo las entradas en la planta Σ permitan controlar (de ahı el nombre)el comportamiento dinamico de esta. En ocasiones se utiliza ademas una senal externa,v(t),que puede ser la referencia para la salida o una entrada par ayudar al control.

Supongamos entonces que las ecuaciones de Σ en el modelo de espacio-estado son lashabituales (supondremos D = 0 para simplificar la notacion):

x(t) = Ax(t) +Bu(t)y(t) = Cx(t) . (6.38)

Supongamos tambien que las ecuaciones para el sistema Γ son

z(t) =Kz(t) +Ly(t)u(t) =Mz(t) + Fy(t) +Rv(t) (6.39)

Las ecuaciones del sistema conectado se obtienen sustituyendo los valores correspondientesde cada sistema en el otro:

x(t) = Ax(t) +BMz(t) +BFCx(t) +BRv(t) = (A +BFC)x(t) +BMz(t) +BRv(t),

Page 26: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

160 Controlabilidad y Observabilidad. Estabilizacion

R ++ Σ

Γ

Controlador

Planta

v(t) u(t)y(t)w(t)

Figura 6.2: Realimentacion del sistema Σ

d(t)

v(t) K ++ ++ x(t) = Ax(t) +Bu(t)y(t) = Cx(t) +Du(t) y(t)

−F

Controlador Planta

u(t)

x(t)

Figura 6.3: Sistema de control con unfeedback de estados

yz(t) =Kz(t) +LCx(t)

Ası, las ecuaciones del sistema conectado (llamado tambien, por razones obvias, sistemaen lazo cerrado) son:

[x(t)z(t)] = [A +BFC BM

K LC] [x(t)z(t)] + [BR

0] v(t). (6.40)

La conexion mas simple consiste en suponer que las unicas matrices no nulas en elsistema Γ son F y R. En este caso, las ecuaciones del sistema en lazo cerrado se reducen a

x(t) = (A +BFC)x +BRv(t). (6.41)

Se dice entonces que se ha realizado un feedback de salidas sobre el sistema (6.38) y queel sistema resultante (6.41) es el sistema en lazo cerrado por dicho feedback de salidas.

El analisis del comportamiento del sistema en lazo cerrado por un feedback de salidases un problema, en general, difıcil. Mas simple es el analisis del comportamiento del sistema

Page 27: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

6.4 Estabilizacion de los sistemas lineales por feedback de estados 161

cuando el feedback se puede hacer desde los estados; cosa que es implementable fısicamentecuando estos pueden ser medidos. En tal caso, un diagrama de un sistema tıpico de controlen el que se usa un feedback de estados es el que se presenta en la Figura 6.3. El sistemacompleto esta compuesto por: la planta definida por un sistema de ecuaciones (lineales eneste caso) que determina el proceso dinamico, el controlador compuesto por los elementosF y K, la senal de referencia (o senal de control) v y unas perturbaciones que se hanreunido en la funcion d. El controlador usa el estado del sistema x y la senal de referenciav para definir la entrada al sistema dinamico y controlar ası el proceso. El objetivo delcontrolador de feedback es regular la salida del sistema y(t) para que siga la senal dereferencia de entrada en presencia de perturbaciones y, quiza, incertidumbres.

Una faceta importante en el diseno de control es especificar el tipo de comportamientoque se requiere del sistema. El comportamiento basico es que sea estable. Es decir, que enausencia de perturbaciones, el estado de equilibrio del sistema sea asintoticamente estable.Otras especificaciones mas sofisticadas pueden ser que la respuesta a un salto o la respuestade frecuencia tengan propiedades tales como que el tiempo de subida, la sobreelongaciono el tiempo de ajuste tengan valores predeterminados.

Dado que estamos suponiendo que se pueden medir los estados y que el conocimientodel estado en el instante t contiene toda la informacion necesaria para predecir el com-portamiento futuro del sistema, el controlador podrıa disenarse para producir una ley decontrol que sea una funcion general del estado y de la senal de referencia:

u = α(x, v).En el diagrama de la Figura 6.3 se ha supuesto que esta ley es una funcion lineal en x y v:

u(t) = −Fx(t) +Kv(t), t ∈ R. (6.42)

El signo menos es una convencion para indicar que un feedback negativo es la situacionhabitual.

La ecuaciones del sistema en lazo cerrado serıan entonces (la ecuacion de salidas nose verıa afectada):

x(t) = (A −BF )x(t) +BKv(t) (6.43)

Dado que un objetivo basico de diseno para el controlador es que el sistema en lazocerrado sea asintoticamente estable el problema fundamental que queremos resolver es elde la estabilizacion de los sistemas lineales mediante un feedback de estados. Ahora bien,la estabilidad de los sistemas lineales depende de la posicion en el plano complejo de losvalores propios de la matriz de estados. Como, a su vez, los valores propios de una matrizson las raıces de su polinomio caracterıstico, el problema que se trata de resolver es: dadoun polinomio de grado n:

p(s) = sn + pn−1sn−1 +⋯ + p1s + p0,

encontrar una matriz de feedback F tal que el polinomio caracterıstico de la matriz enlazo cerrado A − BF sea p(s). Este problema se conoce con el nombre de problema de

Page 28: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

162 Controlabilidad y Observabilidad. Estabilizacion

asignacion de valores propios o problema de asignacion de polos. Esta ultima denominaciontiene que ver con el hecho de que los polos de la matriz de transferencia del sistema sonvalores propios de la matriz de estados (todos, de hecho, cuando el sistema es controlabley observable). Veremos que el problema de asignacion de valores propios siempre tienesolucion si y solo si el sistema (A,B) es controlable. La demostracion la haremos parasistemas con un solo control aunque es verdad para sistemas con cualquier numero decontroles.

Antes de enunciar y demostrar el teorema de asignacion de valores propios convieneobservar que la matriz K no afecta a la estabilidad interna del sistema que queda determi-nada por los valores propios de A−BF , pero afecta a la solucion en estado estacionario. Enefecto, suponiendo que el sistema es de una sola entrada y una sola salida (la generaliza-cion al caso multivariable es inmediata) y que la senal de referencia es constante (v(t) = vpara todo t ∈ R), la solucion de equilibrio del sistema (6.43) es

xe = −(A −BF )−1BKv,

y la salida para este estado de equilibrio es

ye = Cxe +Due = Cxe +D(Fxe +Kv) = (C +DF )xe +DKv.Si el objetivo de control es que ye siga la senal de referencia, debe ser ye = v. Ası pues, siD = 0 (que es, como ya se ha dicho, el caso mas habitual):

v = Cxe = −C(A −BF )−1BKv ⇒ 1 = −C(A −BF )−1BK ⇒⇒ K = − 1

C(A −BF )−1B

Observese que, una vez estabilizado asintoticamente el sistema con el feedback de estadosF , K es exactamente el inverso de la ganancia de frecuencia cero del sistema en lazocerrado y tambien el inverso de la respuesta de estado estacionario a un salto unidad. Enconsecuencia, usando F , K y v se puede controlar la dinamica del sistema en lazo cerradopara alcanzar el comportamiento deseado. El Ejemplo 6.4 de [1] es una buena muestra decomo utilizar los resultados obtenidos.

Como ya se ha anunciado, nuestro ultimo objetivo en esta seccion es probar quecontrolabilidad equivale a asignabilidad en el caso monovariable (m = 1). Es decir,

Teorema 6.32 Consideremos el sistema (6.38) con m = 1. Este sistema es controlable siy solo si para cualquier polinomio de grado n

p(s) = sn + pn−1sn−1 +⋯ + p1s + p0, (6.44)

existe una matriz f ∈ Rn×1 tal que el polinomio caracterıstico de A − bfT es p(s).

Demostracion.- Supongamos primero que el sistema (A, b) no es controlable. Porel Teorema de Descomposicion de Kalman (Teorema 6.19) existe una matriz invertibleT ∈ Rn×n tal que

A = T−1AT = [A1 A2

0 A3] , b = T−1b = [b1

0] .

Page 29: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

6.4 Estabilizacion de los sistemas lineales por feedback de estados 163

donde A1 ∈ Rr×r y A3 ∈ R(n−r)×(n−r) siendo r = rang C(A, b).Sea p(s) cualquier polinomio monico (i.e., con coeficiente principal 1) de grado n cuyo

conjunto de raıces es disjunto con Λ(A3). Y sea f ∈ Rn×1 cualquier matriz. PongamosfT = fTT y observemos que

T−1(A − bfT )T = A − bfT = [A1 − b1fT1 A2 − b1fT20 A3

]donde f1 y f2 son las submatrices de f formadas por los r primeros elementos de f y losultimos n − r elementos de f , respectivamente. Como A − bfT y A − bfT son semejantes,tienen el mismo polinomio caracterıstico. Ahora bien, p(s) no puede ser el polinomiocaracterıstico de A − bfT porque los valores propios de A3 siempre son raıces de este. Enconsecuencia p(s) no es el polinomio caracterıstico de A − bfT cualquiera que sea f . Estodemuestra la parte “solo si” del teorema.

Recıprocamente, supongamos ahora que (A, b) es controlable y sea p(s) = sn+pn−1sn−1+⋯ + p1s + p0 un polinomio monico de grado n. Como (A, b)es controlobale, la matriz de

controlabilidad C(A, b) = [b Ab ⋯ An−1b]tiene rango n y es, por tanto, invertible. Sea S = C(A, b)−1 y denotemos con sT su ultimafila. Con este vector fila construımos la matriz

T =⎡⎢⎢⎢⎢⎢⎢⎢⎣

sT

sTA⋮sTAn−1

⎤⎥⎥⎥⎥⎥⎥⎥⎦. (6.45)

Observese que por ser sT la ultima fila de C(A, b)−1 y C(A, b)−1C(A, b) = In tenemos que

sTAkb = 0 k = 0,1, . . . , n − 2

sTAn−1b = 1.(6.46)

Por lo tanto

TC(A, b) =⎡⎢⎢⎢⎢⎢⎢⎢⎣

0 ⋯ 0 10 ⋯ 1 ⋆⋮ . .

. ⋮ ⋮1 ⋯ ⋆ ⋆

⎤⎥⎥⎥⎥⎥⎥⎥⎦donde ⋆ representa elementos indeterminados. Ası pues, T es una matriz invertible. Ademas,por el Teorema de Hamilton-Cayley se tiene que si

pA(s) = sn + an−1sn−1 +⋯ + a1s + a0

es el polinomio caracterıstico de A entonces An = −a0In −a1A−⋯−an−1An−1. Por lo tanto

TA =⎡⎢⎢⎢⎢⎢⎢⎢⎣

sTA

sTA2

⋮sTAn

⎤⎥⎥⎥⎥⎥⎥⎥⎦=⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

0 1 0 ⋯ 00 0 1 ⋯ 0⋮ ⋮ ⋮ ⋱ ⋮0 0 0 ⋯ 1−a0 −a1 −a2 ⋯ −an−1

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦

⎡⎢⎢⎢⎢⎢⎢⎢⎣

sT

sTA⋮sTAn−1

⎤⎥⎥⎥⎥⎥⎥⎥⎦(6.47)

Page 30: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

164 Controlabilidad y Observabilidad. Estabilizacion

A la matriz

Ac =⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

0 1 0 ⋯ 00 0 1 ⋯ 0⋮ ⋮ ⋮ ⋱ ⋮0 0 0 ⋯ 1−a0 −a1 −a2 ⋯ −an−1

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦se le llama matriz companera de pA(s) y (6.47) muestra que TAT−1 = Ac siendo T lamatriz de (6.45). Mas aun, de (6.46) se tiene

bc = Tb =⎡⎢⎢⎢⎢⎢⎢⎢⎣

0⋮01

⎤⎥⎥⎥⎥⎥⎥⎥⎦.

Por consiguiente (A, b) y (Ac, bc) son sistemas semejantes. De hecho, se puede ver que(Ac, bc) es una forma canonica para la semejanza de sistemas controlables cuando m = 1.Se dice que (Ac, bc) es un sistema en forma canonica de controlabilidad. Para el sistema(Ac, bc) es muy facil encontrar un vector fc ∈ Rn×1 tal que Ac − bcfTc tiene el polinomiop(s) = sn + pn−1s

n−1 +⋯ + p1s + p0 como polinomio caracterıstico. En efecto, basta tomar

fTc = [p0 − a0 p1 − a1 ⋯ pn−1 − an−1] .Con este vector tenemos:

Ac − bcfTc =⎡⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣

0 1 0 ⋯ 00 0 1 ⋯ 0⋮ ⋮ ⋮ ⋱ ⋮0 0 0 ⋯ 1−p0 −p1 −p2 ⋯ −pn−1

⎤⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦Definiendo

fT = fTc T = [p0 − a0 p1 − a1 ⋯ pn−1 − an−1]T (6.48)

se obtiene

Ac − bcfTc = T (A − bfT )T−1,

lo que demuestra que A − bfT es semejante a la matriz companera del polinomio p(s). Esdecir, p(s) es el polinomio caracterıstico de A − bfT tal y como se querıa demostrar.

La segunda parte de la demostracion del Teorema 6.32 proporciona un metodo paracalcular el vector de feedback f con el que A − bfT tiene el polinomio que se desee comopolinomio caracterıtico.

Procedimiento para calcular la matriz de feedback

Dado el sistema controlable (A, b) y el polinomio p(s) = sn + pn−1sn−1 +⋯ + p1s + p0:

Page 31: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

6.4 Estabilizacion de los sistemas lineales por feedback de estados 165

1. Formese la matriz de controlabilidad del sistema C(A, b).2. Calculese su inversa C(A, b)−1.

3. Extraigase la ultima fila sT de C(A, b)−1.

4. Formese la matriz T de (6.45).

5. Calculese el polinomio caracterıstico de A: pa(s) = sn + an−1sn−1 +⋯ + a1s + a0 (por

ejemplo, mediante la formula TAT−1 si T esta bien condicionada).

6. La matriz de feedback requerida es (vease (6.48)):

fT = [p0 − a0 p1 − a1 ⋯ pn−1 − an−1]T.Para sistemas con multiples entradas el Teorema 6.32 sigue siendo valido: El sistema

(6.38) es controlable si y solo si para cualquier polinomio monico de grado n existe unamatriz F ∈ Rm×n tal que el polinomio caracterıstico de A −BF es p(s). La demostracionprecisa de algunos resultados tecnicos que alargarıan mucho esta exposicion.

El Teorema 6.32 establece que si el sistema no es controlable entonces no se puedeasignar cualquier polinomio de grado n como polinomio caracterıstico para los sistemas enlazo cerrado. Una pregunta natural es la de saber cuanta libertad se tiene en la asignacion;es decir, que polinomios se pueden asignar y cuales no. La respuesta es una consecuenciainmediata del Teorema 6.32 y el Teorema de Descomposicion de Kalman (Teorema 6.19).Recordemos que este teorema establece que si el sistema (A,B) no es controlable entonceses semejante a un sistema de la forma

([A1 A2

0 A3] , [B1

0])

donde A3 representa la parte incontrolable del sistema y (A1,B1) es controlable.

Corolario 6.33 Dado el sistema (6.38) que puede ser no controlable, sea p(s) un poli-nomio monico de grado n y q(s) el polinomio caracterıstico de la parte incontrolable delsistema. Entonces existe una matriz de feedback F ∈ Rm×n tal que A−BF tiene p(s) comopolinomio caracterıstico si y solo si q(s) divide a p(s).

Demostracion.- Podemos suponer sin perdida de generalidad que

A = [A1 A2

0 A3] , B = [B1

0] .

Entonces si escribimos F = [F1 F2] con r el tamano de A1:

Af = A −BF = [A1 −B1F1 A2 −B1F2

0 A3] .

Page 32: Controlabilidad y Observabilidad. Estabilizaci on · 2019-10-17 · 6.2 Controlabilidad de los sistemas lineales 139 que es el subespacio de los estados alcanzables en tiempo tf t0

166 Controlabilidad y Observabilidad. Estabilizacion

Por lo tanto, existe F tal que A−BF tiene p(s) como polinomio caracterıstico si y solo sip(s) es el polinomio caracterıstico de Af . Pero el polinomio caracterıstico de esta matrizes el producto de los polinomios caracterısticos de A1 −B1F1 y A3. En definitiva, p(s) esel polinomio caracterıstico de A −BF si y solo si q(s) divide a p(s).Definicion 6.34 El sistema (6.38) se dice estabilizable por feedback de estados si existeuna matriz F ∈ Rm×n tal que la matriz de estados del sistema en lazo cerrado A −BF esasintoticamente estable.

Del Teorema 6.32 se deduce directamente que si el sistema es controlable entonces esestabilizable por feedback de estados. En efecto, se pueden escoger n numeros complejos conparte real negativa (conjugados a pares) y formar un polinomio monico real de grado n quelos tenga como raıces. Para este polinomio existe F tal que A−BF tiene dicho polinomiocomo polinomio caracterıstico. El sistema en lazo cerrado es, por tanto, asintoticamenteestable.

La demostracion del siguiente corolario es consecuencia del Corolario 6.33

Corolario 6.35 El sistema (6.38) es estabilizable por feedback de estados si y solo si losvalores propios de la parte incontrolable estan en el semiplano Re s < 0.