76
Teor´ ıa de Control aster en Modelizaci´ on e Investigaci´ on Matem´ atica, Estad´ ıstica y Computaci´ on Silvia Marcaida (UPV/EHU) [email protected] 1 Programa de la asignatura 1 Introducci´ on 2 Modelizaci´ on 3 Comportamiento din´ amico: estabilidad 4 Sistemas lineales 5 Controlablilidad y observabilidad 6 Realimentaci´ on lineal: asignaci´ on de valores propios 7 Funci´ on de transferencia 8 Control ´ optimo de sistemas en tiempo discreto 9 Control ´ optimo de sistemas en tiempo continuo: principio del aximo de Pontryagin 10 Control ´ optimo de sistemas en tiempo continuo: programaci´ on din´ amica 11 Controlabilidad de sistemas no lineales 2

Teor a de Control - UPV/EHU

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Teor a de Control - UPV/EHU

Teorıa de ControlMaster en Modelizacion e Investigacion Matematica,

Estadıstica y Computacion

Silvia Marcaida (UPV/EHU)

[email protected]

1

Programa de la asignatura

1 Introduccion

2 Modelizacion

3 Comportamiento dinamico: estabilidad

4 Sistemas lineales

5 Controlablilidad y observabilidad

6 Realimentacion lineal: asignacion de valores propios

7 Funcion de transferencia

8 Control optimo de sistemas en tiempo discreto

9 Control optimo de sistemas en tiempo continuo: principio delmaximo de Pontryagin

10 Control optimo de sistemas en tiempo continuo: programaciondinamica

11 Controlabilidad de sistemas no lineales

2

Page 2: Teor a de Control - UPV/EHU

Programa (PARTE I)

1 Introduccion

2 Modelizacion

3 Comportamiento dinamico: estabilidad

4 Sistemas lineales

5 Controlablilidad y observabilidad

6 Realimentacion lineal: asignacion de valores propios

7 Funcion de transferencia

3

BibliografıaAstrom K. J., Murray R. M., Feedback Systems. An introduction forScientists and Engineers, Princeton University Press, 2008.

http://www.cds.caltech.edu/∼murray/amwiki

Garcıa Isaac A., Teorıa de estabilidad y control, Edicions de laUniversitat de Lleida, 2005.

Heij C., Ran A., van Schagen F., Introduction to MathematicalSystems Theory. Linear Systems, Identification and Control,Birkhauser Verlag, 2007.

Hinrichsen D., Pritchard A. J., Mathematical Systems Theory I.Modelling, State Space Analysis, Stability and Robustness, Springer,2010.

http://www.springerlink.com/content/p24551/

Ogata K., Ingenierıa de control moderna, Pearson, 2010.

Puerta Sales F., Teorıa de sistemas lineales, CPDA-ETSEIB, 2000.

4

Page 3: Teor a de Control - UPV/EHU

¿Que es Control?Sistema: es un objeto o coleccion de objetos con entradas y salidas.

Introduccion 4/117

Sistema: coleccion de objetos relacionados entre sı que producevarias salidas en respuesta a diferentes entradas.

EntradasSistema

Salidas

Muchas ramas de la matematica aplicada se han ocupado de laresolucion de las ecuaciones matematicas que describen el sistema.

Algunos problemas requieren una aproximacion diferente:Controlar un sistema para que se comporte de una maneradeseada.

Ej.: coche (entra gasolina, sale desplazamiento),calefaccion (entra gas, sale calor).

Pueden ser de diferente naturaleza: mecanicos, electricos,biologicos, economicos,...

Variable de salida: es la cantidad o condicion que se mide y controla.

Variable de entrada: es la cantidad o condicion que el controladormodifica para afectar el valor de la variable de salida.

Perturbacion: es una senal que tiende a afectar negativamente la variablede salida de un sistema. Puede ser interna (se genera dentro del sistema)o externa (se genera fuera).

Controlar: es medir la variable de salida y aplicar la variable de entradapara corregir o limitar la desviacion del valor medido respecto del valordeseado.

Ej.: sistema de calefaccion de una vivienda,cuerpo humano (mantiene la temperatura a 37o).

5

¿Que es Control?

Sistema de control en lazo cerrado: sistema que compara la saliday un valor de referencia y usa la diferencia como medio de control.

Sistema de control en lazo abierto: sistema en que la salida notiene efecto sobre la accion de control (no se mide la salida ni serealimenta para compararla con la entrada).

Ej.: lavadora

Sistema en lazo cerrado Sistema en lazo abierto

6

Page 4: Teor a de Control - UPV/EHU

¿Que es Control?

Ventajas de un sistema en lazo abierto:

Contruccion mas simple y facilidad de mantenimiento.Menos costoso (menor numero de componentes).No hay problemas de estabilidad.Conveniente cuando la salida es difıcil de medir o cuando medirla salida de manera precisa no es economicamente viable.

Desventajas de un sistema en lazo abierto:

Si hay perturbaciones o cambios en la calibracion se originanerrores que producen que la salida sea diferente de lo que sedesea.Hay que recalibrar.

7

Ejemplo 1: regulacion de la glucosa en la sangreCuerpo humano: intenta mantener la concentracion de glucosaconstante (90 mg por 100 ml de sangre).

Si el nivel de glucosa aumenta:

el pancreas segrega insulina,la insulina hace que el hıgado almacene el exceso de glucosa.

Si el nivel de glucosa disminuye:

el pancreas segrega glucagon,el glucagon hace que el hıgado libere glucosa.

u: concentracion de glucosa en sangrey : cantidad de insulina/glucagon

8

Page 5: Teor a de Control - UPV/EHU

Ejemplo 2: controlador centrıfugo

El eje de una maquina de vapor esta conectado al controlador quea su vez esta conectado a la valvula de la maquina de vapor.Mantiene la velocidad constante. ¿Como?

Si la velocidad aumenta

entonces las bolas se separan,

causan el cierre de la valvula de admision de vapor,

disminuye la velocidad,

las bolas se cierran.

9

Ejemplo 3: termostato

1 Mide la temperatura

2 Compara la temperatura medida conla temperatura deseada

3 Usa el error para encender o apagar elsistema de calefaccion.

10

Page 6: Teor a de Control - UPV/EHU

¿Como funciona el control?

Control = Deteccion + Calculo + Actuacion

Un controlador moderno:

1 Recoge la informacion de los sensores (salida).

2 La compara con el comportamiento deseado.

3 Calcula las acciones correctivas basadas en un modelo.

4 Actua para llevar a cabo el cambio deseado.

Objetivos:- estabilidad (poder mantener el comportamiento deseado)- rapidez en la respuesta a los cambios- robustez (tolerar perturbaciones)

11

Algunas aplicaciones del controlDispositivos iniciales de control: controlador centrıfugo (1788),termostato (1953), velocidad de crucero en automoviles (1958).

La proliferacion del control ocurrio en la segunda mitad del sigloXX.

Control en la actualidad:

Naturaleza:regulacion fisiologica (homeostasis)ecosistemas

Ingenierıa:robotsvehıculos autonomossistemas de espacio y militares: aviones, misiles, satelitessistemas electronicosprocesos quımicossistemas de informacion y comunicaciones

Economıa:Bolsa y mercadosCadenas de suministro y servicios 12

Page 7: Teor a de Control - UPV/EHU

¿Que es un modelo?

Modelo: representacion precisa de la dinamica de un sistema usadopara predecir su comportamiento.

El modelo puede no ser unico: la eleccion del modelo depende delas preguntas que queremos contestar.

Modelo matematico: representacion mediante ecuaciones de unsistema dinamico (fısico, biologico, economico, ...).

13

Herencia de la MecanicaLa dinamica de muchos sistemas se describe mediante ecuacionesdiferenciales. Se obtienen de las leyes fısicas que las gobiernan.Modelo: Ecuacion diferencial

Ejemplo

Sistema compuesto por una masa con un muelle y amortiguacion

m: masa

q: desplazamiento

c(·): amortiguacion

k : constante del muelle

Ley de Hooke: mq(t) + c(q(t)) + kq(t) = 0

Ecuacion diferencial forzada o controlada:

mq(t) + c(q(t)) + kq(t) = u(t)

donde u representa el efecto de entradas (fuerzas) externas. 14

Page 8: Teor a de Control - UPV/EHU

Herencia de la ElectricidadModelo: sistema entrada/salida (transforma entradas en salidas)

Este modelo permite descomponer el sistema en componentesconectadas a traves de entradas y salidas. Es muy util para lossistemas lineales invariantes en el tiempo.

Lineal: la suma de dos entradas produce la suma de suscorrespondientes salidas (principio de superposicion).

Invariante en el tiempo: la salida no depende de cuando se produjola entrada.

15

Variables del modeloAsociado a un sistema tenemos una serie de variables, que engeneral, pueden cambiar con el tiempo.

Variables de entrada o controles: las denotaremos u1, . . . , um.Variables de salida o medidas: las denotaremos y1, . . . , yp.

Ademas se pueden definir las variables de estado, que son variablesauxiliares que resumen toda la informacion pasada relevante paraconocer el futuro del sistema. Las denotaremos x1, . . . , xn.En la practica no siempre es posible conocerlas directamente.

El estado del sistema en el tiempo inicial t0 junto con las entradasrecibidas a partir de t0 deben permitir la determinacion del estadoen cualquier tiempo t ≥ t0.

El estado en t ≥ t0 no depende de como se llego al estado t0. Parael comportamiento en tiempos futuros a t0 el estado en t0

constituye una completa historia del sistema en tiempos anteriores.

16

Page 9: Teor a de Control - UPV/EHU

Variables del modelo

Las variables de entrada, salida y estado son funciones del tiempoy este puede ser medido de forma continua o discreta.

Sistemas continuos: tienen el estado definido para todos lostiempos de un intervalo:

T = [t0, tf ] ⊆ R

Sistemas discretos: tienen el estado definido en tiemposdiscretos dentro de un intervalo:

T = {t0, t1, . . . , tf } ⊆ R

El estado en un tiempo t, x(t), pertenece a un espacio llamadoespacio de estados.

17

Variables del modelo: ejemplo de masa cayendo en el vacıo

Consideremos una masa cayendo en el vacıo. Laentrada es la aceleracion g y la salida es la alturay(t).

Representacion matematica interna o por las variables deestado 23/117

Ejemplo

Consideramos una masa cayendo en elvacıo. La entrada es la aceleracion gy la salida es la altura y(t).

y(t)g

Entonces: y(t) = −g .

Integrando: y(t)− y(t0) = −g(t − t0).

Integrando de nuevo: y(t)− y(t0)− y(t0)(t − t0) = −g(t−t0)2

2 .

La ecuacion diferencial es: y(t) = −g

La solucion es: y(t)− y(t0)− y(t0)(t − t0) = −g(t−t0)2

2

La variable y no constituye el estado, ya que su valor inicial y(t0)no es suficiente para determinar y(t).

Un vector de estados valido es:

x(t) =

(y(t)y(t)

).

18

Page 10: Teor a de Control - UPV/EHU

Tiempo continuo: ecuaciones diferencialesModelo espacio de estados (describe el cambio del estado):

x(t) = f (t, x(t), u(t)), y(t) = h(t, x(t), u(t))

t ∈ T = [t0, tf ] ⊆ R: tiempox(t) ∈ Rn: vector de estados (resume el pasado del sistema)u(t) ∈ Rm: vector de entradas o controles (excitacion externa)y(t) ∈ Rp: vector de salidas o medidasf : R× Rn × Rm → Rn, h : R× Rn × Rm → Rp funcionesinfinitamente diferenciablesn (dimension del vector de estados): orden del sistema

Matricialmente:

x1(t)...

xn(t)

=

f1(t, x(t), u(t))...

fn(t, x(t), u(t))

,

y1(t)...

yp(t)

=

h1(t, x(t), u(t))...

hp(t, x(t), u(t))

19

Tiempo continuo: ejemplo del sistema compuesto por unamasa con un muelle y amortiguacion

m: masa

q: desplazamiento

c(·): amortiguacion

k : constante del muelle

Ecuacion diferencial forzada o controlada:

mq(t) + c(q(t)) + kq(t) = u(t)

Vector de estados:x(t) = (x1(t), x2(t))T , x1(t) = q(t), x2(t) = q(t)

Modelo espacio de estados:

x(t) =

(x1(t)x2(t)

)=

(x2(t)

−c(x2(t))−kx1(t)+u(t)m

), y(t) = x1(t)

20

Page 11: Teor a de Control - UPV/EHU

Tiempo continuo: ejemplo del pendulo invertido

Parametros: m: masa, l : longitud del brazo, J: momento de inercia,g : aceleracion de la gravedad.

Ecuacion: J θ(t) = mgl sen θ(t)

Vector de estados:x(t) = (x1(t), x2(t))T , x1(t) = θ(t), x2(t) = θ(t)

Modelo espacio de estados:

x(t) =

(x1(t)x2(t)

)=

(x2(t)

mglJ sen(x1(t))

), y(t) = x1(t)

21

Tiempo continuo: ejemplo del satelite en orbita planaConsideremos un satelite de masa m moviendose en orbita planaalrededor de la tierra.

uru i

θ

r

La posicion del satelite queda determinada por las variables r(t) yθ(t) y suponemos que la orbita puede ser controlada por dosimpulsos ortogonales ui (t) y ur (t).Las ecuaciones que describen el movimiento del satelite son

r − θ2r = − µr2 + ur

m

r θ + 2r θ = uim

22

Page 12: Teor a de Control - UPV/EHU

Tiempo continuo: ejemplo del satelite en orbita plana

r − θ2r = − µr2 + ur

m

r θ + 2r θ = uim

Tomando como variables de estado x1 = r , x2 = r , x3 = θ, x4 = θ ycomo variables de salida y1 = x1, y2 = x3 se obtiene:

x1

x2

x3

x4

=

x2

x24 x1 − µ

x21

+ urm

x4

− 2x2x4

x1+ ui

mx1

(y1

y2

)=

(1 0 0 00 0 1 0

)

x1

x2

x3

x4

23

Tiempo continuo: ejemplo del avion de empuje vectorial

http://www.youtube.com/watch?v=5Fh6SqNQsHQ

Parametros: m: masa, J: momento de inercia, g : aceleracion de la gravedad, c:coeficiente de rozamientoEntradas: u1 = F1, u2 = F2 −mg Salidas: x , y , θEcuaciones:

mx = F1 cos θ − F2 sen θ − cx= −mg sen θ − cx + u1 cos θ − u2 sen θmy = F1 sen θ + F2 cos θ −mg − cy= mg(cosθ − 1)− cy + u1 sen θ + u2 cos θ

J θ = rF1= ru1

Estados: x1 = x , x2 = y , x3 = θ, x4 = x , x5 = y , x6 = θ

x1

x2

x3

x4

x5

x6

=

x4

x5

x6−mg sen(x3)−cx4+u1 cos(x3)−u2 sen(x3)

mmg(cos(x3)−1)−cx5+u1 sen(x3)+u2 cos(x3)

mru1J

,

y1

y2

y3

=

x1

x2

x3

24

Page 13: Teor a de Control - UPV/EHU

Tiempo continuo: sistemas linealesModelo espacio de estados:

x(t) = f (t, x(t), u(t)), y(t) = h(t, x(t), u(t))

Lineal: si f y h son funciones lineales en x y u

x(t) = A(t)x(t) + B(t)u(t), y(t) = C (t)x(t) + D(t)u(t)

Invariante en el tiempo: si f y h no dependen del tiempoexplıcitamente

Sistema lineal invariante en el tiempo en forma espacio de estados:

x(t) = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t)

A ∈ Rn×n: matriz de estadosB ∈ Rn×m: matriz de entradas o de controlesC ∈ Rp×n: matriz de salidas o de sensoresD ∈ Rp×m: matriz de transmision directa

25

Tiempo continuo: sistemas lineales

x(t) = Ax(t) + Bu(t)y(t) = Cx(t) + Du(t)

++

++

D

B

A

Cx’(t) x(t) y(t)u(t)

26

Page 14: Teor a de Control - UPV/EHU

Tiempo continuo: ejemplo del sistema compuesto por unamasa con un muelle y amortiguacion lineal

m: masa

q: desplazamiento

c(·) = cq: amortiguacionlineal

k : constante del muelle

Ecuacion diferencial controlada: mq(t) + cq(t) + kq(t) = u(t)Vector de estados:x(t) = (x1(t), x2(t))T , x1(t) = q(t), x2(t) = q(t)

Modelo espacio de estados:

x(t) =

(x1(t)x2(t)

)=

(0 1

− km − c

m

)(x1(t)x2(t)

)+

(01m

)u(t)

y(t) =(

1 0)( x1(t)

x2(t)

)

27

Tiempo discreto: ecuaciones en diferenciasModelo espacio de estados:

x(k + 1) = f (k , x(k), u(k)), y(k) = h(k, x(k), u(k))

k ∈ T = {t0, t1, . . . , tf } ⊆ Rx(k) ∈ Rn: estado del sistema en el tiempo ku(k) ∈ Rm: entraday(k) ∈ Rp: salidaf : Z× Rn × Rm → Rn, h : Z× Rn × Rm → Rp funcionesinfinitamente diferenciablesn (dimension del vector de estados): orden del sistema

Matricialmente:

x1(k + 1)...

xn(k + 1)

=

f1(k, x(k), u(k))...

fn(k, x(k), u(k))

,

y1(k)...

yp(k)

=

h1(k, x(k), u(k))...

hp(k, x(k), u(k))

28

Page 15: Teor a de Control - UPV/EHU

Tiempo discreto: ejemplo de depredador-presaModelo discreto de Lotka-VolterraEstado:

L(k): numero de liebres en el periodo kZ (k): numero de zorros en el periodo k

Entradas:

u(k): cantidad de comida para liebres en el periodo k

Salidas: numero de liebres y zorrosEcuaciones:

L(k + 1) = L(k) + nl(u)L(k)− aZ (k)L(k)

Z (k + 1) = Z (k)−mzZ (k) + cZ (k)L(k)

Parametros/funciones:

nl(u): tasa de nacimiento de liebres por periodo (depende dela comida que haya)mz : tasa de muerte de los zorros por periodoa, c: coeficientes de interaccion

http://www.math.duke.edu/education/ccp/materials/diffeq/predprey/contents.html29

Tiempo discreto: sistemas linealesModelo espacio de estados:

x(k + 1) = f (k , x(k), u(k)), y(k) = h(k, x(k), u(k))

Lineal: si f y h son funciones lineales en x y u

x(k+1) = A(k)x(k)+B(k)u(k), y(k) = C (k)x(k)+D(k)u(k)

Invariante en el tiempo: si f y h no dependen del tiempoexplıcitamente

Ecuacion en diferencias lineal invariante en el tiempo:

x(k + 1) = Ax(k) + Bu(k), y(k) = Cx(k) + Du(k)

A ∈ Rn×n: matriz de estadosB ∈ Rn×m: matriz de entradas o de controlesC ∈ Rp×n: matriz de salidas o de sensoresD ∈ Rp×m: matriz de transmision directa

30

Page 16: Teor a de Control - UPV/EHU

Tiempo discreto: sistemas lineales

x(k + 1) = Ax(k) + Bu(k)

y(k) = Cx(k) + Du(k)

++

++

D

C

A

Bx(k) y(k)u(k)

Delayx(k+1)

31

Tiempo discreto: ejemplo de la economıa de un negocioModelo simple para la economıa de un negocio:

G (k) = P(k) + O(k) + I (k)

donde G (k) es el gasto total en el ano k, P(k) es el gasto enmateria prima en el ano k, O(k) es el gasto en mano de obra en elano k e I (k) es el gasto invertido en publicidad en el ano k .Supongamos que el gasto en materia prima es la mitad del gastototal del ano anterior: P(k) = 1

2G (k − 1) y el gasto en mano deobra es la diferencia del gasto en materia prima de ese ano y elanterior: O(k) = P(k)− P(k − 1). Entonces

O(k) =1

2G (k − 1)− 1

2G (k − 2)

G (k) =1

2G (k − 1) +

1

2G (k − 1)− 1

2G (k − 2) + I (k)

G (k + 2)− G (k + 1) +1

2G (k) = I (k + 2)

Entrada: I (k). Salida: G (k)32

Page 17: Teor a de Control - UPV/EHU

Tiempo discreto: ejemplo de la economıa de un negocioSuponemos I (k) = I para todo k .

G (k + 2)− G (k + 1) +1

2G (k) = I

Tomando como variables de estado:

x1(k) = G (k), x2(k) = G (k + 1)

obtenemos:

x1(k + 1) = x2(k)x2(k + 1) = G (k + 2) = −1

2x1(k) + x2(k) + IG (k) = x1(k)

Ası, (x1(k + 1)x2(k + 1)

)=

(0 1−1

2 1

)(x1(k)x2(k)

)+

(01

)I

G (k) =(

1 0)( x1(k)

x2(k)

)

33

ObservacionEl conjunto de variables de estado que describe un sistema no esunico. Si hacemos un cambio de base en el espacio de estados(cambio de coordenadas), es decir, z = Tx con T ∈ Rn×n

invertible, entoncesCaso continuo:

x = T−1z , x = T−1z .

Ası,x = Ax + Buy = Cx + Du

}−→ T−1z = AT−1z + Bu

y = CT−1z + Du

}

−→ z = TAT−1z + TBuy = CT−1z + Du

}

Las ecuaciones del sistema con el nuevo vector de estados z son:

z = A′z + B ′uy = C ′z + D ′u

}

con A′ = TAT−1, B ′ = TB, C ′ = CT−1, D ′ = D.

34

Page 18: Teor a de Control - UPV/EHU

ObservacionEl conjunto de variables de estado que describe un sistema no esunico. Si hacemos un cambio de base en el espacio de estados(cambio de coordenadas), es decir, z = Tx , T ∈ Rn×n invertible,entonces x = T−1z .Caso discreto:

x(k + 1) = Ax(k) + Bu(k)y(k) = Cx(k) + Du(k)

}−→

T−1z(k + 1) = AT−1z(k) + Bu(k)y(k) = CT−1z(k) + Du(k)

}−→

z(k + 1) = TAT−1z(k) + TBu(k)y(k) = CT−1z(k) + Du(k)

}

Las ecuaciones del sistema con el nuevo vector de estados z son:

z(k + 1) = A′z(k) + B ′u(k)y(k) = C ′z(k) + D ′u(k)

}

con A′ = TAT−1, B ′ = TB, C ′ = CT−1, D ′ = D.35

Obtencion de las ecuaciones de estadoRepresentacion en el espacio de estados de una ecuacion diferencialo en diferencias lineal en la que la funcion de entrada no contieneterminos derivados:Caso continuo:

y (n) + a1y(n−1) + · · ·+ an−1y

(1) + any = u

Definimos las variables de estado:

x1 = y (n−1), x2 = y (n−2), . . . , xn−1 = y (1), xn = y

Ası,

x1 = y (n) = −a1x1 − · · · − an−1xn−1 − anxn + ux2 = x1...xn = xn−1

y = xn

36

Page 19: Teor a de Control - UPV/EHU

Obtencion de las ecuaciones de estado

Matricialmente:

x1

x2

x3...xn

=

−a1 −a2 · · · −an−1 −an1 0 · · · 0 00 1 · · · 0 0...

.... . .

......

0 0 · · · 1 0

x1

x2

x3...xn

+

100...0

u

y =(

0 0 · · · 0 1)

x1

x2

x3...xn

37

Obtencion de las ecuaciones de estadoEs decir,

x = Ax + Bu, y = Cx + Du siendo

x =

x1

x2

x3...xn

, A =

−a1 −a2 · · · −an−1 −an1 0 · · · 0 00 1 · · · 0 0...

.... . .

......

0 0 · · · 1 0

,

B =

100...0

, C =

(0 0 · · · 0 1

), D = 0.

A es la matriz companera del polinomio sn + a1sn−1 + · · ·+ an−1s + an.

38

Page 20: Teor a de Control - UPV/EHU

Obtencion de las ecuaciones de estado

Ejemplo

y(t) + 4y(t) + y(t) = u(t)

Definimos las variables de estado:

x1(t) = y(t), x2(t) = y(t)

Ası,x1(t) = −4x1(t)− x2(t) + u(t)x2(t) = x1(t)y(t) = x2(t)

Es decir,

(x1(t)x2(t)

)=

(−4 −11 0

)(x1(t)x2(t)

)+

(10

)u(t)

y(t) =(

0 1)( x1(t)

x2(t)

)

39

Obtencion de las ecuaciones de estadoRepresentacion en el espacio de estados de una ecuacion diferencialo en diferencias lineal en la que la funcion de entrada no contieneterminos derivados:Caso discreto:

y(k + n) + a1y(k + n − 1) + · · ·+ an−1y(k + 1) + any(k) = u(k)

Definimos las variables de estado:

x1(k) = y(k+n−1), x2(k) = y(k+n−2), . . . , xn−1(k) = y(k+1), xn(k) = y(k)

Ası,

x1(k + 1) = y(k + n) = −a1x1(k)− · · · − an−1xn−1(k)− anxn(k) + u(k)x2(k + 1) = x1(k)...xn(k + 1) = xn−1(k)y(k) = xn(k)

40

Page 21: Teor a de Control - UPV/EHU

Obtencion de las ecuaciones de estadoMatricialmente:

x1(k + 1)x2(k + 1)x3(k + 1)

...xn(k + 1)

=

−a1 −a2 · · · −an−1 −an1 0 · · · 0 00 1 · · · 0 0...

.... . .

......

0 0 · · · 1 0

x1(k)x2(k)x3(k)

...xn(k)

+

100...0

u(k)

y(k) =(

0 0 · · · 1)

x1(k)x2(k)x3(k)

...xn(k)

Es decir,

x(k + 1) = Ax(k) + Bu(k), y(k) = Cx(k) siendo

x(k) =

x1(k)x2(k)

...xn(k)

y A,B,C ,D como en el caso continuo.41

Obtencion de las ecuaciones de estado

Ejemploy(k + 2) + 2y(k + 1)− y(k) = u(k)

Definimos las variables de estado:

x1(k) = y(k + 1), x2(k) = y(k)

Ası,

x1(k + 1) = y(k + 2) = −2x1(k) + x2(k) + u(k)x2(k + 1) = y(k + 1) = x1(k)y(k) = x2(k)

Es decir,

(x1(k + 1)x2(k + 1)

)=

(−2 11 0

)(x1(k)x2(k)

)+

(10

)u(k),

y(k) =(

0 1)( x1(k)

x2(k)

)

42

Page 22: Teor a de Control - UPV/EHU

Obtencion de las ecuaciones de estadoRepresentacion en el espacio de estados de un sistema lineal deecuaciones diferenciales o en diferencias en el que la funcion de entradano contiene terminos derivados:

EjemploConsideremos un sistema con tres entradas u1, u2, u3 y tres salidasy1, y2, y3 descrito por el sistema de ecuaciones:

...y 1 + a1y1 + a2(y1 + y2) + a3(y1 − y3) = u1

y2 + a4(y2 − y1 + 2y3) + a5(y2 − y1) = u2

y3 + a6(y3 − y1) = u3

Seleccionamos como variables de estado:

x1 = y1, x2 = y1, x3 = y1, x4 = y2, x5 = y2, x6 = y3

Entonces x1 = −a1x1 − a2(x2 + x4)− a3(x3 − x6) + u1

x2 = x1

x3 = x2

x4 = −a4(x4 − x2 + 2x6)− a5(x5 − x3) + u2

x5 = x4

x6 = −a6(x6 − x3) + u343

Obtencion de las ecuaciones de estadoEliminando x6 del segundo miembro y reordenando:

x1 = −a1x1 − a2x2 − a3x3 − a2x4 + a3x6 + u1

x2 = x1

x3 = x2

x4 = a4x2 + (−2a4a6 + a5)x3 − a4x4 − a5x5 + 2a4a6x6 + u2 − 2a4u3

x5 = x4

x6 = a6x3 − a6x6 + u3

y1 = x3

y2 = x5

y3 = x6

x =

−a1 −a2 −a3 −a2 0 a3

1 0 0 0 0 00 1 0 0 0 00 a4 −2a4a6 + a5 −a4 −a5 2a4a6

0 0 0 1 0 00 0 a6 0 0 −a6

x+

1 0 00 0 00 0 00 1 −2a4

0 0 00 0 1

u

Ası,

y =

0 0 1 0 0 00 0 0 0 1 00 0 0 0 0 1

x

44

Page 23: Teor a de Control - UPV/EHU

Obtencion de las ecuaciones de estado

Representacion en el espacio de estados de una ecuacion diferencialo en diferencias lineal en la que la funcion de entrada contieneterminos derivados:

Observaciones:

La ecuacion de estado debe expresar x en funcion de x y u(no pueden aparecer las derivadas de u).

La solucion esta en absorber las derivadas de las entradas enlas variables de estado.

45

Obtencion de las ecuaciones de estado

Ejemploy + ay + by = u + cu

Reordenandoy − cu = −ay − by + u

Definimosx1 = y − cu, x2 = y

Se obtiene

x1 = y − cu = −a(x1 + cu)− bx2 + u = −ax1 − bx2 + (−ac + 1)ux2 = y = x1 + cuy = x2

(x1

x2

)=

(−a −b1 0

)(x1

x2

)+

(−ac + 1

c

)u

y =(

0 1)( x1

x2

)

46

Page 24: Teor a de Control - UPV/EHU

Solucion de ecuaciones diferenciales

x(t) = f (t, x(t), u(t)), y(t) = h(t, x(t), u(t))

t ∈ R tiempo, x(t) ∈ Rn estado, u(t) ∈ Rm entrada, y(t) ∈ Rp

salida

Supongamos que f no depende explıcitamente de t yu(t) = α(x(t)) (el sistema regula su propio comportamiento)

x(t) = f (x(t), u(t)) = f (x(t), α(x(t))) = F (x(t)) (sistema autonomo)

P.C .I .

{x(t) = F (x(t))x(t0) = x0

x(t) es solucion en el intervalo de tiempo [t0, tf ] ⊆ R si

x(t0) = x0, x(t) = F (x(t)) para todo t ∈ [t0, tf ].

Se llama trayectoria a la representacion de x(t) frente a t.

Se puede tomar, sin perdida de generalidad, t0 = 0 (si no,τ = t − t0).

47

Existencia y unicidad de soluciones

F : Rn → Rn

x → (F1(x), . . . ,Fn(x))T

Matriz jacobiana de F :

∂F

∂x=

∂F1

∂x1· · · ∂F1

∂xn...

. . ....

∂Fn

∂x1· · · ∂Fn

∂xn

Proposicion:

Si ∂F∂x es uniformemente acotada para todo x

(∃ M t. q. ||∂F∂x (x)|| < M para todo x)

⇓F es Lipschitz continua

(∃ c ∈ R t. q. ||F (x)− F (y)|| < c ||x − y || para todo x , y)

⇓x(t) = F (x(t)) tiene solucion y es unica para cada (t, x)

48

Page 25: Teor a de Control - UPV/EHU

Analisis cualitativo: retratos de fase

x(t) = F (x(t)), F (x) indica como cambia x

Para x = (x1, x2) ∈ R2:

Campo de pendientes: en cada punto x se representa el vector F (x).

Ejemplo: sistema de masa y muelle conamortiguacion lineal q(t)+ q(t)+q(t) = 0(c(q(t)) = cq(t), c = k = m)x1(t) = q(t), x2(t) = q(t)

x(t) =

(0 1−1 −1

)x(t)

x ’ = y y ’ = − x − y

−2 −1.5 −1 −0.5 0 0.5 1 1.5 2

−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

x

y

Retrato de fase: grafica que muestra algunas soluciones x(t) = (x1(t), x2(t))T

x ’ = y y ’ = − x − y

−2 −1.5 −1 −0.5 0 0.5 1 1.5 2

−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

x

y

http://math.rice.edu/∼dfield/dfpp.html 49

Analisis cualitativo: puntos de equilibrio

Un punto xe es un punto de equilibrio de un sistema dinamico si elestado del sistema en t0 es xe y x(t) = xe para todo t ≥ t0 enausencia de entradas o perturbaciones.

Para el sistema continuo x(t) = f (t, x(t), u(t)) esto significa que

f (t, xe , 0) = 0 ∀t ≥ t0.

Para el sistema discreto x(k + 1) = f (k , x(k), u(k)) esto significaque

f (k , xe , 0) = xe ∀k ≥ t0.

Para un sistema autonomo x(t) = F (x(t)), xe es un punto deequilibrio si F (xe) = 0.

Si xe punto de equilibrio, x(t) = xe solucion de equilibrio.

50

Page 26: Teor a de Control - UPV/EHU

Analisis cualitativo: puntos de equilibrioEjemplo

Pendulo invertido (J θ(t) = mgl sen θ(t), mglJ = 1): θ(t) = sen θ(t)

x1(t) = θ(t), x2(t) = θ(t),

(x1(t)x2(t)

)=

(x2(t)

sen(x1(t))

)

F (x1, x2) = (x2, sen x1)

F (x1, x2) = 0⇔ x2 = 0, sen x1 = 0⇔ x1 = nπ, x2 = 0, n ∈ Z.

x ’ = y y ’ = sin(x)

−6 −4 −2 0 2 4 6

−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

x

y

51

Estabilidad de los puntos de equilibrioIdea intuitiva de diferentes puntos de equilibrio: consideremos unabola que rueda libremente sobre la superficie de la figura.

Puntos de equilibrio y concepto de estabilidad 7/29

Si la bola esta sobre los puntos A o F, una perturbacion infinitesimalhara que la bola diverja de estos puntos. Intuitivamente podemosdenominar a estos puntos inestables, ya que una pequena perturbacionocasiona que la bola se aleje de ellos.Pequenas perturbaciones en los puntos E y G harıan que la bola volvieraa estos puntos. Los puntos E y G son denominados estables.

Si la bola estuviese sobre el punto C, una pequena perturbacion, en

ausencia de una velocidad inicial, harıa que la bola se ubicara sobre una

nueva posicion. Los puntos como C son llamados neutralmente estables .

Los puntos de equilibrio son A,E ,F y G y cualquier punto entre By D, por ejemplo C . En ausencia de impulsos la bola se queda enesos puntos.En el espacio de estados un punto de equilibrio para un sistemacontinuo es un punto en el que x = 0 en ausencia de entradas yperturbaciones. Si el sistema esta en ese estado, lo seguira estando.Analogamente, para los sistemas discretos, un punto de equilibrioes un punto para el cual x(k + 1) = x(k) en ausencia de entradasy perturbaciones.

52

Page 27: Teor a de Control - UPV/EHU

Estabilidad de los puntos de equilibrioPuntos de equilibrio y concepto de estabilidad 7/29

Si la bola esta sobre los puntos A o F, una perturbacion infinitesimalhara que la bola diverja de estos puntos. Intuitivamente podemosdenominar a estos puntos inestables, ya que una pequena perturbacionocasiona que la bola se aleje de ellos.Pequenas perturbaciones en los puntos E y G harıan que la bola volvieraa estos puntos. Los puntos E y G son denominados estables.

Si la bola estuviese sobre el punto C, una pequena perturbacion, en

ausencia de una velocidad inicial, harıa que la bola se ubicara sobre una

nueva posicion. Los puntos como C son llamados neutralmente estables .

Si la bola esta sobre los puntos A o F , una perturbacioninfinitesimal hara que la bola diverja de esos puntos. Intuitivamentepodemos denominar a esos puntos inestables, ya que una pequenaperturbacion ocasiona que la bola se aleje de ellos.

Pequenas perturbaciones en los puntos E y G harıan que la bolavolviera repetidamente a esos puntos. Los puntos E y G sondenominados estables.

53

Estabilidad de los puntos de equilibrio

La estabilidad tiene que ver con la siguiente cuestion: Si en eltiempo t0 el estado es perturbado de su punto de equilibrio xe ,¿volvera el estado a xe , o permanecera cercano a xe , o divergera dexe?

A partir de ahora supondremos que x(t) = F (x(t)) tiene solucionunica para cada (t, x).

54

Page 28: Teor a de Control - UPV/EHU

Estabilidad de los puntos de equilibrio

x(t) = F (x(t)), xe punto de equilibrio ⇔ F (xe) = 0

xe estable si para todo ε > 0 existe δ > 0 t. q.||x(t0)− xe || < δ ⇒ ||x(t)− xe || < ε para todo t ≥ t0.

Ejemplo

Sistema de masa y muelle sin amortiguacion (k = m)

q(t) + q(t) = 0⇒(

x1(t)x2(t)

)=

(0 1−1 0

)(x1(t)x2(t)

)

⇒ F (x) = (x2,−x1)⇒ xe = (0, 0)

x ’ = y y ’ = − x

−1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1

−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

x

y

x

y

x ’ = y y ’ = − x

0 2 4 6 8 10 12 14 16−1.5

−1

−0.5

0

0.5

1

1.5

t tiempo

x, y

55

Estabilidad de los puntos de equilibrio

x(t) = F (x(t)), xe punto de equilibrio ⇔ F (xe) = 0

xe asintoticamente estable, sumidero o atractor si xe es estable ylımt→∞ x(t) = xe .

Ejemplo

Sistema de masa y muelle con amortiguacion lineal c = k = m⇒

q(t) + q(t) + q(t) = 0⇒(

x1(t)x2(t)

)=

(0 1−1 −1

)(x1(t)x2(t)

)

⇒ F (x) = (x2,−x1 − x2)⇒ xe = (0, 0)

x ’ = y y ’ = − x − y

−2 −1.5 −1 −0.5 0 0.5 1 1.5 2

−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

x

y

x

y

x ’ = y y ’ = − x − y

0 1 2 3 4 5 6 7 8 9 10−3

−2

−1

0

1

2

3

t tiempo

x, y

56

Page 29: Teor a de Control - UPV/EHU

Estabilidad de los puntos de equilibriox(t) = F (x(t)), xe punto de equilibrio ⇔ F (xe) = 0

xe es inestable si no es estable, es decir,

existe ε > 0 t. q. para todo δ > 0 existe t0 verificando ||x(t0)−xe || < δ y

||x(t1)− xe || ≥ ε para algun t1 > t0.

Los puntos de equilibrio inestables pueden ser fuentes o nodos.xe es fuente si:

x ’ = 2 x − y y ’ = − x + 2 y

−1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1

−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

x

y

x

y

x ’ = 2 x − y y ’ = − x + 2 y

0 0.5 1 1.5

−8

−6

−4

−2

0

2

4

6

8

t tiempo

x, y

xe es nodo si:x ’ = y y ’ = sin(x)

−0.5 −0.4 −0.3 −0.2 −0.1 0 0.1 0.2 0.3 0.4 0.5

−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

x

y

x

y

x ’ = y y ’ = sin(x)

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5

−1.5

−1

−0.5

0

0.5

1

1.5

2

2.5

t tiempo

x, y

57

Observaciones

La estabilidad es un concepto local: Un sistema puede tenerpuntos de equilibrio estables e inestables.

x ’ = y y ’ = sin(x)

−6 −4 −2 0 2 4 6

−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

x

y

Las definiciones anteriores valen para sistemas discretos

x(k + 1) = F (x(k))

cambiando t por k .

58

Page 30: Teor a de Control - UPV/EHU

Analisis de estabilidad de Lyapunov

x(t) = F (x(t)), x(t) ∈ Rn

xe = 0 punto de equilibrio (F (xe) = 0) (si no, z = x − xe).

Sea V : Rn → R continua y definimos la derivada de V a lo largode la trayectoria del sistema como

V (x) =dV

dt=∂V

∂x

dx

dt=∂V

∂xF (x)

Si V (x) > 0 para todo x 6= 0 y V (0) = 0 (V definidapositiva) yV (x) ≤ 0 para todo x (V semidefinida negativa)

⇓xe = 0 es estable.

Si V (x) > 0 para todo x 6= 0 y V (0) = 0 (V definidapositiva) yV (x) < 0 para todo x 6= 0 y V (0) = 0 (V definida negativa)

⇓xe = 0 es asintoticamente estable. 1 59

Sistemas lineales invariantes en el tiempo

Forma general de un sistema LIT continuo:

x(t) = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t)

x(t) ∈ Rn, u(t) ∈ Rm, y(t) ∈ Rp, A ∈ Rn×n, B ∈ Rn×m,C ∈ Rp×n, D ∈ Rp×m.

Si u(t) ∈ R, y(t) ∈ R ⇒ sistema SISO (single input single output).En general, MIMO (multiple input multiple output).

Supongamos conocido u(t). Si conocemos el valor de x(t0)entonces los valores de x(t) e y(t) para t ≥ t0 puedendeterminarse de forma unica. Es decir, la ecuacion diferencialx(t) = Ax(t) + Bu(t) con la condicion inicial x(t0) = x0 tienesolucion unica. Se trata de encontrar esa solucion.

60

Page 31: Teor a de Control - UPV/EHU

Sistemas lineales invariantes en el tiempo

Forma general de un sistema LIT discreto:

x(k + 1) = Ax(k) + By(k), y(k) = Cx(k) + Du(k)

x(k) ∈ Rn, u(k) ∈ Rm, y(k) ∈ Rp, A ∈ Rn×n, B ∈ Rn×m,C ∈ Rp×n, D ∈ Rp×m.

Si u(k) ∈ R, y(k) ∈ R ⇒ sistema SISO (single input singleoutput).En general, MIMO (multiple input multiple output).

Supongamos conocido u(k). Si conocemos el valor de x(k0)entonces los valores de x(k) e y(k) para k ≥ k0 puedendeterminarse de forma unica. Es decir, la ecuacion en diferenciasx(k + 1) = Ax(k) + Bu(k) con la condicion inicial x(k0) = x0 tienesolucion unica. Se trata de encontrar esa solucion.

61

Solucion del sistema continuo: caso escalar

x(t) = ax(t) + bu(t)x(t0) = x0

}

Sistema sin control (homogeneo) (u(t) = 0):x(t) = ax(t)x(t0) = x0

}

La solucion es x(t) = x0ea(t−t0)

x(t) = x0ea(t−t0) verifica las dos condiciones:

Condicion inicial: x(t0) = x0ea(t0−t0) = x0.

Ecuacion diferencial: x(t) = x0aea(t−t0) = ax(t).

Sistema con control:x(t) = ax(t) + bu(t)x(t0) = x0

}

La solucion es x(t) = x0ea(t−t0) +

∫ t

t0

ea(t−τ)bu(τ)dτ

62

Page 32: Teor a de Control - UPV/EHU

Solucion del sistema continuo

Sistema sin control (homog.) (u(t) = 0):x(t) = Ax(t)x(t0) = x0

}

La solucion es x(t) = eA(t−t0)x0

x(t) = eA(t−t0)x0 verifica las dos condiciones:

Condicion inicial: x(t0) = eA(t0−t0)x0 = e0x0 = Ix0 = x0.Ecuacion diferencial: x(t) = AeA(t−t0)x0 = Ax(t).

Sistema con control:x(t) = Ax(t) + Bu(t)x(t0) = x0

}

La solucion es x(t) = eA(t−t0)x0 +

∫ t

t0

eA(t−τ)Bu(τ)dτ

63

Solucion del sistema continuo: matriz de transicionx(t) = Ax(t)x(t0) = x0

}Solucion: x(t) = eA(t−t0)x0

A la matriz eA(t−t0) se le llama matriz de transicion de estados.En ausencia de entrada u(t) la matriz de transicion relaciona elestado en el tiempo t con el estado en cualquier otro tiempo t0.Para tiempos cualesquiera t, τ : x(t) = eA(t−τ)x(τ).

eA(t−τ) = I+A(t−τ)+1

2!A2(t−τ)2+

1

3!A3(t−τ)3+· · · (MATLAB: expm)

Como obtener la matriz de transicion:

Si A es diagonal:

A =

a1

. . .

an

⇒ eA(t−τ) =

ea1(t−τ)

. . .

ean(t−τ)

64

Page 33: Teor a de Control - UPV/EHU

Solucion del sistema continuo: matriz de transicion

Si todos los v.p. de A son reales distintos ⇒ existe T ∈ Rn×n

invertible (sus columnas son los vect. propios) t.q.T−1AT = Diag(λ1, . . . , λn), con λ1, . . . , λn los v.p. de A⇒

A = T Diag(λ1, . . . , λn)T−1.

eA(t−τ) = eT Diag(λ1,...,λn)T−1(t−τ) =

eT Diag(λ1(t−τ),...,λn(t−τ))T−1=

T Diag(eλ1(t−τ), . . . , eλn(t−τ))T−1

65

Solucion del sistema continuo: matriz de transicion

Si todos los v.p. de A son complejos conjugados distintos ⇒existe T ∈ Rn×n invertible t.q.

T−1AT =

a1 b1 · · · 0 0−b1 a1 · · · 0 0

. . .

0 0 · · · am bm0 0 · · · −bm am

con λj = aj ± bj i los v.p. de A.

eA(t−τ) = T Diag

e

a1 b1

−b1 a1

(t−τ)

, . . . , e

am bm−bm am

(t−τ)

T−1

e

aj bj−bj aj

(t−τ)

= eaj (t−τ)

(cos(bj(t − τ)) sen(bj(t − τ))−sen(bj(t − τ)) cos(bj(t − τ))

)

66

Page 34: Teor a de Control - UPV/EHU

Solucion del sistema continuo: matriz de transicion

Si A ∈ Rn×n cualquiera ⇒ existe T ∈ Cn×n t.q. T−1AT = J, con

J =

J1

. . .

Jk

, Jj =

λj 1 0 · · · 00 λj 1 · · · 0

.

.

.

.

.

.. . .

. . ....

0 0 · · · λj 10 0 · · · 0 λj

∈ Cnj×nj , λj v.p. de A (MATLAB: jordan)

Esta es la forma de Jordan de A. Se cumple que:

eJt =

eJ1t

. . .

eJk t

, e

Jj t = eλj t

1 t t2

2!· · · t

nj−2

(nj−2)!tnj−1

(nj−1)!

0 1 t · · · tnj−3

(nj−3)!tnj−2

(nj−2)!

.

.

.

.

.

.

.

.

.. . .

.

.

.

.

.

.0 0 0 · · · 1 t0 0 0 · · · 0 1

.

Si λj = aj + ibj ⇒ eλj t = eaj te ibj t = eaj t(cos(bj t) + isen(bj t))

eA(t−τ) = TeJ(t−τ)T−1

67

Solucion del sistema continuo

x(t) = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t)

Solucion:

x(t) = eA(t−t0)x(t0) +

∫ t

t0

eA(t−τ)Bu(τ)dτ,

y(t) = CeA(t−t0)x(t0) +

∫ t

t0

CeA(t−τ)Bu(τ)dτ + Du(t)

68

Page 35: Teor a de Control - UPV/EHU

Solucion del sistema continuo: cambio de coordenadas

x(t) = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t)

Realizamos el cambio de coordenadas: z = Tx ,T ∈ Rn×n invertible Ası,x = T−1z , x = T−1z .

x = Ax + Buy = Cx + Du

}−→ T−1z = AT−1z + Bu

y = CT−1z + Du

}

−→ z = TAT−1z + TBuy = CT−1z + Du

}

Las ecuaciones del sistema con el nuevo vector de estados z son:

z = A′z + B ′uy = C ′z + D ′u

}

con A′ = TAT−1, B ′ = TB, C ′ = CT−1, D ′ = D.

x(t) = T−1z(t) = T−1

(eA′(t−t0)z(t0) +

∫ t

t0

eA′(t−τ)B ′u(τ)dτ

)=

= T−1eA′(t−t0)Tx(t0) + T−1

∫ t

t0

eA′(t−τ)B ′u(τ)dτ

y(t) = C ′Tx(t) + Du(t)69

Solucion del sistema continuo: modos

x(t) = Ax(t)

Sea λ un v.p de A y v su vector propio asociado.Modo es la solucion para la condicion inicial x(t0) = v :

x(t) = eA(t−t0)v = (I + A(t − t0) +1

2!A2(t − t0)2 + · · · )v =

v + λ(t − t0)v +1

2!λ2(t − t0)2v + · · · = eλ(t−t0)v

Nota: la solucion esta en el subespacio generado por v .

Si A tiene n v.p. distintos λ1, . . . , λn con vect.p. v1, . . . , vn (son l.i.),entonces cualquier condicion inicial

x(t0) = α1v1 + · · ·+ αnvn

Solucion:x(t) = α1e

λ1(t−t0)v1 + · · ·+ αneλn(t−t0)vn.

70

Page 36: Teor a de Control - UPV/EHU

Solucion del sistema discreto

Sistema sin control (homog.) (u(k) = 0):x(k + 1) = Ax(k)x(k0) = x0

}

x(k0 + 1) = Ax(k0) = Ax0

x(k0 + 2) = Ax(k0 + 1) = A2x0

...x(k0 + j) = Ax(k0 + j − 1) = Ajx0

La solucion es x(k) = Ak−k0x0

Sistema con control:x(k + 1) = Ax(k) + Bu(k)x(k0) = x0

}

x(k0 + 1) = Ax(k0) + Bu(k0) = Ax0 + Bu(k0)x(k0 + 2) = Ax(k0 + 1) + Bu(k0 + 1) = A2x0 + ABu(k0) + Bu(k0 + 1)x(k0 + 3) = Ax(k0 + 2) + Bu(k0 + 2) = A3x0 + A2Bu(k0) + ABu(k0 + 1) + Bu(k0 + 2)...

La solucion es x(k) = Ak−k0x0 +

k−k0∑

j=1

Ak−k0−jBu(k0 + j − 1)

71

Solucion del sistema discreto: matriz de transicion

x(k + 1) = Ax(k)x(k0) = x0

}Solucion: x(k) = Ak−k0x0

A la matriz Ak−k0 se le llama matriz de transicion de estados.

En ausencia de entrada u(k) la matriz de transicion relaciona elestado en el tiempo k con el estado en cualquier otro tiempo k0.Para tiempos cualesquiera k , j : x(k) = Ak−jx(j).

Como obtener la matriz de transicion:

Si A es diagonal:

A =

a1

. . .

an

⇒ Ak−j =

ak−j1. . .

ak−jn

72

Page 37: Teor a de Control - UPV/EHU

Solucion del sistema discreto: matriz de transicion

Si todos los v.p. de A son reales distintos ⇒ existe T ∈ Rn×n

invertible (sus columnas son los vect. propios) t.q.T−1AT = Diag(λ1, . . . , λn), con λ1, . . . , λn los v.p. de A⇒

A = T Diag(λ1, . . . , λn)T−1.

Ak−j = (T Diag(λ1, . . . , λn)T−1)k−j =

T Diag(λk−j1 , . . . , λk−jn )T−1

73

Solucion del sistema discreto: matriz de transicion

Si todos los v.p. de A son complejos conjugados distintos ⇒existe T ∈ Rn×n invertible t.q.

T−1AT =

a1 b1 · · · 0 0−b1 a1 · · · 0 0

. . .

0 0 · · · am bm0 0 · · · −bm am

con λl = al ± bl i los v.p. de A.

Entonces

Ak−j = T Diag(Ak−j1 , . . . ,Ak−j

m )T−1

con Al =

(al bl−bl al

).

74

Page 38: Teor a de Control - UPV/EHU

Solucion del sistema discreto: matriz de transicionSi A ∈ Rn×n cualquiera ⇒ existe T ∈ Cn×n t.q. T−1AT = J, con

J =

J1

. . .

Jm

, Jl =

λl 1 0 · · · 00 λl 1 · · · 0

.

.

.

.

.

.. . .

. . ....

0 0 · · · λl 10 0 · · · 0 λl

∈ Cnl×nl , λl v.p. de A.

Esta es la forma de Jordan de A. Se cumple que:

Jk =

Jk1

. . .

Jkm

,

Jkl =

(k0

)λkl

(k1

)λk−1l

(k2

)λk−2l

· · ·(

knl−1

)λk−(nl−1)

l

0(k0

)λkl

(k1

)λk−1l

· · ·(

knl−2

)λk−(nl−2)

l

0 0(k0

)λkl · · ·

(k

nl−3

)λk−(nl−3)

l

.

.

.

.

.

.

.

.

.. . .

.

.

.

0 0 0 · · ·(k0

)λkl

Ak−j = TJk−jT−1

75

Solucion del sistema discreto

x(k + 1) = Ax(k) + Bu(k), y(k) = Cx(k) + Du(k)

Solucion:

x(k) = Ak−k0x(k0) +

k−k0∑

j=1

Ak−k0−jBu(k0 + j − 1),

y(k) = CAk−k0x(k0) +

k−k0∑

j=1

CAk−k0−jBu(k0 + j − 1) + Du(k)

76

Page 39: Teor a de Control - UPV/EHU

Solucion del sistema discreto: cambio de coordenadas

x(k + 1) = Ax(k) + Bu(k), y(k) = Cx(k) + Du(k)

Realizamos el cambio de coordenadas: z = Tx ,T ∈ Rn×n invertible. Ası,x = T−1z .

x(k + 1) = Ax(k) + Bu(k)y(k) = Cx(k) + Du(k)

}−→ T−1z(k + 1) = AT−1z(k) + Bu(k)

y(k) = CT−1z(k) + Du(k)

}

−→ z(k + 1) = TAT−1z(k) + TBu(k)y(k) = CT−1z(k) + Du(k)

}

Las ecuaciones del sistema con el nuevo vector de estados z son:

z(k + 1) = A′z(k) + B ′u(k)y(k) = C ′z(k) + D ′u(k)

}

con A′ = TAT−1, B ′ = TB, C ′ = CT−1, D ′ = D.

x(k) = T−1z(k) = T−1

(A′k−k0z(k0) +

k−k0∑

j=1

A′k−k0−jB ′u(k0 + j − 1)

)=

= T−1A′k−k0Tx(k0) + T−1k−k0∑

j=1

A′k−k0−jB ′u(k0 + j − 1)

y(k) = C ′Tx(k) + Du(k)77

Solucion del sistema discreto: modos

x(k + 1) = Ax(k)

Sea λ un v.p de A y v su vector propio asociado.Modo es la solucion para la condicion inicial x(k0) = v :

x(k) = Ak−k0v = Ak−k0−1Av = Ak−k0−1λv = · · · = λk−k0v

Nota: la solucion esta en el subespacio generado por v .

Si A tiene n v.p. distintos λ1, . . . , λn con vect.p. v1, . . . , vn (son l.i.),entonces cualquier condicion inicial

x(k0) = α1v1 + · · ·+ αnvn

Solucion:x(k) = α1λ

k−k01 v1 + · · ·+ αnλ

k−k0n vn.

78

Page 40: Teor a de Control - UPV/EHU

Estabilidad del sistema homogeneoCaso continuo: x(t) = Ax(t)Caso discreto: x(k + 1) = Ax(k)

F (x) = Ax

x punto de equilibrio ⇔ Ax = 0⇔ x = 0

Por lo tanto, x = 0 es el unico punto de equilibrio.

Estabilidad del sistema=estabilidad del punto de equilibrio 0.

Si hacemos un cambio de coordenadas z = Tx , T invertible, elnuevo sistema

z(t) = TAT−1z(t) o z(k + 1) = TAT−1z(k)

es (asint.) estable ⇔ el sistema inicial es (asint.) estable.

Veamos que la estabilidad del sistema depende de los valorespropios de A.

79

Estabilidad del sistema discreto homogeneox(k + 1) = Ax(k)

Sistema asintoticamente estable⇔ |λl | < 1 para todos los v.p. de ASistema estable⇔ |λl | ≤ 1 para todos los v.p. de A y si |λl | = 1 para algunv.p. entonces su bloque de Jordan es 1× 1Sistema inestable⇔ |λl | > 1 para algun v.p. de A o |λl | = 1 para algunv.p. cuyo bloque de Jordan es de orden mayor que 1

Dem.- x(k) = T−1JkTx(0) es solucion, (J = TAT−1 forma de Jordan)Estudiamos la estabilidad de z(k + 1) = Jz(k). Su solucion es z(k) = Jkz(0)

Jk =

Jk1

. . .

Jkm

, J

kl =

(k0

)λkl

(k1

)λk−1l

(k2

)λk−2l

· · ·(

knl−1

)λk−(nl−1)

l

0(k0

)λkl

(k1

)λk−1l

· · ·(

knl−2

)λk−(nl−2)

l

0 0(k0

)λkl · · ·

(k

nl−3

)λk−(nl−3)

l

.

.

.

.

.

.

.

.

.. . .

.

.

.

0 0 0 · · ·(k0

)λkl

|λl | < 1 ∀l ⇔ lımk→∞ Jkl = 0 ∀l ⇔ lımk→∞ z(k) = 0,∀z(0)

Si |λl | = 1 y su bloque de Jordan es 1× 1⇒ Jkl = λk

l ⇒ zl(k) = λkl zl(0)

y |zl(k)| = |λkl ||zl(0)| = |zl(0)|. Si zl(0) esta cerca de 0⇒ zl(k)

esta cerca de 0 para todo k > 0. 80

Page 41: Teor a de Control - UPV/EHU

Estabilidad del sistema continuo homogeneox(t) = Ax(t)

Sistema asintoticamente estable⇔todos los v.p. de A tienen parte real < 0Sistema estable⇔todos los v.p. de A tienen parte real ≤ 0 y si es 0 entoncesel bloque de Jordan es 1× 1Sistema inestable⇔algun v.p. de A tiene parte real > 0 o tiene parte real0 cuando el bloque de Jordan es n × n, n 6= 1

Dem.- x(t) = T−1eJtTx(0) es solucion, (J = TAT−1 forma de Jordan)Estudiamos la estabilidad de z(t) = Jz(t). Su solucion es z(t) = eJtz(0)

eJt =

eJ1t

. . .

eJk t

, e

Jj t = eRe(λj )t

(cos(Im(λj )t)+isen(Im(λj )t))

1 t · · · tnj−2

(nj−2)!tnj−1

(nj−1)!

0 1 · · · tnj−3

(nj−3)!tnj−2

(nj−2)!

.

.

.

.

.

.. . .

.

.

.

.

.

.0 0 · · · 1 t0 0 · · · 0 1

.

Re(λj) < 0 ∀j ⇔ lımt→∞ eJj t = 0 ∀j ⇔ lımt→∞ z(t) = 0, ∀z(0)

Si λj = 0⇒ zj(t) = zj(0). Si zj(0) esta cerca de 0⇒ zj(t)esta cerca de 0 para todo t > 0.Si λj = ±bi ⇒ zj(t) = (cos(bt) + i sen(bt))zj(0). Si zj(0)esta cerca de 0⇒ zj(t) esta cerca de 0 para todo t > 0.

81

Estabilidad del sistema continuo homogeneox(t) = Ax(t)

Sistema asintoticamente estable

mtodos los v.p. de A tienen parte real negativa

mpara cualquier matriz Q simetrica definida positiva, la ecuacion

ATP + PA = −Qtiene una solucion P simetrica definida positiva.

Dem.- ⇒) P =∫∞

0 eAT tQeAtdt es simetrica definida positiva. Ademas,

ATP+PA =

∫ ∞

0

deAT t

dtQeAtdt+

∫ ∞

0eA

T tQdeAt

dtdt =

∫ ∞

0

d(eAT tQeAt)

dtdt = eA

T tQeAt |∞0 = −Q

⇐) P definida positiva implica V (x) = xTPx > 0 para todo x 6= 0 y V (0) = 0.

V (x) =d(xTPx)

dt=

dxT

dtPx + xTP

dx

dt= (Ax)TPx + xTPAx = xTATPx + xTPAx =

= xT (ATP + PA)x = −xTQx ⇒ V (x) < 0 si x 6= 0 y V (0) = 0.

Por el teorema de Lyapunov, el sistema es asintoticamente estable. 182

Page 42: Teor a de Control - UPV/EHU

Estabilidad de sistemas continuos no lineales

x(t) = Ax(t) + g(x(t)) (1)

con g(x) un polinomio de grado mayor que 1 t. q. g(0) = 0.

Si todos los v.p. de A tienen parte real < 0 entonces xe = 0 es un puntode equilibrio asintoticamente estable localmente de (1).

Dem.- Sean P,Q simetricas definidas positivas tales que ATP + PA = −Q.Sea V (x) = xTPx .

V (x) =dxT

dtPx + xTP

dx

dt= (Ax + g(x))TPx + xTP(Ax + g(x)) =

= (xTAT + g(x)T )Px + xTP(Ax + g(x)) =

= xT (ATP+PA)x+g(x)TPx+xTPg(x) = −xTQx+g(x)TPx+xTPg(x).

xTPg(x) = (Pg(x))T x = g(x)TPT x = g(x)TPx .

V (x) = −xTQx+ 2g(x)TPx < 0 en un entorno de 0, x 6= 0.0 o terminos degrado ≥ 3

83

Linealizacion jacobianaLinealizacion=aproximacion por modelos lineales de un modelo no lineal.Da buenos resultados cuando usada localmente.

x(t) = f (x(t)), xe punto de equilibrio

Desarrollo de Taylor en un entorno de xe :f (x) = ∂f

∂x (xe)(x − xe) + g(x) con

∂f

∂x(xe) =

(∂fi∂xj

(xe)

)(matriz jacobiana), g(xe) = 0, d(g(x)) ≥ 2.

Para linealizar:z = x − xe

Linealizacion jacobiana:

z(t) = Az(t), con A =∂f

∂x(xe).

Si la linealizacion es asint. estable

⇓xe es asint. estable localmente para el sistema no lineal. 84

Page 43: Teor a de Control - UPV/EHU

Linealizacion jacobianaLinealizacion=aproximacion por modelos lineales de un modelo no lineal.Da buenos resultados cuando usada localmente.

x(t) = f (x(t), u(t)), y(t) = h(x(t), u(t)), (xe , ue) punto de equilibrio

Para linealizar:

z = x − xe , v = u − ue , w = y − h(xe , ue)

Linealizacion jacobiana:

z(t) = Az(t) + Bv , w = Cz + Dv , con

A =∂f

∂x|(xe ,ue), B =

∂f

∂u|(xe ,ue), C =

∂h

∂x|(xe ,ue), D =

∂h

∂u|(xe ,ue) .

Si la linealizacion es asint. estable

⇓(xe , ue) es asint. estable localmente para el sistema no lineal.

85

Linealizacion por realimentacion

x(t) = f (x(t), u(t)), y(t) = h(x(t), u(t))

Linealizacion por realimentacion: si existe una ley derealimentacion u = α(x , v) con resultado un sistema lineal conentrada v y salida y .

Ejemplo

M(q)q + C (q, q) = B(q)u,

M(q) ∈ Rn×n invertible,C (q, q) ∈ Rn,B(q) ∈ Rn×n invertible.Elegimos

u = B−1(q)(M(q)v + C (q, q))

Entoncesq = v .

86

Page 44: Teor a de Control - UPV/EHU

Definicion de controlabilidad

x(t) = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t)

A ∈ Rn×n,B ∈ Rn×m,C ∈ Rp×n,D ∈ Rp×m

¿Existe una entrada u(t) t.q. cualquier estado puede ser alcanzado?

Un sistema lineal es controlable en t0 si para cualquier estado finalxf existe un control u(t) que transfiere el estado inicial x(t0) a xfen un tiempo finito.

Un sistema lineal es completamente controlable o controlable si escontrolable para cualquier t0 y x(t0). Es decir,

Un sistema lineal es controlable si para cualquier t0 y cualesquierax0, xf ∈ Rn t. q. x(t0) = x0 existen t1 > t0 finito y u : [t0, t1]→ Rm

t. q. x(t1) = xf .

Nota: Se puede tomar t0 = 0 y xf = 0 sin perdida de generalidad. 87

Definicion de controlabilidad

Sabemos que

x(t) = eA(t−t0)x(t0) +

∫ t

t0

eA(t−τ)Bu(τ)dτ

Por lo tanto,

La controlabilidad depende de las matrices A y B y nodepende de C y D.

Si B = 0 el sistema no es controlable:

x(t) = eA(t−t0)x(t0) 6= 0 si x(t0) 6= 0.

88

Page 45: Teor a de Control - UPV/EHU

Definicion de controlabilidad

Ejemplo

Consideremos el sistema descrito en la figura:

Bajo hipotesis convenientes, las ecuaciones de continuidad paracada deposito conducen al siguiente sistema en el que Ai son lasareas de la superficie de los lıquidos, hi las alturas del lıquido,i = 1, 2, 3 y R1,R2 constantes. 89

Definicion de controlabilidad

A1h1(t) = −h1(t)−h2(t)R1

+ u1(t)

A2h1(t) = −h1(t)−h2(t)R1

− h2(t)−h3(t)R2

+ u2(t)

A3h3(t) = −h2(t)−h3(t)R2

+ u3(t)

Fijadas unas alturas iniciales y unas alturas finales, ¿es posiblegraduar los caudales u1, u2, u3 de forma que transcurrido untiempo finito t1 las alturas finales sean las fijadas? ¿y si soloabrimos uno de los grifos?

90

Page 46: Teor a de Control - UPV/EHU

Prueba algebraica de controlabilidad

Lema: Sea A ∈ Rn×n. Entonces existen n funciones escalaresα0(t), α1(t), . . . , αn−1(t) tales que

eAt = α0(t)I + α1(t)A + · · ·+ αn−1(t)An−1.

Dem.- Por el Teorema de Cayley-Hamilton.

91

Prueba algebraica de controlabilidad

C(A,B) = (B AB A2B · · · An−1B) (matriz de controlabilidad)

Sistema controlable ⇔ C(A,B) de rango completo por columnas

Dem.- ⇒) Tomamos t0 = 0, xf = 0 y supongamos rang C(A,B) < n.Entonces las filas de C(A,B) son l.d., es decir, existe un vector fila q 6= 0 t.q.

qB = 0, qAB = 0, . . . , qAn−1B = 0.

La solucion del sistema es x(t) = eAt(x0 +

∫ t

0e−AτBu(τ)dτ

)para cualquier x0.

Tomando x(t1) = xf = 0⇒ −x0 =∫ t1

0e−AτBu(τ)dτ . Por el Lema:

e−Aτ = α0(τ)I + α1(τ)A + α2(τ)A2 + · · ·+ αn−1(τ)An−1. Ası,

−x0 =∫ t1

0

(α0(τ)I + α1(τ)A + α2(τ)A2 + · · ·+ αn−1(τ)An−1

)Bu(τ)dτ

Premultiplicando por q, qx0 = 0 para todo x0 ⇒ q = 0. Absurdo.

⇐) Definimos P =∫ t1

0e−AτBBT e−AT τdτ ∈ Rn×n.

Como rang C(A,B) = n, P es simetrica y definida positiva ⇒ P invertible.

Definimos u(t) = −BT e−AT tP−1(x0 − e−At1xf ), 0 ≤ t ≤ t1.x(t1) = eAt1

(x0 +

∫ t10

e−AτBu(τ)dτ)

=

eAt1(x0 −

∫ t10

e−AτBBT e−AT τP−1(x0 − e−At1xf )dτ)

=

eAt1(x0 − PP−1(x0 − e−At1xf )

)= xf

92

Page 47: Teor a de Control - UPV/EHU

Forma canonica controlable de un sistema SISOx(t) = Ax(t) + Bu(t), y(t) = Cx(t) + du(t) x(t) ∈ Rn, u(t) ∈ R,y(t) ∈ R, controlable⇒ existe T ∈ Rn invertible tal que z = Tx yForma canonica controlable: 2

z = TAT−1z+TBu =

−a1 −a2 · · · −an−1 −an1 0 · · · 0 00 1 · · · 0 0...

.... . .

......

0 0 · · · 1 0

z+

100...0

u

y = CT−1z + Du =(b1 b2 · · · bn−1 bn

)z + du

El polinomio caracterıstico de TAT−1 es:

λ(s) = sn + a1sn−1 + · · ·+ an−1s + an = det(sIn − A)

C(TAT−1,TB) =

1 −a1 a21 − a2 · · · ∗

0 1 −a1 · · · ∗...

.... . .

. . ....

0 0 0 · · · ∗0 0 0 · · · 1

=

1 a1 a2 · · · an−1

0 1 a1 · · · an−2

......

.... . .

...0 0 0 · · · a1

0 0 0 · · · 1

−1

.

93

Cambio de coordenadas para adquirir la forma canonicaLlamando:

A = TAT−1 =

−a1 −a2 · · · −an−1 −an1 0 · · · 0 00 1 · · · 0 0...

.... . .

......

0 0 · · · 1 0

, B = TB =

100...0

EntoncesC(A, B) = [B AB · · · An−1B] =

[TB TAT−1TB · · · (TAT−1)n−1TB] = TC(A,B)

T = C(A, B)C(A,B)−1

con

C(A, B) =

1 −a1 a21 − a2 · · · ∗

0 1 −a1 · · · ∗...

.... . .

. . ....

0 0 0 · · · ∗0 0 0 · · · 1

=

1 a1 a2 · · · an−1

0 1 a1 · · · an−2

......

.... . .

...0 0 0 · · · a1

0 0 0 · · · 1

−1

.

Por lo tanto, conocidos A, su polinomio caracterıstico y B podemos calcular T(el cambio de coordenadas para adquirir la forma canonica controlable). 3

94

Page 48: Teor a de Control - UPV/EHU

Mas consideraciones sobre controlabilidadx(t) = Ax(t) + Bu(t) es controlable si y solo si la matriz

U(t1) =

∫ t1

0e−AτBBT e−A

T τdτ ∈ Rn×n

es no singular (invertible).Ademas, un control u : [0, t1]→ Rm t. q. x(t1) = xf es

u(t) = −BT e−AT tU(t1)−1

(x(0)− e−At1xf

).

Cualquier otro control u : [0, t1]→ Rm t. q. x(t1) = xf , u(t) 6= u(t)en [0, t1] cumple

∫ t1

0||u(τ)||2dτ ≤

∫ t1

0||u(τ)||2dτ.

Interpretacion: u(t) es el control que minimiza la energıa o elconsumo.

95

Mas consideraciones sobre controlabilidadSi para xf ∈ Rn existe ξ ∈ Rn tal que

U(t1)ξ = x(0)− e−At1xf (2)

entonces el controlu(t) = −BT e−A

T tξ

transfiere el sistema x(t) = Ax(t) +Bu(t) desde x(0) a x(t1) = xf .

Notas:

Si x(t) = Ax(t) + Bu(t) es controlable el control anterior esel que minimiza la energıa.

El recıproco se cumple: solo los xf que cumplen (2) puedenser alcanzados por algun control.

Un estado inicial x(0) = x0 se puede transferir al estado final xf six0, xf ∈< C(A,B) >.

96

Page 49: Teor a de Control - UPV/EHU

Definicion de observabilidad

x(t) = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t)

¿Se puede determinar el estado del sistema a partir de las entradasy las salidas?

Un sistema lineal es observable en t0 si es posible determinar x(t0)a partir del conocimiento de u(t) e y(t) para todo t ∈ [t0, t1]donde t1 es finito y t1 ≥ t0.

Un sistema lineal es completamente observable u observable si esobservable para cualquier t0 y x(t0).

Un sistema lineal es observable si para cualquier t0 y cualquierx(t0) = x0 existe t1 > t0 finito tal que el conocimiento de u(t)e y(t), t ∈ [t0, t1], es suficiente para determinar x0 de forma unica.

97

Definicion de observabilidad

Ejemplo

Consideremos un horno electrico

Definiciones 15/83

Ejemplo

Consideremos un horno electrico

������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������

������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������������

T

T2

T1

La temperatura interior se controla variando la potencia termicau(t) aportada a traves de las paredes del horno, mediante el uso deuna resistencia electrica.Sea c1 la capacidad calorıfica de las paredes del horno y c2 la de sucarga interior; a1 y a2 las areas de la superficie interior y exteriorde las paredes del horno, y h1, h2 los coeficientes respectivos detransferencia termica.

La temperatura interior T2 se controla variando la potenciatermica u(t) aportada a traves de las paredes del horno, medianteel uso de una resistencia electrica.Sea c1 la capacidad calorıfica de las paredes del horno y c2 la de sucarga interior; a1 y a2 las areas de la superficie interior y exteriorde las paredes del horno; y h1 y h2 los coeficientes respectivos detransferencia termica de las superficies.

98

Page 50: Teor a de Control - UPV/EHU

Definicion de observabilidadSupongamos para cualquier instante t una distribucion uniforme de lastemperaturas y que la velocidad de perdida de calor o potencia termicadisipada es proporcional al area y a la diferencia de temperatura entre lapared correspondiente y su entorno. Queremos que la salida sea ladiferencia de temperatura entre las paredes del horno y el exterior.Entonces:

c1T1(t) = a2h2(T∞ − T1(t)) + a1h1(T2(t)− T1(t)) + u(t)

c2T2(t) = a1h1(T1(t)− T2(t))y(t) = T1(t)− T∞

Tomando x1(t) = T1(t)− T∞, x2(t) = T2(t)− T∞:

x(t) =

(− a1h1+a2h2

c1

a1h1

c1a1h1

c2− a1h1

c2

)x(t)+

(1c1

0

)u(t), y(t) =

(1 0

)x(t)

Esta claro que puede existir una imposibilidad de medir directamente latemperatura interior T2.El sistema es observable si T2(t0) es determinable conocidas u(t) y y(t)enun intervalo de tiempo.

99

Definicion de observabilidad

x(t) = eA(t−t0)x(t0) +

∫ t

t0

eA(t−τ)Bu(τ)dτ,

y(t) = CeA(t−t0)x(t0) +

∫ t

t0

CeA(t−τ)Bu(τ)dτ + Du(t)

Se puede tomar u(t) ≡ 0 para t ∈ [t0, t1] sin perdida de generalidad:los dos ultimos terminos de la segunda ecuacion son conocidos y sepueden restar de y(t).

La observabilidad depende de las matrices A y C y no de B y D.

Prueba algebraica de observabilidad:

O(A,C ) =

CCACA2

...CAn−1

(matriz de observabilidad)

Sistema observable ⇔ O(A,C ) de rango completo por filas100

Page 51: Teor a de Control - UPV/EHU

Prueba algebraica de observabilidad

O(A,C) =

CCACA2

...CAn−1

Sistema observablem

O(A,C) de rango completo por filas

Dem.- ⇑)

y = Cx + Dudydt

= C(Ax + Bu) + D dudt

= CAx + CBu + D dudt

d2ydt2 = CA(Ax + Bu) + CB du

dt+ D d2u

dt2 = CA2x + CABu + CB dudt

+ D d2udt2

...dn−1ydtn−1 = CAn−1x + CAn−2Bu + CAn−3B du

dt+ · · ·+ CB dn−2u

dtn−2 + D dn−1udtn−1

y − Dudydt− CBu − D du

dtd2ydt2 − CABu − CB du

dt− D d2u

dt2

...dn−1ydtn−1 − CAn−2Bu − CAn−3B du

dt− · · · − CB dn−2u

dtn−2 − D dn−1udtn−1

=

CCACA2

...CAn−1

x

Si O(A,C) es de rango completo por filas, entonces se obtiene x de forma unica.101

Prueba algebraica de observabilidad

O(A,C) =

CCACA2

...CAn−1

Sistema observablem

O(A,C) de rango completo por filas

Dem.- ⇓)

y(t) = CeA(t−t0)x(t0) +

∫ t

t0

CeA(t−τ)Bu(τ)dτ + Du(t)

Llamamos y(t) = CeA(t−t0)x(t0)

Por el Lema 1:

y(t) = (α0(t)C + α1(t)CA + α2(t)CA2 + · · ·+ αn−1(t)CAn−1)x(t0)

Si O(A,C) no es de rango completo por filas, entonces existe x(t0) 6= 0 t.q.y(t) = 0 ⇒ x(t0) no se puede determinar ⇒ el sistema no es observable (dadala salida no se sabe cual es el estado)

102

Page 52: Teor a de Control - UPV/EHU

DualidadEl sistema

x(t) = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t) (3)

es controlablem

el sistema dual

x(t) = AT x(t) + CTu(t), y(t) = BT x(t) + Du(t) (4)

es observable.

Dem.- (3) controlable ⇔ n = rang(B AB . . . An−1B) =

= rang(B AB . . . An−1B)T = rang

BT

BTAT

...BT (AT )n−1

⇔ (4) observable.103

Forma canonica observable de un sistema SISOx(t) = Ax(t) + Bu(t), y(t) = Cx(t) + du(t) x(t) ∈ Rn, u(t) ∈ R,y(t) ∈ R observable⇒ existe T ∈ Rn×n invertible t.q. z = Tx yForma canonica observable: 2

z = TAT−1z + TBu =

−a1 1 0 · · · 0−a2 0 1 · · · 0

......

.... . .

...−an−1 0 0 · · · 1−an 0 0 · · · 0

z +

b1

b2

...bn−1

bn

u

y = CT−1z + Du =(

1 0 0 · · · 0)z + du

El polinomio caracterıstico de TAT−1 es:

λ(s) = sn + a1sn−1 + · · ·+ an−1s + an = det(sIn − A)

O(TAT−1,CT−1) =

1 0 0 · · · 0−a1 1 0 · · · 0

a21 − a2 −a1 1 · · · 0

......

.... . .

...∗ ∗ ∗ · · · 1

=

1 0 · · · 0a1 1 · · · 0a2 a1 · · · 0...

.... . .

...an−1 an−2 · · · 1

−1

=

O(A,C)T−1104

Page 53: Teor a de Control - UPV/EHU

Realimentacion de estados

x(t) = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t)

x(t) ∈ Rn, u(t) ∈ Rm, y(t) ∈ Rp,A ∈ Rn×n,B ∈ Rn×m,C ∈ Rp×n,D ∈ Rp×p.

++

++

D

B

A

Cx’(t) x(t) y(t)u(t)

El sistema viene determinado por las matrices A,B,C ,D, que nopueden ser alteradas por el disenador para mejorar su rendimiento.Para alterar el rendimiento del sistema habra que alterar de algunaforma las senales externas. El objetivo de realizar unarealimentacion es mejorar las caracterısticas del sistema en algunsentido.

105

Realimentacion de estados

x(t) = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t)

Realimentacion lineal de estados: consiste en hacer el cambio

u(t) = Fv(t)− Kx(t)

v(t) ∈ Rq,F ∈ Rm×q,K ∈ Rm×n (Generalmente q = m).

Feedback de estados y de salidas 48/83

Feedback de estadosConsiste en realizar el cambio

u(t) = Fv(t)− Kx(t) o u(k) = Fv(k)− Kx(k)

donde v F Kp × 1 r × p r × n

.x

F

D

B

K

A

C+

++

++

v w u x y

(Generalmente p = r , F cuadrada).106

Page 54: Teor a de Control - UPV/EHU

Realimentacion de estadosRealizando una realimentacion de estados el sistema se transforma:

x = Ax + Buy = Cx + Du

}u=Fv−Kx−→ x = Ax + B(Fv − Kx)

y = Cx + D(Fv − Kx)

}−→

−→ x = (A− BK )x + BFvy = (C − DK )x + DFv

}

Las nuevas matrices del sistema son:

A = A− BK , B = BF , C = C − DK , D = DF .

Si D = 0 entonces C = C , D = 0.

Analogamente para sistemas discretos.

Si un sistema es controlable, es posible realizar una realimentacionde estados de forma que el sistema realimentado sea estable. Paraello el disenador tendra que elegir la matriz K de modo que lanueva matriz de estados A− BK tenga unos v.p. adecuados.

107

Asignacion de valores propios por realimentacion deestados

x(t) = Ax(t)+Bu(t), y(t) = Cx(t)+du(t), x(t) ∈ Rn, u(t), y(t) ∈ R controlable

Objetivo: llevar la salida y(t) a un valor de referencia r y mantenerlo ahı.Utilizamos realimentacion lineal de estados:

u(t) = fr − Kx(t), f ∈ R,K ∈ R1×n

x(t) = (A− BK)x(t) + Bfr

Objetivo equivalente: determinar K para que el nuevo sistema tenga polinomio

caracterıstico p(s) = sn + p1sn−1 + · · ·+ pn−1s + pn (problema de asignacion

de v.p. ) y f para que la salida estado estable sea r .

xe = −(A− BK)−1Bfr , ye = Cxe + due , ue = fr − Kxe

f debera ser elegido para que ye = r .Si d = 0⇒ Cxe = r ⇒ −C(A− BK)−1Bfr = r ⇒ f = −1

C(A−BK)−1B.

108

Page 55: Teor a de Control - UPV/EHU

Asignacion de valores propios por realimentacion deestados

Supongamos que el polinomio caracterıstico de A es

det(sI − A) = sn + a1sn−1 + · · ·+ an−1s + an.

Realizamos el cambio z = Tx para poner el sistema en forma controlable

z = TAT−1z+TBu =

−a1 −a2 · · · −an−1 −an1 0 · · · 0 00 1 · · · 0 0...

.... . .

......

0 0 · · · 1 0

z+

100...0

u

y = CT−1z =(b1 b2 · · · bn−1 bn

)z

El cambio z = Tx afecta a la realimentacion de estados:

u = fr − KT−1z

Queremos determinar K = [k1 · · · kn] t.q.

det(sI − (A− BK )) = p(s) = sn + p1sn−1 + · · ·+ pn−1s + pn.

109

Asignacion de valores propios por realimentacion deestados

Denotamos KT−1 = [k1 · · · kn].Tras realizar la realimentacion de estados:

z(t) = T (A−BK)T−1z+TBfr =

−a1 − k1 −a2 − k2 · · · −an−1 − kn−1 −an − kn1 0 · · · 0 00 1 · · · 0 0

.

.

.

.

.

.. . .

.

.

.

.

.

.0 0 · · · 1 0

z+

f00

.

.

.0

r

y = CT−1z =(

b1 b2 · · · bn−1 bn)z

det(sI − (A− BK)) = det(sI − T (A− BK)T−1) = sn + (a1 + k1)sn−1 + · · · + (an−1 + kn−1)s + an + kn

Por lo tanto, queremos

sn + (a1 + k1)sn−1 + · · ·+ (an−1 + kn−1)s + an + kn = p(s)

⇓k1 = p1 − a1, k2 = p2 − a2, · · · kn = pn − an

⇓KT−1 = [p1 − a1 p2 − a2 · · · pn − an]

⇓K = [p1 − a1 p2 − a2 · · · pn − an]T 110

Page 56: Teor a de Control - UPV/EHU

Asignacion de valores propios por realimentacion deestados

Sabemos que 3

T = W C(A,B)−1

W =

1 a1 a2 · · · an−1

0 1 a1 · · · an−2

......

.... . .

...0 0 0 · · · a1

0 0 0 · · · 1

−1

.

Ası,

K = [p1 − a1 p2 − a2 · · · pn − an]W C(A,B)−1

Ademas,

f =−1

C (A− BK )−1B=

−1

CT−1(TAT−1 − TBKT−1)−1TB=−1

− bnpn

=pnbn

111

Transformada de Laplace

La transformada de Laplace de una funcion f (t), t ≥ 0, es lafuncion

L[f (t)] = f (s) =

∫ ∞

0f (t)e−stdt

donde el parametro s ∈ C.Propiedades:

Linealidad:L[af (t) + bg(t)] = aL[f (t)] + bL[g(t)] = af (s) + bg(s).

Derivabilidad:

L[f ′(t)] = sL[f (t)]− f (0) = sf (s)− f (0).L[f ′′(t)] = s2L[f (t)]− sf (0)− f ′(0) = s2f (s)− sf (0)− f ′(0).L[f (n)(t)] = snL[f (t)]− sn−1f (0)− · · · − f (n−1)(0) = snf (s)−sn−1f (0)− · · · − f (n−1)(0) = snf (s)−∑n

i=1 sn−i f (i−1)(0).

112

Page 57: Teor a de Control - UPV/EHU

Funcion de transferencia

x(t) = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t)

x(t) ∈ Rn, u(t) ∈ Rm, y(t) ∈ Rp, A ∈ Rn×n, B ∈ Rn×m,C ∈ Rp×n, D ∈ Rp×m. Supongamos x(0) = 0.

Realizando la transformada de Laplace:

sx(s) = Ax(s) + Bu(s), y(s) = Cx(s) + Du(s)

m(sI − A)x(s) = Bu(s), y(s) = Cx(s) + Du(s)

mx(s) = (sI − A)−1Bu(s), y(s) = Cx(s) + Du(s)

Por lo tanto,

y(s) = (C (sI − A)−1B + D)u(s).

Funcion o matriz de transferencia: G (s) = C (sI − A)−1B + D.

113

Funcion de transferencia(sI − A)−1 = Adj(sI−A)

det(sI−A) .

Como I = (sI − A)∑∞

k=1Ak−1

skcuando |s| > ||A||,

(sI − A)−1 =∞∑

k=1

Ak−1

sk.

G (s) = C (sI − A)−1B + D es una matriz racional propiap ×m (sus elementos son funciones racionales con grado dedenominador mayor o igual que el del numerador):

G (s) =C Adj(sI − A)B

det(sI − A)+ D,

G (s) = D +∞∑

k=1

CAk−1B

sk, |s| > ||A||.

Si D = 0, G (s) = C (sI − A)−1B es una matriz racionalestrictamente propia (grado del denominador de cadaelemento mayor que el del numerador).

114

Page 58: Teor a de Control - UPV/EHU

Invarianza de la funcion de transferencia por un cambio decoordenadas

La matriz de transferencia es invariante respecto a un cambio decoordenadas:

x(t) = Ax(t) + Bu(t), y(t) = Cx(t) + Du(t) (5)

Realizamos el cambio de coordenadas z = Tx , T invertible.El nuevo sistema es

T−1z(t) = AT−1z(t) + Bu(t), y(t) = CT−1z(t) + Du(t)

z(t) = TAT−1z(t) + TBu(t), y(t) = CT−1z(t) + Du(t) (6)

La matriz de transferencia de (5) es:

G1(s) = C (sI − A)−1B + D.

La matriz de transferencia de (6) es:

G2(s) = CT−1(sI−TAT−1)−1TB+D = CT−1(T (sI−A)T−1)−1TB+D =

CT−1T (sI − A)−1T−1TB + D = C (sI − A)−1B + D = G1(s).

115

Transformada Z

Dada una sucesion x = (x(0), x(1), x(2), . . .) la transformada Z sedefine como

Z [x(k)] = x(z) =∞∑

k=0

x(k)z−k = x(0) +x(1)

z+

x(2)

z2+ · · ·

donde existe para z ∈ C.

Propiedades:

Linealidad:Z [ax(k) + by(k)] = aZ [x(k)] + bZ [y(k)] = ax(z) + by(z).

Desplazamiento en el tiempo: Z [x(k + n)] = znx(z),n=0,1,2,. . . .

116

Page 59: Teor a de Control - UPV/EHU

Funcion de transferenciaEcuacion en diferencias lineal invariante en el tiempo:

x(k+1) = Ax(k)+Bu(k), y(k) = Cx(k)+Du(k), k = 0, 1, 2, . . .

x(k) ∈ Rn, u(k) ∈ Rm, y(k) ∈ Rp, A ∈ Rn×n, B ∈ Rn×m,C ∈ Rp×n, D ∈ Rp×m.Supongamos x(k) = u(k) = y(k) = 0 para k < 0.

Realizando la transformada Z:

zx(z) = Ax(z) + Bu(z), y(z) = Cx(z) + Du(z)

m(zI − A)x(z) = Bu(z), y(z) = Cx(z) + Du(z)

mx(z) = (zI − A)−1Bu(z), y(z) = Cx(z) + Du(z)

Por lo tanto,

y(z) = (C (zI − A)−1B + D)u(z).

Funcion o matriz de transferencia: G (z) = C (zI − A)−1B + D. 117

Conexion de sistemasSupongamos dos sistemas representados en el espacio de estados

x1 = A1x1 + B1y1

y1 = C1x1 + D1u1

}(S1)

x2 = A2x2 + B2u2

y2 = C2x2 + D2u2

}(S2)

El sistema (S1) tiene m1 entradas, p1 salidas y n1 variables de estado:

u1 =

u11

...u1m1

, y1 =

y11

...y1p1

, x1 =

x11

...x1n1

.

El sistema (S2) tiene m2 entradas, p2 salidas y n2 variables de estado:

u2 =

u21

...u2m2

, y2 =

y21

...y2p2

, x2 =

x21

...x2n2

.

Supongamos que sus funciones de transferencia son G1(s) y G2(s)respectivamente:

y1(s) = G1(s)u1(s), y2(s) = G2(s)u2(s)

118

Page 60: Teor a de Control - UPV/EHU

Conexion de sistemas: paraleloConexion en paralelo (u1 = u2)Podemos conectar los dos sistemas en paralelo, de forma que u1 = u2.

Dos posibilidades:

S1

u1 y1

u2 y2

S2

u1=u2

+

S1

S2

u2

y=y1+y2u1=u2

u1 y1

y2

(1) (2)

Lamamos u, x , y a los vectores de entrada, estado y salida del sistemacompuesto.En los dos casos

u = u1 = u2.

119

Conexion de sistemas: paraleloTomamos como vector de estados:

x =

(x1

x2

)=(x11 · · · x1n1 x21 · · · x2n2

)T.

Ecuacion de estado: hay que expresar x =

(x1

x2

)en funcion de

x =

(x1

x2

)y u = u1 = u2:

x1 = A1x1 + B1u1 = A1x1 + B1u,x2 = A2x2 + B2u2 = A2x2 + B2u.

Es decir,(

x1

x2

)=

(A1 00 A2

)(x1

x2

)+

(B1

B2

)u.

A =

(A1 00 A2

), B =

(B1

B2

).

120

Page 61: Teor a de Control - UPV/EHU

Conexion de sistemas: paralelo

Ecuacion de salida:

(1)

S1

u1 y1

u2 y2

S2

u1=u2

El vector de salida es y =

(y1

y2

).

Hay que expresar y =

(y1

y2

)en funcion de x =

(x1

x2

)y u = u1 = u2:

y1 = C1x1 + D1u1 = C1x1 + D1u,y2 = C2x2 + D2u2 = C2x2 + D2u.

(y1

y2

)=

(C1 00 C2

)(x1

x2

)+

(D1

D2

)u.

C =

(C1 00 C2

), D =

(D1

D2

).

121

Conexion de sistemas: paralelo

Funcion de transferencia:

(1)

S1

u1 y1

u2 y2

S2

u1=u2

El vector de salida es y(s) =

(y1(s)y2(s)

).

Hay que expresar y(s) =

(y1(s)y2(s)

)en funcion de u(s) = u1(s) = u2(s):

y(s) =

(y1(s)y2(s)

)=

(G1(s)u1(s)G2(s)u2(s)

)=

(G1(s)u(s)G2(s)u(s)

)=

(G1(s)G2(s)

)u(s)

G (s) =

(G1(s)G2(s)

)

122

Page 62: Teor a de Control - UPV/EHU

Conexion de sistemas: paralelo

(2)

+

S1

S2

u2

y=y1+y2u1=u2

u1 y1

y2

Ecuacion de salida:

El vector de salida es y = y1 + y2.

y = y1 +y2 = C1x1 +D1u+C2x2 +D2u = C1x1 +C2x2 + (D1 +D2)u.

y =(C1 C2

)( x1

x2

)+ (D1 + D2)u.

C =(C1 C2

), D = D1 + D2.

Funcion de transferencia:

y(s) = y1(s)+y2(s) = G1(s)u1(s)+G2(s)u2(s) = (G1(s)+G2(s))u(s).

G (s) = G1(s) + G2(s) 123

Conexion de sistemas: paralelo

A =

(A1 00 A2

), B =

(B1

B2

).

(1)

C =

(C1 00 C2

), D =

(D1

D2

).

G (s) =

(G1(s)G2(s)

).

(2)C =

(C1 C2

), D = D1 + D2.

G (s) = G1(s) + G2(s).

124

Page 63: Teor a de Control - UPV/EHU

Conexion de sistemas: serieConexion en serie (u2 = y1)Podemos conectar los dos sistemas en serie, de forma que laentrada al sistema (S2) sea la salida del sistema (S1). Es decir,u2 = y1.

Dos posibilidades:

y1=u2S2

y2u1S1

u1

S2

y1=u2

y1

y2

S1

(1) (2)

Lamamos u, x , y a los vectores de entrada, estado y salida delsistema compuesto.En los dos casos

u = u1.

125

Conexion de sistemas: serieTomamos como vector de estados:

x =

(x1

x2

)=(x11 · · · x1n1 x21 · · · x2n2

)T.

Ecuacion de estado: hay que expresar x =

(x1

x2

)en funcion de

x =

(x1

x2

)y u = u1:

x1 = A1x1 + B1u,x2 = A2x2 + B2u2 = A2x2 + B2y1 =

= A2x2 + B2(C1x1 + D1u) == B2C1x1 + A2x2 + B2D1u.

Es decir,(x1

x2

)=

(A1 0

B2C1 A2

)(x1

x2

)+

(B1

B2D1

)u.

126

Page 64: Teor a de Control - UPV/EHU

Conexion de sistemas: serie

Ecuacion de salida:

(1)

y1=u2S2

y2u1S1

El vector de salida esy = y2.

Hay que expresar y = y2 en funcion de x =

(x1

x2

)y u = u1:

y = y2 = C2x2 + D2u2 = C2x2 + D2y1 == C2x2 + D2(C1x1 + D1u) = D2C1x1 + C2x2 + D2D1u.

y =(D2C1 C2

)( x1

x2

)+ D2D1u.

127

Conexion de sistemas: serie

Funcion de transferencia:

(1)

y1=u2S2

y2u1S1

El vector de salida esy(s) = y2(s).

Hay que expresar y(s) = y2(s) en funcion de u(s) = u1(s):

y(s) = y2(s) = G2(s)u2(s) = G2(s)y1(s) = G2(s)G1(s)u1(s) = G2(s)G1(s)u(s)

G (s) = G2(s)G1(s).

128

Page 65: Teor a de Control - UPV/EHU

Conexion de sistemas: serie(2)

u1

S2

y1=u2

y1

y2

S1

Ecuacion de salida:

El vector de salida es

y =

(y1

y2

).

y1 = C1x1 + D1u,

y2 = C2x2 + D2u2 = D2C1x1 + C2x2 + D2D1u.(y1

y2

)=

(C1 0

D2C1 C2

)(x1

x2

)+

(D1

D2D1

)u.

129

Conexion de sistemas: serie(2)

u1

S2

y1=u2

y1

y2

S1

Funcion de transferencia:

y(s) =

(y1(s)y2(s)

)=

(G1(s)u1(s)G2(s)u2(s)

)=

(G1(s)u(s)G2(s)y1(s)

)=

(G1(s)u(s)

G2(s)G1(s)u1(s)

)=

(G1(s)

G2(s)G1(s)

)u(s)

G (s) =

(G1(s)

G2(s)G1(s)

)

130

Page 66: Teor a de Control - UPV/EHU

Conexion de sistemas: serie

A =

(A1 0

B2C1 A2

), B =

(B1

B2D1

).

(1)C =

(D2C1 C2

), D = D2D1.

G (s) = G2(s)G1(s).

(2)

C =

(C1 0

D2C1 C2

), D =

(D1

D2D1

).

G (s) =

(G1(s)

G2(s)G1(s)

).

131

Conexion de sistemas

El metodo puede extenderse para conexiones entre variossubsistemas.

El metodo no siempre lleva a conseguir un numero mınimo devariables de estado.

132

Page 67: Teor a de Control - UPV/EHU

Apendice sobre teorıa de matrices: preliminares

I =

1 0. . .

0 1

matriz identidad

AI = IA = A

AB 6= BA en general

A (cuadrada) invertible si existe A−1 t.q. A−1A = AA−1 = I .

A invertible ⇔ detA 6= 0

(AB)−1 = B−1A−1

(A−1)T = (AT )−1

(AB)T = BTAT

133

Apendice sobre teorıa de matrices: independencia lineal devectores

Los vectores x1, . . . , xn son linealmente dependientes si existenescalares k1, . . . , kn no todos nulos tales que

k1x1 + · · ·+ knxn = 0.

Los vectores x1, . . . , xn son linealmente independientes en casocontrario, es decir,

k1x1 + · · ·+ knxn = 0⇒ k1 = · · · = kn = 0.

134

Page 68: Teor a de Control - UPV/EHU

Apendice sobre teorıa de matrices: valores y vectorespropios

λ ∈ C es valor propio o autovalor de A si existe v ∈ C, v 6= 0,tal que Av = λv .A v se le llama vector propio o autovector de A asociado a λ.

Av = λv ⇔ (λI − A)v = 0⇔ det(λI − A) = 0

Ası, λ ∈ C es valor propio de A si y solo si det(λI − A) = 0.

∆(λ) = det(λI − A) es el polinomio caracterıstico de A. Sugrado es el orden de la matriz A. Sus raıces en C (son reales oconjugadas a pares) son los valores propios de A.

∆(λ) = 0 es la ecuacion caracterıstica de A.

Teorema de Cayley-Hamilton: Toda matriz satisface suecuacion caracterıstica, es decir,

∆(A) = 0

135

Apendice sobre teorıa de matrices: matriz definida positiva

A simetrica si A = AT .

Los valores propios de una matriz simetrica son reales.

A simetrica es definida positiva si xTAx > 0 para todo x 6= 0.

Una matriz simetrica es definida positiva ⇔ todos sus valorespropios son positivos.

A simetrica es semidefinida positiva si xTAx ≥ 0 para todox 6= 0.

Una matriz simetrica es semidefinida positiva ⇔ todos susvalores propios son no negativos.

136

Page 69: Teor a de Control - UPV/EHU

Apendice sobre teorıa de matrices: forma de Jordan

Sea A una matriz cuadrada de orden n.

Supongamos que A tiene n vectores propios linealmenteindependientes, x1, · · · , xn.Llamaremos matriz modal a la matriz cuyas columnas sonx1, . . . , xn. M = [x1 x2 · · · xn] .

La matriz M es invertible y

M−1AM = Λ

donde Λ es una matriz diagonal con los valores propios en ladiagonal (puede haber valores propios repetidos).En este caso se dice que la matriz A es diagonalizable.

137

Apendice sobre teorıa de matrices: forma de Jordan

Caso general: Puede ocurrir que la matriz A no tenga n vectorespropios linealmente independientes.

En ese caso, las columnas de la matriz modal son vectores propiosgeneralizados y

M−1AM = J

donde J es una matriz diagonal por bloques:

J =

J1 0 · · · 00 J2 · · · 0...

.... . .

...0 0 · · · Jp

, Ji =

λ 1 0 · · · 00 λ 1 · · · 00 0 λ · · · 0...

......

. . ....

0 0 0 · · · λ

siendo λ un valor propio.

Puede haber varios bloques asociados al mismo valor propio.

La matriz J se llama forma de Jordan de A.

Si todos los bloques son de orden 1 entonces J = Λ (diagonal).

138

Page 70: Teor a de Control - UPV/EHU

Apendice sobre teorıa de matrices: matriz exponencialDada una matriz cuadrada A de orden n se define

eA =∞∑

k=0

Ak

k!= In + A +

A2

2!+

A3

3!+ · · ·

Algunas propiedades:

e0 = In + 0 + · · · = In.e(A+B) = eAeB ⇔ AB = BA.

Dada una matriz cuadrada A y un escalar t,

eAt =∞∑

k=0

Aktk

k!= In + At +

A2t2

2!+

A3t3

3!+ · · ·

deAt

dt = A + 2A2t2! + 3A3t2

3! + · · ·

= A(I + At1! + A2t2

2! + · · · ) = AeAt

= (I + At1! + A2t2

2! + · · · )A = eAtA.139

Apendice sobre teorıa de matrices: matriz exponencial

eAt =∞∑

k=0

Aktk

k!= In + At +

A2t2

2!+

A3t3

3!+ · · ·

(eAt)T

= eAT t .

Teniendo en cuenta que AtAs = AsAt, se tiene que

eAteAs = eAt+As = eA(t+s).

Para s = −t,

eAte−At = eA(t−t) = e0 = In.

Por tanto, la matriz eAt es invertible y su inversa es e−At .

140

Page 71: Teor a de Control - UPV/EHU

Apendice sobre teorıa de matrices: matriz exponencialConsecuencias de la definicion de eA

Si M es una matriz invertible y A = MAM−1, entonces

Ak = MAM−1MAM−1 · · ·MAM−1 =

= MAInAInA · · · InAM−1 = MAA · · · AM−1 =

= MAkM−1.

yeA =

∑∞k=0

Ak

k! =∑∞

k=0MAkM−1

k! =

= M(∑∞

k=0Ak

k! )M−1 =

= MeAM−1.

Si conocemos eA y M, podemos calcular eA.

141

Apendice sobre teorıa de matrices: matriz exponencialSi A es diagonal por bloques:

A =

A1 0 · · · 00 A2 · · · 0...

.... . .

...0 0 · · · Ap

, Ak =

Ak1 · · · 0

.... . .

...0 · · · Ak

p

.

eA =∑∞

k=01k!Ak =

∑∞k=0

1k!

Ak1 · · · 0

.... . .

...0 · · · Ak

p

=

=

∑∞k=0

1k!Ak

1 · · · 0...

. . ....

0 · · · ∑∞k=0

1k!Ak

p

=

eA1 · · · 0...

. . ....

0 · · · eAp

.

Por ejemplo, si A es diagonal:

A =

d1 · · · 0...

. . ....

0 · · · dn

, eA =

ed1 · · · 0...

. . ....

0 · · · edn

.

142

Page 72: Teor a de Control - UPV/EHU

Apendice sobre teorıa de matrices: matriz exponencial

Si la matriz A es un bloque de Jordan de tamano δ,

A = Jλ =

λ 1 0 · · · 00 λ 1 · · · 00 0 λ · · · 0...

......

. . ....

0 0 0 · · · λ

.

se puede probar que

eAt = eJλt = eλt

1 t t2

2! · · · tδ−1

(δ−1)!

0 1 t · · · tδ−2

(δ−2)!

0 0 1 · · · tδ−3

(δ−3)!...

......

. . ....

0 0 0 · · · 1

.

143

Apendice sobre teorıa de matrices: matriz exponencial

Ejemplo

A =

(3 22 3

), A es diagonalizable.

Matriz modal: M =

(1 −11 1

). M−1AM = Λ =

(5 00 1

).

A = MΛM−1 ⇒ eAt = MeΛtM−1 =

=

(1 −11 1

)(e5t 00 et

)(12

12

−12

12

)=

=1

2

(e5t + et e5t − et

e5t − et e5t + et

).

144

Page 73: Teor a de Control - UPV/EHU

Apendice sobre teorıa de matrices: matriz exponencial

Ejemplo

A =

0 1 00 0 1

27 −27 9

.

M =

1 −23

13

3 −1 13

9 0 0

. M−1AM = J =

3 1 00 3 10 0 3

.

eJt = e3t

1 t t2

20 1 t0 0 1

.

A = MJM−1 ⇒ eAt = MeJtM−1.

145

Apendice sobre teorıa de matrices: normas de vectores

Para estudiar la estabilidad de los sistemas necesitamos tener unamedida de la distancia entre vectores y matrices. Para ellousaremos el concepto de norma. Sea F un cuerpo.

Una norma vectorial en Fn es una funcion

‖ · ‖ : Fn −→ R

que satisface:

(i) ‖ x ‖≥ 0 para todo x ∈ Fn.

(ii) ‖ x ‖= 0 si y solo si x = 0 =

0...0

.

(iii) ‖ αx ‖= |α| ‖ x ‖ para todos α ∈ F y x ∈ Fn.

(iv) ‖ x + y ‖≤‖ x ‖ + ‖ y ‖ para todos x , y ∈ Fn.

146

Page 74: Teor a de Control - UPV/EHU

Apendice sobre teorıa de matrices: normas de vectores

Ejemplos de normas vectoriales son las normas `2 y `∞.

Si x =

x1...xn

,

‖ x ‖2=

(n∑

i=1

|xi |2) 1

2

, ‖ x ‖∞= max1≤i≤n

|xi |.

La norma `2 se llama norma euclıdea ya que representa la nocionusual de distancia desde el origen cuando x esta en R, R2 o R3.

Ejemplo

x =

−210

‖ x ‖2=√

(−2)2 + 12 + 02 =√

5,

‖ x ‖∞= max{| − 2|, |1|, |0|} = 2.

MATLAB: norm(x) = norm(x , 2), norm(x , inf ). 147

Apendice sobre teorıa de matrices: normas de vectoresLa distancia entre dos vectores es la norma de su diferencia.

Dados x =

x1

...xn

, y =

y1

...yn

, las distancias `2 y `∞ entre x e y se

definen mediante

‖ x − y ‖2=

(n∑

i=1

|xi − yi |2) 1

2

,

‖ x − y ‖∞= max1≤i≤n

|xi − yi |.

Ejemplo

x =

1−10

, y =

011

, x − y =

1−2−1

,

‖ x − y ‖2=√

6, ‖ x − y ‖∞= 2.

148

Page 75: Teor a de Control - UPV/EHU

Apendice sobre teorıa de matrices: normas de matrices

Una norma matricial en Fn×n es una funcion

‖ · ‖ : Fn×n −→ R

que satisface:

(i) ‖ A ‖≥ 0 para todo A ∈ Fn×n.

(ii) ‖ A ‖= 0 si y solo si A = 0.

(iii) ‖ αA ‖= |α| ‖ A ‖ para todos α ∈ F y A ∈ Fn×n.

(iv) ‖ A + B ‖≤‖ A ‖ + ‖ B ‖ para todas A,B ∈ Fn×n.

(v) ‖ AB ‖≤‖ A ‖‖ B ‖ para todas A,B ∈ Fn×n.

La distancia entre las matrices A,B ∈ Fn×n con respecto a unanorma matricial es ‖ A− B ‖.

149

Apendice sobre teorıa de matrices: normas de matrices

Ejemplos de normas en Fn×n:

‖ A ‖∞= max1≤i≤n

n∑

j=1

|aij |

(maxima suma de los valores absolutos de las filas).

‖ A ‖F=

n∑

i=1

n∑

j=1

|aij |2

12

‖ · ‖F se llama norma euclıdea o norma de Frobenius.

150

Page 76: Teor a de Control - UPV/EHU

Apendice sobre teorıa de matrices: normas de matrices

Ejemplo

A =

1 2 −10 3 −15 −1 1

∑3j=1 |a1j | = |1|+ |2|+ | − 1| = 4,∑3j=1 |a2j | = |0|+ |3|+ | − 1| = 4,∑3j=1 |a3j | = |5|+ | − 1|+ |1| = 7.

‖ A ‖∞= max{4, 4, 7} = 7.

‖ A ‖F=√

1 + 4 + 1 + 9 + 1 + 25 + 1 + 1 =√

43.

MATLAB:norm(A, inf )

151