18
Control óptimo LQG Recordemos que el problema LQR considera el sistema de espacio de estado ˙ x = Ax + Bu; x R n ; u R p y = Cx; y R q y el criterio de desempeño J = R 0 x T (t)Qx(t)+ u T (t)Ru(t)dt; donde Q es no negativa definida y R es definida positiva. Entonces el control que minimiza J está dado por la ley de realimentación lineal u(t)= -Kx(t) con K = R -1 B T P y donde P es la única solución definida positiva a la EAR A T P + PA - PBR -1 B T P + Q =0 Realizaci ´ on– p. 1/18

Control lqg

Embed Size (px)

DESCRIPTION

Control moderno y optimo Lqg

Citation preview

Page 1: Control lqg

Control óptimo LQG

Recordemos que el problema LQR considera el sistema de espacio de estado

x = Ax + Bu; x ∈ Rn; u ∈ R

p

y = Cx; y ∈ Rq

y el criterio de desempeño J =∫

0xT (t)Qx(t) + uT (t)Ru(t)dt; donde Q es no

negativa definida y R es definida positiva. Entonces el control que minimiza J estádado por la ley de realimentación lineal

u(t) = −Kx(t) con K = R−1BT P

y donde P es la única solución definida positiva a la EAR

AT P + PA − PBR−1BT P + Q = 0

Realizacion– p. 1/18

Page 2: Control lqg

Estimación de estado óptima LQE

Recordemos que el problema dual esti-mador óptimo LQ lleva al filtro de Kalman,el cual es el mejor estimador posible parala planta corrupta con ruidos w y v

x = Ax + Bu + w

y = Cx + v

donde w y v son procesos Gaussianos es-tocásticos de media cero no correlaciona-dos en el tiempo y el uno al otro, con co-varianzas E(wwT ) = W y E(vvT ) = V .La ganancia del estimador óptimo es L =

PCT V −1 donde P es la solución de laEAR

A − LC

B

A

∫ x(t)C

u(t)

∫L

B

x(t)

y(t)

w(t)

v(t)

Observer

ator

v

stochastic

time

AP + PAT − PCT V −1CP + W = 0

Realizacion– p. 2/18

Page 3: Control lqg

Control lineal cuadrático Gaussiano (LQG)

El control LQG es el controlador óptimo obtenido como la combinación de unaganancia de realimentación de estado LQR con realimentación desde losestimados a partir de un estimador de estado óptimo LQE.

an optimal LQE state estimator.

A − LC

B

A

∫ x(t)CN

u(t)

∫L

B

Kx(t)

y(t)r

w(t)

v(t)

Kalman Filter (LQE)

LQR

El principio de separación nos permite diseñar una ganancia de realimentaciónLQR y el LQE independientemente.

Realizacion– p. 3/18

Page 4: Control lqg

Control LQG

El principio de separación dice que si tenemos una planta dada por

x = Ax + Bu + w

y = Cx + v

y deseamos diseñar un controlador para minimizar

J = lımT→∞

E{

xT (t)Qx(t) + uT (t)Ru(t)dt}

entonces la solución óptima se obtiene combinando la ganancia de realimentaciónóptima LQ y el observador LQ observer dados arriba. Recuerde también de laasignación de polos que los polos de lazo cerrado se obtienen en los autovaloresde A − BK y A − LC.

Realizacion– p. 4/18

Page 5: Control lqg

Control LQG

El controlador combinado incluyendo un LQR (regulador óptimo linealcuadrático) y un LQE (estimador óptimo lineal cuadrático) se denominausualmente controlador lineal cuadrático gaussiano (LQG).

LQG se puede usar como una herramienta simple para obtener uncontrolador ball-park con un desempeño razonable. Como con la asignaciónde polos, la planta debe aumentarse si se desean características comoacción integral.

Existen también estrategias sofisticadas basadas en LQG. Estas resuelvenno solo dinámicas intrincadas (ej. sistemas resonantes o interacciones ensistemas multivariables), sino también aseguran que el diseño tengapropiedades adecuadas de robustez. Tales estrategias van más allá delalcance de este curso, y se recomienda el libro ”Multivariable Feedbackcontrol:Analysis and design” de Skogestad y Postlethwaite.

Realizacion– p. 5/18

Page 6: Control lqg

Rechazo a disturbios con LQG

Como ejemplo de control LQG, consideremos una aplicación para rechazo adisturbios, por el principio de modelo interno .Considere la planta

x =

[

−10 −50

1 0

]

x +

[

1

0

]

u

y = [20 0]x

b

b b

bj j- - --??

y(t)

v(t)d(t)

20

s2+10s+50

Donde se sabe que la salida de la planta es afectada por ruido blanco aditivo demedia cero y covarianza 0,005.También se sabe que, en operación, el vector de estado de esta planta esafectado por una señal ruidosa de banda estrecha de aproximadamente 1Hz. Lameta del problema de control es rechazar este disturbio de 1Hz.

Realizacion– p. 6/18

Page 7: Control lqg

Rechazo a disturbios con LQG

Un principio básico es que para ser capaces de rechazar un disturbio, o seguiruna referencia, necesitamos incorporar un modelo del disturbio en el controlador.Esto se conoce como principio del modelo interno.El principio del modelo interno establece que para rechazar un disturbio, el sis-tema debe incluir un modelo del disturbio , si éste está disponible.

Un ejemplo familiar de rechazo a disturbio (y seguimiento de referencia) basadoen el principio del modelo interno es la acción integral en la realimentación deestados: Para rechazar disturbios constantes aumentamos su modelo (unintegrador) a la planta.

Realizacion– p. 7/18

Page 8: Control lqg

Rechazo a disturbios con LQG

Para el ruido aditivo a la salida, lo modelamos como una señal de ruido v convarianza V = 0,005. En el caso del disturbio de 1Hz, lo modelamos por unaecuación de estado auxiliar, donde w es ruido blanco de media cero concovarianza W = 0,01.

x =

[

0 2π

−2π 0

]

xd +

[

0

1

]

w

yd = [100 0]xd

Este ruido excita al sistema para pro-ducir una señal de 1 Hz, escalada porun factor de 100.

0 10 20 30 40 50 60 70 80 90 100−15

−10

−5

0

5

10

15

d(t)

time [s]

Realizacion– p. 8/18

Page 9: Control lqg

Rechazo a disturbios con LQG

Trataremos la salida ruidosa como un disturbio de ruido en la entrada del sistemaoriginal,

x =

[

−10 −50

1 0

]

x +

[

1

0

]

(u + d) = Ax + B(u + d)

y = [20 0]x + v = Cx + v

Diseñaremos un filtro de Kalman para rechazar este disturbio. Para el diseñocombinaremos planta y disturbio en la planta aumentada (Aa; Ba; Ca; Da):

[

x

xd

]

=

[

A B

0 An

] [

x

xd

]

+

[

B

0

]

u +

[

0

Bn

]

w

y = [C 0]

[

x

xd

]

+ v

Realizacion– p. 9/18

Page 10: Control lqg

Rechazo a disturbios con LQG

Ahora diseñamos la ganancia L de nuestro filtro de Kalman

˙x = (Aa − LCa)x + Bau + Ly

usando nuestro modelo hipotético de la planta (la planta aumentada) y laspropiedades estadísticas de los ruidos v y w,

V = E{v2(t)} = 0,005; W = E{w2(t)} = 0,01.

En MATLAB podemos usar la función lqe L = lqe(Aa,[0*B;Bn],Ca,W,V);

obteniendo,

L =

0,9037

8,1671

1,4021

0,1848

.

Realizacion– p. 10/18

Page 11: Control lqg

Rechazo a disturbios con LQG

En otras palabras, hemos modelado el disturbio como la salida de una plantahipotética, y lo incorporamos al modelo de la planta real para obtener el modeloaumentado

xa = Aaxa + Bau + Ew

ya = Caxa + vy

Ahora, para controlar este sistema, calculamos una ganancia de realimentaciónu = −Kxa para minimizar el criterio de desempeño

J =

0

xTa (t)

1 0 0 0

0 0 0 0

0 0 0 0

0 0 0 0

xa(t) + uT (t)Ru(t)

dt

Note que esta forma de Q penaliza solamente la salida del sistema real, no sepenalizan ”los estados” del disturbio.

Realizacion– p. 11/18

Page 12: Control lqg

Rechazo a disturbios con LQG

La razón es que tales ”estados” son hipotéticos y no controlables de todasmaneras. Usaremos dos valores diferentes de R > 0 para ver el efecto de cadauno.El truco para rechazar el disturbio de banda estrecha no es tratar de controlarlo,ya que no es controlable por definición, pero sí filtrarlo usando su modelo en elfiltro de Kalman.

xa = (Aa − LCa)xa + Bau + Ly

Terminator

Scope

In1 Out1

Plant with narrow−band disturbance

K* u

MatrixGain3

Aa−L*Ca* u

L* u

Ba* u

ManualSwitch

1sDemux

0

Constant1

0

Constant

4

4

4

44

44 4

2

2

2

La ganancia del estimador L se calculapara minimizar óptimamente el efectode los ruidos w y v utilizando las co-varianzas del ruido W y V .

Realizacion– p. 12/18

Page 13: Control lqg

Rechazo a disturbios con LQG

El diagrama de SIMULINK de abajo muestra el detalle de implementación de laplanta aumentada.plant implementation.

Terminator

In1 Out1

Subsystem

Scope

K*u

MatrixGain3

Aa−L*Ca* u

MatrixGain2

L* u

MatrixGain1

K*u

MatrixGain

ManualSwitch

1s

Integrator

Demux

0

Constant1

0

Constant

4

4

4

4

4

4

44 4

2

2

2

Plant Model

y(t)

w(t)

d(t)

u(t)1

Out11s

K*u

Gn

Out1

Disturbance

K*u

C

Band−LimitedWhite Noise

K*u

B

K*u

A

1In1

2

2

2

2

2

22

2

2

Realizacion– p. 13/18

Page 14: Control lqg

Rechazo a disturbios con LQG

Este diagrama de SIMULINK muestra como implementar el modelo de disturbiode entrada de banda estrecha.narrow-band input disturbance model.

Terminator

In1 Out1

Subsystem

Scope

K*u

MatrixGain3

Aa−L*Ca* u

MatrixGain2

L* u

MatrixGain1

K*u

MatrixGain

ManualSwitch

1s

Integrator

Demux

0

Constant1

0

Constant

4

4

4

4

4

4

44 4

2

2

2

Plant Model

y(t)

w(t)

d(t)

u(t)1

Out11s

K*u

Gn

Out1

Disturbance

K*u

C

Band−LimitedWhite Noise

K*u

B

K*u

A

1In1

2

2

2

2

2

22

2

2

Disturbance Model

1Out1

1s K*u

Cn

K*u

BnBand−LimitedWhite Noise

K*u

An

2

2

2

2

22

2

Realizacion– p. 14/18

Page 15: Control lqg

Rechazo a disturbios con LQG

Se muestra la salida del sistema en lazo abierto (K = 0) y en lazo cerrado paradiferentes valores de R.

0 2 4 6 8 10 12 14 16 18 20−1.5

−1

−0.5

0

0.5

1

1.5

Closed loopR=1e−6

Open loop

Realizacion– p. 15/18

Page 16: Control lqg

Rechazo a disturbios con LQG

Para valores del peso de contrlo R < 10−4 no hay mejora significante en larespuesta, porque el sistema tiene un nivel de ruido de ”base” debido al ruidomedido v (el cual no podemos remover de la salida).

No obstante, podemos efectivamente mejorar la respuesta al remover eldisturbio de banda estrecha.

Esta es una forma de tratar con disturbios en el observador en lugar que enel control realimentado, como se hizo en el esquema de acción integralestudiado previamente.

Realizacion– p. 16/18

Page 17: Control lqg

Rechazo a disturbios con LQG

La gráfica muestra el diagrama deBode de amplitud de la función detransferencia de lazo cerrado desde eldisturbio d a la salida, para los difer-entes valores de R, y en lazo abierto.

10−1 100 101 102 103 104−200

−150

−100

−50

0

50

Mag

nitu

de (d

B)

Bode Diagram

Frequency (rad/sec)

Open LoopR=10−2

R=10−4

R=10−6

Podemos ver como el control LQG produce un sistema de lazo cerrado con un”notch” en la frecuencia del disturbio (1Hz).

Realizacion– p. 17/18

Page 18: Control lqg

Observaciones finales acerca de LQG

De hecho, podemos incorporar en nuestro diseño LQG una acción integral,aumentando a la planta la integral del error de seguimiento. En ese casodeberíamos ser cuidadosos en seleccionar Q para que penalicemos el errorde seguimiento y no el estado que se supone debe seguir a la referencia.

Ya que LQG es un controlador por realimentación de estado en combinacióncon un estimador de estado, pueden incorporarse fácilmente esquemas”antiwindup” en realimentación de estado con acción integral.

LQG es una de las herramientas más básicas e importantes en ingeniería decontrol. Para modelos de espacio de estados, constituye en la mayoría de loscasos, la mejor opción para diseño de control.

LQG no es robusto, pero casi siempre dará buenos resultados cuando elmodelo del sistema es razonablemente preciso.

Realizacion– p. 18/18