Upload
rodrigoorostica
View
213
Download
0
Embed Size (px)
Citation preview
8/16/2019 InformeEjercicioN1
1/8
Ejercicio N°1: Introducción al Control Adaptativo
Rodrigo OrósticaDepartamento de Ingenierı́a Eléctrica
Universidad de Chile
EL7017-Control Adaptativo de Sistemas
Email:[email protected]
I. INTRODUCCIÓN
El siguiente informe presenta los resultados del Ejercicio
N°1 del curso EL7017-Control Adaptativo de Sistemas, el
cual está enfocado en introducir al estudiante en conceptos y
aplicación de la teorı́a de control adaptativo.
La tarea esta dividida en 2 problemas que son tratados
de forma independiente en las siguientes 2 secciones. El
primero de ellos enfocado a analizar el comportamiento de
los controladores adaptativos directo, indirecto algebraico,
indirecto dinámico y combinado en una planta de primer orden
inestable, mientras que el segundo centra su problemática en
el diseño de un observador de estado de orden completo en
una planta estable.
Para finalizar, se concluye sobre la experiencia enfatizando
en el rendimiento de las diferentes clases de controladores
analizados y en la utilidad de disponer de un observador de
estado.
II. PROBLEMA 1
En este problema se tiene una planta inestable y desconocida
de primer orden,
ẋ p(t) − 3x p(t) = 2u(t)
x p(0) = 1
y el modelo de referencia asintóticamente estable,
ẋm(t) + 3xm(t) = r(t)
xm(0) = 0
y se pide realizar controladores adaptables que permitan
que el error de control tienda a 0. Junto con esto, mediante
simulaciones, se pide analizar el comportamiento bajo distintas
condiciones como son tipos de entradas, pertubaciones,
ganancias adaptativas, condiciones iniciales entre otros.
II-A. Generalidades
En lo que sigue se usará la notación vista en clases para
un sistema de primer orden, lo que significa que en este caso
particular se tendrá:
Para la planta,
a p = −3; k p = 2; x p(0) = 1
y para el modelo de referencia,
am = 3; bm = 1; xm(0) = 0
Lo primero a desarrollar es el modelo en Simulink de cada
uno de los controladores adaptables solicitados. Es evidente
que a partir de un controlador combinado es posible obtener
el resto bajo ciertas simplificaciones de entradas y parámetros
pero como se trata de una tarea introductoria que busca
familiarizarse con estas estrategias, la construcción de los
modelos se realiza en forma incremental comenzando por el
controlador directo, pasando posteriormente por el indirectoalgebraico, indirecto dinámico para finalizar en el controlador
combinado.
En las figuras (1) y (2) se observan los esquemas para el mo-
delo correspondiente al control directo e indirecto algebraico
a modo de ejemplo del trabajo desarrollado. La realización del
modelo se hizo se forma modular diferenciando planta,modelo
de referencia, modelo de identificaci´ on, ley de control, errores
de lazo cerrado y leyes de ajustes.
Figura 1. Controlador Directo
En lo que sigue, el análisis de cada de los controles
se desarrolla de forma independiente en las próximassecciones del informe para finalizar comentando similitudes
y diferencias.
II-B. Control Directo
Este esquema de control calcula los parámetros del
controlador (θ y k ) mediante las leyes de ajustes definidas en
[1] sin estimación previa de los parámetros de la planta.
8/16/2019 InformeEjercicioN1
2/8
Figura 2. Controlador Indirecto Algebraico
En esta situación las variables libres son las 2 condiciones
iniciales correspondientes a los parámetros del controlador,
definidos como θ0 y k0; y 2 más correspondientes a lasganancias adaptativas de las leyes de ajuste llamadas γ θ1 y
γ k1 siguiendo la denominación en [2].
Inicialmente, se realiza una serie de simulaciones variando
las condiciones iniciales, antes mencionadas, con ganancias
adaptativas unitarias. Las simulaciones se realizan a paso fijo
igual a ∆T = 0,01[s] con el objetivo de utilizar un indice decomparación similar al IAE (integral del valor absoluto del
error), que se definirá mediante:
IAE discreto
N
i=1
e2(i) (1)
Nótese que para que sean comparables 2 simulaciones,se
debe considerar el mismo tiempo final para ambas.
En la tabla (I) se observan cuales son las condiciones ini-
ciales simuladas junto con el indice definido previamente para
30[s] de simulación. Los resultados indican que la condición
[−5 10] muestra los mejores resultados.
Cuadro IIEA PARA DISTINTAS CONDICIONES INICIALES
C.I [θ0 k0] IEA
[0 0] 3250
[10 5] 24607
[5 10] 17528
[5 5] 14709
[−5 10] 5596
Junto con la tabla se obtienen gráficos para el error de
control y para los parámetros θ y k en función del tiempo.
Estos resultados se aprecian en las figuras (3) y (4), respecti-
vamente, y es posible notar que la condición inicial con mejor
ı́ndice IAE es la [0 0] seguida por la que presenta menor sobreoscilación, en el caso de la condición [0 0] se observa unaoscilación mayor que retrasa su tiempo de estabilización con
respecto a los otros casos.
0 0.5 1 1.5 2 2.5 3−5
0
5
10
15
20Control Directo−Varación en condiciones iniciales
[0 0][10 5]
[5 10]
[5 5][−5 10]
Figura 3. Error para distintas C.I. en controlador directo
En cuanto a los parámetros del controlador, de la figura
(4) es posible concluir que no necesariamente se alcanzan los
valores deseados (θ∗ y k∗), el único caso en que ocurre es
para C.I=[0 0] siendo estos valores θ∗ = −3, k∗ = 12
.
0 0.5 1 1.5 2 2.5 3−20
−10
0
10Control Directo−theta para distintas C.I.
[0 0][10 5]
[5 10]
[5 5][−5 10]
0 0.5 1 1.5 2 2.5 3−5
0
5
10Control Directo−k para distinta C.I
[0 0][10 5]
[5 10]
[5 5][−5 10]
Figura 4. Parámetros para distintas C.I. en controlador directo. Arriba: θ(t).Abajo: k(t)
Ahora manteniendo constante las C.I en [θ0 k0] = [0 0], seanaliza el comportamiento del controlador adaptativo directo
al variar la ganancias adaptativas. Se prueban un total de 3
situaciones para un entrada escalón de magnitud 5, primero
las 2 ganancias adaptativas son iguales a 1, y en las otras se
varia una independiente de la otra, como se puede observar
en la descripción de la figura (5).
8/16/2019 InformeEjercicioN1
3/8
En la situación base [γ θ1 γ k1] = [0 0] se observa que antesde la estabilización del error de control el sistema oscila, pero
estas oscilaciones se ven reducidas al aumentar la ganancia
γ θ1, tanto en cantidad como en amplitud. Se puede concluir
, luego, que las ganancia involucradas son capaces de regular
las oscilación.
0 2 4 6 8 10−2.5
−2
−1.5
−1
−0.5
0
0.5
1
1.5
2
2.5Control Directo−Variación de ganancias
Tiempo[s]
A m p l i t u d
[1 1]
[10 1]
[1 10]
Figura 5. Error para distintas ganancias adaptativas, [γ θ1] γ k1
Por último, se hace una comparación variando el tipo de
referencia y dada la importancia de las referencias acotadas,
se utiliza un escalón y una señal sinusoidal. Las del primer
tipo se estudiaron previamente y en ellas se observa que
luego de alcanzarse un error de control nulo, permanece de
este modo pues no hay cambio en la referencia ni tampoco
perturbaciones externas. Para una entrada sinusoidal de
amplitud 5 y frecuencia f=0.25[Hz] los resultados se observan
en la figura (6).
0 5 10 15 20 25 30−0.5
−0.4
−0.3
−0.2
−0.1
0
0.1
0.2
0.3
0.4
0.5Comportamiento del error para una referencia sinusoidal
Tiempo[s]
A m p l i t u d
error de control
referencia sinusoidal. A=5. f=0.25[Hz]
Figura 6. Comportamiento del error para referencia sinusoidal
De la gráfica se desprende que cuando hay un cambio
de signo en la referencia, el error deja de ser nulo
momentáneamente para luego volver al valor permanente.
II-C. Controlador Indirecto Algebraico
En esta clase de controlador se estiman los parámetros
de la planta (â p y k̂ p) para luego generar un controladorbasado en una expresión algebraica de los valores calculados
calculados, ver ecuaciones (2) y (3).
θ = â p − am
ˆk p
(2)
k = bm
k̂ p(3)
En este controlador, se tienen 3 condiciones iniciales
modificables, el estado estimado (x̂ p), y aquellas relacionadas
con las leyes de ajustes de los parámetros del modelo
de identificación, k̂ p0 y â p0.Además tienen 2 gananciasadaptativas γ kp1 y γ ap1.
La consideración que hay que tener en la implementación
del modelo radica en evitar que k̂ p se haga nulo porque de serası́ se indefinen los valores de los parámetros de control, véase
ecuaciones (2) y (3). Para resolver lo planteado se sigue la
estrategia mencionada en [1], definiendo b̄ = 0,1, además k̂ p0no se modifica y se fija su valor en 1, de modo tal que k̂ p0 > b̄.
A continuación se presenta un desarrollo similar al
efectuado con el control directo, considerando una referencia
constante igual a r(t) = 5. Se comienza analizando lo queocurre al fijar las ganancias en 1 y variar las condicionesiniciales, incluyéndose valores similares a los anteriores y
además un caso que corresponde a los valores en estado
estacionario [x̂ p0 â p0] = [5
3 − 3], en la tabla (II) se pueden
observar los casos tratados junto con el valor de IAE discretodel error de control(ec) y de identificación (ei) para los
primeros 30[s] de simulación.
Cuadro IIIEA PARA DISTINTAS CONDICIONES INICIALES
C.I [x̂p0 âp0] IEA ec IEA ei
[0 0] 502 502
[ 53 − 3] 109 177
[10 0] 8276 6917
[5 10] 19260 18260
El indice utilizado muestra que el caso en que se obtuvo
mejor rendimiento es con condiciones iniciales próximas a
las de régimen permanente ([ 53 − 3). Además se aprecia una
correlación entre el error de control y de estimación lo que
es lógico pues mientras más certera sea la estimación de los
parámetros de la planta, mejor deberı́an ser los resultados en
la salida.
En la figura (7) se muestran los error de control (lineas
sólidas) e identificación (lineas discontinuas) para los distintos
casos de condiciones iniciales, a excepción del [5 10] que
8/16/2019 InformeEjercicioN1
4/8
0 0.5 1 1.5−2
0
2
4
6
8
10Control Indirecto−Error de control y estimación para distintas C.I
Tiempo[s]
A m p l i t u d
[0 0] ec[0 0] ei
[5/3 −3] ec[5/3 −3] ei
[10 0] ec[10 0] ei
Figura 7. Errores de estimación e identificación para distintas condicionesiniciales
está fuera de rango. Se logra apreciar que en todos los casos
se consigue la estabilización aunque los tiempos en que se
alcanzan no son idénticos, de hecho existe una compensación
entre este y el IAE .
Manteniendo constantes las condiciones iniciales: x̂ p = 0),k̂ p0 = 1 y â p0 = 0; y para un referencia escalón de amplitud5, se analiza lo que sucede al modificar las ganancias
adaptativas. Se tienen en total 3 casos, el primero, ambas son
iguales a la unidad, y en los otros, cada una se varia dejando
contante la otra.
Los resultado se muestran en la figura (8) indicándose
la situación en la leyenda del gráfico: [ γ kp1 γ ap1]. Al
variar las ganancias hay pequeños cambios en los tiempos de
estabilización, los que mejoran al aumentar el valor de γ ap1.
0 0.5 1 1.5 2 2.5 3−0.4
−0.2
0
0.2
0.4
0.6
0.8
1
1.2
1.4Control Indirecto−Error de control al modificar ganancias adaptativas
Tiempo[s]
A m p l i t u d
[1 1]
[10 1]
[1 10]
Figura 8. Error de control para distintos valores de ganancia
Finalmente se modifica la entrada manteniendo constante el
resto de los parámetros, para lo cual se considera una refe-
rencia sinusoidal de amplitud 5 y frecuencia f = 0,25[Hz].En la figura (9) se observa el comportamiento de la señal de
control y se aprecia que a diferencia de lo que ocurre con una
señal constante, cuando existe un cambio se signo la medida
del error es perturbado aunque vuelve a estabilizarse en breve.
0 5 10 15 20 25 30−5
−4
−3
−2
−1
0
1
2
3
4
5Error de control para referecia sinusoidal
Tiempo[s]
A m p l i t u d
Figura 9. Error de control para referencia sinusoidal
II-D. Controlador Indirecto Din´ amico
Este modelo de controlador, al igual que el anterior,
considera un modelo de identificación, de ahı́ el nombre de
indirecto, pero a diferencia del algebraico se definen errores
de estimación en lazo cerrado, véase ecuaciones (4) y (5),
que se suman a las leyes de ajustes del control para darle una
caracterización dinámica.
θ = −â p + k̂ pθ + am (4)
k = k̂ p − bm (5)
En este controlador, se tienen 5 condiciones inicialesmodificables:x̂ p0,θ0,k0, k̂ p0 y â p0 y 7 ganancias adaptativassujetas a cambio.
En este controlador no es necesario restringir en el modelo
el valor del parámetro k̂ p pues de calcula mediante unaecuación diferencial, por esta razón en las simulaciones que
analizan la influencia de la C.I.
En la figura (10) se muestra el esquema del modelo
implementado y en la (11) una simulación para una referencia
constante de valor igual a 5, haciendo iguales a 0 las
condiciones iniciales y unitarias las ganancias. El valor del
IAE es 1652.
II-E. Controlador Combinado
El control adaptativo combinado es una mezcla de las
estrategias de control directo e indirecto pues en las leyes
de ajuste se utiliza tanto el error de control como el de
estimación.De hecho, bajo ciertas restricciones, es posible
obtener el resto: control directo, indirecto algebraico e
indirecto dinámico.
8/16/2019 InformeEjercicioN1
5/8
8/16/2019 InformeEjercicioN1
6/8
0 0.5 1 1.5 2 2.5 3−0.8
−0.6
−0.4
−0.2
0
0.2
0.4
0.6
0.8
1Error de control para controlador adaptativo indirecto dinámcico
Tiempo[s]
A m p l i t u d
Figura 13. Error de control para controlador adaptativo combinado
ẋ(t) =
0 1−2 3
x(t) +
04
u(t); x(0) =
12
(6)
y(t) =
1 0
x(t)El objetivo es diseñar un observador de estado completo y
simular el comportamiento de este y de la planta bajo diversas
situaciones que consideran el efecto de diferentes condiciones
iniciales, el tipo de entradas, perturbaciones externas, cambio
de los parámetros de la planta durante la simulación, entre
otros.
III-A. Generalidades
El cálculo de los valores propios de la matriz A permite
concluir que la planta es estable (λ1 = −1 y λ2 = −2)y además que el par (A, C ) es observable. Lo anterior se
realiza con las funciones eig() y obsv(), respectivamente.
Dado que la realización en variables de estado si es
observable es posible llevar a cabo el procedimiento indicado
para lo cual es necesario fijar los valores del vector F de
modo tal que (A−FC) tenga sus polos en el lugar deseado.
Dados los polos de la planta, los del observador se fijaran
de modo tal que sean por lo menos 10 veces m ás rápidos paraevitar problemas de convergencia. El procedimiento es llevado
a cabo en MATLAB con la función K = place[A,B ,P ]que permite determinar el vector de ganancias en un sistema
realimentado de modo tal que el espectro de (A−BK) esté enlo valores de P . Esta función también puede ser utilizada para
determinar F si se considera la dualidad control/observación
que indica que si el par (A,C) es observable, es controlableel par (AT,CT), de modo tal que F = KT.
Con el fin de notar la importancia de la elección de los polos
del observador se generan 2 vectores de ganancia F, uno de
ellos con los polos 10 veces más rápido que los de la planta
( p = [−10 − 20]) y otro con polos 10 veces más lentos. Los
valores vienen dados a continuación en el orden respectivo:
F1 =
27,0000117,0000
;F2 =
−2,70006,1200
III-B. Resultados
A partir del diseño en Simulink de la planta y el
observador (véase figura (14)) se realizan simulaciones en
diversas situaciones comenzando con el comportamiento de
las salidas (real y estimada) para los 2 vectores de ganancia
F determinados previamente dada una entrada de tipo escalón
de magnitud 5 y con condiciones iniciales para el integrador
del observador igual a x̂0 = [1 0]T .
Figura 12. Esquema control adaptativo combinado
8/16/2019 InformeEjercicioN1
7/8
Figura 14. Esquema de planta y observador de estado para problema N°2
Los resultados se muestran en la figura (15) para el primer
segundo de simulación, donde se gráfica la salida de la
planta y las estimadas en ambos casos. Cuando los polos del
observador son más rápidos que los de la planta, la salida
estimada converge rápidamente produciéndose diferencias
solo en un comienzo debido a las distintas condiciones
iniciales entre la planta y el observador. En el caso de fijar
los polos de modo que sean más lentos, se aprecia que la
convergencia no se produce durante el tiempo mostrado (se
comienza a aproximar a partir de los 15[s]).
0 0.2 0.4 0.6 0.8 10
20
40
60
80
100
120
140
160
180
200
Tiempo [s]
S a l i d a s
Comportamiento del observador para 2 vectores F
y planta
y estimada F1
y estimada F2
Figura 15. Comportamiento de la salida del observador bajo diferentes valoresde ganancia F
Dado que los mejores resultados se observan cuando el
observador posee polos más rápidos que la planta, en lo
sucesivo se continuará el trabajo con el vector de ganancia F1.
La siguientes simulaciones buscan determinar la importan-
cia de las condiciones iniciales del observador, por lo que se
realizan una serie de pruebas cambiando dichas condiciones x̂0para la entrada previa, un escalón de amplitud 5. Los valores
utilizados son los siguientes:
x̂0 = [0 1]T , [1 − 2]T , [50 − 2]T , [1 50]T , [50 50]T
En la figura (16) se observa el error correspondiente
a la diferencia entre la salida estimada y la de la planta,
e = ŷ−y, para las condiciones iniciales indicadas. Se observaque mientras más distantes se encuentren estas de las de la
planta mayores serán los errores al comienzo pero en todos
los casos, con el transcurso del tiempo, este se hace nulo.
En el caso lı́mite en que las C.I del observador sean sean
idénticas a las de la planta el error es nulo como es de esperar.
0 0.1 0.2 0.3 0.4 0.5−10
0
10
20
30
40
50
Tiempo [s]
E r r o r e s
( \ h a t { y } − y )
[0 1]
[1 50]
[1 −2]
[50 50]
[50 2]
Figura 16. Error ante distintas condiciones iniciales
En el enunciado se pide además modificar los parámetros dela planta aumentándolos un 50 % durante la simulación paraanalizar la robustez del diseño del observador. Lo indicado
se consigue en Simulink generando una interrupción que se
dispara en un tiempo fijado por el usuario (t=5[s]), la cual
cambia los datos del workspace, véase figura (14).Téngase en
cuenta que se modifican los valores de las matrices A,B y
C de la planta mientras que los del observador se conservan
intactos.
Los resultados mencionados se muestran en la figura
(17), considerando condiciones iniciales para el observador
x̂0 = [0 1]T y una entrada escalón de amplitud 5 para la
planta. En el momento en que se produce el cambio de los
parámetros el error de estimación es nulo lo que implica que
tanto planta como observador tendrán el mismo estado, pero
posterior a esto sus dinámicas serán distintas y dado que se
tiene una señal de entrada constantes se producirá un error
permanente, o sea, el error de estimación será no nulo como
se muestra en la gráfica.
Para continuar con el análisis, bajo las consideraciones
anteriores de entrada y C.I., se simula una perturbación
externa sobre la salida de la planta (en la entrada tendrá un
efecto similar por lo que se omite) correspondiente a un
pulso de amplitud 1.5 y ancho igual a 2[s] en un momento en
que los estados estimados alcanzan los valores de los de la
planta. El resultado se observa en la figura (18) y como es de
esperar la estimación de la salida no se ve afectada en mayor
medida, pues sólo existen errores de estimación en los puntos
donde hay discontinuidades. En este caso la corrección se
realiza gracias a la diferencia de las salidas.
Consideremos finalmente lo que ocurre cuando se modifica
el tipo de entrada. De las ecuaciones es posible deducir que
8/16/2019 InformeEjercicioN1
8/8
0 2 4 6 8 10−5
0
5
10
15
20Variación de parámetros de la planta en t=5[s]
Tiempo [s]
A m p l i t u d
y planta
y estimada
Error de estimación
Figura 17. Cambio de parámetros en la planta en t=5[s]
0 2 4 6 8 10−2
0
2
4
6
8
10
12
14
16
18Perturbacion externa correpsondiente a pulso de amplitud 1.5
Tiempo [s]
A m p l i t u d
y planta
y estimada
Error de estimación
Figura 18. Perturbación externa
sin importar el tipo, desde el momento en que los estadostanto de observador como de la planta son idénticos, el error
de estimación será nulo, a diferencia de lo que ocurre con
una perturbación externa la cual requerirá un tiempo antes de
que e = ŷ − y sea cero. En la figura (19) se observa lo queocurre para una entrada correspondiente a una sinusoide y a
una suma de escalones, para C.I x̂0 = [5 10]T .
IV. CONCLUSIÓN
En la tarea se abordan dos aspectos principales, diseño
de controladores adaptativos y de observadores de estado
completo.
Mediante las simulaciones de la planta con los controladores
es posible corroborar que las leyes de ajuste si aseguran
estabilidad y que el error de referencia se anula. Según el
tipo de controlador existen una serie de parámetros libres
que permiten mejorar el comportamiento en cuando a sobre
oscilaciones como tiempo de estabilización. Dado que las
leyes de ajustes no son lineales es imposible separar por
completo el comportamiento y efecto de cada una de las
0 1 2 3 4 5 6 7 8 9 10−10
−5
0
5
10Entrada Sinusoidal
Tiempo [s]
A m p l i t u d
0 1 2 3 4 5 6 7 8 9 10−10
0
10
20
30
40
50Entrada suma de escalones
Tiempo [s]
A m p l i t u d
y planta
y estimadaError de estimación
Figura 19. Tipos de entrada
ganancias, aunque si se obtuvieron conclusiones parciales queson expresadas en el documento. En cuanto a las condiciones
iniciales, al variarlas se obtienen las mejores respuestas
mientras más próximas son a los parámetros de la planta.
Queda pendiente la tarea de determinar una buena estrategia
que permita ajustar parámetros en especial para el caso del
control combinado, y surge la pregunta de cual es la mejor
forma de diseñar este tipo de controladores cuando el orden
de la planta es mayor.
En cuanto al problema de observadores, es importante
destacar que el fin último es poder aplicar el conocimiento
de la estimación de estado para el control. En la planta dadano era necesario realizar esto pues ya era estable aunque si
se podrı́a haber mejorado la dinámica.
REFERENCIAS
[1] 3.0 Sistemas Adaptativos Simples.[2] Tabla Resumen v1.1: Elementos de Controladores Adaptativos para
Plantas Simples.