6
Control PID Wavenet Discreto para Sistemas No Lineales Subactuados con Ganancias Autosintonizables por Retroalimentaci´on de Salida M.A. Vega Navarrete * , L.E. Ramos Velasco * , P.A. Arizpe Carre´ on * V.M. Delgado R´ omero * , P. Argumedo * and V. Parra Vega ** * Universidad Polit´ ecnica Metropolitana de Hidalgo, M´ exico (e-mails: {mvega, lramos, parizpe, vdelgado, jguzman} @upmh.edu.mx). ** Centro de Invetigaci´ on y de Estudios Avanzados, Coahuila, M´ exico (e-mail: [email protected]) Resumen: Se propone una aplicaci´ on de las redes neuronales en conjunci´ on con la teor´ ıa wavelet para el control de un sistema subactuado. La red neuronal wavelet identifica la din´ amica inversa en el espacio del error del sistema subactuado, empleando una red neuronal de base radial con funciones de activaci´ on wavelet Morlet hijas y un filtro de respuesta infinita al impulso (IIR) en cascada. Dicho esquema controla la posici´ on angular mostrando la aplicaci´ on en un carro-p´ endulo mediante un controlador PID discreto sintentizado a partir de la multiresoluci´ on que provee la red wavelet cuyas ganancias se sintonizan en l´ ınea, empleando para esto, una parte de la din´ amica dada por la red neuronal wavelet. Se presentan los resultados obtenidos en simulaci´ on num´ erica mediante la plataforma de MATLAB. 1. INTRODUCCI ´ ON La contribuci´ on de las wavelets en la aproximaci´ on de se˜ nales continuas demuestra que es una herramienta muy ´ util en diferentes ramas de la ciencia [32]. Estudios realiza- dos en el ´ area de los neurocontroladores han probado ser ´ utiles para una clase de situaciones pr´ acticas; mostrando que pueden ser operadas en presencia de no linealidades normalmente desconocidas [16,19]. En [31] se mostr´ o un novedoso neurocontrolador usando una red neuronal tri- capa de recurrencia din´ amica; sin embargo, se asume que se tiene el modelo en espacio de estados del sistema, lo cual, no siempre es posible. Los autores en [8,30] emplean redes neuronales multicapa realimentadas en el dise˜ no de un control adaptable autosintonizable no lineal desconocido, con resultados importantes; sin embargo, la t´ ecnica de en- trenamiento de retropropagaci´ on [10] para redes multicapa es computacionalmente compleja y usualmente requiere de alculos fuera de l´ ınea para minimizar el error. En [9,17,25] emplean la estructura de un controlador PID basado en redes neuronales wavelets para controlar sistemas SISO, mientras que en [6,26] para sistemas MIMO completamen- te actuados. En [3,2] se presenta un control PID wavenet para un UAV (sistema subactuado) en el transporte de carga, con una estructura de red neuronal diferente sin filtro IIR a la salida, mientras que en [29] se hace un estudio comparativo de un controlador PID cl´ asico con un control inteligente. En la presente investigaci´ on se hace uso del algoritmo del gradiente descendiente para entrenar una red de perceptrones de una sola capa con funciones wavelets Morlet hijas como funciones de activaci´ on con la cual es posible sintonizar un controlador PID discreto en ınea para el control de un sistema subactuado SISO. La organizaci´ on del art´ ıculo es la siguiente: en la Secci´ on 2 se presentan los preliminares donde se describe el esquema del control inteligente. El modelo entrada-salida de un sistema subactuado en tiempo discreto se describe en la Secci´ on 3. En las Secci´ on 4, se describen los resultados de la simulaci´ on num´ erica en lazo cerrado. Finalmente, en la Secci´ on 5 son presentadas las conclusiones. 2. PRELIMINARES El esquema del controlador PID wavenet se muestra en la Figura 1. De donde se pueden observar que dicha arquitectura del controlador consta de tres bloques b´ asicos, cuyo objetivo de control es manipular la salida de un sistema SISO no lineal subactuado en una forma deseada, este esquema ya ha sido empleado para un motor de CA [25]. A continuaci´ on se describen cada una de los bloques: 2.1 Identificaci´on del Sistema El proceso de identificaci´ on se hace mediante una red neu- ronal de base radial en la que las funciones de activaci´ on son funciones wavelet hijas del tipo Morlet, dicha selecci´ on de esta wavelet se debe a que es la que mejores resultados present´ o de un estudio comparativo de un grupo de diez wavelets madre en simulaci´ on num´ erica [7], se le a˜ nadi´ oa la salida un filtro IIR en cascada que tiene como funci´ on filtrar (podar) las neuronas que tienen “poca” contribuci´ on en el proceso de identificaci´ on, permitiendo con esto redu- cir el n´ umero de iteraciones en el proceso de aprendizaje [11]. Dichos elementos se observan en las Figuras 2 y 3. La funci´ on wavelet ψ(τ ) es llamada wavelet madre porque las diferentes wavelet s generadas a partir de ella, por su dilataci´ on o contracci´ on y traslaci´ on, se les llama wavelets hijas ψ l (τ l ), representadas matem´ aticamente como [5]: Congreso Nacional de Control Automático 2017 Monterrey, Nuevo León, Mexico, Octubre 4-6, 2017 173

Control PID Wavenet Discreto para Sistemas No Lineales

  • Upload
    others

  • View
    11

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Control PID Wavenet Discreto para Sistemas No Lineales

Control PID Wavenet Discreto para

Sistemas No Lineales Subactuados con

Ganancias Autosintonizables por

Retroalimentacion de Salida

M.A. Vega Navarrete∗, L.E. Ramos Velasco∗, P.A. Arizpe Carreon ∗

V.M. Delgado Romero∗, P. Argumedo ∗ and V. Parra Vega ∗∗

∗ Universidad Politecnica Metropolitana de Hidalgo, Mexico (e-mails:{mvega, lramos, parizpe, vdelgado, jguzman} @upmh.edu.mx).

∗∗ Centro de Invetigacion y de Estudios Avanzados, Coahuila, Mexico(e-mail: [email protected])

Resumen: Se propone una aplicacion de las redes neuronales en conjuncion con la teorıa waveletpara el control de un sistema subactuado. La red neuronal wavelet identifica la dinamica inversaen el espacio del error del sistema subactuado, empleando una red neuronal de base radialcon funciones de activacion wavelet Morlet hijas y un filtro de respuesta infinita al impulso(IIR) en cascada. Dicho esquema controla la posicion angular mostrando la aplicacion en uncarro-pendulo mediante un controlador PID discreto sintentizado a partir de la multiresolucionque provee la red wavelet cuyas ganancias se sintonizan en lınea, empleando para esto, unaparte de la dinamica dada por la red neuronal wavelet. Se presentan los resultados obtenidos ensimulacion numerica mediante la plataforma de MATLAB.

1. INTRODUCCION

La contribucion de las wavelets en la aproximacion desenales continuas demuestra que es una herramienta muyutil en diferentes ramas de la ciencia [32]. Estudios realiza-dos en el area de los neurocontroladores han probado serutiles para una clase de situaciones practicas; mostrandoque pueden ser operadas en presencia de no linealidadesnormalmente desconocidas [16,19]. En [31] se mostro unnovedoso neurocontrolador usando una red neuronal tri-capa de recurrencia dinamica; sin embargo, se asume quese tiene el modelo en espacio de estados del sistema, lo cual,no siempre es posible. Los autores en [8,30] emplean redesneuronales multicapa realimentadas en el diseno de uncontrol adaptable autosintonizable no lineal desconocido,con resultados importantes; sin embargo, la tecnica de en-trenamiento de retropropagacion [10] para redes multicapaes computacionalmente compleja y usualmente requiere decalculos fuera de lınea para minimizar el error. En [9,17,25]emplean la estructura de un controlador PID basado enredes neuronales wavelets para controlar sistemas SISO,mientras que en [6,26] para sistemas MIMO completamen-te actuados. En [3,2] se presenta un control PID wavenetpara un UAV (sistema subactuado) en el transporte decarga, con una estructura de red neuronal diferente sinfiltro IIR a la salida, mientras que en [29] se hace unestudio comparativo de un controlador PID clasico conun control inteligente. En la presente investigacion se haceuso del algoritmo del gradiente descendiente para entrenaruna red de perceptrones de una sola capa con funcioneswavelets Morlet hijas como funciones de activacion con lacual es posible sintonizar un controlador PID discreto enlınea para el control de un sistema subactuado SISO. Laorganizacion del artıculo es la siguiente: en la Seccion 2 se

presentan los preliminares donde se describe el esquemadel control inteligente. El modelo entrada-salida de unsistema subactuado en tiempo discreto se describe en laSeccion 3. En las Seccion 4, se describen los resultados dela simulacion numerica en lazo cerrado. Finalmente, en laSeccion 5 son presentadas las conclusiones.

2. PRELIMINARES

El esquema del controlador PID wavenet se muestra enla Figura 1. De donde se pueden observar que dichaarquitectura del controlador consta de tres bloques basicos,cuyo objetivo de control es manipular la salida de unsistema SISO no lineal subactuado en una forma deseada,este esquema ya ha sido empleado para un motor de CA[25]. A continuacion se describen cada una de los bloques:

2.1 Identificacion del Sistema

El proceso de identificacion se hace mediante una red neu-ronal de base radial en la que las funciones de activacionson funciones wavelet hijas del tipo Morlet, dicha seleccionde esta wavelet se debe a que es la que mejores resultadospresento de un estudio comparativo de un grupo de diezwavelets madre en simulacion numerica [7], se le anadio ala salida un filtro IIR en cascada que tiene como funcionfiltrar (podar) las neuronas que tienen “poca” contribucionen el proceso de identificacion, permitiendo con esto redu-cir el numero de iteraciones en el proceso de aprendizaje[11]. Dichos elementos se observan en las Figuras 2 y 3.La funcion wavelet ψ(τ) es llamada wavelet madre porquelas diferentes wavelets generadas a partir de ella, por sudilatacion o contraccion y traslacion, se les llama waveletshijas ψl(τl), representadas matematicamente como [5]:

Congreso Nacional de Control Automático 2017Monterrey, Nuevo León, Mexico, Octubre 4-6, 2017

173

Page 2: Control PID Wavenet Discreto para Sistemas No Lineales

Figura 1. Esquema a bloques del controlador PID auto-sintonizado mediante una wavenet para un sistemadinamico SISO, donde k es la variable temporal dis-creta, yref [k] senal de referencia, y[k] senal de salida,y[k] senal salida aproximada, r[k] senal de ruido, v[k]

senal persistente, Γ[k] vector de aproximacion no li-neal, u[k] senal de control, e[k] error de seguimiento,ε[k] error de identificacion y p[k], i[k] d[k] ganancıaproporcional, integral y derivativa, respectivamente.

ψl(τl) =1√aψ(τ) (1)

con τl = k−blal

; al 6= 0, al, bl ∈ R y donde al es la variable deescala, que permite hacer dilataciones y contracciones; y bles la variable de traslacion, que permite el desplazamientoen el instante k y R el conjunto de los numeros reales. Larepresentacion matematica de la wavelet Morlet esta dadapor [5]:

ψ(τ) = cos(ω0τ)e−0.5τ2

(2)

donde ω0 es la frecuencia de oscilacion de la wavelet madre,su derivada parcial con respecto a bl de la wavelet Morletes:

∂ψ

∂bl=

1

a

[ω0sin(ω0τ)e−0.5τ2

+ τψ(τ)]

(3)

Figura 2. Red Neuronal Wavelet con filtro IIR.

De las Figuras 2 y 3 se puede obtener la senal aproximadapor la wavenet con filtro IIR y[k] como:

y[k] =

N∑n=1

dny[k − n]v[k]︸ ︷︷ ︸+

M∑m=0

cmz[k −m]︸ ︷︷ ︸u[k] (4)

≡ Φ[k] + Γ[k] u[k] (5)

donde

z[k] =

L∑l=1

wlψl[τl] (6)

L es el numero de neuronas, wl son los pesos de cadaneurona en la wavenet, cm y dn son los coeficientes deadelanto y atraso del filtro IIR, respectivamente, mientrasque M y N son el numero de los coeficientes de adelantoy atraso del filtro IIR, respectivamente.

Figura 3. Estructura del filtro IIR.

Los parametros de la wavenet, en forma vectorial estandados por:

A[k] = [a1[k], a2[k], . . . , al[k], . . . , aL[k]]T (7)

B[k] = [b1[k], b2[k], . . . , bl[k], . . . , bL[k]]T (8)

W [k] = [w1[k], w2[k], . . . , wl[k], . . . , wL[k]]T (9)

y los parametros del filtro IIR, representados de la mismaforma:

C[k] = [c0[k], c1[k], . . . , cm[k], . . . , cM [k]]T (10)

D[k] = [d1[k], d2[k], . . . , dn[k], . . . , dN [k]]T (11)

Los cuales son optimizados mediante un algoritmo deaprendizaje basado en mınimos cuadrados medios LMS,esto se realiza mediante la minimizacion de una funcion decosto E. Para lograr esto se define el error de estimacione[k] como la diferencia entre la salida real de la planta y[k]y la salida de la red neuronal y[k], es decir:

e[k] = y[k]− y[k] (12)

La funcion de energıa del error de estimacion se definecomo:

E ≡ 1

2

T∑k=1

e2[k] (13)

Donde T es el periodo de muestreo, para minimizar E seaplica el metodo del gradiente de pasos descendentes, queutiliza las siguientes derivadas:

∂E

∂wl[k]=−e[k]CT [k]Ψl[τ ])u[k] (14)

∂E

∂bl[k]=−e[k]CT [k]Ψbl[τ ]wl[k]u[k] (15)

∂E

∂al[k]= τl

∂E

∂bl[k](16)

∂E

∂cm[k]=−e[k]z[k −m]u[k] (17)

∂E

∂dn[k]=−e[k]y[k − n]v[k] (18)

donde

Ψl[τ ] = [ψl[τ ], ψl[τ − 1], · · · , ψl[τ −M ]]T (19)

Ψbl[τ ] =

[∂ψl[τ ]

∂bl[k],∂ψl[τ − 1]

∂bl[k], · · · , ∂ψl[τ −M ]

∂bl[k]

]T(20)

La actualizacion de los parametros cumple con la siguienteregla [4,27]:

θ[k + 1] = θ[k] + µθ∆θ[k], ∆θ[k] = − ∂E

∂θ[k](21)

Page 3: Control PID Wavenet Discreto para Sistemas No Lineales

donde θ puede ser cualquiera de los parametros a serajustados: W [k], A[k], B[k], C[k] y D[k]. El valor de µθ ∈ Rrepresenta el coeficiente de velocidad de aprendizaje paracada uno de los parametros.

2.2 Control PID wavenet

En esta parte se presenta el control PID clasico en tiempodiscreto cuyas ganacias son adaptables en lınea, empleandopara esto el termino Γ[k] de la wavenet que es usadapara el proceso de identificacion entrada-salida. La senalde control del PID que sigue la referencia deseada yref [k]puede ser calculada como [1,12,22]:

u[k + 1] = u[k] + p[k]{ε[k]− ε[k − 1]}+ i[k]ε[k] +

d[k]{ε[k]− 2ε[k − 1] + ε[k − 2]} (22)

donde p[k], i[k] y d[k] son las ganancias proporcional,integral y derivativas del controlador PID, u[k] es laentrada de la planta al instante k y el error de seguimientoε[k] se define como la diferencia entre la salida de la plantay[k] y la senal de referencia yref [k], es decir:

ε[k] = y[k]− yref [k] (23)

2.3 Auto-sintonizacion

Debido a que las ganancias p[k], i[k] y d[k] estan conside-radas dentro de la funcion de costo (13) estas pueden seractualizadas de la siguiente manera:

p[k] = p(k − 1) + µpe[k]Γ[k]{ε[k]− ε[k − 1]} (24)

i[k] = i(k − 1) + µie[k]Γ[k]ε[k] (25)

d[k] = d[k − 1] + µde[k]Γ[k]{ε[k]− 2ε[k − 1] + ε[k − 2]}(26)

donde Γ[k] es una parte de la ecuacion de identificaciondel sistema descrita por (5). Y, las constantes µ son lastazas de aprendizaje de las ganancias del controlador PIDdiscreto, el control dado por (22) con las ganacias (24)-(26) le llamamos PID wavenet dado que (24)-(26) tienenun termino multiplicando el error de identificacion e[k] y

Γ[k] multiplicando la senal de control u[kT ] en (40).

3. DINAMICA DE UN SISTEMA SUBACTUADO

En esta seccion se obtiene el modelo discreto para unrobot subactuado con n grados de libertad, comenzandocon el modelo en tiempo continuo. En [28], las ecuacionesdiferenciales de un robot subactuado en tiempo continuopueden ser escritas como:

M11q1 + M12q2 + C1(q, q)q + g1(q) = 0 (27)

M21q1 + M22q2 + C2(q, q)q + g2(q) = γ (28)

donde

M(q) =

[M11 M12

M21 M22

],C(q, q) =

[C1(q, q)C2(q, q)

], (29)

q = [ q1 q2 ]T

, g(q) = [ g1(q) g2(q) ]T

y q es el vector(n × 1) de coordenadas generalizadas, M (q) es la matrizde inercia (n × n), que es simetrica y definida positiva,

C (q, q) es la matriz de Coriolis, g (q) son los terminosgravitacionales, y γ es el vector (n×1) de pares de entrada.

En [23] se demuestra que las ecuaciones dinamicas de unsistema subactuado no pueden ser integradas en el casogeneral, solo para mecanismos especıficos es posible obte-ner una relacion entre las velocidades o posiciones de lasuniones pasivas y activas. Por esta razon, el acoplamientodinamico se define en base a la relacion de aceleracion (27),que siempre se puede encontrar. Resolviendo (27) para q1,se obtiene

q1 = −M−111 (M12q2 + C1(q, q)q + g1) (30)

sustituyendo (30) en (28), se obtiene

M22q2 + C2q + g2 = γ (31)

donde M22 = M22−M21M−111 M12, C2(q, q) = C2(q, q)−

M21M−111 C1(q, q) y g2(q) = g2(q)−M21M

−111 g1(q)

el cual, pueden ser representadas en espacio de estadoscomo

x(t) = f(x(t)) + g(x(t))u(t) (32)

y(t) = x2(t) = [0 I]x(t) ≡ Cox(t) (33)

donde

f(x(t)) =

[x2

−M−122 [C2x2 + g2]

], g(x(t)) =

[0

M−122

](34)

aquı, [xT1 xT2 ] = [qT2 qT2 ] y u = γ.

Para obtener una ecuacion de estado en tiempo discretoa partir de (32)-(33), [14], [18], [21], [20], se asume quetodas las mediciones del estado del manipulador estandisponibles en un periodo de muestreo T , y los paresde entrada permanecen constantes entre los instantes demuestreo, es decir, en cada intervalo de tiempo Ik =[kT (k + 1)T ], donde k ≥ 0 es un entero, para losintervalos suficientemente pequenos x se puede aproximarcon una diferencia hacia adelante de primer orden, x ≈x(t+T )−x(t)

T . Entonces, la ecuacion diferencial (32) puedeser aproximada como

x(t+ T )− x(t)

T= f(x(t)) + g(x(t))u(t) (35)

Resolviendo esta ecuacion para x(t+ T ), se obtiene

x(t+ T ) = x(t) + f(x(t))T + g(x(t))Tu(t) (36)

Ahora evaluando (36) y (33) en t = kT da un modelosimple en tiempo discreto como sigue:

x[(k + 1)T ] = x[kT ] + f(x[kT ])T + g(x[kT ])Tu[kT ](37)

y[(k + 1)T ] = Cox[(k + 1)T ] (38)

Sustituyendo (37) en (38), la senal de salida en el instante(k + 1)T esta dada por

y[(k + 1)T ] = Co (x[kT ] + f(x[kT ])T )

+Co(g(x[kT ])T )u[kT ]

≡Φ[x[kT ], T ] + Γ[x[kT ], T ]u[kT ] (39)

donde Φ[x[kT ], T ] = Co(x[kT ]+f(x[kT ])T ) y Γ[x[kT ], T ] =Co(g(x[kT ])T ). La ecuacion (39) describe el comporta-miento dinamico entrada-salida de un sistema subactuado.

Page 4: Control PID Wavenet Discreto para Sistemas No Lineales

Se asume que los terminos en (39) se desconocen, para estose considera:

y[(k + 1)T ] = Φ[x[kT ]), ϑφ] + Γ[(x[kT ]), ϑΓ]u[kT ] (40)

Ahora, comparando la ecuacion previa (40) con la salidade la wavenet con el filtro IIR (4), se concluye que:

Φ[x[kT ], ϑΦ] =

N∑n=1

dny[(k − n)T ]v[kT ] (41)

Γ[x[kT ], ϑΓ] =

M∑m=0

cmz[(k −m)T ] (42)

que depende de parametros ajustables ϑΦ y ϑΓ respecti-vamente.

Se han propuesto muchos esquemas para sintonizarlas,especialmente el backstepping en [13] y linealizacion parcialpor retroalimentacion en [28], sin embargo requieren unconocimiento completo de la planta [15], [16]. El metodoadaptable en [33] y el backstepping con modo deslizante[24] introducen la robustez ante incertidumbres parame-tricas y de modelo, respectivamente. Sin embargo, en esteartıculo solo se requiere la entrada y la salida del sistemasubactuado para la identificacion y el control, donde ambosse realizan en lınea.

4. SIMULACION

El controlador PID discreto auto-sintonizado por la redneuronal wavelet es empleado para controlar la posicionangular del carro-pendulo, utilizando Simulink-MATLABen el cual fue programado, los parametros mostrados enla Cuadro 1 que pertenecen a un pendulo invertido marcaQuanser debido a que este ha sido ampliamente estudiadoy permite compararlo. Los parametros para la wavenetempleados en la simulacion numerica se dan en la Cuadro2. Los valores iniciales y tazas de aprendizaje de losparametros ajustados estan dados en la Cuadro 3.

Cuadro 1. Parametros empleados en la simula-cion numerica

Parametro Significado Valor

M Masa de carro 0.52 Kgm Masa del pendulo 0.23 Kgl Longitud al centro de gravedad 0.32 mJ Momento de inercia 0.007 Kgm2

g Aceleracion de la gravedad 9.8 m/s2

β1 Friccion del carro 0.1 Kg/sβ2 Friccion del pendulo 0.01 Kg/s

4.1 Resultados de la Identificacion del Sistema

La simulacion se llevo a cabo dando una condicion inicialde π/40 rad en la inclinacion del pendulo y cero en laposicion del carro; el cual sigue una trayectoria senoidalde amplitud 4.5 grados y frecuencia de 1rad/seg.

En la Figura 4 son presentados los comportamientos dela los parametros propios de la red neuronal como son lospesos (wl) y tanto las dilataciones (al) y traslaciones (bl)de la funcion de activacion wavelet para cada una de lastres neuronas utilizadas en el caso actual. Es importante

0 5 10 15 20 25 30 35 40 45 500

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1x 10

−16

Tiempo (segundos)

Peso

, w

Tiempo (segundos)0 5 10 15 20 25 30 35 40 45 50

Tra

sla

ció

n, b

0

1

2

3

4

5

6

7

8

9

10

0 5 10 15 20 25 30 35 40 45 500

1

2

3

4

5

6

7

8

9

10

Tiempo (segundos)

Dila

tació

n,

a

Figura 4. Comportamiento de los pesos, traslaciones ydilataciones de la wavenet.

0 5 10 15 20 25 30 35 40 45 50−2.5

−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

2.5

Tiempo (segundos)

Error

(grad

os)

Figura 5. Error de Identificacion

destacar que los valores de estos tres parametros se com-portaron de manera similar en las tres neuronas.

Cuadro 2. Parametros de la red neuronal wa-velet

Parametro Valor

wavelet madre, ψ(τ) Morlet, con ω0 = 1Numero de neuronas, L 3Coeficientes c del filtro IIR, M 4Coeficientes d del filtro IIR, N 2Periodo de muestreo, T 0.001 ssenal de persistencia, v[k] u

5

Cuadro 3. Valores iniciales de la red neuronal

Parametro Valor Taza de Valor

aprendizaje

W [0, 0, 0] µw 5 ∗ 10−20

A [10, 10, 10] µa 5 ∗ 10−15

B [1, 1, 1] µb 5 ∗ 10−18

C [0.1, 0.05, 0, 0.15] µc 5 ∗ 10−21

D [0, 0] µd 5 ∗ 10−19

p 26 µp 99999999999999i 10 µi 99999999999999d 6 µd 99999999999999

Ası mismo, en la Figura 5 se muestra el error de identifi-cacion, en el cual es posible observar que se mantiene unerror que oscila en un maximo de un grado, de lo cual sepuede asumir que la red neuronal wavelet de identificacionse encuentra alrededor del mınimo aproximado medianteel metodo del gradiente decendiente.

Page 5: Control PID Wavenet Discreto para Sistemas No Lineales

Tiempo (segundos)0 5 10 15 20 25 30 35 40 45 50

Ampl

itud

(gra

dos)

-5

-4

-3

-2

-1

0

1

2

3

4

5Señal de salidaSeñal de Referencia

Figura 6. Seguimiento del sistema.

0 5 10 15 20 25 30 35 40 45 50−0.02

−0.01

0

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

Tiempo (segundos)

Erro

r(gra

dos)

Figura 7. Error de Seguimiento

4.2 Resultados del controlador PID wavenet

Como se puede apreciar el buen desempeno del controladorPID discreto cuya ganancias son adaptadas con la redneuronal wavelet ya que la trayectoria real se aproxima ra-pidamente y de manera suave a la trayectoria deseada conun error de seguimiento pequeno considerando la dinamicaaltamente no lineal e inestable del sistema subactuado.

Dicho error de seguimiento es mostrado en la Figura 7, elcual se puede ver que oscila entre ±0.1 grado, esto es laconsecuencia del error de identificacion presentado.

4.3 Resultados de la Auto-sintonizacion

En la Figura 8 se muestra la evolucion de las diferentesganancias del control a traves del experimento realizado.Es importante aclarar que dada la naturaleza inestable delsistema fue necesario elegir ganancias iniciales que hicieranestable al sistema y que despues se adaptaran en lınea porunas mas adecuadas.

Por ultimo en la Figura 9 se presenta la senal de controlaplicada al sistema, una caracterıstica importante de esteesquema de control es que la senal de control es suave, estotrae como beneficio una mayor duracion de los actuadores.

5. CONCLUSIONES Y TRABAJO FUTURO

De los resultados obtenidos en la presente investigacion sepuede concluir la importante posibilidad de controlar siste-mas no lineales subactuados por medio de redes wavenetsen conjunto con filtros IIR para aproximar plantas que sonde naturaleza inestable y que en ocasiones es practicamen-te imposible de sintonizar un PID clasico con las tecnicastradicionales. El siguiente paso natural es realizar la parteexperimental, ademas extender este resultado a sistemasMIMO subactuados, como por ejemplo los Drones. Comotrabajo futuro queda de manera inmediata la sıntesis deun postulado con su prueba formal, ası como un analisiscomparativo analıtico. Actualmente, se esta trabajando anivel experimental en todo ello.

REFERENCIAS

[1] Astrom K. (1997). Computer-Controlled Systems,theory and design. Pretince-Hall.

0 5 10 15 20 25 30 35 40 45 5042.1

42.2

42.3

42.4

42.5

42.6

42.7

42.8

42.9

43

Tiempo (segundos)

Gan

ancia

Pro

porc

iona

l

0 5 10 15 20 25 30 35 40 45 505.9998

5.9999

6

6.0001

6.0002

6.0003

6.0004

6.0005

Tiempo (segundos)

Gan

ancia

Der

ivativ

a

0 5 10 15 20 25 30 35 40 45 500

50

100

150

200

250

Tiempo (segundos)

Gan

ancia

Inte

gral

Figura 8. Ganancias del controlador PID.

0 5 10 15 20 25 30 35 40 45 50−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

Tiempo (segundos)

Cont

rol (

Volts

)

Figura 9. Senal de control.

[2] Ricardo A. Barron-Gomez, Luis Enrique Ramos-Velasco, Eduardo Steed Espinoza Quesada and LuisRodolfo Garcıa Carrillo. Wavelet neural network PIDcontroller for a UAS transporting a cable-suspendedload, IFAC Word Congress, 2017, pp. 2371-2376.

[3] Ricardo A. Barron-Gomez, Luis E. Ramos-Velasco,Eduardo S. Espinoza-Quesada, Hao Xu and Luis R.Garcia-Carrillo. Model-free adaptive controller for au-tonomous aerial transportation of suspended loadswith unknown characteristics, Proc. SPIE UnmannedSystems Technology XIX, 2017.

[4] Cruz J., L. Ramos and M. Espejel. A self-tuing waveletPID controller using wavelet networks. 20th Interna-tional Conference on Electronics Communications andComputers (CONIELE-COMP 2010). Puebla, Mexi-co.

[5] Daubechies I. (1992). Ten lectures on wavelets. SIAM.[6] F. A. Dıaz Lopez, L. E. Ramos Velasco, O. A. Domın-

guez Ramırez and Vicente Parra Vega. Multiresolutionwavenet PID control for global Regulation of Robots,9th Asian Control Conference (ASCC 2013).

[7] C. R. Domınguez Mayorga, M. A. Espejel Rivera, L.E. Ramos Velasco, J. C. Ramos Fernandez and E. Es-camilla Hernandez. Wavenet algorithms with applica-tions in approximation signals: a comparative study.Ibero-American Journal of Industrial Automation andInformatics, 2012, pp.347-358.

Page 6: Control PID Wavenet Discreto para Sistemas No Lineales

[8] F. C. Chen. Back-propagation neural networks fornonlinear self-tuning adaptive control. IEEE ControlSystems Magazine, Special Issue on Neural Networksfor Control Systems, 25, April 1990.

[9] C. M. Chang and T. S. Liu. A wavelet network con-trol method for disk drives. IEEE Trans. on ControlSystems Technology, 14(1), january 2006.

[10] M.T. Hagan.(1999). Nueral Network Desing. PWSPublishing Company.

[11] Haykin S. (2001). Kalman Filtering and Neural Net-works. Wiley.

[12] Kuo B. (1997). Sistemas de Control Digital.C.E.C.S.A.

[13] M. Krstic and P.V. Kokotovic. Estimation-basedadaptive backstepping designs for linear systems, Pro-ceedings of the 34th IEEE Conference on Decision andControl, 1995, pp. 3935-3940.

[14] R. Lai, Y. Yamanaka, F. Ohkawa and R. Katoh.Digital control of a robot manipulator disturbed byunknown external forces, Proceeding of The Societyif Instruments and control Engineers, 1997, pp. 1115-1118

[15] Levin A. and K. Narendra. Control of nonlinear dy-namical systems using neural networks: controllabilityand stabilization. IEEE Transactions on Neural Net-works, 1993, Vol. 4, pp. 192-206.

[16] Levin A. and K. Narendra. Control of nonlinear dyna-mical systems using neural networks - Part II: observa-bility, identification, and control. IEEE Transactionson Neural Networks, 1996, Vol. 7, pp. 30-42.

[17] Hui Li and Hongzhang Jin. PID control based on wa-velet neural network identification and tuning and itsapplication to in stabilizer. In International Conferen-ce on Mechatronics and Automation, Shanghai, 2004.

[18] I. Mareels, H.B. Penfold and R.J. Evans. Controllingnonlinear time-varying systems via Euler approxima-tions, Automatica, 1992, pp. 681-696.

[19] B. Muller and J. Reinhardt. Neural Networks. SpringVerlag, Berlin, 1990.

[20] S. Nicosia, P. Tomei and A. Tornambe. Discrete dy-namics of robot arm, Poceedings of IFAC Theory ofRobotics, 1986.

[21] C.P. Neuman and V.D. Tourassis. Discrete dynamicrobot models, Transactions on Systems, Man andcybernetics, 1985, pp.193-204

[22] Ogata K. (1996). Sistemas de Control en TiempoDiscreto. Prentice-Hall.

[23] G. Oriolo and Y. Nakamura. Control of mechanicalsystems with second-order nonholonomic constraints:underactuated manipulators, Proceedings of the 30thIEEE Conference on Decision and Control,1991, pp.2398-2403.

[24] Heriberto Ramirez-Rodriguez, Vicente Parra-Vega,Anand Sanchez-Orta and Octavio Garcia-Salazar. Ro-bust backstepping control based on integral slidingmodes for tracking of quadrotors, Journal of Intelli-gent and Robotic Systems, 2014, pp. 51-66.

[25] L. E. Ramos-Velasco, J.C. Ramos-Fernandez O. Islas-Gomez, J. Garcıa-Lamont and M.A. Marquez-Vera.Identification and wavenet control of AC motor, Ibero-American Journal of Industrial Automation and Infor-matics, 2013, pp. 269–278.

[26] L. E. Ramos Velasco, O. A. Domınguez Ramırez andVicente Parra Vega. Wavenet fuzzy PID controller

for nonlinear MIMO systems: experimental validationon a high-end haptic robotic interface, Applied SoftComputing, 2016, pp. 199-205.

[27] Sedighizadeh M. and A Rezazadeh. Adaptative PIDcontrol of wind energy conversion systems usingRASP1 mother wavelet basis function network. Pro-ceeding of World Academy of Science, Engineering andTechnology, 2008, pp. 269-273.

[28] M.W. Spong. Partial feedback linearization of unde-ractuated mechanical systems, Proceedings on of theIEEE International Conference Intelligent Robots andSystems, 1994.

[29] M.A. Saldana O., L.E. Ramos V., J.P. Ordaz O., A.Garcia Barrientos, I. Algredo Badillo, Jean FrancoisBalmat and Frederic Lafont. A comparative studyof the wavenet PID ontrollers for applications innonlinear systems, 12th Int. Conf. on Elect. Eng.Computing Science and Automatic Control, 2015, pp.33-38.

[30] A. Sideris, D. Psaltis and A. A. Yamamura. A multi-layered neural network controller. IEEE Control Sys-tems Magazine, April 1988.

[31] S.I.Sudharsanan, Training of a three layer dynamicalrecurrent neural network for nonlinear input outputmapping. In Proc. Int. Conf. on Nerual Networks,1991.

[32] A. I. Zayed (1993). Advanced in Shannonts SamplingTheory. CRC Press, Inc., Boca Raton, FL.

[33] T. Zhang and S.S. Ge. Adaptive neural network con-trol for strict-feedback nonlinear systems using backs-tepping design, Automatica, 2000, pp. 1835-1846.