6
СИМУЛАЦИЈА НА ИНВЕРТИРАНО НИШАЛО И ИДЕНТИФИКАЦИЈА НА МОДЕЛОТ СО НЕВРОНСКИ МРЕЖИ Александар Арсовски 1 , Миле Станковски 1 1 Факултет за Електротехничка и информациони технологии Скопје, Карпош II бб, 1000 Скопје, Македонија, [email protected]; [email protected] Апстракт Во овој труд е презентиран симулациски модел за управување на инвертирано нишало и негова идентификација со невронски мрежи. Прво се разгледува системот на инвертирано нишало, преку опис на нелинеарен математички модел и управувач со лиеаризирана повратна врска. Симулациските модели се развиени во MATLAB/Simulink ® . Потоа е извршена идентификација на претходно дефинираниот модел со користење на невронски мрежи, и на крајот се анализирани и споредени добиените резултати од нелинеарниот математички модел и од моделот со невронска мрежа. Клучни зборови инвертирано нишало, идентификација, невронски мрежи. 1. ВОВЕД Инвертираното нишало како систем на управување со силна нелинеарност и нестабилност, е класичен проблем во теоријата на управување. Во последно време во широко распространетата литература тој се наметнува како основен систем за тестирање и споредување на голем број управувачки алгоритми. Реална примена системот на управување на инвертирано нишало наоѓа во голем број апликации, како на пример, управување на рамнотежа на хуманоиден робот или моторен уницикл segway PT (самобалансирачки скутер), одржување на позиција на ракетни лансирни рампи и сл. Покрај многуте проблеми од фамилија на инвертирано нишало, како што се само- еректирачко, ротирачко, двојно инвертирано нишало, и многу други, овдека ќе беде изложена проблематиката на наједноставниот систем, составен од количка на која се наоѓа прачката каде управувањето се врши со поместување на количката, преку аплицирање на потребна сила за управување на системот [1]. Способноста на невронските мрежи за апроксимација на нелинеарни системи од висок ред, ги прави едни од главните кандидати за репрезентација на динамичките карактеристики на овие системи. Условот што со методата на учење наназад, параметрите на невронските мрежи можат релативно лесно да се прилагодат е уште една причина тие да се користат при идентификација на нелинеарните динамички системи. Потребните податоци за да се реализира учењето наназад на невронската мрежа се единствено влезно - излезните податоци од системот на инвертирано нишало. Но, бидејќи системот е нелинеарен систем од втор ред, потребно е излезите да имаат временско доцнење од втор ред за да се земе впредвид реалното влијание на влезот врз излезите на системот. 2. ОПИС НА СИСТЕМОТ 2.1. Физички опис Инвертираното нишало е составено од прачка која на едниот нејзин крај е закачена за некоја подвижна основа, најчесто количка (Сл. 1). Сл. 1 – Инвертирано нишало

СИМУЛАЦИЈА НА ИНВЕРТИРАНО НИШАЛО И ИДЕНТИФИКАЦИЈА НА МОДЕЛОТ СО НЕВРОНСКИ МРЕЖИ

Embed Size (px)

Citation preview

Page 1: СИМУЛАЦИЈА НА ИНВЕРТИРАНО НИШАЛО И ИДЕНТИФИКАЦИЈА НА МОДЕЛОТ СО НЕВРОНСКИ МРЕЖИ

СИМУЛАЦИЈА НА ИНВЕРТИРАНО НИШАЛО И ИДЕНТИФИКАЦИЈА НА МОДЕЛОТ СО НЕВРОНСКИ МРЕЖИ

Александар Арсовски1, Миле Станковски1

1 Факултет за Електротехничка и информациони технологии – Скопје, Карпош II бб, 1000 Скопје, Македонија, [email protected]; [email protected]

Апстракт – Во овој труд е презентиран симулациски модел за управување на инвертирано нишало и негова идентификација со невронски мрежи. Прво се разгледува системот на инвертирано нишало, преку опис на нелинеарен математички модел и управувач со лиеаризирана повратна врска. Симулациските модели се развиени во MATLAB/Simulink®. Потоа е извршена идентификација на претходно дефинираниот модел со користење на невронски мрежи, и на крајот се анализирани и споредени добиените резултати од нелинеарниот математички модел и од моделот со невронска мрежа.

Клучни зборови – инвертирано нишало, идентификација, невронски мрежи.

1. ВОВЕД

Инвертираното нишало како систем на управување со силна нелинеарност и нестабилност, е класичен проблем во теоријата на управување. Во последно време во широко распространетата литература тој се наметнува како основен систем за тестирање и споредување на голем број управувачки алгоритми.

Реална примена системот на управување на инвертирано нишало наоѓа во голем број апликации, како на пример, управување на рамнотежа на хуманоиден робот или моторен уницикл segway PT (самобалансирачки скутер), одржување на позиција на ракетни лансирни рампи и сл.

Покрај многуте проблеми од фамилија на инвертирано нишало, како што се само-еректирачко, ротирачко, двојно инвертирано нишало, и многу други, овдека ќе беде изложена проблематиката на наједноставниот систем, составен од количка на која се наоѓа прачката каде управувањето се врши со поместување на количката, преку аплицирање на потребна сила за управување на системот [1].

Способноста на невронските мрежи за апроксимација на нелинеарни системи од висок ред, ги прави едни од главните кандидати за репрезентација на динамичките карактеристики на овие системи. Условот што со методата на учење наназад, параметрите на невронските мрежи можат релативно лесно да се прилагодат е уште една причина тие да се користат при идентификација на нелинеарните динамички системи.

Потребните податоци за да се реализира учењето наназад на невронската мрежа се единствено влезно - излезните податоци од системот на инвертирано нишало. Но, бидејќи системот е нелинеарен систем од втор ред, потребно е излезите да имаат временско доцнење од втор ред за да се земе впредвид реалното влијание на влезот врз излезите на системот.

2. ОПИС НА СИСТЕМОТ

2.1. Физички опис

Инвертираното нишало е составено од прачка која на едниот нејзин крај е закачена за некоја подвижна основа, најчесто количка (Сл. 1).

Сл. 1 – Инвертирано нишало

Page 2: СИМУЛАЦИЈА НА ИНВЕРТИРАНО НИШАЛО И ИДЕНТИФИКАЦИЈА НА МОДЕЛОТ СО НЕВРОНСКИ МРЕЖИ

Во општ случај количката има слобода на движење по некоја рамнина и прачката може да се движи напред и назад. Во овој случај разгледуваме количка која може да се движи во еден правец, додека прачката може да ротира само околу оската на која е закачена за количката, во рамнината определена со правецот на движењето на количката и нејзината вертикална положба. Од механичка гледна точка оваа е систем со два степени на слобода на движење.

Доколку прачката се постави точно во вертикална положба, теориски таа треба да остане во истата бидејќи на неа не дејствуваат бочни сили. Но, во пракса тоа не е можно да се случи, бидејќи прачката е далеку од рамнотежна состојба и само мало пореметување е доволно таа да се придвижи на едната или другата страна. Со цел прачката да се одржи во вертикална состојба, потребно е на количката да се дејствува со некоја сила F која ќе ја движи количката напред – назад. За постигнување на оваа цел, се управува единствено со интезитетот и насоката на силата F, поради што овој систем спаѓа во класата на механички системи со помалку управувани големини од степените на слобода на движење. Оваа карактеристика дополнително го отежнува управувањето на системот.

2.2. Математички модел

За целите на овој труд ќе користиме математичи модел на инвертирано нишало често цитиран во литературата, а реализиран со помош на Лагранжова функција. [5]

Кинетичката енергија на системот T е збир од кинетичките енергии на сите маси. Кинетичката

енергија на количката и прачката се 1T и 2T ,

соодветно:

21

1

2T Mx (1)

2 22 2

1( )

2T m x y (2)

Според ознаките на Сл. 2 се добива:

2 2sin ; cosx x l x x l (3)

cos ; siny l y l (4)

од каде пак за 2T и T се добива:

2 2 22

1( 2 cos )

2T m x xl l (5)

2 2 2 21 2

1( 2 cos )

2T T T Mx m x xl l

,(6)

Потенцијалната енергија V , на системот е акумулирана само во прачката и изнесува:

cosV mgy mgl (7)

x

O

2

x

m

M

y

F

l

Сл. 2 – Шематски приказ на инвертирано нишало

За Лагранжова фукција на системот L T V се добива:

2 2 21 1( ) cos

2 2cos

L M m x mlx ml

mgl

(8)

за која важат равенките:

0

d L LF

dt x x

d L L

dt

(9)

Според равенката (8) изводите на L се дадени со следните равенства:

2

0;

sin sin

( ) cos

cos

L

xL

mgl mlx

LM m x ml

xL

mlx ml

(10)

Со смена на (10) во (9) и решавање на изводите по време t се добива:

2

2

( ) cos sin

cos sin 0

M m x ml ml F

mlx ml mgl

(11)

Од равенките (11) се добиваат равенките (12), коишто го претставуваат нелинеарниот математички модел на системот на инвертирано нишало.

2

2

2

2

sin cos ( ) sin cos

cos ( )

sin cos sin

cos ( )

ml M m g F

ml M m l

mg ml Fx

m M m

(12)

Page 3: СИМУЛАЦИЈА НА ИНВЕРТИРАНО НИШАЛО И ИДЕНТИФИКАЦИЈА НА МОДЕЛОТ СО НЕВРОНСКИ МРЕЖИ

3. СТАБИЛИЗАЦИЈА НА ИНВЕРТИРАНО НИШАЛО СО КОРИСТЕЊЕ НА

УПРАВУВАЧ СО ПОВРАТНА ВРСКА СО ЛИНЕАРИЗИРАЧКИ ЗАКОН

Аголот што го зафаќа прачката на инвертира-ното нишало со вертикалата е нестабилен и при мало нарушување прачката паѓа на едната или другата страна од количката. Управување на системот на инвертирано нишало во отворена јамка, не задоволува, бидејќи прачката многу брзо паѓа на едната или другата страна. За таа цел потребно е да се стабилизира нишалото, за што користиме управувач по состојби во повратна врска. Упраувачот е избран така да затворениот систем (нишалото и управувачот) претставува линеаризиран систем [2].

Бидејќи системот е силно нелинеарен и нестабилен, изборот на ваков управувач претставува тешка задача. Воочено е дека линеарните техники на управување, како што се PID, управување со повратна врска по комплетен вектор на состојби не даваат задоволителни резултати за управување на нишалото [3]. Од тие причини е предлчожен управувач во повратна врска за линеаризација на системот. Овој управувач има за цел да ја компензира нелинеарноста на системот, односно системот во затворена јамка да биде линеарен.

Со равенката (13) е даден управувачкиот закон за управувачот за линеаризација на системот со повратна врска.

21 1 2 1 2 1

2

( ) ( )d d

fu h k k c x x c x f

h

(13)

каде 1 2 1 2, , и h h f f се дефинирани како:

1

2

3sin

43

cos4

h gl

hl

21

22

3sin sin 2

8

31 cos

4

f m l g

f M m

(14)

4. РАЗВИТОК НА СИМУЛАЦИСКИ МОДЕЛ ВО MATLAB/Simulink®

Претходно дефинираниот математички модел (12) и управувачот (13) за инвертираното нишало ги реализиравме како симулациски модели во MATLAB/Simulink®. За параметри на системот и управувачот ги употребивме вредностите прикажани во табела 1.

Табела 1. Параметри на системот и управувачот

Назив Ознака Вредност Единица

Маса на количка M 0.5 kg Маса на прачка m 0.2 kg

Должина на прачка l 0.3 m Земјино забрзување g 9.81 m/s2

Параметри на управувачот

k1 25 /

k2 10 /

c1 1 /

c2 2.6 /

Сакана положба за количката и прачката

xd 0 m

Θd 0 rad Симулациониот модел на инвертирано нишало и на управувачот, реализирани во MATLAB/ Simulink® се претставени на сл.3 и сл.4, соодветно.

Сл. 3 – Simulink модел на инвертирано нишало

Сл. 4 – Simulink модел на управувачот за инвертирано нишало

Page 4: СИМУЛАЦИЈА НА ИНВЕРТИРАНО НИШАЛО И ИДЕНТИФИКАЦИЈА НА МОДЕЛОТ СО НЕВРОНСКИ МРЕЖИ

5. ИДЕНТИФИКАЦИЈА НА СИСТЕМОТ СО КОРИСТЕЊЕ НА НЕВРОНСКИ МРЕЖИ

Идентификација на системи со невронски мрежи, во принцип претставува основен пристап на идентификација на „црна кутија“. За иденти-фикација на системите се користи множество на влезно – излезни податоци. Пристапот на идентификација на таканаречена „црна кутија“ не е можно да ни даде информации за однесувањето на под-системите на главниот систем којшто е цел на идентификација [4].

За квалитетна идентификација на системот со невронски мрежи потребно е да располагаме со што поголемо множество на влезно – излезни податоци од системот. Во нашата апликација користевме добиени резултати од експериментот извршен за симулациониот модел од слика 5. Влезно – излезните податоци од симулацијата се користат како влезен и излезен вектор при учењето на невронската мрежа [7].

Сл. 5 – Симулација на математичкиот модел на инвертирано нишало со управувач со линеаризирачка

повратна врска

Бидејќи референтна положба на нишалото е вертикалната положба, односно аголна позиција од 0 степени, како влез во симулацискиот модел се зема само бел шум којшто ги апроксимира нарушувањата кои реално се јавуваат во системот.

Треба да се забележи дека влезот на невронската мрежа е составен од излезите добиени од моделот на слика 5, и референтен влез од тип на бел шум, земајќи впредвид временско доцнење од втор ред. Ова е потребно да се направи бидејќи математичкиот модел на системот е нелинеарен систем од втор ред, поради што има задоцнето влијание на влезот врз излезите од системот.

По повеќе проби за архитектурата на невронската мрежа, со различен број на скриени слоеви и неврони во нивниот состав, најдобри резултати беа добиени при користење на невронска мрежа со 15 неврони во влезниот слој, еден скриен слој со 5 неврони со логаритамско – сигмоидна (log-sigmoid) активациска функција, и 4 неврони во

излезниот слој со линеарна активациска функција, претставена на Слика 6. За обучување на невронската мрежа се користи методата на учење наназад (анг. feed-forward backpropagation network) [6].

Сл. 6 – Архитектура на невронската мрежа

Вака дефинираната невронска мрежа, се обучува, односно учи, на претходно дефинираното влезно излезното множество на податоци. За перформансен критериум при учењето на мрежата се користи средната квадратна грешка (MSE). По 1000 епохи на учење се добива крива на перформансен критериум на невронската мрежата прикажана на сл. 7.

Сл. 7 – Перформансен критериум на мрежата во текот на учењето

Се забележува дека најдобрата, односно најмалата средна квадратна грешка, на невронската мрежа е во илјадитата, последна, епоха од учењето. Тоа значи дека со понатамошно учење таа грешка ќе

Page 5: СИМУЛАЦИЈА НА ИНВЕРТИРАНО НИШАЛО И ИДЕНТИФИКАЦИЈА НА МОДЕЛОТ СО НЕВРОНСКИ МРЕЖИ

се намали, но незначително малку во однос на времето потрошено за продолжување на учењето.

6. СПОРЕДБА НА РЕЗУЛТАТИТЕ ОД НЕВРОНСКАТА МРЕЖА

Добиената невронска мрежа, според претходно опишаната постапка, ја генериравме во Simulink. Така добиениот блок за мрежата се поврзува паралелно со моделот на инвертираното нишало, дизајниран во делот 4 од овој труд (Сл. 8), и се споредуваат добиените резултати од симулациите.

Сл. 8 – Модел во Simulink за споредба на резултатите

од моделот и невронската мрежа За споредба на резултатите, за влез во системот се користи отскочна функција со бел шум но со различни карактеристи од претходно дефинираните, со цел невронската мрежа да се верификува на различно множество на влезни податоци од оние на коишто е обучена. Добиените резултати се дадени на Сл. 9 ~ Сл. 12.

0 100 200 300 400 500 600-0.15

-0.1

-0.05

0

0.05

0.1

0.15

0.2Споредба на резултати за аголна позиција на нишалото

time (t)

The

ta (

rad)

Theta, од модел

Theta, од НМ

Сл. 9 – Споредба на резултати за аголна позиција на

инвертираното нишало

0 100 200 300 400 500 600-0.4

-0.3

-0.2

-0.1

0

0.1

0.2

0.3

0.4Споредба на резултати за аголна брзина на нишалото

time (t)

The

tado

t (r

ad/s

)

Thetadot, од модел

Thetadot, од НМ

Сл. 10 – Споредба на резултати за аголната брзина на

инвертираното нишало

0 100 200 300 400 500 600-6

-5

-4

-3

-2

-1

0

1Споредба на резултати за позиција на количката на нишалото

time (t)

x (m

)

x, од модел

x, од НМ

Сл. 11 – Споредба на резултати за позиција на

количката на инвертираното нишало

0 100 200 300 400 500 600-2.5

-2

-1.5

-1

-0.5

0

0.5

1Споредба на резултати за брзина на количката на нишалото

time (t)

xdot

(m

/s)

xdot, од модел

xdot, од НМ

Сл. 12 – Споредба на резултати за брзина на количката

на инвертираното нишало

Средната квадратна грешка, користена како критериум за оценка на квалитетот на идентифи-кацијата е од редот 10-4, што значи дека добиената невронска мрежа речиси дава идентични резултати како и физичкиот моделот на нишалото.

Page 6: СИМУЛАЦИЈА НА ИНВЕРТИРАНО НИШАЛО И ИДЕНТИФИКАЦИЈА НА МОДЕЛОТ СО НЕВРОНСКИ МРЕЖИ

1 2 3 40

0.2

0.4

0.6

0.8

1

1.2

1.4x 10

-4 Споредба на средни квадратни грешки (MSE) за Theta, Thetadot, x, xdot

MS

ETh

eta

MS

ETh

etad

ot

MS

Ex

MS

Exd

ot

Сл. 13 – Споредба на средни квадратни грешки (MSE) за четирите состојбени велиличини на инвертираното

нишало

На Сл. 13 е претставена споредбата на големините на средните квадратни грешки за секоја состојба на системот на инвертирано нишало. Се забележува дека средната квадратна грешка за позицијата на количката е најголема, што е очекувано бидејќи тоа е всушност управувачката величина и таа трпи најголеми промени (Сл. 11).

7. ЗАКЛУЧОК

Во овој труд беше обработен комплетен нелинеарен математички модел на инвертирано нишало. Пред да се премине на негова идентификација со невронски мрежи, нелинеарниот систем на инвертирано нишало беше линеаризиран и стабилизиран со управувач со линеаризирачка повратна врска. Влезно излезните резултати од така дефинираниот систем беа користени за учење на мрежата.

Невронската мрежа со учење наназад покажа добри карактеристики при користење за идентификација на овој нелинеарен систем, со

многу мала средна квадратна грешка (MSE). Според ова може да заклучиме дека добиената невронска мрежа со голема точност го апроксимира поведението на системот инвертирано нишало, којшто беше предмет на идентификација. Со оваа апликација презен-тиравме една можност и начин за користење на невронските мрежи за интерпретирање на поведението на нелиенеарните системи при различни влезови и нарушувања.

8. ЛИТЕРАТУРА

[1] Драган Станковски, Војчо Краљевски, Миле Станковски, Татјана Колемишевска Гугуловска: Споредба помеѓу фази логичко и ПИД управување на инвертирано нишало, ЕТАИ 2005 – Охрид, Македонија

[2] Ljung, L: Identification – Theory for the user, 1987 Prentice Hall

[3] Marvin Bugeja,” Non-Linear Swing-Up and Stabilizing Control of an Inverted Pendulum System” EUROCON 2003 Ljubljana, Slovenia

[4] Dr Mohandas K.P. and Ms Deepth Y. A., Partial Recurrent Neural Networks for Identificatio & Control of Non-Linear System, IASTED. International conference on control and applications, 1998 Honolulu, USA

[5] A.A. Saifizul, Z. Zainon, N.A Abu Osman, C.A. Azlan and U.F.S Ungku Ibrahim; Inteligent Control for Self-erecting Inverted Pendulum Via Adaptive Neuro-Fuzzy Inference System - American Journal of Applied Sciences 3 (4): 1795-1802, 2006

[6] M.T. Hagan, H.B. Demuth, and M.H. Beale; Neural Network Design – 1996

[7] Michael C. Nechyba and Yangsheng Xu, Neural Network Approach to Control System Identification with Variable Activation Functions, The Robotics Institute - Carnegie Mellon University - Pittsburgh

- - - - - - - - - - - - - - - - - - - - - - - - - -

Summary

SIMULATION OF INVERTED PENDULUM USING NEURAL NETWORKS FOR IDENTIFICATION OF MODEL

Aleksandar Arsovski1, Mile Stankovski1

1 Faculty of Electrical Engineering and Information Technologies – Skopje, Karpoš II bb, 1000 Skopje, Macedonia, [email protected]; [email protected]

Abstract – The paper is presenting a simulation model of operating the inverted pendulum and its identification with the neural network. First, the system of the inverter pendulum is examined through a description of a nonlinear mathematical model and a controller with linear feedback link. Simulation models are developed in MATLAB / Simulink®. Then identification is performed on previously defined model with the use of neural networks. In conclusion, the gathered results from the nonlinear mathematical model and the neural network model are compared and analyzed.

Keywords – inverted pendulum, identifications, neural networks