210
Algorytmy sterowania optymalnego w nieliniowej regulacji predykcyjnej Streszczenie W rozprawie sformulowano ogólny algorytm predykcyjny z przybliŜoną optymalizacją i adaptacją wskaźnika jakości dla systemów opisywanych nieliniowymi równaniami Ŝniczkowymi zwyczajnymi. PowyŜszy algorytm jest rozszerzeniem klasycznych algorytmów predykcyjnych i umoŜliwia realizację zadań sterowania czasooptymalnego i docelowego oraz stabilizacji po osiągnięciu celu. Podano szereg przykladów zastosowań algorytmu w ukladach magnetycznej lewitacji, technologii chemicznej, robotyce i lotach kosmicznych. Rozdzial pierwszy ma charakter wprowadzający. Rozdzial drugi rozprawy zawiera twierdzenia o stabilności i odporności algorytmu udowodnione przy zaloŜeniu, Ŝe rozwiązania problemów optymalizacji są rozwiązaniami suboptymalnymi. Ta wlasność pozwala zredukować naklad obliczeń. Bazując na wynikach rozdzialu drugiego, w rozdzialach trzecim i czwartym zaproponowano nowy, quasi-czasooptymalny algorytm predykcyjny, lączący w sobie cechy sterowania czasooptymalnego i stabilizacji. Rozdzial 5 zawiera szczególowe wyniki dotyczące wyznaczania ograniczeń stanu końcowego oraz wlasności asymptotycznych zaproponowanych algorytmów predykcyjnych. Następnie przeanalizowano moŜliwości zastosowania stosunkowo nowej metody optymalizacji dynamicznej, jaką jest metoda MSE. Metoda MSE, zaadaptowana do potrzeb sterowania predykcyjnego, okazala się skuteczna. Metoda ta charakteryzuje się duŜą szybkością zbieŜności w pobliŜu rozwiązania, co czyni ją uŜyteczną w zastosowaniu do algorytmów predykcyjnych, omawianych w niniejszej pracy. Praca kończy się wnioskami i spisem literatury zawierającym 98 pozycji. Optimization Algorithms in Nonlinear Model Predictive Control Abstract This thesis presents a general Receding Horizon Control (RHC) algorithm with approximate optimization and adaptation of cost function for systems described by nonlinear ordinary differential equations. Presented algorithm is an extension of classical NMPC algorithms and allows a realisation of time-optimal and target control tasks and a stabilisation after reaching target. A series of applications of the algorithm were presented, in systems such as: magnetic levitation, chemical technology, robotics and space-flight. The first chapter has an introductory character. The second chapter contains theorems regarding stability and robustness of the algorithm on the assumption, that the optimisation problem solutions are sub-optimal. This property allows the reduction of computational effort. On the base of results of the second chapter in the third and fourth ones a new quasi-time-optimal receding horizon algorithm was introduced, that has properties of both time-optimal control and stabilisation. Chapter 5 contains specific results regarding terminal state constraints determination and asymptotic properties of proposed RHC algorithms. Subsequently, the possibilities of application of relatively new dynamical optimisation method which is the MSE method were analysed. This method, adapted for the needs of model predictive control has given successful results. The method is useful for RHC algorithms in this thesis, because of its strong convergence near the solution. Thesis ends with conclusions and a references list containing 98 positions.

Algorytmy sterowania optymalnego w nieliniowej regulacji ...home.agh.edu.pl/~pba/pdfdoc/ASO_W_NMPC.pdf · Algorytmy sterowania optymalnego w nieliniowej regulacji predykcyjnej Streszczenie

  • Upload
    vonhu

  • View
    220

  • Download
    0

Embed Size (px)

Citation preview

Algorytmy sterowania optymalnego w nieliniowej regulacji predykcyjnej

Streszczenie

W rozprawie sformuowano oglny algorytm predykcyjny z przyblion optymalizacj i adaptacj wskanika jakoci dla systemw opisywanych nieliniowymi rwnaniami rniczkowymi zwyczajnymi. Powyszy algorytm jest rozszerzeniem klasycznych algorytmw predykcyjnych i umoliwia realizacj zada sterowania czasooptymalnego i docelowego oraz stabilizacji po osigniciu celu. Podano szereg przykadw zastosowa algorytmu w ukadach magnetycznej lewitacji, technologii chemicznej, robotyce i lotach kosmicznych. Rozdzia pierwszy ma charakter wprowadzajcy. Rozdzia drugi rozprawy zawiera twierdzenia o stabilnoci i odpornoci algorytmu udowodnione przy zaoeniu, e rozwizania problemw optymalizacji s rozwizaniami suboptymalnymi. Ta wasno pozwala zredukowa nakad oblicze. Bazujc na wynikach rozdziau drugiego, w rozdziaach trzecim i czwartym zaproponowano nowy, quasi-czasooptymalny algorytm predykcyjny, czcy w sobie cechy sterowania czasooptymalnego i stabilizacji. Rozdzia 5 zawiera szczegowe wyniki dotyczce wyznaczania ogranicze stanu kocowego oraz wasnoci asymptotycznych zaproponowanych algorytmw predykcyjnych. Nastpnie przeanalizowano moliwoci zastosowania stosunkowo nowej metody optymalizacji dynamicznej, jak jest metoda MSE. Metoda MSE, zaadaptowana do potrzeb sterowania predykcyjnego, okazaa si skuteczna. Metoda ta charakteryzuje si du szybkoci zbienoci w pobliu rozwizania, co czyni j uyteczn w zastosowaniu do algorytmw predykcyjnych, omawianych w niniejszej pracy. Praca koczy si wnioskami i spisem literatury zawierajcym 98 pozycji.

Optimization Algorithms in Nonlinear Model Predicti ve Control

Abstract

This thesis presents a general Receding Horizon Control (RHC) algorithm with approximate optimization and adaptation of cost function for systems described by nonlinear ordinary differential equations. Presented algorithm is an extension of classical NMPC algorithms and allows a realisation of time-optimal and target control tasks and a stabilisation after reaching target. A series of applications of the algorithm were presented, in systems such as: magnetic levitation, chemical technology, robotics and space-flight. The first chapter has an introductory character. The second chapter contains theorems regarding stability and robustness of the algorithm on the assumption, that the optimisation problem solutions are sub-optimal. This property allows the reduction of computational effort. On the base of results of the second chapter in the third and fourth ones a new quasi-time-optimal receding horizon algorithm was introduced, that has properties of both time-optimal control and stabilisation. Chapter 5 contains specific results regarding terminal state constraints determination and asymptotic properties of proposed RHC algorithms. Subsequently, the possibilities of application of relatively new dynamical optimisation method which is the MSE method were analysed. This method, adapted for the needs of model predictive control has given successful results. The method is useful for RHC algorithms in this thesis, because of its strong convergence near the solution. Thesis ends with conclusions and a references list containing 98 positions.

AKADEMIA GRNICZO-HUTNICZA IM. STANISAWA STASZICA

WYDZIA ELEKTROTECHNIKI, AUTOMATYKI, INFORMATYKI I ELEKTRONIKI KATEDRA AUTOMATYKI

ROZPRAWA DOKTORSKA

ALGORYTMY STEROWANIA OPTYMALNEGO W NIELINIOWEJ REGULACJI PREDYKCYJNEJ

MGR IN. PIOTR BANIA

Promotor: dr hab. in. Adam Korytowski

Krakw, 2008

Podzikowania

Dzikuj panu prof. Adamowi Korytowskiemu za udzielenie mi wsparcia oraz za nieustajce

prby wyzwolenia mnie z puapki nawykowego, konwencjonalnego mylenia. Dzikuj te

mojej onie za cierpliwo i podtrzymywanie mnie na duchu w trudnych momentach.

Piotr Bania

Spis treci Waniejsze oznaczenia i skrty ............................................................................................................... s. 1 Wstp oraz tezy pracy ............................................................................................................................... 2 Rozdzia 1. Rozwaania wstpne ............................................................................................................... 8

1.1 Przykady wprowadzajce .............................................................................................................. 8 Rozdzia 2. Oglny algorytm predykcyjny z przyblion optymalizacj .............................................. 12 2.1. Podstawowe definicje i twierdzenia .............................................................................................. 12 2.2. Algorytm predykcyjny ................................................................................................................... 14 2.3. Stabilno algorytmu predykcyjnego ............................................................................................ 20 2.4. Odporno algorytmu predykcyjnego na zakcenia i bdy modelowania .................................. 24 2.5. Rola algorytmu optymalizacji w sterowaniu predykcyjnym i planowaniu trajektorii .................. 28 Rozdzia 3. Quasi-czasooptymalny algorytm predykcyjny ze zmiennym horyzontem i adaptacj wskanika jakoci (Quasi Time Optimal Receding Horizon Control, QTO-RHC) ............................... 29

3.1. Algorytm QTO-RHC ..................................................................................................................... 30 3.2. Stabilno algorytmu QTO-RHC ................................................................................................... 31 3.3. Odporno algorytmu QTO-RHC .................................................................................................. 36 3.4. Przykady sterowania systemami nieliniowymi ............................................................................ 38

Rozdzia 4. Quasi-czasooptymalny algorytm predykcyjny dla zada, w ktrych funkcja L zaley tylko od sterowania .................................................................................................................................... 89

4.1. Algorytm QTO-RHC dla zada minimalizacji E-funkcjonaw ................................................... 89 4.2. Stabilno algorytmu QTO-RHC dla zada minimalizacji E-funkcjonaw ................................. 90 4.3. Odporno algorytmu QTO-RHC dla zada minimalizacji E-funkcjonaw ................................ 95 4.4. Przykady sterowania systemami nieliniowymi ............................................................................. 97

Rozdzia 5. Wyznaczanie ogranicze stanu kocowego oraz wasnoci asymptotyczne algorytmu QTO-RHC ................................................................................................................................................... 114

5.1. Ograniczenia stanu kocowego w algorytmie 3.1.1 ....................................................................... 114 5.2. Ograniczenia stanu kocowego w algorytmie 4.1.1 ....................................................................... 120 5.3. Wasnoci asymptotyczne algorytmu QTO-RHC .......................................................................... 121

Rozdzia 6. Algorytm optymalizacji .......................................................................................................... 126 6.1. Wprowadzenie ................................................................................................................................ 126 6.2. Zadanie sterowania optymalnego .................................................................................................. 128 6.3. Warunki optymalnoci zasady maksimum ..................................................................................... 130 6.4. Parametryzacja sterowa oraz pochodne wskanika jakoci wzgldem parametrw sterowania . 132 6.5. Procedury generacji i redukcji ........................................................................................................ 139 6.6. Metody cakowania rwna stanu i rwna sprzonych .............................................................. 148 6.7. Oglny algorytm metody MSE ....................................................... .............................................. 150 6.8. Przykady optymalizacji sterowania ............................................................................................... 154 6.9. Uwagi o implementacji algorytmu MSE ........................................................................................ 159

Rozdzia 7. Porwnanie algorytmw z czasem dyskretnym z algorytmem QTO-RHC ....................... 160 7.1. Systemy cige i dyskretne w czasie .............................................................................................. 160 7.2. Sterowanie predykcyjne systemami dyskretnymi w czasie ............................................................ 161 7.3. Uwagi o dyskretyzacji rwna rniczkowych .............................................................................. 162 7.4. Problemy zwizane z konstrukcj dyskretnej wersji algorytmu QTO-RHC .................................. 164 7.5. Stabilno systemu cigego, sterowanego za pomoc algorytmu predykcyjnego z czasem dyskretnym ............................................................................................................................................ 165 7.6. Zalety i wady algorytmw predykcyjnych z czasem cigym i z czasem dyskretnym .................. 166

Podsumowanie ............................................................................................................................................. 168 Dodatek A. Twierdzenia pomocnicze .......................................................................................................... 170 Dodatek B. Zasada maksimum Pontriagina ................................................................................................ 176 Dodatek C. Efektywno generacji jednowzowych ................................................................................. 193 Literatura ................................................................................................................................................... 203

1

Waniejsze skrty i oznaczenia

ZSO Zadanie Sterowania Optymalnego RHC Receding Horizon Control MPC Model Predictive Control NMPC Nonlinear Model Predictive Control QTO-RHC Quasi Time Optimal Receding Horizon Control SGAS saba globalna asymptotyczna stabilno algorytmu predykcyjnego GAS globalna asymptotyczna stabilno algorytmu predykcyjnego w sensie Lapunowa I macierz jednostkowa diag(a) macierz diagonalna, ktrej elementy na przektnej gwnej s okrelone wektorem a

)...,,,(col 21 naaa wektor kolumnowy

0>H macierz dodatnio okrelona TH macierz transponowana do macierzy H

xxx T=|| norma euklidesowa w nR Hyxyx

HT=, iloczyn skalarny w przestrzeni nR z macierz wag 0>= THH

Hxxx HT=|| norma wektora w nR z macierz wag 0>= THH ; Ixx |||| =

( )Hmin , ( )Hmax najmniejsza i najwiksza warto wasna macierzy symetrycznej H rzdQ rzd macierzy Q N zbir liczb naturalnych ...},2,1,0{ R przestrze liczb rzeczywistych

}0:{0 =+ tRtR zbir liczb rzeczywistych nieujemnych

)],,0([ mRTPC przestrze funkcji przedziaami cigych o wartociach w mR )],,0([ np RTL przestrze funkcji cakowalnych z p-t potg

p

Tp

p dttuu =0

|)(||||| norma w przestrzeni pL , ,...2,1=p

)],,0([ nRTL przestrze funkcji mierzalnych istotnie ograniczonych z norm |)(|supess||||

],0[tuu

Tt =

)],,0([,1 nRTW przestrze funkcji absolutnie cigych z pierwsz pochodn istotnie ograniczon

T

=

nx x

q

x

q

x

qzyxq ,....,,),,(

21

gradient funkcji q wzgldem zmiennej x

=

n

m

n

m

x

x

xf

x

xf

x

xf

x

xf

xf)()(

)()(

)(1

11

1

L

MOM

L

transponowana macierz Jacobiego funkcji mn RRf :

++= TTxdttutxuQT

. (1.2)

Zgodnie z zasad maksimum Pontriagina (zob. dodatek B), sterowanie optymalne maksymalizuje hamiltonian

)(5,0)( 22 uxxuH += ,

gdzie zmienna sprzona spenia rwnanie sprzone

)()()( txtt +=& , )()( TxT = .

Maksimum hamiltonianu jest osigane, gdy

0== uHu .

Korzystajc z warunku maksimum hamiltonianu otrzymuje si rwnania kanoniczne

)()()( ttxtx +=& ,

)()()( txtt +=& .

Rozwizanie ukadu rwna kanonicznych ma posta

)0()()0()()( 1211 txttx += ,

)0()()0()()( 2221 txtt += ,

gdzie

)2(sh2

1)2(ch)(11 ttt = , )2(sh

2

1)()( 2112 ttt == , )2(sh

2

1)2(ch)(22 ttt += .

Uwzgldnienie warunkw brzegowych na stan i zmienn sprzon pozwala wyznaczy sterowanie jako funkcj czasu i stanu pocztkowego

1. Rozwaania wstpne

9

0)()()( xtkttu == , (1.3)

gdzie

)()(

)()()()()(

2212

21112221 TT

TTtttk

++

= . (1.4)

Rozwamy teraz nastpujcy algorytm sterowania.

Algorytm A 0. Dane: 0x , system (1.1), wskanik jakoci (1.2), liczba 0> , i = 0. 1. Oblicz sterowanie ixitktu )()( = i zastosuj je w systemie (1.1), w przedziale czasu

))1(,[ + iit . 2. Podstaw 1: += ii , )(: ixxi = i id do 1.

Algorytm A stanowi prosty przykad sterowania predykcyjnego. Zauwamy, e algorytm ten realizuje sprzenie zwrotne od stanu. W punkcie pierwszym wyznaczamy rozwizanie zadania sterowania optymalnego (ZSO) w zalenoci od aktualnego stanu obiektu. Rozwizanie ZSO jest w tym przypadku trywialne i sprowadza si do jednokrotnego wyznaczenia funkcji )(tk . Nastpnie stosujemy pocztkowy fragment sterowania optymalnego w przedziale czasu ))1(,[ + iit . W punkcie 2 wyznaczamy stan obiektu w chwili )1( += it i ponownie wracamy do 1. Wynik dziaania powyszej procedury pokazano na rys.1.1a i b. Przez xzamk oznaczono trajektori systemu zamknitego, bdc wynikiem dziaania algorytmu A, ktr to trajektori porwnano z trajektori xotw, uzyskan po zastosowaniu sterowania (1.3) w przedziale czasu ],0[ T . Sterowania w ukadzie zamknitym i otwartym oznaczono odpowiednio przez uzamk, uotw. Na rys. 1.1c pokazano trajektori i sterowanie w przypadku, gdy horyzont T ulega z kadym krokiem dziaania algorytmu skrceniu o liczb . Rys. 1.1d przedstawia kolejne rozwizania ZSO uzyskane w algorytmie A.

Analiza powyszego przykadu pozwala stwierdzi, e:

1. Sterowanie i trajektoria skadaj si z kawakw sterowa i trajektorii, bdcych rozwizaniami kolejnych ZSO. Sterowanie w systemie zamknitym jest na og niecige, nawet wtedy, gdy rozwizanie kadego ZSO jest cige.

2. Analiza przypadkw z rys. 1.1b i d pokazuje, e rozwizanie uzyskane po zamkniciu sprzenia zwrotnego, moe by istotnie rne od rozwizania problemu sterowania uzyskanego w chwili pocztkowej.

3. Wyduenie horyzontu sterowania powoduje, e trajektoria systemu zamknitego zblia si do optymalnej trajektorii uzyskanej w chwili pocztkowej (rys. 1.1a).

4. Skracanie horyzontu o liczb (rys. 1.1c) powoduje, e trajektoria systemu zamknitego jest rwna optymalnej trajektorii uzyskanej w chwili pocztkowej (przy braku zakce).

5. Rozwizania kolejnych ZSO mog si od siebie znacznie rni (rys. 1.1d). Jest to efekt niekorzystny, gdy powoduje odstpstwa od trajektorii optymalnej dla zadania z nieskoczonym (dugim) horyzontem oraz utrudnia rozwizywanie ZSO w kolejnych krokach. Z punktu widzenia optymalizacji dobrze byoby wykorzysta poprzednio uzyskane rozwizanie jako punkt startowy w kolejnym ZSO. Rnice pomidzy rozwizaniami kolejnych ZSO staj si pomijalnie mae przy odpowiednim wyborze horyzontu T i liczby .

1. Rozwaania wstpne

10

0 2 4 6 8 100

0.5

1

t

x

0 2 4 6 8 10

-0.4

-0.2

0

t

u

uotw

xzamk

uzamk

xotw

a. 1,0,10,10 === T przesuwany

horyzont.

0 0.5 1 1.50

0.5

1

t

x

0 0.5 1 1.5-1

-0.5

0

t

u

uzamk

xotw

xzamk

uotw

b. 1,0,10,1 === T przesuwany

horyzont.

0 0.2 0.4 0.6 0.8 10

0.5

1

t

x

0 0.2 0.4 0.6 0.8 1-0.8

-0.6

-0.4

t

u

xzamk = xotw

uzamk = uotw

c. 1,0,10,1 === T skracany horyzont

0 0.5 1 1.5 20

0.5

1

t

x

0 0.5 1 1.5 2

-0.6

-0.4

-0.2

0

t

u

d. 1,0,10,1 === T kolejne rozwizania

ZSO, przesuwany horyzont

Rys. 1.1. Trajektorie i sterowania.

Algorytm predykcyjny na og nie zapewnia stabilnoci systemu zamknitego (rozumianej tutaj roboczo jako zmierzanie trajektorii do zera). Aby si o tym przekona, rozwamy nastpujcy

Przykad 1.2 (utrata stabilnoci systemu z regulatorem predykcyjnym).

Wemy prosty system liniowy (niestabilny)

0,)0(,)(),(),()()( 0 =+= txxRtutxtutxtx& . (1.5)

Sterowanie zapewniajce minimum wskanika jakoci (1.2) jest okrelone wzorami (1.3) i (1.4), przy czym

)2(sh2

1)2(ch)(11 ttt += , )2(sh

2

1)()( 2112 ttt == , )2(sh

2

1)2(ch)(22 ttt = .

(1.6) Do sterowania systemem (1.5) zastosowano algorytm A z przykadu 1.1. Na rys. 1.2a przedstawiono trajektori i sterowanie dla horyzontu T = 10. Zmniejszenie horyzontu do T = 0,6 (rys. 1.2b) nie powoduje jeszcze utraty stabilnoci, ale znacznie wydua czas osignicia stanu ustalonego. Zwikszenie wagi w funkcji stanu kocowego do = 10 (rys. 1.2c) skraca czas osignicia stanu ustalonego do okoo 2. Krtki horyzont T = 0,5 i maa warto = 0,1 prowadz do utraty stabilnoci (rys. 1.2d).

1. Rozwaania wstpne

11

0 1 2 3 4 5 6 70

0.5

1x

t

0 1 2 3 4 5 6 7-3

-2

-1

0

u

t

xzamk

uzamk

a. 05,0,1,0,10 === T

0 1 2 3 40.7

0.8

0.9

1

t

x

0 1 2 3 4-1.5

-1

-0.5

t

u

xzamk

uzamk

b. 05,0,1,0,6,0 === T

0 0.5 1 1.5 2 2.5 30

0.5

1

t

x

0 0.5 1 1.5 2 2.5 3-3

-2

-1

0

t

u uzamk

xzamk

c. 05,0,10,5,0 === T

0 1 2 3 40.5

1

1.5

t

x

0 1 2 3 4-1.5

-1

-0.5

t

u

xzamk

uzamk

d. 05,0,1,0,5,0 === T

Rys. 1.2. Trajektorie i sterowania w systemie zamknitym przykad utraty stabilnoci przy nieodpowiednim wyborze wskanika jakoci (rys. d).

Mamy nastpujce dwa wnioski dotyczce analizowanego przykadu.

1. Zbyt krtki horyzont moe spowodowa utrat stabilnoci.

2. Wprowadzenie funkcji kary za niespenienie warunku kocowego pozwala ustabilizowa system nawet przy krtkich horyzontach.

W dalszych rozdziaach pracy ucilimy i rozwiniemy przedstawione powyej spostrzeenia. Na szczegln uwag zasuguje fakt, e skracanie horyzontu o liczb w kadym kroku algorytmu powoduje, e trajektoria w systemie zamknitym jest dokadnie rwna optymalnej trajektorii planowanej w chwili pocztkowej.

2.Oglny algorytm predykcyjny z przyblion optymalizacj

12

Rozdzia 2. Oglny algorytm predykcyjny z przybli on optymalizacj

W tym rozdziale formuujemy ogln posta algorytmu predykcyjnego. Algorytm dopuszcza moliwo ewolucji wskanika jakoci w trakcie procesu sterowania, co wydaje si istotn z punktu widzenia zastosowa wasnoci. Nastpnie podajemy warunki dostateczne stabilnoci ukadu regulacji z regulatorem predykcyjnym. Warunki te wymagaj jedynie znajdowania rozwiza suboptymalnych odpowiedniego problemu optymalizacji, co pozwala na znaczn redukcj nakadu oblicze. W dalszej czci rozdziau zajmujemy si analiz odpornoci ukadu sterowania na zakcenia i bdy modelowania. Nastpnie podajemy warunki, przy ktrych trajektoria stanu, generowana przez algorytm w obecnoci zakce, osiga w skoczonym czasie pewne otoczenie celu i pozostaje w tym otoczeniu. Promie otoczenia maleje do zera przy zmniejszaniu amplitudy zakce.

2.1. Podstawowe definicje i twierdzenia

Model obiektu

Zakadamy, e dysponujemy modelem obiektu w postaci ukadu rwna rniczkowych zwyczajnych

)),(),(()( 0ptutxftx =& , 0)0( xx = , + 0Rt . (2.1)

Funkcja nlmn RRRRf : jest klasy 1C wzgldem wszystkich argumentw oraz 0),0,0( 0 =pf . Funkcja ta jest zalena od l parametrw danych wektorem

lRp 0 . Ponadto f spenia globalnie (dla wszystkich nR21, ,

mRv ) warunek Lipschitza

|||),,(),,(| 210201 Lpvfpvf , (2.1a)

ze sta 0 >L , niezalen od 021 ,,, pv . Zakadamy te, e istnieje ciga funkcja RRL nu : , taka e dla wszystkich

nR , mRvv 21, zachodz warunki

||)(|),,(),,(| 210201 vvLpvfpvf u , (2.1b)

0)( >uL . (2.1c)

Ograniczenia wartoci sterowania maj posta

Utu )( , }0,0,:{ maxminmaxmin >

2.Oglny algorytm predykcyjny z przyblion optymalizacj

13

Sterowanie u spenia takie same zaoenia jak sterowanie u . Funkcje pwa ,, reprezentuj zakcenia w generacji sterowa, zakcenia zewntrzne oraz zmiany parametrw obiektu. Poniewa stan systemu nie jest na og bezporednio dostpny, konieczne jest zastosowanie estymatora stanu. Zakadamy, e dysponujemy odpowiednio dokadnym estymatorem stanu (moe to by np. estymator typu high-gain, Bornard 1991, Busawon 2000, Gauthier 1994, Findeisen 2003a,b lub estymator z przesuwanym oknem, Michalska i Mayne 1995, Rao i Rawlings 1998). Niech )( tx oznacza estymat stanu obiektu oraz niech

)()()( txtxte = (2.4)

bdzie bdem estymacji stanu. Funkcje a, w, p, e bdziemy wsplnie nazywa zakceniami. Zakadamy, e zakcenia s przedziaami cige na +0R oraz ograniczone, tzn.

aa

2.Oglny algorytm predykcyjny z przyblion optymalizacj

14

)exp(|)(|))(0(|)(||)(|

/1

/1 TLdssuLqLTtxsx

pTt

t

pqu

++

+ ,

gdzie 1, >qp , 111 =+qp

,

(ii) ponadto jeeli + )( Ttx , to zachodzi oszacowanie

)exp(|)(| 1 TLMsx ,

gdzie

||sup)0(||sup 11 vLLMUv

u

+=

.

Dowd twierdzenia znajduje si w dodatku A.

Lemat 2.1.1. Niech ML bdzie zbiorem wszystkich funkcji nRTx ],0[: speniajcych

warunki:

W1) 0|)(| Mtx ],0[ Tt , gdzie 00 >M jest ustalon liczb,

W2) |||)()(| 2121 ttMtxtx , ],0[, 21 Ttt , gdzie 0>M jest ustalon liczb.

Niech bdzie dana funkcja h K oraz funkcjona + 0: RQ ML ,

=T

dttxhxQ0

)|)(|()( .

Niech })(:{, qxQx MqM = LL ,

bdzie zbiorem poziomicowym funkcjonau Q, przy czym + 0Rq .

Wwczas:

T1) istnieje funkcja K, taka e dla dowolnego + 0Rq oraz dla wszystkich qMx ,L , speniony jest warunek

)(|)(|sup],0[

qtxTt

,

T2) jeeli dodatkowo =

)(lim

h , to warunek W1 moe by pominity i zachodzi T1.

Dowd lematu znajduje si w dodatku A. 2.2. Algorytm predykcyjny

Niech nRx ),0[:~ bdzie funkcj przedziaami cig, ze skoczon liczb punktw niecigoci pierwszego rodzaju w kadym przedziale ograniczonym. Niech bd dane odwzorowania ++ 00: RRRRNS

nn , + 00 : RRSn oraz niech cig k spenia rwnanie

))(),(~,,(1 kkkk txtxkS =+ , ))0((00 xS= . (2.6)

2.Oglny algorytm predykcyjny z przyblion optymalizacj

15

Niech nkkkk RTttx + ],[: dla 0kT bdzie rozwizaniem rwnania (2.1), z warunkiem

pocztkowym )(~ ktx i sterowaniem dopuszczalnym ku . Wskanik jakoci w k-tym kroku

czasowym jest dany rwnoci

+

+++=kk

k

Tt

t

kkkkk

kkkkkk TtxqdssusxLTtxTuJ ))(())(),(()),(~;,( , (2.7)

przy czym funkcja L jest rniczkowalna w sposb cigy wzgldem obu argumentw oraz

0),( vL , 0)0,0( =L dla wszystkich nR , mRv . (2.8)

Zakadamy, e funkcja q jest rniczkowalna w sposb cigy oraz

0)( xqx , dla 0x . (2.9)

Ponadto zakadamy, e

0)0( =q (2.10)

oraz e istnieje funkcja w K, speniajca warunek =

)(lim

w i taka, e

)||()( xwxq . (2.11)

Z powyszych zaoe wynika, e funkcja q ma dokadnie jedno minimum w punkcie 0=x . Zaoenie (2.9) pozwala wykluczy pojawiajce si w zadaniu optymalizacji dodatkowe minima lokalne. Zaoenia (2.10), (2.11) s zwykle spenione w praktycznych problemach. Wskanik jakoci zaley w sposb cigy od kkk

k txTu ),(~,, , przy czym cigo wzgldem ku rozumiemy w sensie jednej z norm = ,...,2,1,|||| pp . Konstrukcja wskanika jakoci

(2.7) umoliwia, poprzez odpowiedni dobr wspczynnika k , zmian celu sterowania w czasie trwania procesu. W opinii autora istnieje szereg problemw sterowania, w ktrych cel sterowania powinien zmienia si w zalenoci od czasu i stanu procesu. Konkretne przykady sterowania ze zmieniajcym si kryterium jakoci, zostan przedstawione w rozdziaach trzecim i czwartym.

Sformuujemy teraz zadanie sterowania optymalnego. Zakadamy, e zbir jest ustalony.

Problem ))(~,,( kkk txtP : Znajd sterowanie dopuszczalne ku oraz horyzont kT ,

minimalizujce wskanik jakoci (2.7) na trajektoriach systemu (2.1), przy ograniczeniach

i) + )( kkk Ttx ,

ii) minTTk .

Rozwizanie problemu ))(~,,( kkk txtP oraz odpowiadajc mu trajektori oznaczamy symbolami ))(~,( k

k txsu , kT , ));(~,( kk

k utxsx . Zakadamy, e rozwizanie powyszego

problemu istnieje dla dowolnego warunku pocztkowego nk Rtx )(~ . Ograniczenie horyzontu minTTk podyktowane jest wzgldami praktycznymi. Po pierwsze, sterowanie musi by wyznaczone co najmniej w przedziale czasu ],[ +kk tt . Po drugie, w stanach awaryjnych, gdy nie jest moliwa estymacja stanu bd wyliczenie nowego sterowania, chcemy na og dysponowa sterowaniem na horyzoncie duszym ni . Jeeli 0=k i 0min =T oraz funkcja q ronie dostatecznie szybko, to rozwizanie zadania sterowania

2.Oglny algorytm predykcyjny z przyblion optymalizacj

16

optymalnego jest zblione do rozwizania zadania czasooptymalnego, a norma stanu kocowego jest bliska zeru. Ograniczenie + )( kk

k Ttx moe, ale nie musi wystpowa.

Ograniczenie to bdziemy wykorzystywa przy dowodzeniu stabilnoci systemu zamknitego (por. np. Fontes 2000, Findeisen 2003a).

Definicja 2.2.1. Niech para ),( kk Tu bdzie rozwizaniem ))(~,,( kkk txtP . Wyraenie

min)),(~;,()),(~( TtxTuJtxV kkk

kkk = ,

bdziemy nazywa funkcj wartoci (value function) dla problemu ))(~,,( kkk txtP .

W pewnych przypadkach bdziemy pomija drugi argument funkcji V.

Wniosek 2.2.1. Funkcja wartoci jest ciga, 0)0( =V oraz 0)( V , nR .

Algorytm optymalizacji procedury , oraz sterowania -suboptymalne

Do rozwizywania problemw ))(~,,( kkk txtP bdziemy na og uywa procedur numerycznych. Wystpuj tu trzy podstawowe trudnoci:

Problemy ))(~,,( kkk txtP s czsto niewypuke i charakteryzuj si wystpowaniem wielu minimw lokalnych;

Przestrze decyzyjna jest nieskoczenie wymiarowa (poszukujemy sterowania optymalnego w nieskoczenie wymiarowej przestrzeni funkcyjnej);

Sterowanie musi by wyznaczane on-line w kadym kroku algorytmu, w czasie krtszym ni .

Problem wielu minimw lokalnych mona czciowo rozwiza dopuszczajc rozwizania przyblione, speniajce warunek + )( kk

k Ttx . Drug trudno omija si zwykle poprzez

wybr odpowiednio bogatej, skoczenie wymiarowej parametryzacji sterowa, w taki sposb, aby procedura numeryczna bya zbiena do zadowalajcego przyblienia rozwizania optymalnego. Problemu ograniczonego czasu oblicze nie da si rozwiza w peni. Jednake, jak zobaczymy poniej, mona tak skonstruowa algorytm predykcyjny, aby procedura numeryczna moga zakoczy obliczenia po znalezieniu rozwizania suboptymalnego, speniajcego odpowiednie kryteria. Poniewa zbir rozwiza suboptymalnych ma zwykle niezerow miar, to znajdowanie takich rozwiza jest znacznie atwiejsze ni znajdowanie rozwiza optymalnych. Na obecnym etapie rozwaa bdziemy zakada, e istnieje pewna iteracyjna procedura

)],,([: ,1000n

kkkadn RTttWRURRR + +++ , ))(~,,(),,( kkk

kk

k txtxTu =

zdolna do znalezienia odpowiednio dokadnego przyblionego rozwizania problemu ))(~,,( kkk txtP , takiego e + )( kk

k Ttx . Fakt, e rozwizanie przyblione znajdujemy za

pomoc procedury bdziemy zapisywa wzorem

))(~,,(),,( kkkk

kk txtxTu = . (2.12)

Procedur, ktra znajduje rozwizanie problemu ))(~,,( kkk txtP oznaczamy i piszemy

))(~,,(),,( kkkk

kk txtxTu = . (2.12a)

2.Oglny algorytm predykcyjny z przyblion optymalizacj

17

Definicja 2.2.2. Procedura jest -suboptymalna, jeeli istnieje funkcja K, taka e dla dowolnych nk Rtx )(~ , ]1,0[k , ...,2,1,0=k i dowolnej liczby 0> , trjka

),,( kkk xTu , wygenerowana przez t procedur, spenia nastpujce warunki:

i) |))(~(|)),(~;,( min kkkkk txTtxTuJ ,

ii) + )( kkk Ttx ,

iii) minTTk , iv) yh dla 0y . Wszystkie algorytmy predykcyjne, jakie bdziemy analizowa

2.Oglny algorytm predykcyjny z przyblion optymalizacj

18

w dalszych rozdziaach, bd miay posta analogiczn do przedstawionego poniej, oglnego schematu. Analiza warunkw stabilnoci i odpornoci tego schematu pozwoli okreli wymagania wobec procedury oraz maksymalnej dopuszczalnej amplitudy zakce.

Schemat 2.2.1 (oglny algorytm predykcyjny z przyblion optymalizacj).

Dane: , minT , model obiektu (2.1), estymata warunku pocztkowego )0(x , funkcja h, liczba ]1,0( .

Inicjalizacja : Oblicz ))0((00 xS= . Za pomoc procedury lub oblicz sterowanie pocztkowe ))0(,,0(),,( 0

00

0 xxTu = lub ))0(,,0(),,( 00

00 xxTu = .

1. Postaw 0:=k , ktk =: , )0(:)(~ xtx k = . 2. W przedziale czasu ),[ +kk tt stosuj do obiektu sterowanie

ku oraz jednoczenie

wykonuj czynnoci 37. 3. Wyznacz estymat stanu )( ktx .

4. Oblicz min)),(~,,( TtxTuJr kkk

kk = .

5. Oblicz ))(),(~,,(1 kkkk txtxkS =+ oraz wyznacz predykcj krtkoterminow )(~ 1+ktx . 6. Za pomoc procedury sprbuj wyznaczy rozwizanie -suboptymalne

))(~,,(),,( 1111

11

++++

++ = kkk

kk

k txtxTu , speniajce warunek ))(~(1 kkk txhrr + . Jeeli takiego rozwizania nie da si znale, to wyznacz moliwie najlepsze przyblienie rozwizania optymalnego.

7. Wykonaj obliczenia pomocnicze (aktualizacje wspczynnikw, testy stabilnoci itp.). 8. Podstaw 1: += kk , ktk =: . 9. Id do 2.

Sterowanie w systemie zamknitym otrzymujemy poprzez konkatenacj sterowa ku zastosowanych do obiektu w przedziaach czasu ),[ 1+kk tt , ,...2,1,0=k . Sterowanie to oznaczamy przez u . Trajektoria obiektu x jest funkcj cig, natomiast sterowanie u jest funkcj przedziaami cig. Sterowanie 0u moe by w zasadzie dowolnym sterowaniem -suboptymalnym, jednake wskazane jest, aby byo ono dostatecznie dokadnym przyblionym rozwizaniem problemu ))0(,,0( 0 xP . W zwizku z tym, w praktycznych realizacjach algorytmu, wyposaa si go w bibliotek sterowa pocztkowych, wyliczonych off-line dla rnych warunkw pocztkowych. Przy starcie algorytmu wybiera si z biblioteki rozwizanie wyliczone dla warunku pocztkowego najbliszego aktualnej estymacie stanu

)0(x . Czynnoci opisane w kroku 2 oraz w krokach 3 7 wykonuje si rwnolegle w czasie,

tzn. ukady wykonawcze zajmuj si realizacj sterowania ku i jednoczenie realizowane s kroki 3 7. Krok 7 algorytmu jest opcjonalny i nie musi wystpowa. Na rys. 2.1 pokazano, w formie graficznej, przebieg oblicze w schemacie 2.2.1, a na rys. 2.2 zobrazowano zalenoci czasowe. Przykad 1.2 poucza, e podany powyej algorytm moe generowa trajektorie x , takie e =

|)(|lim tx

t, nawet przy braku zakce. Dlatego w dalszym cigu

zajmiemy si badaniem stabilnoci i odpornoci schematu 2.2.1.

2.Oglny algorytm predykcyjny z przyblion optymalizacj

19

)(tx

)(ty

))(~,,(),,( 1111

11

++++

++ = kkk

kk

k txtxTu

1+ku )(tuk

)(ta)(tp)(tw

ku

)(~ 1+ktx )( ktx

1, +kk uu

Zakcenia

Algorytmoptymalizacji

Pami Obiekt

Predykcja

)(tx

)(ty

))(,,(),,( 1111

11

++++

++ = kkk

kk

k txtxTu

1+ku )(tuk

)(ta)(tp)(tw

ku

)( 1+ktx )( ktx

1, +kk uu

Rys. 2.1. Graficzna reprezentacja schematu 2.2.1

kt

kt

1+kt

1+kt

2+kt

2+kt

)( ktx

)( ktx

)( ktx

)(~ ktxx~ x~

)( 1+

ktx )( 2+

ktx

kx 1+kx

)( 1+ktx

)(~ 1+ktx

)(~ 1+ktx

)(~ 2+ktx

1ku ku1+ku

Optymalizacja,obliczaniesterowania uk+1

t

t

Estymacjastanu

Predykcja

kt

kt

1+kt

1+kt

2+kt

2+kt

)( ktx

)( ktx

)( ktx

)( ktxx x

)( 1+

ktx )( 2+

ktx

kx 1+kx

)( 1+ktx

)( 1+ktx

)( 1+ktx

)( 2+ktx

1ku ku1+ku

Rys. 2.2. Zalenoci czasowe w schemacie 2.2.1.

2.Oglny algorytm predykcyjny z przyblion optymalizacj

20

2.3. Stabilno algorytmu predykcyjnego

Zajmiemy si stabilnoci schematu 2.2.1 w przypadku nominalnym, gdy estymacja stanu jest dokadna i nie wystpuj adne zakcenia. W przypadku tym zachodz rwnoci

)()( txtxk = dla ],[ 1+ kk ttt oraz )()()(~ kkk

k txtxtx == . Bdziemy rozwaa nastpujce definicje stabilnoci.

Definicja 2.3.1 (stabilno w sensie Lapunowa). Schemat 2.2.1 bdziemy nazywa stabilnym w sensie Lapunowa, jeeli dla dowolnej liczby 0> istnieje liczba 0> , taka e

yh dla 0y , taka e dla wszystkich 0kk i dowolnego rozwizania -suboptymalnego ),,( kk

k xTu , procedura generuje rozwizanie -suboptymalne ),,( 11

1 ++

+ kk

k xTu , speniajce nierwno

2.Oglny algorytm predykcyjny z przyblion optymalizacj

21

))(~(1 kkk txhrr + . (2.17)

b. Jeeli schemat 2.2.1 ma sab wasno WS2 ze wskanikiem 0k oraz dodatkowo istnieje

funkcja L K , taka e |)(|)( yyh L dla wszystkich nRy , to mwimy, e schemat 2.1.1 ma wasno WS2 ze wskanikiem 0k w sensie zwykym (zwyk wasno WS2) .

c. Jeeli schemat 2.2.1 ma zwyk wasno WS2 ze wskanikiem 0k oraz dodatkowo

=

)(lim L

, to mwimy, e schemat 2.2.1 ma mocn wasno WS2 ze wskanikiem 0k .

WS3. Mwimy, e schemat 2.2.1 ma wasno WS3 ze wskanikiem 0k , jeeli istnieje funkcja K, taka e nierwno

)(|)(| kk rtx (2.18)

jest speniona dla wszystkich wskanikw 0kk oraz wszystkich ],[ 1+ kk ttt .

atwo zauway, e prawdziwe s nastpujce implikacje: (i) mocna wasno WS1 ze wskanikiem 0k zwyka wasno WS1 ze wskanikiem 0k

(ii) mocna wasno WS2 ze wskanikiem 0k zwyka wasno WS2 ze wskanikiem 0k

saba wasno WS2 ze wskanikiem 0k .

Rys. 2.3. Moliwe zachowanie cigu kr w przypadku, gdy schemat 2.2.1 ma wasno WS2a.

Od tej chwili zakadamy, e spenione s wszystkie zaoenia odnonie prawej strony rwna modelu (2.1) i obiektu (2.3) oraz problemw ))(~,,( kkk txtP przyjte w punktach 2.1 i 2.2 niniejszego rozdziau.

Lemat 2.3.1. Jeeli schemat 2.2.1 ma wasno WS1 (mocn wasno WS1) ze wskanikiem

0k , to ma zwyk wasno WS2 (mocn wasno WS2) ze wskanikiem 0k .

Dowd: Pokaemy, e caka w (2.16) ma niezerowe oszacowanie dolne. Schemat 2.2.1 generuje trajektorie takie, e + )( kk

k Ttx . Z twierdzenia 2.1.1 wynika, e

)exp(|)(| 1 kk TLMtx , dla ],[ kkk Tttt + . Z (2.16) wynika, e cig kr nie ronie dla 0kk .

2.Oglny algorytm predykcyjny z przyblion optymalizacj

22

Poniewa M . Wynika std, e

|)(|))(|)(~|,0max( txttMtx kkk , ktt .

Funkcja L K , zatem musi by

|))((|)))(|)(~|,0max(( txttMtx kLkkL .

Cakujc t nierwno w granicach ],[ +kk tt otrzymujemy oszacowanie

dtttMtxdttxk

k

k

k

t

tkkL

t

t

kL

++

)))(|)(~|,0max((|))((| . (2.19)

Wyraenie

dtttMtxtxk

k

t

t

kkLkL +

=

)))(|)(~|,0max((|))(~(| (2.20)

okrela dla 0> cig i cile rosnc funkcj normy warunku pocztkowego )(~ ktx . Poniewa 0)0( =L , to L K. Na mocy (2.16), (2.19) i (2.20) otrzymujemy

|))(~(||))((|1

1 kLk

t

t

kLkk txrdttxrr

k

k

+

+ .

Przyjmujc |))(~(|))(~( kLk txtxh = otrzymujemy nierwno (2.17), co koczy dowd.

Lemat 2.3.2. Jeeli schemat 2.2.1 ma wasno WS1 ze wskanikiem 0k , to ma rwnie

wasno WS3 ze wskanikiem 0k .

Dowd: Pokaemy, e spenione s zaoenia lematu 2.1.1. Z (2.16) wynika, e

k

t

t

kL rdttx

k

k

+1

|))((| , 0kk .

Schemat 2.2.1 generuje trajektorie takie, e + )( kkk Ttx . Z twierdzenia 2.1.1 wynika, e

)exp(|)(| 1 kk TLMtx dla ],[ kkk Tttt + . Poniewa

2.Oglny algorytm predykcyjny z przyblion optymalizacj

23

Dowd: a. Poniewa zakcenia nie wystpuj i estymacja stanu jest dokadna, to )()()()(~ kkk

kk txtxtxtx

=== . W przedziale czasu ],0[ 0k , trajektoria x jest ograniczona.

W chwili 0k znajdujemy -suboptymalne rozwizanie problemu ))(~,,( 000 kkk txtP . Rozwizaniu temu odpowiada skoczona warto

0kr . Bezporednio z wasnoci WS2 (zob.

wzr (2.17)) i z konstrukcji algorytmu wynika, e cig ikr +0 , ,...2,1,0=i , jest nierosncy i ograniczony od dou, a zatem jest zbieny. Poniewa kady cig zbieny jest cigiem Cauchyego, to z wasnoci WS2 mamy

0))(~(0 1 +

kkkk rrtxh .

A zatem 0))(~(

k

ktxh . Na mocy wasnoci WS3 istnieje funkcja K, taka e

)(|)(| kk rtx dla ],[ + kk ttt , 0kk . (2.21)

Poniewa cig kr jest nierosncy dla 0kk , to z (2.21) wynika, e cig )()(~ kk

k txtx = jest ograniczony. Funkcja h jest ciga oraz 0)0( =h i 0)( >yh dla 0y . Wynika std, e warunek 0))(~(

kktxh implikuje 0)(

~

k

ktx . (Uwaga: gdyby cig )(~

ktx nie by

ograniczony, to na og nie byby zbieny do zera). Procedura jest -suboptymalna (zob. def. 2.2.2), zatem |))(~(| kk txr , gdzie K . Ponadto na mocy (2.21) mamy

|))(~(|(|)(| kk txtx . Poniewa przy braku zakce dla ],[ 1+ kk ttt zachodzi rwno

)()( txtxk = , to |))(~(|(|)(| ktxtx , dla ],[ 1+ kk ttt . Przechodzc do granicy k

otrzymujemy 0|)(|lim =

txt

. A zatem schemat 2.2.1 jest SGAS.

b. Poniewa schemat 2.2.1 ma sab wasno WS2 ze wskanikiem 00 =k , to cig kr , ,...2,1,0=k nie ronie. Z (2.21) i z definicji -suboptymalnoci (def. 2.2.2) mamy

|))0(~(|()()(|)(| 0 xrrtx kk , gdzie o K.

Poniewa przy braku zakce dla ],[ 1+ kk ttt zachodzi rwno )()( txtxk = oraz

)()(~ kk txtx= , to |)))0((|(|)(| xtx dla wszystkich 0t , co dowodzi, e schemat

2.2.1 jest stabilny. Z punktu a twierdzenia przy 00 =k wynika, e schemat 2.2.1 jest SGAS. A zatem schemat 2.2.1 jest GAS.

Twierdzenie 2.3.2 (o stabilnoci schematu 2.2.1). a. Jeeli schemat 2.2.1 ma wasno WS1 ze wskanikiem 00 k , to jest on sabo

globalnie asymptotycznie stabilny. b. Jeeli dodatkowo 00 =k , to schemat ten jest globalnie asymptotycznie stabilny

w sensie Lapunowa.

Dowd: Poniewa schemat 2.2.1 ma wasno WS1, to z lematw 2.3.1 i 2.3.2 wynika, e ma zwyk (a zatem i sab) wasno WS2 oraz wasno WS3. Teza wynika natychmiast z twierdzenia 2.3.1.

Komentarz

Z twierdze 2.3.1 i 2.3.2 wynika, e stabilny algorytm predykcyjny naley konstruowa w taki sposb, aby wskanik jakoci mala w kolejnych krokach, przy czym wskanik ten powinien stanowi pewnego rodzaju miar odlegoci trajektorii kx od celu (wasno WS3).

2.Oglny algorytm predykcyjny z przyblion optymalizacj

24

O tym, e algorytmy posiadajce wasnoci WS13 rzeczywicie istniej, przekonamy si w rozdziaach 3 i 4. Wasnoci WS1 i WS2 s analogiczne do warunku ujemnej okrelonoci pochodnej funkcjonau Lapunowa w klasycznej teorii stabilnoci (zob. np. Demidowicz 1972). Wasno WS2 jest sabsza ni wasno WS1. Fundamentalnym wymaganiem jest ograniczono trajektorii kx . Spenienie tego wymagania gwarantowane jest przez warunki Lipschitza oraz poprzez danie, aby + )( kk

k Ttx . Jeeli skdind wiadomo, e

trajektorie s ograniczone, to globalny warunek Lipschitza wzgldem x moe by zastpiony warunkiem lokalnym. Znaczenie warunku kocowego + )( kk

k Ttx mona wyrazi nieco

nieprecyzyjnie stwierdzajc, e regulator musi widzie cel. Optymalno nie jest warunkiem koniecznym stabilnoci. Ilociowe kryterium wczeniejszego przerwania oblicze podane w punkcie 6 schematu 2.2.1, pozwala unika nadmiernej liczby iteracji w kocowej fazie optymalizacji. Jest oczywiste, e nadmierne odejcie od optymalnoci nie jest wskazane ze wzgldu na cel sterowania (wyraany przez wskanik jakoci), jednak niewielka utrata optymalnoci pozwala zdaniem autora znaczco odciy algorytm optymalizacji, zwaszcza w obecnoci zakce. W przypadku nominalnym naley w algorytmie wybra 1= . Przypadek 1 mona dobra liczby 0,,, >epwa , takie e kada trajektoria

x wygenerowana przez schemat 2.2.1

spenia relacj

)()( xttxt : |)(| tx ,

to schemat 2.2.1 nazywamy odpornym.

Prawa strona rwnania obiektu (2.3) spenia zaoenia twierdzenia o cigej zalenoci rozwizania od parametru i warunku pocztkowego (Palczewski 1999). Zatem dla dowolnej liczby 0~0 > istniej liczby 0,,, >epwa , takie e rozwizanie

nkkk

k RTttx + ],[: , gdzie minTTk , rwnania (2.1) z warunkiem pocztkowym )(~ ktx i sterowaniem dopuszczalnym UTttu kkk

k + ],[: oraz rozwizanie rwnania (2.3) z warunkiem pocztkowym )( ktx

i z tym samym sterowaniem, speniaj na odcinku ],[ 1+kk tt warunek

0~|)()(|

istnieje liczba 01 > taka , e warunek

111 |)()(~|

2.Oglny algorytm predykcyjny z przyblion optymalizacj

25

11111

1111 ~)),(,,()),(~,,( +< +++

++++

+kk

kk

kkkk

k txTuJtxTuJ . (2.24)

W chwili 1+kt (rys. 2.2) stan obiektu wynosi )( 1+

ktx , natomiast stan przewidywany jest

rwny )(~ 1+ktx i jest on na og rny od stanu )( 1+kk tx , uzyskanego na podstawie

rozwizania rwnania (2.1) z warunkiem pocztkowym )(~ ktx i sterowaniem ku . Odlego

pomidzy stanem )(~ 1+ktx i stanem )( 1+kk tx , wystpujc w warunku (2.23), mona uczyni

dowolnie ma, wybierajc odpowiednio mae liczby 0,,, >epwa . Korzystajc z (2.22) i (2.24) otrzymujemy

|))(~(|~)),(~,,()),(~,,( 11111

kLkkkk

kkkk txtxTuJtxTuJ ++++

+ (2.25)

Pomy 0> oraz 0~ , 1~ . Na mocy cigej zalenoci rozwiza rwna (2.1) i (2.3) od parametrw i warunkw pocztkowych wnioskujemy, e dla dowolnej liczby 0> istniej liczby 0,,, >epwa takie, e zachodzi nierwno

|))(~(|)),(~,,()),(~,,( 1111

kLkkkk

kkkk txtxTuJtxTuJ ++++

+ (2.26)

Korzystajc z definicji cigu kr (zob. wzr (2.14)) moemy napisa

|))(~(|1 kLkk txrr + i znaleli odpowiadajce jej liczby 0,,, >epwa , to proces obliczania sterowania w algorytmie 2.2.1 mgby by przerywany po znalezieniu rozwizania -suboptymalnego gwarantujcego spenienie nierwnoci (2.27). Wskanik jakoci malaby wwczas dla wszystkich )(~ ktx speniajcych warunek |))(

~(| kL tx < . Poniewa na og nie znamy liczb 0,,, >epwa odpowiadajcych zadanej liczbie 0> , to jako warunek wczeniejszego zakoczenia oblicze w algorytmie 2.2.1, przyjmujemy spenienie nierwnoci (2.29).

Wniosek 2.4.1. Jeeli schemat 2.2.1 ma zwyk wasno WS2 ze wskanikiem 00 k oraz dla pewnego 0kk speniona jest nierwno (2.28), to istniej liczby 0,,, >epwa takie, e procedura moe wygenerowa rozwizanie - suboptymalne ),,( 11

1 ++

+ kk

k xTu ,

speniajce warunek (2.29).

Zachodzi nastpujce

2.Oglny algorytm predykcyjny z przyblion optymalizacj

26

Twierdzenie 2.4.1 (o odpornoci schematu 2.2.1). Jeeli schemat 2.2.1 ma zwyk wasno WS2 ze wskanikiem 00 k , wasno WS3 ze wskanikiem 00 k oraz )1,0( , to schemat 2.2.1 jest odporny.

Dowd: Bdziemy bada zachowanie trajektorii )(txk . Niech ),0( maxE , gdzie 0)(lim)1(max >= LE . Ponadto niech K bdzie kul domknit o rodku

w zerze i promieniu ))1(()( 110 = LR , gdzie

1L jest funkcj odwrotn do L .

Przypumy, e cig )(~ ktx pozostaje zawsze na zewntrz kuli K , tzn.

))1((|)(~| 11 > Lktx dla ,...2,1,0=k . (2.30)

Z (2.30) i z wniosku 2.4.1 wynika, e dla kadego ),0( maxE istniej liczby 0,,, >epwa , takie e procedura moe wygenerowa rozwizanie -suboptymalne

),,( 111 +

++ k

kk xTu , speniajce warunek (2.29). Ze wzorw (2.14), (2.15), (2.29) i (2.30) oraz

z wasnoci WS2 wynika, e przy odpowiednio maych liczbach 0,,, >epwa wyrazy cigu kr bd spenia nierwnoci

+ 1|))(~(|0 1 kkLkk rtxrr dla ,...2,1,0=k .

Po skoczonej iloci krokw wyrazy cigu kr musiayby przyjmowa wartoci ujemne, co

jest sprzeczne z definicj tego cigu. Istnieje zatem taki wskanik 0k , e

))1((|)(~| 11 Lktx .

Poniewa procedura jest -suboptymalna, to z definicji 2.2.2 oraz z ostatniej nierwnoci mamy oszacowanie wskanika jakoci

)))1(((|))(~(| 11 Lkk txr . (2.31)

Przypumy teraz, e na skutek dziaania zakce stan przewidywany opuszcza kul K ,

tzn. Ktx k )(~ oraz Ktx k + )(

~1 . Moe si wwczas zdarzy, e kk rr >+1 , jednak

z nierwnoci (2.27) wynika, e przyrosty cigu kr s mniejsze ni , tzn.

+epwa , nastpny wyraz tego cigu musi spenia nierwno

+ T ), model obiektu (2.1), wskanik jakoci (2.7), estymata warunku pocztkowego )0(x , funkcja L K, zbir B, liczby ]1,0( , )1,0( (np. = 0,1),

]1,0(min (np. =min 0,01). Inicjalizacja : Podstaw 0:=k , ktk =: , )0(:)(~ xtx k = , 0:=k . Jeeli )0(x B, to podstaw

min: =k . Oblicz rozwizanie pocztkowe ))0(,,0(),,( 00

00 xxTu = .

1. W przedziale czasu ),[ +kk tt stosuj do obiektu sterowanie ku oraz rwnolegle

wykonuj czynnoci 25. 2. Wyznacz estymat stanu )( ktx .

3. Wyznacz na podstawie rwnania (2.13) predykcj krtkoterminow )(~ 1+ktx .

4. Podstaw kk =+ :1 oraz oblicz min))(~,,( TtxTuJr kkk

k = . a. Jeeli ),[0 minmin += TTTkk , to podstaw min1 : =+k i id do 5. b. Jeeli B)( ktx , to podstaw )1,min(:1 kkk +=+ , gdzie

+

+

+

+=

kk

k

k

k

Tt

t

kk

t

t

kkk

k

dtuxL

dtuxL

),(

),(

)1( dla + minTTk , (3.1)

))((),(

),(

)1(

min

kkk

Tt

t

kk

t

t

kkkk

k

TtxqdtuxL

dtuxLTT

kk

k

k

k

++

+

=

+

+

+

dla ),[ minmin + TTTk . (3.2)

5. a. Jeeli 01 =+k , to za pomoc procedury sprbuj wyznaczy rozwizanie -suboptymalne ))(~,,(),,( 111

11

1+++

++

+ = kkkk

kk txtxTu , speniajce warunek

+ kk rr 1 . b. Jeeli 01 >+k , to za pomoc procedury sprbuj wyznaczy rozwizanie -suboptymalne ))(~,,(),,( 111

11

1+++

++

+ = kkkk

kk txtxTu , speniajce warunek

+

+1

|))((|min1k

k

t

t

kLkk dttxrr .

c. Jeeli nie da si znale rozwizania -suboptymalnego speniajcego warunki w punktach 5a lub 5b, to za ),,( 11

1 ++

+ kk

k xTu podstaw moliwie najlepsze

przyblienie rozwizania optymalnego. 6. Podstaw 1: += kk , ktk =: i id do 1.

3. Quasi-czasooptymalny algorytm predykcyjny...

31

Komentarz

Algorytm QTO-RHC czy w sobie cechy algorytmu czasooptymalnego oraz klasycznego algorytmu predykcyjnego. W chwili pocztkowej wyznaczane jest sterowanie pocztkowe. Dopki stan obiektu ley poza zbiorem B, to algorytm wyznacza sterowania -suboptymalne zblione do sterowania czasooptymalnego. W tej fazie wspczynnik k jest rwny zeru i wykonywane s punkty 1, 2, 3, 4, 5a i 6. Poniewa sterowanie wyznaczane jest na jeden krok naprzd, to do wykonania procedury ))(~,,( 111 +++ kkk txt wymagane jest wyznaczenie predykcji krtkoterminowej oraz wspczynnika 1+k . Czynnoci te wykonywane s w punktach 3 i 4. Po pewnym czasie zachodzi jeden z warunkw w punktach 4a lub 4b. Od tej chwili algorytm przechodzi do fazy stabilizacji, wspczynnik

k przyjmuje pierwszy raz dodatni warto i rozpoczyna si adaptacja wskanika jakoci. W fazie tej wykonywane s punkty 1, 2, 3, 4b, 5b i 6. 3.2. Stabilno algorytmu QTO-RHC

Zauwamy, e istnieje pena analogia pomidzy algorytmem 3.1.1 i schematem 2.2.1 z rozdziau 2. Wykaemy, e przy braku zakce i dokadnej estymacji stanu, algorytm 3.1.1 jest GAS. Jeeli zakcenia nie wystpuj, to )(~)()()( kk

kkk txtxtxtx ===

oraz

)()( txtx k= dla ],[ 1+ kk ttt . Rozpoczniemy od analizy dziaania algorytmu przy 0=k .

Lemat 3.2.1. Jeeli w algorytmie 3.1.1 0=k dla ,...2,1,0=k , to przy braku zakce i dokadnej estymacji stanu speniona jest nierwno

),min())(( min1 TTrtxV kkk + . (3.3)

Dowd: Niech para ),( kk Tu bdzie rozwizaniem -suboptymalnym oraz niech para

),( 11

++

kk Tu bdzie rozwizaniem ))(~,,( 111 +++ kkk txtP . Zamy, e minTTk . Poniewa

),( 11

++

kk Tu minimalizuje )),(;;( 11 ++

kktxTuJ , to zastpujc sterowanie

1+ku przez

sterowanie ku , obcite do przedziau ],[ kkk Ttt ++ , otrzymujemy

=++++= +++

++ ))(())(())(( min11

1min11 kk

kkkk

kkk TtxqTTTtxqTTtxV

== kkkkk rTtxTuJ min)),(,,( .

Jeeli

3. Quasi-czasooptymalny algorytm predykcyjny...

32

Dowd: Zamy, e B)0(x i + min0 TT . Zatem dla pewnego k, 0=k , B)( ktx i + minTTk . Rozpatrzmy teraz rozwizanie -suboptymalne ),,(

11

1 ++

+ kk

k xTu , speniajce

warunek

),min()1())(( min11 TTtxVr kkk + +

+ .

Rozwizanie takie istnieje, poniewa zaoylimy, e istniej rozwizania problemw ))(~,,( kkk txtP oraz procedura jest -suboptymalna. Na mocy lematu 3.2.1 otrzymujemy

),min())((),min()1( min1min1 TTrtxVTTr kkkkk +

+ .

A zatem dla 0=k , istniej rozwizania -suboptymalne ),,(1

11 +

++ k

kk xTu takie, e

),min( min1 TTrr kkk + . (3.3)

W ktym kroku mamy

=

++=1

0min0min ),min())((0

k

iikk

kkk TTrTtxqTTr . (3.4)

Poniewa minTrT kk + , to z twierdzenia 2.1.1 wynika, e ))(exp(|)(| min1 TrLMtx kk + .

Z (3.4) i ostatniej nierwnoci wynika, ze w pewnej chwili j horyzont jT zmaleje na tyle, e ),[ minmin + TTT j lub bdzie speniony warunek B)( jtx .

Mwic nieco nieprecyzyjnie: albo nie mona ju zmniejszy horyzontu o , albo osignity zosta zbir B . Nastpujcy wniosek podsumowuje dotychczasowe rozwaania.

Wniosek 3.2.1. Przy braku zakce i dokadnej estymacji stanu algorytm 3.1.1 ma nastpujce wasnoci: (i) istnieje wskanik 0k N, taki e dla wszystkich 0kk speniony jest warunek

1min k , (ii) warunek w punkcie 4a zachodzi tylko raz, (iii) jeeli 0=k oraz + minTTk , to istniej rozwizania -suboptymalne gwarantujce spenienie nierwnoci w punkcie 5a.

Dowd: (i) Jeeli 0x B, to w fazie inicjalizacji algorytmu mamy min0 = . W przeciwnym wypadku teza wynika bezporednio z lematu 3.2.2 oraz z punktw 4a i b algorytmu. (ii) Wynika bezporednio z lematu 3.2.2 i z faktu, e 0 k . (iii) Wynika bezporednio ze wzoru (3.3).

Warunki stabilnoci algorytmu 3.1.1 okrela nastpujce

Twierdzenie 3.2.1 (o stabilnoci algorytmu QTO-RHC). Przyjmijmy nastpujce zaoenia.

1. Rozwizania problemw ))(~,,( kkk txtP istniej dla wszystkich n

kkk RRtxt + ]1,0[))(~,,( 0 , ,...2,1,0=k .

2. Istnieje funkcja L K , taka e funkcja podcakowa L we wskaniku jakoci (2.7) spenia dla wszystkich mn RRv ),( warunek

|)(|),( LvL . (3.5)

3. Quasi-czasooptymalny algorytm predykcyjny...

33

3. Dla kadego )0(sx istnieje przedziaami cige sterowanie Uus ],0[: , takie e trajektoria sx systemu (2.1) wygenerowana przez to sterowanie pozostaje w zbiorze oraz speniony jest warunek

0))(),(())(( + sss

uxLxqd

d, ],0[ . (3.6)

Wwczas, przy braku zakce i dokadnej estymacji stanu algorytm 3.1.1 jest GAS.

Dowd: Jeeli )0(x B, to 00 = i z wniosku 3.2.1 wynika, e istniej sterowania -suboptymalne gwarantujce spenienie nierwnoci w punkcie 5a algorytmu. Wspczynnik k bdzie rwny zeru a do osignicia zbioru B, bd te do spenienia warunku w punkcie 4a algorytmu. Z wniosku 3.2.1 wynika, e istnieje wskanik 00 k taki, e dla wszystkich 0kk jest min k . Jeeli )0(x B , to min k dla ,...2,1,0=k . Wykaemy, e dla wszystkich 0kk istniej rozwizania -suboptymalne gwarantujce spenienie nierwnoci w punkcie 5b algorytmu. Bdziemy rozwaa dwa przypadki.

Przypadek A. Niech trjka ),,( kkk xTu bdzie rozwizaniem -suboptymalnym oraz niech

+ minTTk (rys. 3.1).

kt minTtk + kk Tt + ++ kk Tt+ktt

su

xu,

sx

ku

kx

kt minTtk kk Tt kk Ttkt

su

sx

ku

kx

Rys. 3.1. Struktura czasowa sterowania dla przypadku A.

Przy warunku pocztkowym )( ktx mamy

+

+++=kk

k

Tt

t

kkkkk

kkk TtxqdtuxLTTr ))((),(min . (3.7)

Po czasie wykonujemy now optymalizacj z warunkiem pocztkowym )( 1+

ktx . Funkcja

wartoci jest rwna

))((),())(( 1111

1min11

1

++++= ++

++

+

+++++

+

kkk

Tt

t

kkkkk TtxqdtuxLTTtxV

kk

k

. (3.8)

Poniewa para ( 1+ku , 1+kT ) minimalizuje )),(,,( 11 ++

kktxTuJ , to zastpujc t par rozwizaniem suboptymalnym ),,( kk

k xTu obcitym do przedziau ],[ kkk Ttt ++ otrzymujemy nierwno

+

+++

+++kk

k

Tt

t

kkkkk

kkk TtxqdtuxLTTtxV

))((),())(( 1min1 . (3.9)

3. Quasi-czasooptymalny algorytm predykcyjny...

34

Szacujc rnic kk rtxV + ))(( 1 otrzymujemy

++++ ++

+++

))((),())((),())(( 11 kkk

Tt

t

kkkkk

kTt

t

kkkkk TtxqdtuxLTtxqdtuxLrtxV

kk

k

kk

k

+

+

+

+kk

k

k

k

Tt

t

kkk

t

t

kkk dtuxLdtuxL

),(),( .

Podstawiajc za k wyraenie (3.1) oraz korzystajc z zaoenia 2 otrzymujemy

0|))((|),())(( 1

3. Quasi-czasooptymalny algorytm predykcyjny...

35

+

++=

++

+

+

+

+

min

),(),(),()( min

Tt

Tt

ss

Tt

t

kkk

t

t

kkkk

k

kk

kk

k

k

k

dtuxLdtuxLdtuxLTT

))(())((),( minmin

kkk

ks

Tt

Tt

ssk TtxqTtxqdtuxLk

kk

+++++ ++

+

.

Z zaoenia 3 twierdzenia oraz z faktu, e ]1,0[k , wynika nierwno

0))(())((),( minmin

++++++

+kk

kks

Tt

Tt

ssk TtxqTtxqdtuxLk

kk

.

Otrzymujemy zatem

++

++

+

+

+

+

+

min

),(),(),()())(( min1

Tt

Tt

ss

Tt

t

kkk

t

t

kkkkkk

k

kk

kk

k

k

k

dtuxLdtuxLdtuxLTTrtxV . (3.11)

Z zaoenia 3 twierdzenia wynika nierwno

))((),(min

kkk

Tt

Tt

ss TtxqdtuxLk

kk

+++

+

.

Z rwnoci (3.2) oraz z powyszej nierwnoci otrzymujemy

++

+

=

+

+

+

))((),(

),(

)1(

min

kkk

Tt

t

kk

t

t

iikk

k

TtxqdtuxL

dtuxLTT

kk

k

k

k

++

+

+

+

+

+

+

min

),(),(

),(

)1(

min

Tt

Tt

ss

Tt

t

kk

t

t

kkkk

k

kk

kk

k

k

k

dtuxLdtuxL

dtuxLTT

.

Podstawiajc powysz nierwno do (3.11) dostajemy

0|))((|)(),()())(( minmin1

3. Quasi-czasooptymalny algorytm predykcyjny...

36

+

+

k

k

t

t

kLkkk dttxrr |))((|1 .

Zatem dla wszystkich 0kk istniej sterowania -suboptymalne gwarantujce spenienie nierwnoci w punkcie 5b algorytmu. Ale to oznacza, e algorytm 3.1.1 ma wasno WS1 z pewnym wskanikiem 0k . Ponadto, jeeli )0(x B, to 00 =k . Korzystajc z twierdzenia 2.3.2 widzimy, e algorytm ten jest GAS. Twierdzenie zostao udowodnione.

Komentarz

Twierdzenie 3.2.1 podaje warunki stabilnoci algorytmu QTO-RHC. Z dowodu wynika, e rozwizanie -suboptymalne w kroku k-tym, moe posuy do wyznaczenia rozwizania -suboptymalnego w kroku k+1. Zaoenie 2 nakada ograniczenia na funkcj podcakow L we wskaniku jakoci. Dla przykadu funkcja 2221 )(),( uxxuxL += nie spenia tego zaoenia, natomiast czsto spotykany kwadratowy wskanik jakoci RuuWxxuxL TT +=),( ,

0>= TWW , 0>= TRR spenia zaoenie 2, przy czym 2min ||)(|)(| xWxL = . Znacznie trudniejsze do spenienia jest zaoenie 3. Jeeli istnieje prawo sterowania )(xKu = , takie e funkcja q jest lokalnie funkcjonaem Lapunowa systemu (2.1) ze sterowaniem )(xKu = , to zbir moe by wybrany jako zbir poziomicowy funkcjonau q (por. Chen i Algwer 1998, Jadbababie 2001, Fontes 2000). Jeeli system (2.1) nie jest stabilizowalny (tzn. jego linearyzacja w otoczeniu zera nie jest stabilizowalna), to problem znacznie si komplikuje. Jako zbir wybiera si wwczas pewien zbir zoony z tych punktw przestrzeni stanu, z ktrych moliwe jest sprowadzenie systemu do zera. Szczegy takiego podejcia podaje Fontes (2000, 2003a). Problem wyboru zbioru oraz funkcji q dla systemw stabilizowalnych zostanie szczegowo omwiony w rozdziale pitym. 3.3. Odporno algorytmu QTO-RHC

Odporno algorytmu 3.1.1 bdziemy analizowa metodami opisanymi w punkcie 2.4. W pocztkowej fazie dziaania (o ile 0x B i + minTTk ), algorytm generuje sterowanie zblione do czasooptymalnego, minimalizujc wskanik jakoci (2.7), przy 0=k . Z konstrukcji algorytmu oraz z dowodu lematu 3.2.2 wynika, e dopki 0=k , to przy braku zakce i dokadnej estymacji stanu algorytm generuje sterowania takie, e speniona jest nierwno

+ kk rr 1 . (3.14)

Rozumujc analogicznie jak w punkcie 2.4 mona pokaza, e dla dowolnego 0> , istniej dostatecznie mae liczby 0,,, >epwa , takie e wyrazy cigu kr speniaj nierwno

++ kk rr 1 . (3.15)

Jeeli < , to z powyszej nierwnoci wynika, e dla dostatecznie maych liczb 0,,, >epwa , istnieje wskanik 00 k taki, e ),[ minmin0 + TTTk lub B)( 0ktx . Warunki

w punkcie 4 algorytmu gwarantuj, e min k dla wszystkich 0kk > . Mamy nastpujce

Twierdzenie 3.3.1 (o odpornoci algorytmu QTO-RHC). Jeeli spenione s zaoenia twierdzenia 3.2.1 oraz )1,0( , to algorytm QTO-RHC jest odporny.

3. Quasi-czasooptymalny algorytm predykcyjny...

37

Dowd: Wykazalimy ju, e w obecnoci zakce i bdw estymacji stanu, istnieje wskanik 00 k taki, e min k dla wszystkich 0kk > . Z dowodu twierdzenia 3.2.1 wynika, e algorytm 3.1.1 ma wasno WS1 ze wskanikiem 10 +k . Teza wynika natychmiast z twierdzenia 2.4.2.

Komentarz

Dopuszczalna amplituda zakce zapewniajca zmniejszanie wskanika jakoci w pocztkowej fazie sterowania (dla 0=k ), jest okrelona przez do restrykcyjny warunek

< . Niespenienie tego warunku moe spowodowa, e trajektoria x oddali si dowolnie daleko od pocztku ukadu wsprzdnych. Powysze rozumowanie prowadzi do wniosku, e w pocztkowej fazie dziaania (dopki 0=k ), odporno algorytmu 3.1.1 na zakcenia i bdy modelowania moe by maa. Wniosek ten pokrywa si z wynikami dotyczcymi sterowania czasooptymalnego, uzyskanymi przez Turnaua i Korytowskiego (Turnau 2002, Korytowski 2002), ktrzy pokazali i potwierdzili eksperymentalnie, e wraliwo stanu kocowego w zadaniu czasooptymalnym moe by nawet nieskoczona. Dua wraliwo wystpuje zwykle w pobliu celu i dlatego naley wwczas zrezygnowa ze strategii czasooptymalnej, doczajc do wskanika jakoci czon cakowy. Moment zejcia z trajektorii czasooptymalnej moe by wybrany poprzez odpowiedni dobr horyzontu minimalnego, zbioru B oraz okresu wyliczania sterowania . Wielkoci te naley dobra eksperymentalnie w zalenoci od konkretnego zadania sterowania. Zbir B powinien by na tyle obszerny, aby trajektoria stanu obiektu nie opuszczaa B na skutek dziaania zakce. Na tym zakoczymy rozwaania o stabilnoci i odpornoci i przejdziemy do przykadw obliczeniowych.

3. Quasi-czasooptymalny algorytm predykcyjny...Przykady

38

3.4. Przykady sterowania systemami nieliniowymi

Aby wyjani dziaanie algorytmu i przerwa nieco nuce rozwaania teoretyczne, w niniejszym podrozdziale przeanalizujemy pi przykadw sterowania systemami nieliniowymi. Jako zadania przykadowe wybrano nastpujce problemy:

1. Sterowanie ramieniem manipulatora. 2. Sterowanie ukadem lewitacji magnetycznej. 3. Sterowanie wahadem na wzku. 4. Sterowanie manipulatorem o dwch stopniach swobody. 5. Sterowanie przepywowym reaktorem chemicznym.

W powyszych przykadach zadanie czasooptymalne oraz zadanie stabilizacji stanowi naturalnie nasuwajce si zagadnienia sterowania. Przykady 2-5 celowo wybrano w taki sposb, aby prawa strona rwna stanu nie speniaa globalnego warunku Lipschitza. Mona zatem podejrzewa, e warunek ten nie jest nazbyt istotny. W opinii autora znacznie wiksze znaczenie ma ograniczono rozwiza i nieskoczony czas ucieczki. W przypadku systemw ze skoczonym czasem ucieczki algorytm QTO-RHC moe nie dziaa. Przykady zostay uszeregowane pod wzgldem rosncej zoonoci obiektw sterowania. Przykad pierwszy ma charakter wprowadzajcy. Obiekty z przykadw 2, 3 i 5 s rzeczywistymi obiektami laboratoryjnymi. Wahado na wzku oraz reaktor przepywowy s znanymi w literaturze, silnie nieliniowymi obiektami testowymi (Turnau 2002, Chen 1995, Tyagunov 2004). Algorytm predykcyjny opisany w rozdziaach 2 i 3 wymaga na og estymatora stanu. Poniewa teoria estymacji stanu w systemach nieliniowych znacznie wykracza poza ramy tej pracy, w tym miejscu zaznaczymy jedynie, e we wszystkich przykadach stosowany by estymator typu high-gain (Bornard 1991, Busawon 2000, Gauthier 1994). W symulacjach uwzgldniono dwa przypadki: nominalny i zakcany. W pierwszym z nich, estymacja stanu jest dokadna oraz nie wystpuj zakcenia i bdy modelowania. W drugim przypadku symulowane s zakcenia i bdy modelowania oraz estymacja stanu nie jest dokadna. Algorytm optymalizacji, uyty do wyliczania sterowania, zostanie opisany w rozdziale 6. Przykad 3.4.1. Rami manipulatora Rozwamy na pocztek elementarny przykad ramienia manipulatora pracujcego w paszczynie pionowej i napdzanego za pomoc silnika elektrycznego.

u

z1

z2

x1

I, d

Rys. 3.3. Rami manipulatora.

3. Quasi-czasooptymalny algorytm predykcyjny...Przykady

39

Pomijajc tarcie i dynamik silnika oraz zakadajc, e moment wytwarzany przez silnik jest proporcjonalny do napicia podawanego na sterownik silnika, mona przyj, e dynamika pewnego hipotetycznego ramienia manipulatora opisana jest ukadem rwna:

21 xx =& , kuxx += 12 sin& ,

przy czym kt 1x jest wyraony w radianach, prdko ktowa 2x w rad/s, a moment napdowy u w Nm. Przyjto, e parametr 3,0=k rad/(Nms2).

Zadanie sterowania polega na przeprowadzeniu ramienia z dolnego stabilnego punktu rwnowagi T]0,[0 =x do grnego niestabilnego pooenia rwnowagi

T]0,0[0 =x . Maksymalna i minimalna warto sterowania wynosiy odpowiednio =maxu 1, =minu 1. Zgodnie z konwencj przyjt na pocztku rozdziau, zadanie to przeksztacono na zadanie ze swobodnym horyzontem i stanem kocowym. Wskanik jakoci mia posta dan wzorem (2.7), przy czym funkcja podcakowa L oraz funkcja kary za niespenienie warunku kocowego byy dane rwnociami

22 ||||),( RW uxuxL += , 2|| Hxq = , 22xIW = , 10=R ,

=

22,2721 22,2721

22,2721 22,3721H .

Zbir kocowy by dany rwnoci }1,0:{ 2 = HxxRx T . Dodatnio okrelon macierz H oraz zbir kocowy wyznaczono metodami opisanymi w rozdziale pitym. Wybr macierzy H i zbioru gwarantuje spenienie zaoe twierdze 3.2.1 i 3.3.1. W eksperymentach numerycznych przyjto wspczynnik = 0,1. Zbir B, w ktrym nastpuje adaptacja wskanika jakoci, by dany rwnoci }2,1,5,0||:{ 2 == ixRx iB . Zaoono, e bdy w generacji momentu napdowego w silniku nie przekraczaj 10% jego maksymalnej wartoci. Bdy te symulowano poprzez dodanie do sterowania wyliczonego przez algorytm szumu o rozkadzie rwnomiernym ze redni zero i amplitud rwn 0,1 Nm. Zaoono, e maksymalne bdy estymacji kta 1x nie przekraczaj wartoci 4096/2 rad, podyktowanej rozdzielczoci typowego 12-bitowego enkodera. Przyjto, e prdko ktowa ramienia manipulatora jest estymowana z dokadnoci do 0,02 rad/s. Bdy estymacji stanu symulowano dodajc do wyj obiektu symulowanego szum o rozkadzie rwnomiernym ze redni zero i amplitud rwn 4096/2 rad dla pomiaru kta oraz 0,02 rad/s dla pomiaru prdkoci ktowej. Symulator obiektu by osobn, napisan w jzyku C procedur cakowania rwna rniczkowych, wykorzystujc do generacji zakce generatory liczb pseudolosowych (zob. Press 1992). We wszystkich eksperymentach numerycznych okres wyliczania sterowania wynosi = 0,1 s. Optymalizacja miaa charakter przybliony i bya przerywana po spenieniu warunkw w punktach 5a,b algorytmu 3.1.1. W pierwszym eksperymencie numerycznym zakcenia nie wystpoway. Rys. 3.4-5 przedstawiaj trajektori i sterowanie generowane przez algorytm QTO-RHC oraz trajektori i sterowanie przewidywane w chwili pocztkowej. Przyjto, e stan docelowy jest osignity, jeeli odchylenie pierwszej zmiennej stanu od zera jest mniejsze ni 0,5 stopnia dla przypadku nominalnego i 2 stopnie dla przypadku zakcanego oraz odchylenie prdkoci od zera jest mniejsze ni 0,5 stopnia/s w przypadku nominalnym i 1,5 stopnia/s w przypadku zakcanym. Przewidywany w chwili pocztkowej czas osignicia celu wynosi 12,553 s. Po czasie okoo 10,7 s trajektoria osiga zbir B i nastpuje adaptacja wskanika jakoci. Wskutek wprowadzenia do wskanika jakoci czonu cakowego, czas osignicia celu wyduy si do okoo 13,2 s (okoo 5% wicej w porwnaniu z czasem optymalnym). Mechanizm adaptacji usun ze sterowania ostatnie przeczenie i zastpi sterowanie bang-bangowe sterowaniem lecym wewntrz ogranicze. Pierwsze dwa czasy przecze nie

3. Quasi-czasooptymalny algorytm predykcyjny...Przykady

40

ulegy zmianie w porwnaniu ze sterowaniem przewidywanym w chwili pocztkowej. Wskanik jakoci monotonicznie mala, a horyzont mala a do momentu osignicia minimalnej dopuszczalnej wartoci. W drugim eksperymencie symulowano zakcenia w generacji sterowa i bdy estymacji stanu. Na rys. 3.7-8 pokazano trajektori i sterowanie generowane przez algorytm oraz trajektori i sterowanie przewidywane w chwili pocztkowej. Na skutek dziaania zakce trajektoria generowana przez algorytm rni si od trajektorii przewidywanej ju w pocztkowej fazie sterowania. Czas osignicia zbioru B by wikszy ni w przypadku nominalnym i wynosi 11,1 s. Czas osignicia celu wynosi ok. 14,5 s (ok. 15% wicej w porwnaniu z czasem optymalnym). Wystpia nieznaczna zmiana czasw przecze sterowania. Adaptacja wskanika jakoci odbywaa si podobnie jak w przypadku nominalnym, jednake na skutek obecnoci zakce i bdw estymacji stanu wskanik jakoci nie mala ju monotonicznie. Horyzont optymalny mala (lecz nie monotonicznie), a do osignicia wartoci minimalnej. Odchylenie standardowe drugiej zmiennej stanu w kocowej fazie eksperymentu wynosio 0,45 /s (odchylenie standardowe dla pierwszej zmiennej stanu byo kilkakrotnie mniejsze).

Wyczenie mechanizmu adaptacji wskanika jakoci spowodowao wiksze odchylenia trajektorii od zera w kocowej fazie sterowania oraz generacj bardzo duej liczby przecze sterowania, co moe by przyczyn szybkiego zuywania si elementw wykonawczych manipulatora, nadmiernego przegrzewania silnikw oraz wzbudzania drga w ukadzie. Na rys. 3.1011 pokazano trajektorie i sterowania przy wyczonym mechanizmie adaptacji. Odchylenie standardowe drugiej zmiennej stanu w kocowej fazie eksperymentu wynosio 0,63 /s i byo o ok. 41% wiksze, ni w przypadku wczonego mechanizmu adaptacji wskanika jakoci. Caka z kwadratu sterowania, ktra czsto stanowi miar energii zuywanej przez ukad sterowania, bya w przypadku wyczonego mechanizmu adaptacji wskanika jakoci ponad 25 razy wiksza, ni analogiczna caka obliczona dla przypadku z wczonym mechanizmem adaptacji wskanika jakoci. Powysze dwa wyniki stanowi istotne uzasadnienie celowoci stosowania mechanizmu adaptacji wskanika jakoci w czasie trwania procesu sterowania.

W ostatnim eksperymencie rozwaono przypadek B = nR , w ktrym adaptacja wskanika jakoci odbywa si od samego pocztku procesu sterowania. Na rys. 3.12-14 pokazano wyniki symulacji przy zakceniach i bdach estymacji stanu. Czas osignicia celu wynosi ok. 15 s i by o ok. 20% duszy ni czas optymalny. Widoczne s znaczce rnice pomidzy trajektori generowan przez algorytm i trajektori przewidywan w chwili pocztkowej. Adaptacja wskanika jakoci przebiegaa bardzo wolno w pocztkowej fazie sterowania i koczya si po ok. 10 s. W sterowaniu nie wystpoway ju przeczenia, ale tzw. quasi-przeczenia, ktre zostan dokadniej omwione w rozdziale 6. Horyzont mala w przyblieniu liniowo, a do osignicia minimalnej wartoci, natomiast tempo zmniejszania si wskanika jakoci byo istotnie zalene od zmian wspczynnika k . Przypadek ten mona uzna za poredni pomidzy minimalizacj czasu a minimalizacj kwadratowego wskanika jakoci.

3. Quasi-czasooptymalny algorytm predykcyjny...Przykady

41

0 2 4 6 8 10 12 14 16 18 20-5

-4

-3

-2

-1

0

1

2

rad,

rad

/s

t [s]

11 12 13-0.4

-0.2

0

0.2

0.4

x2

x1

Poczatek adaptacji w chwili t = 10,7s

Trajektoria przewidywana w chwili t = 0

Trajektoria w algorytmie QTO-RHC

Rys. 3.4. Algorytm QTORHC. Trajektoria stanu oraz trajektoria przewidywana w chwili pocztkowej w przypadku bez zakce. Do momentu rozpoczcia adaptacji wskanika jakoci obie trajektorie pokrywaj si.

0 2 4 6 8 10 12 14 16 18 20

-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

t [s]

u [N

m]

Sterowanie przewidywane w chwili t = 0

Sterowanie w algorytmie QTO-RHC

Rys. 3.5. Algorytm QTORHC. Sterowanie oraz sterowanie przewidywane w chwili pocztkowej w przypadku bez zakce. Do momentu rozpoczcia adaptacji wskanika jakoci oba sterowania pokrywaj si.

3. Quasi-czasooptymalny algorytm predykcyjny...Przykady

42

0 2 4 6 8 10 12 14 16 18 20

0

0.2

0.4

0.6

0.8

1

t [s]

0 2 4 6 8 10 12 14 16 18 200

5

10

15

t [s]

11 12 13 140

1

2 wskaznik jakosci

horyzont

wspolczynnik k

wskaznik jakosci i horyzont

Rys. 3.6. Algorytm QTORHC. Wspczynnik k oraz wskanik jakoci w poszczeglnych iteracjach. Przypadek nominalny.

0 2 4 6 8 10 12 14 16 18 20-5

-4

-3

-2

-1

0

1

2

t [s]

rad,

rad

/s

12 14 16

-0.4

-0.2

0

0.2Poczatek adaptacji w chwili t=11,1s

Trajektoria przewidywana w chwili t=0.

x2

x1

Trajektoria w algorytmie QTO-RHC

Rys. 3.7. Algorytm QTORHC. Trajektoria stanu oraz trajektoria przewidywana w chwili pocztkowej w przypadku zakce w generacji sterowania oraz przy bdnej estymacji stanu. Odchylenie standardowe drugiej zmiennej stanu w przedziale czasu 15-20 s wynosi 0,45 /s.

3. Quasi-czasooptymalny algorytm predykcyjny...Przykady

43

0 2 4 6 8 10 12 14 16 18 20

-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

t [s]

u [N

m]

6 6.5 7-1

0

1

Sterowanie w algorytmie QTO-RHC.

Sterowanie przewidywane w chwili t=0.

Rys. 3.8. Algorytm QTORHC. Sterowanie oraz sterowanie przewidywane w chwili pocztkowej w przypadku zakce w generacji sterowania oraz przy bdnej estymacji stanu. Na rysunku pokazano te zmian czasw przecze, spowodowan obecnoci zakce i bdw estymacji stanu. Caka z kwadratu sterowania w przedziale czasu 15-20 s wynosi okoo 0,2.

0 2 4 6 8 10 12 14 16 18 200

2

4

6

8

10

t [s]

0 2 4 6 8 10 12 14 16 18 200

5

10

15

t [s]

12 14 16 180

1

2

3

wspolczynnik k

Wskaznik jakosci

Horyzont

Rys. 3.9. Algorytm QTORHC. Wspczynnik k oraz wskanik jakoci w poszczeglnych iteracjach w przypadku zakcanym. Wskutek obecnoci zakce wskanik jakoci nie maleje monotonicznie.

3. Quasi-czasooptymalny algorytm predykcyjny...Przykady

44

0 2 4 6 8 10 12 14 16 18 20-5

-4

-3

-2

-1

0

1

2

t [s]

rad,

rad

/s

13 14 15 16-0.4

-0.2

0

0.2

x2

x1

Rys. 3.10. Trajektoria generowana przez algorytm QTO-RHC z wyczonym mechanizmem adaptacji wskanika jakoci, przy wystpowaniu zakce i bdnej estymacji stanu. Odchylenie standardowe drugiej zmiennej stanu w przedziale czasu 15-20 s wynosi 0,63 /s i jest o 41% wiksze ni analogiczne odchylenie obliczone dla przypadku z wczonym mechanizmem adaptacji.

0 2 4 6 8 10 12 14 16 18 20

-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

t [s]

u [N

m]

Rys. 3.11. Sterowanie generowane przez algorytm QTO-RHC z wyczonym mechanizmem adaptacji wskanika jakoci, przy wystpowaniu zakce i bdnej estymacji stanu. Caka z kwadratu sterowania w przedziale czasu 15-20 s wynosi ok. 5,0 i jest ponad 25 razy wiksza ni analogiczna caka obliczona dla przypadku z wczonym mechanizmem adaptacji wskanika jakoci.

3. Quasi-czasooptymalny algorytm predykcyjny...Przykady

45

0 2 4 6 8 10 12 14 16 18 20-5

-4

-3

-2

-1

0

1

2

t [s]

rad,

rad

/s

12 14 16 18 20-0.2

0

0.2

0.4

x2

x1

Trajektoria przewidywana w chwili t=0

Trajektoria w algorytmie QTO-RHC

Poczatek adaptacji w chwili t=0

Rys. 3.12. Algorytm QTORHC. Trajektoria stanu oraz trajektoria przewidywana w chwili pocztkowej w przypadku, gdy zbir B = nR . Symulowano zakcenia w generacji sterowania oraz bdy estymacji stanu. Odchylenie standardowe drugiej zmiennej stanu w przedziale czasu 15-20 s wynosi 0,51 /s.

0 2 4 6 8 10 12 14 16 18 20

-1

-0.8

-0.6

-0.4

-0.2

0

0.2

0.4

0.6

0.8

1

t [s]

u [N

m]

Sterowanie w algorytmie QTO-RHC.

Sterowanie przewidywane w chwili t=0, przy 0=0

Rys. 3.13. Algorytm QTORHC. Sterowanie oraz sterowanie przewidywane w chwili pocztkowej w przypadku, gdy zbir B = nR . Symulowano zakcenia w generacji sterowania oraz bdy estymacji stanu.

3. Quasi-czasooptymalny algorytm predykcyjny...Przykady

46

0 2 4 6 8 10 12 14 16 18 20

0

0.2

0.4

0.6

0.8

1

t [s]

0 2 4 6 8 10 12 14 16 18 200

5

10

15

t [s]

12 14 16 18 20

0.20.40.60.8

11.21.4

wspolczynnik k

wskaznik jakosci

horyzont

wskaznik jakosci

horyzont

Rys. 3.14. Algorytm QTORHC. Wspczynnik k oraz wskanik jakoci w poszczeglnych iteracjach w przypadku, gdy zbir B = nR . Symulowano zakcenia w generacji sterowania oraz bdy estymacji stanu. W przypadku obecnoci zakce wskanik jakoci nie maleje monotonicznie.

3. Quasi-czasooptymalny algorytm predykcyjny...Przykady

47

Przykad 3.4.2. Lewitacja magnetyczna Na przestrzeni ostatnich dwudziestu lat systemy magnetycznego zawieszenia (MZ) znalazy wiele zastosowa w rozmaitych dziedzinach nauki i techniki. Do najbardziej rozpowszechnionych zastosowa naley zaliczy szybk kolej na poduszce magnetycznej, oyska magnetyczne, aktywne tumienie drga i wibracji oraz pomiary masy i gstoci w ekstremalnych warunkach (np. w kwasach). Wicej informacji na temat zawieszenia magnetycznego mona znale w pracach Piata (2004) i autora (1999). Sterowanie systemami MZ polega zazwyczaj na ich stabilizacji w otoczeniu wybranego punktu pracy. Naley uzna, e stosowane powszechnie techniki stabilizacji magnetycznego zawieszenia za pomoc liniowych sprze zwrotnych od stanu lub pooenia s dobrze opanowane zarwno w aspekcie teoretycznym, jak i praktycznym. Zdaniem autora, zastosowanie technik nieliniowych, a w szczeglnoci algorytmu QTO-RHC, do sterowania systemem MZ moe poprawi jego niezawodno i zagwarantowa stabilno w przypadku znacznych odchyle od zadanego punktu pracy (punktu linearyzacji rwna). W stanie normalnej pracy podstawowym algorytmem sucym do stabilizacji systemu MZ jest zwykle liniowy algorytm PID lub LQ. Do stabilizacji w otoczeniu punktu pracy mona take stosowa regulatory rozmyte i nieliniowe. Przykad nieliniowego regulatora stabilizujcego dla MZ mona znale w pracy autora (2001). W przypadku znacznego odchylenia od punktu pracy, spowodowanego obecnoci krtkotrwaego zakcenia, a take przy rozruchu bd koczeniu pracy systemu, stosowanie regulatorw liniowych nie gwarantuje na og stabilnoci systemu MZ. Wwczas, aby moliwie szybko doprowadzi system MZ do stanu rwnowagi, mona jako algorytm awaryjny zastosowa algorytm QTO-RHC, dla ktrego obszar przycigania punktu rwnowagi jest znacznie wikszy ni obszar przycigania regulatorw liniowych. Opisany poniej system MZ znajdujcy si w laboratorium Katedry Automatyki AGH posuy jako ilustracja moliwoci zastosowania algorytmu QTO-RHC.

Sterownikprduv

x3

mg

x1

H

Podoe

Rys. 3.15. Schemat systemu magnetycznego zawieszenia oraz widok ukadu laboratoryjnego. W dalszym cigu bdziemy rozwaa system MZ przedstawiony na rys. 3.15, w ktrym lewitujcym obiektem jest kula z materiau ferromagnetycznego. Niech 1x w m, 2x

w m/s, 3x w A, v w V oznaczaj odpowiednio odlego kuli od elektromagnesu, jej

prdko, prd w cewce oraz napicie sterujce. Prd w cewce elektromagnesu kontrolowany jest przez sterownik prdowy, ktry eliminuje wpyw ruchu kuli na prd cewki oraz zapewnia liniow zaleno pomidzy prdem cewki, a napiciem sterujcym w stanie ustalonym. Pomiary wykonane przez autora (Bania 1999) pokazay, e dynamika elektromagnesu wraz ze

3. Quasi-czasooptymalny algorytm predykcyjny...Przykady

48

sterownikiem prdu moe by dobrze aproksymowana za pomoc liniowego rwnania rniczkowego pierwszego rzdu. Rwnania stanu systemu MZ wyprowadzone w pracach (Bania 1999, Piat 2004) maj posta:

21 xx =& , gxmxL

x +

= 231

2 2

)(& , )(

133 xivkx s =

& , (3.16)

gdzie

=s

x

s

LxL 101 exp)( (3.17)

jest pochodn indukcyjnoci cewki wzgldem pooeniu kuli w H/m, =m 0,06 kg oznacza mas lewitujcego obiektu, =g 9,81 m/s2 jest przyspieszeniem ziemskim, =0L 0,1091 H jest indukcyjnoci cewki dla 01 =x , =s 0,0077 m jest parametrem elektromagnesu, = 10,7 ms jest sta czasow elektromagnesu wraz ze sterownikiem prdu, =si 1,506 A jest staym prdem pyncym przez cewk oraz =k 0,29703 A/V jest wspczynnikiem wzmocnienia sterownika prdu. Minimalna i maksymalna warto napicia sterujcego wynosz odpowiednio =minv 5,56 V i =maxv 9,56 V. Nominalny punkt pracy systemu MZ by okrelony rwnociami

=rx1 14,00 mm, 02 =rx m/s, =rx3 0,7139 A, =rv 7,4734 V. (3.18)

Aby zminimalizowa liczb mnoe w trakcie oblicze numerycznych oraz maksymalnie uproci konieczne do wykonania rachunki, wprowadzono skalowanie sterowania, zmiennych stanu oraz czasu

11 xx = , 22 xx = , 33 xx = , kiu

v s+

=

, tt = , (3.19)

gdzie

s= , gs= , 0

2

L

msg= , g

s= , 0

2

L

mg= .

Wspczynniki skalowania byy rwne

= 0,00773746 m, = 0,27550768156260 m/s, = 0,28890446065998 A,

= 0,02808437120924 s, = 10,28701901522286 A/s.

Po zamianie zmiennych rwnania (3.16) przyjmuj prost, bezwymiarow posta

21 xx =& , (3.20) 1)exp( 2312 += xxx& , (3.21)

ucxx += 33& , (3.22)

==g

sc

1

2,62627844778518. (3.23)

Nominalny punkt pracy oraz graniczne wartoci sterowania po skalowaniu wynosiy

=rx1 1,8094, 02 =rx , =rx3 2,4712, =ru 6,4899, (3.24)

3. Quasi-czasooptymalny algorytm predykcyjny...Przykady

49

sivku

= minmin =1,32, =

=

ivku smaxmax 12,12. (3.25)

Opis eksperymentw numerycznych

W pierwszym eksperymencie zaoono, e w stanie pocztkowym kula spoczywa na podou w odlegoci 18 mm od elektromagnesu oraz e prd w cewce elektromagnesu odpowiada stanowi ustalonemu dla pooenia 18 mm. Celem sterowania byo doprowadzenie systemu do nominalnego punktu pracy danego rwnociami (3.18).

Zgodnie z konwencj przyjt na pocztku rozdziau, zadanie to przeksztacono na zadanie ze swobodnym horyzontem. Wskanik jakoci dla systemu przeskalowanego (3.20-22) mia posta dan wzorem (2.7), przy czym funkcja podcakowa L oraz funkcja kary za niespenienie warunku kocowego byy dane rwnociami

22 ||||),( RrWr uuxxuxL += , 2|| Hrxxq = , (3.26)

=W 2diag([1 1 0,01]), =R 1,

=2,0353 9,1576- 9,1576-

9,1576- 41,4305 41,4305

9,1576- 41,4305 42,4305

H .

Zbir kocowy by dany rwnoci }1,0||:{ 23 = HrxxRx . Dodatnio okrelon macierz H oraz zbir kocowy wyznaczono metodami opisanymi w rozdziale pitym. Wybr macierzy H i zbioru gwarantuje spenienie zaoe twierdze 3.2.1 i 3.3.1. W eksperymentach numerycznych przyjto wspczynnik = 0,1. Zbir B by dany rwnoci }2,1,08,0||:{ 3 == ixxRx iriB . Zaoono, e bdy w generacji sterowania nie przekraczaj 50 mV. Bdy te symulowano poprzez dodanie do sterowania wyliczonego przez algorytm szumu o rozkadzie rwnomiernym ze redni zero i amplitud rwn 50 mV. Zaoono, e maksymalne bdy estymacji pooenia kuli nie przekraczaj wartoci 0,02 mm. Przyjto, e prdko kuli jest estymowana z dokadnoci do 2,5 mm/s. Bdy estymacji stanu symulowano dodajc do wyj obiektu symulowanego szum o rozkadzie rwnomiernym ze redni zero i amplitud rwn 0,02 mm dla pomiaru pooenia oraz 2,5 mm/s dla pomiaru prdkoci. Symulowano rwnie zaburzenia parametrw obiektu, dodajc do wszystkich wspczynnikw rwna (3.16) szum o rozkadzie rwnomiernym ze redni zero i amplitud rwn 10% wartoci nominalnej kadego wspczynnika. Symulator obiektu by odrbn, napisan w jzyku C procedur cakowania rwna rniczkowych, wykorzystujc do generacji zakce generatory liczb pseudolosowych (zob. Press 1992). W obliczeniach sterowania wykorzystywano model skalowany (3.20-22).

We wszystkich eksperymentach numerycznych okres wyliczania sterowania wynosi = 0,7 ms. Okres prbkowania by rwny 0,1 ms. Optymalizacja miaa charakter

przybliony i bya przerywana po spenieniu warunkw w punktach 5a,b algorytmu 3.1.1. Na rys. 3.17 pokazano wyniki symulacji dziaania algorytmu QTO-RHC oraz algorytmu liniowo-kwadratowego z czasem dyskretnym, z macierzami wagowymi jak we wzorze (3.26), i z okresem prbkowania 0,7 ms. Wpyw zakce powoduje, e trajektoria przewidywana w chwili pocztkowej i trajektoria generowana przez algorytm QTO-RHC rni si od siebie. W sterowaniu wystpuj dwa dodatkowe przeczenia. May rozmiar przekroju zbioru B paszczyzn 21xx powoduje, e adaptacja wskanika jakoci rozpoczyna si ok. 5 ms przed planowanym osigniciem celu. W kocowej fazie sterowania regulator QTO-RHC wykazuje nieco wiksze ni LQ odchyki zmiennych stanu i sterowania od stanu ustalonego, co wynika z obecnoci zakce oraz z faktu, e sterowanie optymalne jest

3. Quasi-czasooptymalny algorytm predykcyjny...Przykady

50

wraliwe na zakcenia i bdy modelowania. Czas, po ktrym bd pooenia kuli jest mniejszy ni 0,05 mm wynosi ok. 0,055 s. Dla algorytmu liniowo-kwadratowego czas ten wynosi ok. 0,17 s. W drugim eksperymencie zaoono, e w stanie pocztkowym kula lewituje w odlegoci 10 mm od elektromagnesu oraz e prd w cewce elektromagnesu odpowiada stanowi ustalonemu dla pooenia 10 mm. Celem sterowania byo doprowadzenie systemu do nominalnego punktu pracy danego rwnociami (3.18). Wszystkie parametry byy takie same jak w poprzednim eksperymencie. Wyniki symulacji przy zakceniach i bdach modelowania przedstawiono na rys. 3.18. System magnetycznego zawieszenia jest ukadem niestabilnym o silnych nieliniowociach i duej wraliwoci na zakcenia. Pomimo tych cech algorytm QTO-RHC dziaa poprawnie. Podstawowym problemem przy implementacji algorytmu jest dua zoono obliczeniowa zadania optymalizacji. Maksymalny czas oblicze dla pojedynczej optymalizacji by rwny ok. 0,03 s, co ponad czterokrotnie przekracza zaoony okres wyliczania sterowania. Pomiary czasu oblicze prowadzonych w MATLABIE ver. 5.3, przeprowadzone na maszynie Notebook Amilo Pro Fujitsu Siemens z systemem operacyjnym Windows XP z procesorem Intel 740 wyposaonym w 2 MB pamici podrcznej (cash) i z zegarem 1,73 GHz pokazano na rys. 3.16. Otrzymany wynik pozwala sdzi, e zastosowanie wyspecjalizowanych procesorw oraz przepisanie algorytmu na kod jzyka C, pozwoli na implementacj algorytmu w czasie rzeczywistym.

0 20 40 60 80 100 120 140 160 180 2000

0.005

0.01

0.015

0.02

0.025

0.03

0.035

numer iteracji

czas

obl

icze

n [s

]

Rys. 3.16. Czasy oblicze sterowania w zadaniu podniesienia kuli.

3. Quasi-czasooptymalny algorytm predykcyjny...Przykady

51

a.

0 0.02 0.04 0.06 0.08 0.1 0.12 0.14

14

15

16

17

18

19

t [s]

x 1 [

mm

]

0.045 0.05 0.055

14

14.1

14.2

14.3

14.4

Poczatek adaptacji

Trajektoria przewidywana w chwili poczatkowej

Trajektoria w algorytmie QTO-RHC

Trajektoria w algorytmie LQ

b.

0 0.02 0.04 0.06 0.08 0.1 0.12 0.14

-160

-140

-120

-100

-80

-60

-40

-20

0

20

t [s]

x 2 [

mm

/s]

Poczatek adaptacji

Trajektoria w algorytmie QTO-RHC

Trajektoria w algorytmie LQ

Trajektoria przewidywana w chwili poczatkowej

c.

0 0.02 0.04 0.06 0.08 0.1 0.12 0.140.2

0.4

0.6

0.8

1

1.2

1.4

t [s]

x 3 [

A]

Trajektoria w algorytmie LQ Trajektoria przewidywana

w chwili poczatkowej

Trajektorira w algorytmie QTO-RHC

Poczatek adaptacji

d.

0 0.02 0.04 0.06 0.08 0.1 0.12 0.14

5.5

6

6.5

7

7.5

8

8.5

9

9.5

10

10.5

t [s]

u [V

]

Sterowanie w algorytmie LQ

Sterowanie w algorytmieQTO-RHC

Sterowanie przewidywane w chwili poczatkowej

e.

0 0.02 0.04 0.06 0.08 0.1 0.12 0.140

0