Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Chapter 5
最適レギュレータ
対 (A;B) が可制御ならば,状態フィードバック制御 u = ÄKx に
より閉ループ系 _x = (AÄBK)x の極を任意に配置することが可能
である。3章で述べた極配置法は,この性質を利用して閉ループ系
が指定した極をもつように状態フィードバックゲイン K を定める
方法であった。本章では,ある評価関数 J を最小化するという意味
で最適な状態フィードバックゲイン K の設計法について議論する。
5.1 準備
5.1.1 行列の正定性
最初に,行列の正定性を定義しておこう。
定義 5. 1 (正定性)
対称行列 Q = QT 2 RnÇn が非零な任意のベクトル x 2 Rn に対して
xTQx > 0 (5:1)
を満足するとき 正定行列 (positive deånite matrix) と呼び,Q > 0 と記述する。
式 (5:1) に対応して xTQx ï 0 が成り立つ場合を 準正定 (positive semi-deånite),xTQx î 0
の場合を 準負定 (negative semi-deånite),xTQx < 0 の場合を 負定 (negative deånite) と呼
び,それぞれ Q ï 0; Q î 0; Q < 0 と記述する。
対称行列の固有値 ïi は実数であり,その固有ベクトル vi は互いに直交する。すなわち,
vTi vj =
8<: 1 (i = j)
0 (i 6= j)
{ 5.1 {
{ 5.2 { CHAPTER 5. 最適レギュレータ
また,適当な正則変換により対角化が可能である。これらより,対称行列 Q が (準)正定
であるための必要十分条件は,その固有値がすべて正 (非負)であることを示すことができ
る。このことは,正定行列は正則であることを意味する。
正定性に対するもう一つの必要十分条件を与えよう。行列 Q の第 i1; i2;ÅÅÅ; ir行ならび
に第 j1; j2;ÅÅÅ; jr列の要素からなる r次正方行列の行列式を (r次)小行列式 (minor) と呼ぶ。
特に,i1 = j1; i2 = j2; ÅÅÅ; ir = jr のとき (r次)主小行列式 (principal minor),i1 = j1 =
1; i2 = j2 = 2; ÅÅÅ; ir = jr = r のとき (r次)主座小行列式 (leading principal minor) と呼
ぶ。このとき,行列 Q が正定であるための必要十分条件は,すべての主座小行列式が正で
あることである。また準正定であるための必要十分条件は,すべての主小行列式が非負で
あることである。
準正定行列 Q 2 RnÇn のランクを m とするとき,Q = CTC となる行フルランク行列
C 2 RmÇn が存在する。
例題 5. 1
次に示す対称行列が正定あるいは準正定であるための条件を調べてみよう。
(1) Q =
24 1 0
0 q
35 ; (2) Q =
24 1 Ä2
Ä2 q
35(1) 対角行列の対角要素は固有値そのものであることから,q > 0 であれば正
定,q ï 0 であれば準正定,q < 0 であればどちらでもない。
(2) 1次の主座小行列式は正 (1) であり,2次の主座行列式を計算すると qÄ 4
となる。したがって,q > 4 のとき行列 Q は正定となる。また,Q が2
次であることから 2次の主小行列式と主座小行列式は等しいので,q ï 4
のとき行列 Q は準正定となる。なお,行列 Q の固有値からも同様の結
果が得られる。ここで,Q の要素の符号と正定性には関連がないことに
注意してほしい。
5.1.2 リアプノフ方程式
行列 A 2 RnÇn; Q = QT 2 RnÇn に対して
ATX +XA = ÄQ (5:2)
を リアプノフ方程式 (Lyapunov equation) と呼ぶ。この方程式の解 X に対して次に示す
定理が成り立つ。
定理 5. 1
5.2. 最適レギュレータ問題とその解 { 5.3 {
(1) A が漸近安定で Q が正定 (準正定,準負定,負定) であれば,リアプノ
フ方程式 (5:2) の解 X は正定 (準正定,準負定,負定) である。
(2) Q が準正定の場合,Q = CTC に対して対 (C;A) が可観測であれば解 X
は正定である。
(3) Q が正 (負)定であり,解 X が正 (負)定であれば A は漸近安定である。
(4) Q = CTC に対して対 (C;A) が可検出であり,解 X が準正定であれば A
は漸近安定である。
5.2 最適レギュレータ問題とその解
5.2.1 最適レギュレータ問題
状態方程式
_x = Ax+Bu (5:3)
に対して,次に示す 評価関数 (cost function) J を最小にする操作量 u を求める問題を
最適レギュレータ問題 (optimal regulator problem),その解を 最適レギュレータ (optimal
regulator) と呼ぶ。
J =Z 1
0(xTQx+ uTRu) dt (5:4)
ここで,対 (A;B)は可制御であるとし,行列 Q 2 RnÇn は準正定,R 2 RmÇm は正定行
列とする。評価関数 (5:4) における被積分関数は,行列の正定性の定義より,任意の時刻 t
において非負のスカラ値をもつので J ï 0 であることに注意してほしい。また,評価関数
J は,状態量 x と操作量 u の関数として与えられているが,状態量が操作量の関数である
ことから,評価関数 J は操作量 u の関数となる (厳密には操作量 u と初期状態 x(0) = x0
の関数である)。
最適レギュレータを理解するためには,上述の評価関数 J の意味を知ることが重要であ
る。その目的で,Q を対角行列
Q = diagfq1; q2;ÅÅÅ; qng
と選定したとしようy。Q ï 0 であることから qi ï 0 でなければならない。このとき,xiを状態量 x の第 i要素とすると
xTQx =nXi=1
qix2i (t)
y行列 Q は準正定条件を満足すればよいので,必ずしも対角行列である必要はないが,通常の設計におい
ては対角行列と選ぶ場合が多い。行列 R についても同様である。
{ 5.4 { CHAPTER 5. 最適レギュレータ
であることから,Z 1
0xTQx dt は状態量 x(t) の総2乗面積を表していることがわかる (図
5:1 参照)。初期状態 x(0) から原点への移動を議論する制御問題をレギュレータ問題と呼ぶ
ことは 3章でも述べたが,2乗面積はそのときの応答を評価する際の一つの指標となり得
る。したがって,評価関数 J の第1項目は応答性に関連したものであり,その値が小さい
方がより応答性が高いと考えてよい。
Time[sec]
x(t) x T Qx dt
図 5.1 応答性に関する評価指標
ところで,一般に高い応答性を要求した場合,より多くの操作量が必要となる。このこ
とは,重量のある物体を移動させるときに,速く移動させようとすればするほど,必要と
する操作量が大きくなることからも推測される。通常,制御対象には駆動のためのアクチュ
エータが取り付けられているが,それが制御対象に対して与えることのできる操作量は有
界である。そのため,操作量のことも考慮にいれた設計がより合理的な設計といえよう。
評価関数 J 中の第 1項目に対する議論と同様に考えると,第2項目は 2乗面積を用いて操
作量の大きさを表現したものであることがわかる。もちろんその値は小さい方が好ましい。
なお,評価関数 J において行列 R を正定としていることに注意してほしい。もし,次式
に示すように
uTRu = [u1 u2]
24 r1 0
0 0
3524 u1
u2
35 = r1u21
行列 R が準正定であるならば,評価関数 J に考慮されない操作量 (上式では u2)が存在す
ることになる。この場合,その操作量が非常に大きな値を取ったとしてもそれは評価関数
J には反映されない。行列 R の正定性はこのようなことを生じないようにするために必要
な条件である。
前述のとおり投与する操作量と応答性との間にはトレードオフの関係があるが,このこ
とは行列 Q と R の比率により与えることが可能である。たとえば,1入力系の場合,行列
R はスカラ r となり,評価関数 J は
5.2. 最適レギュレータ問題とその解 { 5.5 {
J =Z 1
0(xTQx+ ru2) dt
で与えられるが,行列 Q に対して r を小さくすると多くの操作量を使用でき,逆に大き
くすると操作量が制限されることを意味する。一般に,前者の方が高い応答性を期待でき
る。以下では Q; R を重み行列と呼ぶが,最適レギュレータの設計においては,これらを
どの様に設定するかが鍵となる。
5.2.2 最適レギュレータ問題の解
前項の最適レギュレータ問題に対して,次式に示す Riccati方程式 (Riccati equation) を
導入する。
ATX +XAÄXBRÄ1BTX +Q = 0 (5:5)
この方程式の解法については次節で述べることにして,この方程式に対する (準)正定解 X
が存在するとして,それを利用して本問題に対する解を求めてみよう。
ddt(x(t)TXx(t)) = _xTXx+ xTX _x
= (Ax+Bu)TXx+ xTX(Ax+Bu)
= xT (ATX +XA)x+ uTBTXx+ xTXBu
= Ä(xTQx+ uTRu) + (u+RÄ1BTXx)TR(u+RÄ1BTXx)
2番目の等式は状態方程式 (5:3) を代入することによって,また 4番目の等式は Riccati方
程式 (5:5) を利用することによって得られる。
上式の両辺を区間 [0;1) で積分すると,
J = Ä xT (t)Xx(t)ååå10
+Z 1
0(u+RÄ1BTXx)TR(u+RÄ1BTXx) dt
を得る。行列R が正定であることから,
u = ÄRÄ1BTXx (5:6)
と選ぶことが評価関数 J の第2項目の積分を最小にする操作量 u の与え方であることがわ
かる。また,後述するように式 (5:6) で制御を行った閉ループ系
_x = (AÄBRÄ1BTX)x
が漸近安定 ( limt!1
x(t) = 0) であることを示すことができる。したがって,評価関数 J の最
小値は
{ 5.6 { CHAPTER 5. 最適レギュレータ
Jmin = xT (0)Xx(0) (5:7)
で与えられる。ここで,問題の設定は状態フィードバック制御という形態を前提としてい
ないのに対して,結果として得られる最適操作量 u はゲイン K が
K = RÄ1BTX (5:8)
である状態フィードバック (u = ÄKx) の構造をもつことに注意してほしい。
例題 5. 2
次に示す最適レギュレータ問題を考える。
系 : _x = ax+ bu (b 6= 0)
評価関数 : J =Z 1
0(x2 + ru2)dt (r > 0)
本問題に対する Riccati方程式は
X2 Ä 2ar
b2 X Är
b2 = 0
で与えられるので,その正定解は
X =r
b2 (a+
sa2 +
b2
r)
であり,状態フィードバックゲイン k は
k =1
b(a+
sa2 +
b2
r)
で与えられる。このとき閉ループ系は
_x = Äsa2 +
b2
rx
となる。前述のとおり,操作量に対する重み r を小さくするということは,多くの操作量
が使用可能であることを意味するが,それに伴ってフィードバックゲイン k は大きくなり,
閉ループ極はより安定側に向かうことがわかる。
例題 5. 3
次に示す最適レギュレータ問題を考える。
5.2. 最適レギュレータ問題とその解 { 5.7 {
系 : _x =
24 0 1
0 0
35x+
24 0
1
35u 評価関数 : J =
Z 10
0@xT 24 1 0
0 q
35x+ ru2
1Adt (q ï 0; r > 0)
Riccati方程式の解を
X =
24 x1 x2
x2 x3
35としたとき,本問題に対する Riccati方程式は24 0 0
1 0
3524 x1 x2
x2 x3
35+
24 x1 x2
x2 x3
3524 0 1
0 0
35Ä24 x1 x2
x2 x3
3524 0
1
35 1rh
0 1i 24 x1 x2
x2 x3
35+
24 1 0
0 q
35 = 0
で与えられる。これより,
x22 = r; x1 =
1
rx2x3;
1
rx2
3 = 2x2 + q
を得る。上式を解くことにより正定解 X は
X =
24 q2pr + q
prp
rprq
2pr + q
35となり,状態フィードバックゲイン k は
k =1pr
[1q
2pr + q]
で与えられる。また,閉ループ系は
_x =
264 0 1
Ä 1prÄq
2 + qr
375xで与えられる。
これに対して操作量に対する重み r を変化させたときの閉ループ極の軌跡を描いたのが図
5:2 である。なお,q = 0:1 とした。r が大きい値をもつときには閉ループ極の位置は原点
近傍 (開ループ極) にあり,逆に r を十分小さくすると一つの実根は Ä1 へ,もう一つは
Ä1=pq = Ä3:16 へ漸近していくことがわかる。これについては後の節で議論する。
{ 5.8 { CHAPTER 5. 最適レギュレータ
-6 -4 -2 0
-2
0
2
Real
-3.16
r ∞r 0 r 0
Imag.
図 5.2 操作量の重みに関する閉ループ極の軌跡
5.3 Riccati方程式の解法
対称行列 Q;R 2 RnÇn に対して,次に示す Riccati方程式を考える。
ATX +XAÄXRX +Q = 0 (5:9)
これに対応して,次式で定義される ハミルトン行列 (Hamilton matrix) を導入する。
H =
24 A ÄRÄQ ÄAT
35 (5:10)
このとき以下に示す定理が成り立つ (なお,証明は章末を参照)。
定理 5. 2
ハミルトン行列 (以下,H行列) は虚軸に対称な固有値をもつ。
これより,H行列が虚軸上に固有値をもたなければ,n個の漸近安定な固有値を必ずも
つ。これらの固有値に対する固有ベクトルからなる行列 V 2 C2nÇn を次式のようにブロッ
ク行列表現する。
V =
24 X1
X2
35 (5:11)
ここで X1; X2 2 CnÇn である。
定理 5. 3
H行列が虚軸上に固有値をもたず,式 (5:11) における X1 が正則であるとする。このとき,
5.3. RICCATI方程式の解法 { 5.9 {
X = X2XÄ11 (5:12)
は AÄRX を安定化する Riccati方程式 (5:9) の唯一解である。この解を 安定化解 (stabilizing
solution) と呼び,X = RicfHg と表記する。
ところで,上の定理が対象としている Riccati方程式 (5:9) は,Q; R の対称性のみを前
提としていることに注意してほしいy。前節で述べた最適レギュレータ問題に対する Riccati
方程式 (5:5) では,H行列は Q ï 0; R > 0 に対して
H =
24 A ÄBRÄ1BT
ÄQ ÄAT
35 (5:13)
で与えられる。この場合,以下の定理が成り立つ。
定理 5. 4
対 (A;B) が可制御であり (厳密には可安定でよい),Q = CTC に対して対 (C;A) が可検
出であれば H行列 (5:13) は虚軸上に固有値をもたない。
Q = CTC のとき,評価関数 J は
J =Z 1
0(xTCTCx+ uTRu)dt
=Z 1
0(yT y + uTRu)dt
となり,行列 C を用いた観測量 y = Cx を評価関数として組み込んだ最適レギュレータ問
題と考えることができる。対 (C;A) の可検出性は系のもつ不安定なモードが評価関数の中
で確実に評価されることを保証するためのものである (次に示す例題参照)。Q が正定であ
れば可検出性は満たされる。
例題 5. 4
例題 5: 2 の系に対して
J =Z 1
0u2 dt
を最小化する問題の解は u = 0 であり,評価関数の最小値は Jmin = 0 である。しかし,その
ときの閉ループ系 ( _x = ax) は (a > 0 であるならば)不安定である。これは対 (C;A) = (0; a)
が可検出ではなく,不安定な状態量が評価関数中に含まれていないことが原因である。
定理 5. 5
対 (A;B) が可制御であれば行列 X1 は正則である。
y次章で述べる H1 制御問題では,必ずしもQ; R の正定 (あるいは準正定)性が保証されるとは限らない
{ 5.10 { CHAPTER 5. 最適レギュレータ
以上から,最適レギュレータ問題において,対 (A;B) の可制御性ならびに Q = CTC に
対する対 (C;A) の可検出性が満たされていれば,X = X2XÄ11 は AÄ BRÄ1BTX を安定
化する Riccati方程式の唯一解であり,定理 5: 3 の証明から,そのときの閉ループ極は H
行列の漸近安定な固有値と一致することがいえる。また,Riccati方程式を変形すると
(AÄBRÄ1BTX)TX +X(AÄBRÄ1BTX) = ÄCTC ÄXBRÄ1BTX
が得られるが,AÄBRÄ1BTX の漸近安定性と CTC の準正定性から,定理5:1 より,解
X が準正定であることがわかる。もし,対 (C;A) が可観測であれば解 X は正定となる。
例題 5. 5
例題 5: 2 に対する Riccati方程式の解を H行列を利用して求めてみよう。この場合の H
行列は
H =
24 a Ä1r b
2
Ä1 Äa
35で与えられる。この行列に対する固有値を求めると,Ü
ra2 + b2
r であるので,漸近安定な
固有値は Ära2 + b2
r である。これは例題 5: 2 の閉ループ極と一致する。また,この固有
値に対する固有ベクトルの一つは
V =
264 aÄra2 + b2r
1
375で与えられるので,式 (5:12) ならびに式 (5:8) よりフィードバックゲイン k は
k =1b
(a+
sa2 +
b2
r)
となる。これは,例題5: 2 の結果と一致する。
例題 5. 6
柔軟ビーム振動系に対して最適レギュレータを設計する。
設計のスタートでは重み Q; r の決め手となる情報がないために,とりあえず Q = I; r =
1 と選んでみる。このとき状態フィードバックゲイン k は
k = [2:288Ç 10Ä4; 0:09058; 3:794Ç 10Ä3; 0:1849; 7:555Ç 10Ä3; 0:07483 ]
で与えられるが,その大きさから判断して十分な制振効果が得られるとは思えない。そこ
で,減衰力を高めるという趣旨から各振動モードの速度に相当する状態量に対する重みを
5.3. RICCATI方程式の解法 { 5.11 {
大きくして,さらに操作量を十分に出せるようにそれに対する重みを小さく選定する。具
体的には,
Q = diagf1; 100; 1; 100; 1; 100 g; r = 0:1
とする。これに対して得られる状態フィードバックゲイン k は
k = [Ä20:02; 26:40; 160:0; 28:91; 476:4; 25:25 ]
であり,このときの閉ループ極は
fÄ4:059Ü 13:33j; Ä5:095Ü 52:87; Ä3:242Ü 112:1j gとなる。極の実部から判断して,閉ループ系は十分な制振性能をもつと期待できる。実際,
閉ループ系のインパルス応答を図 5:3(破線が開ループ特性) に示すが,良好な性能をもつ
ことがわかる。
0 1 2 3Time[sec]
Amp.
図 5.3 最適レギュレータを用いた柔軟ビーム振動系の制御結果 (インパルス応答)
次に,1次振動モードに対応した重みのみを大きく設定してみる。つまり,
Q = diagf1; 100; 1; 1; 1; 1 g; r = 0:1
これに対して得られる状態フィードバックゲイン k は
k = [Ä0:9811; 26:59; 10:44; 1:464; 5:288; 0:7108 ]
であり,このときの閉ループ極は
fÄ4:063Ü 13:33j; Ä0:6624Ü 53:12j; Ä0:7448Ü 112:1j gとなる。1次振動モードの特性だけが改善されていることがわかる (図5:4 参照)。このよう
に,重みの選び方で希望する特定の振動モードの制御も可能となる。
{ 5.12 { CHAPTER 5. 最適レギュレータ
10 1 2
Freq.[rad/sec]10 10 3
20
0
-20
-40
-60
Gain[dB]
図 5.4 1振動モードのみの制振 (BODE線図)
5.4 指定した領域内に閉ループ極をもつ最適レギュレータ
Q = 0 とした Riccati方程式
ATX +XAÄXBRÄ1BTX = 0 (5:14)
を考える。これに対する H行列は次式に示すようにブロック上三角行列となる。
H =
24 A ÄBRÄ1BT
0 ÄAT
35この行列の固有値は,システム行列 A の固有値とそれを虚軸に対して対称な位置に移動さ
せた固有値 (行列 ÄAT の固有値) の和であるので,システム行列 A が虚軸上に固有値を
もたなければ H行列は虚軸上に固有値をもたない。さらに,対 (A;B) が可制御であれば定
理 5: 5 より X1 は正則であり,X = X2XÄ11 は閉ループ系 _x = (AÄBRÄ1BTX)x を漸近
安定とする Riccati方程式の解である。このときの閉ループ極は,(システム行列 A の漸近
安定な固有値)+(不安定な固有値を虚軸に対称に安定側に折り返した固有値) からなる。な
お,この議論は,行列 R の選定には無関係であるので R = I としてよい。
いま,上式の H行列内の行列 A を正の実数 ãを用いて A+ãIn で置き換えたとしよう。
H =
24 A+ãIn ÄBBT
0 Ä(A+ãIn)T
35 (5:15)
ただし,A+ãIn が虚軸上に固有値をもたないように ãが選定されているものとする。対
(A;B) が可制御であれば,対 (A+ãIn;B) も可制御であることは容易に示せる。
5.4. 指定した領域内に閉ループ極をもつ最適レギュレータ { 5.13 {
この操作は,ちょうど虚軸が不安定側に ãだけシフトしたことと等価であるため,閉
ループ極の位置は Äãよりも小さい実部をもつ極はそのままで,大きい実部をもつものは
(Äã; 0) を通る虚軸に平行な軸に対して折り返した位置に配置される。その結果,得られる
閉ループ極の実部が Äã未満であることが保証される。また,ãを適切に選定することに
より,図 5:5 に示した斜線の領域に閉ループ極を配置することも可能となる。
0
Rea l
Imag .
-α
図 5.5 希望する閉ループ極の領域
3章で述べた極配置法は極の位置を直接指定する設計法であるので,もちろん斜線部内に
極を指定することは可能であるが,設計の際にすべての極の位置を明確に指定する必要が
ある。しかし,実際の設計においては,位置というよりはどの領域に極を配置したいのか
が重要になる場合が多い。その意味では,このように領域を設計する手法は有効であると
いえる。
例題 5. 7
次式の 3次系を考える。
_x =
2664 Ä10 0 0
0 0 1
0 Ä26 Ä2
3775x+
2664 1
0
1
3775uこの系は Ä10; Ä1Ü 5j の地点に極をもつので,漸近安定ではあるが振動的な応答を示す。
いま ã= 3 としよう。このようにすることで,Ä10 の極はそのままで,残る 1対の共役複
素極が Ä3 を通る虚軸に平行な軸に対して折り返された地点,すなわち Ä5Ü 5j に移動す
るので,振動的な応答を抑制することができるはずである。
上述の系に対して ã= 3 としたときの式 (5:15) の H行列は
{ 5.14 { CHAPTER 5. 最適レギュレータ
H =
266666666664
Ä7 0 0 Ä1 0 Ä1
0 3 1 0 0 0
0 Ä26 1 Ä1 0 Ä1
0 0 0 7 0 0
0 0 0 0 Ä3 26
0 0 0 0 Ä1 Ä1
377777777775これに対する漸近安定な固有値は Ä7; Ä2 Ü 5j であり,その固有ベクトルから得られる
Riccati方程式の解 X は
X =
2664 0 0 0
0 304 24
0 24 8
3775となる。このときの状態フィードバックゲイン k は
k = [0 24 8]
であり,閉ループ極は Ä10; Ä5Ü 5j となる。これは希望した結果である。
0 2 4-1
0
1
2
Time[sec]
図 5.6 初期値応答
図 5:6 に初期値応答を示すが,開ループ系で見られる振動 (破線) が状態フィードバック制
御により制振されていることがわかる。
本節では,虚軸をシフトさせる設計法について紹介したが,他の指定領域内に極を配置
するレギュレータについての議論も行われている。これらの詳細については脚注の文献を
参照してもらいたいy。
y参考文献:たとえば,川崎,示村:指定領域に極を配置する状態フィードバック則の設計法,計測自動制御学
5.5. 最適レギュレータのもつ性質 { 5.15 {
5.5 最適レギュレータのもつ性質
5.5.1 円条件
Riccati方程式 (5:5) を次式のように変形する。
X(sI ÄA) + (ÄsI ÄA)TX +XBRÄ1BTX ÄQ = 0
上式に対して左から BT (ÄsI Ä A)ÄT,右から (sI ÄA)Ä1B を掛けた後,式を整理すると
次式が得られる。
(I +K(ÄsI ÄA)Ä1B)TR(I +K(sI ÄA)Ä1B) =
R +BT (ÄsI ÄA)ÄTQ(sI ÄA)Ä1B(5:16)
ここで,式 (5:8) (K = RÄ1BTX) の関係を利用している。右辺の第2項が準正定であるこ
とから
(I +K(ÄsI ÄA)Ä1B)TR(I +K(sI ÄA)Ä1B) ï R (5:17)
が成り立つ。
もし,1入力系 (B = b;K = k) であるならば
j1 + k(j!I ÄA)Ä1bj ï 1 (5:18)
の関係が得られる。
u
-x = Ax + bu.
k
x
図 5.7 状態フィードバック制御系
上式の意味を検討するために,図 5:7 に示すフィードバック制御系を考える。これは状態
方程式 _x = Ax+ bu に対して u = Äkx という状態フィードバックを施した制御系である。
このとき,式 (5:18) 中の k(j!I Ä A)Ä1b は一巡伝達関数の周波数応答 L(j!) を意味して
いることがわかる。式 (5:18) は一巡伝達関数 L に対するベクトル軌跡を描いたときにそれ
会論文集,15,4,pp.451/457(1979),川崎,示村:虚数部を変化させて指定領域に固有値を配置する状態フィード
バック則の設計法,計測自動制御学会論文集,16,1,pp.14/20(1980),川崎,示村:指定領域内に特性根を配置する
線形レギュレータ問題の重み係数の決定法,計測自動制御学会論文集,17,3,pp.335/342(1981)
{ 5.16 { CHAPTER 5. 最適レギュレータ
が (Ä1; 0) を中心とする半径 1 の円内に入らないことを意味している (図 5:8 参照)。この
条件を 円条件 (circle condition) と呼ぶ。
(-1+j0)
L(jω)L(jω)1+
図 5.8 円条件
この円条件より,状態フィードバックゲインを ã倍した ãk を用いて閉ループ系を構成
したとき,1=2 < ã<1 に対して一巡伝達関数 ãL が (Ä1; 0) を回る数が変わらないこと
がわかる。したがって,ナイキストの定理より,閉ループ系が漸近安定であることがいえ
る。このことは,最適レギュレータはゲイン余裕が増加側で 1,減少側で少なくとも 1=2
あることを意味している。また,(Ä1; 0) を中心とする単位円と原点を中心とする単位円の
交点が Ü60[deg] であることから,ナイキストの定理より,少なくとも位相余裕が Ü60[deg]
あることがわかる。これらはいずれも最適レギュレータがもつ重要な性質である。
5.5.2 低感度特性
前述した一巡伝達関数 L(= k(sIÄA)Ä1b) を用いた次式の伝達関数を感度関数 (sensitivity
function) と呼ぶ。
S(s) =1
1 + L
感度の意味を明らかにするために,図 5:9 の制御系を考える。
この制御系に対して (図に示すように)開ループ伝達関数 G(s) が G(s) + ÅG(s) の摂動を
受けたとしよう。これに対して,目標値 r から観測量 y までの閉ループ伝達関数 T (s) が
その摂動の影響を受けて T (s) + ÅT (s) となったとする。このとき簡単な代数演算から,
5.5. 最適レギュレータのもつ性質 { 5.17 {
K(s) G(s)r y+
-
ΔG(s)
+
+
図 5.9 感度関数
ÅT (s)
T (s) + ÅT (s)= S(s)
ÅG(s)
G(s) + ÅG(s)
の関係を得ることができる。上式より,開ループ系と閉ループ系の摂動の影響の比率を表
しているのが感度関数であることがわかる。したがって,感度関数 S(s) のゲインが 1 よ
りも小さいということは,開ループ伝達関数 G(s) に対する摂動の影響が閉ループを構成
することによって必ず低減できる (厳密には悪化しない) ことを意味する。式 (5:18) は,最
適レギュレータ系がこの意味で低感度特性をもつことを示している。
5.5.3 閉ループ系の根軌跡
ところで,1入力系に対して,式 (5:16) は
(1 + k(ÄsI ÄA)Ä1b)(1 + k(sI ÄA)Ä1b) =
1 + 1r b
T (ÄsI ÄA)ÄTQ(sI ÄA)Ä1b
となる。ここで,開ループ系の特性多項式を ûop(s) = jsI ÄAj,最適レギュレータによる
閉ループ系のそれを ûcl(s) = jsI ÄA+ bkj とすると,
(1 + k(sI ÄA)Ä1b) = j1 + k(sI ÄA)Ä1bj= jI + bk(sI ÄA)Ä1j= jsI ÄA+ bkjj(sI ÄA)Ä1j= ûcl(s)=ûop(s)
の関係y を利用して,両辺に ûop(s)ûop(Äs) を掛けると
y2番目の等式の導出には det(I +AB) = det(I +BA) の関係を利用している
{ 5.18 { CHAPTER 5. 最適レギュレータ
ûcl(s)ûcl(Äs) = ûop(s)ûop(Äs) +1
rbT adj(ÄsI ÄAT )Q adj(sI ÄA)b
を得る。上式の両辺は s の偶数べきからなる 2n次多項式であり,虚軸に対称な根をもつ。
そのうちの左半平面内にある根が閉ループ極となる。この閉ループ極が操作量に対する重
み r によってどの様に変化するのかを調べてみる。まず,r が十分大きい場合には
ûcl(s)ûcl(Äs) = ûop(s)ûop(Äs)
であるので,開ループ系の漸近安定な極はそのままで不安定な極は虚軸に対して安定側に折
り返した地点に配置される。一方,rが十分小さい場合には,bT adj(ÄsIÄAT )Q adj(sIÄA)b
を 2m次多項式としたとき,m個はその漸近安定な根に,残りの nÄm個は Butterworth
配置と呼ばれる次式の漸近線に沿って無限遠点に向かう (図 5:10 参照)。
0
n-m=1
θ=0
0
n-m=2
θ=π/4
0
n-m=3
θ=0
θ=π/3
図 5.10 Butterworth配置
í=kô
2(nÄm)
8<: k = Ü1; Ü3;ÅÅÅ; (nÄm)が偶数
k = 0; Ü2;ÅÅÅ; (nÄm)が奇数(5:19)
たとえば,例題 5: 3 の場合,
bT adj(ÄsI ÄAT )Q adj(sI ÄA)b = 1Ä qs2
であるので,r を十分小さくしたときに一つの閉ループ極は Ä1=pq = Ä3:16 に漸近し,残
る一つの極は実軸上を Ä1 に向かうことがわかる。
例題 5. 8
倒立振子系に対して最適レギュレータによる閉ループ系の根軌跡について検討する。
倒立振子系の開ループ極は Äê; Üpp1g; 0 であるので,操作量に対する重み r を大きく
とるとそれに対する閉ループ極は Äê; Äpp1g(2重根); 原点近傍 となる。一方,状態量に
対する重み Q を
5.5. 最適レギュレータのもつ性質 { 5.19 {
Q =
2666664q1 0 0 0
0 q2 0 0
0 0 q3 0
0 0 0 q4
3777775としたとき,bT adj(ÄsI ÄAT )Q adj(sI ÄA)b = 0 を計算すると
Ä (q3 Ä p21q4)s6 + (q1 + 2q3p1g + p2
1q2)s4 Ä p1g(2q1 + q3p1g)s2 + q1p21g
2 = 0 (5:20)
となり,3つの漸近安定な根をもつことがわかる。したがって,操作量に対する重みを小さ
くしていくことで 3つの閉ループ極はこれらの根に漸近し,残る一つは実軸上を Ä1 に
向かう。もし,速度に対する重みを 0,すなわち q3 = q4 = 0 とすると式 (5:20) は
s4 Ä 2q1p1g
q1 + p21q2
s2 +q1p
21g
2
q1 + p21q2
= 0
となり,次式に示す 2つの漸近安定な根をもつことになる。
Äpp1g
(1 + ñQ2)1=4 exp(Üj tanÄ1 ñQ=2)
ここで, ñQ = p1
qq2=q1。
これより,q2 に対して q1 を大きく選ぶことにより,操作量に対する重みを小さくしたとき
に漸近する根の安定度を高めることができることがわかる。ただし,その上限値はpp1g
であり,これは開ループ極の一つと一致する。
-400 -200 0-200
0
200
Real-5 0
-4
-2
0
2
Real
4
Imag. Imag.
図 5.11 倒立振子系に対する最適レギュレータ系の極の軌跡
具体例として q1 = 100; q2 = 1; q3 = q4 = 0 と選んで操作量に対する重み r に対する閉
ループ極の軌跡を描いたのが図 5:11 である。また,r = 100; 1; 0:01 に対して最適レギュ
{ 5.20 { CHAPTER 5. 最適レギュレータ
レータを設計し,このときの初期値応答を描いたのが図 5:12 である。r が小さくなるのに
ともない応答性が改善されていることがわかる。一方,図 5:13 はそのときの操作量を描い
たものであるが,制御のために必要な操作量が r の減少に対して増大している。
0 1 2-0.05
0
0.05
0.1
0.15
0 1 2-0.2
-0.1
0
0.1
Time[sec] Time[sec]
r=100
10.01
r=1001
0.01Cart[m] Pendulum[rad]
図 5.12 振子系の初期値応答
0 1 2-10
-5
0
Time[sec]
r=100
10.01 Input[V]
図 5.13 操作量
5.6 LQGレギュレータ
前章では,全状態観測器のオブザーバゲイン H の設計において極配置法を利用したが,
本章で述べた最適レギュレータ法により設計することもできる。具体的には,適切に選定
した重み Qo ï 0; Ro > 0 に対して,Riccati方程式
AY + Y AT Ä Y CTRÄ1o CY +Qo = 0 (5:21)
5.7. 積分型最適レギュレータ { 5.21 {
を解いて得られる準正定解 Y ï 0 を用いて H = RÄ1o CY とすればよい。最適レギュレー
タを設計する際の Riccati方程式と比較すると
A! AT ; B ! CT
となっていることに注意してほしい。
ところで,いま対象としている系が次式に示すように何らかの外乱 (雑音)を受けている
ものとしよう。
_x = Ax+ v
y = Cx+ w
ここで,v; w は平均 0 のガウス性白色雑音であり,その共分散行列
V = E[vvT ]; W = E[wwT ]
が既知であるとする。上式中 E[Å] は期待値を意味している。このとき,式 (5:21) において
Q = V; R = W と選定して設計したオブザーバゲイン H を用いて構成した全状態観測器
は,推定誤差 (e = xÄ x̂) の2乗平均値 J = E[eTe] を最小にするという意味で最適な推定
器となる。このときの状態観測器を特に Kalmanフィルタ (Kalman ålter) と呼び,最適レ
ギュレータと組み合わせた制御器を LQGレギュレータ (LQG regulator) と呼ぶ。ここで,
LQ は Linear Quadratic,G は Gaussian を意味している。LQGレギュレータを設計する
ためには,独立な 2本の Riccati方程式を解けばよいことに注意してほしい。
ところで,最適レギュレータの場合,操作量が確実に評価されるために操作量に対する
重みの正定性が必要であった。Kalmanフィルタの場合,これは観測量 y すべてが独立な
外乱 w によって影響を受けているという立場に対応する。もし,外乱の影響を受けない観
測量があれば,非常に高速な推定が可能となり,対応するオブザーバゲインが非常に大き
くなる。
5.7 積分型最適レギュレータ
最後に,単位ステップ入力に定常偏差なく追従する最適レギュレータ系の構成を考える。
この場合,t!1 で系の出力が目標値に追従したとすると,それに必要な操作量も非零の
定数となる。したがって,これまでの評価関数をそのまま使用したのでは,その値が無限
大となる。そこで,ここでは,偏差系を構成してそれに対する最適レギュレータの設計を
行う。なお,議論を容易にする目的で,次式に示す 1入出力系を対象とする。
_x = Ax+ bu
y = cx
いま,t!1 で x = xs; u = us であり,y = 1 であるとしよう。このとき
{ 5.22 { CHAPTER 5. 最適レギュレータ
24 A b
c 0
3524 xsus
35 =
24 0
1
35より,
24 xsus
35 =
24 A b
c 0
35Ä1 24 0
1
35 (5:22)
を得る。ここで,3章で述べたように,単位ステップ目標入力に対してサーボ系を構成でき
る条件が行列 24 A b
c 0
35 (5:23)
が正則であることなので,この条件が満足されていることが前提であることに注意してほ
しい。
式 (5:22) に対して,次式のように偏差を定義する。
éx = xÄ xs; éu = uÄ us
v = _u として é_x; é_u を計算してまとめると
_xe =
24 A b
0 0
35xe +
24 0
1
35 vy Ä 1 = [c 0]xe
(5:24)
ここで,xe = [éx éu]T。拡大系 (5:24) は,対象としてる系が可制御であり,式 (5:23) の行
列が正則であるならば,可制御であることを示すことができる。したがって,Q ï 0; r > 0
に対して
Je =Z 1
0(xTeQxe + rv2)dt
を最小にする解が存在し,状態フィードバック制御 v = Äkexe で与えられる。また,状態
量 xe は時間の経過とともに 0 に漸近するので,y ! 1 すなわち出力 y が目標値に追従す
ることが保証される。
ところで,このときの状態量は éx = xÄ xs ならびに éu = u Ä us であり,このままで
は利用できない。そこで,少し式変形を行う。
5.7. 積分型最適レギュレータ { 5.23 {
v = Ä[k1 k2]
24 éxéu
35= Ä[k1 k2]
0@24 x
u
35Ä 24 xsus
351A= Ä[k1 k2]
24 A b
c 0
35Ä1 24 _x
y Ä 1
35上式において
[ñk1ñk2] = [k1 k2]
24 A b
c 0
35Ä1
とおいて,両辺を積分すると
u =Z t
0v dt = Äñk1xÄ ñk2
Z t
0(y Ä 1)dt
を得る。得られた制御系に対するブロック線図は 3章の図 3:9 と一致する。
例題 5. 9
磁気浮上系に対して積分型最適レギュレータを設計してみよう。
まず式 (5:24) に対応した拡大系を求めると
_xe =
2664 0 1 0
ã 0 å
0 0 0
3775xe +
2664 0
0
1
3775 vy Ä 1 = [1 0 0]xe
を得る。これに対して,可制御行列 V を計算すると
V =
2664 0 0 å
0 å 0
1 0 0
3775であるので,det(V ) = Äå2 6= 0,したがって,拡大系は可制御である。
次に,拡大系に対して Q = I; r = 0:001 として状態フィードバックゲイン k を求めると,
k = [Ä3:918Ç 104; Ä806:3; 129:0 ]
を得る。これより,
ñk = k
24 A b
c 0
35Ä1
= [Ä806:3; Ä13:30; Ä7:716Ç 103 ]
を得る。
{ 5.24 { CHAPTER 5. 最適レギュレータ
5.8 定理の証明
5.8.1 定理 5:2
J =
"0 InÄIn 0
#に対して H = Ä(JHJÄ1)T が成り立つ。ïを H行列の固有値とする。固有値は転置や正則変換に
よって不変であるということから,
det(ïI ÄH) = det(ïI + (JHJÄ1)T ) = det(ïI +H) = 0
を得る。上式は ïが固有値であるとき Äïも固有値であることを意味している。
5.8.2 定理 5:3
As を H行列の漸近安定な固有値からなる行列であるとする。"A ÄRÄQ ÄAT
#"X1
X2
#=
"X1
X2
#As (5:25)
これより,
AX1 Ä RX2 = X1AsÄQX1 ÄATX2 = X2As
(5:26)
を得る。X1 は逆行列が存在するので X = X2XÄ11 とする。第 1式の右から XÄ1
1 を掛けることで
A ÄRX = X1AsXÄ11
となるので,A Ä RX は As と同じ固有値をもつ,すなわち漸近安定であることがいえる。また,
式 (5:26) の第 1式の左から X2XÄ11 を右から XÄ1
1 を掛けることで
XA ÄXRX = X2AsXÄ11
を得る。また,第2式の右から XÄ11 を掛けると,
ÄQÄATX = X2AsXÄ11
を得る。両式より X が Riccati方程式の解であることがいえる。
次に解が唯一であることを示そう。いま,X1; X2 という解が存在したと仮定する。
ATX1 +X1AÄX1RX1 +Q = 0ATX2 +X2AÄX2RX2 +Q = 0
第1式-第 2式を計算すると
(AÄ RX2)T (X1 ÄX2) + (X1 ÄX2)(AÄRX1) = 0
が得られるが,A Ä RX1 ならびに A Ä RX2 がともに漸近安定であることから,X1 = X2 がい
える。
5.8. 定理の証明 { 5.25 {
5.8.3 定理 5:4
H行列 (5:13) が虚軸上に固有値 (j!) をもつと仮定する。このとき,"j!In Ä A BRÄ1BT
Q j!In + AT
# "v1
v2
#= 0
となるベクトル [vT1 vT2 ]T 6= 0 が存在する。上式を分解表現すると,
(j!In ÄA)v1 +BRÄ1BT v2 = 0Qv1 + (j!In +AT )v2 = 0
(5:27)
を得る。式 (5:27) の第 1式の左から vÉ2,第2式の左から vÉ1 を掛けることで
vÉ2(j!In ÄA)v1 + vÉ2BRÄ1BT v2 = 0
vÉ1Qv1 + vÉ1(j!In + AT )v2 = 0
を得る。これより
Cv1 = 0BT v2 = 0
(5:28)
を得る。前者を式 (5:27) の第2式に代入すると,vÉ2(j!In Ä A) = 0 となるが,対 (A;B) が可制御
であることから v2 = 0 を得る。同様に後者を式 (5:27) の第 1式に代入し,対 (C;A) の可検出性か
ら v1 = 0 を得る。以上から [vT1 vT2 ]T = 0 となるが,最初の仮定に矛盾する。したがって,定理
の条件を満足するとき H行列は虚軸上に極をもたないことがいえる。
5.8.4 定理 5:5
式 (5:26) と同様の式変形を行うことで,式 (5:13)に対して
AX1 Ä BRÄ1BTX2 = X1AsÄQX1 ÄATX2 = X2As
(5:29)
を得る。いま,det(X1) = 0 と仮定する。このとき,X1v = 0 となるベクトル v 6= 0 が存在する。
式 (5:29) の第1式の左から vTXT2 ,右から v を掛け XT
2 X1 = XT1 X2 の関係が成り立つ (後述)こ
とを利用すると,
BTX2v = 0
を得る。再び式 (5:29) の第1式の右から v を掛けることで
X1Asv = 0
の関係を得るが,これは
Asv = ïv
を意味する。次に,式 (5:29) の第2式の右から v を掛けると
{ 5.26 { CHAPTER 5. 最適レギュレータ
(X2v)T (ÄïI ÄA) = 0
を得るが,対 (A;B) が可制御であることから X2v = 0 を得る。以上のことは,"X1
X2
#v = 0
を意味するが,[XT1 XT
2 ]T が固有ベクトルであることから,v = 0 でなければならない。したがっ
て,det(X1) 6= 0 が示せた。
最後に XT2 X1 = XT
1 X2 が成り立つことを示そう。式 (5:25)
HV = V AT
の左から V TJ を掛け JH が対称であることを利用すると,V T JV As が対称行列であることがい
える。また JT = ÄJ を利用することにより
V T JV As +ATs VT JV = 0
の関係を得る。ここで As が安定であることから V TJV = 0 が得られるが,これよりXT2 X1 = XT
1 X2
を示せる。
5.8. 定理の証明 { 5.27 {
演 習 問 題
5-1 磁気浮上系に対して最適レギュレータを設計しなさい。なお,重み Q; r は適当に設
定してよい。また,得られたフィードバックゲインを用いて円条件を満足しているか
どうかをベクトル軌跡を描いて確認しなさい。
5-2 例題 5:2 において a > 0 とする。このとき,例題中で求めた状態フィードバックゲイ
ンを ã倍した k̂ = ãk に対して閉ループ系 ( _x = (aÄ bk̂)x) が漸近安定となる ãの範
囲を求めなさい。
5-3 式 (5:19) を証明しなさい。
5-4 式 (5:24) が可制御であることを示しなさい。