37
Institut für Mess- und Regeltechnik Prof. M. Steiner, Prof. Dr. H. P. Geering Technische Hochschule Zürich Eidgenössische Swiss Federal Institute of Technology Ch. Roduner Die Riccati-Gleichung Inhalt: 1 Einleitung und Problemstellung 2 2 Eigenschaften der Riccati-Gleichung 4 2.1 Die Riccati-Differentialgleichung (RDE) . . . . . . . . . . . . . 4 2.2 Die algebraische Riccati-Gleichung (ARE) . . . . . . . . . . . 5 2.3 Die Konvergenz der RDE im unendlichen Zeitintervall . . 7 3 Anwendung in Optimierungsproblemen 9 4 Beweise der Theoreme 11 4.1 Sätze aus der Matrix-Theorie . . . . . . . . . . . . . . . . . . . . . 11 4.2 Sätze aus der linearen System-Theorie . . . . . . . . . . . . . . 12 4.3 Beweise der Theoreme von Abschnitt 2.1. . . . . . . . . . . . 16 4.4 Beweise der Theoreme von Abschnitt 2.2. . . . . . . . . . . . 19 4.5 Beweise der Theoreme von Abschnitt 2.3. . . . . . . . . . . . 31 Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 Institut für Mess- und Regeltechnik IMRT-Bericht Nr. 26 April 1994

Die Riccati-Gleichung4 2 Eigenschaften der Riccati-Gleichung Sofern nichts anderes vermerkt ist, gelten im ganzen Kapitel die in der Einleitung erwähn-ten Voraussetzungen für die

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

  • Institut für Mess- und RegeltechnikProf. M. Steiner, Prof. Dr. H. P. Geering

    Technische HochschuleZürich

    Eidgenössische

    Swiss Federal Institute of Technology

    Ch. Roduner

    Die Riccati-Gleichung

    Inhalt:1 Einleitung und Problemstellung 22 Eigenschaften der Riccati-Gleichung 4

    2.1 Die Riccati-Differentialgleichung (RDE) . . . . . . . . . . . . . 42.2 Die algebraische Riccati-Gleichung (ARE) . . . . . . . . . . . 52.3 Die Konvergenz der RDE im unendlichen Zeitintervall . . 7

    3 Anwendung in Optimierungsproblemen 94 Beweise der Theoreme 11

    4.1 Sätze aus der Matrix-Theorie . . . . . . . . . . . . . . . . . . . . . 114.2 Sätze aus der linearen System-Theorie . . . . . . . . . . . . . . 124.3 Beweise der Theoreme von Abschnitt 2.1. . . . . . . . . . . . 164.4 Beweise der Theoreme von Abschnitt 2.2. . . . . . . . . . . . 194.5 Beweise der Theoreme von Abschnitt 2.3. . . . . . . . . . . . 31

    Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

    Institut für Mess- und RegeltechnikIMRT-Bericht Nr. 26

    April 1994

  • Güte-ung

    Glei-s cha-

    eren-

    eel-nt

    rtrizenusge-

    ereu-

    em,eführtatrix

    ale

    nert-

    1 Einleitung und Problemstellung

    In Optimierungsprozessen für zeitkontinuierliche lineare Systeme mit quadratischemindex muß für die Berechnung der optimalen Lösung die zeitkontinuierliche Riccati-Gleichgelöst werden. Die in der vorliegenden Arbeit aufgestellten Theoreme über die Riccati-chung sollen die Existenz und die Eigenschaften der Lösung des Optimierungsproblemrakterisieren.

    Bezieht sich der Optimierungsprozeß auf ein endliches Zeitintervall [t0, t1] („endlicherHorizont“), wird die zeitvariable LösungK(t) der n × n Matrix-Riccati-Differentialgleichung(RDE)

    – (t) = ATK(t) + K(t)A + K(t)RK(t) + Q

    mit der Endbedingung

    K(t1) = F

    im entsprechenden Zeitintervall benötigt. Sie kann durch Rückwärtsintegrieren der Difftialgleichung vom Zeitpunkt t1 eindeutig berechnet werden.

    Die reellen × n SystemmatrixA des linearen Prozesses wird dabei als zeitinvariant, die rlen n × n GewichtungsmatrizenR, Q undF des quadratischen Gütekriteriums als zeitinvariaund symmetrisch vorausgesetzt. Die Gewichtungen des Zustandes,Q (im Integranden, wäh-rend des Intervalls) undF (zur Endzeitt1), sollen positiv-semidefinit sein. Die Definitheit deMatrix R, die sich aus den Gewichtungen der Stellgrößen und den System-Eingangsmazusammensetzt, hängt vom Typ des Optimierungsproblems ab und wird hier nicht vorasetzt.

    Beim Minimierungsproblem (LQ-Regulatorproblem, Kalman-Filter, H2-Reglerentwurf) istR negativ-semidefinit, beim Maximierungsproblem (Berechnung der H∞-Norm) ist R positiv-semidefinit und beim Minmax-Problem (Differentialspiele, H∞-Reglerentwurf) istR i.a. indefi-nit. In diesem Fall kannR = R1 – R2 als Subtraktion zweier beliebiger positiv-semidefinitn × n MatrizenR1 undR2 dargestellt werden (es gibt i.a. mehrere Möglichkeiten). Eine eindtige ZerlegungR= 1 – 2 ergibt sich, falls 1 und 2 orthogonal sind, d.h. 1 2 = 0 (vgl.Kapitel 4, Bemerkung 4).

    Das zeitvariable geschlossene System, d.h. das optimal geregelte System, hat dien × nSystemmatrix [A + RK(t)]. Im Minmax-Problem entspricht dies dem geschlossenen Systbei dem sowohl die minimierenden als auch die maximierenden Stellgrößen zurückgwerden. Falls nur die minimierende Stellgröße zurückgeführt wird, resultiert die Systemm[A – R2K(t)] ∈ n×n. Die Eigenschaften der RDE werden in Abschnitt 2.1 untersucht.

    Für die praktische Anwendung wird man sich vor allem für eine zeitinvariante optimLösung im unendlich langen Zeitintervall [0,∞) („unendlicher Horizont“) interessieren. Eineseparate Bestrafung des Zustandes zur (unendlichen) Endzeitt1 mit der GewichtungsmatrixFwird dann meistens weggelassen, d.h.F = 0. Dieses Optimierungsproblem hat dann eiLösung, wenn die LösungK(t) der RDE fürt → –∞ und F = 0 gegen einen stationären WeK∞ konvergiert. Die zeitinvarianten × n Matrix K∞ erfüllt dann die algebraische Riccati-Glei

    R̂ R̂ R̂ R̂ R̂ R̂

    IR

    2

  • Auf-ration

    n Vor-

    lcheTheo-für

    lltenlton-

    igechee

    s-

    ung

    chung (ARE)

    0 = ATK + KA + KRK + Q ,

    die im allgemeinen mehr als eine Lösung besitzt, da sie quadratisch ist. Der numerischewand für die Berechnung einer Lösung der ARE ist aber geringer als die Rückwärtsintegder RDE. Es wäre deshalb vorteilhaft, wenn die stationäre LösungK∞ von den restlichenLösungen der ARE unterschieden werden könnte. Von Interesse ist auch, unter welcheaussetzungen das zeitinvariante geschlossene System [A + RK∞] asymptotisch stabil ist.

    Wann das Optimierungsproblem mit unendlichem Horizont eine Lösung hat und weEigenschaften das optimal geregelte zeitinvariante System aufweist, kann anhand derreme in Abschnitt 2.2 über die ARE und in Abschnitt 2.3 über die Konvergenz der RDEt → –∞ beurteilt werden.

    Die Beweise der Theoreme aus Kapitel 2 befinden sich im 4. Kapitel. Die aufgesteTheoreme und ihre Beweisführung basieren nicht (wie oft in der Literatur) auf der HamiMatrix.

    Über die Riccati-Gleichung wurde viel veröffentlicht; es seien hier nur einige wenerwähnt. In [1], [4], [9], [12] und [13] wurden die Eigenschaften der ARE für das klassisMinimierungsproblem mitR ≤ 0 untersucht, wobei in [1] und [4] auch die RDE und ihrstationäre Lösung einbezogen wurden. In [5] und [6] können auchR ≥ 0 undQ indefinit sein.Der allgemeine Fall, in demR keine Definitheits-Voraussetzung erfüllen muß, wurde mit Aunahme von [8] erst in neuester Zeit mit dem Aufkommen der H∞-Theorie betrachtet ([2], [3],[7], [10] und [11]). Hervorzuheben ist hier [3], wo auch die RDE und ihre stationäre Lösberücksichtigt sind.

    3

  • ähn-

    rte

    unkt

    lle

    er

    von F

    r,

    2 Eigenschaften der Riccati-Gleichung

    Sofern nichts anderes vermerkt ist, gelten im ganzen Kapitel die in der Einleitung erwten Voraussetzungen für dien × n Matrizen A, R, Q und F : reell, zeitinvariant,Q = QT ≥ 0,F = FT ≥ 0 undR = RT. Für die Theoreme 2.1a, 2.2b, 3.1 und 3.2 wirdQ ≥ 0 nicht benötigt. IstQ ≤ 0 undF ≤ 0, kann die Riccati-Gleichung durch Multiplizieren mit –1 auf die gefordeForm gebracht werden. Die UngleichungK1 ≥ K2 ist immer im SinneK1 – K2 ≥ 0 zu verstehen.

    2.1 Die Riccati-Differentialgleichung (RDE)

    Für dien × n Matrix-Riccati-Differentialgleichung

    – (t) = ATK(t) + K(t)A + K(t)RK(t) + Q (2.1)

    mit der Endbedingung

    K(t1) = F (2.2)

    gelten im endlichen Zeitintervall [t0, t1] die folgenden Sätze:

    Theorem 1.1: K(t) existiert (d.h. ist endlich) im Intervall[t0, t1] genau dann, wenn R „genü-gend klein“ ist, R< 0 ∈ n×n. D.h. für R existiert ein Supremum0 ≥ 0, unterhalb welchemK(t) existiert. Für R≥ 0 besitzt die RDE einen konjugierten Punkt im Intervall[t0, t1] (d.h.K(t) divergiert).

    Dieses Theorem kann auch für die MatrizenQ oderF formuliert werden. D.h. fürQ undF exi-stieren Suprema 0 und 0, unterhalb welchenK(t) existiert. Allerdings können 0 (außer fürF = 0) bzw. 0 (außer fürQ = 0) auch indefinit sein. Die Grenzwerte0, 0 und 0 können i.a.nur iterativ berechnet werden. WennR ≤ 0 ist (Minimierungsproblem), istK(t) in jedem endli-chen Intervall definiert. Die folgenden Sätze gelten, falls die RDE keinen konjugierten Pim Intervall [t0, t1] besitzt.

    Theorem 1.2:a) Existiert die Lösung K(t), so ist sie reell, symmetrisch und positiv-semidefinit für a

    t ∈ [t0, t1], K(t) = K T(t) ≥ 0 ∀ t ∈ [t0, t1].

    b) K(t) ist für eine beliebige Zeit t∈ [t0, t1) genau dann singulär, wenn ein nicht beobachtbarZustand des Systems[A, Q] im NullraumN { F} der Matrix F liegt.Ist die Schnittmenge des nicht beobachtbaren Zustandsraums mit dem NullraumA-invariant, dann (und nur dann) ist der NullraumN { K(t)} von K(t) zeitinvariant und fälltmit dem Raum der Schnittmenge zusammen.

    Ein Vektor-Raum istA-invariant, wenn der Raum durchA in sich selbst abgebildet wird. Jededurch Eigenvektoren vonA aufgespannte Teilraum istA-invariant. Satz a gilt auch dann nochwenn die MatrizenA, R undQ zeitvariabel sind.

    R̂ IR R̂R̂

    Q̂ F̂ Q̂F̂ R̂ Q̂ F̂

    4

  • n-

    -

    t und

    t,

    WennA und Q zeitinvariant sind, istK(t) entweder zu allen Zeiten singulär oder zu alle(endlichen) Zeiten regulär. [A, Q] beobachtbar oderF > 0 sind hinreichende (aber nicht notwendige) Voraussetzungen für eine LösungK(t) > 0 für alle t ∈ [t0, t1]. Haben die Systeme[A, Q] und [A, F ] einen gemeinsamen nicht beobachtbaren Pol (d.h. [A, [QT FT]T] ist nichtbeobachtbar), wird dieser Pol im geregelten System [A + RK(t)] nicht verschoben, da der entsprechende Eigenvektor vonA zu allen Zeitent ∈ [t0, t1] im Nullraum vonK(t) liegt.

    Theorem 1.3: Ist F = 0, dann wächst K(t) monoton mit abnehmender Zeit,(t) ≤ 0 bzw.K(τ) ≥ K(t) ∀ τ < t, ∀ t,τ ∈ [t0, t1].

    2.2 Die algebraische Riccati-Gleichung (ARE)

    In diesem Kapitel werden die Eigenschaften der algebraischen Matrix-Riccati-Gleichung

    0 = ATK + KA + KRK + Q (2.3)

    untersucht. Sie hat i.a. mehrere Lösungen (maximal (2n)!/(n!)2). Als Lösungen der ARE wer-den nur diejenigenn × n MatrizenK bezeichnet, die reell und symmetrisch sind (maximal 2n).Es können die folgenden Sätze aufgestellt werden:

    Theorem 2.1:a) Es existiert höchstens eine Lösung K der ARE, die das geschlossene System[A + RK]

    (asymptotisch) stabilisiert oder vollständig destabilisiert (d.h. –[A + RK] stabilisiert).

    b) Die stabilisierende Lösung existiert genau dann, wenni) [A, R] stabilisierbar ist,ii) [A, Q] keinen nicht beobachtbaren Pol auf der imaginären Achse hat,

    und iii) R „genügend klein“ ist, R< R0 ∈ n×n. D.h. für R existiert einSupremum R0 ≥ 0, unterhalb welchem existiert.

    Diese stabilisierende, eindeutige Lösung wird im folgenden mit gekennzeichnet, [A + R ]asymptotisch stabil. Die destabilisierende eindeutige Lösung existiert, wenn existier[–A, R] stabilisierbar ist (dies trifft zu, falls [A, R] steuerbar ist). Sie wird mit bezeichnet.

    Gilt anstelle vonR < R0 nur R ≤ R0, existiert eine eindeutige LösungK, bei der [A + RK]noch stabil, aber nicht mehr asymptotisch stabil ist. FürR > R0 existiert keine Lösung der AREmehr (vgl. Theorem 2.3). IstR ≤ 0 (Minimierungsproblem), ist die Bedingungiii stets erfüllt,und Theorem 2.1b reduziert sich auf die ersten zwei Voraussetzungen. Das SupremumR0 kanni.a. nur iterativ berechnet werden. Bei der Auslegung eines H∞-Kompensators liegtRoft in derFormR= γ –1R1 – R2 vor. In diesem Fall existiert fürγ bei R(γ0) = R0 ein Infimumγ0, oberhalbdem existiert.

    Die Voraussetzungiii für R kann auch auf eine Bedingung fürQ umformuliert werden. Fürein gegebenesR existiert dann ein GrenzwertQ0 ≥ 0, bei welchem genau dann existierwennQ < Q0 ist.

    K

    IRK

    K KKK̂

    K

    K

    5

  • folgt,

    leht

    e

    -

    -

    nd

    d

    st

    itiv-

    r

    Theorem 2.2:a) ist genau dann positiv-semidefinit,≥ 0, wenn[A, 2] stabilisierbar ist, wobei 2 aus

    der eindeutigen Zerlegung von R in zwei positiv-semidefinite orthogonale MatrizenR = 1 – 2 mit 1, 2 ≥ 0 und 1 2 = 0.

    b) ist genau dann singulär, wenn[A, Q] nicht beobachtbare, asymptotisch stabile Pobesitzt. Der NullraumN { } von wird durch die Eigenvektoren dieser stabilen, nicbeobachtbaren Pole aufgespannt.Im geregelten System[A + R ] werden diese Pole nicht verschoben.

    Da für alleR1 ≥ 0 undR2 ≥ 0 mit R = R1 – R2 stetsR1 ≥ 1 undR2 ≥ 2 gelten muß, ist [A, 2]genau dann stabilisierbar, wenn [A, R2] für alle R2 stabilisierbar ist. Die destabilisierendLösung ist genau dann singulär, wenn [A, Q] nicht detektierbar ist.

    SindR1 undR2 in R = γ –1R1 – R2 nicht orthogonal (R1R2 ≠ 0) und wirdγ sukzessive verklei-nert, können diskreteγi > γ0 (0 ≤ i ≤ n) auftreten, bei welchen [A, R(γi)] nicht mehr stabilisier-bar, und entsprechend (γi) inexistent ist. Bei jedem Unterschreiten einesγi wird ein Eigen-wert von negativ und ein Pol vonA durch 2 nicht mehr stabilisierbar. Eine positiv-semidefinite stabilisierende Lösung existiert fürR = γ –1R1 – R2 folglich genau dann, wenn dieBedingungen von Theorem 2.1b erfüllt sind undγ > γopt, wobei γopt = max{γ0, γi}. Ist [A, R2]stabilisierbar, ist das Infimumγopt positiv.

    Im H∞-Problem entsprichtγopt1/2 der minimalen H∞-Norm, die mit einer Zustandsrückführung erreicht werden kann. FürR2 = 0 (R ≥ 0) undA asymptotisch stabil istγopt1/2 = γ01/2 dieH∞-Norm des Systems [A, B, C] mit BBT = R undCTC = Q.

    Theorem 2.3: Existiert eine (beliebige) Lösung K der ARE, dann existiert auch , falls (unur falls) [A, R] stabilisierbar ist und das geschlossene System[A + RK] keinen Pol auf derimaginären Achse hat.Ist K positiv-semidefinit (K≥ 0) und [A, Q] detektierbar, dann ist positiv-semidefinit unkleiner als K,0 ≤ ≤ K. Wenn K positiv-definit (K >0) ist, fällt die Detektierbarkeits-Voraus-setzung weg.

    Wenn das geschlossene System [A + RK] einen Pol auf der imaginären Achse besitzt, iBedingungii oder iii aus Theorem 2.1b verletzt, und [A + RK] wird für alle LösungenK derARE diesen Pol auf der imaginären Achse aufweisen.

    Theorem 2.4: Jede positiv-semidefinite Lösung K≥ 0 stabilisiert das geregelte System[A – R2K], falls [A, Q] detektierbar ist. Ist K positiv-definit (K> 0) oder stabilisierend (K= ),fällt die Detektierbarkeits-Voraussetzung weg.Wenn [A – R2K] asymptotisch stabil ist, so ist K positiv-semidefinit (K≥ 0). Ist zusätzlich[A, Q] beobachtbar, so ist K positiv-definit (K> 0).

    Falls R ≤ 0 (R1 = 0) ist, kann wegen Theorem 2.1a nur die stabilisierende Lösung posdefinit bzw. positiv-semidefinit (falls [A, Q] detektierbar ist) sein. Falls [A, Q] nicht detektier-bar ist, sind mehrere positiv-semidefinite LösungenK möglich, wobei die maximale dieseLösungen die stabilisierende ist, 0≤ K ≤ .

    K K R̂ R̂

    R̂ R̂ R̂ R̂ R̂ R̂

    KK K

    K

    R̂ R̂ R̂

    KK R̂

    K

    K

    KK

    K

    K

    K

    6

  • w.

    r

    tems

    ems

    und

    ie

    Ist R ≥ 0 (R2 = 0) undA asymptotisch stabil, sind alle LösungenK positiv-semidefinit bzw.positiv-definit (falls [A, Q] beobachtbar ist). Andererseits existiert keine positiv-definite bzkeine positiv-semidefinite (falls [A, Q] detektierbar ist) LösungK, fallsA instabil ist.

    Theorem 2.5:a) Existiert ( ), so existiert (R) für alle R≤ , falls [A, R] stabilisierbar ist. Ist ( ) ≥ 0

    ( ( ) > 0), so ist auch (R) ≥ 0 ( (R) > 0).

    b) (R) wächst monoton mit R,(R) ≤ ( ) ∀ R ≤ .

    c) Der arithmetische Mittelwert der Pole des geschlossenen Systems[A + R (R)] wächstmonoton mit R,spur{A + R (R)} ≤ spur{A + ( )} < 0 ∀ R ≤ .

    d) Für R→ –∞ konvergiert (R) gegen einen Grenzwert KR∞ ≥ 0.Die Pole des geschlossenen Systems[A + R (R)] konvergieren dabei (entsprechend deAnzahl Nullstellen nν) gegen die Nullstellenνi , i = {1 ,...,nν} , bzw. gegen die an derimaginären Achse gespiegelten Nullstellen des Systems[A, B, C] (BBT = –R und CTC = Q).Die restlichen Pole divergieren, wenn R nicht einen kleineren Rang als Q hat (rang{R}≥ rang{Q} ).Der Grenzwert KR∞ verschwindet genau dann (KR∞ = 0), wenn das System[A, B, C] mini-malphasig ist (Re{νi} < 0 ∀ i) und R nicht einen kleineren Rang als Q hat.

    Theorem 2.6:a) Existiert ( ), so existiert (Q) für alle Q mit 0 ≤ Q ≤ , falls [A, Q] keinen nicht beob-

    achtbaren Pol auf der imaginären Achse besitzt. Ist( ) ≥ 0, so ist auch (Q) ≥ 0.

    b) (Q) wächst monoton mit Q,(Q) ≤ ( ) ∀ Q ≤ .

    c) Für R ≥ 0 wächst der arithmetische Mittelwert der Pole des geschlossenen Sys[A + R (Q)] monoton mit Q,spur{A + R (Q)} ≤ spur{A + ( )} < 0 ∀ Q ≤ .Für R ≤ 0 fällt der arithmetische Mittelwert der Pole des geschlossenen Syst[A + R (Q)] monoton mit wachsendem Q,0 > spur{A + (Q)} ≥ spur{A + R ( )}∀ Q ≤ .

    d) Für Q = 0 existiert (0) genau dann, wenn A keinen Pol auf der imaginären Achse hat[A, R] stabilisierbar ist (vgl. Theorem 2.1b).Im geregelten System[A + R (0)] bleiben die stabilen Pole von A unverändert, während dinstabilen Pole von A an der imaginären Achse gespiegelt werden.

    (0) verschwindet genau dann ((0) = 0), wenn A asymptotisch stabil ist.

    2.3 Die Konvergenz der RDE im unendlichen Zeitintervall

    In diesem Abschnitt wird das Verhalten dern × n Matrix-Riccati-Differentialgleichung

    – (t) = ATK(t) + K(t)A + K(t)RK(t) + Q

    KR K R KRKR K K

    K K KR R

    KK RKR R

    KK

    KQ K QKQ K

    K K KQ Q

    K K KQ Q

    K K KQQ

    K

    K

    K K

    7

  • ungen

    KPol-Raum

    reme

    inystemrixerte

    n

    -semlls)

    s

    t.

    mit der Endbedingung

    K(t1) = F

    für t → –∞ untersucht. FallsK(t) gegen einen stationären WertK∞ konvergiert,

    , (2.4)

    genügt dieser der algebraischen Riccati-Gleichung (ARE), die i.a. aber mehrere Lösbesitzt. Die folgenden Sätze können angewandt werden:

    Theorem 3.1: Konvergiert die Lösung K(t) der RDE für t→ −∞ nicht gegen einenstationären Wert K∞, stellt sich entweder eine stationäre periodische Lösung ein, oder(t)divergiert. Die periodische Lösung kann nur auftreten, wenn A ein konjugiert-komplexespaar besitzt, dessen beide konjugiert-komplexe Eigenvektoren durch F in den gleichenabgebildet werden. Ein Divergieren von K(t) für alle F ≥ 0 tritt genau dann ein, wenn keinepositiv-semidefinite Lösung K der ARE existiert.

    Eine positiv-semidefinite LösungK der ARE existiert genau dann, wennR ≤ R0 und [A, 2, Q]BIBO stabilisierbar (nur die detektierbaren Pole müssen stabilisierbar sein) ist (vgl. Theo2.1b iii und 2.2a).

    Besitzt die ARE eine oder mehrere positiv-semidefinite LösungenK, ist die EndbedingungF ≥ 0 ausschlaggebend, ob und gegebenenfalls gegen welche dieser LösungenK(t) konver-giert.

    Theorem 3.2: Die Lösung der ARE ist ein stabiler stationärer Grenzwert der RDE. EKonvergieren von K(t) gegen eine andere Lösung K der ARE, die das geschlossene S[A + RK] nicht stabilisiert, kommt genau dann vor (falls K(t) konvergiert), wenn die Mat[F – ] singulär ist, wobei die eindeutige Lösung der ARE ist, bei welcher alle Eigenwdes geschlossenen Systems[A + R ] instabil sind.Wenn der instabile Zustandsraum der Matrix[A + R ] (aufgespannt durch die Eigenvektoreder nicht stabilen Eigenwerte der Matrix[A + R ]) mit dem NullraumN {[ F – ]} zusam-menfällt, dann konvergiert K(t) gegen (hinreichend, aber nicht notwendig).

    Existiert die Lösung nicht, weil [–A, R] nicht stabilisierbar ist, kann anstelle von diejenige Lösung Ersatzverwendet werden, die die destabilisierbaren Pole destabilisiert. In dieFall konvergiertK(t) für t → −∞ gegen eine nicht stabilisierende Lösung, falls (und nur fadie Schnittmenge vonN {[ F – Ersatz]} mit dem instabilen Zustandsraum des System[A+R Ersatz] nicht leer ist.

    Für F = 0 ist folglich eine stationäre LösungK∞, die das geschlossene System [A + RK∞]nicht stabilisiert, nur möglich, wenn [A, Q] nicht detektierbar ist, da andernfalls regulär is

    Theorem 3.3: Hat die ARE eine positiv-semidefinite, stabilisierende Lösung≥ 0, so kon-vergiert K(t) für t → −∞ für jede Endbedingung F mit0 ≤ F ≤ gegen , falls[A, Q] detek-

    K∞ K t( )t ∞–→lim=

    K

    K̂ K̂K̂

    K̃K̃ K̂

    K̂ K̂K̂

    K̂K̂

    KK K

    8

  • enn

    opti-

    zont)n die

    Rück-

    eutigfwen-PoleRück-

    ssenerriumseinerndenichtspro-esmüs-

    ptima-demuer

    hbar),n

    tierbar ist. Ist [A, Q] nicht detektierbar, ist die Konvergenz genau dann noch garantiert, wkein nicht detektierbarer Zustand im NullraumN { F} der Matrix F liegt.

    Der Existenz-GrenzwertR0 (bzw. Q0) von (vgl. Theorem 2.1b) muß deshalb für alleF ≤unter dem Existenz-Grenzwert0 (bzw. 0) vonK(t) (vgl. Theorem 1.1) für alle Zeitintervalle[t0, t1] liegen,R0 ≤ 0 (bzw.Q0 ≤ 0).

    FürF = 0 und [A, Q] detektierbar konvergiertK(t) für t → –∞ gegen , falls ≥ 0 existiert.

    3 Anwendung in Optimierungsproblemen

    Das Optimierungsproblem im endlichen Zeitintervall [t0, t1] (endlicher Horizont) hat genaudann eine eindeutige Lösung, wenn die RDE im entsprechenden Intervall existiert. Dasmale Gütekriterium hat dann für einen beliebigen Anfangszustandx0 den WertJo = x0TK(t0)x0.

    Für das Optimierungsproblem mit unendlich langer Problemdauer (unendlicher Horikann folgendes zusammengefaßt werden. Eine optimale Lösung existiert dann, wenLösung der RDE fürt → –∞ und F = 0 gegen einen stationären WertK∞ konvergiert. DasGütekriterium hat bei optimaler Rückführung für einen beliebigen Anfangszustandx0 den Wert

    = x0TK∞x0.Diese stationäre LösungK∞ stabilisiert das geschlossene System [A + RK∞] nur dann nicht,

    wenn das quadratische Gütekriterium so formuliert wurde, daß eine nicht stabilisierendeführung zu einem endlichen optimalen Wert des Kriteriums führen kann, d.h. wenn [A, Q]nicht detektierbar ist. Da nur die stabilisierende Lösung der ARE numerisch eindbestimmbar ist, ist die Berechnung dieser stationären Lösung in der Anwendung sehr audig. Alternativ könnte man das Optimierungsproblem auf ein um die nicht detektierbarenreduziertes System anwenden, da diese im ursprünglichen Problem durch die optimaleführung auch nicht verändert würden (vgl. Abschnitt 4.4, Bemerkung 8).

    Häufig interessiert man sich aber ohnehin nur für optimale Lösungen, die das geschloSystem [A + RK∞] asymptotisch stabilisieren. Ist [A, Q] nicht detektierbar, aber beobachtbafür alle grenzstabilen Pole, kann diese Forderung bei der Formulierung des Gütekriteberücksichtigt werden, indem zusätzlich der Zustand zur (unendlichen) Endzeit mittelsMatrix F ≥ 0 bestraft wird.F muß dabei so gewählt werden, daß eine nicht stabilisiereRückführung zwangsläufig zu einem Divergieren des Gütekriteriums führen würde, waseinem eindeutigen Optimum entsprechen kann. Damit das ursprüngliche Optimierungblem nicht verfälscht wird, kannF beliebig klein festgelegt werden. Da ein grenzstabilSystem durch keinen Endkostenterm zum Divergieren des Gütekriteriums führen würde,sen die reinimaginären Pole vonA durchQ beobachtbar sein.

    Bei diesem Vorgehen muß aber beachtet werden, daß ein Unterschied zwischen der olen Lösung des Problems mit unendlich langer Problemdauer (unendlicher Horizont) undGrenzübergangt → –∞ der optimalen Lösung des Problems mit endlich langer Problemdabesteht (d.h. die Reihenfolge von Optimierung und Grenzübergang ist nicht vertauscwenn die Schnittmenge des NullraumsN { F} mit dem nicht detektierbaren Zustandsraum vo

    K KR̂ Q̂

    R̂ Q̂K K

    J∞o

    K

    9

  • em isten von

    also

    s, nicht

    -bestehtbeimzuge-en. Soenraumrmsnden

    peri-

    g isttigenent des

    -nn.

    ierttemt das

    n)tsgradedlicherimal-rt wer-

    [A, Q] nicht A-invariant ist. Im ersten Fall genügt die Bedingung [A, [QT FT]T] detektierbar,um eine stabilisierende Lösung (sofern eine existiert) zu garantieren. Beim zweiten Probldiese Voraussetzung nicht hinreichend, da dies nur voraussetzt, daß keine Eigenvektornicht detektierbaren Polen von [A, Q] im Nullraum vonF liegen. Nach Theorem 3.3 tritt dieKonvergenz vonK(t) gegen aber nur dann ein, wenn kein nicht detektierbarer Zustand,auch keine Linearkombination der genannten Eigenvektoren, im Nullraum vonF liegt.

    Ist diese Bedingung, im Gegensatz zur schwächeren Bedingung des ersten Problemerfüllt, stellt sich entweder eine stationäre periodische Lösung ein, oderK(t) konvergiert gegeneinen nicht stabilisierenden, stationären WertK∞. Die optimale Rückführung des ersten Problems (berechnet mittels ) stabilisiert aber das geschlossene System. Der Unterschieddarin, daß im ersten Problem nur zeitinvariante Lösungen in Frage kommen, währendzweiten Problem, trotz der unendlich langen Problemdauer, auch zeitvariable Lösungenlassen sind, die zu einem geringeren (besseren) Wert des Gütekriteriums führen könnverändert die anfänglich stationäre LösungK∞ ihren Wert gegen Ende des unendlich langIntervalls derart, daß mit endlichem Aufwand der unendliche Zustandsvektor in den Nullder MatrixF gedreht wird. Der Wert des Gütekriteriums divergiert infolge des Endkostentenicht, und die Gesamtkosten liegen tiefer als diejenigen der zeitinvarianten stabilisiereLösung (K∞ ≤ , vgl. Theorem 2.4). Diese Überlegungen gelten auch für die erwähntenodischen Lösungen.

    Die Matrix F ≥ 0 kann aber immer so gewählt werden, daßK(t) für t → –∞ gegen die stabi-lisierende, positiv-semidefinite Lösung der ARE strebt. Die zeitinvariante Rückführundann auch optimal unter allen zeitvariablen Möglichkeiten. Die Existenz dieser eindeuLösung ≥ 0 ist folglich hinreichend und notwendig für die Existenz einer eindeutigLösung des Optimierungsproblems mit unendlichem Horizont, bei welchem die Stabilitägeregelten Systems [A + R ] vorausgesetzt wird. FürR = R1 – R2 (H∞-Reglerentwurf) ist dannauch die asymptotische Stabilität des Systems [A – R2 ] garantiert.

    Durch sukzessives verkleinern vonQ oderRwird auch der optimale Wert des Gütekriteriums kleiner (vgl. Theoreme 2.5 und 2.6), wobei (bzw. ) nicht negativ werden kaBeim GrenzübergangQ → 0 („expensive control“, keine Bestrafung der Zustände) resulteine Rückführung, die mit minimalem Aufwand (d.h. mit minimalen Stellgrößen) das Sysstabilisiert, indem die instabilen Pole an der imaginären Achse gespiegelt werden. IsSystem bereits stabil, wird eine perfekte Regelung = 0 (bzw.= 0) ohne Rückführungerzielt. Beim GrenzübergangR → –∞ („cheap control“, keine Bestrafung der Stellgrößekann eine perfekte Regelung erreicht werden, wenn einerseits genügend Regler-Freiheivorhanden sind (nicht weniger Stellgrößen als Regelgrößen) und andererseits alle in enZeit abklingenden Transienten durch eine Pol-Nullstellen-Auslöschung (was nur bei minphasigen Systemen möglich ist, da das geschlossene System stabil sein muß) verhindeden können.

    K

    K

    K

    K

    K

    KK

    J∞o

    J∞o K

    J∞o K

    10

  • linea-d u.a.der

    achteterden.derne und

    seiener lin-

    n

    -

    4 Beweise der Theoreme

    In den Abschnitten 4.1 und 4.2 werden einige bekannte Lemmata aus der Matrix- undren System-Theorie aufgeführt, die für die späteren Beweise benötigt werden. Sie sinauch im Anhang von [1] zu finden und werden hier nicht bewiesen. Die ReihenfolgeBeweise der Theoreme ist nicht strikt derjenigen von Abschnitt 2 angepaßt, da darauf gewurde, daß nur bereits bewiesene Theoreme in der weiteren Beweisführung verwendet wZum Teil sind die Beweise der einzelnen Theoreme für sich allein nicht verständlich, sonsetzen die Begriffe und mathematischen Umformungen der vorangegangenen BeweisLemmata voraus.

    4.1 Sätze aus der Matrix-Theorie

    Lemma 1 Determinanten-RegelnFür die komplexen Matrizen A,M,N∈ n×n, A regulär, B∈ n×m, C ∈ p×n, D ∈ p×m undE ∈ m×p mit beliebigen Dimensionen n, m und p gelten die folgenden Identitäten:

    det{MN} = det{NM} = det{M}det{N} , det{A–1} = det{A} –1 (4.1)

    (4.2)

    det{Im + ED} = det{Ip + DE} (4.3)

    Lemma 2 Matrix-Inversions-LemmaM und N seien zwei quadratische, invertierbare Matrizen beliebiger Dimension. L und Rzwei Rechteckmatrizen mit passenden Dimensionen. Dann gilt, sofern die Inverse auf dken Seite existiert:

    [M + LNR] –1 = M –1 – M–1L[RM–1L + N –1] –1RM–1 , (4.4)

    wobei die Invertierbarkeit von[RM–1L + N –1] garantiert ist.

    Lemma 3 Lemma von LyapunovSeien A, B und C gegebene Matrizen mit den Dimensionen n× n, m× m und n× m. Die lineareMatrizen-Gleichung

    AX + XB + C = 0 (4.5)

    hat genau dann eine eindeutige Lösung X∈ n×m, wenn A keine (am Ursprung) gespiegelteEigenwerte von B hat,λi(A) + λj(B) ≠ 0 für alle i und j.Wenn B = AT, C ≥ 0 und [A, C] beobachtbar (detektierbar) ist, existiert genau dann eine ein

    IC IC IC ICIC

    det A B

    C D

    det A{ }det D CA 1– B–{ }=

    IR

    11

  • il ist,

    t

    ge-

    ddiert

    s

    enbe-n den

    deutige, positiv-definite (positiv-semidefinite) Lösung X, wenn A asymptotisch stabRe{λi(A)} < 0 ∀i.

    Bemerkung 4 Zerlegung einer indefiniten Matrix in zwei positiv-semidefinite

    Die Spektralzerlegung der symmetrischen, indefiniten MatrixRergibtR= UΛUT, wobei dieKolonnen der unitären MatrixU (UT = U–1) den orthogonalen Eigenvektoren vonR entspre-chen undΛ diagonal mit den Eigenwerten vonR besetzt ist.Λ undU können dabei so gewählwerden, daß

    und , (4.6)

    wobei Λ1 ≥ 0 undΛ2 ≤ 0 sind (allfällige verschwindende Eigenwerte können beliebig aufteilt werden). Mit diesen Teilblöcken lautet die Spektralzerlegung:

    (4.7)

    Da U unitär ist, sindU1 und U2 orthogonal (U1U2 = 0). Dadurch sind auch1 = U1Λ1U1T ≥ 0und 2 = –U2Λ2U2T ≥ 0 orthogonal ( 1 2 = 0). Die Menge aller Zerlegungen vonR = R1 – R2in zwei positiv-semidefinite MatrizenR1 und R2 kann mit der positiv-semidefiniten Matrix∆R ≥ 0 parametrisiert werden, indem sie zu den Matrizen der orthogonalen Zerlegung awerden,R1 = 1 + ∆R, R2 = 2 + ∆R. Da 1 und 2 orthogonal sind, verletzt ein∆R ≤ 0zwangsläufig die BedingungenR1 ≥ 0 undR2 ≥ 0.

    4.2 Sätze aus der linearen System-Theorie

    Lemma 5 Steuer- und Stabilisierbarkeit von linearen dynamischen Systemena) Das lineare zeitinvariante dynamische System[A, B], (t) = Ax(t) + Bu(t), mit den konstan-

    ten Systemmatrizen A∈ n×n und B∈ n×m ist bezüglich jedes beliebigen Intervall[t0, t1] genau dann (vollständig) steuerbar, wenn

    rang{[λ I – A B]} = n ∀ λ ∈ . (4.8)

    Ist das System[A, B] nicht steuerbar, wird der nicht steuerbare Zustandsraum durch dNullraumN {[ λ I – A B]T} definiert. Der steuerbare Zustandsraum fällt mit dem Wertereich Ra {[ λ I – A B]} zusammen. Die nicht steuerbaren Pole des Systems entsprecheWerten vonλ, bei welchen ein Rangabfall der Matrix[λI – A B] eintritt. Diese Pole kön-nen dann (und nur dann) durch keine Rückführung u(t) = Gx(t) (G ∈ m×n) verschobenwerden.

    b) Das lineare zeitinvariante dynamische System[A, B] ist genau dann stabilisierbar, wenn

    rang{[λ I – A B]} = n ∀ Re{λ} ≥ 0. (4.9)

    Λ Λ2 00 Λ2

    = U U1 U2=

    R UΛUT U1Λ1U1T U2Λ2U2T+ R̂1 R̂2–= = =

    R̂R̂ R̂ R̂

    R̂ R̂ R̂ R̂

    ẋIR IR

    IC

    IR

    12

  • ng

    er-

    re

    raum

    trixrbare

    bige

    tands-

    Ist das System[A, B] nicht stabilisierbar, dann (und nur dann) existiert keine Rückführuu(t) = Gx(t) (G ∈ m×n), die das geschlossene System[A + BG] asymptotisch stabilisiert.Die nicht stabilisierbaren Pole des Systems entsprechen den Werten vonλ mit Re{λ} ≥ 0,bei welchen ein Rangabfall der Matrix[λ I – A B] eintritt.

    c) Für ein nicht steuerbares zeitinvariantes System[A, B] existiert immer eine zeitinvarianteZustandstransformation = Tx, mit der die Systemmatrizen auf die Form

    (4.10)

    transformiert werden können, wobei[A11, B1] steuerbar ist. Die Pole von A22 entsprechenden nicht steuerbaren Polen. Ist A22 asymptotisch stabil, so ist das System noch stabilisibar.

    d) Das lineare zeitvariable dynamische System[A(t), B(t)], (t) = A(t)x(t) + B(t)u(t), mit denzeitvariablen Systemmatrizen A(t) ∈ n×n und B(t) ∈ n×m ist bezüglich des Intervalls[t0, t1] genau dann steuerbar, wenn die positiv-semidefinite Steuerbarkeitsmatrix

    (4.11)

    regulär (d.h. positiv-definit) ist, wobeiΦ die Transitionsmatrix des Systems(t) = A(t)x(t)ist. Die Steuerbarkeitsmatrix W(t) = W(t0, t) erfüllt die lineare Matrix-Differentialgleichung

    ;

    . (4.12)

    Ist das System im Intervall[t0, t1] nicht steuerbar, wird der zeitabhängige, nicht steuerbaZustandsraum durch den NullraumN { W(t0, t1)} definiert. Wenn das System[A, B] zeitinva-riant ist, ist die Steuerbarkeitsmatrix nur noch eine Funktion der Zeitdifferenz t1 – t0 und ihrNullraum zeitinvariant. Der entsprechende zeitinvariante, nicht steuerbare Zustandsentspricht dann demjenigen aus Punkt a.

    Das System [A, B] ist folglich genau dann nicht steuerbar, wenn ein linker Eigenvektorx derMatrix A im Nullraum N { BT} der Matrix BT liegt, xTA = λxT, xTB = 0 bzw. BTx = 0 ⇒ [A, B]nicht steuerbar. Gilt dies für einen Eigenvektor eines nicht stabilen Eigenwertes der MaA(Re{λ} ≥ 0), ist das System nicht stabilisierbar. Der nicht steuerbare bzw. nicht stabilisieZustandsraum wird durch die entsprechenden Eigenvektoren aufgespannt.

    Da aus xTA = λxT und xTB = 0 folgt, daß auchxT[A + BG] = λxT für jedes beliebigeG ∈ m×n gilt, bleiben die Steuerbarkeit und die Stabilisierbarkeit erhalten für eine belieZustandsrückführungu(t) = Gx(t). D.h. die Systeme [A, B] und [A + BG, B] haben die glei-chen nicht steuerbaren (stabilisierbaren) Pole und die gleichen nicht steuerbaren Zusräume.

    IR

    Ã TAT 1–A11 A120 A22

    und B̃ TB B10

    = = = =

    ẋIR IR

    W t0 t1,( ) Φ t1 σ,( )B t( )BT t( )ΦT t1 σ,( ) σdt0

    t1

    ∫=

    tdd

    W t0 t,( ) Ẇ t( ) A t( )W t( ) W t( )AT t( ) B t( )BT t( )+ += =

    W t0 t, 0( ) 0=

    IR

    13

  • n

    -

    rchms

    ng

    ier-

    Lemma 6 Beobachtbar- und Detektierbarkeit von linearen dynamischen Systemea) Das lineare zeitinvariante dynamische System[A, C], (t) = Ax(t), y(t) = Cx(t), mit den

    konstanten Systemmatrizen A∈ n×n und C∈ p×n ist bezüglich jedes beliebigen Intervalls [t0, t1] genau dann (vollständig) beobachtbar, wenn

    rang = rang{[[λI – A]T CT]T} = n ∀ λ ∈ . (4.13)

    Ist das System[A, C] nicht beobachtbar, wird der nicht beobachtbare Zustandsraum duden NullraumN {[[ λI – A]T CT]T} definiert. Die nicht beobachtbaren Pole des Systeentsprechen den Werten vonλ, bei welchen ein Rangabfall der Matrix[[λI – A]T CT] ein-tritt. Diese Pole können dann (und nur dann) durch keine Rückführung(t) = Ax(t) + Hy(t)(H ∈ n×p) verschoben werden.

    b) Das lineare zeitinvariante dynamische System[A, C] ist genau dann detektierbar, wenn

    rang = rang{[[λI – A]T CT]T} = n ∀ Re{λ} ≥ 0. (4.14)

    Ist das System[A, C] nicht detektierbar, dann (und nur dann) existiert keine Rückführu(t) = Ax(t) + Hy(t) (H ∈ n×p), die das geschlossene System[A + HC] asymptotisch sta-

    bilisiert. Die nicht detektierbaren Pole des Systems entsprechen den Werten vonλ mitRe{λ} ≥ 0, bei welchen ein Rangabfall der Matrix[[λI – A]T CT] eintritt.

    c) Für ein nicht beobachtbares zeitinvariantes System[A, C] existiert immer eine zeitinvari-ante Zustandstransformation = Tx, mit der die Systemmatrizen auf die Form

    (4.15)

    transformiert werden können, wobei[A11, C1] beobachtbar ist. Die Pole von A22 entsprechenden nicht beobachtbaren Polen. Ist A22 asymptotisch stabil, so ist das System noch detektbar.

    d) Das lineare zeitvariable dynamische System[A(t), C(t)], (t) = A(t)x(t), y(t) = C(t)x(t), mitden zeitvariablen Systemmatrizen A(t) ∈ n×n und C(t) ∈ p×n ist bezüglich des Intervalls[t0, t1] genau dann beobachtbar, wenn die positiv-semidefinite Beobachtbarkeitsmatrix

    (4.16)

    regulär (d.h. positiv-definit) ist, wobeiΦ die Transitionsmatrix des Systems(t) = A(t)x(t)ist. Die Beobachtbarkeitsmatrix M(t) = M(t, t1) erfüllt die lineare Matrix-Differentialglei-

    ẋIR IR

    λI A–C

    IC

    ẋIR

    λI A–C

    ẋ IR

    Ã TAT 1–A11 0

    A21 A22und C̃ CT 1– C1 0= = = =

    ẋIR IR

    M t0 t1,( ) ΦT σ t0,( )CT t( )C t( )Φ σ t0,( ) σdt0

    t1

    ∫=

    14

  • b-

    iffe-ob-

    ktor

    ixrbare

    kfüh-

    me.

    n, hat

    chung

    ;

    . (4.17)

    Ist das System im Intervall[t0, t1] nicht beobachtbar, wird der zeitabhängige, nicht beoachtbare Zustandsraum durch den NullraumN { M(t0, t1)} definiert. Wenn das System[A, C] zeitinvariant ist, ist die Beobachtbarkeitsmatrix nur noch eine Funktion der Zeitdrenz t1 – t0 und ihr Nullraum zeitinvariant. Der entsprechende zeitinvariante, nicht beachtbare Zustandsraum entspricht dann demjenigen aus Punkt a.

    Das System [A, C] ist folglich genau dann nicht beobachtbar, wenn ein rechter Eigenvex der MatrixA im NullraumN { C} der Matrix C liegt, Ax= λx, Cx = 0 ⇒ [A, C] nicht beob-achtbar. Gilt dies für einen Eigenvektor eines nicht stabilen Eigenwertes der MatrA(Re{λ} ≥ 0), ist das System nicht detektierbar. Der nicht beobachtbare bzw. nicht detektieZustandsraum wird durch die entsprechenden Eigenvektoren aufgespannt.

    Da ausAx= λx undCx = 0 folgt, daß auch [A + HC]x = λx für jedes beliebigeH ∈ n×pgilt, bleiben die Beobachtbarkeit und die Detektierbarkeit erhalten für eine beliebige Rücrung (t) = Ax(t) + Hy(t). D.h. die Systeme [A, C] und [A + HC, C] haben die gleichen nichtbeobachtbaren (detektierbaren) Pole und die gleichen nicht beobachtbaren Zustandsräu

    Das System [A, C] ist genau dann beobachtbar (detektierbar), wenn [AT, CT] steuerbar (sta-bilisierbar) ist.

    Lemma 7 Nullstellen von linearen SystemenDas lineare zeitinvariante dynamische System

    (t) = Ax(t) + Bu(t) , y(t) = Cx(t) + Du(t) , x(t) ∈ n, u(t) ∈ m, y(t) ∈ p

    mit der Übertragungsfunktion G(s) = C[sI – A] –1B + D hat eine Nullstelleνi , wenn die Matrix

    (4.18)

    an der Stelle s =νi einen Rangabfall hat. Wennνi kein Pol des Systems ist (det{νi I – A} ≠ 0),hat auch die Übertragungsfunktion G(s) einen Rangabfall an der Stelle s =νi.Wenn das System quadratisch ist, m = p, und die Matrizen B und C vollen Rang p habedas System eine Nullstelle an der Stelle s =νi , wenn

    . (4.19)

    tdd

    M t t, 1( )– Ṁ– t( ) AT t( )M t( ) M t( )A t( ) CT t( )C t( )+ += =

    M t1 t, 1( ) 0=

    IR

    ẋ IR IR IR

    N s( ) sI A– B–C D

    =

    ϕ s( ) det N s( ){ } det sI A– B–C D

    0= = =

    15

  • -

    e

    t der

    en

    der

    ϕ(s) ist das charakteristische Nullstellen-Polynom. Wennνi kein Pol des Systems ist, verschwindet auch die Determinante der Übertragungsfunktion G(s) an der Stelle s =νi :

    , (4.20)

    wobeiφ(s) das charakteristische Polynom ist.Das System ist minimalphasig, wenn alle Nullstellenνi in der linken offenen Gauß-Halbebenliegen,Re{νi} < 0 ∀ i.

    4.3 Beweise der Theoreme von Abschnitt 2.1

    Beweis von Theorem 1.1:

    Das Minimierungsproblem für das lineare zeitinvariante dynamische System (t) = Ax(t) +Bu(t), x(t0) = x0 mit dem quadratischen Gütekriterium

    (4.21)

    führt auf die RDE (2.1) mit der Endbedingung (2.2), wobeiR = –BBT ≤ 0. FürQ ≥ 0 undF ≥ 0kann das (strikt konvexe) Gütekriterium nur positive Werte annehmen. Andererseits bleibWert vonJ(u) beschränkt für jede Rückführungu(t) = G(t)x(t) mit beschränkter MatrixG(t).Für das Minimierungsproblem im endlichen Intervall [t0, t1], und somit auch für die RDE mitR ≤ 0, muß deshalb immer eine Lösung existieren.

    Handelt es sich nicht um ein reines Minimierungsproblem, so istR nicht negativ-semidefi-nit, und der quadratische Term destabilisiert die RDE fürK(t) ≥ 0 undt ≤ t1. Wird R genügendgroß gewählt, divergiertK(t) beim Rückwärtsintegrieren bereits nach endlicher Zeitt ≤ t1.

    Nehmen wir an,K(t) = K(t, R) existiere im Intervall [t0, t1] für ein gegebenesR ≥ 0 (dies istmöglich, da fürR= 0 aus der RDE eine lineare Matrix-Gleichung wird, die in jedem endlichIntervall definiert ist). Um zu beweisen, daß ein Supremum0 ≥ 0 existiert, zeigen wir, daß

    (t) = K(t, ) im entsprechenden Intervall existiert für alle≤ R.Abzählen der RDE für (t) von der RDE fürK(t) und entsprechendes ZusammenfassenTerme ergibt:

    –d/dt(K – ) = AT(K – ) + (K – )A + KRK – + (K K – K K)

    = AT(K – ) + (K – )A – (K – ) (K – ) + K (K – ) + (K – ) K + K(R– )K ;

    K(t1) – (t1) = F – F = 0

    det G s( ){ } det C sI A–[ ] 1– B D+{ }

    det sI A– B–

    C D

    det sI A–{ }------------------------------------------- ϕ s( )

    φ s( )----------- 0= = = =

    J u( ) uT t( )u t( ) x+ T t( )Qx t( ) t xT t1( )Fx t1( )+dt1

    t0

    ∫=

    R̂K R R

    K

    K K K KRK R R

    K K KR K R K KR R

    K

    16

  • chem

    e

    ni-

    ni-

    h die

    erme

    Mit ∆K(t) = K(t) – (t) und∆R = R– folgt:

    –∆ (t) = [A + K(t)]T∆K(t) + ∆K(t)[A + K(t)] – ∆K(t) ∆K(t) + K(t)∆RK(t) ;

    ∆K(t1) = 0 (4.22)

    Für ∆R= R– ≥ 0 und ≥ 0 („worst case“, für ≤ 0 wurde die Existenz vonK(t, ) bereitsbewiesen) entspricht Gleichung (4.22) einer RDE mit negativ-semidefinitem quadratisTerm.∆K(t) und somit (t) = K(t, ) = K(t) – ∆K(t) existieren im Intervall [t0, t1] also, wennK(t, R) existiert und ≤ R.

    Daß auch für die MatrizenQ undF Suprema 0 und 0 existieren, kann in analoger Weisbewiesen werden. Abzählen der RDE für (t) = K(t, ) von der RDE fürK(t) = K(t, Q) undentsprechendes Zusammenfassen der Terme ergibt mit∆K(t) = K(t) – (t) und∆Q = Q – :

    –∆ (t) = [A + RK(t)]T∆K(t) + ∆K(t)[A + RK(t)] – ∆K(t)R∆K(t) + ∆Q ;

    ∆K(t1) = 0 (4.23)

    Für ∆Q = Q – ≥ 0 undR ≥ 0 entspricht Gleichung (4.23) einer RDE mit negativ-semidefitem quadratischem Term.∆K(t) und somit (t) = K(t) – ∆K(t) existieren also im Intervall[t0, t1].

    Abzählen der RDE für (t) = K(t, ) von der RDE fürK(t) = K(t, F) und entsprechendesZusammenfassen der Terme ergibt mit∆K(t) = K(t) – (t) und∆F = F – :

    –∆ (t) = [A + RK(t)]T∆K(t) + ∆K(t)[A + RK(t)] – ∆K(t)R∆K(t) ; ∆K(t1) = ∆F (4.24)

    Für ∆F = F – ≥ 0 undR ≥ 0 entspricht diese Gleichung einer RDE mit negativ-semidefitem quadratischem Term.∆K(t) und somit (t) = K(t) – ∆K(t) existieren also im Intervall[t0, t1].

    Beweis von Theorem 1.2a:

    Da die RDE (2.1) und die Endbedingung (2.2) reell und symmetrisch sind, muß aucLösungK(t) im ganzen Zeitintervall reell und symmetrisch sein. Um zu zeigen, daßK(t) posi-tiv-semidefinit ist, teilen wir den quadratischen Term der RDE auf die beiden linearen Tauf:

    – (t) = [A + RK(t)/2]TK(t) + K(t)[A + RK(t)/2] + Q ; K(t1) = F

    Mit Hilfe der zeitvariablen TransitionsmatrixΦ der Systemmatrix [A + RK(t)/2] lautet dieLösungK(t) dieser linearen Matrix-Differentialgleichung:

    (4.25)

    mit (t1, t) = –Φ(t1, t)[A + RK(t)/2] ; Φ(t1, t1) = I

    K R

    K̇ R R R

    R R R R

    K RR

    Q̂ F̂K Q

    K Q

    QK

    K FK F

    FK

    K t( ) ΦT t1 t,( )FΦ t1 t,( ) ΦT σ t,( )QΦ σ t,( ) σdt

    t1

    ∫+=

    Φ̇

    17

  • nden,

    -

    renlen

    -

    lär,im

    Da die Definitheit bei einer Kongruenztransformation erhalten bleibt, sind beide Summaund damitK(t), positiv-semidefinit im ganzen Zeitintervall, fallsQ ≥ 0 undF ≥ 0 sind.

    Beweis von Theorem 1.2b:

    Wir stellen die LösungK(t) der RDE (2.1) mit der Endbedingung (2.2) mit Hilfe der zeitinvarianten TransitionsmatrixΦ(t1, t) = exp{A(t1 – t)} der SystemmatrixA dar, indem der qua-dratische Term des homogenen Teils der RDE zum inhomogenen Teil geschlagen wird:

    (4.26)

    mit (t1, t) = –Φ(t1, t)A ; Φ(t1, t1) = I

    Der erste Integralterm dieser Gleichung entspricht gerade der BeobachtbarkeitsmatrixM(t, t1)des Systems [A, Q] (vgl. Lemma 6). Ihr NullraumN { M(t, t1)} wird durch die nicht beobacht-baren Zustände aufgespannt. Die homogene Entwicklungx(t) = Φ(t, 0)x0 eines nicht beobacht-baren Anfangszustandesx0 (Linearkombination der Eigenvektoren zu nicht beobachtbaPolen vonA) ist zu allen Zeitent ein nicht beobachtbarer (Anfangs-) Zustand und liegt zu alZeitent im Nullraum der MatrizenQ undM(t, t1), d.h.QΦ(t, 0)x0 = 0 bzw.M(t, t1)Φ(t, 0)x0 = 0∀ t.

    Existiert ein nicht beobachtbarer Zustandsvektorx ∈ N { M(t, t1)} des Systems [A, Q], derim Nullraum der MatrixF liegt (Fx = 0, x ∈ N { F}), reduziert sich Gleichung (4.26) durchMultiplizieren von rechts mity = Φ(t, t1)x zu:

    Diese Gleichung hat (für ein beliebigesR) nur eine Lösung, wennK(t) singulär undK(t)Φ(t, t1)x = 0 zu allen Zeitent ist. Ist die SchnittmengeΩ = N { F} ∩ N { M(t, t1)} des nichtbeobachtbaren Zustandsraums mit dem Nullraum vonF A-invariant, dann liegen die Eigenvektoren der nicht beobachtbaren Pole von [A, Q] entweder im Nullraum vonF oder im kom-plementären Raum. In diesem Fall sind alle Vektoren, die im Nullraum vonF liegen, auchnicht beobachtbare Zustandsvektoren des Systems [A, Q] (Ω = N { F} ⊆ N { M(t, t1)}). DerNullraum N { K(t)} = Ω wird dementsprechend zu allen Zeitent von diesen Vektoren aufge-spannt.

    Der verbleibende nicht beobachtbare Zustandsraum liegt orthogonal zum RaumΩ undbeeinflußtN { K(t)} nicht (d.h. die Summe der ersten zwei Summanden von (4.26) ist reguda ihre Nullräume orthogonal sind). Existiert kein nicht beobachtbarer Zustandsvektor, derNullraum vonF liegt (Ω = {}), ist K(t) regulär.

    K t( ) ΦT t1 t,( )FΦ t1 t,( ) ΦT σ t,( )QΦ σ t,( ) σdt

    t1

    ∫+=

    + ΦT σ t,( )K σ( )RK σ( )Φ σ t,( ) σdt

    t1

    Φ̇

    K t( )y ΦT σ t,( )K σ( )RK σ( )Φ σ t,( ) σ ydt

    t1

    ∫=

    18

  • e ein-

    ilen

    Beweis von Theorem 1.3:

    Um die Monotonität vonK(t) zu zeigen, leiten wir die RDE nach der Zeit ab:

    – (t) = AT (t) + (t)A + (t)RK(t) + K(t)R (t)

    = [A + RK(t)]T (t) + (t)[A + RK(t)] (4.27)

    Mit Hilfe der zeitvariablen TransitionsmatrixΦ der Systemmatrix [A + RK(t)] lautet dieLösung (t) dieser linearen Matrix-Differentialgleichung:

    (t) = ΦT(t1, t) (t1)Φ(t1, t) mit (t1, t) = –Φ(t1, t)[A + RK(t)] ; Φ(t1, t1) = I (4.28)

    Da die Definitheit bei einer Kongruenztranformation erhalten bleibt, ist (t) ≤ 0 ∀ t ≤ t1, falls(t1) = –ATF – FA – FRF– Q ≤ 0. Für K(t1) = F = 0 ist die Endbedingung (t1) = –Q ≤ 0,

    und somit auch (t) ≤ 0 ∀ t ≤ t1. Durch Integrieren von (t) erhält man:

    K(t) – K(τ) = ≤ 0

    4.4 Beweise der Theoreme von Abschnitt 2.2

    Beweis von Theorem 2.1a:

    Wir betrachten zwei verschiedene LösungenK und der ARE (2.3), wobei dasgeschlossene System [A + R ] asymptotisch stabilisieren soll. Für die Differenz∆K = K –dieser beiden Lösungen erhalten wir durch Subtrahieren der beiden ARE:

    0 = ATK + KA + KRK + Q – { AT + A + R + Q }

    = AT(K – ) + (K – )A + KRK– R

    = AT(K – ) + (K – )A + (K – )R(K – ) + (K – )R + R(K – )

    = AT(K – ) + (K – )A – (K – )R(K – ) + (K – )RK + KR(K – )

    0 = [A + R ]T∆K + ∆K[A + R ] + ∆KR∆K (4.29)

    0 = [A + RK]T∆K + ∆K[A + RK] – ∆KR∆K (4.30)

    0 = [A + R ]T∆K + ∆K[A + RK] (4.31)

    Gleichung (4.31) ist eine homogene Lyapunov-Gleichung (4.5) und hat nach Lemma 3 dideutige Lösung∆K = 0, falls λi ([A + R ]T) + λj ([A + RK]) ≠ 0. Falls K von abweicht(∆K ≠ 0), hat die Matrix [A + RK] mindestens einen am Ursprung gespiegelten Pol der stab

    K̇̇ K̇ K̇ K̇ K̇

    K̇ K̇

    K̇ K̇ Φ̇

    K̇K̇ K̇

    K̇ K̇

    K̇ σ( ) σdτ

    t

    K KK K

    K K K K

    K K K K

    K K K K K K K K

    K K K K K K

    K K

    K

    K K

    19

  • tems

    exi-

    n

    temn der

    alls: DerMini-z.B.

    ufigt diesnerilisie-

    atrix

    Matrix [A + R ]. Es kann also keine LösungK der ARE (außerK = ) das geschlosseneSystem stabilisieren.

    Wenn existiert und [–A, R] stabilisierbar ist, dann muß es eine MatrixK geben, die diePole der Matrix –[A + RK] an die Stelle der Pole der Matrix [A + R ] legt. Da K alle Polegegenüber [A + R ] verschiebt, muß die Differenz∆K = K – regulär sein. =K erfüllt des-halb Gleichung (4.31), und damit auch die ARE (2.3):

    0 = ∆K–1[A + R ]T∆K + [A + R ] (4.32)

    Das System [A + R ] hat also die an der imaginären Achse gespiegelten Pole des Sys[A + R ].

    Beweis von Theorem 2.1b:

    Bedingung i:Trivialerweise muß [A, R] stabilisierbar sein.Bedingung ii:Falls [A, Q] einen nicht beobachtbaren Pol auf der imaginären Achse hat,stiert nach Lemma 6 ein entsprechender Eigenvektorx mit Ax= λx, Re{λ} = 0 und Qx= 0.Multiplizieren der ARE von links mitx* (*: konjugiert-komplex und transponiert) und vorechts mitx ergibt:

    0 = x*ATKx + x*KAx + x*KRKx + x*Qx = (λ* + λ)x*Kx + x*KRKx + x*Qx = x*KRKx

    Für ein beliebigesR mußKx = 0 für alle Lösungen der ARE gelten. Das geschlossene Sys[A + RK] besitzt deshalb diesen nicht beobachtbaren, reinimaginären Pol für alle LösungeARE, da [A + RK]x = Ax= λx.Bedingung iii: Für R indefinit wird diese Voraussetzung in Theorem 2.5a bewiesen. FR ≤ 0 ist, können die Überlegungenvom Beweis von Theorem 1.1 übernommen werdenUnterschied besteht darin, daß die Integrationsgrenzen des Gütekriteriums (4.21) beimmierungsproblem mit unendlichem Horizont unendlich weit auseinander liegen. FallsF > 0 gewählt wird (vgl. Kapitel 3), führt eine nicht stabilisierende Rückführung zwangsläzu einem Divergieren des Gütekriteriums. Jede stabilisierende Rückführung verhinderaber. Wenn [A, R] stabilisierbar ist, wird auch die optimale Rückführung, die sich aus eiLösung der ARE berechnet, stabilisierend sein (sonst wäre sie nicht optimal). Eine stabrende Lösung der ARE muß demnach existieren.

    Beweis von Theorem 2.2b:

    Zuerst wird gezeigt, daß [A, Q] nicht beobachtbare, stabile Pole haben muß, wennsingulär ist. Anschließend wird bewiesen, daß nicht regulär sein kann, wenn [A, Q] nichtbeobachtbare, stabile Pole hat.

    Die stabilisierende Lösung der ARE kann anhand der zeitinvarianten Transitionsm(t, 0) = exp{[A + R ]t} des stabilen geschlossen Systems [A + R ] als Intergralgleichung

    dargestellt werden:

    0 = AT + A + R + Q = [A + R ]T + [A + R ] – R + Q (4.33)

    K K

    KK

    K K K̂

    K K̂

    K̂K

    KK

    KΦ K K

    K K K K K K K K K K

    20

  • ren

    tbarender

    so auchrück-

    d denrte

    h ist,

    (4.34)

    mit d/dt (t, 0) = [A + R ] (t, 0) ; (0, 0) =I

    Falls singulär ist, existiert ein Vektorx, mit x = 0. x muß auch im NullraumN { Q} liegen(N { } ⊆ N { Q}), was erkenntlich ist, wenn die ARE (4.33) von links mitxT und von rechtsmit x multipliziert wird. Da der Nullraum des Integrals von Gleichung (4.34) (für beliebigeR)gleich dem Nullraum von ist, muß dieser - bzw. [A + R ]-invariant sein, d.h. er wirddurch Eigenvektoren von [A + R ] aufgespannt. Diese Eigenvektoren sind auch Eigenvektoder MatrixA, da sie im Nullraum von liegen. Weil sie auch imN { Q} liegen, sind die ent-sprechenden stabilen Eigenwerte nicht beobachtbar.

    Wenn regulär ist, kann die ARE (4.33) von beiden Seiten mit–1 multipliziert werden:

    0 = –1[AT + A + R + Q] –1 = –1[A + R ]T + [A + –1Q] –1

    ⇔ [A + –1Q] = – –1[A + R ]T (4.35)

    Die Matrizen [A + –1Q] und –[A + R ] haben folglich die gleichen Eigenwerte. Hat [A, Q]nicht beobachtbare stabile Poleλ, Re{λ} < 0, liegt der entsprechende Eigenvektorx im N { Q}.λ und x sind dann auch Eigenwerte und Eigenvektoren von [A + –1Q]: [A + –1Q]x= Ax= λx, Re{λ} < 0. Dies kann aber nicht sein, weil alle Eigenwerte von [A + –1Q] instabilsind. ist also singulär.

    In analoger Weise kann bewiesen werden, daß genau dann singulär ist, wenn [A, Q] nichtdetektierbar ist (d.h. wenn [–A, Q] nicht beobachtbare stabile Pole hat).

    Bemerkung 8 ARE für Systeme mit nicht beobachtbaren, stabilen Polen

    Aus Lemma 6, Gleichung (4.15) ist bekannt, daß das System [A, B, C] (BBT = R, CTC = Q)mittels einer Zustandstransformation in einen beobachtbaren und in einen nicht beobachTeil zerlegt werden kann. Diese Ähnlichkeitstransformation beeinflußt weder die PoleStrecke, noch die Pole des geschlossenen Systems. Das Optimierungsproblem kann alfür die transformierte Strecke gelöst werden, wobei die optimale Lösung anschließend zutransformiert werden muß. Die transformierten Matrizen und werden entsprechenMatrizenA undC von (4.15) in vier Blöcke geteilt. Die ARE lautet dann für das transformieSystem:

    (4.36)

    Für die einzelnen Teilmatrizen ergibt das die Gleichungen (da die Gleichung symmetrisc

    K ΦT σ 0,( ) Q K σ( )R K σ( )–[ ] Φ σ 0,( ) σd0

    ∫=

    Φ KΦ Φ

    K KK

    K Φ KK

    K

    K K

    K K K K K K K K K K

    K K K K

    K K

    K KK

    KK̂

    K̃ R̃

    0 0

    0 0

    A11 0

    A21 A22

    TK11 K12K12T K22

    K11 K12K12T K22

    +A11 0

    A21 A22=

    +K11 K12K12T K22

    R11 R12R12T R22

    K11 K12K12T K22

    Q11 0

    0 0+

    21

  • nicht

    ole

    E

    sind die außerdiagonalen Blöcke identisch):

    0 = A11TK11 + A21T K12T + K11A11 + K12A21 + K11R11K11 + K11R12K12T

    + K12R12TK11 + K12R22K12T + Q11 (4.37)

    0 = A11TK12 + A21T K22 + K12A22 + K11R11K12 + K11R12K22

    + K12R12TK12 + K12R22K22 (4.38)

    0 = A22TK22 + K22A22 + K22R22K22 + K12R12K22 + K12TR11K12 + K22R12TK12T (4.39)

    Das stabile geschlossene System hat dann die Form:

    (4.40)

    Die Aufteilung der Blöcke kann auch so erfolgen, daß die nicht asymptotisch stabilen,beobachtbaren Pole von zum TeilblockA11 anstatt zuA22 zugeordnet werden. [A11, Q11] istdann nicht mehr detektierbar, undA22 enthält nur noch die stabilen, nicht beobachtbaren P([A11, R11] ist dann stabilisierbar, wenn [A, R] stabilisierbar ist, daB2 = 0 und somitR12 = 0 undR22 = 0 sein dürfen ( = [B1 B2][B1 B2]T)). In der einzigen stabilisierenden Lösung der ARmüssen dann die BlöckeK22 undK12 = K21T verschwinden, und fürK11ergibt sich die ARE fürdas (um die nicht beobachtbaren, asymptotisch stabilen Pole) reduzierte System [A11, R11, Q11],

    0 = A11TK11 + K11A11 + K11R11K11 + Q11 , (4.41)

    die eine Lösung 11 hat, die das geschlossene System [A11 – R11 11] stabilisiert. Die System-matrix des nicht reduzierten, stabilen geschlossenen Systems,

    , (4.42)

    hat die Pole des reduzierten Systems [A11 – R11 11] und der MatrixA22.

    Bemerkung 9 Die „inverse“ Riccati-Gleichung

    Durch Vertauschen der MatrizenQ undR und Ersetzten der MatrixA durch ihre Transpo-nierte in der ARE (2.3), erhält man die sogenannte inverse ARE:

    0 = PAT + AP + PQP + R = P(–AT) + (–A)P – PQP– R

    = P(–[A + PQ]T) + (–[A + PQ])P + PQP– R (4.43)

    Ã R̃K̃+[ ] A11 0A21 A22

    R11 R12R12T R22

    K11 K12K12T K22

    +=

    A11 R11K+ 11 R12K12T+ R11K12 R22K22+

    A21 R12T K11+ R22K12T+ A22 R12T K+ 12 R22K22+=

    K K

    Ã R̃K̃+[ ]A11 R11K+ 11 0

    A21 R12TK11+ A22K̃= K11 0

    0 0

    =

    K

    22

  • System

    z-

    z.B.lär,

    ) diee

    i-

    Sie hat nach Theorem 2.1 genau dann eine eindeutige Lösung , die das geschlossene(–[A + Q]T) stabilisiert (d.h. [A + Q] vollständig destabilisiert), wenn

    i) [–AT, Q] stabilisierbar ist,ii ) [–AT, R] keinen nicht beobachtbaren Pol auf der imaginären Achse hat,

    und iii ) R< R0, mit R0 ≥ 0 (daQ ≥ 0).Bedingungi ist genau dann erfüllt, wenn [A, Q] keinen nicht beobachtbaren, stabilen (grenstabilen) Pol hat (dann ist übrigens von (2.3) regulär). Voraussetzungii ist genau dannerfüllt, wenn [A, R] keinen nicht steuerbaren Pol auf der imaginären Achse hat. Dies istdann der Fall, wenn [A, R] stabilisierbar ist. Nach Theorem 2.2b ist genau dann reguwenn [–AT, R] keinen nicht beobachtbaren, stabilen Pol besitzt, d.h. wenn [A, R] stabilisierbarist.

    Wenn die ARE (4.43) eine reguläre LösungP hat, erfüllt ihr InversesK = P–1 die ARE (2.3)(K ist folglich auch regulär):

    0 = P–1{ PAT + AP + PQP + R }P–1 = ATP–1 + P–1A + Q +P–1 RP–1

    = ATK + KA + Q +KRK

    Die geschlossenen Systeme (–[A + PQ]T) und [A + RK] haben dann identische Pole:

    0 = ATK + KA + KRK + Q ⇔ K[A + RK] = –[A + K–1Q]TK

    ⇔ [A + RK] = –K–1[A + K–1Q]TK = –K–1[A + PQ]TK (4.44)

    Dies bedeutet insbesondere, daß existiert, wenn [A, R] stabilisierbar ist und existiert.

    Beweis von Theorem 2.2a:

    Wir beweisen dieses Theorem für reguläre . Ist singulär, kann anstelle von (2.3reduzierte ARE (4.41) mit dem regulären11 verwendet werden, mit welchem mit (4.42) disinguläre Lösung berechnet werden kann. Die inverse ARE (4.43) für =–1 undR = 1 – 2 ( 1 2 = 0) ergibt:

    0 = AT + A + [ 1 – 2] + Q (4.45)

    Diese Gleichung wird von links mitx* und von rechts mitx multipliziert, wobeix ein Eigen-vektor vonA ist (Ax= λx):

    0 = (λ* + λ)x* x – x* 2x + x*[ 1 + Q ]x (4.46)

    Wenn > 0, so ist auch > 0. Falls Re{λ} > 0, sind der erste und dritte Term von (4.46) postiv, womit der zweite negativ sein muß. D.h. [A, 2] muß stabilisierbar sein, wenn > 0 ist.

    Wenn umgekehrt (und somit ) indefinit bedeutet, daß [A, 2] nicht stabilisierbar seinkann, muß > 0 sein, wenn [A, 2] stabilisierbar ist. Dazu schreiben wirR = ρ 1 – 2 undverkleinernρ sukzessive bisρ = 0 ist (d.h.R = – 2 ≤ 0). Nach Theorem 2.1b muß (ρ) fürfast alleρ < ρ0 existieren (und (ρ) für alleρ < ρ0). (ρ = 0) erfüllt die ARE:

    0 = [A + R (0)]T (0) + (0)[A + R (0)] + (0) 2 (0) + Q (4.47)

    PP P

    K

    P

    K P

    K KK

    K P KR̂ R̂ R̂ R̂

    P P R̂ R̂ P P

    P R̂ R̂ P P

    K PR̂ K

    K P R̂K R̂ R̂ R̂

    R̂ KP K

    K K K K K R̂K

    23

  • -

    iner

    na-zierte

    t

    -

    ole

    Nach Lemma 3 ist (ρ = 0) > 0 (und somit (ρ = 0) > 0), da [A + R (0)] asymptotisch stabilist und die zwei letzten Terme positiv-semidefinit sind. Wenn (ρ) indefinit und (0) > 0 ist,existiert ein (0 ≤ ≤ ρ), bei welchem ( ) singulär wird, da (ρ) eine kontinuierlicheFunktion vonρ ist. Nach Theorem 2.2b ist dies der Fall, wenn [–AT, R] nicht beobachtbare, stabile Pole besitzt, d.h. wenn [A, R] = [A, 1 – 2] nicht stabilisierbar ist. Da 1 und 2 ortho-gonal sind, ist auch [A, 2] nicht stabilisierbar:Ax= λx, Rx = 1x – 2x = 0 ⇒ 1x = 0,

    2x = 0.❑

    Beweis von Theorem 2.6d:

    Hat die Matrix A keine Eigenwerte auf der imaginären Achse, kann sie mittels eZustandstransformation auf die Form (4.15) gebracht werden, wobeiA11 nur instabile undA22nur asymptotisch stabile Eigenwerte besitzt. Die stabilisierende Lösung (Q = 0) der AREwird dementsprechend die Form (4.42) haben und wird die stabilen Pole vonA nicht verschie-ben, d.h. derN { } wird durch die Eigenvektoren der stabilen Eigenwerte aufgespannt. Alog zur Beweisführung von Theorem 2.2a interessieren wir uns nur noch für das reduSystem, bei welchemA11 vollständig instabil (d.h. Re{λ(A11)} > 0 ∀ λ), aber [A11, R11] stabili-sierbar ist (was der Fall ist, wenn [A, R] stabilisierbar ist, vgl. Bemerkung 8). Die ARE hadann die Form (4.42) mitQ11 = 0:

    0 = A11TK11 + K11A11 + K11R11K11 (4.48)

    Die inverse Gleichung von (4.48) ist eine lineare homogene Matrizengleichung:

    0 = PA11T + A11P + R11 = P(–A11)T + (–A11)P – R11 (4.49)

    Sie hat nach Lemma 3 eine eindeutige LösungP (da–A11 asymptotisch stabil ist) und ist regulär, wenn [–A11T, R11] beobachtbar ist (also wenn [A11, R11] stabilisierbar ist). Für ein reguläresK11 = P–1 folgt:

    0 = A11TK11 + K11[A11 + R11K11] ⇔ [A11 + R11K11] = –K11–1A11TK11 (4.50)

    Das geschlossene System [A11 + R11K11] hat die an der imaginären Achse gespiegelten Pdes offenen SystemsA11. DaA11 vollständig instabil ist, ist [A11 + R11K11] asymptotisch stabil.

    Beweis von Theorem 2.3:

    Wir betrachten zwei verschiedene LösungenK und der ARE (2.3), wobei dasgeschlossene System [A + R ] asymptotisch stabilisieren soll. Für die Differenz∆K = K –gilt Gleichung (4.30):

    0 = [A + RK]T∆K + ∆K[A + RK] – ∆KR∆K (4.51)

    Diese ARE ist vom Typ (4.48) und hat nach Theorem 2.6d genau dann eine Lösung∆K, diedas geschlossene System [A + RK] – ∆KR∆K = [A + R ] stabilisiert, wenn [A + RK] keinePole auf der imaginären Achse hat und [[A + RK], R] stabilisierbar ist (was der Fall ist, wenn

    K P KP P

    ρ̂ ρ̂ P ρ̂ P

    ρ̂ R̂ R̂ R̂ R̂R̂ ρ̂ R̂ R̂ R̂

    K

    K

    K KK K

    K

    24

  • in

    nn iste

    il

    pannt

    [A, R] stabilisierbar ist). Trifft dies zu, existiert, da =K – ∆K.WennK singulär und [A, Q] detektierbar ist, wird der NullraumN { K} von den Eigenvekto-

    ren der stabilen, nicht beobachtbaren Pole von [A, Q] aufgespannt. Die Nullräume vonK undsind also identisch (N { K} = N { }). Die folgenden Überlegungen können deshalb auf e

    um die nicht beobachtbaren Pole reduziertes System angewendet werden, bei dessenK undregulär sind. Für die Differenz∆P = P – der Inversen vonK = P –1 und = –1 ergibt sichdie folgende ARE:

    0 = PAT + AP + R + PQP – { AT + A + R + Q }

    = (P – )AT + A(P – ) + PQP – Q

    = ∆PAT + A∆P – ∆PQ∆P + ∆PQP + PQ∆P

    0 = ∆P[A + PQ]T + [A + PQ]∆P – ∆PQ∆P (4.52)

    Diese ARE ist vom Typ (4.48) und hat genau dann eine Lösung∆P, die das geschlosseneSystem –[A + PQ]T + Q∆P = –[A + Q]T stabilisiert, wenni) [–[A + PQ]T, Q] stabilisierbarist undii ) –[A + PQ]T keinen Pol auf der imaginären Achse hat.∆P ≤ 0, daQ ≥ 0 (vgl. Lemma3). ist regulär, wenniii ) [–AT, R] keinen nicht beobachtbaren, stabilen Pol besitzt.= –1

    existiert, wenn alle drei Bedingungen erfüllt sind: Beii ist das der Fall, wenn [A, Q] keinennicht beobachtbaren, stabilen Pol besitzt, d.h. wenn regulär ist (wenn singulär ist, daes auchK, siehe Bemerkung oben). Beiii darf [A + RK] keinen Pol auf der imaginären Achshaben (vgl. Gleichung (4.44)), undiii ist erfüllt, wenn und [A, R] stabilisierbar ist.

    WennK = P –1 > 0, dann ist auch = –1 = [P – ∆P] –1 > 0 und ≤ K, da∆P ≤ 0 ist.❑

    Beweis von Theorem 2.4:

    Die ARE (2.3) kann mitR= R1 – R2 in

    0 = ATK + KA + KRK + Q = [A – R2K]TK + K[A – R2K] + K [R1 + R2]K + Q (4.53)

    umgeformt werden. Diese Gleichung wird von links mitx* und von rechts mitx multipliziert,wobeix ein Eigenvektor von [A – R2K] ist ([A – R2K]x = λx):

    0 = (λ* + λ)x*Kx + x*[K[R1 + R2]K + Q]x (4.54)

    WennK > 0 ist, muß (λ* + λ) < 0 sein, da der zweite Term positiv ist. (λ* + λ) = 0 ist nichtmöglich, da der zweite Term nur verschwinden kann, wennKx = 0, was fürK > 0 unmöglichist. WennK ≥ 0, singulär ist, kann Gleichung (4.54) für ein beliebigesλ mit Kx = 0 undQx = 0 erfüllt werden.λ ist dann ein nicht beobachtbarer Pol von [A, Q], der im geschlossenenSystem [A – R2K] nicht verschoben wird. Ist [A, Q] detektierbar, muß dieser Pol aber stabsein. WennK = ≥ 0, kann Gleichung (4.54) ohnehin nur für stabileλ erfüllt werden, da derNullraum von durch Eigenvektoren von stabilen, nicht beobachtbaren Polen aufgeswird.

    Wenn [A – R2K] asymptotisch stabil ist, ist nach Lemma 3K ≥ 0, da die Summe der letzten

    K K

    K KK

    P K P

    P P P P

    P P P P

    P

    P K P

    K K

    K P K

    KK

    25

  • n. Für

    ung

    f

    zwei Terme von (4.53) positiv-semidefinit sind.K ist positiv-definit, wenn [[A – R2K], Q]beobachtbar ist. Dies ist der Fall, wenn [A, Q] beobachtbar ist, da wenn [[A – R2K], Q] nichtbeobachtbar ist, auch [A, Q] nicht beobachtbar ist: [A – R2K]x = λx, Qx = 0 ⇒ Kx = 0 ⇒Ax= λx.

    Beweis von Theorem 2.5a:

    Wir betrachten die stabilisierenden Lösungen ( ) und (R) von zwei ARE (2.3) mitunterschiedlichen Matrizen undR. Die nicht beobachtbaren, stabilen Pole von [A, Q] wer-den im geschlossenen System [A + R ] nicht verschoben und sind unabhängig vonR. ( )und (R) sind dann singulär und haben denselben Nullraum, da [A, Q] bei beiden ARE gleichist. Falls sie singulär sind, verwenden wir das reduzierte System mit regulären Lösungedie Differenz ∆P = P – der Inversen von (R) = P –1 und ( )= –1 ergibt sich mit∆R = R– die folgende ARE:

    0 = PAT + AP + R + PQP – { AT + A + + Q }

    = (P – )AT + A(P – ) + PQP – Q + R –

    = ∆PAT + A∆P + ∆PQ∆P + ∆PQ + Q∆P + ∆R

    0 = ∆P[A + Q]T + [A + Q]∆P + ∆PQ∆P + ∆R (4.55)

    Wenn ∆R = R– ≤ 0 (Minimierungsproblem), hat diese ARE hat genau dann eine Lös∆P, die das geschlossene System –[A + Q]T – Q∆P = –[A + PQ]T stabilisiert, wenn i)[–[A + Q]T, Q] stabilisierbar ist undii ) [–[A + Q]T, ∆R] keinen nicht beobachtbaren Pol auder imaginären Achse hat.∆P ≥ 0, da∆R ≤ 0 undQ ≥ 0 (vgl. Lemma 3).P ist regulär, wenniii ) [–AT, R] keinen nicht beobachtbaren, stabilen Pol besitzt. (R) = P –1 existiert, wenn alledrei Bedingungen erfüllt sind und ( ) existiert: Die Bedingungeni und ii sind erfüllt, da–[A + Q]T asymptotisch stabil ist.iii ist erfüllt, wenn [A, R] stabilisierbar ist.

    Wenn ( )= –1 > 0, dann ist auch (R) = P –1 = [ + ∆P] –1 > 0. Daraus folgt für dienicht reduzierten Lösungen: wenn ( )≥ 0, dann ist auch (R) ≥ 0.

    Beweis von Theorem 2.5b:

    Wir betrachten die stabilisierenden Lösungen = ( ) undK = (R) von zwei ARE (2.3)mit unterschiedlichen Matrizen undR. Für die Differenz∆K = (R) – ( ) ergibt sich mit∆R = R– die folgende ARE:

    0 = ATK + KA + KRK + Q – { AT + A + + Q }]

    = AT(K – ) + (K – )A + KRK– + ( K K – K K )

    KR KR

    K KRK

    P K KR PR

    P P R P P

    P P P P R

    P P

    P P

    RP

    P P

    KKR

    PKR P K P

    KR K

    K KR KR K KR

    R

    K K KRK

    K K KRK R R

    26

  • n

    le desst

    ).

    = AT∆K + ∆KA + ∆K ∆K + ∆KR + R∆K + K∆RK

    0 = [A + ]T∆K + ∆K[A + ] + ∆K ∆K + K∆RK (4.56)

    Für kleine∆R, ∆R → 0, wird auch∆K klein, ∆K → 0, und die Terme höherer Ordnung könnevernachlässigt werden:

    0 = [A + ]T∆K + ∆K[A + ] + K∆RK (4.57)

    Wenn∆R ≤ 0, dann ist∆K ≤ 0, da [A + ] asymptotisch stabil ist.❑

    Beweis von Theorem 2.5c:

    Wir beziehen uns auf die Resultate aus dem Beweis von Theorem 2.5a. Für die Poreduzierten Systems mitK = P –1 regulär gilt nach Gleichung (4.44) (die Spur einer Matrix igleich der Summe aller Eigenwerte):

    λi (–[A + PQ]T) = λi ([A + RK]) ∀ i ⇔ spur{[A + RK]} = spur{–[A + PQ]T}

    = spur{–[A + Q]T – Q∆P} = spur{–[A + Q]T} + spur{–Q∆P} (4.58)

    ∆P ≥ 0 kann geschrieben werden als∆P = DTD, mit D ∈ p×n undp = rang{∆P}:

    spur{–Q∆P} = spur{–QDTD} = spur{–DQDT} ≤ 0

    ⇔ spur{–[A + PQ]T} ≤ spur{–[A + Q]T}

    ⇔ spur{[A + R (R)]} ≤ spur{[A + ( )]} (4.59)

    Beweis von Theorem 2.5d:

    Der GrenzwertKR∞ ≥ 0 von (R) für R → –∞ existiert, weil (R) monoton sinkt mitR(vgl. Theorem 2.5b), aber (R) für alleR ≤ 0 positiv-semidefinit sein muß (vgl. Theorem 2.4

    Multiplizieren der ARE (2.3) von links mitBT[–sI – A] –T und von rechts mit [sI – A]–1Bergibt mit entsprechendem Zusammenfassen der Terme (mitK = , BBT = –R undCTC = Q,wobeiB ∈ n×m, C ∈ p×n, m= rang{R}, p = rang{Q} und n = dim{A}):

    0 = AT + A – BBT + CTC + { s – s }

    = –[–sI – A]T – [sI – A] – BBT + CTC

    0 = BT[–sI – A]–T { –[–sI – A]T – [sI – A] – BBT + CTC }[ sI – A] –1B

    = –BT [sI – A] –1B – BT[–sI – A]–T B – BT[–sI – A]–T BBT [sI – A] –1B

    + BT[–sI – A]–TCTC[sI – A–1B

    R K K

    RK RK R

    RK RK

    RK

    P P

    IR

    P

    K RKR

    K KK

    KIR IR

    K K K K K K

    K K K K

    K K K K

    K K K K

    27

  • (4.3)

    tensenen

    r

    blemgrößetz aufn, eines-

    = –[Im + BT [–sI – A] –1B]T[Im + BT [sI – A] –1B] + Im + BT[–sI – A]–TCTC[sI – A] –1B

    ⇔ [Im + BT [–sI – A] –1B]T[Im + BT [sI – A] –1B] = Im + GT(–s)G(s) (4.60)

    Die Determinante von Gleichung (4.60) ergibt mit den Determinanten-Regeln (4.1) bisund den Definitionen der charakteristischen Polynomeφ(s) undϕ(s) von Gleichung (4.20) mitdem charakteristischen Polynom des geschlossenen Systemsφcl(s) = det{sI – [A – BBT ]}= det{sI – [A + R ]}:

    det{[Im + BT [–sI – A] –1B]T[Im + BT [sI – A] –1B]} = det{ Im + GT(–s)G(s)}

    = det{[Im + BT [–sI – A] –1B]T}det{[ Im + BT [sI – A] –1B]} = det{ Ip + G(s)GT(–s)}

    det{[Im + BT [sI – A] –1B]} = det{[ In + BBT [sI – A] –1]}

    = det{sI – [A – BBT ]} / det{[ sI – A]} = φcl(s) / φ(s)

    ⇔ φcl(–s) φcl(s) = det{Ip + G(s)GT(–s)} φ(–s) φ(s) (4.61)

    Gleichung (4.61) ist ein Polynom 2n-ter Ordnung mit an der imaginären Achse gespiegelNullstellen. Diejenigen der linken Halbebene entsprechen den Polen des geschlosSystems [A + R ].

    Den GrenzübergangR → –∞ realisieren wir, indem wir den skalaren Parameterρ inR= –ρ–1BBT gegen Null streben lassen,ρ → 0. Fallsm ≥ p ist, hat der AusdruckG(s)GT(–s)vollen Rangp. Für den Grenzübergangρ → 0 gilt somit (det{G(s)} = ϕ(s)/φ(s), vgl. Glei-chung (4.20)):

    = ρ–p det{G(s)GT(–s)} φ(–s) φ(s) = ρ–p ϕ(–s) ϕ(s) (4.62)

    Aus dem Polynom (4.61) 2n-ter Ordnung wurde also das Polynom (4.62) 2nν-ter Ordnung,indem die 2(n–nν) höchsten Potenzen gegen Null konvergieren, wobeinν die Anzahl Nullstel-len des offenen Systems ist. D.h. 2(n–nν) Nullstellen von (4.61) divergieren und 2nν Nullstel-len konvergieren gegen die Nullstellen vonG(s) bzw. gegen ihre Spiegelbilder (bezüglich deimaginären Achse). Da die Pole des geschlossenen Systems [A + R ] (Nullstellen des Poly-nomsφcl(s)) asymptotisch stabil sind, konvergieren sie gegen die Nullstellen vonϕ(s), fallsdiese in der linken Halbebene liegen, und gegen die Nullstellen vonϕ(–s), falls die Nullstellenvon ϕ(s) in der rechten Halbebene liegen. Die restlichen (stabilen) Pole divergieren.

    Fallsm > p ist, kann die RegelstreckeG(s) mit einer Rechtecksmatrix der Dimensionp × mvormultipliziert werden, so daß die Regelstrecke quadratisch wird. Das Optimierungsprokann dann für diese quadratische Strecke gelöst werden, wobei die optimale Stellanschließend mit dieser Rechtecksmatrix multipliziert werden muß, damit das Regelgesedie ursprüngliche Strecke angewendet werden kann. Gelingt es unter diesen Umständeperfekte Regelung zu erzielen (KR∞ = 0), ist dies sicher auch möglich, wenn das Optimierungproblem auf die ursprüngliche Strecke angewendet wird, da der Regler dann nochm – p

    K K

    K K

    KK

    K K

    K K

    K K

    K

    K

    φcl s–( )φcl s( ){ }ρ 0→lim det I p ρ 1– G s( )GT s( )+{ }φ s–( )φ s( ){ }

    ρ 0→lim=

    K

    28

  • n

    en des

    ,

    -

    it

    zusätzliche Stellgrößen zur Verfügung hat. Im Folgenden wird deshalbp = m angenommen.FallsKR∞ = 0 ist, reduziert sich die ARE zu:

    { AT + A – ρ–1 BBT + CTC} = { ρ–1 BBT + CTC} (4.63)

    Diese Gleichung kann nur eine Lösung haben, falls rang{B} ≥ rang{C}. Ist dies der Fall, gilt

    {ρ–1/2BT } = UC , (4.64)

    wobei U eine beliebige unitäre Matrix ist (UTU = I ). Für die Pollage des geschlosseneSystems ergibt sich damit:

    φcl(s) = det{sI – [A + R ]} = det{sI – [A – ρ–1BBT ]}

    = det{[In + ρ–1BBT [sI – A] –1]} det{[ sI – A]}

    = det{[Im + ρ–1BT [sI – A] –1B]} det{[ sI – A]}

    ⇔ { φcl(s)}= { det{[ Im + ρ–1BT [sI – A] –1B]} }det{[ sI – A]}

    = { det{ρ–1/2ρ–1/2BT [sI – A] –1B} }det{[ sI – A]}

    = det{ρ–1/2UC[sI – A] –1B} det{[ sI – A]} = det{ρ–1/2U} det{G(s)} φ(s)

    = det{ρ–1/2U} ϕ(s) (4.65)

    FallsKR∞ = 0, konvergieren also die Pole des geschlossenen Systems gegen die Nullstelloffenen Systems. Da die Pole stabil sind, ist dies aber nur möglich, wenn [A, B, C] minimal-phasig ist. D.h. [A, B, C] minimalphasig und rang{B} ≥ rang{C} sind Voraussetzungen fürperfekte Regelung. Sind andererseits diese Bedingungen erfüllt, genügtKR∞ = 0 der ARE undstabilisiert das geschlossene System, da die unitäre MatrixU immer so gewählt werden kanndaß auch die divergierenden Pole stabil sind.

    Beweis von Theorem 2.6a:

    Wir betrachten die stabilisierenden Lösungen ( ) und (Q) von zwei ARE (2.3) mitunterschiedlichen Matrizen undQ. ( ) ist singulär, wenn [A, ] nicht beobachtbare, stabile Pole besitzt. Für 0≤ Q ≤ sind diese Pole dann aber auch für [A, Q] nicht beobachtbar,undN { ( )} ⊆ N { ( )}. Falls ( ) singulär ist, verwenden wir das reduzierte System mregulärer Lösung. Für die Differenz∆P = P – der Inversen von (Q) = P –1 und

    ( ) = –1 ergibt sich mit∆Q = Q – die folgende ARE:

    0 = PAT + AP + R + PQP – { AT + A + R+ }

    = (P – )AT + A(P – ) + PQP – + { Q – Q }

    ρ 0→lim K K K K

    ρ 0→lim K K

    ρ 0→lim K

    K K

    K

    K

    ρ 0→lim

    ρ 0→lim K

    ρ 0→lim K

    KQ KQ KQ Q

    QKQ KQ KQ

    P KKQ P Q

    P P PQP

    P P PQP P P P P

    29

  • ne

    l

    ndasn

    st

    n

    = ∆PAT + A∆P + ∆PQ∆P + ∆PQ + Q∆P + ∆Q

    0 = ∆P[A + Q]T + [A + Q]∆P + ∆PQ∆P + ∆Q (4.66)

    Wenn ∆Q = Q – ≤ 0 und 0≤ Q (Minimierungsproblem), hat diese ARE genau dann eiLösung∆P, die das geschlossene System –[A + Q]T – Q∆P = –[A + PQ]T stabilisiert, wenni)[–[A + Q]T, Q] stabilisierbar ist undii ) [–[A + Q]T, ∆Q] keinen nicht beobachtbaren Poauf der imaginären Achse hat.∆P ≥ 0, da∆Q ≤ 0 und Q ≥ 0 (vgl. Lemma 3).P ist regulär,wenniii ) [–AT, R] keinen nicht beobachtbaren, stabilen Pol besitzt. (Q) = P –1 existiert, wennalle drei Bedingungen erfüllt sind und ( ) existiert:

    Bedingungi ist erfüllt, wenn [–AT, Q] stabilisierbar ist, d.h. wenn [A, Q] keinen nicht beob-achtbaren Polλ mit Re{λ} ≤ 0 hat. Hat [A, Q] einen nicht beobachtbaren Polλ mit Re{λ} < 0,existiert keine stabilisierende Lösung, jedoch ein reguläre LösungP, die die verbleibendenPole stabilisiert. Nach Gleichung (4.44) existiert dann eine singuläre Lösung (Q), die dasgeschlossene System [A + R (Q)] stabilisiert. Die Voraussetzung, daß [A, Q] für Pole λ mitRe{λ} = 0 beobachtbar ist, bleibt bestehen. Bedingungii kann nicht verletzt werden, da wen[–[A + Q]T, ∆Q] einen nicht beobachtbaren Pol auf der imaginären Achse hat, auchasymptotisch stabile System [–[A + ]T, ∆Q] diesen nicht beobachtbaren Pol habemüßte: –[A + Q]T]x = λx, Re{λ} = 0 und ∆Qx= 0 ⇔ –[A + ]T]x = λx. Die letzte Vor-aussetzungiii ist erfüllt, wenn [A, R] stabilisierbar ist. Sie kann nicht verletzt werden, da son

    ( ) nicht existieren würde.Wenn –1 > 0, dann ist auchP–1 = [ + ∆P] –1 > 0. Daraus folgt für die nicht reduzierten

    Lösungen: wenn ( )≥ 0, dann ist auch (Q) ≥ 0.❑

    Beweis von Theorem 2.6b:

    Wir betrachten die stabilisierenden Lösungen = ( ) undK = (Q) von zwei ARE (2.3)mit unterschiedlichen Matrizen undQ. Für die Differenz∆K = (Q) – ( ) ergibt sich mit∆Q = Q – die folgende ARE:

    0 = ATK + KA + KRK + Q – { AT + A + R + }

    = AT(K – ) + (K – )A + KRK– R + Q –

    = AT∆K + ∆KA + ∆K ∆K + ∆KR + R∆K + ∆Q

    0 = [A + R ]T∆K + ∆K[A + R ] + ∆KR∆K + ∆Q (4.67)

    Für kleine∆Q, ∆Q → 0, wird auch∆K klein, ∆K → 0, und die Terme höherer Ordnung könnevernachlässigt werden:

    0 = [A + R ]T∆K + ∆K[A + R ] + ∆Q (4.68)

    Wenn∆Q ≤ 0, dann ist∆K ≤ 0, da [A + R ] asymptotisch stabil ist.❑

    P P P P

    P P P P

    QP

    P P P

    KKQ

    KK

    P PPQ P

    P P PQ

    KQP P

    KQ K

    K KQ KQ K KQ

    Q

    K K K K Q

    K K K K Q

    R K K

    K K

    K K

    K

    30

  • e der

    lsx

    Beweis von Theorem 2.6c:

    Wir beziehen uns auf die Resultate aus dem Beweis von Theorem 2.6a. Für die SummPole der geschlossenen Systeme gilt mit∆K = (Q) – ( ):

    spur{[A + R (Q)]} = spur{[ A + R ( )]} + spur{R∆K} (4.69)

    WennR= BBT ≥ 0 oderR = –BBT ≤ 0 mit B ∈ n×m undm = rang{∆K} ist, gilt (für ∆Q ≤ 0 ist∆K ≤ 0):

    R= BBT ≥ 0: spur{R∆K} = spur{B∆KBT} ≥ 0

    ⇔ spur{[A + R (Q)]} ≥ spur{[A + R ( )]} (4.70)

    R= –BBT ≤ 0: spur{–R∆K} = spur{–B∆KBT} ≤ 0

    ⇔ spur{[A + R (Q)]} ≤ spur{[A + R ( )]} (4.71)

    4.5 Beweise der Theoreme von Abschnitt 2.3

    Bemerkung 10 Die Lösung der RDE in Abhängigkeit der Lösungen der ARE

    Wir stellen die LösungK(t) = K + ∆K(t) der RDE (2.1) mit der Endbedingung (2.2) aSumme einer beliebigen LösungK der ARE (2.3) und einer zeitvariablen Differenz-Matri∆K(t) dar, wobei∆K(t) der folgenden RDE genügen muß:

    – (t) – 0= ATK(t) + K(t)A + K(t)RK(t) + Q – { ATK + KA + KRK + Q }

    = AT(K(t) –K) + (K(t) –K)A + K(t)RK(t) – KRK

    = AT(K(t) –K) + (K(t) –K)A + (K(t) –K)R(K(t) –K) +(K(t) –K)RK + KR(K(t) –K)

    –∆ (t) = [A + RK]T∆K(t) + ∆K(t)[A + RK] + ∆K(t)R∆K(t) ;

    ∆K(t1) = F – K = ∆F (4.72)

    Die entsprechende inverse Gleichung lautet (d/dt{ ∆K(t)–1} = – ∆K(t)–1∆ (t)∆K(t)–1):

    –∆ (t)–1 = ∆K(t)–1[A + RK]T + [A + RK]∆K(t)–1 + R ;

    ∆K(t1)–1 = [F – K] –1 = ∆F–1 (4.73)

    Mit Hilfe der zeitinvarianten TransitionsmatrixΦ(t1, t) = exp{[A + RK](t1 – t)} kann die

    K KQ

    K KQ

    IR

    K KQ

    K KQ

    31

  • ären

    -

    Lösung dieser linearen Matrix-Differentialgleichung explizit dargestellt werden:

    (4.74)

    Der Integralterm im zweiten Teil entspricht der SteuerbarkeitsmatrixW(t1, t) (4.11) desSystems [[A + RK], R] (falls [A, R] steuerbar ist, istW(t1, t) regulär):

    Sie erfüllt die Differential-Gleichung (4.12) und kann als Summe der eindeutigen, stationLösungW der Lyapunov-Gleichung (4.5) und einer zeitvariablen Differenz-Matrix∆W(t) dar-gestellt werden:W(t1, t) = W+ ∆W(t). Die Gleichungen fürW und∆W(t) lauten dann:

    0 = W[A + RK]T + [A + RK]W + R (4.75)

    ∆ (t) = ∆W(t)[A + RK]T + [A + RK]∆W(t) ; ∆W(t1) = –W

    ⇔ ∆W(t) = –Φ(t1, t)WΦT(t1, t) (4.76)

    Einsetzen vonW(t1, t) in (4.74) und Zurückinvertieren ergibt fürK(t) = K + ∆K(t):

    ∆K(t) = ΦT(t1, t){ In – ∆F [W – Φ(t1, t)WΦT(t1, t)]} –1∆FΦ(t1, t)

    K(t) = K + ΦT(t1, t){ In – ∆F [W – Φ(t1, t)WΦT(t1, t)]} –1∆FΦ(t1, t) (4.77)

    Falls die EndbedingungF kleiner alsK gewählt wird,F ≤ K, kann (4.77) mit Hilfe des Inver-sions-Lemmas (4.4) und∆F = F – K = –DTD ≤ 0 mit D ∈ p×n, p = rang{∆F} noch umge-formt werden:

    { In + DTDW(t1, t)} –1DT = {In – DT[DW(t1, t)DT + Ip] –1DW(t1, t)} DT

    = DT{ In – [DW(t1, t)DT + Ip] –1DW(t1, t)DT}

    = DT [DW(t1, t)DT + Ip] –1{[ DW(t1, t)DT + Ip] – DW(t1, t)DT}

    = DT [DW(t1, t)DT + Ip] –1

    ⇔ ∆K(t) = –ΦT(t1, t)DT{ Ip + D[W – Φ(t1, t)WΦT(t1, t)]DT} –1DΦ(t1, t)

    ⇔ K(t) = K – ΦT(t1, t)DT{ Ip + D[W – Φ(t1, t)WΦT(t1, t)]DT} –1DΦ(t1, t) (4.78)

    Für ∆F = F – K ≥ 0 kann die obige Gleichung verwendet werden, indem z.B.D durch –Dersetzt wird.

    Wenn∆K(t) für t → –∞ gegen einen stationären Wert∆K konvergiert, muß dieser den Glei

    ∆K t( ) 1– Φ t t1,( )∆F 1– ΦT t t1,( ) Φ t σ,( )RΦT t σ,( ) σdt

    t1

    ∫–=

    = Φ 1– t1 t,( )∆F 1– I n ∆F Φ t1 σ,( )RΦT t1 σ,( ) σdt

    t1

    ∫– Φ T– t1 t,( )

    W t1 t,( ) Φ t1 σ,( )RΦTΦ t1 σ,( ) σdt

    t1

    ∫=

    IR

    32

  • reder

    ystems

    derrt, die-ie

    rden,n.39))

    a-

    --

    .

    ng8)

    chungen (4.29) bis (4.31) genügen. Falls [A, R] steuerbar ist, existiert genau eine reguläLösung∆K. Sie ist die Differenz zwischen der eindeutigen stabilisierenden Lösung undeindeutigen destabilisierenden Lösung , bei welcher alle Pole des geschlossenen S[A + R ] instabil sind,∆K = – .

    Bemerkung 11 RDE für Systeme mit nicht beobachtbaren stabilen Polen

    Hat das System [A, Q] nicht beobachtbare, stabile Pole, ist die stabilisierende LösungARE singulär. Aus Lemma 6 ist bekannt, daß dann eine Zustandstransformation existiedie MatrizenA undC (bzw. Q = CTC) in die Form (4.15) tranformiert, wobei die nicht detektierbaren Pole hier im TeilblockA11 enthalten sein sollen. Analog zu Bemerkung 8 kann dRDE (2.1) mit der Endbedingung (2.2) für das transformierte System aufgestellt weindem auch die MatrizenR, K und F transformiert und aufgeteilt werden. Die einzelneBlöcke müssen dann die folgenden Gleichungen erfüllen (vgl. Gleichung (4.37) bis (4(die Abhängigkeit der Zeit wird hier nicht explizit angegeben:K = K(t)):

    – 11 = A11TK11 + A21T K12T + K11A11 + K12A21 + K11R11K11 + K11R12K12T

    + K12R12TK11 + K12R22K12T + Q11 ; K11(t1) = F11 (4.79)

    – 12 = A11TK12 + A21T K22 + K12A22 + K11R11K12 + K11R12K22

    + K12R12TK12 + K12R22K22 ; K12(t1) = F12 (4.80)

    – 22 = A22TK22 + K22A22 + K22R22K22 + K12R12K22 + K12TR11K12 + K22R12TK12T ;

    K22(t1) = F22 (4.81)

    Ist 0 ≤ F ≤ , dann haben die Systeme [A, Q] und [A, F] gemeinsame, nicht beobachtbare stbile Pole (d.h. [A, [Q F]T] ist nicht beobachtbar) und der Nullraum vonF muß mindestens sogroß sein, wie derjenige von , d.h. (N { } ⊆ N { F}). Entsprechend verschwinden die TeilblöckeF22 undF12, F22 = 0 undF12 = F21T = 0. Die Lösungen für die obigen Gleichungen lauten dann: 12(t) ≡ 0, 22(t) ≡ 0 und

    – 11(t) = A11TK11(t) + K11(t)A11 + K11(t)R11K11(t) + Q11 ; K11(t1) = F11. (4.82)

    Beweis von Theorem 3.1:

    Besitzt die ARE eine LösungK ≥ 0, so existiert immer eine EndbedingungF ≥ 0, so daßK(t) für t → –∞ gegenK konvergiert. Die trivialste EndbedingungF = K führt nämlich injedem Fall auf die LösungK(t) ≡ F = K ∀ t ≤ t1 (für K = ist dies jedoch die einzige, vglTheorem 3.2). D.h.K(t) divergiert nur dann für alleF ≥ 0, wenn keine LösungK ≥ 0 der AREexistiert.

    Das transiente Verhalten der LösungK(t) der RDE und das Verhalten beim Grenzübergat → –∞ kann in Abhängigkeit der EndbedingungF anhand der Gleichungen (4.77) und (4.7beurteilt werden, falls die entsprechenden LösungenK, vor allem und , der ARE existie-

    KK̂

    K̂ K̂ K

    K

    K

    K K

    K̇ K̇

    K̂ K

    33

  • zungrvall.

    rt-

    toreneineigen

    lei-

    elie-

    derber

    che

    rie

    n der)

    iert

    ren. Wird der invertierte Term zu einem endlichen Zeitpunkt singulär, ist die Voraussetvon Theorem 1.1 verletzt, und die RDE hat einen konjugierten Punkt im endlichen InteIst der Ausdruck [In – ∆FW] singulär fürK = , existiertK(t) in allen endlichen Intervallen,divergiert jedoch beim Grenzübergangt → –∞.

    Eine periodische LösungK(t) stellt sich für t → –∞ ein (vorausgesetzt,K der ARE exi-stiert), wenn die Matrix [A + RK] ein konjugiert-komplexes Polpaar besitzt, dessen konjugiekomplexe Eigenvektoren das gleiche∆F-Abbild haben (und kein weiterer Pol mit größeremRealteil existiert, dessen Eigenvektor ebenfalls das gleiche∆F-Abbild hat). Dies ist möglich,falls A ein konjugiert-komplexes Polpaar besitzt, dessen konjugiert-komplexe Eigenvekdas gleicheF-Abbild haben. Ist dies ein nicht beobachtbares Polpaar, dann existiertLösungK der ARE, deren Nullraum durch diese Eigenvektoren aufgespannt wird. Die obAnnahmen treffen in diesem Fall sicher zu, da dann [A + RK]x = Ax= λx und∆Fx = Fx.

    Die periodische Lösung soll hier nur schematisch erläutert werden. Wir multiplizieren Gchung (4.78) von links mit [xi xj]T und von rechts mit [xi xj], wobei xi undxj ein konjugiert-komplexes Eigenvektorenpaar zu den Polenλ i,j = σ ± jω der Matrix [A + RK] sind. Besitzenxiund xj das gleiche∆F-Abbild, d.h. ∆Fxi = α∆Fxj, muß ∆F singulär sein und kann als∆F = –DTD ≤ 0 mit D ∈ 1×n formuliert werden (das Vorzeichen von∆F und die restlichenKomponenten von∆F haben hier keinen Einfluß und werden deshalb weggelassen bzw. bbig angenommen). Aus dem TermDΦ(t1, t)[xi xj] wird dann mitDxi = αDxj:

    DΦ(t1, t)[xi xj] = DΦ(t1, t)[xi xj] = D[exp{λ i(t1 – t)} xi αexp{λ j (t1 – t)} xj]

    = [exp{λ i (t1 – t)} + αexp{λ j (t1 – t)}] xi

    = exp{σ(t1 – t)}[exp{ jω(t1 – t)} + αexp{–jω(t1 – t)}] xi

    = exp{σ(t1 – t)} cos{ jω(t1 – t) + φ} xi

    Die beiden skalaren Werte exp{σ(t1 – t)} können somit in Gleichung (4.78) mitexp{–σ(t1 – t)} in den inversen Term hineingenommen werden, wo sie sich mit denjenigenTermeDΦ(t1, t)WΦT(t1, t)DT neutralisieren können. Der Cosinus-Term neutralisiert sich ai.a. nicht, da er eine unterschiedliche Phaseφ aufweist. Istσ > 0, divergiertΦ(t1, t) für t → –∞,und der Term [Ip + DWDT] kann vernachlässigt werden. In diesen Fällen ist die periodisLösung stabil, d.h. sie stellt sich auch dann ein, wenn die EndbedingungF nicht exakt in derstationären periodischen LösungK(t) liegt. Ist σ < 0, können sich die Exponential-Terme nuaufheben, wenn der Term [Ip + DWDT] singulär ist und den entsprechenden Nullraum hat. DEndbedingungF muß dann exakt auf der stationären periodischen LösungK(t) liegen.

    Beweis von Theorem 3.2:

    Wenn die ARE eine stabilisierende Lösung hat, dann kann das transiente VerhalteLösungK(t) der RDE (auch fürt → –∞) in Abhängigkeit von mit den Gleichungen (4.77und (4.78) dargestellt werden, indem in Bemerkung 10K = angenommen wird. Die Transi-tionsmatrixΦ(t1, t) verschwindet dann asymptotisch, da das geschlossene System [A + R ]stabil ist. WirdF so gewählt, daß der Term, der invertiert wird, nicht singulär wird, konvergK(t).

    K

    IR

    KK

    KK

    34

  • en-rixden:

    n

    -

    -amit-

    -

    ) und

    und

    Das transiente Verhalten vonK(t) kann aber auch in Abhängigkeit der destabilisierendLösungK = der ARE dargestellt werden, falls [–A, R] stabilisierbar ist. Da dann die Transitionsmatrix fürt → –∞ mit vollem Rang divergiert (d.h. alle Eigenwerte der Transitionsmatdivergieren) undW regulär ist, können die konstanten Terme in (4.78) vernachlässigt wer

    = ΦT(t1, t)DT{ D Φ(t1, t)WΦT(t1, t)DT} –1DΦ(t1, t)

    = + ΦT(t1, t)DT{ D Φ(t1, t)WΦT(t1, t)DT} –1DΦ(t1, t) (4.83)

    Damit K(t) gegen konvergiert, muß der Grenzwert∆K∞ regulär sein. In allen anderen FällekonvergiertK(t) gegen einen GrenzwertK∞, der das geschlossene System [A + RK∞] nicht sta-bilisiert. Dies trifft immer dann zu, wennD nicht quadratisch, also∆F singulär ist.

    Wenn der instabile Zustandsraum der Matrix [A + R ] gleich dem NullraumN {[ F – ]}ist, definiert dieser auch den NullraumN {[ F – ]}, da sich die Systeme [A + R ] und[A + R ] nur in den stabilen Polen unterscheiden. Der Ausdruck∆FΦ(t1, t) von Gleichung(4.77) mitK = und∆F = [F – ] divergiert deshalb nicht fürt → –∞, da die divergierendenKomponenten der TransitionsmatrixΦ(t1, t) des Systems [A + R ] immer im NullraumN { ∆F} liegen. Da die restlichen Komponenten vonΦ(t1, t) asymptotisch verschwinden, verschwindet auch∆K(t) für t → –∞.

    Existiert die Lösung nicht, weil [–A, R] nicht stabili