42
OUTLINE TEORI KONTROL LINEAR Oleh: Dr. Fatmawati, M.Si Departemen Matematika Fakultas Sains dan Teknologi Universitas Airlangga 2012

TKL Bahan Ajar

Embed Size (px)

DESCRIPTION

tkl

Citation preview

OUTLINE

TEORI KONTROL LINEAR

Oleh:

Dr. Fatmawati, M.Si

Departemen Matematika

Fakultas Sains dan Teknologi

Universitas Airlangga

2012

Daftar Isi

1 Pendahuluan 1

1.1 Pengantar Teori Sistem Kontrol. . . . . . . . . . . . . . . . . . . . . . . 1

1.2 Masalah Kontrol Optimal. . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 Ruang Keadaan dan Fungsi Transfer 5

2.1 Teori Kontrol Klasik dan Modern . . . . . . . . . . . . . . . . . . . . . 5

2.2 Representasi Ruang Keadaan . . . . . . . . . . . . . . . . . . . . . . . 5

2.3 Fungsi Transfer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2.4 Turunan dan Integral Matriks . . . . . . . . . . . . . . . . . . . . . . . 8

2.5 Solusi Sistem Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

3 Sifat-sifat Dasar Sistem 11

3.1 Keterkendalian dan Keterobservasian . . . . . . . . . . . . . . . . . . . 11

3.1.1 Keterkendalian . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

3.1.2 Keterobservasian . . . . . . . . . . . . . . . . . . . . . . . . . . 13

4 Kestabilan Sistem 15

5 Keterstabilan dan Keterdeteksian Sistem 17

5.1 Keterstabilan Sistem . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

5.2 Keterdeteksian Sistem . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

6 Optimasi Statis 19

6.1 Optimasi tanpa Constrains . . . . . . . . . . . . . . . . . . . . . . . . . 20

6.2 Optimasi dengan Constrains . . . . . . . . . . . . . . . . . . . . . . . . 21

7 Prinsip Pontryagin 24

7.1 Prinsip Pontryagin Minimum (Maksimum) . . . . . . . . . . . . . . . . 24

7.2 Ringkasan Prinsip Pontriyagin Minimum . . . . . . . . . . . . . . . . . 26

8 Kontrol optimal dengan Linear Quadratic Regulator (LQR) 27

8.1 Ongkos Optimal dengan Hukum Kontrol State-Feedback . . . . . . . . 29

8.2 Ringkasan LQR Waktu Kontinu (Kasus State Akhir Free) . . . . . . . 30

2

8.3 Kontrol Lup-Terbuka (Kasus State Akhir Fixed) . . . . . . . . . . . . . 31

8.4 Ringkasan LQR untuk kasus Lup-Terbuka (State Akhir Fixed) . . . . . 33

8.5 Steady-State Feedback . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

9 Kontrol optimal untuk Tracking 36

Daftar Pustaka 39

3

1 Pendahuluan

1.1 Pengantar Teori Sistem Kontrol.

• Beberapa terminologi dasar.

– Sistem adalah kumpulan beberapa komponen yang saling berinteraksi untuk

suatu tujuan tertentu. Sebagai contoh misalkan sistem biologi, fisika dan

bisa juga sistem ekonomi.

– Teori sistem merupakan bidang yang mempelajari fenomena input/output.

– Sistem Kontrol merupakan bidang yang mengkaji pengaturan sistem se-

hingga berperilaku sesuai yang diinginkan dengan spesifikasi tertentu.

– Obyek yang dikontrol/dikendalikan biasanya disebut plant.

– Sistem kendali umpan balik (feedback) adalah sistem kendali yang sinyal

keluarannya mempunyai pengaruh langsung pada aksi pengendalian.

• Model Matematika

– Prinsip pemodelan (melalui hukum Newton, Kirchoff, dsb)

– Identifikasi sistem (melalui eksperimen)

– Kombinasi prinsip pemodelan dan indentifikasi sistem untuk mendapatkan

model matematika.

Contoh Motivasi.

• d(t): Jarak mobil dari O pada waktu t.

• d(t) = α(t) + β(t),

d: percepatan, α: penambah kecepatan dan β: rem

• x1(t) := d(t): posisi dan x2(t) := d(t): kecepatan

1

• u1(t) := α(t) dan u2(t) := β(t).

• Persamaan state

x1(t) = x2(t)

x2(t) = u1(t) + u2(t).

• Dalam notasi matriks

x(t) =

0 1

0 0

x(t) +

0 0

1 1

u(t) (1)

dengan x(t) =

x1(t)

x2(t)

dan u(t) =

u1(t)

u2(t)

Kendala Fisik.

• Definisikan kendala atau constraint dari state x.

– Diasumsikan mobil bergerak dari keadaan diam dan berhenti di titik e.

– t0: waktu pada saat meninggalkan O

– tf : waktu pada saat tiba di e, sehingga diperoleh

x1(t0) = 0 x1(tf ) = e,

x2(t0) = 0 x2(tf ) = 0.

Dalam notasi matriks, syarat batas tersebut dapat ditulis sebagai

x(t0) =

0

0

, x(tf ) =

e

0

. (2)

– Syarat tambahan

0 ≤ x1(t) ≤ e, 0 ≤ x2(t). (3)

• Definisikan constraint dari input kontrol u.

– Misalkan maksimum percepatan adalah M1 > 0 dan maksimum pelambatan

adalah M2 > 0, maka diperoleh

0 ≤ u1(t) ≤M1, −M2 ≤ u2(t) ≤ 0. (4)

2

• Sebagai tambahan, misalkan mobil bergerak dengan G liter bensin, maka con-

straint lainnya adalah

∫ tf

t0

[k1u1(t) + k2x2(t)]dt ≤ G (5)

Ilustrasi konsep kontrol u yang diperkenankan (admissible).

Kriteria Performansi.

• Untuk mengevaluasi performansi (kinerja) sistem, para desainer/perancang (de-

signer) memilih ukuran performasi.

• Kontrol optimal didefinisikan sebagai salah satu alat untuk meminimumkan (memak-

simumkan) ukuran performansi.

• Misalkan performansi dari sistem dievaluasi berdasarkan ukuran dengan bentuk

sebagai berikut

J = h(x(tf ), tf ) +

∫ tf

t0

g(x(t), u(t), t)dt, (6)

dengan t0 dan tf masing-masing adalah waktu awal dan akhir, h dan g adalah

fungsi skalar.

• tf mungkin sudah ditentukan atau bisa juga bebas, tergantung pada permasala-

han yang dibicarakan.

3

1.2 Masalah Kontrol Optimal.

• Menentukan kontrol yang diperkenankan u∗ yang menyebabkan sistem

x(t) = g(x(t), u(t), t)

mengikuti trayektori yang diperkenankan x∗, yang meminimumkan ukuran per-

formansi

J = h(x(tf ), tf ) +

∫ tf

t0

g(x(t), u(t), t)dt. (7)

• u∗ disebut kontrol optimal dan x∗ disebut trayektori optimal.

4

2 Ruang Keadaan dan Fungsi Transfer

2.1 Teori Kontrol Klasik dan Modern

.

• Teori kontrol klasik berdasarkan pada transformasi Laplace yang dinyatakan

dalam bentuk fungsi transfer (domain frekuensi) dan hanya memuat single-input

dan single-output (SISO).

• Teori kontrol modern dinyatakan dalam bentuk ruang keadaan (domain waktu)

sehingga dapat diaplikasikan pada sistem dengan multi-input dan multi-output

(MIMO), linear atau nonlinear, time-invariant atau time-varying.

• Fungsi transfer pada sistem linear, time-invariant (SISO) didefinisikan sebagai

hasil bagi (rasio) antara tranformasi Laplace dari output terhadap transformasi

Laplace dari input, dengan asumsi nilai awal nol dan dinyatakan sebagai

G(s) =Y (s)

U(s), (8)

dengan Y (s) adalah transformasi Laplace output y(t) dan

U(s) adalah transformasi Laplace input u(t).

2.2 Representasi Ruang Keadaan

• Setiap persamaan diferensial biasa (PDB) linear dengan koefisien konstan dapat

dinyatakan dalam bentuk ruang keadaan berikut

x(t) = Ax(t) +Bu(t), y(t) = Cx(t) +Du(t), (9)

dengan x(t) disebut vektor keadaan, u(t) vektor input, y(t) vektor output, dengan

x(t) ∈ Rn, u(t) ∈ Rm, y(t) ∈ Rp dan A,B,C dan D adalah matriks-matriks yang

ukurannya bersesuaian.

• Diberikan persamaan diferensial sebagai berikut

qn(t) + a1q(n−1)(t) + a2q

(n−2)(t) + ...+ an−1q(t) + anq(t) = u, (10)

5

dan disumsikan bahwa nilai awal q(0), q(0), ..., q(n−1)(0) diketahui.

Jika didefinisikan x1 = q, x2 = q, ..., xn = q(n−1), maka kita dapat menuliskan

pers. (9) sebagai sistem persamaan diferensial berorde 1, katakanlah

x1 = x2

x2 = x3...

x(n−1) = xn

xn = −anx1 +−a(n−1)x2 − ...− a1xn + u,

sehingga dapat ditulis dalam bentuk persamaan diferensial matriks

x1

x2...

x(n−1)

xn

=

0 1 · · · 0 0

0 0 · · · 0 0...

.... . . · · · · · ·

0 0 · · · 0 1

−an −an−1 · · · −a2 −a1

x1

x2...

x(n−1)

xn

+

0

0...

0

1

u.

Jika output sistem didefinisikan sebagai y = x1, maka dapat dinyatakan sebagai bentuk

matriks berikut

y =(

1 0 0 0 0)

x1

x2...

xn

.

Dari uraian di atas terlihat bahwa bentuk PDB (10) dapat dikonversi menjadi bentuk

sistem (9).

2.3 Fungsi Transfer

Transformasi Laplace

• Transformasi Laplace dari fungsi kontinu f(t), dinotasikan dengan L[f(t)], didefin-

isikan sebagai

L[f(t)] = F (s) =

∫ ∞0

f(t)e−stdt, (11)

6

dengan s = σ + iω, dan σ, ω adalah bilangan real.

• Transformasi Laplace dari fungsi f(t) eksis jika

limR→∞

∫ R

0

f(t)e−stdt, (12)

eksis untuk Re(s) > k yakni

limt→∞|f(t)|e−kt = 0. (13)

• Dari (11), f(t) disebut invers transformasi Laplace dari F (s), ditulis sebagai

L−1[F (s)] = f(t).

• Transformasi Laplace bersifat linear yakni untuk konstanta α, β berlaku

L[αf1(t) + βf2(t)] = αF1(s) + βF2(s).

Fungsi Transfer

• Diberikan sistem linear waktu kontinu, time-invariant berikut ini

x(t) = Ax(t) +Bu(t), x(0) = 0, (14)

y(t) = Cx(t) +Du(t). (15)

• Misalkan x(t) =

x1(t)

x2(t)...

xn(t)

.

Definisikan L[x(t)] =

L[x1(t)]

L[x2(t)]...

L[xn(t)]

=

X1(s)

X2(s)...

Xn(s)

= X(s)

• Dengan definisi tersebut, maka

L[x(t)] =

L[x1(t)]

L[x2(t)]...

L[xn(t)]

=

sX1(s)− x1(0)

sX2(s)− x2(0)...

sXn(s)− xn(0)

= sX(s)− x(0).

7

• Fungsi transfer dari u ke y untuk sistem (14)-(15) didefinisikan sebagai

Y (s) = G(s)U(s),

dengan U(s) dan Y (s) masing-masing adalah transformasi Laplace dari u(t) dan

y(t) dengan syarat awal x(0) = 0. Dari definisi tersebut dapat diperoleh

G(s) = C(sI − A)−1B +D.

• Jika (14)-(15) berupa sistem MIMO, maka G(s) disebut pula sebagai matriks

transfer.

• Beberapa pengertian dasar:

– Sistem G(s) disebut stricly proper jika G(s)→ 0 untuk s→∞.

– Sistem G(s) disebut semi-proper atau bi-proper jika G(s) → D 6= 0 untuk

s→∞.

– Sistem G(s) yang stricly proper atau semi-proper disebut proper.

– Sistem G(s) disebut improper jika G(s)→∞ untuk s→∞.

2.4 Turunan dan Integral Matriks

Pada bagian ini akan diuraikan pengertian turunan dan integral pada matriks seprti

yang tertuang pada definisi berikut ini.

Definisi 1 Misalkan A(t) = [aij(t)], maka

• ddtA(t) = A(t) =

[ddt

(aij(t))]

dan

•∫A(t) =

[∫aij(t)dt

].

Contoh.

A(t) =

6t sin 2t

t2 + 2 3

maka,

A(t) =

6 2 cos 2t

2t 0

, dan

∫A(t) =

3t2 −12

cos 2t

13t3 + 2t 3t

+ C,

dengan C adalah matriks konstan.

8

Berdasarkan definisi tersebut, sifat-sifat turunan dan integral kalkulus juga dapat

diaplikasikan pada matriks.

Jika α dan β adalah konstanta dan diberikan matriks A(t) dan B(t). Maka,

i. ddt

(αA(t) + γB(t)) = αA(t) + βB(t).

ii.∫ ba

(αA(t) + γB(t)) dt = α∫ baA(t)dt+ β

∫ baB(t)dt.

iii. ddt

(A(t)B(t) = A(t)B(t) + A(t)B(t).

Eksponensial Matriks.

Berikut ini akan diberikan pengertian eksponsial matriks dan sifat-sifatnya.

Definisi 2 Misalkan A adalah matriks persegi berukuran n× n, maka

eAt =∞∑n=0

(At)n

n!= I + At+

1

2!A2t2 +

1

3!A3t3 + ...

dengan I = A0.

Berdasarkan Definisi 2, beberapa sifat ekponensial dapat diterapkan pada eksponensial

matriks, antara lain:

i. eA(t+s) = eAteAs.

ii. (eAt)−1 = e−At

iii. ddt

(eAt)

= AeAt = eAtA.

iv. Jika P matriks invertible, maka PeAtP−1 = ePAP−1t

v. Jika A adalah matriks yang dapat didiagonalkan sehingga A = PDP−1, maka

eAt = PeDtP−1

2.5 Solusi Sistem Linear

Pada bagian ini akan diuraikan solusi dari sistem persamaan (9). Persamaan tersebut

merupakan gabungan antara persamaan diferensial dan persamaan aljabar. Pandang

kembali sistem persamaan diferensial berikut

x(t) = Ax(t) +Bu(t), x(0) = x0. (16)

9

Solusi dari sistem (16) adalah

x(t) = eAtx0 +

∫ t

0

e(t−τ)Bu(τ)dτ, t ≥ 0. (17)

Langkah pembuktian (Metode langsung).

Kita dapat menuliskan persamaan (16) dalam bentuk

x(t)− Ax(t) = Bu(t)

Kalikan kedua ruas dengan matriks e−At, sehingga diperoleh

e−At (x(t)− Ax(t)) = e−AtBu(t), atau

d

dt

[e−Atx(t)

]= e−AtBu(t).

Dari sini, kita dapat mengintegralkan kedua ruas, sehingga didapat

e−Atx(t)− x(0) =

∫ t

0

e−AτBu(τ)dτ, sehingga

x(t) = eAtx0 +

∫ t

0

eA(t−τ)Bu(τ)dτ. (18)

Dengan demikian output y(t) pada persamaan (9) dapat dinyatakan sebagai

y(t) = C

(eAtx0 +

∫ t

0

e(t−s)Bu(s)ds

)+Du. (19)

Matriks eksponensial eAt pada solusi (17) merupakan matriks transisi dari sistem

x(t) = Ax(t), yang biasanya dinotasikan dengan

Φ(t) = eAt.

Dengan notasi matriks transisi ini, persamaan (17) dapat pula dinyatakan sebagai

x(t) = Φ(t)x0 +

∫ t

0

Φ(t− τ)Bu(τ)dτ, t ≥ 0. (20)

10

3 Sifat-sifat Dasar Sistem

3.1 Keterkendalian dan Keterobservasian

Konsep keterkendalian dan keterobservasian diperkenalkan oleh Kalman pada tahun

1960 sebagai dasar menuju teori kontrol modern. Pertanyaan fundamental untuk sistem

adalah sebagai berikut:

• Dapatkah menentukan fungsi kontrol (kendali) u(t) yang akan mentransformasi

state awal x0 ke state final yang diinginkan xf untuk waktu berhingga?

• Dapatkah menentukan state dari sistem dengan mengukur output sistem untuk

interval waktu yang berhingga?

Dua pertanyaan di atas berturut-turut akan mengarah pada sifat keterkendalian dan

keterobservasian sistem.

Perhatikan kembali sistem linear waktu kontinu (14)-(15) dengan x(t) ∈ Rn, u(t) ∈

Rm dan y(t) ∈ Rp. Sedangkan A,B,C dan D adalah matriks-matriks konstan yang

ukurunnya bersesuaian.

Solusi dari sistem (14)-(15) dengan nilai awal x(0) = x0 akan ditulis sebagai x(t, x0, u)

dan output yang bersesuaian dinyatakan dengan y(t, x0, u) yakni

x(t, x0, u) = eAtx0 +∫ t0eA(t−τ)Bu(τ)dτ (21)

y(t, x0, u) = CeAtx0 +∫ t0CeA(t−τ)Bu(τ)dτ +Du(t). (22)

Sistem (14)-(15) selanjutnya akan dinotasikan dengan sistem (A,B,C,D).

3.1.1 Keterkendalian

Pengertian keterkendalian sistem (A,B,C,D) diberikan pada definisi berikut.

Definisi 3 Sistem (A,B,C,D) dikatakan terkendali jika untuk setiap dua titik x0 dan

x1 dan t1 > 0, terdapat u(t) sedemikian sehingga berlaku x(t1, x0, u) = x1.

Sifat-Sifat Keterkendalian

Keterkendalian sistem dapat diverifikasi melalui kriteria aljabar, seperti yang berikan

pada teorema berikut.

11

Teorema 1 Pernyataan berikut ekivalen

(i) Sistem (A,B,C,D) terkendali.

(ii) Matriks gramian keterkendalian

Wc(t) =

∫ t

0

eAτBB∗eA∗τdτ

definit positif untuk sebarang t > 0.

(iii) Matriks keterkendalian

C =[B AB A2B · · · An−1B

]mempunyai rank baris penuh.

(iv) Matriks[A− λI B

]mempunyai rank baris penuh untuk semua λ ∈ C.

(v) Misalkan λ dan x berturut-turut adalah nilai eigen dan vektor eigen dari A,

artinya x∗A = x∗λ, maka x∗B 6= 0.

Bukti. (i)⇔ (ii):

Misalkan Wc(t1) > 0 untuk suatu t1 > 0, dan definisikan input u(τ) sebagai berikut

u(τ) = −B∗eA∗(t1−τ)Wc(t1)−1 [eAtx0 − x1] .

Substitusikan bentuk u tersebut ke solusi sistem (21), maka diperoleh x(t1) = x1.

Karena x1 dipilih sebarang, maka terbukti pasangan (A,B) terkendali.

Selanjutnya akan ditunjukkan bahwa jika (A,B) terkendali, maka Wc(t) > 0 untuk

sebarang t > 0. Andaikan (A,B) terkendali tetapi Wc(t1) singular untuk suatu t1 > 0.

Karena eAtBB∗eA∗t ≥ 0 untuk semua t, maka terdapat vektor v 6= 0, dengan v ∈ Rn

sehingga berlaku

v∗eAtBB∗eA∗tv = 0, t ∈ [0, t1].

Dari sini, diperoleh v∗eAtB = 0, t ∈ [0, t1]. Kemudian, setting x(t1) = x1 = 0 dan

terapkan pada solusi (21), maka didapat

0 = eAt1x(0) +

∫ t1

0

eA(t1−τ)Bu(τ)dτ. (23)

Kalikan (23) deari kiri dengan vektor v∗ sehingga diperoleh 0 = v∗eAt1x(0). Jika dipilih

nilai awal x(0) = e−At1v, maka akan diperoleh v = 0 sehingga timbul kontradiksi.

Dengan demikian, terbukti bahwa Wc(t) > 0 untuk sebarang t > 0.

12

3.1.2 Keterobservasian

Selanjutnya akan diberikan pengertian keterobservasian sistem (A,B,C,D) seperti

yang tertuang pada definisi berikut.

Definisi 4 Sistem (A,B,C,D) dikatakan terobservasi jika untuk setiap u(t) terdapat

t1 > 0, sehingga untuk y(t, x0, u) = y(t, x1, u) mengakibatkan x0 = x1.

Dengan kata lain, sistem (A,B,C,D) dikatakan terobservasi jika state x(0) dapat

dikonstruksi berdasarkan informasi dari u dan y pada interval [0, t1].

Berikutnya akan ditunjukkan bahwa keterobservasian sistem (A,B,C,D) hanya tergan-

tung pada matriks A dan C, sehingga kadang-kadang disebut sebagai keterobservasian

dari pasangan (C,A).

Karakterisasi Keterobservasian

Seperti pada sifat keterkendalian sistem, sifat keterobservasian dapat dikarakterisasi

melalui kriteria aljabar sebagai berikut.

Teorema 2 Pernyataan berikut ekivalen

(i) Sistem (A,B,C,D) terobservasi.

(ii) Matriks gramian keterobservasian

Wo(t) =

∫ t

0

eA∗τC∗CeAτdτ

definit positif untuk sebarang t > 0.

(iii) Matriks keterobservasian

O =

C

CA

CA2

...

CAn−1

mempunyai rank kolom penuh.

Bukti Teorema 2: Pada kasus ini akan ditunjukkan ekivalensi (i) dan (iii).

(i)⇐ (iii): Misalkan O mempunyai rank kolom penuh, sehingga rank(O) = n. Diambil

13

sebarang t1 > 0 dan input u sehingga berlaku y(t, x0, u) = y(t, x1, u) untuk semua

t ∈ [0, t1]. Karena y(t, x0, u) = y(t, x1, u), maka berakibat

CeAtx0 +

∫ t

0

CeA(t−τ)Bu(τ)dτ +Du(t) = CeAtx1 +

∫ t

0

CeA(t−τ)Bu(τ)dτ +Du(t).

Dari sini diperoleh CeAtx0 = CeAtx1 atau CeAt(x0 − x1) = 0 untuk semua t ∈ [0, t1].

Kemudian integralkan CeAt(x0 − x1) = 0 terhadap t sebanyak (n − 1) kali, sehingga

diperoleh

CeAt(x0 − x1) = 0, t = 0→ C(x0 − x1) = 0

CAeAt(x0 − x1) = 0, t = 0→ CA(x0 − x1) = 0

...

CAn−1eAt(x0 − x1) = 0, t = 0→ CAn−1(x0 − x1) = 0.

Dari sini, diperoleh O(x0 − x1) = 0. Karena rank(O) = n, maka ker(O) = 0. Akibat-

nya x0 − x1 = 0 atau x0 = x1. (i)⇒ (iii)

Misalkan rank(O) < n. Diambil dua vektor yang berbeda x0 dan x1 sedemikian se-

hingga x0 − x1 ∈ ker(O). Maka

C(x0 − x1) = CA(x0 − x1) = . . . CAn−1(x0 − x1) = 0.

Berdasarkan Teorema Cayley-Hamilton, akan diperoleh CAk(x0−x1) = 0, k = 0, 1, . . ..

Akibatnya

CeAt(x0 − x1) =∞∑k=0

tk

k!CAk(x0 − x1) = 0

untuk semua t. Hal ini ekivalen dengan y(t, x0, u) = y(t, x1, u) untuk semua t. Dari

sini dapat disimpulkan bahwa sistem (A,B,C,D) tidak terobservasi. �

Catatan: Teorema Cayley-Hamilton diberikan dalam teorema berikut.

Teorema 3 Misalkan A ∈ Cn×n dengan polinomial karakteristik diberikan oleh p(λ) =

det(λI − A). Maka A memenuhi p(A) = 0.

Dari sini dapat dikatakan bahwa An dapat dinyatakan sebagai kombinasi linear dari

Aj, j = 0, 1, . . . , n− 1.

14

Konsep Dualitas

Walaupun sifat-sifat keterkendalian dan keterobservasian sangat berbeda, tetapi kon-

disi rank matriks keterkendalian dan keterobservasian sangat mirip, seperti yang ter-

tuang dalam teorema berikut.

Teorema 4 Pasangan (A,B) terkendali jika dan hanya jika pasangan (BT , AT ) ter-

observasi. Demikian pula, Pasangan (C,A) terobservasi jika dan hanya jika pasangan

(AT , CT ) terkendali.

Bukti: (A,B) terkendali ⇐⇒ rank[B AB A2B · · · An−1B

]= n

⇐⇒ rank[B AB A2B · · · An−1B

]T= n

⇐⇒ rank

BT

BTAT

BT (AT )2

...

BT (AT )(n− 1)

= n

⇐⇒ (BT , AT ) terobservasi.

Bagian kedua dapat dibuktikan secara similar. �

Berdasarkan teorema sebelumnya dapat disimpulkan bahwa sistem x(t) = Ax(t) +

Bu(t) terkendali jika dan hanya jika sistem z(t) = AT z(t), y(t) = BT z(t) terobservasi.

Transpos dari matriks adalah contoh sederhana dari konsep dualitas.

catatan:

Ruang dual dari Rn adalah himpunan semua fungsi-fungsi linear ϕ : Rn → R dan

untuk kasus ini isomorfis dengan himpunan vektor-vektor baris berdimensi n. Ruang

dual ini biasanya ditulis sebagai (Rn)∗ yang dapat diidentifikasi sebagai Rn itu sendiri.

4 Kestabilan Sistem

Konsep kestabilan memegang peranan penting pada sistem. Berikut ini akan disajikan

definisi titik setimbang (titik stasioner, titik tetap).

Definisi 5 Diberikan sistem autonomous

x = f(x), (24)

15

dengan x ∈ Rn. Titik setimbang dari persamaan autonomous adalah titik x yang

memenuhi f(x) = 0.

Catat: sistem persamaan diferensial autonomous artinya fungsi f tidak memuat t

secara eksplisit.

• Pengertian tentang kestabilan diberikan pada definisi berikut ini.

Definisi 6 Titik setimbang x dikatakan stabil jika diberikan ε > 0 terdapat δ > 0

sehingga untuk sebarang solusi x(t) dari (24) yang memenuhi ‖x(t0)−x(t0)‖ < δ

maka ‖x(t)− x(t)‖ < ε untuk t > t0.

Secara intuitif pengertian stabil adalah untuk kondisi awal yang diambil di sekitar

titik setimbang, maka solusi dari persamaan tersebut akan berada dipersekitaran

titik setimbang juga.

• Pengertian stabil asimtotis diberikan pada definisi berikut

Definisi 7 Titik setimbang x dikatakan stabil asimtotis jika stabil dan jika terda-

pat konstanta b > 0 sehingga jika ‖x(t0)−x(t0)‖ < b maka limt→∞ ‖x(t)−x(t)‖ =

0.

Karakterisasi konsep kestabilan asimtotis diberikan pada Teorema berikut.

Teorema 5 Diberikan sistem persamaan diferensial linear x(t) = Ax(t) dengan A

berukuran n × n dengan nilai eigennya adalah λi, i = 1, 2, ...n. Titik asal x = 0 stabil

asimtotis jika dan hanya jika Reλi < 0.

Berikut ini akan disajikan karakterisasi kestabilan Lyapunov.

Teorema 6 Diberikan sistem persamaan diferensial linear x(t) = Ax(t). Semua nilai

eigen dari matriks A mempunyai bagian real negatif jika dan hanya jika untuk setiap

matriks Q yang definit positif (Q > 0) terdapat matriks P > 0 sehingga memenuhi

A′P + PA = −Q. (25)

16

5 Keterstabilan dan Keterdeteksian Sistem

5.1 Keterstabilan Sistem

Selain sifat kestabilan, pada sistem juga dikenal sifat keterstabilan. Hal ini biasanya

berkaitan dengan sistem yang tidak stabil, sehingga kita ingin mengubah perilaku

sistem yang tidak stabil tersebut menjadi sistem yang stabil.

Definisi 8 Sistem x(t) = Ax(t) + Bu(t) dikatakan terstabilkan jika terdapat state

umpan balik u(t) = Fx(t) sehingga A + BF stabil asimtotis, atau, nilai eigen λ dari

A+BF , Re(λ) < 0.

Teorema berikut akan mendasari keterkaitan sifat keterkendalian dan keterstabilan

sistem.

Teorema 7 Sistem x(t) = Ax(t) + Bu(t) dikatakan terkendali jika dan hanya jika

untuk setiap polinomial p(λ) = λn+pn−1λn−1+. . .+p0 dengan koefisien real, sedemikian

sehingga terdapat matriks F yang menyebabkan det (λI − (A+BF )) = p(λ).

Dari sini, jika (A,B) terkendali, maka polinomial karakteristik dari (A+BF ) dapat

dipilih sebarang sesuai dengan pemilihan F .

Dengan demikian, nilai eigen dari (A+BF ) dapat ditempatkan di sebarang lokasi.

Jika dipilih nilai eigen λ dari (A+BF ) sehingga Re(λ) < 0, yaitu jika x(t) = (A+BF )x

terkendali, maka sistem tersebut juga terstabilkan.

Teorema 7 dikenal juga sebagai Teori Penempatan Pole.

5.2 Keterdeteksian Sistem

Berikutnya akan diberikan pengertian keterdeteksian sistem yang merupakan sifat dual

dari keterstabilan sistem.

Definisi 9 Sistem x(t) = Ax(t), y(t) = Cx(t) atau pasangan (C,A) dikatakan terde-

teksi jika terdapat matriks L sehingga A+LC stabil asimtotis, atau, nilai eigen λ dari

A+ LC, Re(λ) < 0.

17

Konsep dualitas antara keterdeteksian dan keterstabilan dituangkan pada teorema

berikut ini.

Teorema 8 Pasangan (C,A) terdeteksi jika dan hanya jika pasangan (AT , CT ) tersta-

bilkan.

18

6 Optimasi Statis

• Misalkan x ∈ Cn adalah vektor, s ∈ C skalar dan f(x) ∈ Cm berupa fungsi vektor

dari x.

• Diferensial terhadap x dan turunannya terhadap x berturut-turut adalah

dx =

dx1

dx2...

dxn

,dx

ds=

dx1/ds

dx2/ds...

dxn/ds

.

• Jika s adalah fungsi dari x, maka gradient dari s terhadap x berupa kolom vektor

sx =∂s

∂x=

∂s/∂x1

∂s/∂x2...

∂s/∂xn

.

(Catatan: Beberapa referensi kadang dinyatakan dengan vektor baris.)

• Diferensial total terhadap s dinyatakan sebagai

ds =

(∂s

∂x

)T

dx =n∑i=1

∂s

∂xidxi.

• Jika s adalah fungsi dari dua vektor x dan y, maka

ds =

(∂s

∂x

)T

dx+

(∂s

∂y

)T

dy.

• Hessian dari s terhadap x adalah turunan kedua yaitu

sxx =∂2s

∂x2=

[∂2s

∂xi∂xj

],

yang tak lain berupa matriks simetri berukuran n× n.

• Ekspansi deret Taylor dalam bentuk gradient dan Hessian dari s(x) disekitar x0

adalah

s(x) = s(x0) +

(∂s

∂x

)T

(x− x0) +1

2(x− x0)T

∂2s

∂x2(x− x0) +O(3), (26)

dengan O(3) menyatakan sisa orde ke-3.

19

• Jacobian dari f terhadap x adalah matriks berukuran m× n

fx =∂f

∂x=[

∂f∂x1

∂f∂x2

. . . ∂f∂xn

]. (27)

• Diferensial total dari f adalah

df =∂f

∂xdx =

n∑i=1

∂f

∂xidxi.

Beberapa rumus turunan matriks yang sering digunakan adalah

∂x

(yTx

)= ∂

∂x

(xTy

)= y, (28)

∂x

(yTAx

)= ∂

∂x

(xTATy

)= ATy (29)

∂x

(yTf(x)

)= ∂

∂x

(fT(x)y

)= fT

x y, (30)

∂x

(xTAx

)= Ax+ ATx, (31)

Dan jika Q merupakan matriks simetri, maka berlaku

∂x

(xTQx

)= 2Qx, (32)

∂x

((x− y)TQ(x− y)

)= 2Q(x− y). (33)

6.1 Optimasi tanpa Constrains

• Index performansi skalar L(u) diberikan sebagai fungsi dari kontrol atau vektor

keputusan u ∈ Rm. Tujuan kita adalah bagaimana memilih u sehingga L(u)

minimum.

• Perhatikan ekspansi deret Taylor untuk increment (pertambahan) dalam L se-

bagai

dL = LTudu+

1

2duTLuudu+O(3), (34)

dengan Lu = ∂L∂u

adalah gradien L terhadap u dan Luu = ∂2L∂u2

adalah matriks

Hessian.

• Titik kritis (stasioner) dicapai ketika Lu = 0. Agar titik kritis bersifat minimum

lokal, maka

dL =1

2duTLuudu+O(3) positif untuk semua increment du. (35)

Hal ini dicapai ketika Luu definit positif, yaitu Luu > 0.

20

• Jika Luu definit negatif maka titik kritis Lu bersifat maksimum lokal.

6.2 Optimasi dengan Constrains

• Sekarang pandang index performansi skalar L(x, u) sebagai fungsi dari vektor

kontrol u ∈ Rm dan vektor keadaan (state) x ∈ Rn. Permasalahannya adalah

bagaimana memilih u sehingga L(u) minimum dan memenuhi persamaan con-

straint

f(x, u) = 0, (36)

dengan f adalah himpunan fungsi n persamaan skalar, sehingga f ∈ Rn.

• Didefinisikan fungsi Hamiltonian

H(x, u, λ) = L(x, u) + λTf(x, u), (37)

dengan λ ∈ Rn adalah pengali Lagrange.

• Increment dari H tergantung pada increment dari x, u dan λ yakni

dH = HTx dx+HT

u du+HTλ dλ. (38)

Catat bahwa

Hλ =∂H

∂λ= f(x, u), (39)

sehingga kita dapat memilih u dan mensyaratkan

Hλ = 0. (40)

• Dari sini, x dapat ditentukan oleh u berdasarkan f(x, u) = 0, yang merupakan

syarat constraint. Dalam hal ini, Hamiltonian sama dengan indeks performansi

ketika

H|f=0 = L. (41)

• Pilih λ sehingga

Hx = 0, (42)

21

sehingga diperoleh

∂H

∂x= Lx + fT

x λ = 0. (43)

• Jika (39) dan (42) terpenuhi, maka

dL = dH = HTu du, (44)

karena dalam hal ini H = L.

• Untuk mencapai titik stasioner, kita harus menentukan kondisi stasioner yaitu

Hu = 0. (45)

• Dengan demikian, syarat cukup titik minimum dari L(x, u) yang memenuhi con-

straint f(x, u) = 0 adalah

∂H

∂λ= f = 0, (46)

∂H

∂x= Lx + fT

x λ = 0, (47)

∂H

∂u= Lu + fT

u λ = 0, (48)

dengan H(x, u, λ) diberikan oleh (37).

• Nilai λ sebenarnya merupakan variabel penghubung untuk menentukan nilai u, x

dan nilai minimum dari L.

• Dengan mengenalkan pengali Lagrange, kita dapat mengganti persoalan mem-

inimumkan L(x, u) dengan constraint f(x, u) = 0 menjadi persoalan memini-

mumkan Hamiltonian H(x, u, λ) tanpa constraint.

• Selanjutnya akan kita uji bahwa titik (46)-(48) adalah titik minimum. Tulis

ekspansi deret Taylor untuk increment L dan f sebagai berikut

dL =[LTx LT

u

] dx

du

+ 12

[dxT duT

] Lxx Lxu

Lux Luu

dx

du

+O(3)

df = [fx fu]

dx

du

+ 12

[dxT duT

] fxx fxu

fux fuu

dx

du

+O(3),

dengan fxu = ∂2f∂u∂x

, dst.

22

• Untuk mengenalkan Hamiltonian, perhatikan persamaan berikut

[1 λT]

dL

df

=[HTx HT

u

] dx

du

+ 12

[dxT duT

] Hxx Hxu

Hux huu

dx

du

+O(3).

• Untuk mencapai titik stasioner kita memebutuhkan f = 0 dan juga orde pertama

dari dL sama dengan nol untuk semua increment dx, du. Karena f = 0, maka

df = 0, sehingga kondisi ini mengakibatkan Hx = 0 dan Hu = 0 sebagaimana

diberikan oleh (46)-(48).

23

7 Prinsip Pontryagin

7.1 Prinsip Pontryagin Minimum (Maksimum)

Prosedur untuk menyelesaikan masalah kontrol optimal dengan menggunakan Prinsip

Pontryagin Minimum adalah sebagai berikut:

• Misalkan sistem yang akan dikontrol (plant) mempunyai model dinamik sebagai

berikut

x(t) = f(x, u, t) (49)

dengan state x(t) ∈ Rn dan input kontrol u(t) ∈ Rm.

• Pada kasus ini dipilih Indeks Performansi

J(t0) = φ(x(tf ), tf ) +

∫ tf

t0

L(x(t), u(t), t)dt, (50)

dengan φ(x(tf ), tf ) adalah fungsi bobot akhir yang tergantung pada state akhir

x(tf ) dan waktu akhir tf . Sedangkan fungsi bobot L(x, u, t) tergantung pada

state dan input pada interval waktu [t0, tf ].

• Masalah optimal kontrol di sini adalah menentukan input kontrol u∗(t) pada

interval [t0, tf ] sehingga akan membawa plant (49) sepanjang trayektori x∗(t)

sedemikian sehingga Indeks Performansi (50) minimum.

• Input kontrol u(t) ini selanjutnya disebut Kontrol Optimal.

• Kita akan menggunakan Pengali Lagrange untuk menggabungkan plant (49) de-

ngan Indeks Performansi (50) ke dalam suatu fungsi skalar J ′(t0)

J ′(t0) = φ(x(tf ), tf ) +

∫ tf

t0

[L(x(t), u(t), t) + λT(t) (f(x, u, t)− x)

]dt. (51)

• Karena persamaan (49) berlaku untuk setiap t ∈ [t0, tf ], sehingga kita membu-

tuhkan pengali Lagrange λ(t) ∈ Rn, yang merupakan fungsi terhadap waktu.

• Jika didefinisikan Fungsi Hamiltonian sebagai berikut

H(x, u, t) = L(x(t), u(t), t) + λT(t)f(x, u, t), (52)

24

maka persamaan (51) dapat ditulis sebagai

J ′(t0) = φ(x(tf ), tf ) +

∫ tf

t0

[H(x, u, t)− λT(t)x

]dt. (53)

• Aturan Leibniz untuk fungsional menyatakan bahwa jika J(x(t)) =∫ tft0h(x(t), t)dt

adalah fungsional skalar

(J(·) dan h(·) adalah fungsi skalar), maka

dJ = h(x(tf ), tf )dtf − h(x(t0), t0)dt0 +

∫ tf

t0

[hTx (x(t), t)δx

]dt, (54)

dengan

δx(ta) = dx(ta)− x(ta)dta. (55)

• Dengan menggunakan aturan ini, maka total differensial dari fungsi J ′(t0) pada

persamaan (53) adalah

dJ ′(t0) = φTx dx|tf + φT

t dt|tf + (H − λTx)dt|tf − (H − λTx)dt|t0 (56)

+∫ tft0

[HTx δx+HT

u δu− λT(t)δx+ (Hλ − x)Tδλ]dt.

• Perhatikan bahwa

−∫ tf

t0

λT(t)δxdt = −λTδx|tf + λTδx|t0 +

∫ tf

t0

λTδxdt. (57)

• Jika persamaan (57) dan (55) disubstitusikan ke persamaan (56), maka diperoleh

dJ ′(t0) = (φx − λ)Tdx|tf + (φt +H)dt|tf −Hdt|t0 + λTdx|t0 (58)

+∫ tft0

[(Hx + λ)Tδx+HT

u δu+ (Hλ − x)Tδλ]dt.

• Menurut Teori Lagrange, nilai minimum dari Indeks Performansi (50) dengan

kendala sistem (49) dicapai untuk nilai minimum dari fungsi tanpa kendala (51).

• Fungsi (51) akan bernilai minimum apabila dJ ′(t0) = 0.

• Dengan membuat koefisien dari setiap differesial d(·) bernilai nol, maka kita

peroleh syarat cukup agar Indeks Performansi (51) bernilai minimum.

25

7.2 Ringkasan Prinsip Pontriyagin Minimum

Secara ringkas, langkah-langkah untuk menyelesaikan masalah kontrol optimal

dengan Prinsip Pontriyagin Minimum adalah sebagai berikut

1. Bentuk fungsi Hamiltonian

H(x(t), u(t), λ(t), t) = L(x(t), u(t), t) + λT(t)f(x, u, t), (59)

2. Minimumkan H terhadap u(t)

0 =∂H

∂u=∂L

∂u+∂fT

∂uλ. (60)

sehingga diperoleh u∗(t)

3. Gunakan hasil dari Langkah 2 ke dalam Langkah 1, sehingga diperoleh H

optimal yang dinotasikan dengan H∗.

4. Selesaikan himpunan 2n persamaan diferensial berikut:

x(t) =∂H

∂λ= f(x, u, t), t ≥ t0. (61)

yang merupakan Persamaan State dan

−λ(t) =∂H

∂x=∂fT

∂xλ+

∂L

∂x, t ≤ tf , (62)

merupakan Persamaan Costate.

Syarat awal x0 diberikan dan syarat akhir

(φx − λ)T|tfdx(tf ) + (φt +H)|tfdtf = 0. (63)

5. Subsititusikan solusi dari x(t) dan λ(t) dari Langkah 4 ke dalam ekspresi

kontrol optimal u∗(t) yang diperoleh dari Langkah 2.

26

8 Kontrol optimal dengan Linear Quadratic Regu-

lator (LQR)

• Secara umum, terdapat dua tujuan dari sistem kontrol, yaitu

1. Regulator system, yaitu pada sistem ini kontrol optimal bertujuan untuk

menstabilkan sistem, sehingga output dari sistem bernilai tetap atau stabil

2. Tracking, yaitu pada sistem ini kontrol optimal bertujuan untuk ”memaksa”

output agar mengikuti trayektori yang diinginkan.

• Salah satu Indeks Performansi yang banyak digunakan untuk menentukan opti-

mal kontrol adalah bentuk kuadratik linear.

• Misalkan diberikan sistem linear waktu kontinu yang berubah terhadap waktu

(time-varying) berikut

x(t) = A(t)x(t) +B(t)u(t), x(t0) diberikan, (64)

y(t) = C(t)x(t).

• yang bersesuaian dengan Indeks Performansi berikut

J(t0) =1

2xT(tf )S(tf )x(tf ) +

1

2

∫ tf

t0

[xTQ(t)x+ uTR(t)u

]dt, (65)

• dengan S(tf ) dan Q(t) adalah matriks bobot yang bersifat simetri dan semidefinit

positif. Sedangkan R(t) adalah matriks simetri yang definit positif.

• Kita akan menentukan hukum kontrol u(t) pada sistem (64) yang akan memini-

mumkan Indeks Performansi Kuadratik (65) dengan menggunakan persamaan-

persamaan (61)-(63).

• Bentuk fungsi Hamiltonian berikut

H(x, u, t) =1

2

[xTQx+ uTRu

]+ λT(t) (Ax+Bu) . (66)

• Persamaan state adalah

x =∂H

∂λ= Ax+Bu. (67)

27

• Persamaan Costate

−λ =∂H

∂x= Qx+ ATλ. (68)

• Syarat Stasioner

0 =∂H

∂u= Ru+BTλ. (69)

• Dari persamaan (69) diperoleh u sebagai fungsi costate, yaitu

u = −R−1BTλ, (70)

Akibatnya persamaan state (67) menjadi

x = Ax−BR−1BTλ. (71)

• Sementara itu, syarat batas x(t0) diberikan dan diasumsikan state final x(tf )

adalah bebas (free). Dengan demikian dx(tf ) 6= 0 dan dtf = 0, sehingga koefisien

dari dx(tf ) pada persamaan (63) haruslah nol yaitu

λ(tf ) =∂φ

∂x|tf = S(tf )x(tf ). (72)

• Persamaan (72) merupakan syarat batas untuk menyelesaikan persamaan costate.

• Untuk menentukan input kontrol optimal u(t) dari persamaan (70) kita harus

menentukan solusi dari persamaan costate (68) dengan syarat batas (72) dan

persamaan state (67) dengan syarat batas x(t0).

• Untuk itu kita akan menggunakan metode Sweep untuk menentukan solusi kedu-

anya. Diasumsikan bahwa state dan costate mempunyai hubungan seperti pada

(72) untuk semua t ∈ [t0, tf ] yaitu

λ(t) = S(t)x(t). (73)

• Perhatikan bahwa

λ = Sx+ Sx = Sx+ S(Ax−BR−1BTSx). (74)

28

• Substitusikan persamaan costate (68) ke persamaan (74), diperoleh

−Sx = (ATS + SA− SBR−1BTS +Q)x. (75)

• Karena persamaan (75) dipenuhi untuk seluruh x(t) pada interval [t0, tf ], maka

haruslah

−S = ATS + SA− SBR−1BTS +Q. (76)

• Persamaan (76) disebut persamaan Riccati.

• Jika S adalah solusi dari persamaan Riccati (76), maka kontrol optimal dapat

dinyatakan sebagai

u(t) = −R−1BTSx(t). (77)

• Definisikan Gain Kalman sebagai

K(t) = R−1BTS(t), (78)

sehingga diperoleh hukum kontrol state-feedback berikut

u(t) = −K(t)x(t). (79)

8.1 Ongkos Optimal dengan Hukum Kontrol State-Feedback

• Selanjutnya akan ditentukan Indeks performansi (ongkos) optimal dengan meng-

gunakan hukum kontrol state-feedback. Perhatikan bahwa

1

2

∫ tf

t0

d

dt

(xT(t)S(t)x(t)

)dt =

1

2xT(tf )S(tf )x(tf )−

1

2xT(t0)S(t0)x(t0). (80)

Aplikasikan fungsi Ongkos (65) pada kesamaan (80), maka diperoleh

J(t0) =1

2xT(t0)S(t0)x(t0) +

1

2

∫ tf

t0

[xTQ(t)x+ uTR(t)u+ xTS(t)x (81)

+xTS(t)x+ xTS(t)x]dt.

• Bentuk (81) dapat ditulis sebagai

J(t0) =1

2xT(t0)S(t0)x(t0) +

1

2

∫ tf

t0

[xT(S +Q+ ATS + SA

)x (82)

+xTS(t)Bu+ uTBTS(t)x+ uTRu]dt.

29

• Karena S(t) memenuhi persamaan Riccati (76), maka diperoleh

J(t0) = 12xT(t0)S(t0)x(t0) (83)

+12

∫ tft0

[xTSBR−1BTSx+ xTS(t)Bu+ uTBTS(t)x+ uTRu

]dt.

• Notasikan ‖v‖2R = vTRv sebagai norm-R dari vektor v (untuk R > 0), maka

bentuk (83) dapat ditulis sebagai

J(t0) =1

2xT(t0)S(t0)x(t0) +

1

2

∫ tf

t0

‖R−1BTSx+ u‖2Rdt. (84)

• Substitusikan hukum kontrol (77) pada (84), maka diperoleh nilai optimal sebagai

berikut

J(t0) =1

2xT(t0)S(t0)x(t0). (85)

8.2 Ringkasan LQR Waktu Kontinu (Kasus State Akhir Free)

• Model sistem

x(t) = A(t)x(t) +B(t)u(t), t ≥ t0

• Indeks Performansi

J(t0) =1

2xT(tf )S(tf )x(tf ) +

1

2

∫ tf

t0

[xTQ(t)x+ uTR(t)u

]dt

• dengan asumsi

S(tf ) ≥ 0, Q ≥ 0, R > 0, ketiganya simetri

• Kontrol optimal feedback

−S = ATS + SA− SBR−1BTS +Q, t ≤ tf , S(tf ) diberikan

K = R−1BTS

u = −Kx

J∗(t0) =1

2xT(t0)S(t0)x(t0)

30

8.3 Kontrol Lup-Terbuka (Kasus State Akhir Fixed)

• Diberikan sistem linear

x(t) = Ax(t) +Bu(t), t0 diberikan.

dan syarat akhir berupa nilai yang tetap yaitu x(tf ) = r(tf ).

• Karena waktu akhir dan state akhir fixed, maka dtf = 0 dan dx(tf ) = 0.

• Misalkan S(tf ) = 0 dan Q = 0, maka bentuk Indeks Performansi kuadratik (65)

dapat ditulis sebagai

J(t0) =1

2

∫ tf

t0

uTR(t)udt. (86)

• Dibentuk Hamiltonian

H(x, u, t) =1

2uTRu+ λT(t) (Ax+Bu) . (87)

• Persamaan state adalah

x =∂H

∂λ= Ax+Bu. (88)

• Persamaan Costate

−λ =∂H

∂x= ATλ. (89)

• Syarat Stasioner

0 =∂H

∂u= Ru+BTλ. (90)

• Solusi dari (90) menghasilkan

u = −R−1BTλ, (91)

• Akibatnya persamaan state (88) menjadi

x = Ax−BR−1BTλ. (92)

31

• Integralkan (89), sehingga diperoleh

λ = eAT(tf−t)λ(tf ), (93)

dengan λ(tf ) belum diketahui. Substitusikan (93) terhadap (92) menghasilkan

x = Ax−BR−1BTeAT(tf−t)λ(tf ), (94)

• Solusi dari sistem (94) adalah

x(t) = eA(t−t0)x(t0)−∫ t

t0

eA(t−τ)BR−1BTeAT(tf−τ)λ(tf )dτ. (95)

• Untuk menentukan nilai λ(tf ), evaluasi (95) pada saat tf , sehingga diperoleh

x(tf ) = eA(tf−t0)x(t0)−G(t0, tf )λ(tf ), (96)

dengan G(t0, tf ) adalah Gramian keterkontrolan yaitu

G(t0, tf ) =

∫ tf

t0

eA(tf−τ)BR−1BTeAT(tf−τ)dτ. (97)

• Sebelumnya telah diasumsikan bahwa x(tf ) = r(tf ), sehingga dari (96) didapat

λ(tf ) = −G−1(t0, tf )[r(tf )− eA(tf−t0)x(t0)

]. (98)

• Selanjutnya, substitusikan (98) dan (93) pada hukum kontrol (91) sehingga diper-

oleh

u(t) = R−1BTeAT(tf−t)G−1(t0, tf )

[r(tf )− eA(tf−t0)x(t0)

]. (99)

• Jika (A,B) terkontrol, maka terdapat kontrol energi-minimum yang mengger-

akkan state x(t0) ke r(tf ) yang diinginkan.

• Kontrol seperti ini disebut Kontrol Lup-Terbuka (Open-loop control), karena u(t)

tidak tergantung pada state x(t).

• Perhatikan bahwa solusi dari persamaan Lyapunov berikut

P (t) = AP + PAT +BR−1BT, t > t0, (100)

adalah

P (t) = eA(t−t0)P (t0)eAT(t−t0) +

∫ t

t0

eA(t−τ)BR−1BTeAT(t−τ)dτ. (101)

32

• Dari sini, jika P (t0) = 0, maka G(t0, t) = P (t).

• Misalkan notasikan

d(t0, tf ) = r(tf )− eA(tf−t0)x(t0),

maka diperoleh fungsi ongkos minimum sebagai berikut

J∗(t0) =1

2

∫ tf

t0

dT(t0, tf )G−1eA(tf−t)BR−1RR−1BTeA

T(tf−t)G−1d(t0, tf )dt.

Perhatikan bahwa d(t0, tf ) dan G−1(t0, tf ) tidak tergantung pada t, sehingga

didapat

J∗(t0) =1

2dT(t0, tf )G

−1(t0, tf )d(t0, tf ),

atau

J∗(t0) =1

2dT(t0, tf )P

−1(tf )d(t0, tf ),

dengan P (t) memenuhi persamaan Lyapunov (100).

8.4 Ringkasan LQR untuk kasus Lup-Terbuka (State Akhir

Fixed)

• Model sistem

x(t) = Ax(t) +Bu(t), t ≥ t0, x(t0) diberikan

• Final state yang diinginkan

x(tf ) = r(tf ), r(tf ) diberikan

• Indeks Performansi

J(t0) =1

2

∫ tf

t0

uTR(t)udt, R > 0

• Kontrol optimal Lup-Terbuka:

P = AP + PAT +BR−1BT, P (t0) = 0

33

• Kontrol Lup-Terbuka

u(t) = R−1BTeAT(tf−t)P−1(tf )d(t0, tf ), (102)

dengan d(t0, tf ) = r(tf )− eA(tf−t0)x(t0)

• Ongkos optimal adalah

J∗(t0) =1

2dT(t0, tf )P

−1(tf )d(t0, tf ).

8.5 Steady-State Feedback

• Misalkan diberikan plant (time-invariant) berikut

x(t) = Ax(t) +Bu(t).

• Pada bagian ini, Indeks Performansi yang diberikan berupa Infinite-time LQR

(infinite horizon) yaitu

J(t0) =1

2

∫ ∞0

[xTQx+ uTR(t)u

]dt,

dengan Q ≥ 0 dan R > 0.

• Hukum kontrol seperti pada kasus kontrol Lup-Tertutup (State akhir free) masih

bisa diterapkan sehingga diperoleh kontrol optimal feedback sebagai berikut

S(t) = 0 , sehingga diperoleh Persamaan Riccati berikut

0 = ATS + SA− SBR−1BTS +Q,

K = R−1BTS

u = −Kx

• Persamaan Riccati ini

0 = ATS + SA− SBR−1BTS +Q (103)

disebut dengan Algebraic Riccati Equation (ARE)

34

• Jika S∞ adalah solusi dari ARE (103), maka optimal gain untuk kasus infinite-

horizon berupa matriks konstan yaitu

K∞ = R−1BTS∞

u = −K∞x

J = 12xT(0)S∞x(0).

• Sedangkan plant dari lup-tertutup untuk kondisi ini (steady-state) mempunyai

bentuk dinamik sebagai berikut

x(t) = (A−BK∞)x(t) = Acx, (104)

dengan Ac = A−BK∞.

• Ada beberapa pertanyaan yang berkaitan dengan skema steady-state feedback

1. Kapan terdapat solusi limit terbatas S∞ bagi persamaan Riccati untuk se-

mua pemilihan fungsi bobot akhir S(tf )?

2. Secara umum, S∞ tergantung pada S(tf ). Sedangkan untuk kasus steady-

state, S(tf ) diabaikan. Jadi, pada saat kapan terdapat S∞ yang tunggal

yang tidak tergantung pada pemilihan S(tf )?

3. Kapan plant lup-tertutup Ac bersifat stabil asimtotis?

• Untuk menjawab ketiga pertanyaan di atas diperlukan teorema-teorem berikut

• Teorema 9 Misalkan pasangan (A,B) terstabilkan. Maka untuk setiap S(tf )

terdapat solusi limit terbatas S∞ untuk persamaan Riccati. Lebih lanjut, S∞

merupakan solusi yang bersifat semi-definit positif untuk persamaan Riccati Al-

jabar (ARE).

Teorema 10 Misalkan C sebarang matriks sehingga Q = CTC.

Misalkan pasangan (A,C) terobservasi. Maka pasangan (A,B) terstabilkan jika dan

hanya jika:

35

1. Terdapat dengan tunggal solusi limit S∞ yang bersifat definit positif untuk per-

samaan Riccati. Lebih lanjut, S∞ adalah solusi tunggal yang bersifat definit positif

untuk ARE (103).

2. Plant Lup-Tertutup (104) bersifat stabil asimtotis, dengan K = K∞ diberikan

oleh K∞ = R−1BTS∞.

9 Kontrol optimal untuk Tracking

• Misalkan diberikan sistem linear waktu kontinu berikut

x(t) = Ax(t) +Bu(t), x(t0) diberikan. (105)

y(t) = Cx(t). (106)

• Untuk menjaga agar output (106) dengan trayektori r(t) ∈ Rs yang diinginkan,

maka dipilih Indeks Performansi Kuadratik berikut

J(t0) = 12

[(Cx(tf )− r(tf ))TP (Cx(tf )− r(tf )

](107)

+12

∫ tft0

[(Cx− r)TQ(Cx− r) + uTRu

]dt,

• dengan P dan Q adalah matriks simetri yang semidefinit positif dan R adalah

matriks simetri yang definit positif.

• Kita akan menentukan hukum kontrol u(t) pada sistem (105) yang akan memini-

mumkan Indeks Performansi Kuadratik (107) dengan menggunakan persamaan-

persamaan (61)-(63).

• Bentuk fungsi Hamiltonian berikut

H(x, u, t) =1

2

[(Cx− r)TQ(Cx− r) + uTRu

]+ λT(t) (Ax+Bu) . (108)

• Persamaan state adalah

x =∂H

∂λ= Ax+Bu. (109)

• Persamaan Costate

−λ =∂H

∂x= ATλ+ CTQCx− CTQr. (110)

36

• Syarat Stasioner

0 =∂H

∂u= Ru+BTλ. (111)

• Dari persamaan (111) diperoleh u sebagai fungsi costate, yaitu

u = −R−1BTλ, (112)

Akibatnya persamaan state (109) menjadi

x = Ax−BR−1BTλ. (113)

• Sementara itu, syarat batas x(t0) diberikan dan agar syarat batas (63) dipenuhi,

maka haruslah berlaku hubungan berikut

λ(tf ) =∂φ

∂x|tf = CTPCx(tf )− CTPr(tf ). (114)

• Persamaan (114) merupakan syarat batas untuk menyelesaikan persamaan costate.

• Untuk menentukan input kontrol optimal u(t) dari persamaan (112) kita harus

menentukan solusi dari persamaan costate (110) dengan syarat batas (114) dan

persamaan state (109) dengan syarat batas x(t0).

• Untuk itu kita akan menggunakan metode Sweep untuk menentukan solusi kedu-

anya. Diasumsikan bahwa state dan costate mempunyai hubungan seperti pada

(114) untuk semua t ∈ [t0, tf ] yaitu

λ(t) = S(t)x(t)− v(t), (115)

dengan

S(tf ) = CTPC, v(tf ) = CTPr(tf ). (116)

• Jika kita berhasil menentukan matriks S(t) dan v(t), maka asumsi bahwa costate

dapat dinyatakan sebagai persamaan (115) adalah benar.

• Perhatikan bahwa

λ = Sx+ Sx− v = Sx+ S(Ax−BR−1BTλ)− v. (117)

37

• Substitusikan persamaan costate (110) ke persamaan (117), diperoleh

(S + ATS + SA+ CTQC − SBR−1BTS)x+ (−v + SBR−1BTv − ATv − CTQr) = 0.(118)

• Karena persamaan (118) dipenuhi untuk seluruh x(t) pada interval [t0, tf ], maka

haruslah

S + ATS + SA+ CTQC − SBR−1BTS = 0. (119)

dan

−v + SBR−1BTv − ATv − CTQr = 0. (120)

• Jika S(t) dan v(t) adalah solusi dari persamaan (119) dan (120) dengan syarat

batas diberikan pada persamaan (116), maka asumsi kita terhadap persamaan

(115) adalah benar.

• Dari sini, maka fungsi kontrol input optimal u(t) yang dinyatakan oleh persamaan

(112) dapat dinyatakan sebagai

u = −R−1BTλ = −R−1BTSx−R−1BTv, (121)

atau dapat dituliskan sebagai

u = −Kx−R−1BTv, dengan K = R−1BTS. (122)

38

Daftar Pustaka

[1] Olsder, G.J., and Vander Woude, J.W., 1994, Mathematical System Theory, Lec-ture Notes, Delft.

[2] Burghes, D. N., and Graham, A., 1980, Introduction to Control Theory: IncludingOptimal Control, John Wiley & Sons, New York.

[3] William II, R. L., and Lawrence, D. A., 2007, Linear State-Space Control Systems,John Wiley & Sons, Inc, New York.

[4] Lewis, F. L., and Syrmos, V. L., 1994, Optimal Control, John Wiley & Sons, Inc,Canada.

39