Tối ưu hệ số học của mạng hàm bán kính cơ sở trong bộ điều khiển robot theo phương pháp tính momen

Hội nghị Điều khiển và Tự động hoá toàn quốc lần thứ nhất- VCCA-2011

VCCA-2011

Tối ưu hệ số học của mạng hàm bán kính cơ sở trong bộ điều

khiển robot theo phương pháp tính momen

Optimization of the radial basis function network in the robot

controller by computed torque method Nguyễn Trần Hiệp

1; Phạm Thượng Cát

2

1 Khoa kỹ thuật điều khiển, Học viện kỹ thuật Quân sự

2Viện công nghệ Thông tin, Viện Khoa học và công nghệ Việt nam

[email protected]; [email protected]

Abstract: Recently, radial basis function network

(RBFN) is used quite widely when using neural

networks as controllers for subjects with multiple

uncertain parameters such as the robot. The most

important thing when using online learning neural

network system is the choice of coefficient for

networks with fast convergence speed. So far this

coefficient has been chosen by experience and

sometimes it takes quite a long time to find a

coefficient that satisfies the requirement of the

controlling task. Another problem is, when finding

coefficients satisfying the required study of the

problem and control, we can not conclude that the

optimal coefficients. This article refers to the use of

genetic algorithms (GA) to find optimal learning

coefficient for RBF network is used as a controller for

objects whose parameters are uncertain.

Tóm tắt: Gần đây, mạng hàm bán kính cơ sở

(RBFN) được sử dụng khá rộng rãi khi sử dụng mạng

nơron để điều khiển các đối tượng với nhiều tham số

bất định như robot. Hệ số học của mạng nơron có ảnh

hưởng rất lớn đến tốc độ hội tụ và chất lượng của quá

trình điều khiển. Trước đây, hệ số này đã được chọn

bằng kinh nghiệm và đôi khi phải mất một thời gian

khá dài mới tìm được một hệ số đáp ứng các yêu cầu

của bài toán điều khiển. Trong trường hợp đó, chúng

ta cũng không thể khẳng định được hệ số học vừa tìm

được tìm được là tốt nhất. Bài viết này đề cập đến

việc sử dụng thuật di truyền (GA) thực hiện tối ưu hóa

hệ số học cho mạng hàm bán kính cơ sở là thành phần

của bộ điều khiển robot theo phương pháp tính

momen.

Từ khóa: Robot, Mạng RBF, Giải thuật di truyền.

1. Xây dựng mô hình bộ điều khiển robot

sử dụng mạng RBFN 1.1 . Bài toán điều khiển robot với nhiều thành

phần phi tuyến bất định

Phương trình động lực học của một hệ robot n khớp

cứng có thể được mô tả bằng phương trình vi phân phi

tuyến dạng vector như sau:

τ)qd(q,(q)gq)q(q,Bq(q)M ˆˆˆ (1)

Trong đó: Tnqqq ],......,[ 21q ,

Tnqqq ],......,[ 21 q , T

nqqq ,....., 21q là các vector

nx1 biểu diễn vị trí, vận tốc và gia tốc góc của các

khớp tương ứng. Tn ,....., 21τ là vector nx1 biểu

diễn momen tác động lên các khớp. nxnR(q)M là

ma trận quán tính, đối xứng và xác định dương

nxnR )q(q,B ˆ là ma trận hệ số Coriolis và lực hướng

tâm. 1ˆ nxR(q)g là thành phần gia tốc trọng trường.

1nxR)qd(q, là thành phần lực ma sát và nhiễu tác

động lên các khớp của robot.

Trong phương trình (1) có các thành phần không được

biết chính xác do tính bất định của mô hình robot .

Các tham số (q),M )q(q,B ˆ , (q)g có thể được mô tả

như sau:

M(q) M(q)(q)M ˆ (2a)

)qB(q,)qB(q, )q(q,B ˆ (2b)

g(q)g(q) (q)g ˆ (2c)

M(q), )qB(q, , g(q) là các thành phần được xác

định chính xác Δg(q)),qΔB(q,ΔM(q), biểu diễn sai

lệch do tính bất định của mô hình robot. Giả thiết

000 gbm Δg(q),)qΔB(q,, ΔM(q) ,

( 000 g,b,m là các giá trị được biết). Khi đó, phương

trình (1) có thể được biểu diễn dưới dạng:

)qf(q,g(q)q)qB(q,qM(q)τ (3a)

)qf(q, ττ 0 (3b)

g(q)q)qB(q,qM(q)τ0 (3c)

)qd(q, Δg(q))qΔB(q,M(q))qf(q, (3d)

1nxR)qf(q, trong (3d) là tổng hợp các thành phần

không xác định của hệ động lực gồm ma sát, nhiễu

loạn tác động lên robot và bị chặn bởi 0f f với

0f có thể xác định được .

189

mailto:[email protected]

mailto:[email protected]


VCCA - 2011

Mục đích của điều khiển là xác định tín hiệu điều

khiển sao cho robot bám được quỹ đạo dq mong

muốn, nghĩa là sai lệch 0 dqqe ;

0d

e q q và 0d

e q q . Ở đây e,

e ,e là các giá trị sai số về vị trí, vận tốc và gia tốc

góc.

1.2. Xác định thuật điều khiển robot theo phương

pháp tính momen sử dụng mạng hàm bán kính cơ

sở (RBFN).

Phương pháp tính momen là một phương pháp điều

khiển được dùng phổ biến trong lĩnh vực điều khiển

robot. Bộ điều khiển được thực hiện trên cơ sở tách

riêng mô hình động lực học của robot thành hai phần

tuyến tính và phi tuyến, để các thành phần như tác

động của trọng lực, lực ma sát, momen hướng tâm,

lực Coriolis .v.v. sẽ được bù đủ. Với mô hình động

lực học hệ robot được biểu diễn như phương trình (1),

khi đó bộ điều khiển bộ điều khiển PD hay PID được

sử dụng để điều khiển vị trí của robot tiệm cận với

quỹ đạo mong muốn. Phương pháp tính momen

được mô tả như phương trình sau:

ˆ ˆτ M(q)u h(q,q) (4)

d P Du q K e + K e (5)

ˆ ˆ ˆ)h(q,q) = B(q,q)q+d(q,q g(q) (6)

K P, KD

là các ma trận đường chéo xác định dương.

Vì ma trận M (q) là xác định dương và khả đảo nên

vòng điều khiển kín của toàn bộ hệ thống có dạng:

q u (7)

Khi ma trận M (q) và vector h (q,q) giả thiết được

xác định chính xác, nếu chọn đúng các hệ số KDi , KPi

hệ thống sẽ là ổn định tiệm cận và thậm chí không

còn xuất hiện dao động và độ quá điều chỉnh trong

quá trình quá độ. Tuy nhiên phương pháp tính momen

chỉ đơn giản khi các thành phần M(q), B(q,q) ,

g(q) được xác định chính xác. Trong thực tế do tính

bất định của mô hình của robot, các tham số

M(q), B(q,q) , g(q) có thể được mô tả như phương

trình (2).

Do ma trận M (q) và vector h (q,q) không thể biết

chính xác mà chúng ta chỉ nhận được một giá trị ước

lượng của M(q) và h(q,q) : M(q) M(q) và

h(q,q) h(q,q) . Thay thế các giá trị ước lượng M(q)

và h(q,q) vào phương trình động lực học của robot

(4) ta nhận được:

1 ˆ ˆ1q M (q) M(q) u M (q) h(q,q) h(q,(q)

Rõ ràng phương trình trên khác với phương trình (7)

do đó luật điều khiển theo phương pháp tính momen

như trên sẽ gây ra sai số.

Để bù các hành phần bất định của hệ robot, tác giả

đề xuất sử dụng RBFN được học online để xác định

chính xác các thành phần bất định của hệ robot khi

điều khiển bằng phương pháp tính momen [1], [3].

Khi đó, hệ có thể được xem như một hệ điều khiển

PD, các hệ số KP, KD được chọn đảm bảo cho hệ ổn

định và có tốc độ hội tụ nhanh.

Từ phương trình (3b) và (5), suy ra:

0 d D Pτ =M(q) q -K e-K e B(q,q)q+g(q) (8)

Ta có: 0 1τ τ τ (9)

Với τ1 là thành phần momen điều khiển bù sẽ được

xác định sau.

Ta chọn biến phụ s dưới dạng: s = e+Ce (10)

qua đó ta thấy sự đồng nhất giữa s và e.

Với ma trận C là đối xứng và xác định dương T

C = C > 0

Việc chọn ma trận hệ số C đối xứng xác định dương

bảo đảm khi s = 0 hệ tự trị e+ Ce = 0 sẽ tiến về gốc

tọa độ của mặt phẳng pha: e 0,e 0 .

Ta có thể biểu diễn 1f (q,q)=f (s)

nxR . Theo định

lý Stone-Weierstrass, thành phần không xác định

1f (s)

nxR có thể được xấp xỉ bằng một mạng nơron

hữu hạn có cấu trúc như sau:

ˆf (s)= Wσ+ε=f(s)+ε (10)

f(s) = Wσ (11)

Trong đó:

W : Ma trận trọng số của mạng nơron được cập

nhật on-line,

:ε Sai số xấp xỉ và bị chặn 0ε .

Mạng nơron xấp xỉ f (s) là mạng hàm bán kính cơ sở

(RBFN) 3 lớp thoả mãn các điều kiện của định lý

Stone-Weierstrass, với lớp ẩn có n nút với hàm tác

động là hàm có phân bố Gauss :

2

2exp

i i

i

i

s c

lớp đầu vào, lớp ra có hàm tác động dạng tuyến tính

gồm n nơron. Với ,j jc là kỳ vọng và phương sai

của hàm phân bố Gauss có thể tự chọn. Nếu chọn

được các tham số ,j jc phủ hết dải thay đổi cả về

biên độ và dải tần của hàm bất định f (s) thì tốc độ

hội tụ sẽ nhanh hơn.

1s

2s

ns

1s

2s

ns

1 1

1

ˆn

j j

j

f w

2 2

1

ˆn

j j

j

f w

1

ˆn

n jn j

j

f w

H. 1 Mạng RBFN xấp xỉ hàm f (s)

190


VCCA-2011

Cấu trúc của mạng RBFN có thể mô tả theo sơ đồ trên

Hình 1.

Định lý: Hệ động lực robot n bậc tự do (1) với mạng

nơron (11) sẽ bám theo quỹ đạo mong muốn d

q với

sai số e 0 nếu ta chọn thuật điều khiển τ và thuật

học w icủa mạng nơron như sau:

d D P

1

( ) e

(1 )

τ = M q q K K e B(q,q)

g(q) M(q) Wσ s s

(12)

w si j , (13)

với i = 1, 2, …. n

Trong đó các tham số tự chọn D P,K I K C là

ma trận đối xứng xác định dương, I là ma trận đơn vị,

các hệ số , , 0 .

Cấu trúc của hệ điều khiển có thể mô tả theo sơ đồ

trên Hình 2

Momen τ gồm hai thành phần chính:

0 d D P( ) eτ = M q q K K e B(q,q) g(q) là thành

phần phản hồi và bù các thành phần phi tuyến, 1

1 (1 )τ =M(q) Wσ s s

là đầu ra của RBFN

được học on-line để xấp xỉ các thành phần phi tuyến

bất định của robot.

Định lý này được chứng minh bằng phương pháp

ổn định Lyapunov đảm bảo tính ổn định tiệm cận

toàn cục của cả hệ thống như sau:

Chứng minh:

Chọn hàm V xác định dương:

1

1

2s s w w

nT T

i i

i

V

(14)

Ta có V > 0 khi 0s,wi ; V = 0 khi và chỉ khi

s,w = 0i , i=1,2,..n

Lấy đạo hàm V theo thời gian:

1

s s w wn

T T

i i

i

V

(15)

Sau một vài biến đổi ta nhận được:

1

s s s τ - f (s) w wn

T T T

i i

i

V

(16)

Với thuật học on-line:

w si i , i= 1,2 ….n

ta có thể xác định được:

1 1 1

w w w s s w s Wσn n n

T T T T

i i i i i i

i i i

(17)

Cuối cùng ta nhận được: 2 1 2

2

0

- ( ) - .

-

s s s s ε s s s ε

s s s

TV

(18)

Với s là khả vi (10), xét thành phần 1

s s

để

làm rõ tính hữu hạn của τ và V khi s→0 Ta có:

2 2 2 20 0 0

1 2

lim lim lim 1...s s ss

i i i

n i

s s s

s s s s

2 2 2 20 0 0

1 2

lim lim lim 1...s s ss

i i i

n i

s s s

s s s s

1,2,... .i n hoặc 0

1 lim 1s s

is

.

Với giá trị hữu hạn của 1

s sta sẽ có ,τ V trong

là tồn tại và hữu hạn khi s→0.

Nếu chọn: 0 ; 0 ta có

0- + ε -s s s (19)

Cuối cùng thay (19) vào (18) ta nhận được:

2

0s sV (20)

Ta thấy 0V khi s ≠ 0 và 0V khi và chỉ khi

s = 0. Theo nguyên lý ổn định Lyapunov [11],[8],

s 0 và sai số e 0 . Và hàm (14) đươc chọn ban

đầu được gọi là hàm Lyapunov. Như vậy hệ (1) là ổn

định tiệm cận dq q hay nói cách khác quỹ đạo của

robot bám theo quỹ đạo mong muốn với sai số bằng 0.

Tốc độ hội tụ của mạng nơron phụ thuộc vào thuật

học (13). Để cho quá trình học hội tụ nhanh, đảm bảo

các chỉ tiêu chất lượng điều chỉnh như độ quá chỉnh,

số lần dao động.v.v. chúng ta có thể lựa chọn một hệ

số học tối ưu bằng cách sử dụng thuật di truyền.

2. Sử dụng thuật di truyền để tối ưu hệ số

học của RBFN. Thuật di truyền (Genetic Algorithm - GA) là thuật tự

điều chỉnh dựa trên sự tiến hóa chọn lọc và phát triển

tự nhiên. Chọn lọc tự nhiên là sự liên kết giữa các

nhiễm sắc thể - Chromosome và biểu diễn cấu trúc mã

hoá của chúng để chọn ra được cá thể có đặc tính tốt

nhất qua các thế hệ. Giống như trong tự nhiên, bằng

quá trình chọn lọc, thuật di truyền sẽ tìm ra được

những nhiễm sắc thể tốt nhất nhờ hiệu chỉnh thông tin

của chúng thích nghi với sự thay đổi của môi trường.

Những thông tin này cho phép ước lượng được giá trị

của mỗi nhiễm sắc thể theo một hàm thích ứng chọn

Nếu không đạt

chỉ tiêu của quá

trình quá độ

Nếu đạt chỉ tiêu

của quá trình

quá độ

B(q,q)q g(q)

H. 2 Điều khiển robot theo phương pháp

tính momen với RBFN

d

d

q

q

e

-

1τ

d D Pq K e K e M(q)

+

11

s = e + Ce

sτ = M(q) Wσ

s

W sσT

q

q

Robot

+

+

τ

+

0τ

191


VCCA - 2011

trước để chọn ra những nhiễm sắc thể có giá trị thích

ứng tốt nhất và loại bỏ những nhiễm sắc thể có giá trị

thích ứng kém. Để tiến hoá từ thế hệ này sang thế hệ

khác, GA sử dụng ba phép biến đổi cơ bản là tái tạo

lại, liên kết chéo và biến đổi. Ở bài toán mà ta đang

xét, thông tin về hệ thống đã khá rõ ràng, về bản chất

là hệ sẽ tiến đến trạng thái ổn định, chỉ cần thêm một

thông tin bổ sung là giá trị nào của hệ số học (η) sẽ

đem lại chất lượng điều khiển tốt nhất. Do đó, trong

trường hợp này, sử dụng GA để xác định hệ số học

(η) tối ưu sẽ là phương án đơn giản và phù hợp

nhất.Tìm hàm thích ứng trong GA là rất quan trọng

đối với từng trường hợp cụ thể. Ta cần tìm hệ số học

( j ) của RBFN trong (12) để sao cho thời gian thiết

lập (Tc), độ quá điều chỉnh (Oc), số lần dao động (N)

đạt các chỉ tiêu về chất lượng điều khiển, đồng thời

tại thời điểm Tc giá trị ước lượng theo hàm thích ứng

đạt được các yêu cầu đặt ra của bài toán. Do đó, lựa

chọn hàm thích ứng trong trường hợp này ngoài tiêu

chuẩn về sai số, sẽ được bổ xung thêm các chỉ tiêu về

chất lượng của quá trình điều khiển như vừa trình bày

ở trên. Giá trị ước lượng theo hàm thích ứng của cá

thể j (j = 1 r) trong tập hợp mẫu của GA được xác

định như sau:

0

( , ( ), , )

( ( ))

e

e

j c c

j c

F T O N

F T

(21)

Tc là thời gian thiết lập của quá trình quá độ, Oc là độ

quá chỉnh, N là số lần dao động trong thời gian thiết

lập.

( , ( ))ej cF T : giá trị ước lượng theo hàm thích ứng

của cá thể thứ j ( j ) tại thời điểm Tc.

2

( )

1 0

1( ( ))e

e

j cn k

m

i

i m

F T

(22)

Với: i là thứ tự các khớp của robot, m là bậc đạo hàm

của sai lệch e.

Quá trình tiến hóa sẽ dừng lại khi ít nhất có một cá thể

j có quá trình quá độ đạt được các điều kiện (21) và

giá trị ước lượng theo hàm thích ứng

0( , ( ))ej cF T F , với F0 được cho trước tùy theo yêu

cầu về độ chính xác của từng trường hợp cụ thể, khi

đó j sẽ là giá trị tốt nhất tìm được. Khi hệ thống tiến

đến giá trị xác lập, tất cả các sai số tiến đến không do

đó về mặt lý thuyết, hàm thích ứng sẽ tiến đến vô

cùng. Do hệ thống điều khiển của chúng ta là hệ điều

khiển theo sai lệch do đó luôn tồn tại sai số, vì vậy giá

trị của hàm thích ứng trong trường hợp này sẽ tiến

đến một giá trị giới hạn. Như vậy, nếu một cá thể

j tìm được trong quá trình tiến hóa, đảm bảo thỏa

mãn điều kiện (21), đồng thời có giá trị

0( , ( ))ej cF T F sẽ là hệ số học tối ưu. Tập hợp ban

đầu của các hệ số học j được lựa chọn một cách

ngẫu nhiên và là số nguyên dương.

Mỗi một giá trị j được chọn là một cá thể và để tiện

khi thực hiện các phép biến đổi và liên kết chéo ta có

thể sử dụng mã nhị phân để biểu diễn giá trị của hệ số

học (trong trường hợp này sử dụng mã nhị phân 8

bits). Bằng mã nhị phân 8 bits ta có thể tạo ngẫu

nhiên được 256 giá trị nằm trong dải từ 0 đến 255. Để

đảm bảo các cho trường hợp: ηj <1, ηj > 255, giá trị

thực của ηj sau các phép biến đổi của GA được nhân

với một hệ số thang đo cho phép bao hết miền giá trị

của ηj.

Đầu tiên ta có thể chọn hệ số thang đo lớn để đảm bảo

bao hết miền giá trị của ηj. Sau lần tối ưu đầu tiên cho

phép xác định được khu vực tối ưu của hệ số học. Ta

sẽ thay đổi hệ số thang đo để thực hiện tìm giá trị tối

ưu trong khu vực đó. Trường hợp sau mỗi lần tối ưu

ta tìm được cùng một lúc nhiều giá trị cực đại, khi đó

có thể thực hiện tìm giá trị tối ưu của hệ số học đồng

thời trên nhiều máy tính. Như vậy sẽ t ng tốc độ tìm

kiếm tối ưu cho GA.

3. Mô phỏng điều khiển robot PUMA 560

theo phương pháp tính momen. 3.1. Mô hình robot PUMA560.

Robot PUMA 560 là robot 6 bậc tự do có tham số như

sau:

Khớp m (kg) rx (m) ry (m) rz (m)

1 0 0 0 0

2 17.4 -0.3638 0.006 0.2275

3 4.8 -0.0203 -0.0141 0.070

4 0.82 0 0.019 0

5 0.34 0 0 0

6 0.09 0 0 0.032

Khớp Ixx

kg.m2

Iyy

kg.m2

Izz

kg.m2

Ixy=Iyz=Iz

x

(kg.m2)

1 0 0.35 0 0

2 0.13 0.524 0.539 0

3 0.066 0.086 0.0125 0

4 0.0018 0.0013 0.0018 0

5 0.0003 0.0004 0.0003 0

6 0.0001

5

0.00015 0.00004 0

Khớp ia [

o]

ia [m] id [m] Biến

khớp

1 -90o 0 0 1

2 0 0.4318 0.15005 2

3 -90o

0.0203 0 3

4 90 0 0.4318 4

5 -90 0 0 5

6 0 0 0.05625 6

3.2 Bài toán điều khiển robot.

192


VCCA-2011

Giả sử ta chỉ biết các tham số mô hình robot có độ

chính xác 90%.

Ta sẽ điều khiển tay nắm robot đi theo mặt cong dạng 26 3z x x (Hình 4,5) từ vị trí y = (0,25m 0,2m -

0,375m 0 0 0)T tới vị trí y = (0,5 m 0,2 m 0m 0 1,406

0)T. Trong quá trình dịch chuyển, hướng của tay nắm

phải luôn trùng với tia pháp tuyến của mặt cong.

H. 3 Mô hình robot PUMA 560 và các hệ toạ độ khớp

0 2 4 6 8 10-2

-1.5

-1

-0.5

0

0.5

qd1

qd2

qd3

H. 4 Các giá trị đặt của các khớp 1,2,3

0 2 4 6 8 10

-2

-1

0

1

2

3

4

qd4

qd5

qd6

H. 5 Các giá trị đặt của các khớp 4,5,6.

Ta chọn các tham số của robot và điều kiện mô phỏng

như khi chưa sử dụng mạng nơron.

Chọn các tham số điều khiển cho moment τ và thuật

chỉnh trọng mạng nơron w i cho robot như (12) và

(13):

Với 2; 3; 10

Với các tham số hàm Gauss của mạng nơron được

chọn theo kinh nghiệm như sau:

1 2 1 210; 0.1 ; 0.3c c .

Ta có kết quả mô phỏng như sau:

0 1 2 3 4 5 6 7 8 9 10-0.3

-0.2

-0.1

0

0.1

0.2

0.3

0.4

0.5

e1

e2

e3

H. 6 Sai lệch tại các khớp 1,2,3

0 1 2 3 4 5 6 7 8 9 10-0.05

0

0.05

0.1

0.15

0.2

0.25

0.3

e4

e5

e6


0 1 2 3 4 5 6 7 8 9 10-50

0

50

100

150

200

torque1

torque2

torque3

H. 8 Biểu diễn momen tại các khớp 1,2,3

0 1 2 3 4 5 6 7 8 9 10-0.14

-0.12

-0.1

-0.08

-0.06

-0.04

-0.02

0

0.02

0.04

torque4

torque5

torque6


Trong quá trình mô phỏng, khi lựa chọn hệ số học η

cho RBFN theo (12) và (13), tác giả nhận thấy: Với

các giá trị η lựa chọn khác nhau sẽ nhận được các kết

quả có chất lượng điều khiển khác nhau. Khi chọn giá

trị η lớn, sai số của hệ thống khi đạt đến trạng thái xác

lập sẽ sẽ rất bé, gần như bằng “không” nhưng độ quá

chỉnh lớn và số lần dao động trong quá trình quá độ

t ng lên không đạt được các chỉ tiêu của quá trình quá

độ. Khi chọn giá trị η nhỏ sẽ khắc phục được hai

nhược điểm trên là độ quá chỉnh và số lần dao động

giảm nhưng sai số khi hệ đạt đến trạng thái xác lập là

khá lớn, thậm chí khi t ng biên độ của nhiễu, hệ còn

bị mất ổn định. Như vậy với một cấu trúc RBFN được

lựa chọn dùng kết hợp với bộ điều khiển tính momen

sẽ tồn tại một hệ số học η tối ưu đảm bảo tìm được

chất lượng điều chỉnh của hệ là tốt nhất. Xuất phát từ

nhận xét trên, tác giả đề xuất bài toán toán tìm hệ số

học η tối ưu cho RBFN được lựa chọn dùng kết hợp

với bộ điều khiển tính momen. Vì η là một số vô

hướng và cấu trúc của bộ điều khiển đã đảm bảo ổn

định, tác giả lựa chọn phương pháp tìm giá trị η tối ưu

sử dụng thuật di truyền (GA) tiến hành học off-line.

193


VCCA - 2011

Đồng thời trong quá trình tìm giá trị η tối ưu các chỉ

tiêu về chất lượng của điều khiển cũng sẽ được đánh

giá thông qua quá trình xác định giá trị của các mẫu

học theo hàm thích ứng – fitnes function của GA.

Với mô hình bài toán điều khiển như đã trình bày ở

trên, ta sử dụng GA để tìm hệ số học tối ưu của RBFN

theo thuật học được biểu diễn trong (13. Các chỉ tiêu

của quá trình quá độ được cho như Bảng 1:

Các chỉ tiêu của quá

trình quá độ

Giá trị giới

hạn

Đơn

vị

Thời gian điều chỉnh (T) 10 sec

Thời gian thiết lập (TC) ≤ 3 sec

Độ quá điều chỉnh (OC) ≤ 20% giá trị

thiết lập (Qc)

Số lần dao động (N) ≤ 4

Hàm thích ứng trong trường hợp này được xác định

theo (14), cụ thể như sau:

0 3

( , ( ))

( ( )) khác

e

e

j c

j c

F T

F T

c

c c

nÕu T

0 nÕu O 20% Q

0 nÕu N 4

nÕu

Đây là thành phần cho phép đánh giá chỉ tiêu chất

lượng của quá trình quá độ, giá trị ηj tìm được đảm

bảo quá trình điều khiển robot thỏa mãn được tất cả

các yêu cầu của quá trình quá độ.

2 2 2 2 2 2.....1 2 1 2 6 6

1( ( )) 50ej CF T

e e e e e e

Đây là thành phần đảm bảo cho sai lệch của điều

khiển robot nằm trong phạm vi cho phép.

Các tham số của GA được chọn như sau:

Tỷ lệ liên kết chéo (Pc): 0.5, 0.5

Tỷ lệ biến đổi (Pm) : 0.05, 0.05

Kích thước của tập hợp (Psize): r = 100, 100

Giá trị chặn dưới của hàm thích ứng (F0) = 50. 50

Thực hiện tối ưu bằng GA với hệ số thang đo là 1 và

sau 200 thế hệ ta tìm được 1 giá trị tối ưu là 20 đảm

bảo được tất cả các yêu cầu về chất lượng điều khiển

được đặt ra trên Bảng 1. Như vậy thông qua quá trình

tiến hóa để xác định hệ số học η tối ưu bằng GA, ta

đã đánh giá được cả chất lượng của quá trình quá độ

bằng việc xác định giá trị theo hàm thích ứng của

từng mẫu học trong khoảng thời gian mong muốn (ở

đây, ta khảo sát trong khoảng thời gian từ 0 – Tc) nếu

sử dụng các phương pháp tối ưu khác sẽ khó thực

hiện được đánh giá này. Đó là lý do vì sao tác giả lại

sử dụng GA để làm công cụ xác định hệ số học tối ưu

của RBFN.

Kết quả mô phỏng với hệ số học η =20.

0 1 2 3 4 5 6 7 8 9 10-0.3

-0.2

-0.1

0

0.1

0.2

0.3

0.4

0.5

e1

e2

e3


0 1 2 3 4 5 6 7 8 9 10-0.05

0

0.05

0.1

0.15

0.2

0.25

0.3

e4

e5

e6


0 1 2 3 4 5 6 7 8 9 10-50

0

50

100

150

200

torque1

torque2

torque3


0 1 2 3 4 5 6 7 8 9 10-0.14

-0.12

-0.1

-0.08

-0.06

-0.04

-0.02

0

0.02

0.04

toruqe4

torque5

torque6


Nhận xét: So sánh kết quả thu được trên hình 10 – 13

và kết quả mô phỏng nhận được trên các hình 6 – 9, ta

thấy với hệ số học tối ưu tìm được, so với trường hợp

chọn hệ số học η =10, sai lệch về vị trí và vận tốc góc

giảm đi nhiều khi hệ đạt trạng thái xác lập. Như vậy

sử dụng GA để xác định hệ số học tối ưu cho phép

đánh giá được chất lượng của quá trình quá độ, ngoài

các chỉ tiêu về sai số (e), số lần dao động (N), độ quá

chỉnh (Qc) và thời gian thiết lập (Tc) còn cho phép

đánh giá được giá trị cực đại và tốc độ biến thiên của

momen tác động lên khớp của robot. Giá trị η tối ưu

tìm được đảm bảo được tất cả các chỉ tiêu của quá

trình quá độ và các điều kiện vật lý đảm bảo cho động

cơ hoạt động.

194


VCCA-2011

Kết luận Với mô hình điều khiển robot theo phương pháp tính momen sử dụng mạng RBF đảm bảo quá trình học online và cho phép tối ưu trên toàn bộ không gian trạng thái. Kết quả cho thấy hệ thống đảm bảo hội tụ và sai lệch tiến đến không. Việc sử dụng GA để tìm ra hệ số học tối ưu cho phép nâng khảo sát, đánh giá được ảnh hưởng của hệ số học đến quá trình hội tụ của thuật học đồng thời làm nâng cao hơn nữa chất lượng của quá trình điều khiển. Đây là một bước tiến trong quá trình nghiên cứu ứng dụng mạng nơron để xây dựng các bộ điều khiển robot vừa đảm bảo tính hội tụ và ổn định đồng thời nâng cao hơn nữa chất lượng của điều khiển.

Tài liệu tham khảo

[1] Nguyễn Trần Hiệp, Phạm Thượng Cát, Điều

khiển robot n bậc tự do theo phương pháp tính

momen sử dụng mạng nơron xấp xỉ các đại

lượng bất định. Hội thảo Tự động hóa và

Robotic trong Quốc phòng và kinh tế, tháng 3

n m 2009. Tạp chỉ nghiên cứu KH và Công

nghệ Quân sự số đặc biệt tháng 3 n m 2009

trang 73-81.


khiển robot n bậc tự do với mặt trượt tích phân

và mạng nơron xấp xỉ các đại lượng phi tuyến

bất định. Tạp chí KHKT số 127 n m 2009, Học

viện kỹ thuật Quân sự, Tr 36 – 45


khiển robot với mạng nơron RBF có hệ số học

được tối ưu bằng giải thuật di truyền, Tạp chí

Tự động hóa ngày nay số 126 tháng 5 n m 2011,

Hội nghị Cơ điện tử toàn quốc lần thứ 5 tổ chức

từ ngày 22 – 23/10/2010 tại Thành phố Hồ chí

Minh.

[4] Nguyen Tran Hiep, Pham Thuong Cat, Robust

Neural Sliding Mode Control of Robot

Manipulators, Proceeding of 2nd

Mediterrannean Conference on Intelligent

Systems and Automation, March 23-25 2009,

Zarzis, Tunisia. Page 210 -215 (API Conference

Proceedings 1107).

[5] Nguyen Tran Hiep, Pham Thuong Cat, Robot

control nDOF by integrated sliding surface and

approximating neural networks, Proceeding of

European Control Conreference 2009, 23 - 26

August 2009 Budapest Hungary. Page 2187-

2192.

[6] Nguyễn Thanh Thuỷ, Trần Ngọc Hà., (1999)

Tích hợp kỹ thuật mạng nơron và giải thuật di

truyền trong phân tích dữ liệu. Tạp chí tin học

và điều khiển học T15, S.2.

[7] Bach H. Dinh, Matthew W. Dunnigan, Donald

S. Reay (2008), “A Practical Approach for

Position Control of Robotic Manipulator Using a

Radial Basis Function Network and a Simple

Vision Systems”, Wseas Transaction on

Systems and Control. Issue 4, Volume 3, April

2008, Page 289 – 298.

[8] Gongcai Xin, Zhengzai Qian, Weilun Chen, Kun

Qian and Li Li (2010), “Neural Network and

Sliding Mode Control Combining Based

Reconfigurable Control”, Communications in

Computer and Information Science, 2010,

Volume 98, Part 5, Pages 238-243.

[9] Jakub Możaryn and Jerzy E. Kurek (2010),

“Sliding Mode Control of Robot Based on

Neural Network Model with Positive Definite

Inertia Matrix”, Artificial Neural Networks –

ICANN 2010. Lecture Notes in Computer

Science, 2010, Volume 6353/2010, Pages 266-

275.

[10] J.Somlo - B.Lantos - P.T.Cat (1997), Advanced

Robot Control. Akademiai Kiado. Budapest.

[11] L. Bossi, L. Magni, C. Rottenbacher and G.

Mimmi (2009), “ Modeling and Validation of a

Planar Flexible Manipulator”, Proceeding of the

European Control Conference 2009, August 23-

26, 2009, Budapest, Hungary, pp 2809 – 22814.

[12] Min-Jung Lee, Gi Hyun Hwang, Tae-Seok Jin

(2008), “Design and Implementation of

Manipulator Tracking Control based on

Intelligent Method”, Reseachs was supported by

the Program for the Training of Graduate

Students in Regional Innovation with was

conducted by the Ministry of Commerce Industry

and Energy of the Korean government.

[13] Wen-Bin Lin; Chien-An Chen; Huann-Keng

Chiang (2011), “Design and Implementation of a

Sliding Mode Controller Using a Gaussian

Radial Basis Function Neural Network Estimator

for a Synchronous Reluctance Motor Speed

Drive”, Int Electric Power Components and

Systems. Volume 39, Issue 6, 2011, Pages 548 –

562.

[14] Weimin Ge and Duofang Ye (2011), “Sliding

mode variable structure control of mobile

manipulators”, International Journal of

Modelling, Identification and Control. Volume

12, Number 1-2 / 2011, Pages 166 – 172.

195

http://www.springerlink.com/content/?Author=Gongcai+Xin

http://www.springerlink.com/content/?Author=Zhengzai+Qian

http://www.springerlink.com/content/?Author=Weilun+Chen

http://www.springerlink.com/content/?Author=Kun+Qian

http://www.springerlink.com/content/?Author=Kun+Qian

http://www.springerlink.com/content/?Author=Li+Li

http://www.springerlink.com/content/g827978164xu8767/



http://www.springerlink.com/content/1865-0929/


http://www.springerlink.com/content/?Author=Jakub+Mo%c5%bcaryn

http://www.springerlink.com/content/?Author=Jerzy+E.+Kurek

http://www.springerlink.com/content/978-3-642-15821-6/

http://www.springerlink.com/content/978-3-642-15821-6/



http://www.informaworld.com/smpp/title~db=all~content=t713399721~tab=issueslist~branches=39#v39

http://www.informaworld.com/smpp/title~db=all~content=t713399721~tab=issueslist~branches=39#v39

Documents

Tối ưu hệ số học của mạng hàm bán kính cơ sở trong bộ điều khiển robot theo phương pháp tính momen