26
1 BGIÁO DỤC VÀ ĐÀO TẠO VIN HÀN LÂM KHOA HC VÀ CÔNG NGHVIT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ ----------------------------- Nguyễn Văn Tính NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ THUẬT TOÁN ĐIỀU KHIỂN RÔ BỐT DI ĐỘNG CÓ TÍNH ĐẾN ẢNH HƯỞNG CỦA TRƯỢT BÁNH XE LUẬN ÁN KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA Chuyên ngành: Kỹ thuật điều khiển và tự động hóa Mã số: 9.52.02.16 TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT Hà Nội – 2018

TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT - gust.edu.vngust.edu.vn/media/26/uftai-ve-tai-day26513.pdf · nghiÊn cỨu phÁt triỂn mỘt sỐ thuẬt toÁn ĐiỀu khiỂn rÔ

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

1

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC

VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

-----------------------------

Nguyễn Văn Tính

NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ THUẬT TOÁN ĐIỀU

KHIỂN RÔ BỐT DI ĐỘNG CÓ TÍNH ĐẾN ẢNH HƯỞNG CỦA

TRƯỢT BÁNH XE

LUẬN ÁN KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA

Chuyên ngành: Kỹ thuật điều khiển và tự động hóa

Mã số: 9.52.02.16

TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT

Hà Nội – 2018

2

Công trình được hoàn thành tại: Học viện Khoa học và Công nghệ - Viện Hàn lâm

Khoa học và Công nghệ Việt Nam.

Người hướng dẫn khoa học: TS. Phạm Minh Tuấn

Phản biện 1:…………………………………………………………….…..

……………………………………………………………………………….

Phản biện 2:…………………………………………………………….…..

……………………………………………………………………………….

Phản biện 3:…………………………………………………………….…..

……………………………………………………………………………….

Luận án sẽ được bảo vệ trước Hội đồng chấm luận án cấp nhà nước họp tại:

…………………………………………………………….……….………………………

……………………………………………………………………………………………..

Vào hồi giờ ngày tháng năm

Có thể tìm hiểu luận án tại thư viện: …………………………………….….

3

MỞ ĐẦU

Tính cấp thiết của đề tài

Có một sự thật không thể phủ nhận rằng các rô bốt di động có khả năng làm việc trong một phạm vi

rộng và có thể thao tác tự động một cách thông minh mà không cần bất cứ sự tác động nào từ con người. Do

vậy, đề tài này tập trung nghiên cứu các bài toán thiết kế các luật điều khiển cho rô bốt di động kiểu bánh xe.

Các vấn đề nghiên cứu của luận án

Tác giả tập trung nghiên cứu các phương pháp điều khiển mới để bù trượt cho rô bốt di động khi tồn

tại trượt bánh xe, bất định mô hình, và nhiễu ngoài.

Đối tượng nghiên cứu

Để dễ dàng kiểm chứng tính đúng đắn và hiệu năng của các luật điều khiển được đề xuất, rô bốt di

động 03 bánh xe được lựa chọn làm đối tượng nghiên cứu. Cụ thể, rô bốt di động kiểu 03 bánh xe này bao gồm

02 bánh chủ động điều khiển vi phân, 01 bánh thụ động được dùng để làm điểm tựa tạo thế cân bằng trọng lực.

Mục đích nghiên cứu

Đề xuất một số phương pháp điều khiển mới để bù ảnh hưởng tiêu cực của bất định mô hình, nhiễu

ngoài, và trượt bánh xe.

Phương pháp nghiên cứu

Phương pháp nghiên cứu được thể hiện qua trình tự công việc như sau:

Phân tích và xây dựng mô hình động học và động lực học của rô bốt di động khi tồn tại các bất

định mô hình, nhiễu ngoài, và trượt bánh xe.

Nghiên cứu, phân tích các phương pháp điều khiển tiên tiến trong và ngoài nước cho rô bốt di

động trong sự hiện diện của bất định mô hình, nhiễu ngoài, và trượt bánh xe. Sau đó, đề xuất

các phương pháp điều khiển mới.

Chứng minh tính đúng đắn và hiệu quả của các phương pháp điều khiển mới bằng tiêu chuẩn

ổn định Lyapunov và bổ đề Barbalat.

Tiến hành kiểm chứng các phương pháp điều khiển nói trên băng công cụ Matlab/Simulink.

Ý nghĩa khoa học và thực tiễn của đề tài

Ý nghĩa khoa học: Xây dựng các phương pháp điều khiển mới cho rô bốt di động để bù ảnh hưởng

tiêu cực của bất định mô hình, nhiễu ngoài, và trượt bánh xe.

Ý nghĩa thực tiễn: Các phương pháp điều khiển được đề xuất trong luận án này có thể được triển khai

ứng dụng cho các rô bốt di động trong nhà kho với mặt sàn trơn hoặc có thể được triển khai ứng dụng cho các

xe tự hành trong các nông trường với nền đất ẩm ướt dễ trơn trượt.

Bố cục của luận án

Chương 1: Trình bày tổng quan các nghiên cứu trong và ngoài nước trong những năm gần đây, và sau

đó trình bầy mô hình động học và động lực học của rô bốt di động trong điều kiện tồn tại bất định mô hình,

nhiễu ngoài, và trượt bánh xe.

Chương 2: Thiết kế luật điều khiển bám thích nghi dựa trên một mạng nơ ron ba lớp.

Chương 3: Thiết kế luật điều khiển backstepping bền vững thích nghi dựa trên mạng sóng Gaussian.

Chương 4: Thiết kế luật điều khiển backstepping hội tụ hữu hạn ở cấp động lực học.

4

CHƯƠNG 1. TỔNG QUAN VÀ MÔ HÌNH TOÁN HỌC

1.1. Đặt vấn đề

Bài toán điều khiển chuyển động cực kỳ quan trọng trong lĩnh vực rô bốt di động, bởi vì hiệu năng của

các luật điều khiển ảnh hưởng trực tiếp đến hiệu quả của các ứng dụng rô bốt di động trong sản xuất và đời

sống. Do vậy, bài toán này được lựa chọn làm mục tiêu nghiên cứu của luận án này.

Trong những thập kỷ gần đây, bài toán điều khiển chuyển động cho rô bốt di động kiểu bánh xe đã

thu hút sự chú ý của các nhà khoa học trên khắp thế giới. Hiển nhiên, rô bốt di động là một trong số các hệ

thống chịu ràng buộc nonholonomic [1]. Hơn nữa, nó lại là một hệ thống phi tuyến nhiều vào- nhiều ra [2].

Nhờ có sự tiến bộ của lý thuyết cũng như kỹ thuật điều khiển, đã có rất nhiều phương pháp điều khiển khác

nhau được áp dụng để thiết kế các luật điều khiển cho rô bốt di động như: điều khiển trượt [3, 4], điều khiển

bền vững [5], … Các luật điều khiển này đã được thiết kế với giả thiết “bánh xe chỉ lăn mà không trượt”.

Tuy nhiên, trong thực tiễn ứng dụng, điều kiện các bánh xe chỉ lăn mà không trượt lại có thể thường

xuyên bị vi phạm. Tức là đã xảy ra hiện tượng trượt bánh xe [12-13].

Trượt bánh xe là một trong số các nhân tố chính gây ra sự giảm sút hiệu năng điều khiển nghiêm trọng.

Do vậy, trong các tình huống như vậy, nếu muốn cải thiện hiệu năng điều khiển, thì cần phải thiết kế một bộ

điều khiển có khả năng bù trượt bánh xe.

1.2. Tình hình nghiên cứu trong nước

Ở Việt Nam, đến nay, đã có rất nhiều nghiên cứu về xe tự hành như nhóm tác giả ở Đại học Giao

Thông Vận Tải nghiên cứu về rô bốt di động di chuyển kiểu bầy đàn [14-15]. Một nhóm nghiên cứu ở Đại học

Bách Khoa Hà Nội đã nghiên cứu về xây dựng mô hình cho một ô tô điện 04 bánh khi có tính đến tương tác

bánh xe - mặt đường [18]. Tuy nhiên, chưa có nhiều kết quả nghiên cứu về điều khiển bù trượt bánh xe cho rô

bốt di động được công bố.

1.3. Tình hình nghiên cứu ngoài nước

Trên thế giới, đã có rất nhiều báo cáo nghiên cứu về điều khiển bù trượt bánh xe cho rô bốt di động.

Bởi vì trượt bánh xe có thể làm hệ thống mất ổn định hoặc giảm hiệu năng điều khiển nghiêm trọng nên nó

phải được ngăn chặn. Thông thường, để điều khiển bù trượt bánh xe, các thông tin đo lực ma sát và tốc độ

trượt phải luôn được cập nhật theo thời gian thực và chính xác. Cụ thể, trong [12] các tác giả đã bù trượt bánh

xe bằng cách bù tỷ số trượt bánh xe. Các gia tốc kế đã được sử dụng trong [13, 19] để bù trượt bánh xe trong

thời gian thực. Nghiên cứu trong [20] đã phát triển một bộ điều khiển bền vững xử lý cả tốc độ trượt lẫn gia

tốc trượt bằng cách sử dụng hệ tọa độ của độ phẳng vi phân.

1.4. Mô hình động học

Xét một rô bốt di động kiểu bánh xe chịu ràng buộc nonholonomic như Hình 1.3. Cụ thể, G(xG, yG) là

vị trí của tâm khối của phần cứng rô bốt di động. M(xM, yM) là trung điểm của đoạn trục thẳng nối hai bánh xe.

F1, F2 là các ma sát dọc giữa bánh phải và bánh trái với mặt sàn. F3 là tổng lực ma sát tác động theo hướng

ngang ở hai điểm tiếp xúc của hai bánh xe với mặt sàn.

Khi không tồn tại trượt bánh xe, vận tốc tịnh tiến và vận tốc góc lần lượt được tính như sau [21]:

R L

R L

2

2

r

r

b

(1.1)

5

trong đó R L, lần lượt là tọa độ góc của bánh phải và bánh trái.

Bởi vậy, động học của rô bốt di động này được biểu diễn như sau [4]:

M

M

cos

sin

x

y

(1.2)

Ràng buộc nonholonomic của rô bốt di động đảm bảo hai yếu tố như sau:

Hướng của chuyển động tịnh tiến luôn vuông góc với trục nối hai bánh xe chủ động.

Cả chuyển động tịnh tiến lẫn chuyển động quay đều hoàn toàn phụ thuộc vào chuyển động lăn

của hai bánh xe chủ động.

Cụ thể, ràng buộc này có thể được biểu diễn toán học như sau [32]

R M M0 cos sinr x y b (1.3)

L M M0 cos sinr x y b (1.4)

M M0 sin cosx y (1.5)

Mặt khác, khi tồn tại trượt bánh xe, vận tốc tịnh tiến theo hướng dọc được tính như sau:

R L

2

(1.6)

trong đó R L, lần lượt là các tọa độ trượt dọc của bánh phải và bánh trái. Tiếp theo, vận tốc góc thực của nó

được tính như sau:

R L

2b

(1.7)

Ta định nghĩa là tọa độ của trượt ngang dọc theo trục bánh xe (xem Hình 1.1). Mô hình động học

của rô bốt di động trong tình huống này là [30]:

M

M

cos sin

sin cos

x

y

(1.8)

Vì hiện tượng trượt, các ràng buộc nonholonomic bị biến dạng như sau [32]:

R R M Mcos sinr x y b (1.9)

L L M Mcos sinr x y b (1.10)

M Msin cosx y (1.11)

1.5. Mô hình động lực học

Mô hình động lực học của rô bốt di động chịu ảnh hưởng của trượt bánh xe, bất định mô hình, và

nhiễu ngoài được biểu diễn bởi

d Mv Bv Bv Qγ C G τ τ (1.23)

Đặc điểm 1: Ma trận M có tính khả nghịch và xác định dương và thỏa mãn bất phương trình sau: 2 2T

1 2M M x x Mx x

với M1 và M2 lần lượt là giá trị chặn trên và chặn dưới của ma trận M và thỏa mãn 2 1M M 0 .

Đặc điểm 2: Ma trận 2 M B v là một ma trận có tính đối xứng lệch, tức là

T 2 0 x M B v x với 2 1 x R .

6

Hình 1.3. Một rô bốt di động và hiện tượng trượt bánh xe.

1.6. Kết luận chương 1

Đã có rất nhiều nhà khoa học trên khắp thế giới đã dành thời gian nghiên cứu và giải quyết vấn đề này.

Tuy nhiên, phần lớn các nghiên cứu được thực hiện dưới giả thiết rằng góc trượt [36-39] và hệ số ma sát giữa

bánh xe và mặt đường [29] luôn được đo chính xác trong thời gian thực. Hiển nhiên, các đại lượng gồm gia

tốc tịnh tiến, gia tốc góc, vận tốc tịnh tiến, vận tốc góc đều có thể được đo trực tiếp một cách dễ dàng qua

các cảm biến rẻ tiền, nhưng góc trượt và hệ số ma sát lại rất khó để đo [40].

Các phương pháp điều khiển được đề xuất trong luận án sẽ hướng tới không sử dụng các cảm biến

đo góc trượt và hệ số ma sát. Thay vào đó, ảnh hưởng tiêu cực từ trượt bánh xe lên hiệu năng điều khiển bám

sẽ được bù một cách gián tiếp trong các bộ điều khiển.

Ở chương này, mô hình động học và động lực học của rô bốt 3 bánh xe chịu tác động nhiễu ngoài,

trượt bánh xe đã được xây dựng thành công. Các mô hình này sẽ được sử dụng để thiết kế các luật điều khiển

bù trượt bánh xe, bất định mô hình, và nhiễu ngoài ở các chương sau.

Nội dung của Chương này được trích dẫn từ tài liệu công bố số 3.

CHƯƠNG 2. THIẾT KẾ LUẬT ĐIỀU KHIỂN BÁM THÍCH NGHI DỰA TRÊN MẠNG NƠ RON

BA LỚP

2.1. Đặt vấn đề

Vì lý do luật điều khiển trong [33] được thiết kế trong hệ tọa độ toàn cục OXY nên nó yêu cầu phải

đo các vận tốc trong hệ toàn cục này. Nhiệm vụ đo vận tốc này đã được giải quyết bằng bộ quan sát supper-

twisting. Kết quả ước lượng từ bộ quan sát này có thể chứa sai lệch tích lũy trong quá trình vận hành rô bốt.

Nên khả năng triển khai ứng dụng của phương pháp điều khiển trong [33] vẫn bị hạn chế.

Để tránh nhược điểm này, bộ điều khiển mới được đề xuất ở đây được thiết kế trong hệ tọa độ thân rô

bốt MXY. Khi đó, các biến vận tốc của rô bốt có thể được đo trực tiếp thông qua các cảm biến rẻ tiền nhưng

có độ tin cậy cao. Bên cạnh đó, các vận tốc và gia tốc của trượt bánh xe đều không cần phải đo. Thay vào đó,

các ảnh hưởng tiêu cực của chúng sẽ được bù bằng một luật điều khiển có sử dụng mạng nơ ron ba lớp.

F2

F1

F3

Bánh trái

Bánh phải

Bánh thụ

động

a

2b

F4

L

R

Trục bánh

xe

G

M

Phần cứng

θ

7

2.2. Cấu trúc mạng nơ ron ba lớp

Hiển nhiên rằng các mạng nơ ron nhân tạo có khả năng xấp xỉ các hàm phi tuyến đủ trơn với một độ

chính xác tùy ý [8]. Trong tiểu mục này, một mạng nơ ron nhân tạo 3 lớp được giới thiệu khái quát. Như được

minh họa trong Hình 4.1, đầu ra của của mạng nơ ron này được tính như sau 3

T

1 2, , ,..., Ny y y y W V

T T W σ V x trong đó 1

T

1 21, , ,..., Nx x x x là véc tơ đầu vào, ijw W và ijv V lần lượt là các ma

trận trọng số mạng nơ ron kết nối từ lớp đầu vào tới lớp ẩn và từ lớp ẩn tới lớp đầu ra (xem Hình 4.1).

Xét một hàm liên tục 31 NN: f x R R . Tồn tại các ma trận trọng số lý tưởng, *W và V , sao cho

T T* f x W σ V x ε (2.3)

trong đó ε là véc tơ của các sai lệch xấp xỉ tối ưu.

Giả sử 2.1: ε là bị chặn [8]. Cụ thể, bε với b là một hằng số dương hữu hạn nào đó.

Coi T Tˆ ˆ ˆ ˆ, , f x W V W σ V x là một ước lượng của f(x). Trong đó W và V lần lượt là các ma trận

ước lượng của *W và V ; chúng đều được cập nhật online bởi các thuật toán điều chỉnh trọng số online.

Để thuận tiện, ta ký hiệu T*σ σ V x và Tˆˆ ˆσ σ V x . Véc tơ sai số xấp xỉ hàm được tính như sau:

T T T T*

ˆ ˆ ˆ ˆ ˆ, , f f x f x W V W σ V x ε W σ V x (2.4)

2.3. Phát biểu bài toán

Gọi D(xD, yD) là mục tiêu đang di chuyển theo một quỹ đạo mong muốn với một vận tốc tịnh tiến được

định nghĩa trước (xem Hình 2.2). Không mất tính tổng quát, phương trình chuyển động của D được mô tả như

sau:

D 0

D 0

. cos( . )

. sin( . )

D

D

x T t R t x

y T t R t y

(2.5)

trong đó , TD, R, , x0, y0 là các hằng số biểu diễn tham số của phương trình chuyển động của mục tiêu.

Chú ý 2.1: trong Hình 2.2, ta ký hiệu (xP, yP) là vị trí của điểm P, (xP, yP, ) là một véc tơ mô tả cả vị

trí và hướng thực của rô bốt di động. Sự hiện diện của trượt bánh xe (cả trượt dọc và trượt ngang) khiến cho

bài toán điều khiển rô bốt di động sao cho cả vị trí và hướng thực (xP, yP, ) bám theo vị trí và hướng mong

muốn (xPd, yPd, d) không thể được giải quyết với một hiệu năng có thể chấp nhận được [32]. Nhưng, nếu ta

điều khiển rô bốt sao cho vị trí thực (xP, yP) bám theo mục tiêu D(xD, yD) thì bài toán điều khiển hoàn toàn có

thể được giải quyết mặc dù tồn tại cả trượt dọc và trượt ngang [32].

2.4. Mô tả véc tơ FTE (sai lệch bám được lọc – filtered tracking errors)

Một véc tơ của các biến đầu ra được mô tả trong hệ tọa độ M-XY như sau:

1 D M

2 D M

cos sin

sin cos

x x

y y

ζ (2.6)

Đạo hàm bậc nhất của (2.6) được tính như sau:

D

D

cos sin

sin cos

x

y

ζ hv χ (2.7)

8

Hình 2.2. Tọa độ của mục tiêu trong hệ tọa độ gắn thân rô bốt M-XY.

trong đó R

L

v , 2 2

1 1

1 11 1

2 2

2 2

r r

b b

r r

b b

h , 2

1

22

R LR L

b

χ .

Đạo hàm bậc hai của (2.6) được biểu diễn như sau:

1 2 ζ hv Ψ Ψ (2.8)

trong đó D D D D1

D D D D

cos sin sin cos

sin cos cos sin

x y x y

x y x y

Ψ hv , D D2

D D

sin cos

cos sin

x y

x y

Ψ .

Chú ý 2.2: Nếu 1 0 , thì h là một ma trận khả nghịch.

Gọi dζ là véc tơ mong muốn của ζ . Dựa vào yêu cầu bài toán điều khiển bám nói trên và Hình 2.2, hoàn toàn

có thể tính được T

d 0Cζ .

Một véc tơ sai lệch bám vị trí được định nghĩa như sau:

T

1 2 de e e = ζ - ζ (2.9)

Một véc tơ FTE (filtered tracking errors) được định nghĩa như sau:

φ = e+Λe (2.10)

trong đó Λ là một ma trận đường chéo, hằng, xác định dương, và có thể được lựa chọn tùy ý.

2.5. Cấu trúc bộ điều khiển

2Ψ trong (3.3) phụ thuộc trực tiếp vào vận tốc và gia tốc trượt bánh xe, nên nó là bất định. Vì thế, một

biến phụ được đề xuất như sau:

1d 1

κ = h ζ Λe Ψ (2.14)

Mặt khác, ta có thể viết lại (1.23) như sau:

1

2

xD

yD

Trục OY

C

xM

D (mục tiêu)

P

M

Trục OX

yM

xP O

Trục

MY

Trục

MX

yP

9

d Mv τ Bv d τ (2.15)

trong đó d Qγ C G Bv .

Tiếp theo, ta có thể chọn một luật điều khiển bằng phương pháp tính mô men như sau:

1 ˆˆ ˆ ˆ, ,

τ Mh Kφ f x W V (2.19)

trong đó K là một ma trận 22 hằng, đường chéo, và xác định dương và được lựa chọn tùy ý. ˆ ˆ ˆ, ,f x W V là

đầu ra của mạng nơ ron để xấp xỉ f x như được mô tả trong (2.4).

Trong Chương này, luật cập nhật trọng số mạng nơ ron được đề xuất như sau:

T T T1

ˆ ˆ ˆˆ W H σφ σV xφ φ W (2.24)

T T2

ˆ ˆ ˆ V H xφ W σ φ V (2.25)

trong đó 1H là một ma trận hằng 2 3N 1 N , xác định dương, 2H là một ma trận hằng 1 21N N , xác

định dương, là một hằng số dương. Tất cả 1H , 2H , và đều có thể được lựa chọn tùy ý.

Hình 2.1. Cấu trúc của mạng nơ ron 3 lớp.

Hình 2.2. Sơ đồ khối của toàn bộ hệ thống điều khiển vòng kín.

2.6. Phân tích tính ổn định

Định lý 2.1: Đối với một rô bốt di động chịu ảnh hưởng của trượt bánh xe như được minh họa bởi mô

hình động học (1.8) và mô hình động lực học (1.23), nếu luật điều khiển được mô tả bởi Hình 2.2 với tín hiệu

đầu vào điều khiển được lựa chọn bởi (2.19) và các luật cập nhật trọng số mạng nơ ron được lựa chọn bởi

(2.24) và (2.25), thì theo tiêu chuẩn Lyapunov và đinh lý LaSalle mở rộng [8], tín ổn định của toàn bộ hệ thống

điều khiển vòng kín được đảm bảo để đạt được một hiệu năng bám mong muốn mà ở đó véc tơ sai lệch bám vị

Lớp đầu vào Lớp ẩn Lớp đầu ra

x1

x2

y1

y2

1

yN3 wN2N3

v1

v2

vN2

w1

w2

wN3

xN1

v11

Bộ điều

khiển

WMR

chịu

trượt

bánh xe

Mục tiêu

(xD, yD)

e

+

- Phương

trình (2.6)

Mạng nơ

ron ba lớp

v Phương

trình (2.14)

10

trí lọc φ sẽ hội tụ về một lân cận nhỏ tùy ý của không trong khi tất cả các tín hiệu trong hệ thống điều khiển

đều bị chặn kiểu UUB.

2.7. Kết quả mô phỏng

Để minh họa tính đúng đắn của luật điều khiển trong chương này, các mô phỏng máy tính bằng phần

mềm Matlab/Simulink đã được thực hiện. Rô bốt di động được mô tả bởi các tham số trong Bảng 3.1. Hơn

nữa, vì mục đích so sánh, phương pháp trong Chương 3 cũng được mô phỏng trong cùng một điều kiện, cụ thể

là tồn tại các bất định mô hình và nhiễu ngoài (tức d τ 0 ; M 0 ), hơn nữa các tốc độ trượt bánh xe không

được đo.

Không mất tính tổng quát, giả sử rằng T

d 3 sin 0,5 2,5 cos 0,4t t τ và ˆ 0,7M M , và vận

tốc trượt bánh xe TT

2sin 1,5cos0,5 0,5R L t t (m/s) đối với t > 0 (s). Ở thời điểm ban đầu,

vị trí và hướng được giả lập trong hệ O-XY là M 0x (m), M 0y (m), và / 6 (rad).

Đối với mạng nơ ron, để đơn giản trong xây dựng mô hình mạng nơ ron mà không giảm đi ý nghĩa

xấp xỉ hàm phi tuyến bất định, lớp ẩn được lựa chọn có 10 nơ ron, bởi vậy các ma trận hệ số được lựa chọn

như sau 1 11 210

H diag , 2 5 10

8

H diag và 0,5 . Dưới đây là 2 ví dụ mô phỏng đã được thực hiện

bằng công cụ Matlab/Simulink.

Hình 2.4. Đồ thị của các tốc độ trượt theo thời gian.

Bảng 2.1. Các tham số của rô bốt di động [21].

Tên biến Ý nghĩa Giá trị

r Bán kính bánh xe 0,065 (m)

b Một nửa trục nối hai bánh xe chủ động 0,375 (m)

IG Hệ số mô men quán tính của phần cứng rô bốt di động quanh trục thẳng

đứng đi qua G. 15,625 (kg.m2)

IW Mô men quán tính của bánh xe xung quanh trục bánh xe 0,0025 (kg.m2)

ID Mô men quán tính của mỗi bánh xe quanh trục thẳng đứng đi qua tâm

bánh xe 0,005 (kg.m2)

mG Khối lượng phần cứng 30 kg

mW Khối lượng mỗi bánh xe 1 kg

C Khoảng cách giữa M và P 0,5 m

a Khoảng cách giữa M và G 0,3 m

11

Các giá trị ban đầu của các ma trận trọng số nơ ron được khởi tạo là các số ngẫu nhiên trong khoảng

(0; 1) như sau 0 11 2ˆ 0;1rand

W và 0 5 10

ˆ 0;1rand

V .

Dưới đây là một ví dụ mô phỏng đã được thực hiện bằng công cụ Matlab/Simulink.

Ví dụ 2.1: Mục tiêu D di chuyển theo một đường tròn với phương trình chuyển động được mô tả như sau:

2 3cos(0,2 )

0,5 3sin(0,2 )

D

D

x t

y t

(2.36)

Các kết quả mô phỏng cho Ví dụ này được minh họa trong các Hình 2.5, 2.6, 2.7 và 2.8. Trong Hình

2.5, chúng ta có thể dễ dàng thấy rằng phương pháp được đề xuất trong Chương 2 này tỏ ra hiệu quả hơn

phương pháp điều khiển của Hoang Ngoc Bach trong [33] trong việc bám quỹ đạo khi tồn tại trượt bánh xe và

bất định mô hình.

Hình 2.5. So sánh hiệu năng bám giữa hai phương pháp trong Ví dụ 4.1.

Hình 2.6. So sánh các sai lệch bám vị trí trong Ví dụ 4.1.

Để tiện việc so sánh, sai lệch bám vị trí trong [33] được quy đổi từ hệ tọa độ toàn cục OXY sang hệ

tọa độ gắn liền thân rô bốt MXY. Hình 2.6 đã thể hiện phép so sánh sai lệch vị trí của hai phương pháp này

trong hệ tọa độ MXY. Cụ thể, trong trạng thái xác lập, mặc dù sai bám 1e của hai phương pháp là tương đương

12

nhau với giá trị độ lớn khoảng 0,005 (m), nhưng sai lệch bám vị trí 2e trong phương pháp mới này nhỏ hơn

so với phương pháp của Hoang và cộng sự [33] với giá lớn nhất lần lượt là: 0,01 và 0,04 (m).

Hình 2.7 minh họa kết quả so sánh mô men điều khiển giữa hai phương pháp. Về cơ bản, trong giai

đoạn quá độ, hai phương pháp này đòi hỏi mô men điều khiển tương đồng nhau. Trong giai đoạn xác lập,

phương pháp trong [33] đòi hỏi biên độ mô men điều khiển lớn hơn so với phương pháp được đề xuất. Tức là,

phương pháp điều khiển mới này sẽ tiết kiệm năng lượng hơn so với phương pháp [33].

Cần chú ý rằng các sai số bám vị trí đã hội tụ về lân cận không, bởi vậy ζ hội tụ về lân cận dζ . Hệ

quả, 1 hội tụ về lân cận C. Do đó, theo Chú ý 2.2, ma trận h luôn khả nghịch.

Hình 2.7. Các mô men quay trong Ví dụ 4.1 giữa hai phương pháp điều khiển.

2.8. Kết luận Chương 2

Tóm tại, trong chương này, một bộ điều khiển bám thích nghi được đề xuất dựa trên một mạng nơ ron

3 lớp với một luật cập nhật trong số mạng nơ ron online. Nhờ bộ điều khiển được đề xuất này, rô bốt di động

đã bám theo một quỹ đạo mong muốn với một hiệu năng bám tốt trong sự hiện diện của bất định mô hình,

nhiễu ngoài, và trượt bánh xe. Sai lệch bám vị trí đã hội tụ về lân cận không và được điều chỉnh nhỏ tùy ý. Các

kết quả mô phỏng đã thể hiện ưu điểm vượt trội so với phương pháp trong [33]. Cụ thể, phương pháp điều

khiển mới này vừa bám quỹ đạo chính xác hơn lại vừa tiết kiệm năng lượng hơn so với phương pháp trong

[33].

CHƯƠNG 3. THIẾT KẾ LUẬT ĐIỀU KHIỂN BACKSTEPPING DỰA TRÊN MẠNG SÓNG

GAUSSIAN

3.1. Đặt vấn đề

Mặc dù phương pháp điều khiển ở Chương 2 đã tỏ ra hiệu quả khi bù bất định mô hình và nhiễu ngoài,

nhưng độ chính xác điều khiển (véc tơ sai lệch bám vị trí e) chưa thực sự cao so với kỳ vọng của các nhiệm vụ

yêu cầu khắt khe về độ chính xác. Lý do có thể là:

trong phương pháp điều khiển đó, đã không có sự phân chia nhiệm vụ một cách rõ ràng. Cụ

thể, ở đâu (thành phần điều khiển nào) là để xử lý (bù) ảnh hưởng tiêu cực của trượt bánh xe?

Và ở đâu (thành phần điều khiển nào) là để xử lý (bù) bất định mô hình và nhiễu ngoài ở cấp

độ động lực học.

13

Hoặc trong hệ thống điều khiển đó, không có thành phần điều khiển bền vững, nên tiêu chuẩn

ổn định chỉ là UUB. Cụ thể, các sai lệch điều khiển chỉ được đảm bảo sẽ hội tụ về một miền

kín lân cận không, chứ không phải hội tụ về không.

Do vậy, ở Chương 3 này, một phương pháp điều khiển bám bền vững thích nghi dựa trên kỹ thuật

backstepping [8] (tạo tác động ngược từ động học vào động lực học) cho rô bốt di động để bù trượt bánh xe,

bất định mô hình, và nhiễu ngoài. Sơ đồ khối của hệ thống điều khiển vòng kín được mô tả như Hình 3.1.

Cụ thể, hệ thống này gồm 2 vòng điều khiển kín. Vòng ngoài chứa bộ điều khiển động học. Trong bộ

điều khiển động học này, thành phần bền vững động học được sử dụng để bù ảnh hưởng tiêu cực của trượt

bánh xe. Vòng kín phía trong chứa bộ điều khiển động lực học. Đầu ra của bộ điều khiển động học cũng chính

là đầu vào của vòng điều khiển động lực học phía trong. Ở đây, mạng sóng Gausian (Gaussian wavelet network

– GWN) được sử dụng để xấp xỉ các hàm động lực học phi tuyến không được xác định trước do không biết

trước mô hình động lực học của rô bốt di động. Thành phần bền vững động lực học được sử dụng để bù ảnh

hưởng tiêu cực của bất định mô hình, nhiễu ngoài, và sai số xấp xỉ hàm không thể tránh khỏi do số lượng hữu

hạn các hàm sóng cơ sở trong lớp ẩn của GWN.

3.2. Mô tả cấu trúc của mạng sóng Gaussian

Cấu trúc của mạng sóng Gaussian được mô tả trong Hình 3.2. Nếu mạng này chứa p hàm sóng cơ sở

thì đầu ra của nó được tính như sau:

p

k j j

j

f wx x với j = 1,…, p (3.1)

trong đó T

1,..., nx xx là véc tơ đầu vào; jw biểu thị một trọng số.

j x biểu thị một hàm sóng đa chiều và được tạo thành bởi tích của các hàm sóng đơn chiều [40] như sau:

1 2 ...j j j j nx x x x (3.2)

trong đó 221

exp2

j i i i ij i ijx x x c

với 221i i ij i ijx x c .

ij và ijc lần lượt là hệ số giãn nở và tịnh tiến.

Nhờ vào khả năng xấp xỉ mạnh mẽ của mạng GWN [40], nếu như đã cho trước một hàm trơn bất kỳ

f x thì sẽ tồn tại một ma trận trọng số tối ưu W , các véc tơ tối ưu ξ và c sao cho

T* * *, , f x W ψ x ξ c ε (3.5)

trong đó ε mô tả một véc tơ của các sai lệch xấp xỉ tối ưu.

3.3. Thiết kế luật điều khiển động học

Chương này cũng sẽ giải quyết bài toán điều khiển như được phát biểu trong mục 2.3.

Giả sử 3.3: Các tọa độ Dx , Dy cùng với các đạo hàm bậc 1 và 2 của chúng đều bị chặn.

Giả sử 3.4: Tất cả các tốc độ trượt bánh xe đều bị chặn. Bởi vậy, tồn tại một hằng số dương biết trước

sao cho χ .

Bởi vì vận tốc của các tọa độ trượt bánh xe không được đo nên χ trong (2.7) là bất định. Ví thế, luật

điều khiển động học trong phương pháp điều khiển này được đề xuất như sau

14

D1I d

D0

cos sin

sin cos

t

c

xd

y

v h Λe Λ e ζ r (3.9)

trong đó cv là véc tơ mong muốn của véc tơ các vận tốc góc bánh xe v ; r là thành phần bền vững động học

được đề xuất như sau để bù ảnh hưởng tiêu cực của trượt bánh xe.

e

re

(3.10)

trong đó là hệ số của thành phần bền vững động học và được như trong Giả sử 3.4.

3.4. Thiết kế luật điều khiển động lực học

Ta đề xuất một đầu vào điều khiển như sau.

ˆˆ ˆ ˆˆ, , , τ Ks f x W ξ c d (3.14)

trong đó K là một ma trân đường chéo xác định dương và có thể được lựa chọn tùy ý.

Hình 3.1. Sơ đồ khối của phương pháp điều khiển trong chương 3.

Hình 3.2. Cấu trúc của mạng sóng Gaussian – GWN.

Phương

trình (3.2)

bôt di

dộng

Bộ điều

khiển động

lực học

Bộ điều khiển động

học

Mạng sóng

Gaussian

Bền vững động lực

học

Bền vững

động học

+

- - +

Ph

ép T

ịnh tiến

x1

xn

Hệ số dãn

nở

Hệ số dãn

nở

15

ˆˆ ˆ ˆ, , ,f x W ξ c là đầu ra của GWN như được mô tả trong (3.6) và được sử dụng để xấp xỉ f x ; d minh họa

thành phần bền vững động lực học được sử dụng để khử tổng bất định do sai số xấp xỉ của GWN, bất định mô

hình động lực học, và nhiễu ngoài không được xác định, vân vân.

Thành phần bền vững động lực học d trong (5.14) được đề xuất như sau:

ˆ s

ds

(3.25)

trong đó là hằng số dương và được lựa chọn sao cho thỏa mãn Giả sử 3.5 như sau.

3.5. Phân tích tính ổn định

Định lý 3.1. Xét rô bốt di động trong sự hiện diện của trượt bánh xe, bất định mô hình, và nhiễu ngoài

với mô hình động học (1.8) và mô hình động lực học (1.23), các Giả sử 3.1 -3.5 đúng. Nếu luật điều khiển

được đề xuất như Hình 3.1 với luật điều khiển động học (3.9), luật điều khiển động lực học (3.14), và các luật

cập nhật trọng số cho GWN như (3.28), (3.29), và (3.30), thì các véc tơ sai lệch điều khiển bám, e và s , sẽ

hội tụ tiệm cận về 0 khi t , và hơn nữa tất cả các tín hiệu trong hệ thống điều khiển vòng kín được đảm

bảo bị chặn với 0t .

Chú ý 3.1. Để khử hiện tượng chattering trong cv (ở cấp độ động học), ta thay thế (3.10) bởi luật bền

vững mới sau:

e

er

e

e

e

(3.42)

trong đó là một hằng số thực dương rất nhỏ và có thể được lựa chọn tùy ý.

Chú ý 3.2. Tương tự, với mục đích khử hiện tượng chattering của vòng động lực học, (3.25) được thay

bằng phương trình sau.

ˆ

s

sd

s

s

s

(3.49)

trong đó là một hằng số dương rất nhỏ có thể được lựa chọn tùy ý.

3.6. Kết quả mô phỏng

Trong phần này, một mô phỏng được thực hiện để kiểm chứng tính đúng đắn và hiệu năng của phương

pháp điều khiển được đề xuất trong Chương này. Cần nhấn mạnh rằng không có bất kỳ thông tin nào được

biết trước về mô hình động lực học của rô bốt di động.

Hơn nữa, trong mô phỏng này, một phép so sánh hiệu năng bám của phương pháp được đề xuất với

phương pháp điều khiển trong Chương 2 cũng được thực hiện để so sánh, phân tích ưu nhược điểm của hai

phương pháp điều khiển này với nhau.

Ví dụ 3.1: Mục tiêu D đã di chuyển trên quỹ đạo cong như sau.

D

D

2 3cos 0,2

0,5 3sin 0,2

x t

y t

(3.51)

Các kết quả mô phỏng của cả hai phương pháp được minh họa trong các Hình 3.3, 3.4, và 3.5.

nếu

nếu

nếu

nếu

16

Nếu chỉ xem Hình 3.3, ta có thể lầm tưởng rằng hiệu năng của hai phương pháp điều khiển này là

tương đương nhau. Nhưng khi xem Hình 3.4, ta dễ dàng thấy rằng các sai lệch bám vị trí e1,2 của Phương pháp

điều khiển được đề xuất mới ở đây nhỏ hơn rất nhiều so với các sai lệch bám vị trí e1,2 trong Chương 2. Cụ

thể, các giá trị lớn nhất của e1,2 của phương pháp mới trong giai đoạn xác lập lần lượt là 1.10-3 và 0,6.10-3(m).

Trong khi đó, đối với phương pháp trong Chương 2, các giá trị tương ứng lần lượt là: 1,5.10-2 và -1,2.10-2 (m).

Bởi vậy, khả năng xấp xỉ của GWN và khả năng bền vững của các thành phần điều khiển bền vững

đã tạo ưu điểm vượt trội cho phương pháp điều khiển mới này so với phương pháp trong Chương 2.

Hình 3.3. So sánh các quỹ đạo trong ví dụ 3.1.

Tuy nhiên, nhược điểm của phương pháp mới này là rằng: để có được hiệu năng bám tốt hơn Chương

2 như vậy, phương pháp mới được đề xuất trong Chương 3 này đã phải đòi hỏi mô men quay lớn ở các tín hiệu

đầu vào điều khiển. Kết quả từ Hình 3.5 đã thể hiện rất rõ ràng. Cụ thể, phương pháp mới này đòi hỏi các đầu

vào điều khiển lớn tại thời điểm ban đầu với các giá trị lần lượt là 100 (N.m) ở bánh phải và 80 (N.m) ở bánh

trái. Trong khi đó, với phương pháp ở Chương 2, tại thời điểm ban đầu, các mô men điều khiển lần lượt là 63

(N.m) ở bánh phải và 38 (N.m) ở bánh trái.

Cuối cùng nhưng không kém phần quan trọng, để đánh giá hiệu quả của các biện pháp khử chattering

trong các Chú ý 3.1 và 3.2, ta thực hiện lại mô phỏng Ví dụ 5.1 với các luật điều khiển động học (5.10) và

động lực học (3.25) sau đó so sánh với kết quả mô phỏng tương ứng các luật (3.42) trong Chú ý 3.1 và (3.49)

trong Chú ý 3.2. Kết quả từ Hình 3.6 cho thấy hiệu quả xử lý chattering được thể hiện rất rõ ràng ở cả hai bánh

xe. Khi chattering được xử lý phù hợp thì giá thành (chi phí năng lượng) vận hành hệ thống điều khiển vòng

kín này sẽ được giảm xuống, và đồng thời tuổi thọ của các phần tử chấp hành tại các bánh xe sẽ kéo dài hơn

rất nhiều.

Rất cần thiết để chú ý rằng trong các Hình 3.4, véc tơ các sai lệch bám vị trí, e trong (3.8), đã hội tụ

tiệm cận về không. Bởi vậy, 1 đã hội tụ tiệm cận về hằng số C. Tức là, ma trận h trong (2.7) luôn khả nghịch.

Do vậy, ta có thể kết luận rằng luật điều được đề xuất trong Định lý 3.1 là đúng.

17

a) b)

Hình 3.4. So sánh các sai lệch bám vị trí e1,2 trong Ví dụ 3.1 giữa hai phương pháp điều khiển.

a) So sánh e1 trong toàn bộ quá trình mô phỏng; b) so sánh e2 trong toàn bộ quá trình mô phỏng;

a) b)

Hình 3.5. So sánh mô men quay giữa hai phương pháp điều khiển.

a) Mô men quay ở bánh phải; b) Mô men quay ở bánh trái.

3.7. Kết luận chương 3

Trong chương này, một bộ điều khiển bám dựa trên kỹ thuật backstepping và mạng sóng Gaussian

GWN với các luật cập nhật tham số động đã được sử dụng để cho phép rô bốt di động bám theo một quỹ đạo

cho trước trong điều kiện tồn tại trượt bánh xe, bất định mô hình và nhiễu ngoài. Với phương pháp này, không

cần phải biết trước mô hình động lực học của rô bốt di động và cũng như không cần phải đào tạo tĩnh trước

các trọng số của GWN. Tính ổn định của toàn hệ thống điều khiển được đảm bảo bằng tiêu chuẩn Lyapunov.

Các kết quả mô phỏng đã kiểm chứng tính đúng đắn và hiệu quả của phương pháp điều khiển mới này.

Tuy nhiên, nhược điểm của phương pháp này là đòi hỏi tín hiệu điều khiển đầu vào (mô men quay) ở

thời điểm ban đầu rất lớn.

Nội dung của Chương 3 này được trích dẫn từ bài báo công bố số 7.

18

Hình 3.6. Đánh giá hiệu quả của biện pháp xử lý chattering ở cả hai bánh xe.

a) So sánh mô men ở bánh phải.

b) So sánh mô men ở bánh trái.

CHƯƠNG 4. THIẾT KẾ LUẬT ĐIỀU KHIỂN THÍCH NGHI BACKSTEPPING HỘI TỤ HỮU HẠN

Ở CẤP ĐỘ ĐỘNG LỰC HỌC

4.1. Đặt vấn đề

Như ta đã biết, nhược điểm của phương pháp điều khiển ở Chương 3 là đòi hỏi mô men điều khiển

quá lớn ở thời điểm ban đầu, cụ thể là 100 và 80 N.m. Điều này có thể dẫn đến nguy cơ bão hòa động cơ ở

phần tử chấp hành [42-44].

Nguy cơ bão hòa động cơ là một hiện tượng xảy ra khi khả năng cung cấp tối đa mô men quay ở phần

tử chấp hành nhỏ hơn yêu cầu ở đầu ra của bộ điều khiển. Tức là các phần tử chấp hành đã không đáp ứng

được các yêu cầu về độ lớn mô men quay của bộ điều khiển.

Nếu hiện tượng này xảy ra thì khả năng ứng dụng của luật điều khiển vào hệ thống điều khiển vòng

kín sẽ bị méo mó và thậm chí gây ra mất ổn định toàn hệ thống.

Nhược điểm của luật điều khiển ở Chương 3 cũng là lý do để một luật điều khiển mới ở Chương 4 này

được đề xuất thêm.

Tương tự Chương 3, ở Chương 6 này, một phương pháp điều khiển bám bền vững thích nghi dựa trên

kỹ thuật backstepping cho rô bốt di động để bù trượt bánh xe, bất định mô hình, và nhiễu ngoài được đề xuất.

Sơ đồ khối của hệ thống điều khiển vòng kín được mô tả như Hình 4.1.

4.2. Mô tả cấu trúc của RBFNN

Như được thấy trong Hình 4.2, cấu trúc của RBFNN bao gồm 3 lớp: lớp đầu vào, lớp ẩn, và lớp đầu

ra. Đối với bất kỳ một véc tơ hàm liên tục và bị chặn nào 31:NN f x R R , tồn tại một ma trận tối ưu W sao

cho

T f x W σ ε (4.4)

trong đó ε là véc tơ sai lệch xấp xỉ tối ưu.

4.3. Thiết kế luật điều khiển động học

Xuất phát từ (3.9) trong chương 3, luật điều khiển động học trong phương pháp điều khiển này được

đề xuất như sau:

0 2 4 6 8-50

0

50

100

Danh gia hieu qua cua bien phap xu lychattering o BANH PHAI

thoi gian (s)

Mo

men

qu

ay (

N.m

)

0 2 4 6 8

-20

0

20

40

60

80

Danh gia hieu qua cua bien phap xu ly chattering o BANH TRAI

thoi gian (s)

Mo

men

qu

ay (

N.m

)

Khong xu ly chattering

Co xu ly chattering

Khong xu ly chattering

Co xu ly chattering

19

D1I d

D0

cos sinˆ

sin cos

t

c

xd

y

v h Λe Λ e ζ χ (4.6)

trong đó cv là véc tơ mong muốn của véc tơ các vận tốc góc bánh xe v , Λ là một ma trận đường chéo, hằng,

xác định dương, và có thể được lựa chọn tùy ý; χ là thành phần bền vững động học được đề xuất như sau

ˆˆ e

χe

4.7)

trong đó là hệ số của thành phần bền vững động học và được cập nhật online như sau:

ˆ H e (4.8)

trong đó H là một hệ số dương và cũng được lựa chọn tùy ý.

4.4. Thiết kế luật điều khiển động lực học

Vì không biết trước mô hình động lực học của rô bốt di động, nên ta không thể biết f x một cách

chính xác. Bởi vậy, ta đề xuất đầu vào điều khiển như sau:

ˆ ˆ ˆ,

τ Ksig s f x W d (4.12)

trong đó K là một ma trận hằng xác định dương và có thể được lựa chọn tùy ý.

Hình 4.1. Khả năng đáp ứng của động cơ đối với đầu ra của bộ điều khiển.

Hình 4.2. Sơ đồ khối của phương pháp điều khiển trong Chương 4.

Bộ điều

khiển Động

Ký hiệu viết tắt:

C - Mệnh lệnh từ đầu ra bộ điều

khiển

A – Đáp ứng thực tế của động cơ

Ngưỡng bão hòa

Ngưỡng bão hòa

C

A

A

C

Phương trình

(3.2)

Rô bốt di

động bị

trượt bánh

xe

Bộ điều

khiển động

lực học

Bộ điều

khiển động

học

RBFNN

Thành phần bền vững

động lực học

Thành phần

bền vững động

học

e

+ - -

+

20

Hình 4.3. Cấu trúc mạng nơ ron RBFNN.

Tˆ ˆ ˆ, f x W W σ là đầu ra của RBFNN (4.3) và được sử dụng để xấp xỉ f x . Tiếp theo,

T

1 1 2 2sign , signs s s s

sig s (4.13)

với là một hằng số dương thỏa mãn 0 1 ; d biểu diễn thành phần bền vững động lực học được sử dụng

để bù tổng bất định gồm bất định mô hình, nhiễu ngoài, và sai số xấp xỉ hàm do số lượng hữu hạn của các nơ

ron lớp ẩn gây ra.

Bây giờ, thành phần bền vững động lực học d được định nghĩa như sau:

2M

1ˆ ˆ W2

sd

s (4.16)

trong đó là một hằng số dương và có thể được lựa chọn tùy ý. là hệ số bền vững động lực học và được

cập nhật động như sau:

s (4.17)

với là một hằng số dương và cũng được lựa chọn tùy ý.

4.5. Phân tích tính ổn định

Định lý 4.1: Chú ý đến một rô bốt di động trong sự hiện diện của trượt bánh xe, bất định mô hình, và

nhiễu ngoài với mô hình động học (1.8) và động lực học (1.23). Các Giả sử 3.3-3.4 và 4.1-4.3 được thỏa mãn.

Nếu phương pháp điều khiển được mô tả như Hình 6.1 với luật điều khiển động học (6.6), luật điều khiển động

lực học (4.12), thành phần bền vững động học (4.7), thành phần bền vững động lực học (4.16), và các luật cập

nhật động (4.8), (4.17), và (4.19) được đề xuất, thì véc tơ sai lệch bám vận tốc góc s hội tụ về không trong một

thời gian hữu hạn, véc tơ sai lệch vị trí e hội tụ tiệm cận về 0 khi t , các tín hiệu điều khiển được đảm

bảo luôn bị chặn.

4.6. Kết quả mô phỏng

Trong phần này, ta thực hiện một mô phỏng để kiểm chứng tính đúng đắn và hiệu năng của phương

pháp điều khiển được đề xuất trong Chương này. Hơn nữa, trong mô phỏng này, ta sẽ so sánh hiệu năng bám

của phương pháp được đề xuất này với phương pháp điều khiển trong Chương 3.

Vì mục đích so sánh, cả hai phương pháp này đều được thiết kế với cùng các hệ số điều khiển và

được thực hiện dưới một điều kiện có tính thực tiễn cao rằng bên cạnh chú ý đến sự tồn tại của bất định mô

hình và nhiễu ngoài, các vận tốc và gia tốc trượt bánh xe không được đo.

x1

Lớp đầu vào Lớp ẩn

Lớp đầu ra

21

Hình 4.4. So sánh hiệu năng bám quỹ đạo giữa phương pháp điều khiển mới này với phương pháp điều

khiển ở Chương 3.

Ví dụ 4.1: Mục tiêu D chuyển động theo phương trình sau.

D

D

2 3cos 0,2

1 3sin 0,2

x t

y t

(4.49)

Các kết quả mô phỏng được biểu diễn trong các Hình 4.4, 4.5, 4.6, và 4.7. Cụ thể, Hình 4.4 thể hiện

rằng sai lệch bám vị trí trong mặt phẳng O-XY của hai phương pháp điều khiển là tương đồng nhau.

Hình 4.5 thể hiện so sánh sai lệch bám vị trí e (được định nghĩa trong (3.8)) giữa hai phương pháp điều

khiển. Hình 4.5.a) và 4.5.b) minh họa so sánh toàn bộ tiến trình của các biến 1,2e . Ta thấy có vẻ như hai phương

pháp này cho kết quả tương đồng nhau về sai lêch bám vị trí.

a) b)

Hình 4.5. So sánh sai lệch vị trí giữa 2 phương pháp điều khiển.

a) So sánh toàn bộ tiến trình biến thiên của sai lệch vị trí 1e ;

b) So sánh toàn bộ tiến trình biến thiên của sai lệch vị trí 2e ;

22

a) b)

c) d)

Hình 4.6. so sánh sai lệch bám vận tốc góc ở bánh PHẢI và bánh TRÁI giữa hai phương pháp điều khiển.

a) so sánh toàn bộ tiến trình của sai lệch bám tốc độ góc ở bánh phải 1s ;

b) so sánh toàn bộ tiến trình của sai lệch bám tốc độ góc ở bánh trái 2s ;

c) so sánh TRẠNG THÁI XÁC LẬP của 1s ; d) so sánh TRẠNG THÁI XÁC LẬP của 2s ;

a) b)

Hình 4.7. So sánh các mô men quay (đầu vào điều khiển) của hai phương pháp điều khiển.

a) So sánh R ở bánh phải; b) So sánh L ở bánh trái

0 2 4 6 8-50

0

50

100

So sanh mo men quay o banh phai

thoi gian (s)

Mo

men

qu

ay (

N.m

)

0 2 4 6 8-20

0

20

40

60

80

So sanh mo men quay o banh trai

thoi gian (s)

mo

men

qu

ay (

N.m

)

chuong 6

chuong 5

chuong 6

chuong 5

23

Khi xét đến véc tơ sai lệch bám vận tốc góc s được định nghĩa trong (3.13) và (4.11) trong vòng điều

khiển động lực học như Hình 4.6, thì rõ ràng rằng trong giai đoạn xác lập, sai các sai lệch bám vận tốc góc

s1,2 của phương pháp mới nhỏ hơn rất nhiều so với phương pháp ở Chương 3. Cụ thể, các giá trị lớn nhất của

1,2s trong trạng thái xác lập ở Chương 4 đều là khoảng 5.10-3 (rad/s), trong khi đó các giá trị tương ứng ở

Chương 3 đều là khoảng 2,5.10-2 (rad/s). Lý do là rằng, xét về định tính, phương pháp điều khiển mới ở đây

đã đảm bảo tính hội tụ hữu hạn [46] ở cấp độ động lực học, nghĩa là, sai lệch điều khiển bám tốc độ góc s

được đảm sẽ hội tụ về không sau khoảng thời gian hữu hạn st được tính trong (4.37) thay vì chỉ hội tụ tiệm

cận (s 0 khi t ) như ở Chương 3.

Cuối cùng và quan trọng nhất, khi xét đến các tín hiệu đầu vào điều khiển R,L (mô men quay) như

trong Hình 4.7 thì rõ ràng rằng tại thời điểm ban đầu, các mô men quay của phương pháp mới nhỏ hơn rất

nhiều so với phương pháp ở Chương 3. Cụ thể, tại thời điểm 0(s), các giá trị mô men quay tại các bánh phải

và trái trong phương pháp Chương 4 lần lượt là 30 (N.m) và 25 (N.m). Nhưng đối với phương pháp trong

Chương 3, thì các giá trị tương ứng lần lượt là 100 (N.m) và 80 (N.m). Các các đòi hỏi giá trị mô men nhỏ tại

thời điểm ban đầu trong phương pháp mới sẽ làm giảm nguy cơ bão hòa động cơ, hạ thấp giá thành cho chi

phí đầu tư động cơ chấp hành.

4.7. Kết luận Chương 4

Tóm lại, luật điều khiển hội tụ hữu hạn ở cấp độ động lực học đã khắc phục được những nhược điểm

của phương pháp điều khiển ở Chương 3. Cụ thể là:

giảm được nguy cơ bão hòa động cơ tại thời điểm ban đầu.

nâng cao độ chính xác ở cấp độ động lực học trong trạng thái xác lập của hệ thống điều khiển.

không cần phải xác định trước các giá trị chặn trên của các thành phần bất định mô hình, nhiễu

ngoài và tốc độ trượt bánh xe.

KẾT LUẬN VÀ KIẾN NGHỊ

Sau khi tổng hợp nội dung trong các Chương ở trên, một số kết luận chính được đúc kết như sau:

Những nội dung nghiên cứu chính của luận án

Phân tích tổng quan, thực trạng, xu thế phát triển của các phương pháp điều khiển cho rô bốt di động

kiểu bánh xe để bám theo một quỹ đạo mong muốn được định nghĩa trước.

Phân tích các nguyên nhân và ảnh hưởng tiêu cực của các loại bất định mô hình, nhiễu ngoài, và

trượt bánh xe.

Xây dựng mô hình động học, động lực học của rô bốt di động khi xét ảnh hưởng tiêu cực của trượt

bánh xe lên chuyển động của rô bốt.

Xây dựng 03 luật điều khiển khác nhau để bù ảnh hưởng của trượt bánh xe lên rô bốt di động.

Thực hiện các mô phỏng máy tính bằng công cụ MATLAB/Simulink để kiểm chứng tính đúng đắn

của các luật điều khiển được đề xuất trong luận án.

Những đóng góp của luận án

Luận án có 03 đóng góp như sau:

Thiết kế luật điều khiển thích nghi dựa trên một mạng nơ ron ba lớp (chương 2).

Thiết kế luật điều khiển bám bền vững thích nghi sử dụng kỹ thuật backstepping và mạng sóng

Gaussian (chương 3).

Thiết kế luật điều khiển backstepping hội tụ hữu hạn ở cấp động lực học (chương 4).

Định hướng nghiên cứu phát triển

Tiếp tục nghiên cứu phát triển các phương pháp điều khiển mới cho rô bốt di động bám theo quỹ đạo

mong muốn.

24

Xây dựng hệ thống thực nghiệm để kiểm chứng các luật điều khiển được đề xuất.

DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ

1. Nguyễn Văn Tính, Phạm Thượng Cát, Phạm Minh Tuấn, “Mô hình hóa và điều khiển rô bốt di động

non-holonomic có trượt ngang”, Kỷ yếu hội nghị toàn quốc lần thư 3 về Điều khiển và Tự động hóa –

VCCA, 2015, Thái Nguyên, 103-108.

2. N. V. Tinh, N. T. Linh, P. T. Cat, P. M. Tuan, M. N. Anh, N. P. Anh, Modeling and Feedback

Linearization Control of a Nonholonomic Wheeled Mobile Robot with Longitudinal, Lateral Slips, In:

Proc. 2016 IEEE International Conference on Automation Science and Enginerring, TX, USA, 996-

1001.

3. Tinh Nguyen, Hung Linh Le, Neural network-based adaptive tracking control for a nonholonomic

wheeled mobile robot subject to unknown slips, Journal of Computer Science and Cybernetics, Vietnam

Academy of Science and Technology, 2017, 33(1), 1-17.

4. Tinh Nguyen, Linh Le, “Neural network-based adaptive tracking control for a nonholonomic wheeled

mobile robot with unknown wheel slips, model uncertainties, and unknown bounded disturbances”,

Turkish Journal of Electrical Engineering & Computer Sciences, 2018, 26, 378-392.

5. Tinh Nguyen, Kiem Nguyentien, Tuan Do, Tuan Pham, Neural Network-based Adaptive Sliding Mode

Control Method for Tracking of a Nonholonomic Wheeled Mobile Robot with Unknown Wheel Slips,

Model Uncertainties, and Unknown Bounded External Disturbances, Acta Polytechnica Hungarica,

2018, 15(2), 103-123.

6. Kiem Nguyentien, Linh Le, Tuan Do, Tinh Nguyen, Minhtuan Pham, Robust control for a wheeled

mobile robot to track a predefined trajectory in the presence of unknown wheel slips, Vietnam Journal

of Mechanics, Vietnam Academy of Science and Technology, 2018, 40(2), 141 –154.

7. Nguyen Tinh, Thuong Hoang, Minhtuan Pham & Namphuong Dao, A Gaussian wavelet network-based

robust adaptive tracking controller for a wheeled mobile robot with unknown wheel slips, International

Journal of Control, 2018, DOI: 10.1080/00207179.2018.1458156.

TÀI LIỆU THAM KHẢO

1. L. Xin, Q. Wang, J. She, Y. Li, Robust adaptive tracking control of wheeled mobile robot, Robotics and

Autonomous Systems, 2016, 78, 36-48.

2. Y. Li, Z. Wang, and L. Zhu, Adaptive Neural Network PID Sliding Mode Dynamic Control of

Nonholonomic Mobile Robot, Proceedings of the 2010 IEEE International Conference on Information and

Automation, Harbin, China, 2010, 753-757.

10. Z.-P Jiang, H. Nijmeijer, Tracking control of mobile robots: A case study in backstepping, Automatica,

1997, 33(7), 1393-1399.

11. D. Kim, J. Oh, Tracking control of a two-wheeled mobile robot using input–output linearization, Control

Engineering Practice, 1999, 7, 369–373.

12. H. Gao, X. Song, L. Ding, K. Xia, N. Li, Z. Deng, Adaptive motion control of wheeled mobile robot with

unknown slippage, International Journal of Control, 2014, 87, 1513–1522.

25

13. M. Seyr, S. Jakubek, Proprioceptive Navigation, Slip Estimation and Slip Control for Autonomous

Wheeled Mobile Robots, in: Proceedings of the IEEE Conference on Robotics, Automation and

Mechatronics, 2006, 1–6.

14. Lê Thị Thúy Nga, Lê Hùng Lân, Điều khiển robot bầy đàn tránh vật cản và tìm kiếm mục tiêu, Hội nghị

toàn quốc lần thứ 3 về Điều khiển và Tự động hóa VCCA, 2015, 87-93.

15. Lê Hùng Lân, Lê Thị Thúy Nga, Phân tích sự ổn định tụ bầy của robot bầy đàn sử dụng hàm hút/đẩy mờ,

Tạp chí Khoa học Giao thông Vận tải, 2013, 10, 88-93.

16. Nguyễn Văn Khanh, Trần Văn Hùng, Điều khiển thời gian thực robot hai bánh tự cân bằng sử dụng bộ

điều khiển PID mờ tự chỉnh, Hội nghị toàn quốc lần thứ 3 về Điều khiển và Tự động hóa VCCA, 2015,

70-77.

17. Nguyễn Hữu Công, Vũ Ngọc Kiên, Điều khiển cân bằng xe hai bánh tự cân bằng sử dụng thuật toán

giảm bậc mô hình, Hội nghị toàn quốc lần thứ 3 về Điều khiển và Tự động hóa VCCA, 2015, 61-69.

18. Nguyễn Dũng, Nguyễn Bảo Huy, Võ Duy Thành, Tạ Cao Minh, Mô hình hóa ô tô điện bằng phương

pháp EMR với mô hình mở rộng của tương tác bánh xe – mặt đường, Hội nghị toàn quốc lần thứ 3 về

Điều khiển và Tự động hóa VCCA, 2015, 117-122.

19. J.-C. Ryu, S.K. Agrawal, Differential flatness-based robust control of mobile robots in the presence of

slip, The International Journal of Robotics Research, 2011, 30(4), 463–475.

20. Y. Qiu, X. Liang, Z. Dai, Backstepping dynamic surface control for an anti-skid braking system, Control

Engineering Practice, 2015, 42, 140–152.

21. N. Sidek, N. Sarkar, Dynamic modeling and control of nonholonomic mobile robot with lateral slip.

Proceedings of 3rd International Conference on Systems, 2008, 35-40.

22. I. Motte, G.A. Campion, Slow manifold approach for the control of mobile robots not satisfying the

kinematic constraints, IEEE Transactions on Robotics and Automation, 2000, 16(6), 875-880.

23. A. Matveev, M. Hoy, J. Katupitiya, A. Savkin, Nonlinear sliding mode control of an unmanned

agricultural tractor in the presence of sliding and control saturation, Robotics and Autonomous Systems,

2013, 61, 973–987.

24. M. Corradini, G. Orlando, Experimental testing of a discrete time sliding mode controller for trajectory

tracking of a wheeled mobile robot in the presence of skidding effects, Journal of Robotic Systems, 2002,

19, 177–188.

25. H. Khan, J. Iqbal, K. Baizid, T. Zielinska, Longitudinal and lateral slip control of autonomous wheeled

mobile robot for trajectory tracking, Frontiers of Information and Technology & Electronic Engineering,

2015, 16(2), 166-172.

26. L. Chang Boon, W. Danwei, Integrated Estimation for Wheeled Mobile Robot posture, velocities, and

wheel skidding perturbations, in: Proceedings of the IEEE International Conference on Robotics and

Automation, 2007, 2355–2360.

27. C. C. Ward, K. Iagnemma, Model-Based Wheel Slip Detection for Outdoor Mobile Robots, IEEE

International Conference on Robotics and Automation, 2007, 2724 – 2729.

28. G. Baffet, A. Charara, J. Stephant, Sideslip angle, lateral force and road fricion estimation in simulations

and experiments, Proceedings of IEEE International Conference on Control Applications, 2006, 903-908.

29. L. Li, F.Y. Wang, Integrated Longitudinal and lateral tire/road friction modeling and monitoring for

vehicle motion control, IEEE Transaction on Intelligent Transportation Systems, 2006, 7(1), 1-19.

26

30. Y. Tian, N. Sarkar, Control of a mobile robot subject to wheel slip, Journal of Intelligent and Robotic

Systems, 2014, 74, 915–929.

31. H. Kang, Y. Kim, C. Hyun, M. Park, Generalized extended state observer approach to robust tracking

control for wheeled mobile robot with skidding and slipping, International Journal of Advanced Robotic

Systems 2013, 10, 1–10.

32. S. Yoo, Approximation-based adaptive control for a class of mobile robots with unknown skidding and

slipping, International Journal of Control, Automation and Systems, 2012, 10, 703–710.

33. N Hoang, H Kang, Neural network-based adaptive tracking control of mobile robots in the presence of

wheel slip and external disturbance force, Neurocomputing, 2016, 188, 12-22.

34. C. B. Low, D. Wang, GPS-based path following control for a car-like wheeled mobile robot with skidding

and slipping, IEEE Transactions on Control Systems Technology 2008, 16, 340–347.

35. C. B. Low, D. Wang, GPS-based tracking control for a car-like wheeled mobile robot with skidding and

slipping, IEEE/ASME Transactions on Mechatronics, 2008, 13, 480–484.

36. R. Lenain, B. Thuilot, C. Cariou, P. Martinet, Mixed kinematic and dynamic sideslip angle observer for

accurate control of fast off-road mobile robots, Journal of Field Robotics, 2010, 27(2), 181-196.

37. B. Chen, F. Hsieh. Sideslip angle estimation using extended Kalman filter, Vehicle System Dynamics,

2008, 46, 353-364.

38. G. Bayar, M. Bergerman, E. Konukseven, A. Koku, Improving the trajectory tracking performance of

autonomous orchard vehicles using wheel slip compensation, Biosystems Engineering, 2016, 146, 149-

164.

39. H. Grip, L. Imsland, T. Johansen, J. Kalkkuhl, A. Suissa, Vehicle sideslip estimation: design,

implementation and experimental validation, IEEE Control Systems Magazine, 2009, 29(5), 36-52.

40. J. Dakhlallah, S. Glaser, S. Mammar, Y. Sebsadji, Tire-Road Forces Estimation Using Extended Kalman

Filter and Sideslip Angle Evaluation, Proceedings of 2008 American Control Conference, Washington,

USA, June 11-13, 2008, 4597- 4602.

41. C. Lin, Adaptive tracking controller design for robotic systems using Gaussian wavelet networks. IEE

Proceedings - Control Theory and Applications, 2002, 149(4), 316–322.

42. J. Slotine, W. Li, Applied Nonlinear Control, Prentice- Hall, 1991, Englewood Cliffs, New Jersey, USA.

43. J. Huang, C. Wen, Wei Wang, Z. Jiang. Adaptive stabilization and tracking control of a nonholonomic

mobile robot with input saturation and disturbance. Systems & Control Letters, 2013, 62, 234–241.

44. N. Perez-Arancibia, T. Tsao, J. Gibson, Saturation-induced instability and its avoidance in adaptive

control of hard disk drives, IEEE Transactions Control System Technology, 2010, 18, 368–382.

45. F. Lewis, A. Yesildirek, A., K. Liu. Multilayer Neural-Net Robot Controller with Guaranteed Tracking

Performance, IEEE Transactions on Neural Networks, 1996, 7(2), 388-399.

46. L. Wang, T. Chai, L. Zhai, Neural network-based terminal sliding mode control of robotic manipulators

including actuator dynamics, IEEE Transaction on Industrial Electronics, 2009, 56(9), 3296-3304.

47. A. K. Pamosoaji, P. T. Cat, K. Hong, Sliding-mode and proportional-derivative-type motion control with

radial basis function neural network based estimators for wheeled vehicles, International Journal of

Systems Sciences, 2014, 45(12).