Upload
others
View
5
Download
0
Embed Size (px)
Citation preview
1
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-----------------------------
Nguyễn Văn Tính
NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ THUẬT TOÁN ĐIỀU
KHIỂN RÔ BỐT DI ĐỘNG CÓ TÍNH ĐẾN ẢNH HƯỞNG CỦA
TRƯỢT BÁNH XE
LUẬN ÁN KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA
Chuyên ngành: Kỹ thuật điều khiển và tự động hóa
Mã số: 9.52.02.16
TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT
Hà Nội – 2018
2
Công trình được hoàn thành tại: Học viện Khoa học và Công nghệ - Viện Hàn lâm
Khoa học và Công nghệ Việt Nam.
Người hướng dẫn khoa học: TS. Phạm Minh Tuấn
Phản biện 1:…………………………………………………………….…..
……………………………………………………………………………….
Phản biện 2:…………………………………………………………….…..
……………………………………………………………………………….
Phản biện 3:…………………………………………………………….…..
……………………………………………………………………………….
Luận án sẽ được bảo vệ trước Hội đồng chấm luận án cấp nhà nước họp tại:
…………………………………………………………….……….………………………
……………………………………………………………………………………………..
Vào hồi giờ ngày tháng năm
Có thể tìm hiểu luận án tại thư viện: …………………………………….….
3
MỞ ĐẦU
Tính cấp thiết của đề tài
Có một sự thật không thể phủ nhận rằng các rô bốt di động có khả năng làm việc trong một phạm vi
rộng và có thể thao tác tự động một cách thông minh mà không cần bất cứ sự tác động nào từ con người. Do
vậy, đề tài này tập trung nghiên cứu các bài toán thiết kế các luật điều khiển cho rô bốt di động kiểu bánh xe.
Các vấn đề nghiên cứu của luận án
Tác giả tập trung nghiên cứu các phương pháp điều khiển mới để bù trượt cho rô bốt di động khi tồn
tại trượt bánh xe, bất định mô hình, và nhiễu ngoài.
Đối tượng nghiên cứu
Để dễ dàng kiểm chứng tính đúng đắn và hiệu năng của các luật điều khiển được đề xuất, rô bốt di
động 03 bánh xe được lựa chọn làm đối tượng nghiên cứu. Cụ thể, rô bốt di động kiểu 03 bánh xe này bao gồm
02 bánh chủ động điều khiển vi phân, 01 bánh thụ động được dùng để làm điểm tựa tạo thế cân bằng trọng lực.
Mục đích nghiên cứu
Đề xuất một số phương pháp điều khiển mới để bù ảnh hưởng tiêu cực của bất định mô hình, nhiễu
ngoài, và trượt bánh xe.
Phương pháp nghiên cứu
Phương pháp nghiên cứu được thể hiện qua trình tự công việc như sau:
Phân tích và xây dựng mô hình động học và động lực học của rô bốt di động khi tồn tại các bất
định mô hình, nhiễu ngoài, và trượt bánh xe.
Nghiên cứu, phân tích các phương pháp điều khiển tiên tiến trong và ngoài nước cho rô bốt di
động trong sự hiện diện của bất định mô hình, nhiễu ngoài, và trượt bánh xe. Sau đó, đề xuất
các phương pháp điều khiển mới.
Chứng minh tính đúng đắn và hiệu quả của các phương pháp điều khiển mới bằng tiêu chuẩn
ổn định Lyapunov và bổ đề Barbalat.
Tiến hành kiểm chứng các phương pháp điều khiển nói trên băng công cụ Matlab/Simulink.
Ý nghĩa khoa học và thực tiễn của đề tài
Ý nghĩa khoa học: Xây dựng các phương pháp điều khiển mới cho rô bốt di động để bù ảnh hưởng
tiêu cực của bất định mô hình, nhiễu ngoài, và trượt bánh xe.
Ý nghĩa thực tiễn: Các phương pháp điều khiển được đề xuất trong luận án này có thể được triển khai
ứng dụng cho các rô bốt di động trong nhà kho với mặt sàn trơn hoặc có thể được triển khai ứng dụng cho các
xe tự hành trong các nông trường với nền đất ẩm ướt dễ trơn trượt.
Bố cục của luận án
Chương 1: Trình bày tổng quan các nghiên cứu trong và ngoài nước trong những năm gần đây, và sau
đó trình bầy mô hình động học và động lực học của rô bốt di động trong điều kiện tồn tại bất định mô hình,
nhiễu ngoài, và trượt bánh xe.
Chương 2: Thiết kế luật điều khiển bám thích nghi dựa trên một mạng nơ ron ba lớp.
Chương 3: Thiết kế luật điều khiển backstepping bền vững thích nghi dựa trên mạng sóng Gaussian.
Chương 4: Thiết kế luật điều khiển backstepping hội tụ hữu hạn ở cấp động lực học.
4
CHƯƠNG 1. TỔNG QUAN VÀ MÔ HÌNH TOÁN HỌC
1.1. Đặt vấn đề
Bài toán điều khiển chuyển động cực kỳ quan trọng trong lĩnh vực rô bốt di động, bởi vì hiệu năng của
các luật điều khiển ảnh hưởng trực tiếp đến hiệu quả của các ứng dụng rô bốt di động trong sản xuất và đời
sống. Do vậy, bài toán này được lựa chọn làm mục tiêu nghiên cứu của luận án này.
Trong những thập kỷ gần đây, bài toán điều khiển chuyển động cho rô bốt di động kiểu bánh xe đã
thu hút sự chú ý của các nhà khoa học trên khắp thế giới. Hiển nhiên, rô bốt di động là một trong số các hệ
thống chịu ràng buộc nonholonomic [1]. Hơn nữa, nó lại là một hệ thống phi tuyến nhiều vào- nhiều ra [2].
Nhờ có sự tiến bộ của lý thuyết cũng như kỹ thuật điều khiển, đã có rất nhiều phương pháp điều khiển khác
nhau được áp dụng để thiết kế các luật điều khiển cho rô bốt di động như: điều khiển trượt [3, 4], điều khiển
bền vững [5], … Các luật điều khiển này đã được thiết kế với giả thiết “bánh xe chỉ lăn mà không trượt”.
Tuy nhiên, trong thực tiễn ứng dụng, điều kiện các bánh xe chỉ lăn mà không trượt lại có thể thường
xuyên bị vi phạm. Tức là đã xảy ra hiện tượng trượt bánh xe [12-13].
Trượt bánh xe là một trong số các nhân tố chính gây ra sự giảm sút hiệu năng điều khiển nghiêm trọng.
Do vậy, trong các tình huống như vậy, nếu muốn cải thiện hiệu năng điều khiển, thì cần phải thiết kế một bộ
điều khiển có khả năng bù trượt bánh xe.
1.2. Tình hình nghiên cứu trong nước
Ở Việt Nam, đến nay, đã có rất nhiều nghiên cứu về xe tự hành như nhóm tác giả ở Đại học Giao
Thông Vận Tải nghiên cứu về rô bốt di động di chuyển kiểu bầy đàn [14-15]. Một nhóm nghiên cứu ở Đại học
Bách Khoa Hà Nội đã nghiên cứu về xây dựng mô hình cho một ô tô điện 04 bánh khi có tính đến tương tác
bánh xe - mặt đường [18]. Tuy nhiên, chưa có nhiều kết quả nghiên cứu về điều khiển bù trượt bánh xe cho rô
bốt di động được công bố.
1.3. Tình hình nghiên cứu ngoài nước
Trên thế giới, đã có rất nhiều báo cáo nghiên cứu về điều khiển bù trượt bánh xe cho rô bốt di động.
Bởi vì trượt bánh xe có thể làm hệ thống mất ổn định hoặc giảm hiệu năng điều khiển nghiêm trọng nên nó
phải được ngăn chặn. Thông thường, để điều khiển bù trượt bánh xe, các thông tin đo lực ma sát và tốc độ
trượt phải luôn được cập nhật theo thời gian thực và chính xác. Cụ thể, trong [12] các tác giả đã bù trượt bánh
xe bằng cách bù tỷ số trượt bánh xe. Các gia tốc kế đã được sử dụng trong [13, 19] để bù trượt bánh xe trong
thời gian thực. Nghiên cứu trong [20] đã phát triển một bộ điều khiển bền vững xử lý cả tốc độ trượt lẫn gia
tốc trượt bằng cách sử dụng hệ tọa độ của độ phẳng vi phân.
1.4. Mô hình động học
Xét một rô bốt di động kiểu bánh xe chịu ràng buộc nonholonomic như Hình 1.3. Cụ thể, G(xG, yG) là
vị trí của tâm khối của phần cứng rô bốt di động. M(xM, yM) là trung điểm của đoạn trục thẳng nối hai bánh xe.
F1, F2 là các ma sát dọc giữa bánh phải và bánh trái với mặt sàn. F3 là tổng lực ma sát tác động theo hướng
ngang ở hai điểm tiếp xúc của hai bánh xe với mặt sàn.
Khi không tồn tại trượt bánh xe, vận tốc tịnh tiến và vận tốc góc lần lượt được tính như sau [21]:
R L
R L
2
2
r
r
b
(1.1)
5
trong đó R L, lần lượt là tọa độ góc của bánh phải và bánh trái.
Bởi vậy, động học của rô bốt di động này được biểu diễn như sau [4]:
M
M
cos
sin
x
y
(1.2)
Ràng buộc nonholonomic của rô bốt di động đảm bảo hai yếu tố như sau:
Hướng của chuyển động tịnh tiến luôn vuông góc với trục nối hai bánh xe chủ động.
Cả chuyển động tịnh tiến lẫn chuyển động quay đều hoàn toàn phụ thuộc vào chuyển động lăn
của hai bánh xe chủ động.
Cụ thể, ràng buộc này có thể được biểu diễn toán học như sau [32]
R M M0 cos sinr x y b (1.3)
L M M0 cos sinr x y b (1.4)
M M0 sin cosx y (1.5)
Mặt khác, khi tồn tại trượt bánh xe, vận tốc tịnh tiến theo hướng dọc được tính như sau:
R L
2
(1.6)
trong đó R L, lần lượt là các tọa độ trượt dọc của bánh phải và bánh trái. Tiếp theo, vận tốc góc thực của nó
được tính như sau:
R L
2b
(1.7)
Ta định nghĩa là tọa độ của trượt ngang dọc theo trục bánh xe (xem Hình 1.1). Mô hình động học
của rô bốt di động trong tình huống này là [30]:
M
M
cos sin
sin cos
x
y
(1.8)
Vì hiện tượng trượt, các ràng buộc nonholonomic bị biến dạng như sau [32]:
R R M Mcos sinr x y b (1.9)
L L M Mcos sinr x y b (1.10)
M Msin cosx y (1.11)
1.5. Mô hình động lực học
Mô hình động lực học của rô bốt di động chịu ảnh hưởng của trượt bánh xe, bất định mô hình, và
nhiễu ngoài được biểu diễn bởi
d Mv Bv Bv Qγ C G τ τ (1.23)
Đặc điểm 1: Ma trận M có tính khả nghịch và xác định dương và thỏa mãn bất phương trình sau: 2 2T
1 2M M x x Mx x
với M1 và M2 lần lượt là giá trị chặn trên và chặn dưới của ma trận M và thỏa mãn 2 1M M 0 .
Đặc điểm 2: Ma trận 2 M B v là một ma trận có tính đối xứng lệch, tức là
T 2 0 x M B v x với 2 1 x R .
6
Hình 1.3. Một rô bốt di động và hiện tượng trượt bánh xe.
1.6. Kết luận chương 1
Đã có rất nhiều nhà khoa học trên khắp thế giới đã dành thời gian nghiên cứu và giải quyết vấn đề này.
Tuy nhiên, phần lớn các nghiên cứu được thực hiện dưới giả thiết rằng góc trượt [36-39] và hệ số ma sát giữa
bánh xe và mặt đường [29] luôn được đo chính xác trong thời gian thực. Hiển nhiên, các đại lượng gồm gia
tốc tịnh tiến, gia tốc góc, vận tốc tịnh tiến, vận tốc góc đều có thể được đo trực tiếp một cách dễ dàng qua
các cảm biến rẻ tiền, nhưng góc trượt và hệ số ma sát lại rất khó để đo [40].
Các phương pháp điều khiển được đề xuất trong luận án sẽ hướng tới không sử dụng các cảm biến
đo góc trượt và hệ số ma sát. Thay vào đó, ảnh hưởng tiêu cực từ trượt bánh xe lên hiệu năng điều khiển bám
sẽ được bù một cách gián tiếp trong các bộ điều khiển.
Ở chương này, mô hình động học và động lực học của rô bốt 3 bánh xe chịu tác động nhiễu ngoài,
trượt bánh xe đã được xây dựng thành công. Các mô hình này sẽ được sử dụng để thiết kế các luật điều khiển
bù trượt bánh xe, bất định mô hình, và nhiễu ngoài ở các chương sau.
Nội dung của Chương này được trích dẫn từ tài liệu công bố số 3.
CHƯƠNG 2. THIẾT KẾ LUẬT ĐIỀU KHIỂN BÁM THÍCH NGHI DỰA TRÊN MẠNG NƠ RON
BA LỚP
2.1. Đặt vấn đề
Vì lý do luật điều khiển trong [33] được thiết kế trong hệ tọa độ toàn cục OXY nên nó yêu cầu phải
đo các vận tốc trong hệ toàn cục này. Nhiệm vụ đo vận tốc này đã được giải quyết bằng bộ quan sát supper-
twisting. Kết quả ước lượng từ bộ quan sát này có thể chứa sai lệch tích lũy trong quá trình vận hành rô bốt.
Nên khả năng triển khai ứng dụng của phương pháp điều khiển trong [33] vẫn bị hạn chế.
Để tránh nhược điểm này, bộ điều khiển mới được đề xuất ở đây được thiết kế trong hệ tọa độ thân rô
bốt MXY. Khi đó, các biến vận tốc của rô bốt có thể được đo trực tiếp thông qua các cảm biến rẻ tiền nhưng
có độ tin cậy cao. Bên cạnh đó, các vận tốc và gia tốc của trượt bánh xe đều không cần phải đo. Thay vào đó,
các ảnh hưởng tiêu cực của chúng sẽ được bù bằng một luật điều khiển có sử dụng mạng nơ ron ba lớp.
F2
F1
F3
Bánh trái
Bánh phải
Bánh thụ
động
a
2b
F4
L
R
Trục bánh
xe
G
M
Phần cứng
θ
7
2.2. Cấu trúc mạng nơ ron ba lớp
Hiển nhiên rằng các mạng nơ ron nhân tạo có khả năng xấp xỉ các hàm phi tuyến đủ trơn với một độ
chính xác tùy ý [8]. Trong tiểu mục này, một mạng nơ ron nhân tạo 3 lớp được giới thiệu khái quát. Như được
minh họa trong Hình 4.1, đầu ra của của mạng nơ ron này được tính như sau 3
T
1 2, , ,..., Ny y y y W V
T T W σ V x trong đó 1
T
1 21, , ,..., Nx x x x là véc tơ đầu vào, ijw W và ijv V lần lượt là các ma
trận trọng số mạng nơ ron kết nối từ lớp đầu vào tới lớp ẩn và từ lớp ẩn tới lớp đầu ra (xem Hình 4.1).
Xét một hàm liên tục 31 NN: f x R R . Tồn tại các ma trận trọng số lý tưởng, *W và V , sao cho
T T* f x W σ V x ε (2.3)
trong đó ε là véc tơ của các sai lệch xấp xỉ tối ưu.
Giả sử 2.1: ε là bị chặn [8]. Cụ thể, bε với b là một hằng số dương hữu hạn nào đó.
Coi T Tˆ ˆ ˆ ˆ, , f x W V W σ V x là một ước lượng của f(x). Trong đó W và V lần lượt là các ma trận
ước lượng của *W và V ; chúng đều được cập nhật online bởi các thuật toán điều chỉnh trọng số online.
Để thuận tiện, ta ký hiệu T*σ σ V x và Tˆˆ ˆσ σ V x . Véc tơ sai số xấp xỉ hàm được tính như sau:
T T T T*
ˆ ˆ ˆ ˆ ˆ, , f f x f x W V W σ V x ε W σ V x (2.4)
2.3. Phát biểu bài toán
Gọi D(xD, yD) là mục tiêu đang di chuyển theo một quỹ đạo mong muốn với một vận tốc tịnh tiến được
định nghĩa trước (xem Hình 2.2). Không mất tính tổng quát, phương trình chuyển động của D được mô tả như
sau:
D 0
D 0
. cos( . )
. sin( . )
D
D
x T t R t x
y T t R t y
(2.5)
trong đó , TD, R, , x0, y0 là các hằng số biểu diễn tham số của phương trình chuyển động của mục tiêu.
Chú ý 2.1: trong Hình 2.2, ta ký hiệu (xP, yP) là vị trí của điểm P, (xP, yP, ) là một véc tơ mô tả cả vị
trí và hướng thực của rô bốt di động. Sự hiện diện của trượt bánh xe (cả trượt dọc và trượt ngang) khiến cho
bài toán điều khiển rô bốt di động sao cho cả vị trí và hướng thực (xP, yP, ) bám theo vị trí và hướng mong
muốn (xPd, yPd, d) không thể được giải quyết với một hiệu năng có thể chấp nhận được [32]. Nhưng, nếu ta
điều khiển rô bốt sao cho vị trí thực (xP, yP) bám theo mục tiêu D(xD, yD) thì bài toán điều khiển hoàn toàn có
thể được giải quyết mặc dù tồn tại cả trượt dọc và trượt ngang [32].
2.4. Mô tả véc tơ FTE (sai lệch bám được lọc – filtered tracking errors)
Một véc tơ của các biến đầu ra được mô tả trong hệ tọa độ M-XY như sau:
1 D M
2 D M
cos sin
sin cos
x x
y y
ζ (2.6)
Đạo hàm bậc nhất của (2.6) được tính như sau:
D
D
cos sin
sin cos
x
y
ζ hv χ (2.7)
8
Hình 2.2. Tọa độ của mục tiêu trong hệ tọa độ gắn thân rô bốt M-XY.
trong đó R
L
v , 2 2
1 1
1 11 1
2 2
2 2
r r
b b
r r
b b
h , 2
1
22
R LR L
b
χ .
Đạo hàm bậc hai của (2.6) được biểu diễn như sau:
1 2 ζ hv Ψ Ψ (2.8)
trong đó D D D D1
D D D D
cos sin sin cos
sin cos cos sin
x y x y
x y x y
Ψ hv , D D2
D D
sin cos
cos sin
x y
x y
Ψ .
Chú ý 2.2: Nếu 1 0 , thì h là một ma trận khả nghịch.
Gọi dζ là véc tơ mong muốn của ζ . Dựa vào yêu cầu bài toán điều khiển bám nói trên và Hình 2.2, hoàn toàn
có thể tính được T
d 0Cζ .
Một véc tơ sai lệch bám vị trí được định nghĩa như sau:
T
1 2 de e e = ζ - ζ (2.9)
Một véc tơ FTE (filtered tracking errors) được định nghĩa như sau:
φ = e+Λe (2.10)
trong đó Λ là một ma trận đường chéo, hằng, xác định dương, và có thể được lựa chọn tùy ý.
2.5. Cấu trúc bộ điều khiển
2Ψ trong (3.3) phụ thuộc trực tiếp vào vận tốc và gia tốc trượt bánh xe, nên nó là bất định. Vì thế, một
biến phụ được đề xuất như sau:
1d 1
κ = h ζ Λe Ψ (2.14)
Mặt khác, ta có thể viết lại (1.23) như sau:
1
2
xD
yD
Trục OY
C
xM
D (mục tiêu)
P
M
Trục OX
yM
xP O
Trục
MY
Trục
MX
yP
9
d Mv τ Bv d τ (2.15)
trong đó d Qγ C G Bv .
Tiếp theo, ta có thể chọn một luật điều khiển bằng phương pháp tính mô men như sau:
1 ˆˆ ˆ ˆ, ,
τ Mh Kφ f x W V (2.19)
trong đó K là một ma trận 22 hằng, đường chéo, và xác định dương và được lựa chọn tùy ý. ˆ ˆ ˆ, ,f x W V là
đầu ra của mạng nơ ron để xấp xỉ f x như được mô tả trong (2.4).
Trong Chương này, luật cập nhật trọng số mạng nơ ron được đề xuất như sau:
T T T1
ˆ ˆ ˆˆ W H σφ σV xφ φ W (2.24)
T T2
ˆ ˆ ˆ V H xφ W σ φ V (2.25)
trong đó 1H là một ma trận hằng 2 3N 1 N , xác định dương, 2H là một ma trận hằng 1 21N N , xác
định dương, là một hằng số dương. Tất cả 1H , 2H , và đều có thể được lựa chọn tùy ý.
Hình 2.1. Cấu trúc của mạng nơ ron 3 lớp.
Hình 2.2. Sơ đồ khối của toàn bộ hệ thống điều khiển vòng kín.
2.6. Phân tích tính ổn định
Định lý 2.1: Đối với một rô bốt di động chịu ảnh hưởng của trượt bánh xe như được minh họa bởi mô
hình động học (1.8) và mô hình động lực học (1.23), nếu luật điều khiển được mô tả bởi Hình 2.2 với tín hiệu
đầu vào điều khiển được lựa chọn bởi (2.19) và các luật cập nhật trọng số mạng nơ ron được lựa chọn bởi
(2.24) và (2.25), thì theo tiêu chuẩn Lyapunov và đinh lý LaSalle mở rộng [8], tín ổn định của toàn bộ hệ thống
điều khiển vòng kín được đảm bảo để đạt được một hiệu năng bám mong muốn mà ở đó véc tơ sai lệch bám vị
∑
∑
Lớp đầu vào Lớp ẩn Lớp đầu ra
x1
x2
y1
y2
1
yN3 wN2N3
v1
v2
vN2
w1
w2
wN3
xN1
v11
Bộ điều
khiển
WMR
chịu
trượt
bánh xe
Mục tiêu
(xD, yD)
e
+
- Phương
trình (2.6)
Mạng nơ
ron ba lớp
v Phương
trình (2.14)
10
trí lọc φ sẽ hội tụ về một lân cận nhỏ tùy ý của không trong khi tất cả các tín hiệu trong hệ thống điều khiển
đều bị chặn kiểu UUB.
2.7. Kết quả mô phỏng
Để minh họa tính đúng đắn của luật điều khiển trong chương này, các mô phỏng máy tính bằng phần
mềm Matlab/Simulink đã được thực hiện. Rô bốt di động được mô tả bởi các tham số trong Bảng 3.1. Hơn
nữa, vì mục đích so sánh, phương pháp trong Chương 3 cũng được mô phỏng trong cùng một điều kiện, cụ thể
là tồn tại các bất định mô hình và nhiễu ngoài (tức d τ 0 ; M 0 ), hơn nữa các tốc độ trượt bánh xe không
được đo.
Không mất tính tổng quát, giả sử rằng T
d 3 sin 0,5 2,5 cos 0,4t t τ và ˆ 0,7M M , và vận
tốc trượt bánh xe TT
2sin 1,5cos0,5 0,5R L t t (m/s) đối với t > 0 (s). Ở thời điểm ban đầu,
vị trí và hướng được giả lập trong hệ O-XY là M 0x (m), M 0y (m), và / 6 (rad).
Đối với mạng nơ ron, để đơn giản trong xây dựng mô hình mạng nơ ron mà không giảm đi ý nghĩa
xấp xỉ hàm phi tuyến bất định, lớp ẩn được lựa chọn có 10 nơ ron, bởi vậy các ma trận hệ số được lựa chọn
như sau 1 11 210
H diag , 2 5 10
8
H diag và 0,5 . Dưới đây là 2 ví dụ mô phỏng đã được thực hiện
bằng công cụ Matlab/Simulink.
Hình 2.4. Đồ thị của các tốc độ trượt theo thời gian.
Bảng 2.1. Các tham số của rô bốt di động [21].
Tên biến Ý nghĩa Giá trị
r Bán kính bánh xe 0,065 (m)
b Một nửa trục nối hai bánh xe chủ động 0,375 (m)
IG Hệ số mô men quán tính của phần cứng rô bốt di động quanh trục thẳng
đứng đi qua G. 15,625 (kg.m2)
IW Mô men quán tính của bánh xe xung quanh trục bánh xe 0,0025 (kg.m2)
ID Mô men quán tính của mỗi bánh xe quanh trục thẳng đứng đi qua tâm
bánh xe 0,005 (kg.m2)
mG Khối lượng phần cứng 30 kg
mW Khối lượng mỗi bánh xe 1 kg
C Khoảng cách giữa M và P 0,5 m
a Khoảng cách giữa M và G 0,3 m
11
Các giá trị ban đầu của các ma trận trọng số nơ ron được khởi tạo là các số ngẫu nhiên trong khoảng
(0; 1) như sau 0 11 2ˆ 0;1rand
W và 0 5 10
ˆ 0;1rand
V .
Dưới đây là một ví dụ mô phỏng đã được thực hiện bằng công cụ Matlab/Simulink.
Ví dụ 2.1: Mục tiêu D di chuyển theo một đường tròn với phương trình chuyển động được mô tả như sau:
2 3cos(0,2 )
0,5 3sin(0,2 )
D
D
x t
y t
(2.36)
Các kết quả mô phỏng cho Ví dụ này được minh họa trong các Hình 2.5, 2.6, 2.7 và 2.8. Trong Hình
2.5, chúng ta có thể dễ dàng thấy rằng phương pháp được đề xuất trong Chương 2 này tỏ ra hiệu quả hơn
phương pháp điều khiển của Hoang Ngoc Bach trong [33] trong việc bám quỹ đạo khi tồn tại trượt bánh xe và
bất định mô hình.
Hình 2.5. So sánh hiệu năng bám giữa hai phương pháp trong Ví dụ 4.1.
Hình 2.6. So sánh các sai lệch bám vị trí trong Ví dụ 4.1.
Để tiện việc so sánh, sai lệch bám vị trí trong [33] được quy đổi từ hệ tọa độ toàn cục OXY sang hệ
tọa độ gắn liền thân rô bốt MXY. Hình 2.6 đã thể hiện phép so sánh sai lệch vị trí của hai phương pháp này
trong hệ tọa độ MXY. Cụ thể, trong trạng thái xác lập, mặc dù sai bám 1e của hai phương pháp là tương đương
12
nhau với giá trị độ lớn khoảng 0,005 (m), nhưng sai lệch bám vị trí 2e trong phương pháp mới này nhỏ hơn
so với phương pháp của Hoang và cộng sự [33] với giá lớn nhất lần lượt là: 0,01 và 0,04 (m).
Hình 2.7 minh họa kết quả so sánh mô men điều khiển giữa hai phương pháp. Về cơ bản, trong giai
đoạn quá độ, hai phương pháp này đòi hỏi mô men điều khiển tương đồng nhau. Trong giai đoạn xác lập,
phương pháp trong [33] đòi hỏi biên độ mô men điều khiển lớn hơn so với phương pháp được đề xuất. Tức là,
phương pháp điều khiển mới này sẽ tiết kiệm năng lượng hơn so với phương pháp [33].
Cần chú ý rằng các sai số bám vị trí đã hội tụ về lân cận không, bởi vậy ζ hội tụ về lân cận dζ . Hệ
quả, 1 hội tụ về lân cận C. Do đó, theo Chú ý 2.2, ma trận h luôn khả nghịch.
Hình 2.7. Các mô men quay trong Ví dụ 4.1 giữa hai phương pháp điều khiển.
2.8. Kết luận Chương 2
Tóm tại, trong chương này, một bộ điều khiển bám thích nghi được đề xuất dựa trên một mạng nơ ron
3 lớp với một luật cập nhật trong số mạng nơ ron online. Nhờ bộ điều khiển được đề xuất này, rô bốt di động
đã bám theo một quỹ đạo mong muốn với một hiệu năng bám tốt trong sự hiện diện của bất định mô hình,
nhiễu ngoài, và trượt bánh xe. Sai lệch bám vị trí đã hội tụ về lân cận không và được điều chỉnh nhỏ tùy ý. Các
kết quả mô phỏng đã thể hiện ưu điểm vượt trội so với phương pháp trong [33]. Cụ thể, phương pháp điều
khiển mới này vừa bám quỹ đạo chính xác hơn lại vừa tiết kiệm năng lượng hơn so với phương pháp trong
[33].
CHƯƠNG 3. THIẾT KẾ LUẬT ĐIỀU KHIỂN BACKSTEPPING DỰA TRÊN MẠNG SÓNG
GAUSSIAN
3.1. Đặt vấn đề
Mặc dù phương pháp điều khiển ở Chương 2 đã tỏ ra hiệu quả khi bù bất định mô hình và nhiễu ngoài,
nhưng độ chính xác điều khiển (véc tơ sai lệch bám vị trí e) chưa thực sự cao so với kỳ vọng của các nhiệm vụ
yêu cầu khắt khe về độ chính xác. Lý do có thể là:
trong phương pháp điều khiển đó, đã không có sự phân chia nhiệm vụ một cách rõ ràng. Cụ
thể, ở đâu (thành phần điều khiển nào) là để xử lý (bù) ảnh hưởng tiêu cực của trượt bánh xe?
Và ở đâu (thành phần điều khiển nào) là để xử lý (bù) bất định mô hình và nhiễu ngoài ở cấp
độ động lực học.
13
Hoặc trong hệ thống điều khiển đó, không có thành phần điều khiển bền vững, nên tiêu chuẩn
ổn định chỉ là UUB. Cụ thể, các sai lệch điều khiển chỉ được đảm bảo sẽ hội tụ về một miền
kín lân cận không, chứ không phải hội tụ về không.
Do vậy, ở Chương 3 này, một phương pháp điều khiển bám bền vững thích nghi dựa trên kỹ thuật
backstepping [8] (tạo tác động ngược từ động học vào động lực học) cho rô bốt di động để bù trượt bánh xe,
bất định mô hình, và nhiễu ngoài. Sơ đồ khối của hệ thống điều khiển vòng kín được mô tả như Hình 3.1.
Cụ thể, hệ thống này gồm 2 vòng điều khiển kín. Vòng ngoài chứa bộ điều khiển động học. Trong bộ
điều khiển động học này, thành phần bền vững động học được sử dụng để bù ảnh hưởng tiêu cực của trượt
bánh xe. Vòng kín phía trong chứa bộ điều khiển động lực học. Đầu ra của bộ điều khiển động học cũng chính
là đầu vào của vòng điều khiển động lực học phía trong. Ở đây, mạng sóng Gausian (Gaussian wavelet network
– GWN) được sử dụng để xấp xỉ các hàm động lực học phi tuyến không được xác định trước do không biết
trước mô hình động lực học của rô bốt di động. Thành phần bền vững động lực học được sử dụng để bù ảnh
hưởng tiêu cực của bất định mô hình, nhiễu ngoài, và sai số xấp xỉ hàm không thể tránh khỏi do số lượng hữu
hạn các hàm sóng cơ sở trong lớp ẩn của GWN.
3.2. Mô tả cấu trúc của mạng sóng Gaussian
Cấu trúc của mạng sóng Gaussian được mô tả trong Hình 3.2. Nếu mạng này chứa p hàm sóng cơ sở
thì đầu ra của nó được tính như sau:
p
k j j
j
f wx x với j = 1,…, p (3.1)
trong đó T
1,..., nx xx là véc tơ đầu vào; jw biểu thị một trọng số.
j x biểu thị một hàm sóng đa chiều và được tạo thành bởi tích của các hàm sóng đơn chiều [40] như sau:
1 2 ...j j j j nx x x x (3.2)
trong đó 221
exp2
j i i i ij i ijx x x c
với 221i i ij i ijx x c .
ij và ijc lần lượt là hệ số giãn nở và tịnh tiến.
Nhờ vào khả năng xấp xỉ mạnh mẽ của mạng GWN [40], nếu như đã cho trước một hàm trơn bất kỳ
f x thì sẽ tồn tại một ma trận trọng số tối ưu W , các véc tơ tối ưu ξ và c sao cho
T* * *, , f x W ψ x ξ c ε (3.5)
trong đó ε mô tả một véc tơ của các sai lệch xấp xỉ tối ưu.
3.3. Thiết kế luật điều khiển động học
Chương này cũng sẽ giải quyết bài toán điều khiển như được phát biểu trong mục 2.3.
Giả sử 3.3: Các tọa độ Dx , Dy cùng với các đạo hàm bậc 1 và 2 của chúng đều bị chặn.
Giả sử 3.4: Tất cả các tốc độ trượt bánh xe đều bị chặn. Bởi vậy, tồn tại một hằng số dương biết trước
sao cho χ .
Bởi vì vận tốc của các tọa độ trượt bánh xe không được đo nên χ trong (2.7) là bất định. Ví thế, luật
điều khiển động học trong phương pháp điều khiển này được đề xuất như sau
14
D1I d
D0
cos sin
sin cos
t
c
xd
y
v h Λe Λ e ζ r (3.9)
trong đó cv là véc tơ mong muốn của véc tơ các vận tốc góc bánh xe v ; r là thành phần bền vững động học
được đề xuất như sau để bù ảnh hưởng tiêu cực của trượt bánh xe.
e
re
(3.10)
trong đó là hệ số của thành phần bền vững động học và được như trong Giả sử 3.4.
3.4. Thiết kế luật điều khiển động lực học
Ta đề xuất một đầu vào điều khiển như sau.
ˆˆ ˆ ˆˆ, , , τ Ks f x W ξ c d (3.14)
trong đó K là một ma trân đường chéo xác định dương và có thể được lựa chọn tùy ý.
Hình 3.1. Sơ đồ khối của phương pháp điều khiển trong chương 3.
Hình 3.2. Cấu trúc của mạng sóng Gaussian – GWN.
Phương
trình (3.2)
Rô
bôt di
dộng
Bộ điều
khiển động
lực học
Bộ điều khiển động
học
Mạng sóng
Gaussian
Bền vững động lực
học
Bền vững
động học
+
- - +
Ph
ép T
ịnh tiến
x1
xn
Hệ số dãn
nở
Hệ số dãn
nở
15
ˆˆ ˆ ˆ, , ,f x W ξ c là đầu ra của GWN như được mô tả trong (3.6) và được sử dụng để xấp xỉ f x ; d minh họa
thành phần bền vững động lực học được sử dụng để khử tổng bất định do sai số xấp xỉ của GWN, bất định mô
hình động lực học, và nhiễu ngoài không được xác định, vân vân.
Thành phần bền vững động lực học d trong (5.14) được đề xuất như sau:
ˆ s
ds
(3.25)
trong đó là hằng số dương và được lựa chọn sao cho thỏa mãn Giả sử 3.5 như sau.
3.5. Phân tích tính ổn định
Định lý 3.1. Xét rô bốt di động trong sự hiện diện của trượt bánh xe, bất định mô hình, và nhiễu ngoài
với mô hình động học (1.8) và mô hình động lực học (1.23), các Giả sử 3.1 -3.5 đúng. Nếu luật điều khiển
được đề xuất như Hình 3.1 với luật điều khiển động học (3.9), luật điều khiển động lực học (3.14), và các luật
cập nhật trọng số cho GWN như (3.28), (3.29), và (3.30), thì các véc tơ sai lệch điều khiển bám, e và s , sẽ
hội tụ tiệm cận về 0 khi t , và hơn nữa tất cả các tín hiệu trong hệ thống điều khiển vòng kín được đảm
bảo bị chặn với 0t .
Chú ý 3.1. Để khử hiện tượng chattering trong cv (ở cấp độ động học), ta thay thế (3.10) bởi luật bền
vững mới sau:
e
er
e
e
e
(3.42)
trong đó là một hằng số thực dương rất nhỏ và có thể được lựa chọn tùy ý.
Chú ý 3.2. Tương tự, với mục đích khử hiện tượng chattering của vòng động lực học, (3.25) được thay
bằng phương trình sau.
ˆ
s
sd
s
s
s
(3.49)
trong đó là một hằng số dương rất nhỏ có thể được lựa chọn tùy ý.
3.6. Kết quả mô phỏng
Trong phần này, một mô phỏng được thực hiện để kiểm chứng tính đúng đắn và hiệu năng của phương
pháp điều khiển được đề xuất trong Chương này. Cần nhấn mạnh rằng không có bất kỳ thông tin nào được
biết trước về mô hình động lực học của rô bốt di động.
Hơn nữa, trong mô phỏng này, một phép so sánh hiệu năng bám của phương pháp được đề xuất với
phương pháp điều khiển trong Chương 2 cũng được thực hiện để so sánh, phân tích ưu nhược điểm của hai
phương pháp điều khiển này với nhau.
Ví dụ 3.1: Mục tiêu D đã di chuyển trên quỹ đạo cong như sau.
D
D
2 3cos 0,2
0,5 3sin 0,2
x t
y t
(3.51)
Các kết quả mô phỏng của cả hai phương pháp được minh họa trong các Hình 3.3, 3.4, và 3.5.
nếu
nếu
nếu
nếu
16
Nếu chỉ xem Hình 3.3, ta có thể lầm tưởng rằng hiệu năng của hai phương pháp điều khiển này là
tương đương nhau. Nhưng khi xem Hình 3.4, ta dễ dàng thấy rằng các sai lệch bám vị trí e1,2 của Phương pháp
điều khiển được đề xuất mới ở đây nhỏ hơn rất nhiều so với các sai lệch bám vị trí e1,2 trong Chương 2. Cụ
thể, các giá trị lớn nhất của e1,2 của phương pháp mới trong giai đoạn xác lập lần lượt là 1.10-3 và 0,6.10-3(m).
Trong khi đó, đối với phương pháp trong Chương 2, các giá trị tương ứng lần lượt là: 1,5.10-2 và -1,2.10-2 (m).
Bởi vậy, khả năng xấp xỉ của GWN và khả năng bền vững của các thành phần điều khiển bền vững
đã tạo ưu điểm vượt trội cho phương pháp điều khiển mới này so với phương pháp trong Chương 2.
Hình 3.3. So sánh các quỹ đạo trong ví dụ 3.1.
Tuy nhiên, nhược điểm của phương pháp mới này là rằng: để có được hiệu năng bám tốt hơn Chương
2 như vậy, phương pháp mới được đề xuất trong Chương 3 này đã phải đòi hỏi mô men quay lớn ở các tín hiệu
đầu vào điều khiển. Kết quả từ Hình 3.5 đã thể hiện rất rõ ràng. Cụ thể, phương pháp mới này đòi hỏi các đầu
vào điều khiển lớn tại thời điểm ban đầu với các giá trị lần lượt là 100 (N.m) ở bánh phải và 80 (N.m) ở bánh
trái. Trong khi đó, với phương pháp ở Chương 2, tại thời điểm ban đầu, các mô men điều khiển lần lượt là 63
(N.m) ở bánh phải và 38 (N.m) ở bánh trái.
Cuối cùng nhưng không kém phần quan trọng, để đánh giá hiệu quả của các biện pháp khử chattering
trong các Chú ý 3.1 và 3.2, ta thực hiện lại mô phỏng Ví dụ 5.1 với các luật điều khiển động học (5.10) và
động lực học (3.25) sau đó so sánh với kết quả mô phỏng tương ứng các luật (3.42) trong Chú ý 3.1 và (3.49)
trong Chú ý 3.2. Kết quả từ Hình 3.6 cho thấy hiệu quả xử lý chattering được thể hiện rất rõ ràng ở cả hai bánh
xe. Khi chattering được xử lý phù hợp thì giá thành (chi phí năng lượng) vận hành hệ thống điều khiển vòng
kín này sẽ được giảm xuống, và đồng thời tuổi thọ của các phần tử chấp hành tại các bánh xe sẽ kéo dài hơn
rất nhiều.
Rất cần thiết để chú ý rằng trong các Hình 3.4, véc tơ các sai lệch bám vị trí, e trong (3.8), đã hội tụ
tiệm cận về không. Bởi vậy, 1 đã hội tụ tiệm cận về hằng số C. Tức là, ma trận h trong (2.7) luôn khả nghịch.
Do vậy, ta có thể kết luận rằng luật điều được đề xuất trong Định lý 3.1 là đúng.
17
a) b)
Hình 3.4. So sánh các sai lệch bám vị trí e1,2 trong Ví dụ 3.1 giữa hai phương pháp điều khiển.
a) So sánh e1 trong toàn bộ quá trình mô phỏng; b) so sánh e2 trong toàn bộ quá trình mô phỏng;
a) b)
Hình 3.5. So sánh mô men quay giữa hai phương pháp điều khiển.
a) Mô men quay ở bánh phải; b) Mô men quay ở bánh trái.
3.7. Kết luận chương 3
Trong chương này, một bộ điều khiển bám dựa trên kỹ thuật backstepping và mạng sóng Gaussian
GWN với các luật cập nhật tham số động đã được sử dụng để cho phép rô bốt di động bám theo một quỹ đạo
cho trước trong điều kiện tồn tại trượt bánh xe, bất định mô hình và nhiễu ngoài. Với phương pháp này, không
cần phải biết trước mô hình động lực học của rô bốt di động và cũng như không cần phải đào tạo tĩnh trước
các trọng số của GWN. Tính ổn định của toàn hệ thống điều khiển được đảm bảo bằng tiêu chuẩn Lyapunov.
Các kết quả mô phỏng đã kiểm chứng tính đúng đắn và hiệu quả của phương pháp điều khiển mới này.
Tuy nhiên, nhược điểm của phương pháp này là đòi hỏi tín hiệu điều khiển đầu vào (mô men quay) ở
thời điểm ban đầu rất lớn.
Nội dung của Chương 3 này được trích dẫn từ bài báo công bố số 7.
18
Hình 3.6. Đánh giá hiệu quả của biện pháp xử lý chattering ở cả hai bánh xe.
a) So sánh mô men ở bánh phải.
b) So sánh mô men ở bánh trái.
CHƯƠNG 4. THIẾT KẾ LUẬT ĐIỀU KHIỂN THÍCH NGHI BACKSTEPPING HỘI TỤ HỮU HẠN
Ở CẤP ĐỘ ĐỘNG LỰC HỌC
4.1. Đặt vấn đề
Như ta đã biết, nhược điểm của phương pháp điều khiển ở Chương 3 là đòi hỏi mô men điều khiển
quá lớn ở thời điểm ban đầu, cụ thể là 100 và 80 N.m. Điều này có thể dẫn đến nguy cơ bão hòa động cơ ở
phần tử chấp hành [42-44].
Nguy cơ bão hòa động cơ là một hiện tượng xảy ra khi khả năng cung cấp tối đa mô men quay ở phần
tử chấp hành nhỏ hơn yêu cầu ở đầu ra của bộ điều khiển. Tức là các phần tử chấp hành đã không đáp ứng
được các yêu cầu về độ lớn mô men quay của bộ điều khiển.
Nếu hiện tượng này xảy ra thì khả năng ứng dụng của luật điều khiển vào hệ thống điều khiển vòng
kín sẽ bị méo mó và thậm chí gây ra mất ổn định toàn hệ thống.
Nhược điểm của luật điều khiển ở Chương 3 cũng là lý do để một luật điều khiển mới ở Chương 4 này
được đề xuất thêm.
Tương tự Chương 3, ở Chương 6 này, một phương pháp điều khiển bám bền vững thích nghi dựa trên
kỹ thuật backstepping cho rô bốt di động để bù trượt bánh xe, bất định mô hình, và nhiễu ngoài được đề xuất.
Sơ đồ khối của hệ thống điều khiển vòng kín được mô tả như Hình 4.1.
4.2. Mô tả cấu trúc của RBFNN
Như được thấy trong Hình 4.2, cấu trúc của RBFNN bao gồm 3 lớp: lớp đầu vào, lớp ẩn, và lớp đầu
ra. Đối với bất kỳ một véc tơ hàm liên tục và bị chặn nào 31:NN f x R R , tồn tại một ma trận tối ưu W sao
cho
T f x W σ ε (4.4)
trong đó ε là véc tơ sai lệch xấp xỉ tối ưu.
4.3. Thiết kế luật điều khiển động học
Xuất phát từ (3.9) trong chương 3, luật điều khiển động học trong phương pháp điều khiển này được
đề xuất như sau:
0 2 4 6 8-50
0
50
100
Danh gia hieu qua cua bien phap xu lychattering o BANH PHAI
thoi gian (s)
Mo
men
qu
ay (
N.m
)
0 2 4 6 8
-20
0
20
40
60
80
Danh gia hieu qua cua bien phap xu ly chattering o BANH TRAI
thoi gian (s)
Mo
men
qu
ay (
N.m
)
Khong xu ly chattering
Co xu ly chattering
Khong xu ly chattering
Co xu ly chattering
19
D1I d
D0
cos sinˆ
sin cos
t
c
xd
y
v h Λe Λ e ζ χ (4.6)
trong đó cv là véc tơ mong muốn của véc tơ các vận tốc góc bánh xe v , Λ là một ma trận đường chéo, hằng,
xác định dương, và có thể được lựa chọn tùy ý; χ là thành phần bền vững động học được đề xuất như sau
ˆˆ e
χe
4.7)
trong đó là hệ số của thành phần bền vững động học và được cập nhật online như sau:
ˆ H e (4.8)
trong đó H là một hệ số dương và cũng được lựa chọn tùy ý.
4.4. Thiết kế luật điều khiển động lực học
Vì không biết trước mô hình động lực học của rô bốt di động, nên ta không thể biết f x một cách
chính xác. Bởi vậy, ta đề xuất đầu vào điều khiển như sau:
ˆ ˆ ˆ,
τ Ksig s f x W d (4.12)
trong đó K là một ma trận hằng xác định dương và có thể được lựa chọn tùy ý.
Hình 4.1. Khả năng đáp ứng của động cơ đối với đầu ra của bộ điều khiển.
Hình 4.2. Sơ đồ khối của phương pháp điều khiển trong Chương 4.
Bộ điều
khiển Động
cơ
Ký hiệu viết tắt:
C - Mệnh lệnh từ đầu ra bộ điều
khiển
A – Đáp ứng thực tế của động cơ
Ngưỡng bão hòa
Ngưỡng bão hòa
C
A
A
C
Phương trình
(3.2)
Rô bốt di
động bị
trượt bánh
xe
Bộ điều
khiển động
lực học
Bộ điều
khiển động
học
RBFNN
Thành phần bền vững
động lực học
Thành phần
bền vững động
học
e
+ - -
+
20
Hình 4.3. Cấu trúc mạng nơ ron RBFNN.
Tˆ ˆ ˆ, f x W W σ là đầu ra của RBFNN (4.3) và được sử dụng để xấp xỉ f x . Tiếp theo,
T
1 1 2 2sign , signs s s s
sig s (4.13)
với là một hằng số dương thỏa mãn 0 1 ; d biểu diễn thành phần bền vững động lực học được sử dụng
để bù tổng bất định gồm bất định mô hình, nhiễu ngoài, và sai số xấp xỉ hàm do số lượng hữu hạn của các nơ
ron lớp ẩn gây ra.
Bây giờ, thành phần bền vững động lực học d được định nghĩa như sau:
2M
1ˆ ˆ W2
sd
s (4.16)
trong đó là một hằng số dương và có thể được lựa chọn tùy ý. là hệ số bền vững động lực học và được
cập nhật động như sau:
s (4.17)
với là một hằng số dương và cũng được lựa chọn tùy ý.
4.5. Phân tích tính ổn định
Định lý 4.1: Chú ý đến một rô bốt di động trong sự hiện diện của trượt bánh xe, bất định mô hình, và
nhiễu ngoài với mô hình động học (1.8) và động lực học (1.23). Các Giả sử 3.3-3.4 và 4.1-4.3 được thỏa mãn.
Nếu phương pháp điều khiển được mô tả như Hình 6.1 với luật điều khiển động học (6.6), luật điều khiển động
lực học (4.12), thành phần bền vững động học (4.7), thành phần bền vững động lực học (4.16), và các luật cập
nhật động (4.8), (4.17), và (4.19) được đề xuất, thì véc tơ sai lệch bám vận tốc góc s hội tụ về không trong một
thời gian hữu hạn, véc tơ sai lệch vị trí e hội tụ tiệm cận về 0 khi t , các tín hiệu điều khiển được đảm
bảo luôn bị chặn.
4.6. Kết quả mô phỏng
Trong phần này, ta thực hiện một mô phỏng để kiểm chứng tính đúng đắn và hiệu năng của phương
pháp điều khiển được đề xuất trong Chương này. Hơn nữa, trong mô phỏng này, ta sẽ so sánh hiệu năng bám
của phương pháp được đề xuất này với phương pháp điều khiển trong Chương 3.
Vì mục đích so sánh, cả hai phương pháp này đều được thiết kế với cùng các hệ số điều khiển và
được thực hiện dưới một điều kiện có tính thực tiễn cao rằng bên cạnh chú ý đến sự tồn tại của bất định mô
hình và nhiễu ngoài, các vận tốc và gia tốc trượt bánh xe không được đo.
x1
Lớp đầu vào Lớp ẩn
Lớp đầu ra
21
Hình 4.4. So sánh hiệu năng bám quỹ đạo giữa phương pháp điều khiển mới này với phương pháp điều
khiển ở Chương 3.
Ví dụ 4.1: Mục tiêu D chuyển động theo phương trình sau.
D
D
2 3cos 0,2
1 3sin 0,2
x t
y t
(4.49)
Các kết quả mô phỏng được biểu diễn trong các Hình 4.4, 4.5, 4.6, và 4.7. Cụ thể, Hình 4.4 thể hiện
rằng sai lệch bám vị trí trong mặt phẳng O-XY của hai phương pháp điều khiển là tương đồng nhau.
Hình 4.5 thể hiện so sánh sai lệch bám vị trí e (được định nghĩa trong (3.8)) giữa hai phương pháp điều
khiển. Hình 4.5.a) và 4.5.b) minh họa so sánh toàn bộ tiến trình của các biến 1,2e . Ta thấy có vẻ như hai phương
pháp này cho kết quả tương đồng nhau về sai lêch bám vị trí.
a) b)
Hình 4.5. So sánh sai lệch vị trí giữa 2 phương pháp điều khiển.
a) So sánh toàn bộ tiến trình biến thiên của sai lệch vị trí 1e ;
b) So sánh toàn bộ tiến trình biến thiên của sai lệch vị trí 2e ;
22
a) b)
c) d)
Hình 4.6. so sánh sai lệch bám vận tốc góc ở bánh PHẢI và bánh TRÁI giữa hai phương pháp điều khiển.
a) so sánh toàn bộ tiến trình của sai lệch bám tốc độ góc ở bánh phải 1s ;
b) so sánh toàn bộ tiến trình của sai lệch bám tốc độ góc ở bánh trái 2s ;
c) so sánh TRẠNG THÁI XÁC LẬP của 1s ; d) so sánh TRẠNG THÁI XÁC LẬP của 2s ;
a) b)
Hình 4.7. So sánh các mô men quay (đầu vào điều khiển) của hai phương pháp điều khiển.
a) So sánh R ở bánh phải; b) So sánh L ở bánh trái
0 2 4 6 8-50
0
50
100
So sanh mo men quay o banh phai
thoi gian (s)
Mo
men
qu
ay (
N.m
)
0 2 4 6 8-20
0
20
40
60
80
So sanh mo men quay o banh trai
thoi gian (s)
mo
men
qu
ay (
N.m
)
chuong 6
chuong 5
chuong 6
chuong 5
23
Khi xét đến véc tơ sai lệch bám vận tốc góc s được định nghĩa trong (3.13) và (4.11) trong vòng điều
khiển động lực học như Hình 4.6, thì rõ ràng rằng trong giai đoạn xác lập, sai các sai lệch bám vận tốc góc
s1,2 của phương pháp mới nhỏ hơn rất nhiều so với phương pháp ở Chương 3. Cụ thể, các giá trị lớn nhất của
1,2s trong trạng thái xác lập ở Chương 4 đều là khoảng 5.10-3 (rad/s), trong khi đó các giá trị tương ứng ở
Chương 3 đều là khoảng 2,5.10-2 (rad/s). Lý do là rằng, xét về định tính, phương pháp điều khiển mới ở đây
đã đảm bảo tính hội tụ hữu hạn [46] ở cấp độ động lực học, nghĩa là, sai lệch điều khiển bám tốc độ góc s
được đảm sẽ hội tụ về không sau khoảng thời gian hữu hạn st được tính trong (4.37) thay vì chỉ hội tụ tiệm
cận (s 0 khi t ) như ở Chương 3.
Cuối cùng và quan trọng nhất, khi xét đến các tín hiệu đầu vào điều khiển R,L (mô men quay) như
trong Hình 4.7 thì rõ ràng rằng tại thời điểm ban đầu, các mô men quay của phương pháp mới nhỏ hơn rất
nhiều so với phương pháp ở Chương 3. Cụ thể, tại thời điểm 0(s), các giá trị mô men quay tại các bánh phải
và trái trong phương pháp Chương 4 lần lượt là 30 (N.m) và 25 (N.m). Nhưng đối với phương pháp trong
Chương 3, thì các giá trị tương ứng lần lượt là 100 (N.m) và 80 (N.m). Các các đòi hỏi giá trị mô men nhỏ tại
thời điểm ban đầu trong phương pháp mới sẽ làm giảm nguy cơ bão hòa động cơ, hạ thấp giá thành cho chi
phí đầu tư động cơ chấp hành.
4.7. Kết luận Chương 4
Tóm lại, luật điều khiển hội tụ hữu hạn ở cấp độ động lực học đã khắc phục được những nhược điểm
của phương pháp điều khiển ở Chương 3. Cụ thể là:
giảm được nguy cơ bão hòa động cơ tại thời điểm ban đầu.
nâng cao độ chính xác ở cấp độ động lực học trong trạng thái xác lập của hệ thống điều khiển.
không cần phải xác định trước các giá trị chặn trên của các thành phần bất định mô hình, nhiễu
ngoài và tốc độ trượt bánh xe.
KẾT LUẬN VÀ KIẾN NGHỊ
Sau khi tổng hợp nội dung trong các Chương ở trên, một số kết luận chính được đúc kết như sau:
Những nội dung nghiên cứu chính của luận án
Phân tích tổng quan, thực trạng, xu thế phát triển của các phương pháp điều khiển cho rô bốt di động
kiểu bánh xe để bám theo một quỹ đạo mong muốn được định nghĩa trước.
Phân tích các nguyên nhân và ảnh hưởng tiêu cực của các loại bất định mô hình, nhiễu ngoài, và
trượt bánh xe.
Xây dựng mô hình động học, động lực học của rô bốt di động khi xét ảnh hưởng tiêu cực của trượt
bánh xe lên chuyển động của rô bốt.
Xây dựng 03 luật điều khiển khác nhau để bù ảnh hưởng của trượt bánh xe lên rô bốt di động.
Thực hiện các mô phỏng máy tính bằng công cụ MATLAB/Simulink để kiểm chứng tính đúng đắn
của các luật điều khiển được đề xuất trong luận án.
Những đóng góp của luận án
Luận án có 03 đóng góp như sau:
Thiết kế luật điều khiển thích nghi dựa trên một mạng nơ ron ba lớp (chương 2).
Thiết kế luật điều khiển bám bền vững thích nghi sử dụng kỹ thuật backstepping và mạng sóng
Gaussian (chương 3).
Thiết kế luật điều khiển backstepping hội tụ hữu hạn ở cấp động lực học (chương 4).
Định hướng nghiên cứu phát triển
Tiếp tục nghiên cứu phát triển các phương pháp điều khiển mới cho rô bốt di động bám theo quỹ đạo
mong muốn.
24
Xây dựng hệ thống thực nghiệm để kiểm chứng các luật điều khiển được đề xuất.
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ
1. Nguyễn Văn Tính, Phạm Thượng Cát, Phạm Minh Tuấn, “Mô hình hóa và điều khiển rô bốt di động
non-holonomic có trượt ngang”, Kỷ yếu hội nghị toàn quốc lần thư 3 về Điều khiển và Tự động hóa –
VCCA, 2015, Thái Nguyên, 103-108.
2. N. V. Tinh, N. T. Linh, P. T. Cat, P. M. Tuan, M. N. Anh, N. P. Anh, Modeling and Feedback
Linearization Control of a Nonholonomic Wheeled Mobile Robot with Longitudinal, Lateral Slips, In:
Proc. 2016 IEEE International Conference on Automation Science and Enginerring, TX, USA, 996-
1001.
3. Tinh Nguyen, Hung Linh Le, Neural network-based adaptive tracking control for a nonholonomic
wheeled mobile robot subject to unknown slips, Journal of Computer Science and Cybernetics, Vietnam
Academy of Science and Technology, 2017, 33(1), 1-17.
4. Tinh Nguyen, Linh Le, “Neural network-based adaptive tracking control for a nonholonomic wheeled
mobile robot with unknown wheel slips, model uncertainties, and unknown bounded disturbances”,
Turkish Journal of Electrical Engineering & Computer Sciences, 2018, 26, 378-392.
5. Tinh Nguyen, Kiem Nguyentien, Tuan Do, Tuan Pham, Neural Network-based Adaptive Sliding Mode
Control Method for Tracking of a Nonholonomic Wheeled Mobile Robot with Unknown Wheel Slips,
Model Uncertainties, and Unknown Bounded External Disturbances, Acta Polytechnica Hungarica,
2018, 15(2), 103-123.
6. Kiem Nguyentien, Linh Le, Tuan Do, Tinh Nguyen, Minhtuan Pham, Robust control for a wheeled
mobile robot to track a predefined trajectory in the presence of unknown wheel slips, Vietnam Journal
of Mechanics, Vietnam Academy of Science and Technology, 2018, 40(2), 141 –154.
7. Nguyen Tinh, Thuong Hoang, Minhtuan Pham & Namphuong Dao, A Gaussian wavelet network-based
robust adaptive tracking controller for a wheeled mobile robot with unknown wheel slips, International
Journal of Control, 2018, DOI: 10.1080/00207179.2018.1458156.
TÀI LIỆU THAM KHẢO
1. L. Xin, Q. Wang, J. She, Y. Li, Robust adaptive tracking control of wheeled mobile robot, Robotics and
Autonomous Systems, 2016, 78, 36-48.
2. Y. Li, Z. Wang, and L. Zhu, Adaptive Neural Network PID Sliding Mode Dynamic Control of
Nonholonomic Mobile Robot, Proceedings of the 2010 IEEE International Conference on Information and
Automation, Harbin, China, 2010, 753-757.
10. Z.-P Jiang, H. Nijmeijer, Tracking control of mobile robots: A case study in backstepping, Automatica,
1997, 33(7), 1393-1399.
11. D. Kim, J. Oh, Tracking control of a two-wheeled mobile robot using input–output linearization, Control
Engineering Practice, 1999, 7, 369–373.
12. H. Gao, X. Song, L. Ding, K. Xia, N. Li, Z. Deng, Adaptive motion control of wheeled mobile robot with
unknown slippage, International Journal of Control, 2014, 87, 1513–1522.
25
13. M. Seyr, S. Jakubek, Proprioceptive Navigation, Slip Estimation and Slip Control for Autonomous
Wheeled Mobile Robots, in: Proceedings of the IEEE Conference on Robotics, Automation and
Mechatronics, 2006, 1–6.
14. Lê Thị Thúy Nga, Lê Hùng Lân, Điều khiển robot bầy đàn tránh vật cản và tìm kiếm mục tiêu, Hội nghị
toàn quốc lần thứ 3 về Điều khiển và Tự động hóa VCCA, 2015, 87-93.
15. Lê Hùng Lân, Lê Thị Thúy Nga, Phân tích sự ổn định tụ bầy của robot bầy đàn sử dụng hàm hút/đẩy mờ,
Tạp chí Khoa học Giao thông Vận tải, 2013, 10, 88-93.
16. Nguyễn Văn Khanh, Trần Văn Hùng, Điều khiển thời gian thực robot hai bánh tự cân bằng sử dụng bộ
điều khiển PID mờ tự chỉnh, Hội nghị toàn quốc lần thứ 3 về Điều khiển và Tự động hóa VCCA, 2015,
70-77.
17. Nguyễn Hữu Công, Vũ Ngọc Kiên, Điều khiển cân bằng xe hai bánh tự cân bằng sử dụng thuật toán
giảm bậc mô hình, Hội nghị toàn quốc lần thứ 3 về Điều khiển và Tự động hóa VCCA, 2015, 61-69.
18. Nguyễn Dũng, Nguyễn Bảo Huy, Võ Duy Thành, Tạ Cao Minh, Mô hình hóa ô tô điện bằng phương
pháp EMR với mô hình mở rộng của tương tác bánh xe – mặt đường, Hội nghị toàn quốc lần thứ 3 về
Điều khiển và Tự động hóa VCCA, 2015, 117-122.
19. J.-C. Ryu, S.K. Agrawal, Differential flatness-based robust control of mobile robots in the presence of
slip, The International Journal of Robotics Research, 2011, 30(4), 463–475.
20. Y. Qiu, X. Liang, Z. Dai, Backstepping dynamic surface control for an anti-skid braking system, Control
Engineering Practice, 2015, 42, 140–152.
21. N. Sidek, N. Sarkar, Dynamic modeling and control of nonholonomic mobile robot with lateral slip.
Proceedings of 3rd International Conference on Systems, 2008, 35-40.
22. I. Motte, G.A. Campion, Slow manifold approach for the control of mobile robots not satisfying the
kinematic constraints, IEEE Transactions on Robotics and Automation, 2000, 16(6), 875-880.
23. A. Matveev, M. Hoy, J. Katupitiya, A. Savkin, Nonlinear sliding mode control of an unmanned
agricultural tractor in the presence of sliding and control saturation, Robotics and Autonomous Systems,
2013, 61, 973–987.
24. M. Corradini, G. Orlando, Experimental testing of a discrete time sliding mode controller for trajectory
tracking of a wheeled mobile robot in the presence of skidding effects, Journal of Robotic Systems, 2002,
19, 177–188.
25. H. Khan, J. Iqbal, K. Baizid, T. Zielinska, Longitudinal and lateral slip control of autonomous wheeled
mobile robot for trajectory tracking, Frontiers of Information and Technology & Electronic Engineering,
2015, 16(2), 166-172.
26. L. Chang Boon, W. Danwei, Integrated Estimation for Wheeled Mobile Robot posture, velocities, and
wheel skidding perturbations, in: Proceedings of the IEEE International Conference on Robotics and
Automation, 2007, 2355–2360.
27. C. C. Ward, K. Iagnemma, Model-Based Wheel Slip Detection for Outdoor Mobile Robots, IEEE
International Conference on Robotics and Automation, 2007, 2724 – 2729.
28. G. Baffet, A. Charara, J. Stephant, Sideslip angle, lateral force and road fricion estimation in simulations
and experiments, Proceedings of IEEE International Conference on Control Applications, 2006, 903-908.
29. L. Li, F.Y. Wang, Integrated Longitudinal and lateral tire/road friction modeling and monitoring for
vehicle motion control, IEEE Transaction on Intelligent Transportation Systems, 2006, 7(1), 1-19.
26
30. Y. Tian, N. Sarkar, Control of a mobile robot subject to wheel slip, Journal of Intelligent and Robotic
Systems, 2014, 74, 915–929.
31. H. Kang, Y. Kim, C. Hyun, M. Park, Generalized extended state observer approach to robust tracking
control for wheeled mobile robot with skidding and slipping, International Journal of Advanced Robotic
Systems 2013, 10, 1–10.
32. S. Yoo, Approximation-based adaptive control for a class of mobile robots with unknown skidding and
slipping, International Journal of Control, Automation and Systems, 2012, 10, 703–710.
33. N Hoang, H Kang, Neural network-based adaptive tracking control of mobile robots in the presence of
wheel slip and external disturbance force, Neurocomputing, 2016, 188, 12-22.
34. C. B. Low, D. Wang, GPS-based path following control for a car-like wheeled mobile robot with skidding
and slipping, IEEE Transactions on Control Systems Technology 2008, 16, 340–347.
35. C. B. Low, D. Wang, GPS-based tracking control for a car-like wheeled mobile robot with skidding and
slipping, IEEE/ASME Transactions on Mechatronics, 2008, 13, 480–484.
36. R. Lenain, B. Thuilot, C. Cariou, P. Martinet, Mixed kinematic and dynamic sideslip angle observer for
accurate control of fast off-road mobile robots, Journal of Field Robotics, 2010, 27(2), 181-196.
37. B. Chen, F. Hsieh. Sideslip angle estimation using extended Kalman filter, Vehicle System Dynamics,
2008, 46, 353-364.
38. G. Bayar, M. Bergerman, E. Konukseven, A. Koku, Improving the trajectory tracking performance of
autonomous orchard vehicles using wheel slip compensation, Biosystems Engineering, 2016, 146, 149-
164.
39. H. Grip, L. Imsland, T. Johansen, J. Kalkkuhl, A. Suissa, Vehicle sideslip estimation: design,
implementation and experimental validation, IEEE Control Systems Magazine, 2009, 29(5), 36-52.
40. J. Dakhlallah, S. Glaser, S. Mammar, Y. Sebsadji, Tire-Road Forces Estimation Using Extended Kalman
Filter and Sideslip Angle Evaluation, Proceedings of 2008 American Control Conference, Washington,
USA, June 11-13, 2008, 4597- 4602.
41. C. Lin, Adaptive tracking controller design for robotic systems using Gaussian wavelet networks. IEE
Proceedings - Control Theory and Applications, 2002, 149(4), 316–322.
42. J. Slotine, W. Li, Applied Nonlinear Control, Prentice- Hall, 1991, Englewood Cliffs, New Jersey, USA.
43. J. Huang, C. Wen, Wei Wang, Z. Jiang. Adaptive stabilization and tracking control of a nonholonomic
mobile robot with input saturation and disturbance. Systems & Control Letters, 2013, 62, 234–241.
44. N. Perez-Arancibia, T. Tsao, J. Gibson, Saturation-induced instability and its avoidance in adaptive
control of hard disk drives, IEEE Transactions Control System Technology, 2010, 18, 368–382.
45. F. Lewis, A. Yesildirek, A., K. Liu. Multilayer Neural-Net Robot Controller with Guaranteed Tracking
Performance, IEEE Transactions on Neural Networks, 1996, 7(2), 388-399.
46. L. Wang, T. Chai, L. Zhai, Neural network-based terminal sliding mode control of robotic manipulators
including actuator dynamics, IEEE Transaction on Industrial Electronics, 2009, 56(9), 3296-3304.
47. A. K. Pamosoaji, P. T. Cat, K. Hong, Sliding-mode and proportional-derivative-type motion control with
radial basis function neural network based estimators for wheeled vehicles, International Journal of
Systems Sciences, 2014, 45(12).