Các vấn đề nghiên cứu của luận án Tác giả tập trung nghiên cứu các phương pháp điều khiển mới để bù trượt cho rô bốt di động khi tồn tại trượt bánh xe, bất định mô hình, và nhiễu ngoài
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
LUẬN ÁN KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA
Chuyên ngành: Kỹ thuật điều khiển và tự động hóa
Mã số: 9.52.02.16
TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT
Hà Nội – 2018
Trang 2Công trình được hoàn thành tại: Học viện Khoa học và Công nghệ - Viện Hàn lâm Khoa học và Công nghệ Việt Nam
Người hướng dẫn khoa học: TS Phạm Minh Tuấn
Phản biện 1:……….…
………
Phản biện 2:……….…
………
Phản biện 3:……….…
………
Luận án sẽ được bảo vệ trước Hội đồng chấm luận án cấp nhà nước họp tại: ……….……….………
………
Vào hồi giờ ngày tháng năm Có thể tìm hiểu luận án tại thư viện: ……….…
Trang 3MỞ ĐẦU Tính cấp thiết của đề tài
Có một sự thật không thể phủ nhận rằng các rô bốt di động có khả năng làm việc trong một phạm vi
rộng và có thể thao tác tự động một cách thông minh mà không cần bất cứ sự tác động nào từ con người Do
vậy, đề tài này tập trung nghiên cứu các bài toán thiết kế các luật điều khiển cho rô bốt di động kiểu bánh xe
Các vấn đề nghiên cứu của luận án
Tác giả tập trung nghiên cứu các phương pháp điều khiển mới để bù trượt cho rô bốt di động khi tồn
tại trượt bánh xe, bất định mô hình, và nhiễu ngoài
Đối tượng nghiên cứu
Để dễ dàng kiểm chứng tính đúng đắn và hiệu năng của các luật điều khiển được đề xuất, rô bốt di động 03 bánh xe được lựa chọn làm đối tượng nghiên cứu Cụ thể, rô bốt di động kiểu 03 bánh xe này bao gồm
02 bánh chủ động điều khiển vi phân, 01 bánh thụ động được dùng để làm điểm tựa tạo thế cân bằng trọng lực
Mục đích nghiên cứu
Đề xuất một số phương pháp điều khiển mới để bù ảnh hưởng tiêu cực của bất định mô hình, nhiễu ngoài, và trượt bánh xe
Phương pháp nghiên cứu
Phương pháp nghiên cứu được thể hiện qua trình tự công việc như sau:
Phân tích và xây dựng mô hình động học và động lực học của rô bốt di động khi tồn tại các bất định mô hình, nhiễu ngoài, và trượt bánh xe
Nghiên cứu, phân tích các phương pháp điều khiển tiên tiến trong và ngoài nước cho rô bốt di động trong sự hiện diện của bất định mô hình, nhiễu ngoài, và trượt bánh xe Sau đó, đề xuất các phương pháp điều khiển mới
Chứng minh tính đúng đắn và hiệu quả của các phương pháp điều khiển mới bằng tiêu chuẩn
ổn định Lyapunov và bổ đề Barbalat
Tiến hành kiểm chứng các phương pháp điều khiển nói trên băng công cụ Matlab/Simulink
Ý nghĩa khoa học và thực tiễn của đề tài
Ý nghĩa khoa học: Xây dựng các phương pháp điều khiển mới cho rô bốt di động để bù ảnh hưởng
tiêu cực của bất định mô hình, nhiễu ngoài, và trượt bánh xe
Ý nghĩa thực tiễn: Các phương pháp điều khiển được đề xuất trong luận án này có thể được triển khai
ứng dụng cho các rô bốt di động trong nhà kho với mặt sàn trơn hoặc có thể được triển khai ứng dụng cho các
xe tự hành trong các nông trường với nền đất ẩm ướt dễ trơn trượt
Bố cục của luận án
Chương 1: Trình bày tổng quan các nghiên cứu trong và ngoài nước trong những năm gần đây, và sau
đó trình bầy mô hình động học và động lực học của rô bốt di động trong điều kiện tồn tại bất định mô hình,
nhiễu ngoài, và trượt bánh xe
Chương 2: Thiết kế luật điều khiển bám thích nghi dựa trên một mạng nơ ron ba lớp
Chương 3: Thiết kế luật điều khiển backstepping bền vững thích nghi dựa trên mạng sóng Gaussian Chương 4: Thiết kế luật điều khiển backstepping hội tụ hữu hạn ở cấp động lực học
Trang 4CHƯƠNG 1 TỔNG QUAN VÀ MÔ HÌNH TOÁN HỌC 1.1 Đặt vấn đề
Bài toán điều khiển chuyển động cực kỳ quan trọng trong lĩnh vực rô bốt di động, bởi vì hiệu năng của các luật điều khiển ảnh hưởng trực tiếp đến hiệu quả của các ứng dụng rô bốt di động trong sản xuất và đời
sống Do vậy, bài toán này được lựa chọn làm mục tiêu nghiên cứu của luận án này
Trong những thập kỷ gần đây, bài toán điều khiển chuyển động cho rô bốt di động kiểu bánh xe đã
thu hút sự chú ý của các nhà khoa học trên khắp thế giới Hiển nhiên, rô bốt di động là một trong số các hệ thống chịu ràng buộc nonholonomic [1] Hơn nữa, nó lại là một hệ thống phi tuyến nhiều vào- nhiều ra [2] Nhờ có sự tiến bộ của lý thuyết cũng như kỹ thuật điều khiển, đã có rất nhiều phương pháp điều khiển khác nhau được áp dụng để thiết kế các luật điều khiển cho rô bốt di động như: điều khiển trượt [3, 4], điều khiển
bền vững [5], … Các luật điều khiển này đã được thiết kế với giả thiết “bánh xe chỉ lăn mà không trượt”
Tuy nhiên, trong thực tiễn ứng dụng, điều kiện các bánh xe chỉ lăn mà không trượt lại có thể thường xuyên bị vi phạm Tức là đã xảy ra hiện tượng trượt bánh xe [12-13]
Trượt bánh xe là một trong số các nhân tố chính gây ra sự giảm sút hiệu năng điều khiển nghiêm trọng
Do vậy, trong các tình huống như vậy, nếu muốn cải thiện hiệu năng điều khiển, thì cần phải thiết kế một bộ
điều khiển có khả năng bù trượt bánh xe.
1.2 Tình hình nghiên cứu trong nước
Ở Việt Nam, đến nay, đã có rất nhiều nghiên cứu về xe tự hành như nhóm tác giả ở Đại học Giao Thông Vận Tải nghiên cứu về rô bốt di động di chuyển kiểu bầy đàn [14-15] Một nhóm nghiên cứu ở Đại học Bách Khoa Hà Nội đã nghiên cứu về xây dựng mô hình cho một ô tô điện 04 bánh khi có tính đến tương tác
bánh xe - mặt đường [18] Tuy nhiên, chưa có nhiều kết quả nghiên cứu về điều khiển bù trượt bánh xe cho rô
bốt di động được công bố
1.3 Tình hình nghiên cứu ngoài nước
Trên thế giới, đã có rất nhiều báo cáo nghiên cứu về điều khiển bù trượt bánh xe cho rô bốt di động
Bởi vì trượt bánh xe có thể làm hệ thống mất ổn định hoặc giảm hiệu năng điều khiển nghiêm trọng nên nó
phải được ngăn chặn Thông thường, để điều khiển bù trượt bánh xe, các thông tin đo lực ma sát và tốc độ trượt phải luôn được cập nhật theo thời gian thực và chính xác Cụ thể, trong [12] các tác giả đã bù trượt bánh
xe bằng cách bù tỷ số trượt bánh xe Các gia tốc kế đã được sử dụng trong [13, 19] để bù trượt bánh xe trong thời gian thực Nghiên cứu trong [20] đã phát triển một bộ điều khiển bền vững xử lý cả tốc độ trượt lẫn gia tốc trượt bằng cách sử dụng hệ tọa độ của độ phẳng vi phân
1.4 Mô hình động học
Xét một rô bốt di động kiểu bánh xe chịu ràng buộc nonholonomic như Hình 1.3 Cụ thể, G(xG, yG) là
vị trí của tâm khối của phần cứng rô bốt di động M(xM, yM) là trung điểm của đoạn trục thẳng nối hai bánh xe
F1, F2 là các ma sát dọc giữa bánh phải và bánh trái với mặt sàn F3 là tổng lực ma sát tác động theo hướng ngang ở hai điểm tiếp xúc của hai bánh xe với mặt sàn
Khi không tồn tại trượt bánh xe, vận tốc tịnh tiến và vận tốc góc lần lượt được tính như sau [21]:
R L
R L2
2
r
r b
Trang 5trong đó R, L lần lượt là tọa độ góc của bánh phải và bánh trái
Bởi vậy, động học của rô bốt di động này được biểu diễn như sau [4]:
M M
cossin
x y
Ràng buộc nonholonomic của rô bốt di động đảm bảo hai yếu tố như sau:
Hướng của chuyển động tịnh tiến luôn vuông góc với trục nối hai bánh xe chủ động
Cả chuyển động tịnh tiến lẫn chuyển động quay đều hoàn toàn phụ thuộc vào chuyển động lăn của hai bánh xe chủ động
Cụ thể, ràng buộc này có thể được biểu diễn toán học như sau [32]
x M B v x với x R2 1
Trang 6bánh xe và mặt đường [29] luôn được đo chính xác trong thời gian thực Hiển nhiên, các đại lượng gồm gia
tốc tịnh tiến, gia tốc góc, vận tốc tịnh tiến, vận tốc góc đều có thể được đo trực tiếp một cách dễ dàng qua các cảm biến rẻ tiền, nhưng góc trượt và hệ số ma sát lại rất khó để đo [40]
Các phương pháp điều khiển được đề xuất trong luận án sẽ hướng tới không sử dụng các cảm biến
đo góc trượt và hệ số ma sát Thay vào đó, ảnh hưởng tiêu cực từ trượt bánh xe lên hiệu năng điều khiển bám
sẽ được bù một cách gián tiếp trong các bộ điều khiển
Ở chương này, mô hình động học và động lực học của rô bốt 3 bánh xe chịu tác động nhiễu ngoài, trượt bánh xe đã được xây dựng thành công Các mô hình này sẽ được sử dụng để thiết kế các luật điều khiển
bù trượt bánh xe, bất định mô hình, và nhiễu ngoài ở các chương sau
Nội dung của Chương này được trích dẫn từ tài liệu công bố số 3
CHƯƠNG 2 THIẾT KẾ LUẬT ĐIỀU KHIỂN BÁM THÍCH NGHI DỰA TRÊN MẠNG NƠ RON
BA LỚP 2.1 Đặt vấn đề
Vì lý do luật điều khiển trong [33] được thiết kế trong hệ tọa độ toàn cục OXY nên nó yêu cầu phải
đo các vận tốc trong hệ toàn cục này Nhiệm vụ đo vận tốc này đã được giải quyết bằng bộ quan sát twisting Kết quả ước lượng từ bộ quan sát này có thể chứa sai lệch tích lũy trong quá trình vận hành rô bốt Nên khả năng triển khai ứng dụng của phương pháp điều khiển trong [33] vẫn bị hạn chế
supper-Để tránh nhược điểm này, bộ điều khiển mới được đề xuất ở đây được thiết kế trong hệ tọa độ thân rô bốt MXY Khi đó, các biến vận tốc của rô bốt có thể được đo trực tiếp thông qua các cảm biến rẻ tiền nhưng
có độ tin cậy cao Bên cạnh đó, các vận tốc và gia tốc của trượt bánh xe đều không cần phải đo Thay vào đó, các ảnh hưởng tiêu cực của chúng sẽ được bù bằng một luật điều khiển có sử dụng mạng nơ ron ba lớp
Phần cứng
θ
Trang 72.2 Cấu trúc mạng nơ ron ba lớp
Hiển nhiên rằng các mạng nơ ron nhân tạo có khả năng xấp xỉ các hàm phi tuyến đủ trơn với một độ chính xác tùy ý [8] Trong tiểu mục này, một mạng nơ ron nhân tạo 3 lớp được giới thiệu khái quát Như được minh họa trong Hình 4.1, đầu ra của của mạng nơ ron này được tính như sau 3 T
trong đó ε là véc tơ của các sai lệch xấp xỉ tối ưu
Giả sử 2.1: ε là bị chặn [8] Cụ thể, ε b với b là một hằng số dương hữu hạn nào đó
Coi f x W V , ˆ ˆ, W σ V xˆ T ˆT là một ước lượng của f(x) Trong đó ˆ W và ˆ V lần lượt là các ma trận
ước lượng của W* và V ; chúng đều được cập nhật online bởi các thuật toán điều chỉnh trọng số online
Để thuận tiện, ta ký hiệu T
2.3 Phát biểu bài toán
Gọi D(xD, yD) là mục tiêu đang di chuyển theo một quỹ đạo mong muốn với một vận tốc tịnh tiến được định nghĩa trước (xem Hình 2.2) Không mất tính tổng quát, phương trình chuyển động của D được mô tả như sau:
cos( ) sin( )
D D
trong đó , T D , R, , x0, y0 làcác hằng số biểu diễn tham số của phương trình chuyển động của mục tiêu
Chú ý 2.1: trong Hình 2.2, ta ký hiệu (xP, yP) là vị trí của điểm P, (xP, yP, ) là một véc tơ mô tả cả vị trí và hướng thực của rô bốt di động Sự hiện diện của trượt bánh xe (cả trượt dọc và trượt ngang) khiến cho
bài toán điều khiển rô bốt di động sao cho cả vị trí và hướng thực (xP, yP, ) bám theo vị trí và hướng mong
muốn (xPd , yPd, d) không thể được giải quyết với một hiệu năng có thể chấp nhận được [32] Nhưng, nếu ta
điều khiển rô bốt sao cho vị trí thực (xP, yP) bám theo mục tiêu D(xD, yD) thì bài toán điều khiển hoàn toàn có thể được giải quyết mặc dù tồn tại cả trượt dọc và trượt ngang [32]
2.4 Mô tả véc tơ FTE (sai lệch bám được lọc – filtered tracking errors)
Một véc tơ của các biến đầu ra được mô tả trong hệ tọa độ M-XY như sau:
cos sinsin cos
x y
Trang 8Hình 2.2 Tọa độ của mục tiêu trong hệ tọa độ gắn thân rô bốt M-XY
trong đó Λ là một ma trận đường chéo, hằng, xác định dương, và có thể được lựa chọn tùy ý
2.5 Cấu trúc bộ điều khiển
Trang 9trong đó K là một ma trận 22 hằng, đường chéo, và xác định dương và được lựa chọn tùy ý f x W V là ˆ , ˆ ˆ,
đầu ra của mạng nơ ron để xấp xỉ f x như được mô tả trong (2.4)
Trong Chương này, luật cập nhật trọng số mạng nơ ron được đề xuất như sau:
Hình 2.1 Cấu trúc của mạng nơ ron 3 lớp
Hình 2.2 Sơ đồ khối của toàn bộ hệ thống điều khiển vòng kín
2.6 Phân tích tính ổn định
Định lý 2.1: Đối với một rô bốt di động chịu ảnh hưởng của trượt bánh xe như được minh họa bởi mô
hình động học (1.8) và mô hình động lực học (1.23), nếu luật điều khiển được mô tả bởi Hình 2.2 với tín hiệu đầu vào điều khiển được lựa chọn bởi (2.19) và các luật cập nhật trọng số mạng nơ ron được lựa chọn bởi (2.24) và (2.25), thì theo tiêu chuẩn Lyapunov và đinh lý LaSalle mở rộng [8], tín ổn định của toàn bộ hệ thống điều khiển vòng kín được đảm bảo để đạt được một hiệu năng bám mong muốn mà ở đó véc tơ sai lệch bám vị
WMR chịu trượt bánh xe
Mạng nơ ron ba lớp v
Phương trình (2.14)
Trang 10
trí lọc φ sẽ hội tụ về một lân cận nhỏ tùy ý của không trong khi tất cả các tín hiệu trong hệ thống điều khiển đều bị chặn kiểu UUB
Để minh họa tính đúng đắn của luật điều khiển trong chương này, các mô phỏng máy tính bằng phần mềm Matlab/Simulink đã được thực hiện Rô bốt di động được mô tả bởi các tham số trong Bảng 3.1 Hơn
nữa, vì mục đích so sánh, phương pháp trong Chương 3 cũng được mô phỏng trong cùng một điều kiện, cụ thể
là tồn tại các bất định mô hình và nhiễu ngoài (tức τd 0 ; M0 ), hơn nữa các tốc độ trượt bánh xe không
(m/s) đối với t > 0 (s) Ở thời điểm ban đầu,
vị trí và hướng được giả lập trong hệ O-XY là xM0 (m), yM0 (m), và / 6 (rad)
Đối với mạng nơ ron, để đơn giản trong xây dựng mô hình mạng nơ ron mà không giảm đi ý nghĩa xấp xỉ hàm phi tuyến bất định, lớp ẩn được lựa chọn có 10 nơ ron, bởi vậy các ma trận hệ số được lựa chọn như sau H1diag 1011 2 , H2diag 85 10 và 0,5 Dưới đây là 2 ví dụ mô phỏng đã được thực hiện bằng công cụ Matlab/Simulink
Hình 2.4 Đồ thị của các tốc độ trượt theo thời gian
Bảng 2.1 Các tham số của rô bốt di động [21]
I W Mô men quán tính của bánh xe xung quanh trục bánh xe 0,0025 (kg.m2)
I D Mô men quán tính của mỗi bánh xe quanh trục thẳng đứng đi qua tâm
Trang 11Các giá trị ban đầu của các ma trận trọng số nơ ron được khởi tạo là các số ngẫu nhiên trong khoảng (0; 1) như sau ˆ0 rand 0;1 11 2
Dưới đây là một ví dụ mô phỏng đã được thực hiện bằng công cụ Matlab/Simulink
Ví dụ 2.1: Mục tiêu D di chuyển theo một đường tròn với phương trình chuyển động được mô tả như sau:
2 3cos(0, 2 )0,5 3sin(0, 2 )
D D
Trang 12nhau với giá trị độ lớn khoảng 0,005 (m), nhưng sai lệch bám vị trí e2 trong phương pháp mới này nhỏ hơn
so với phương pháp của Hoang và cộng sự [33] với giá lớn nhất lần lượt là: 0,01 và 0,04 (m)
Hình 2.7 minh họa kết quả so sánh mô men điều khiển giữa hai phương pháp Về cơ bản, trong giai đoạn quá độ, hai phương pháp này đòi hỏi mô men điều khiển tương đồng nhau Trong giai đoạn xác lập, phương pháp trong [33] đòi hỏi biên độ mô men điều khiển lớn hơn so với phương pháp được đề xuất Tức là, phương pháp điều khiển mới này sẽ tiết kiệm năng lượng hơn so với phương pháp [33]
Cần chú ý rằng các sai số bám vị trí đã hội tụ về lân cận không, bởi vậy ζ hội tụ về lân cận ζd Hệ quả, 1 hội tụ về lân cận C Do đó, theo Chú ý 2.2, ma trận h luôn khả nghịch
Hình 2.7 Các mô men quay trong Ví dụ 4.1 giữa hai phương pháp điều khiển
2.8 Kết luận Chương 2
Tóm tại, trong chương này, một bộ điều khiển bám thích nghi được đề xuất dựa trên một mạng nơ ron
3 lớp với một luật cập nhật trong số mạng nơ ron online Nhờ bộ điều khiển được đề xuất này, rô bốt di động
đã bám theo một quỹ đạo mong muốn với một hiệu năng bám tốt trong sự hiện diện của bất định mô hình, nhiễu ngoài, và trượt bánh xe Sai lệch bám vị trí đã hội tụ về lân cận không và được điều chỉnh nhỏ tùy ý Các kết quả mô phỏng đã thể hiện ưu điểm vượt trội so với phương pháp trong [33] Cụ thể, phương pháp điều khiển mới này vừa bám quỹ đạo chính xác hơn lại vừa tiết kiệm năng lượng hơn so với phương pháp trong [33]
CHƯƠNG 3 THIẾT KẾ LUẬT ĐIỀU KHIỂN BACKSTEPPING DỰA TRÊN MẠNG SÓNG
GAUSSIAN 3.1 Đặt vấn đề
Mặc dù phương pháp điều khiển ở Chương 2 đã tỏ ra hiệu quả khi bù bất định mô hình và nhiễu ngoài,
nhưng độ chính xác điều khiển (véc tơ sai lệch bám vị trí e) chưa thực sự cao so với kỳ vọng của các nhiệm vụ
yêu cầu khắt khe về độ chính xác Lý do có thể là:
trong phương pháp điều khiển đó, đã không có sự phân chia nhiệm vụ một cách rõ ràng Cụ thể, ở đâu (thành phần điều khiển nào) là để xử lý (bù) ảnh hưởng tiêu cực của trượt bánh xe?
Và ở đâu (thành phần điều khiển nào) là để xử lý (bù) bất định mô hình và nhiễu ngoài ở cấp
độ động lực học
Trang 13 Hoặc trong hệ thống điều khiển đó, không có thành phần điều khiển bền vững, nên tiêu chuẩn
ổn định chỉ là UUB Cụ thể, các sai lệch điều khiển chỉ được đảm bảo sẽ hội tụ về một miền kín lân cận không, chứ không phải hội tụ về không
Do vậy, ở Chương 3 này, một phương pháp điều khiển bám bền vững thích nghi dựa trên kỹ thuật backstepping [8] (tạo tác động ngược từ động học vào động lực học) cho rô bốt di động để bù trượt bánh xe, bất định mô hình, và nhiễu ngoài Sơ đồ khối của hệ thống điều khiển vòng kín được mô tả như Hình 3.1
Cụ thể, hệ thống này gồm 2 vòng điều khiển kín Vòng ngoài chứa bộ điều khiển động học Trong bộ
điều khiển động học này, thành phần bền vững động học được sử dụng để bù ảnh hưởng tiêu cực của trượt
bánh xe Vòng kín phía trong chứa bộ điều khiển động lực học Đầu ra của bộ điều khiển động học cũng chính
là đầu vào của vòng điều khiển động lực học phía trong Ở đây, mạng sóng Gausian (Gaussian wavelet network – GWN) được sử dụng để xấp xỉ các hàm động lực học phi tuyến không được xác định trước do không biết
trước mô hình động lực học của rô bốt di động Thành phần bền vững động lực học được sử dụng để bù ảnh
hưởng tiêu cực của bất định mô hình, nhiễu ngoài, và sai số xấp xỉ hàm không thể tránh khỏi do số lượng hữu hạn các hàm sóng cơ sở trong lớp ẩn của GWN
3.2 Mô tả cấu trúc của mạng sóng Gaussian
Cấu trúc của mạng sóng Gaussian được mô tả trong Hình 3.2 Nếu mạng này chứa p hàm sóng cơ sở
thì đầu ra của nó được tính như sau:
và c ij lần lượt là hệ số giãn nở và tịnh tiến
Nhờ vào khả năng xấp xỉ mạnh mẽ của mạng GWN [40], nếu như đã cho trước một hàm trơn bất kỳ
trong đó ε mô tả một véc tơ của các sai lệch xấp xỉ tối ưu
3.3 Thiết kế luật điều khiển động học
Chương này cũng sẽ giải quyết bài toán điều khiển như được phát biểu trong mục 2.3
Giả sử 3.3: Các tọa độ x , D y D cùng với các đạo hàm bậc 1 và 2 của chúng đều bị chặn
Giả sử 3.4: Tất cả các tốc độ trượt bánh xe đều bị chặn Bởi vậy, tồn tại một hằng số dương biết trước
sao cho χ
Bởi vì vận tốc của các tọa độ trượt bánh xe không được đo nên χ trong (2.7) là bất định Ví thế, luật
điều khiển động học trong phương pháp điều khiển này được đề xuất như sau