cho phương tiện tự hành nói chung hay USV nói riêng đang trở thành xu hướngmới, đi cùng với đó là các thách thức như đặc tính động lực học đặc trưng củaUSV, dự đoán hành vi và ra quyết đ
Trang 1I H C QU C GIA TP HCM
TR NG I H C BÁCH KHOA
-
PHAN MINH TÂM
XÂY D NG GI I THU T TRÁNH VA CH M CHO
A NOVEL COLLISION AVOIDANCE ALGORITHM
FOR UNMANNED VEHICLES
Chuyên ngành: K Thu t i u Khi n và T ng Hóa
Mã s : 8520216
LU N V N TH C S
TP H CHÍ MINH, tháng 06 n m 2022
Trang 25 TS ng Xuân Ba .- y viên
Xác nh n c a Ch t ch H i đ ng đánh giá LV và Tr ng Khoa qu n lý chuyên ngành sau khi lu n v n đã đ c s a ch a (n u có)
CH T CH H I NG TR NG KHOA I N - I N T
PGS.TS Hu nh Thái Hoàng
Trang 3i
NHI M V LU N V N TH C S
H tên h c viên: Phan Minh Tâm MSHV:2070628
Ngày, tháng, n m sinh : 14/12/1998 N i sinh: Gia Lai
Chuyên ngành : K thu t i u khi n và T đ ng hóa Mã s : 8520216
I TÊN TÀI: Xây d ng gi i thu t tránh va ch m cho ph ng ti n không ng i lái (A Novel Collision Avoidance Algorithm for Unmanned Vehicles)
II NHI M V VÀ N I DUNG :
- Tìm hi u các ph ng pháp tránh va ch m cho ph ng ti n không ng i lái
IV NGÀY HOÀN THÀNH NHI M V : 07/06/2021
Trang 4ii
L I C M N
Trong su t th i gian hai n m h c t p và rèn luy n t i Tr ng i h c Bách Khoa - HQG cho đ n nay, em đã nh n đ c r t nhi u s quan tâm, giúp đ c a quý Th y Cô và b n
bè V i lòng bi t n sâu s c và chân thành nh t, em xin g i đ n quý Th y Cô Khoa
i n – i n T – Tr ng i h c Bách Khoa - HQG đã cùng v i tri th c và tâm huy t
c a mình đ truy n đ t v n ki n th c quý báu cho chúng em trong su t th i gian h c t p
t i tr ng
Em xin chân thành c m n GS.TS H Ph m Huy Ánh đã t n tâm h ng d n chúng em qua t ng bu i h c trên l p c ng nh nh ng bu i nói chuy n, th o lu n v l nh v c sáng
t o trong nghiên c u khoa h c
Em c ng xin bày t lòng bi t n đ n ban lãnh đ o c a Tr ng i h c Bách Khoa - HQG và các Khoa Phòng ban ch c n ng đã tr c ti p và gián ti p giúp đ em trong su t quá trình h c t p và nghiên c u đ tài này
Phan Minh Tâm đ c tài tr b i T p đoàn Vingroup – Công ty CP và h tr b i Ch ng trình h c b ng th c s , ti n s trong n c c a Qu i m i sáng t o Vingroup (VINIF),
Vi n Nghiên c u D li u l n, mã s VINIF.2021.ThS.85
Trang 5iii
TÓM T T TÀI Trong lu n v n này, h th ng tránh va ch m hai ch đ (DMCAS) đ c phát tri n đ
gi i quy t bài toán tránh va ch m cho tàu không ng i lái (USVs), hai ch đ c a DMCAS bao g m ch đ ho ch đ nh ch đ ng và ph n ng ph n ng hành vi “Vùng ê- líp xâm ph m” là m t khái ni m m i đ c khám phá ra khi gi i bài toán d đoán vùng
va ch m, và đ c dùng đ thi t k thu t toán tránh va ch m cho c hai ch đ c a DMCAS
ch đ ho ch đ nh ch đ ng, qu đ o đ cong liên t c theo ê-lip (ECCT) là m t qu
đ o tránh va ch m an toàn và t i u đ c đ xu t nh tính ch t t nh c a vùng ê-líp xâm
ph m ch đ ph n ng hành vi, m t tr ng th o đ c xây d ng d a vào vùng ê-líp xâm ph m đ đi u khi n USV di chuy n tránh xa vùng ê-líp và t đó tránh đ c va ch m
H n n a, gi i thu t đi u h ng và b đi u khi n đ c thi t k đ đi u khi n USV bám
qu đ o tránh va ch m d i tác đ ng c a dòng ch y v i sai s luôn b ch n Các mô
ph ng s đ c th c hi n đ ki m ch ng kh n ng tránh va ch m c a DMCAS trong nhi u
tr ng h p khác nhau
Trang 6iv
ABSTRACT
In this thesis, a dual-mode collision avoidance system (DMCAS) is developed to address collision avoidance for USVs, including a deliberative mode and a reactive mode
A new concept named “threat ellipse”, a result obtained when predicting collision areas,
is explored and applied to design collision avoidance algorithms for two modes of DMCAS In the deliberative mode, a proposed Ellipse-based Curvature-Continuous Trajectory (ECCT) exploits a static property of the threat ellipse to generate a safe, admissible, and optimal collision avoidance trajectory for Unmanned Surface Vessel (USV) In the reactive mode, Threat Ellipse-based Potential Field (TEPF) is defined to encourage USV to move far away collision areas and avoid dynamic obstacles Moreover, the guidance laws and control laws are proposed for the trajectory tracking problem under the condition of current with the prescribed performance Several numerical simulations are carried out to verify the capability of DMCAS in different scenarios such as head-on, crossing, overtaking, and multiple ships
Trang 7v
L I CAM OAN Tôi xin cam đoan lu n v n này là do tôi th c hi n, hoàn toàn không sao chép n i dung
c a tác gi khác ho c do ng i khác th c hi n Toàn b các trích d n, công th c, gi i thu t s d ng c a tác gi khác đ u đ c chú thích đ y đ
Tp H Chí Minh, ngày … tháng … n m 2022
H c viên
Phan Minh Tâm
Trang 8Mục lục
1.1 Đặt vấn đề 1
1.2 Tình hình nghiên cứu về USV 2
1.3 Tình hình nghiên cứu giải thuật tránh va chạm 6
1.4 Mục tiêu và nội dung nghiên cứu 11
2 CƠ SỞ LÝ THUYẾT 13 2.1 Mô hình toán USV 13
2.1.1 Mô hình động học của USV 13
2.1.2 Mô hình động lực học 15
2.1.3 Tác động của dòng chảy: 17
2.2 Trường thế nhân tạo 19
2.3 COLREGs 20
3 HỆ THỐNG TRÒNH VA CHẠM 23 3.1 Tổng quan hệ thống 23
3.2 Vùng ê-líp xâm hại (TE) 24
3.3 Chế độ hoạch định chủ động 28
3.3.1 Quỹ đạo tránh va chạm 28
3.3.2 Tối ưu hóa các tham số của ECCT 31
3.4 Chế độ phản ứng hành vi 32
vi
Trang 94 ĐIỀU KHIỂN BÒM QUỸ ĐẠO 35
4.1 Bộ điều hướng 35
4.1.1 Sai số bám 35
4.1.2 Luật điều hướng 38
4.1.3 Tác động của dòng chảy 41
4.2 Bộ điều khiển 44
4.2.1 Điều khiển góc hướng 46
4.2.2 Điều khiển vận tốc 47
5 KẾT QUẢ MŨ PHỎNG 49 5.1 Mô hình Cyber Ship II 49
5.2 Mô phỏng bám quỹ đạo 50
5.3 Mô phỏng chế độ hoạch định chủ động 61
5.4 Chế độ phản ứng hành vi 66
5.5 Kết luận 70
6 KẾT LUẬN 71 6.1 Những công việc đã hoàn thành 71
6.2 Các hạn chế 72
6.3 Hướng phát triển 72
Trang 10Danh sách hình vẽ
1.1 Vụ tai nạn của tàu chở dầu Mediterranean gần Corsica, Ý. 2
1.2 Vụ tai nạn giữa tàu chở hàng WIN HERO với tàu đánh cá Hàn Quốc. 3 1.3 Thuyền AutoCat được nghiên cứu tại MIT năm 2000. 4
1.4 Thuyền DELFIM sử dụng hai động cơ đẩy. 5
1.5 Wave Glider được phát triển bởi Liquid Robotics chuyển động nhờ sóng biển. 5
1.6 Hình ảnh USV tự động tránh ca nô chở người trên biển. 6
1.7 Hệ thống thị giác máy phát hiện các vật cản tiềm năng. 7
1.8 Tàu ESM30 tránh né vật cản khi hoạt động ở vùng gần bờ. 7
1.9 Lưu đồ minh họa phương pháp hoạch định chủ động. 8
1.10 Lưu đồ minh họa phương pháp phản ứng hành vi (reactive). 9
1.11 Lưu đồ minh họa phương pháp lai (hybrid). 10
2.1 Hệ quy chiếu ECEF ¶e♢ = (x e , y e , z e ) xoay với một tỷ góc ω e so với hệ quy chiếu ECI ¶i♢ = (x i , y i , z i). 14
2.2 Mô hình USV 3-DOF được biểu diễn trong mặt phẳng ngang. 17
2.3 Minh họa trường thế của APF. 19
2.4 Minh họa các tình huống va chạm: đối đầu, vượt, băng ngang. 21
2.5 Sự điều động của tàu không ưu tiên trong ba tình huống. 22
3.1 Hệ thống tránh va chạm cho USV với hai chế độ: hoạch định chủ động và phản ứng hành vi. 23
viii
Trang 113.2 Minh họa vùng ê-líp xâm hại được định nghĩa bởi (3.8) 27
3.3 Minh họa ECCT và các quỹ đạo mẫu. 29
3.4 Minh họa lực đẩy của TEPF 33
3.5 Minh họa lực ly tâm của TEPF 34
4.1 Sai số bám x e , y e so với quỹ đạo đặt. 36
4.2 Minh họa ϑ x với α1= β1 = 3 và λ x ∈ (−3; 3) 38
4.3 Hệ thống điều hướng (guidance) cho mô hình động học của USV 39 4.4 Hệ thống điều hướng cho mô hình động học của USV trong môi trường có dòng chảy u r , v r là vận tốc tương đối, v n c = [V x , V y]T là vận tốc dòng chảy 41
4.5 Hệ thống điều hướng đầy đủ cho USV trong môi trường có dòng chảy 45
5.1 Quỹ đạo đặt (1), quỹ đạo USV theo phương pháp đề xuất (2) và theo [35] (3), USV(4). 51
5.2 Các chặn trên và chặn dưới (1), sai số bám x e theo phương pháp đề xuất (2) và [35] (3). 52
5.3 Các chặn trên và chặn dưới (1), sai số bám y e theo phương pháp đề xuất (2) và [35] (3). 52
5.4 Sai số điều khiển vận tốc. 53
5.5 Sai số điều khiển góc hướng. 53
5.6 Lực đẩy tác dụng. 54
5.7 Moment xoay. 54
5.8 Quỹ đạo đặt (1) và quỹ đạo USV dưới tác động của dòng chảy theo phương pháp đề xuất (2) và phương pháp Huang không sử dụng (3) và có sử dụng bộ ước lượng (4), USV(5). 56
5.9 Các chặn trên và chặn dưới (1), sai số bám x e dưới tác động dòng chảy theo phương pháp đề xuất (2) và phương pháp Huang không sử dụng (3) và có sử dụng bộ ước lượng (4). 56
Trang 12Luận Văn Thạc Sĩ x DANH SÒCH HÌNH VẼ
5.10 Các chặn trên và chặn dưới (1), sai số bám x e dưới tác động dòng chảy theo phương pháp đề xuất (2) và phương pháp Huang không sử dụng
(3) và có sử dụng bộ ước lượng (4). 57
5.11 Sai số điều khiển vận tốc tương đối. 57
5.12 Sai số điều khiển góc hướng. 58
5.13 Lực đẩy tác dụng (có dòng chảy). 58
5.14 Moment xoay (có dòng chảy). 59
5.15 Chất lượng của các bộ ước lượng dòng chảy theo phương x: (1) Tốc độ dòng chảy thực tế, (2) Bộ ước lượng (4.19), (3) Bộ ước lượng (5.1). 59
5.16 Chất lượng của các bộ ước lượng dòng chảy theo phương y: (1) Tốc độ dòng chảy thực tế, (2) Bộ ước lượng (4.20), (3) Bộ ước lượng (5.2) 60
5.17 So sánh quỹ đạo tránh va chạm đối đầu của ECCT và các phương pháp khác trong kịch bản đối đầu (1) Đường toàn cục, (2) Way-point, (3) LNDT, (4) Dubins, (5) Bezier, (6) ECCT, (7) Vùng ê-líp xâm phạm 62
5.18 Đánh giá hiệu suất tránh va chạm đối đầu: A/ Sai số bám, B/Khoảng cách giữa OS và TS 63
5.19 So sánh quỹ đạo tránh va chạm đối đầu của ECCT và các phương pháp khác trong kịch bản băng ngang (1) Đường toàn cục, (2) Waypoint, (3) LNDT, (4) Dubins, (5) Bezier, (6) ECCT, (7) Vùng ê-líp xâm phạm 63
5.20 Đánh giá hiệu suất tránh va chạm băng ngang: A/ Sai số bám, B/Khoảng cách giữa OS và TS 64
5.21 So sánh quỹ đạo tránh va chạm đối đầu của ECCT và các phương pháp khác trong kịch bản vượt (1) Đường toàn cục, (2) Waypoint, (3) LNDT, (4) Dubins, (5) Bezier, (6) ECCT, (7) Vùng ê-líp xâm phạm 64
5.22 Đánh giá hiệu suất tránh va chạm vượt: A/ Sai số bám, B/Khoảng cách giữa OS và TS 65
Luận Văn Thạc Sĩ HV: Phan Minh Tâm x
Trang 135.23 Tránh va chạm với nhiều tàu tham gia, t=53s 67
5.24 Tránh va chạm với nhiều tàu tham gia, t=70s 67
5.25 Tránh va chạm với nhiều tàu tham gia, t=111s 68
5.26 Tránh va chạm với nhiều tàu tham gia, t=168s 68
5.27 Tránh va chạm với nhiều tàu tham gia, t=53s 69
Trang 14Danh sách bảng
5.1 Thông số động học của các TS sử dụng trong các mô phỏng chế
độ hoạch định chủ động 615.2 Tổng hợp so sánh chất lượng của bốn phương pháp theo từng tiêuchí trong ba trường hợp 625.3 Thông số của TEPF 665.4 Thông số động học của các tàu TS 66
xii
Trang 15Danh sách từ viết tắt
APF = Artificial Potential Field
COLREGs = Convention on the international regulations
for preventing collisions at sea
DMCAS = Dual-mode Collision Avoidance System
DOF = Degree of Freedom
ECCT = Ellipse-based Curvature Continuous Trajectory.ECEF = Earth-centered Earth-fixed
ECI = Earth-centered inertial
Trang 16có thể được sử dụng cho các mục đích quân sự: do thám, vận chuyển vũ khí,tác chiến điện tử, và cả mục đích dân sự như cứu nạn cứu hộ, vận chuyểnhàng hóa, hỗ trợ đánh bắt, quan trắc môi trường, Ngày nay, USV đã đạt mức
độ tự hành cao hơn nhờ tận dụng các tiến bộ của khoa học kỹ thuật cũng nhưcác thiết bị công nghệ cao, nên USV hoàn toàn có khả năng phát hiện, dự đoáncác va chạm và tự động thực hiện các hành vi tránh va chạm một cách hợp lý
và chính xác Trên thế giới hiện nay, việc nghiên cứu giải thuật tránh va chạm
1
Trang 17cho phương tiện tự hành nói chung hay USV nói riêng đang trở thành xu hướngmới, đi cùng với đó là các thách thức như đặc tính động lực học đặc trưng củaUSV, dự đoán hành vi và ra quyết định trong các tình huống phức tạp có thểxảy ra, Tóm lại, việc nghiên cứu giải thuật tránh vật cản không những đemlại những lợi ích về Khoa học-Công nghệ trong việc nâng cao tính tự hành củaUSV, mà còn có ý nghĩa cho Kinh tế-Xã hội khi có thể hạn chế những thiệt hại
về con người và vật chất do các tai nạn gây ra
Hình 1.1: Vụ tai nạn của tàu chở dầu Mediterranean gần Corsica, Ý.
1.2 Tình hình nghiên cứu về USV
Phần lớn các nguyên mẫu nghiên cứu của USV được thiết kế và phát triển chomục đích thu thập dữ liệu hải dương học, như là đo độ sâu, quan trắc môi trường, Các nguyên mẫu của Châu Âu bao gồm Measuring Dolphin (MESSIN), đượcphát triển bởi Đại học Rostock, Đức [4] và tàu hai thân tự hành Charlie của Viện
Hệ thống Tự động Thông minh, Genova, Ý Charlie là một tàu hai thân được
sử dụng để thu thập các mẫu bề mặt biển trong chuyến thám hiểm của người Ýđến Nam Cực lần thứ XIX [5] Tại Anh, những đóng góp đáng chú ý trong lĩnhvực USV bắt nguồn từ Nhóm Nghiên cứu Phân tích Động lực Hàng hải & Côngnghiệp (MIDAS) tại Đại học Plymouth trong việc phát triển Springer USV
Trang 18Luận Văn Thạc Sĩ 3 CHƯƠNG 1 MỞ ĐẦU
Hình 1.2:Vụ tai nạn giữa tàu chở hàng WIN HERO với tàu đánh cá Hàn Quốc.
Springer đã được phát triển để thực hiện các cuộc khảo sát về môi trường vàthủy văn ở các vùng nước ven biển Tại Hoa Kỳ, Viện Công nghệ Massachusetts(MIT) đã phát triển một họ USV bao gồm ARTEMIS (1993) có tỉ lệ 1:7 so vớitàu đánh cá, tàu kiểu catamaran, ACES (1997) và AutoCat (1999), và SCOUT(2004)
Hiện nay, thân thuyền USV tồn tại nhiều kiểu dáng khác nhau phù hợp với từngứng dụng Loại catamaran và kayak thì phổ biến cho mục đích nghiên cứu nhờtính linh hoạt trong việc lắp đặt thiết bị Trong khi tàu một thân như SCOUTthuận tiện để sản xuất thì tàu hai thân như Springer lại thường được sử dụnghơn do tính ổn định của góc roll Các loại thuyền bơm hơi thân cứng là lựa chọntốt cho các nhiệm vụ kéo dài đặc biệt là trong ứng dụng quân sự nhờ có khảnăng chở tải cao [6] Các loại thuyền này đều sử dụng hệ thống bánh lái-động cơđẩy để điều khiển tốc độ và góc heading Thuyền DELFIM lại sử dụng hai động
cơ đẩy độc lập tương tự xe hai bánh để điều động con thuyền Có một vấn đề mà
đa số các nguyên mẫu USV thường gặp phải đó là chi phí và sự bất tiện của việcnạp nhiên liệu Wave Glider được phát triển bởi Liquid Robotics là một phiênbản USV được thương mại hóa có khả năng chuyển đổi sóng thành lực đẩy và
sử dụng cảm biến dùng năng lượng mặt trời Trong số tất cả các nguyên mẫu
Luận Văn Thạc Sĩ HV: Phan Minh Tâm 3
Trang 19Hình 1.3: Thuyền AutoCat được nghiên cứu tại MIT năm 2000.
này, loại thuyền kayak, các tàu SCOUT đã triển khai thành công COLREGs ởmức cơ bản cho các tình huống đối đầu trong khi duy trì liên lạc không dây [7].Vào tháng 7 năm 2007, Giám đốc Điều hành Chương trình Chiến tranh Littoral
& Mine đã điều chỉnh Kế hoạch Tổng thể USV cho Hải quân Hoa Kỳ Sự điềuchỉnh này phác thảo nhu cầu phát triển USV cho các mục tiêu của Bộ Quốcphòng (DoD) đến năm 2020 Kế hoạch này đã được công bố cho các học viện,ngành công nghiệp và các tổ chức nghiên cứu để hướng nỗ lực của họ theo nhucầu của chính phủ Những nhu cầu được xác định là liên quan đến việc tăngmức độ tự hành để giảm luồng dữ liệu vào và ra từ người vận hành và nghiêncứu các quy tắc cần thiết của luật hàng hải đối với hoạt động của các phươngtiện tự hành (có vũ trang) cần được tích hợp trong thiết kế hệ thống Các lĩnhvực khác sẽ được giải quyết bao gồm nhận dạng mục tiêu tự động, tránh chướngngại vật và va chạm, phóng và phục hồi Nhu cầu chính đối với hệ thống điềukhiển là tăng cường quyền tự chủ về khả năng nhận biết chướng ngại vật và cácbiện pháp tránh né thích hợp để giảm thiểu sự phụ thuộc vào sự can thiệp củangười vận hành Các hệ thống thị giác, ở cấp độ cơ bản, phải phát hiện trướccác đối tượng và phân loại chúng là tĩnh hay động và nếu có thể, dự đoán vận
Trang 20Luận Văn Thạc Sĩ 5 CHƯƠNG 1 MỞ ĐẦU
Hình 1.4: Thuyền DELFIM sử dụng hai động cơ đẩy.
Hình 1.5: Wave Glider được phát triển bởi Liquid Robotics chuyển động nhờ sóng
biển.
Luận Văn Thạc Sĩ HV: Phan Minh Tâm 5
Trang 21Hình 1.6: Hình ảnh USV tự động tránh ca nô chở người trên biển.
tốc và vị trí trong tương lai của chúng để xác định hướng hành động thích hợp.Các hệ thống tầm nhìn tiên tiến hơn có thể có khả năng phân loại đối tượng,tức là loại tàu hoặc xây dựng bản đồ của một môi trường không xác định trongthời gian thực Các thao tác tránh bao gồm chuyển hướng xung quanh các đốitượng địa lý tĩnh như đảo hoặc vùng nước nông, né tránh các mục tiêu thù địchđộng hoặc đơn giản là tránh va chạm với các tàu đang tiếp cận khác tuân theoCOLREGs Nhân lực cần thiết trong quá trình cập cảng tàu cũng có thể giảmđáng kể nhờ hệ thống hạ và phóng tàu tự động
1.3 Tình hình nghiên cứu giải thuật tránh va
chạm
Theo [8] và [9], phương pháp tránh va chạm cho robot có thể chia làm 3 loạigồm: phương pháp hoạch định chủ động, phương pháp phản ứng hành vi, vàphương pháp lai (kết hợp cả hai phương pháp) Phương pháp hoạch định chủđộng (hình 1.9) được áp dụng để hoạch định đường đi với bản đồ và vật cảntĩnh đã biết trước Kết quả đầu ra của phương pháp hoạch định chủ động là một
Trang 22Luận Văn Thạc Sĩ 7 CHƯƠNG 1 MỞ ĐẦU
Hình 1.7: Hệ thống thị giác máy phát hiện các vật cản tiềm năng.
Hình 1.8: Tàu ESM30 tránh né vật cản khi hoạt động ở vùng gần bờ.
Luận Văn Thạc Sĩ HV: Phan Minh Tâm 7
Trang 23đường toàn cục đi từ điểm ban đầu đến điểm đích cần đến đồng thời thỏa mãnmột số yêu cầu như độ dài, độ liên tục và tránh vật cản tĩnh Một số phươngpháp kinh điển thuộc loại này có thể kể đến như Dijkstra [10], A* [11], tìm kiếmnhanh theo các cây ngẫu nhiên (Rapidly-Exploring Random Trees) [12], và lưu
đồ Voronoi (Voronoi diagrams) [13] Trong lĩnh vực hàng hải, các tàu tham gia
Hình 1.9: Lưu đồ minh họa phương pháp hoạch định chủ động.
giao thông trên biển buộc phải tuân thủ theo luật hàng hải về phòng tránh vachạm (COLREGs) và thực hiện các hành động tránh né va chạm theo quy địnhcủa COLREGs, do đó hành vi của những loại tàu COLREGs rất dễ dự đoán
Vì thế mà các phương pháp hoạch định chủ động có thể được mở rộng để giảiquyết các bài tránh va chạm với tàu COLREGs bằng cách đưa ra các sửa chữacục bộ cho đường toàn cục Ví dụ như, [14] đã đề xuất giải thuật Điều hướng đặt(Set-based Guidance) trong đó một điểm tránh va chạm được thêm vào để USV
có thể bám theo Ngoài cách thêm các điểm như vậy thì một đoạn quỹ đạo cục
bộ cũng có thể được sử dụng như quỹ đạo cục bộ hình phân phối chuẩn (local
Trang 24Luận Văn Thạc Sĩ 9 CHƯƠNG 1 MỞ ĐẦU
normal distribution trajectory - LNDT) được giới thiệu bởi [15] Tuy nhiên, cácphương pháp của [14] và [15] hay tương tự chỉ phù hợp với việc tránh một tàuđơn lẻ và không có tính linh hoạt để tránh nhiều tàu một lúc Một hướng tiếpcận khác được đề xuất trong [16], các tàu được xấp xỉ bằng các vùng dự đoán
va chạm (Predicted Area of Danger - PAD) và các PAD này sau đó được sửdụng để hoạch định tránh va chạm Hạn chế lớn nhất của [16] tốn nhiều thờigian tính toán, nên khó có thể bắt thể bắt kịp sự biến động của ngoại cảnh
Khác với phương pháp hoạch định chủ động, các giải thuật phản ứng hành
vi lại chú trọng phản ứng nhanh với các sự biến đổi của môi trường hơn tối ưuhiệu suất, do đó không bước hoạch định (hình 1.10) Phương pháp đơn giản và
Hình 1.10: Lưu đồ minh họa phương pháp phản ứng hành vi (reactive).
phổ biến nhất cho loại giải thuật này có lẽ là Trường thế nhân tạo (ArtificialPotential Field - APF) [17] Đúng như tên gọi của giải thuật, APF sẽ thiết lậpcác trường thế xung quanh các vật cản và điểm đích, và các lực thế sinh ra sẽ
có đặc điểm luôn hướng ra vật cản và hướng đến điểm đích Tuy nhiên, vấn đềlớn nhất của phương pháp là các điểm cực tiểu địa phương [18] đã đề xuất hàmAPF mới cho robot di chuyển trong môi trường động bằng cách xem xét thêmvận tốc của điểm đích và gia tốc, vận tốc của robot khi thiết kế các hàm thế [19]
đã chia miền thế thành bốn miền khác theo thứ tự tăng dần mức độ nguy hiểmgồm vùng an toàn, vùng điều tiết, vùng khẩn cấp, và vùng cấm [20] giới thiệuphương pháp hoạch định đường đi theo theo APF (PGHAPF) để giải quyết vấn
Luận Văn Thạc Sĩ HV: Phan Minh Tâm 9
Trang 25đề cực tiểu cục bộ của APF truyền thống PGHAPF xem xét giá trị thế năngtại 4 điểm gồm: vị trí hiện tại, và các vị trí sau khi thực hiện các hành động đithẳng, rẽ phải, rẽ trái Nếu thế năng tại bất kì vị trí nào lớn hơn ngưỡng chotrước, thì hành động tương ứng với giá trị thế năng nhỏ nhất sẽ được chọn đểđiều động USV Để giải quyết cực tiểu địa phương khi mà robot, vật cản, điểmđích thẳng hàng, [21] đề xuất thêm vào mô hình APF một thành phần lực mới
mà tiếp tuyến với biên dạng của vật cản Trong [22], một thành phần lực cũngđược giới thiệu nhưng vuông thành phần lực đẩy
Các hệ thống lai là sự kết hợp của các phương pháp hoạch định chủ động vàgiải thuật phản ứng hành vi để tận dụng lợi thế cũng như bù đắp nhược điểmcủa hai phương pháp này (1.11) Trong hệ thống này, lớp hoạch định chủ động
Hình 1.11: Lưu đồ minh họa phương pháp lai (hybrid).
là lớp cao hơn có nhiệm vụ hoạch định đường đi tối ưu trong môi trường tĩnh.Lớp thấp hơn là lớp phản ứng hành vi có nhiệm vụ nhận đường đi tham chiếu
từ lớp hoạch định chủ động và đưa ra chỉ dẫn để tránh các vật cản động [23]giới thiệu NHNA (New Hybrid Navigation Algorithm), gồm lớp hoạch định chủđộng và lớp phản ứng hành vi Trong đó đường tham chiếu được tạo ra bởi thuậttoán A*, DHB (Distance Histogram bug) là thuật toán phản ứng hành vi được
sử dụng [24] cũng đề xuất HNA (Hybrid Navigation algorithm with roamingtrails) nhưng với APF được sử dụng trong lớp reactive [25] cũng đề xuất hệthống lai tương tự với NHNA và HNA, nhưng WSM (Weight Sum Model) là
Trang 26Luận Văn Thạc Sĩ 11 CHƯƠNG 1 MỞ ĐẦU
thuật toán phản ứng hành vi được sử dụng để giải bài toán tối ưu đa mục tiêu.Bên cạnh những nghiên cứu này, còn rất nghiên cứu về hệ thống lai như [26], [27]
1.4 Mục tiêu và nội dung nghiên cứu
Như đã đề cập trong mục 1.3, tất cả các tàu thuyền tham gia giao thông trênbiển đều phải COLREGs, làm cho tàu COLREGs trở nên phổ biến và có hành
vi dễ dự đoán Việc áp dụng phương pháp hoạch định hoạch định chủ động để
xử lý tránh va chạm với các loại tàu này có thể mang lại nhiều lợi ích khác nhaunhư tiết kiệm thời gian, năng lượng, có thể kiểm soát quỹ đạo Tuy nhiên, khi
số lượng tàu COLREGs tăng lên hay có sự tham gia của tàu phi COLREGs,phương pháp hoạch định chủ động sẽ gặp nhiều khó khăn hoặc thậm chí khôngthể giải quyết được Trong những tình huống này thì các giải thuật phản ứnghành vi lại là phương án tốt vì lúc này việc giữ an toàn nên được ưu tiên hơnviệc tối ưu chất lượng Từ nhưng quan sát trên, luận văn này đề xuất hệ thốngtránh va chạm hai chế độ (DMCAS) được xây dựng dựa trên kiến trúc của hệthống lai, gồm: chế độ hoạch định chủ động để xử lý các tàu COLREGs, và chế
độ phản ứng hành vi để xử lý các trường hợp phức tạp hơn Với thiết kế này,DMCAS có thể khai thác tối đa luật COLREGs để đạt được hiệu suất cao khitránh va chạm tàu COLREGs, trong khi vẫn luôn giữ an toàn trong các tìnhhuống phức tạp hơn Để xây dựng được DMCAS thỏa mãn các mục tiêu này,các nội dung nghiên cứu chi tiết của đề tài này như sau:
• Đề xuất phương pháp xây dựng “vùng êlip xâm phạm” (threat ellipse TE) cho phép biến đổi bài toán tránh vật cản động thành tránh vật cảntĩnh với các đối tượng là tàu tuân thủ luật COLREGs
-• Đề xuất phương pháp xây dựng một quỹ đạo tránh vật cản dựa trên TE
có tên là quỹ đạo độ cong liên tục theo ê-lip (Ellipse-bases Continuous Trajectory - ECCT)
Curvature-Luận Văn Thạc Sĩ HV: Phan Minh Tâm 11
Trang 27• Phát triển giải thuật tránh vật cản cho trường hợp đa vật cản bằng cách sửdụng tính chất tĩnh của TE.
• Phát triển giải thuật tránh vật cản cho trường hợp vật cản không tuân thủCOLREGs bằng cách tích hợp threat ellipse vào trường thế của APF
• Thiết kế bộ điều khiển và giải thuật điều hướng để điều khiển USV bámtheo quỹ đạo tránh va chạm
Trang 28Chương 2
CƠ SỞ LÝ THUYẾT
2.1 Mô hình toán USV
2.1.1 Mô hình động học của USV
Các hệ quy chiếu
Hệ quy chiếu với trái đất là trung tâm: Có 2 loại
ECI (The Earth-centered inertial): Là một hệ quy chiếu quán tính cho điềuhướng trên mặt đất, nó là hệ quy chiếu mà trong đó các luật của Newton được
áp dụng để tính toán, ký hiệu là {i} Gốc của {i} thì nằm tại tâm o i của tráiđất cùng với các trục được biễu diễn trong hình 2.1
ECEF (The Earth-centered Earth-fixed): Là một bản chỉnh sửa của ECI Đây là
hệ quy chiếu xem trái đất là cố định (không xoay) Ký hiệu là {e} Gốc của {e}vẫn nằm tại tâm của trái đất, nhưng trục của nó xoay lệch đi so với ECI Trong
đó tỷ góc quay là ω e = 7.2921x10−5 rad/s Đối với các tàu di chuyển chậm thì
ta có thể bỏ qua chuyển động quay của trái đất do đó có thể xem {e} như là{i} Hệ tọa độ {e} thường được sử dụng trong định vị, dẫn đường và điều khiểntoàn cầu
Hệ quy chiếu địa lý: Cũng có 2 loại
NED (North-East-Down): Là hệ tọa độ với tâm là o n được định nghĩa dựa vào
13
Trang 29dạng ellip của trái đất Nó là hệ tọa độ chúng ta đề cập trong cuộc sống hàngngày Thường thì NED được định nghĩa là một mặt phẳng tiếp tuyến với bềmặt của trái đất, ký hiệu {n} Trong hệ tọa độ này trục x của nó sẽ hướng vềphía Bắc còn trục y sẽ hướng về phía Đông và trục z sẽ hướng xuống vuông gócvới mặt phẳng tiếp tuyến với bề mặt trái đất Vị trí của {n} so với {e} sẽ được
xác định qua hai góc l và µ biễu thị tương ứng cho kinh độ và vĩ độ Đối với các
tàu hoạt động trong một vùng địa lý cố định thì kinh độ và vĩ độ có thể đượcxem là xấp xỉ không đổi Khi đó một mặt phẳng tiếp tuyến với trái đất cố định(không xoay) được sử dụng để định vị và được ký hiệu là {n} sẽ có thể giả sử
là quán tính và các luật Newton có thể áp dụng được
BODY: Ký hiệu là {b} với gốc o b là một hệ tọa độ di chuyển gắn với cố định
Hình 2.1: Hệ quy chiếu ECEF ¶e♢ = (x e , y e , z e ) xoay với một tỷ góc ω e so với hệ quy
chiếu ECI ¶i♢ = (x i , y i , z i).
với tàu Vị trí và hướng của tàu thì được mô tả tương ứng trong hệ quy chiếuquán tính (xấp sẽ {e} hoặc {n}) trong khi đó vận tốc góc và vận tốc tuyến tính
của tàu nên được thể hiện trong hệ tọa độ BODY này Gốc o b thường được chọntrùng với điểm giữa thuyền trong đường nổi trên mặt nước Với tàu thì các trục
Trang 30Luận Văn Thạc Sĩ 15 CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
x b , y b và z b được chọn trùng với trục chính của quán tính, và thường được địnhnghĩa như sau:
+ x b - trục theo chiều dọc (hướng từ phía sau đến trước)
+ y b- trục hoành (hướng từ bên trái sang bên phải)
+ z b - trục thường (hường từ trên xuống dưới)
2.1.2 Mô hình động lực học
Chuyển động của một vật thể trong không gian có thể mô tả một cách tổngquát bằng 6 bậc tự do (6 DOF) Các giá trị x, y và z sẽ mô tả vị trí trong không
gian 3 chiều và các góc roll, pitch, và yaw ϕ, θ, ψ sẽ mô tả hướng của con tàu.
Giả sử rằng con tàu đang nằm ngang ổn định không bị nghiêng (đặc biệt là chocác loại tàu hai thân có tính ổn định cao khi di chuyển) thì ta có thể xem gócroll, pitch xấp xỉ bằng không nên ta có thể loại bỏ Tương tự với độ nổi của contàu ta xem không đổi nên ta có thể bỏ qua giá trị z Như vậy mô hình chuyểnđộng của tàu trên mặt nước có thể rút gọn thành 3 DOF Ta có mô hình độnglực học 3 DOF được rút gọn từ mô hình tổng quát 6 DOF của (Fossen, 2002)[28] như sau:
hệ tọa độ NED như là vị trí ECEF nên η = [x, y, ψ] T
+ υ = [u, v, r] T trong hệ tọa độ BODY
+ τ ex là ngoại lực từ môi trường tác động vào tàu ví dụ như gió, dòng chảy,
Luận Văn Thạc Sĩ HV: Phan Minh Tâm 15
Trang 31+ τ = [τ1, τ2, τ3] T = Bα: B là ma trận điều khiển, α là tín hiệu điều khiển.
Với các đặc tính riêng biệt của tàu, cách bố trí thiết bị đẩy, mà ta sẽ có
ma trận B khác nhau Trong các phần mô phỏng ở các chương sau ta xéttàu có đặc tính chỉ sẽ tác động lực theo đẩy phương thẳng và momen xoay
tức là τ1 và τ3, nhưng để tổng quát khi có thành phần τ3 thường sẽ tạo ra
τ2 nên ta có thể viết lại với A là hệ số tỉ lệ
Trang 32Luận Văn Thạc Sĩ 17 CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Hình 2.2: Mô hình USV 3-DOF được biểu diễn trong mặt phẳng ngang.
2.1.3 Tác động của dòng chảy:
Dòng chảy trên đại dương có thể được phân làm hai loại chính là dòng chảyxoắn và dòng chảy không xoắn, tuy nhiên trong các bài toán thiết kế điều khiểnngười ta thường giả sử rằng dòng chảy là không xoắn Ta xét dòng chảy trên bềmặt trong hệ NED như sau:
c = [u c , v c]T là vận tốc dòng chảy trong hệ BODY Theo [28] mô hình toán
(2.3) có thể được viết lại theo vận tốc tương đối so với chất lưu ϑ r = [u r , v r , r] =
Luận Văn Thạc Sĩ HV: Phan Minh Tâm 17
Trang 33[u, v, r] T − [u c , v c ,0]T như sau:
Trang 34Luận Văn Thạc Sĩ 19 CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
2.2 Trường thế nhân tạo
Trường thế nhân tạo (hay Artificial Potential Field - APF) là một giải thuậttránh va chạm khá phổ biển bới tính đơn giản và hiệu quả của nó APF lần đầutiên được đề xuất bởi Khatib [17] vào năm 1985, trong đó một trường thế ảođược đặt tại vị trí của vật cản (2.9), giá trị thế năng càng lớn khi càng tiến gầnvật cản, và một trường thế khác được đặt tại vị trí điểm đích (2.10), giá trị thếnăng càng giảm khi càng tiến điểm đích
trong đó η, ε là các hệ số dương, ρ, ρ0 lần lượt là khoảng cách Euclidean từ
robot đến vật cản và điểm đích, ρ0 là vùng ảnh hưởng của U rep Để tránh va
Hình 2.3: Minh họa trường thế của APF.
chạm với vật cản và đi đến điểm đích, thì robot chỉ cần đi theo hướng thế năng
Luận Văn Thạc Sĩ HV: Phan Minh Tâm 19
Trang 35giảm hay đi theo các lực ảo sau.
với ⃗n os , ⃗n sg lần lượt là vector đơn vị hướng từ vật cản đến robot và vector đơn
vị hướng từ robot đến điểm đích
lý và pháp lý đã được đảm bảo bởi IMO; hành động tránh vật cản của USV dễnhận biết bởi các tàu tuân thủ COLREGs khác nên thuận lợi phối hợp cùngtránh va chạm Do đó COLREGs nên tích hợp trong giải thuật tránh vật cảncho USV
Trong luận văn này, chỉ có Phần B của COLREGs gồm luật 13 đến 17 liên quanviệc lái tàu trên biển được xét tới Luật 13, 14 và 14 định nghĩa ba tình huống
va chạm cơ bản bao gồm: đối đầu (head-on), vượt (overtaking) và băng ngang(crossing) được nhận ra nhờ kinh nghiệm thay vì nhờ đo đạc hay các tiêu chí
cụ thể nào Để cải thiện sự hiệu quả của hệ thống ra quyết định của USV thì
một đại lượng định lượng được tính toán từ θ OS - hướng của OS (Own Ship Ê
thuyền thực hiện hành vi tránh vật cản) và θ T S- hướng của TS (Target Ship Ê
thuyền đóng vai trò là vật cản) như công thức ∆θ = θ T S − θ OS được chuẩn hóa
về miền [0o ,360o) và được chia làm 4 miền nhỏ tương ứng với từng tình huống
Trang 36Luận Văn Thạc Sĩ 21 CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
Hình 2.4: Minh họa các tình huống va chạm: đối đầu, vượt, băng ngang.
va chạm khác nhau như hình 2.4
Luật 16 và 17 liên quan đến trách nhiệm của tàu nhường đường (give-way) vàtàu được nhường đường (stand-on)trong mỗi tình huống Cụ thể là, tàu nhườngđường phải rời khỏi đường hiện tại và tránh xa khỏi tàu được nhường đường,mỗi hành vi tránh né của tàu nhường đường phải rõ ràng và dễ nhận biết Dựavào từng tình huống mà tàu give-way chọn bên mạn tàu thích hợp để vượt qua(như hình 2.5) Trong khi đó, tàu được nhường đường phải giữ nguyên tốc độ
và hướng trong suốt cả quá trình tránh va chạm Luật này là cơ sở quan trọng
để xây dựng thuật toán tránh vật cản
Luận Văn Thạc Sĩ HV: Phan Minh Tâm 21
Trang 37Hình 2.5: Sự điều động của tàu không ưu tiên trong ba tình huống.
Trang 38Chương 3
HỆ THỐNG TRÒNH VA CHẠM
23
Trang 39và chế độ phản ứng hành vi, được kích hoạt trong các tình huống cụ thể để tối
ưu hiệu suất của hệ thống Đầu tiên, chế độ hoạch định chủ động là chế độ mặcđịnh của hệ thống, được kích hoạt khi đối mặt với những vật cản tĩnh biết trước(được cung cấp bởi bản đồ) hoặc một tàu COLREGs Trong chế độ này, mộtđường đi toàn cục được hoạch định để giúp USV thực hiện một số nhiệm vụnhất định cũng như tránh né các vật cản tĩnh trên đường đi như đảo, rạng san
hô, khu vực cấm Trong quá trình di chuyển trên đường đi toàn cục, nếu USV
có nguy cơ va chạm với một tàu COLREGs thì một phần đường đi toàn cụcgần vị trí sẽ xảy ra va chạm được thay thế bằng đoạn quỹ đạo tránh va chạm
an toàn và tối ưu được hoạch định bởi khối ECCT Nếu tình huống va chạm làvới những tàu có quỹ đạo không thể dự đoán, thì việc hoạch định và tối ưu quỹđạo trở nên bất khả thi, do đó chế độ phản ứng hành vi được kích hoạt để phảnứng lại sự thay đổi của những con tàu này và đảm bảo an toàn cho USV Thuậttoán tránh va chạm được sử dụng trong cả hai chế độ đều được đều được thiết
kế dựa trên TE, là một khái niệm mới được đề cập trong mục tiếp theo.Ngoài
ra, bộ điều hướng cũng được thiết kế sao cho USV có thể bám theo quỹ đạotránh va chạm với sai số bám luôn trong vùng quy định trước
3.2 Vùng ê-líp xâm hại (TE)
Trong hầu hết bài toán bám đường USV được điều khiển bám theo đường đặtvới vận tốc không đổi Do đó, giả thiết sau đây là phù hợp
Giả thiết 1: Giả sử USV bám đường đi toàn cục với vận tốc không đổi.
Để đơn giản hóa, ta giả sử đường đi toàn cục được hoạch định dọc theo trục x.Như vậy, ta có quỹ đạo dự đoán theo thời gian của USV như sau:
Trang 40Luận Văn Thạc Sĩ 25 CHƯƠNG 3 HỆ THỐNG TRÒNH VA CHẠM
(i) Các vật cản được xấp xỉ bởi các hình tròn với bán kính R oi phụ thuộc vàokích thước của vật cản Chuyển động của vật cản được biểu diễn thông qua
Giả thiết 3: Bán kính hoạt động của hệ thống phát hiện vật cản đủ lớn để đảm
bảo hệ thống tránh va chạm có đủ thời để dự đoán chuyển động và hoạch địnhquỹ đạo tránh va chạm khi khối ECCT được kích hoạt
Xét vùng nguy hiểm là tập hợp tất cả vị trí dự đoán của OS theo thời gian mà
làm cho khoảng cách giữa OS và TS nhỏ hơn bán kính an toàn R s như địnhnghĩa (3.3)
S HA = n(x p (t), y p (t)) ♣ (x p (t) − x o (t))2+ (y p (t) − y o (t))2 < R2so (3.3)
trong đó R s = R usv + R o , R usv là bán kính an toàn của USV
Đường biên của S HA được tách ra từ (3.3):
(x p (t) − x o (t))2 + (y p (t) − y o (t))2 < R2s (3.4)Thay (3.2) vào (3.4) ta được:
E (x p , y p ) = C xx x2p (t) + 2C xy x p (t)y p (t) + C yy y p2(t) + 2C x x p (t) + 2C y y p (t) + C0 = 0
(3.5)
Luận Văn Thạc Sĩ HV: Phan Minh Tâm 25