Danh mục các chữ viết tắtviết tắt 1 AA Aggregration Algorithm Thuật toán tập hợp bầy robot 2 ACC Algebraic Connectivity Control Điều khiển kết nối đại số 4 BC Behavior based Control Điều
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Phạm Duy Hưng
PHÁT TRIỂN THUẬT TOÁN TỰ TRIỂN KHAI
CHO HỆ THỐNG ĐA ROBOT GIÁM SÁT MÔI TRƯỜNG
KHÔNG BIẾT TRƯỚC
Chuyên ngành: Kỹ thuật Điện tử
Trang 2LỜI CAM ĐOAN
Tôi xin cam đoan luận án này là công trình nghiên cứu của tôi dưới sự hướngdẫn của PGS.TS Trần Quang Vinh và PGS TS Ngô Trung Dũng, chưa được xuấtbản tại bất kỳ nơi nào Mọi nguồn thông tin tham khảo sử dụng trong luận án đềuđược trích dẫn đầy đủ
Tác giả
Phạm Duy Hưng
Trang 3LỜI CẢM ƠN
Lời đầu tiên, tôi xin gửi lời cảm ơn sâu sắc đến PGS.TS Trần Quang Vinh vàPGS.TS Ngô Trung Dũng đã trực tiếp hướng dẫn, hỗ trợ và động viên tôi trongsuốt quá trình nghiên cứu Tôi xin cảm ơn Phòng thí nghiệm More-Than-OneRobotics1 của PGS.TS Ngô Trung Dũng đã hỗ trợ cơ sở vật chất, trang thiết bị vàcác điều kiện cần thiết để tôi thực hiện các thí nghiệm thực nghiệm trên hệ thốngrobot thật
Tôi xin gửi lời cảm ơn chân thành tới Ban giám hiệu Trường Đại học Côngnghệ và các thầy/cô của khoa Điện tử - Viễn thông đã hỗ trợ, tạo điều kiện vàđộng viên tôi rất nhiều trong thời gian thực hiện luận án
Cuối cùng, tôi xin gửi lời cảm ơn tới những người thân yêu trong gia đình đãluôn sát cánh, hỗ trợ, chia sẻ và động viên để tôi hoàn thành luận án này
1 Phòng thí nghiệm More-Than-One Robotics (http://www.morelab.org) thuộc University of Brunei Darussalam, Brunei giai đoạn 2011-2016, thuộc University of Prince Edward Island, Canada từ 2017 đến nay.
iii
Trang 4MỤC LỤC
Trang phụ bìa i
Lời cam đoan ii
Lời cảm ơn iii
Danh mục các ký hiệu và chữ viết tắt vi
Danh mục bảng ix
Danh mục các hình vẽ, đồ thị x
Mở đầu xii
Chương 1 TỔNG QUAN VỀ HỆ THỐNG ĐA ROBOT 1
1.1 Giới thiệu 1
1.2 Điều khiển phân tán hệ thống đa robot 5
1.2.1 Điều khiển dựa trên hành vi 5
1.2.2 Trường lực thế nhân tạo 7
1.2.3 Điều khiển kết nối đại số 10
1.3 Tự triển khai hệ thống đa robot 13
1.3.1 Theo dõi đa mục tiêu 13
1.3.2 Bao phủ 17
1.4 Kết luận chương 24
Chương 2 ĐIỀU KHIỂN PHÂN TÁN ĐA TẦNG HDC CHO DUY TRÌ VÀ MỞ RỘNG MẠNG ĐA ROBOT 25
2.1 Mô hình hệ thống 25
2.2 Duy trì mạng đa robot 30
2.3 Tối ưu kết nối, mở rộng mạng 33
Trang 52.4 Điều khiển phân tán đa tầng 37
2.4.1 Điều khiển nút 38
2.4.2 Điều khiển kết nối 41
2.5 Độ phức tạp và tính ổn định của HDC 43
2.5.1 Độ phức tạp 43
2.5.2 Tính ổn định 45
2.6 Kết luận chương 47
Chương 3 ỨNG DỤNG HDC CHO TRIỂN KHAI HỆ THỐNG ĐA ROBOT THEO DÕI ĐA MỤC TIÊU VÀ BAO PHỦ 48
3.1 Bài toán theo dõi đa mục tiêu 51
3.1.1 Đám mây đích liên thông 51
3.1.2 Phát hiện và phân loại biên của mạng đa robot 55
3.1.3 Đám mây đích không liên thông 62
3.1.4 Kết quả thí nghiệm và thảo luận 64
3.2 Bài toán bao phủ 79
3.2.1 Quy tắc tạo đỉnh ảo 83
3.2.2 Điều khiển bao phủ 85
3.2.3 Kết quả thí nghiệm và thảo luận 88
3.3 Kết luận chương 92
Chương 4 ỨNG DỤNG HDC CHO TRIỂN KHAI HỆ THỐNG ĐA ROBOT KHÁM PHÁ MÔI TRƯỜNG CÓ CẤU TRÚC 94
4.1 Chiến lược triển khai các robot đồng nhất 95
4.2 Chiến lược triển khai robot mẹ, con 96
4.3 Kết quả thí nghiệm và thảo luận 98
4.3.1 Mô phỏng 98
4.3.2 Thực nghiệm 106
4.3.3 Thảo luận 106
4.4 Kết luận chương 108
KẾT LUẬN 109
v
Trang 6DANH MỤC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUANĐẾN LUẬN ÁN 112
TÀI LIỆU THAM KHẢO 113
Trang 7DANH MỤC CÁC KÝ HIỆU
VÀ CHỮ VIẾT TẮT
Danh mục các ký hiệu
2 ∆x i Bước chạy của robot i trong khoảng thời gian ∆t
5 Sai Vùng tránh vật cản của robot i
6 Sci Vùng tới hạn của robot i
7 Sni Vùng không tới hạn của robot i
9 ε, ε i Dung sai tới hạn và dung sai tối thiểu
i Tập các robot không tới hạn của robot i
14 Nig Tập các robot thuộc cấu trúc LCT
15 λ 2 Thuộc tính kết nối của mạng đa robot
16 − →vi Véctơ vận tốc tổng hợp của roboti
i Véctơ vận tốc thành phần phân chia của robot i
20 ` I ij Chiều dài liên kết nối giữa robot i và j
22 d i Đích được phân công cho robot i nằm trong vùng S i
23 e ij Cạnh kết nối giữa robot i và j
24 rij Khoảng cách tương đối giữa robot i và j
25 Ti Nhóm cấu trúc tam giác của robot i
26 K i Nhóm cấu trúc k-kết nối của robot i
27 Rn i Tập các robot tới hạn dư thừa của robot i
28 Rn T
i Tập các robot tới hạn dư thừa trong nhóm T i
29 Rn K
i Tập các robot tới hạn dư thừa trong nhóm K i
30 v max Vận tốc cực đại của robot i
31 α, β, γ Hệ số hiệu chỉnh hành vi tương ứng với − →vc
Trang 8Danh mục các chữ viết tắt
viết tắt
1 AA Aggregration Algorithm Thuật toán tập hợp bầy robot
2 ACC Algebraic Connectivity Control Điều khiển kết nối đại số
4 BC Behavior based Control Điều khiển dựa trên hành vi
5 BEC Boundary Error Correction Sửa lỗi biên
6 CDI Cumulative Distance Information Thông tin khoảng cách tích lũy
7 DAR Distance-Aware Routing Định tuyến theo khoảng cách
8 DCC Distributed Coverage Control Điều khiển bao phủ phân tán
9 DSHR Deployment Strategy for
12 FILO First In Last Out Vào trước, ra sau
13 HDC Hierarchical Distributed Control Điều khiển phân tán đa tầng
14 INMC In Network Mobility Control Điều khiển di chuyển nội mạng
15 LCT Local Connectivity Topology Cấu trúc kết nối cục bộ LCT
16 MANET Mobile Ad-hoc Network Mạng Ad-hoc di động
17 MRS Multi-Robot System Hệ thống đa robot
18 MTT Multi-Target Tracking Theo dõi đa mục tiêu
19 MWSN Mobile Wireless Sensor Network Mạng cảm biến không dây di
động
20 NSB Null Space Behavioral control Điều khiển hành vi không gian
Null
24 VTG Virtual Target Generation Tạo đích ảo
Trang 9DANH MỤC CÁC BẢNG
3.1 Tham số điều khiển cho MRS 67
3.2 So sánh các phương pháp điều khiển phân tán MRS 78
4.1 Thời gian pha dịch chuyển của DSHR và DSNR 105
4.2 Thời gian pha phân tán và tập hợp của DSHR và DSNR 105
ix
Trang 10DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
1.1 Mô hình điều khiển hành vi của Reynolds 5
1.2 Trường lực thế nhân tạo APF 8
1.3 Ước ượng λ2 theo kiểu phân tán 11
1.4 Triển khai bao phủ sử dụng phân vùng Voronoi 18
1.5 Triển khai bao phủ sử dụng lưới tam giác 20
1.6 Triển khai bao phủ sử dụng APF 22
2.1 Vùng cảm nhận của robot 26
2.2 Hệ thống đa robot được mô hình hóa bởi đồ thị vô hướng 27
2.3 Thuật toán định tuyến dựa trên nhận thức khoảng cách DAR trong mạng Ad-hoc di động 28
2.4 Phân loại các robot trong tập robot hàng xóm 30
2.5 Biến đổi của khoảng cách tương đối sau 1 chu kỳ lệnh ∆t 31
2.6 Cấu trúc kết nối cục bộ LCT 34
2.7 Chiến lược tinh giản cấu trúc kết nối cục bộ LCT 36
2.8 Sơ đồ khối điều khiển phân tán đa tầng HDC 38
2.9 Trường tương tác của robot 39
2.10 Hệ số liên kết bầy Υ 40
2.11 Vùng tự do không chịu tác động bởi thành phần vận tốc liên kết 40
2.12 Hàm Lyapunov của HDC 45
3.1 Các dạng phân bố đích 49
3.2 MRS tạo vùng bao phủ cấu trúc lưới lục giác 49
3.3 Các loại cấu trúc lưới 50
3.4 Lưu đồ thuật toán theo dõi đa mục tiêu 51
Trang 113.5 Di chuyển nội mạng 54
3.6 Phân loại nút dựa trên trạng thái cung 56
3.7 Nút biên lỗi 57
3.8 Cung khuyết nằm trong cấu trúc tứ giác 58
3.9 Tập Nij và Nik 58
3.10 Kịch bản hình thành cung tam giác mở rộng 59
3.11 Phân loại đường biên 61
3.12 Lưu đồ thuật toán chiến lược theo dõi đa mục tiêu mở rộng 63
3.13 Quy tắc tạo kịch bản mô phỏng 65
3.14 Độ phức tạp của kịch bản 65
3.15 Mô hình robot hai bánh vi sai 66
3.16 Tỷ lệ chiếm đích thành công của MRS 68
3.17 Thuộc tính kết nối của mạng MRS trong các thí nghiệm mô phỏng 69
3.18 Tốc độ chiếm đích thành công 69
3.19 Độ phức tạp của HDC 70
3.20 Robot di động được sử dụng trong thực nghiệm 71
3.21 Hệ thí nghiệm cùng các robot thật 72
3.22 Thí nghiệm 4 robot chiếm đóng 4 đích liên thông 73
3.23 Thí nghiệm 6 robot chiếm đóng 6 đích liên thông 74
3.24 Thí nghiệm 14 robot chiếm đóng 14 đích liên thông 74
3.25 Thí nghiệm 9 robot chiếm đóng 2 đám mây đích không liên thông 75
3.26 Thí nghiệm 11 robot chiếm đóng 3 đám mây đích không liên thông 75
3.27 Thí nghiệm 5 robot chiếm đóng 20 đích phân bố liên thông 76
3.28 Kết quả so sánh mô phỏng và thực nghiệm cùng 6 robot 76
3.29 Thuộc tính kết nối của mạng MRS trong các thí nghiệm thực nghiệm theo dõi đa mục tiêu 77
3.30 Cặp nút biên kề của robot i 81
3.31 Vùng bao phủ của MRS 82
3.32 Quy tắc tạo đích ảo 83
3.33 Lưu đồ thuật toán chiến lược bao phủ 85
3.34 Quá trình triển khai tạo lưới bao phủ lục giác 89
3.35 Lưới bao phủ lục giác được tạo bởi các robot trong môi trường tự do 90
xi
Trang 123.36 Lưới bao phủ lục giác được tạo bởi các robot trong môi trường có
cấu trúc giống căn phòng 91
3.37 Thuộc tính kết nối của mạng MRS trong các thí nghiệm thực nghiệm bao phủ lưới lục giác 91
4.1 Mô hình môi trường có cấu trúc 94
4.2 Chiến lược DSHR cho môi trường có cấu trúc 95
4.3 Chiến lược DSNR cho môi trường có cấu trúc 97
4.4 Quỹ đạo chuyển động theo bầy của 10 robot 99
4.5 Thông số đặc trưng của chuyển động theo bầy cùng 10 robot trong trường hợp không vật cản 100
4.6 Thông số đặc trưng của chuyển động theo bầy cùng 10 robot trong trường hợp có vật cản 100
4.7 Tốc độ hội tụ tới trạng thái cân bằng của MRS gồm 10 robot 100
4.8 Tiến trình triển khai của DSHR 102
4.9 Tiến trình triển khai của DSNR 104
4.10 Thuộc tính kết nối mạng MRS trong quá trình triển khai 104
4.11 So sánh thời gian triển khai của chiến lược DSHR và DSNR 105
4.12 DSHR cùng 13 robot thật 106
4.13 Thuộc tính kết nối mạng MRS trong thí nghiệm DSHR cùng 13 robot thật 107
Trang 13hệ thống đa robot, viết tắt là MRS (Multi-Robot System), là lĩnh vực mới, có tínhcấp thiết để giải quyết các nhiệm vụ có quy mô lớn mà một robot khó đạt hiệuquả như tuần tra và giám sát (patrol and surveillance), tìm kiếm và cứu hộ (searchand rescue), vận chuyển trong kho hàng (transportation in warehouse),
MRS còn được gọi là robot bầy đàn gồm nhiều robot hoạt động tự trị tươngtác, hợp tác với nhau cùng thực hiện nhiệm vụ Nhờ hoạt động phối hợp mà MRSđạt hiệu suất cao hơn, giải quyết được những nhiệm vụ phức tạp hơn so với trườnghợp chỉ sử dụng một robot đơn
Có nhiều chủ đề nghiên cứu về MRS trong đó vấn đề điều khiển đồng thời sốlượng lớn các robot di động tự triển khai vào môi trường và phối hợp hoạt độnggiữa chúng dựa trên trao đổi thông tin là chủ đề mang tính thời sự, có ý nghĩakhoa học và thực tiễn cao, có tiềm năng ứng dụng cho các hoạt động theo dõi đamục tiêu, bao phủ giám sát môi trường phục vụ an ninh, quốc phòng và tìm kiếm,cứu hộ
Trên thế giới các nghiên cứu về chủ đề này đã và đang được các nhà nghiêncứu về hệ thống đa robot quan tâm thực hiện Ở Việt Nam, nghiên cứu về robotđược bắt đầu từ nhiều năm nay nhưng các nghiên cứu về hệ thống đa robot chỉ mớibắt đầu trong một vài năm trở lại đây ở một vài trường đại học, cơ quan nghiêncứu với số công trình công bố còn rất khiêm tốn, chưa có nghiên cứu nào có mụctiêu tương tự luận án này
Mục đích nghiên cứu: Luận án này nghiên cứu phát triển thuật toán tựtriển khai (Self-Deployment) MRS cho giám sát môi trường không biết trước Tự
xiii
Trang 14triển khai được hiểu là việc điều khiển phân tán bầy robot nhằm trải rộng chúng
ra môi trường cho mục đích giám sát cụ thể như theo dõi đa mục tiêu và bao phủ.Đặc trưng điển hình của MRS là phối hợp hoạt động trên nền tảng mạng truyềnthông giữa các robot cho phép chúng có thể trao đổi thông tin với nhau để phâncông nhiệm vụ Vì vậy, điều khiển chuyển động của robot được đặt trong ràng buộcphải luôn đảm bảo duy trì sự toàn vẹn của mạng trong suốt quá trình triển khai.Luận án có các mục tiêu cụ thể như sau:
• Nghiên cứu điều khiển MRS đảm bảo duy trì sự toàn vẹn của mạng cho hoạtđộng phối hợp giữa các robot trong khi thực hiện nhiệm vụ Mạng có khảnăng mở rộng vùng bao phủ, thích nghi với môi trường không biết trước
• Nghiên cứu chiến lược tự triển khai MRS theo dõi đa mục tiêu và bao phủ.Chiến lược triển khai kết hợp hoạt động phân nhiệm dựa trên trao đổi thôngtin giữa các robot và điều khiển chuyển động của robot để thực thi nhiệm vụ
Đối tượng nghiên cứu: Luận án thực hiện các nhiệm vụ nghiên cứu về điềukhiển duy trì sự toàn vẹn của mạng đa robot và chiến lược tự triển khai MRS chotheo dõi đa mục tiêu và bao phủ trên đối tượng là các robot di động hoạt động tựtrị trong không gian hai chiều
Phạm vi nghiên cứu: Luận án được giới hạn nghiên cứu trong điều khiểnphân tán, ở đó các robot tính toán và ra quyết định điều khiển dựa trên thông tincục bộ từ các robot hàng xóm trong vùng cảm nhận của chúng Chuyển động củarobot được xem xét trên mô hình động học, không tính đến các đặc trưng độnglực học, cũng như ảnh hưởng của nhiễu Luận án tập trung xem xét vấn đề điềukhiển duy trì sự toàn vẹn của mạng đa robot và chiến lược tự triển khai MRS chomục đích giám sát môi trường, cụ thể là theo dõi đa mục tiêu và bao phủ Luận
án không nghiên cứu về vấn đề thu thập, phân tích thông số môi trường
MRS được xem là hệ thống của hệ thống chứa đựng nhiều vấn đề phức tạp
đã và đang được quan tâm nghiên cứu, giải quyết như hệ thống cảm biến và tổnghợp dữ liệu cảm biến để nhận biết và hiểu về môi trường xung quanh; định vị vàdẫn đường cho các robot; đảm bảo độ tin cậy truyền thông trong mạng đa robot, Các vấn đề này không thuộc phạm vi nghiên cứu của luận án Để không ảnh hưởngđến mục tiêu nghiên cứu, luận án giả thiết các robot có vùng cảm nhận và truyềnthông hình đĩa tròn, có khả năng xác định và phân biệt các robot và vật cản/mụctiêu trong vùng cảm nhận, có khả năng trao đổi thông tin với các robot hàng xómtrong vùng truyền thông với độ tin cậy cao và độ trễ truyền không đáng kể Đây
Trang 15là các giả thiết đang được sử dụng rộng rãi trong các nghiên cứu về MRS và mạngcảm nhận không dây di động MWSN (Mobile Wireless Sensor Network).
Phương pháp nghiên cứu: Luận án kết hợp giữa nghiên cứu lý thuyết, môhình hóa, mô phỏng và thực nghiệm Nghiên cứu lý thuyết sử dụng lý thuyết đồthị kết hợp với lý thuyết điều khiển để đề xuất mô hình, kỹ thuật điều khiển choduy trì, mở rộng mạng đa robot dựa trên cấu trúc hình học kết nối cục bộ giữa cácrobot và chiến lược triển khai MRS để theo dõi đa mục tiêu và bao phủ Mô phỏngđược thực hiện trên phần mềm Matlab để kiểm chứng mô hình, các kỹ thuật điềukhiển, triển khai trên quy mô lớn (về số lượng robot, kịch bản làm việc, ) Thựcnghiệm trên hệ thống robot di động thật nhằm đánh giá khả năng hoạt động củacác đề xuất trong thế giới thực Thí nghiệm được thực hiện ở môi trường trongnhà cùng sự hỗ trợ của hệ thống định vị giúp các robot có thể nhận thức được cácđối tượng xung quanh như robot, vật cản, mục tiêu trong vùng cảm nhận
Những đóng góp của luận án: Luận án hoàn thành các mục tiêu nghiêncứu và có 3 đóng góp mới như sau:
• Đề xuất một phương pháp mới có tên là điều khiển phân tán đa tầng, viếttắt là HDC (Hierarchical Distributed Control), cho duy trì sự toàn vẹn mạngtoàn cục của MRS HDC gồm điều khiển nút để điều khiển chuyển động củarobot và duy trì mạng toàn cục, và điều khiển kết nối để mở rộng vùng baophủ mạng HDC dựa trên tiếp cận hình học xem xét cấu trúc hình học cáckết nối cục bộ giữa các robot vì thế nó không yêu cầu ước lượng kết nối đại
số của đồ thị mạng như các phương pháp đã tồn tại Bên cạnh đó, nhờ vàoviệc tinh giản các cấu trúc kết nối cục bộ, HDC có khả năng giải phóng cácràng buộc của kết nối cục bộ giống như cực tiểu cục bộ, cho phép MRS thuđược hiệu suất cao trong chuyển động theo bầy, theo dõi đa mục tiêu và baophủ Đóng góp này được công bố trong công trình [CT1-CT4],[CT8]
• Đề xuất chiến lược theo dõi đa mục tiêu, viết tắt là MTT (Multi-TargetTracking), sử dụng HDC để triển khai MRS theo dõi đa mục tiêu và bao phủtrong môi trường không biết trước MTT kết hợp thủ tục phân nhiệm dựatrên trao đổi thông tin giữa các robot và điều khiển HDC để thực thi nhiệm
vụ, duy trì mạng Vượt qua các nghiên cứu đã tồn tại, luận án tìm ra rằngbài toán theo dõi đa mục tiêu và bao phủ có đặc điểm chung: các đích chobài toán theo dõi đa mục tiêu giống với các đích ảo của bài toán bao phủ,
vì thế MTT được áp dụng để giải quyết cả hai bài toán Trong bài toán baophủ, luận án đề xuất quy tắc tạo đích ảo VTG (Virtual Target Generation)
xv
Trang 16dựa trên cấu trúc lưới lục giác cho phép MRS bao phủ được môi trường cócấu trúc bất kỳ Đóng góp này công bố trong công trình [CT2-CT5].
• Đề xuất thuật toán phát hiện và phân loại biên cho MRS trong đó sửa lỗibiên được thực hiện bằng tiếp cận hình học Lỗi biên được loại bỏ thông quaxem xét cấu trúc hình học các kết nối cục bộ thay cho quá trình đệ quy vàđồng bộ toàn cục trong thuật toán gốc Luận án tích hợp thuật toán pháthiện biên vào chiến lược MTT để giải quyết bài toán theo dõi đa mục tiêuvới các kịch bản đích phân bố không liên thông Đóng góp này công bố trongcông trình [CT6],[CT7]
Ý nghĩa khoa học và thực tiễn của luận án: Kết quả của luận án có ýnghĩa khoa học trong lĩnh vực nghiên cứu về MRS, có giá trị và độ tin cậy, có tiềmnăng ứng dụng trong tuần tra và giám sát, tìm kiếm và cứu hộ phục vụ an ninh,quốc phòng; vận chuyển trong nhà kho, sân bay, sản xuất quy mô lớn cho đời sống
xã hội
Bố cục luận án: Luận án gồm 4 chương và phần kết luận, cụ thể như sau:
• Chương 1: Trình bày tổng quan tài liệu về MRS; phân tích, đánh giá và biệnluận về các kết quả nghiên cứu trong nước và trên thế giới gần đây liên quanđến điều khiển MRS và chiến lược tự triển khai MRS cho theo dõi đa mụctiêu và bao phủ
• Chương 2: Trình bày lý thuyết đảm bảo duy trì và mở rộng mạng đa robotdựa trên cấu trúc kết nối cục bộ của mạng; áp dụng lý thuyết được đề xuất
để thiết kế bộ điều khiển phân tán đa tầng HDC cho phép điều khiển MRSchuyển động tới mục tiêu trong khi đảm bảo khả năng duy trì sự toàn vẹn và
mở rộng của mạng đa robot theo cấu trúc bất kỳ
• Chương 3: Trình bày chiến lược tự triển khai MRS sử dụng HDC cho theodõi đa mục tiêu và bao phủ trong môi trường không biết trước Chiến lượcMTT được đề xuất để giải quyết bài toán theo dõi đa mục tiêu trong trườnghợp các đích phân bố liên thông và được bổ sung thuật toán phát hiện biên
để giải quyết trường hợp các đích phân bố không liên thông MTT cũng được
sử dụng để phát triển chiến lược triển khai bao phủ với việc bổ sung thêm bộtạo đích ảo cấu trúc lưới lục giác VTG Hiệu quả của HDC và chiến lược tựtriển khai MTT được đánh giá thông qua mô phỏng và thực nghiệm
• Chương 4: Trình bày chiến lược tự triển khai MRS trong môi trường có cấutrúc giống sàn của một tầng nhà gồm nhiều phòng có hành lang chung Mô
Trang 17hình triển khai các robot đồng nhất gồm các robot có đặc tính giống nhau
và mô hình không đồng nhất theo kiểu robot mẹ, con được xem xét, nghiêncứu Chiến lược triển khai kết hợp nhiệm vụ di chuyển theo bầy của MRStrên hành lang và nhiệm vụ triển khai bao phủ, thu hồi robot trong mỗi cănphòng cần khám phá Kết quả mô phỏng và thực nghiệm cho thấy tính thựctiễn và hiệu quả của hai mô hình được đề xuất
Cuối cùng là một số kết luận và các hướng nghiên cứu tiếp theo của luận án.Quá trình thực hiện luận án, nghiên cứu sinh có 03 đợt đi trao đổi nghiêncứu tại phòng thí nghiệm More-Than-One Robotics2 với tổng thời gian 12 tháng.Toàn bộ lý thuyết, mô phỏng và thực nghiệm đều do nghiên cứu sinh thực hiệndưới sự hướng dẫn của PGS.TS Trần Quang Vinh và PGS.TS Ngô Trung Dũng.Phần thực nghiệm có khai thác, sử dụng cơ sở vật chất, trang thiết bị của phòngthí nghiệm More-Than-One Robotics
2 Phòng thí nghiệm More-Than-One Robotics (http://www.morelab.org) thuộc University of Brunei Darussalam, Brunei giai đoạn 2011-2016, thuộc University of Prince Edward Island, Canada từ 2017 đến nay.
xvii
Trang 18về robot nhưng có thể hiểu robot là một loại máy có thể thực hiện được nhữngcông việc một các tự động hoặc bằng điều khiển từ máy tính hoặc vi mạch điện tửđược lập trình Tiêu chuẩn của robot được đánh giá dựa trên khả năng nhận biếtmôi trường; khả năng tương tác với những vật thể trong môi trường, đưa ra cácquyết định dựa trên thông tin từ môi trường; sự thông minh và hoạt động tự trị.Nhiều robot đã đạt đến mức độ hoàn hảo cả về khả năng thực hiện nhiệm vụ và
sự thông minh như robot dạng người ASIMO của Honda, robot khám phá sao hỏaExoMars của ESA, Tuy nhiên, trong thực tế, có nhiều nhiệm vụ sẽ không hiệuquả, thậm chí không thể hoàn thành, nếu chỉ thực hiện bởi một robot như baophủ, giám sát vùng không gian rộng lớn; theo dõi nhiều mục tiêu đồng thời; phốihợp vận chuyển trong kho hàng, nhà máy quy mô lớn; tìm kiếm, cứu nạn hay cácnhiệm vụ có quy mô thay đổi theo thời gian cần tối ưu nguồn lực tham gia nhưnhiệm vụ xử lý rò rỉ dầu sau tai nạn, Các yêu cầu thực tiễn này dẫn đến sự rađời các nghiên cứu về hệ thống đa robot hay còn được gọi là robot bầy đàn
Hệ thống đa robot, viết tắt là MRS (Multi-Robot System), được nhắc đến nhưmột tập hợp số lượng lớn (large-scale) các robot tự trị (autonomy) có khả năngcảm nhận được môi trường xung quanh, tính toán điều khiển và trao đổi thông tinthông qua mạng truyền thông [1] Các robot thường có tính năng hạn chế (limitedcapability), không đạt hiệu quả nếu hoạt động một mình nhưng chúng lại hiệu quảcao khi phối hợp với nhau để cùng thực hiện nhiệm vụ Hoạt động tương tác, hợptác là đặc trưng điển hình của MRS, giúp MRS thu được kết quả nhanh hơn vàđáng tin cậy hơn một robot riêng lẻ MRS có thể đồng nhất (Homogeneous), gồmcác robot hoàn toàn giống nhau, hoặc không đồng nhất (Non-homogeneous), gồm
Trang 19nhiều loại robot có thiết kế, tính năng khác nhau MRS có các đặc tính [2] sau:
• Tính bền vững (Robustness): là khả năng liên kết, hoạt động ổn định của hệthống ngay cả khi mất một vài robot
• Tính linh hoạt (Flexibility): là có khả năng thích nghi với nhiều môi trường,nhiệm vụ khác nhau mà không yêu cầu cấu hình lại hệ thống
• Khả năng mở rộng (Scalability): là khả năng hoạt động với quy mô của bầyrobot khác nhau mà không yêu cầu cấu hình lại hệ thống Đặc tính này đượcnhắc đến như một đặc trưng của điều khiển phân tán, các thuật toán điềukhiển được thiết kế phải hoạt động không phụ thuộc vào quy mô của MRS
Các đặc tính này cho phép MRS đạt hiệu suất và độ tin cậy cao trong cácnhiệm vụ Bên cạnh đó, trong thực tế, có những nhiệm vụ tiềm ẩn nguy hiểm, tainạn xẩy ra với chính robot như các hoạt động khám phá hầm mỏ, tìm kiếm cứunạn, Việc sử dụng MRS gồm nhiều robot có độ phức tạp và chi phí vừa phải làgiải pháp đem lại hiệu quả kinh tế cao so với việc sử dụng một robot có độ phứctạp cao, chi phí chế tạo lớn
Ra đời từ cuối những năm 1980, MRS đã nhận được sự quan tâm lớn từ cộngđồng khoa học trên thế giới bởi tiềm năng phát triển và thách thức của nó Cộngđồng các nhà nghiên cứu về MRS hiện phân chia các hướng nghiên cứu thành 3nhóm chính (tham khảo tại http://www.multirobotsystems.org) như sau:
• Mô hình hóa và điều khiển MRS : nghiên cứu về mô hình động học, động lựchọc, cấu trúc cảm biến và tương tác với môi trường; Điều khiển tối ưu; Kiếntrúc điều khiển tập trung/phân tán và khả năng mở rộng của MRS; Các bàitoán điều khiển như chuyển động bầy đàn, bao phủ, đội hình, MRS phỏngsinh học và trí tuệ bầy đàn
• Lập kế hoạch và cơ chế ra quyết định cho MRS : nghiên cứu về kế hoạch chuyểnđộng và phối hợp trong MRS; Phân nhiệm và hợp tác thực hiện nhiệm vụ;
Cơ chế ra quyết định; Tương tác giữa các robot, giữa robot với môi trường
và với con người; Phối hợp học tập trong bầy robot; Trí tuệ nhân tạo cho các
Trang 20MRS; MRS trong môi trường có cấu trúc (cho hoạt động tìm kiếm, cứu hộ, );MRS cấu trúc mi-crô/na-nô; Đánh giá hiệu suất và đối sánh trong MRS.
Mục tiêu của luận án là nghiên cứu điều khiển phân tán MRS và cơ chế tươngtác, phối hợp giữa các robot cho hoạt động tự triển khai để giám sát môi trườngkhông biết trước Hoạt động phối hợp của các robot được thực hiện thông qua traođổi thông tin nhằm đạt được mục tiêu chung do vậy việc duy trì sự toàn vẹn củamạng cho tất cả các robot theo thời gian là nội dung quan trọng trong nghiên cứunày Một số thuật ngữ sử dụng trong luận án được hiểu như sau:
Tự triển khai (Self-Deployment): là việc các robot tự điều khiển để phân tán
ra, trải ra hay nở ra môi trường cho mục đích giám sát như theo dõi đa mục tiêu
và bao phủ
Giám sát môi trường không biết trước (Unknown Environmental Surveillance):được hiểu và giới hạn trong phạm vi (1) MRS tìm kiếm và theo dõi các mục tiêuphân bố ngẫu nhiên, không biết trước trong môi trường; (2) MRS giám sát môitrường không biết trước thông qua bao phủ vùng cảm nhận của MRS lên nó Yếu
tố không biết trước ở đây được hiểu là các điểm mục tiêu (đối với bài toán theo dõi
đa mục tiêu) và hình dạng biên của môi trường (đối với bài toán bao phủ) Luận
án tập trung nghiên cứu về điều khiển MRS và các chiến lược triển khai MRS chonhiệm vụ theo dõi đa mục tiêu và bao phủ Luận án không nghiên cứu về thu thập,phân tích thông số môi trường
Theo dõi đa mục tiêu (Multi-Target Tracking): các robot có nhiệm vụ phốihợp với nhau tìm kiếm và chiếm đóng các đích phân bố ngẫu nhiên, không biếttrước trong môi trường Các đích có thể tĩnh hoặc động Luận án này giới hạntrong trường hợp các điểm đích cố định
Bao phủ (Coverage): các robot có nhiệm vụ phối hợp với nhau để tạo ra vùngcảm nhận của MRS bao phủ lên toàn bộ môi trường có cấu trúc bất kỳ Luận ánnày xem xét tạo vùng bao phủ của MRS theo cấu trúc lưới lục giác
Điều khiển phân tán (Distributed control): phương thức điều khiển trong đómỗi robot tính toán và ra quyết định điều khiển chỉ dựa trên thông tin thu thậpđược từ các robot hàng xóm nằm trong vùng nhìn thấy của nó
Duy trì sự toàn vẹn của mạng: là việc đảm bảo hai robot bất kỳ trong mạngduy trì sự kết nối với nhau trực tiếp hoặc gián tiếp qua các robot trong mạng nhờvậy chúng có thể trao đổi thông tin với nhau Duy trì kết nối giữa hai robot đượchiểu là duy trì vùng cảm nhận và truyền thông giữa chúng
Nghiên cứu được xem xét trên đối tượng là các robot di động tự trị hoạt động
Trang 21trong không gian hai chiều Chuyển động của robot được xem xét trên mô hìnhđộng học, không tính đến các đặc trưng động lực học, cũng như ảnh hưởng củanhiễu Các mục tiêu cụ thể của luận án gồm:
• Nghiên cứu, thiết kế bộ điều khiển phân tán cho MRS đảm bảo robot có thể
di chuyển đến mục tiêu mong muốn trong khi luôn duy trì sự toàn vẹn củamạng đa robot Mạng đa robot được duy trì là nền tảng cho phép các robottrao đổi thông tin phối hợp như phân nhiệm, dẫn đường, tạo quyết định đồngthuận, Điều khiển chuyển động đến mục tiêu cho phép robot thực hiện đượcnhiệm vụ được giao
• Nghiên cứu xây dựng chiến lược tự triển khai MRS giám sát môi trường vớihai nhiệm vụ cụ thể là: theo dõi đa mục tiêu và bao phủ Chiến lược triển khai
là sự kết hợp việc phân nhiệm giữa các robot dựa trên mạng truyền thôngđược duy trì và điều khiển chuyển động của robot để thực hiện nhiệm vụđược phân công
Ở Việt Nam, các nghiên cứu về MRS mới bắt đầu vài năm trở lại đây Sốlượng các nhóm nghiên cứu và kết quả được công bố về hệ thống đa robot còn rất
ít Cụ thể, nghiên cứu về điều khiển ổn định MRS tránh vật cản và tụ bầy sử dụnglogic mờ được thực hiện ở Trường Đại học Giao thông Vận tải và có 01 nghiêncứu sinh tốt nghiệp năm 2016 [3–9]; nghiên cứu về điều khiển tối ưu MRS, loại
bỏ nhiễu động của mô hình động học và động lực học được thực hiện ở TrườngĐại học Công nghiệp Thành phố Hồ Chí Minh [10]; nghiên cứu về tìm đường chomột nhóm robot sử dụng cây bao phủ được thực hiện trong đề tài luận văn thạc
sĩ ở Trường Đại học Bách khoa Hà Nội [11]; nghiên cứu về bao phủ sử dụng cơchế quay lui và đường cầy cho bầy robot được thực hiện bởi nhóm tác giả thuộcTrường Đại học Vinh, Trường Đại học Duy Tân và Kyung Hee University (HànQuốc) [12] Khác với các nghiên cứu nêu trên, luận án này nghiên cứu sinh tậptrung vào chủ đề điều khiển duy trì sự toàn vẹn của mạng MRS và ứng dụng chocác nhiệm vụ tìm kiếm mục tiêu, bao phủ môi trường không biết trước Bên cạnhhướng nghiên cứu này, ở Trường Đại học Công nghệ thuộc Đại học Quốc gia HàNội còn có một số nghiên cứu về áp dụng thuật toán tối ưu PSO cho MRS [13–16].Phần sau đây sẽ trình bầy tổng quan tài liệu nghiên cứu về các chủ đề liênquan đến mục tiêu nghiên cứu của luận án nhằm làm rõ nội dung, phương pháptiếp cận thực hiện các mục tiêu này
4
Trang 221.2 Điều khiển phân tán hệ thống đa robot
MRS gồm nhiều robot di động tương tác, phối hợp với nhau cùng thực hiệncác mục tiêu chung theo kiểu phân tán Hoạt động phối hợp thực hiện trên nềntảng mạng cảm nhận và truyền thông được duy trì giúp các robot có thể trao đổithông tin, ra các quyết định tập thể, Vấn đề đặt ra là làm thế nào để có thểđiều khiển tất cả các robot cùng lúc hoạt động theo yêu cầu mong muốn Có nhiềunghiên cứu hiện nay về điều khiển MRS và có thể phân chia thành ba phương phápchính là điều khiển dựa trên hành vi, trường lực thế nhân tạo và điều khiển kếtnối đại số
1.2.1 Điều khiển dựa trên hành vi
Điều khiển dựa trên hành vi, viết tắt là BC (Behaviour-based Control), đượclấy ý tưởng từ các nghiên cứu về hành vi bầy đàn của côn trùng hay động vậttrong thế giới tự nhiên và áp dụng chúng cho các hệ thống nhân tạo
Trong MRS, phần lớn các nghiên cứu dựa trên những hiểu biết về các quy tắctương tác cục bộ đơn giản trong thế giới côn trùng và động vật như loài kiến, ong,chim, [17] Một trong những mô hình BC đầu tiên được đề xuất bởi Reynolds [18]
mô phỏng chuyển động của đàn chim trên máy tính Các phần tử trong đàn đượcgọi là các boid Mỗi boid có ba hành vi điều khiển hướng (Steering behaviors) đơngiản như minh họa trong hình 1.1 gồm: liên kết (Coherent), phân chia (Separation)
và Sắp xếp (Alignment)
Hình 1.1: Mô hình điều khiển hành vi của Reynolds [18].
• Hành vi liên kết : điều khiển hướng của boid về phía vị trí trung tâm của cácboid hàng xóm nằm trong vùng cảm nhận/nhìn thấy của nó
• Hành vi phân chia: điều khiển hướng của boid tránh sự đông đúc của cácboid hàng xóm
Trang 23• Hành vi sắp xếp: điều khiển hướng của boid theo hướng trung bình của cácboid hàng xóm, giúp nó tương thích vận tốc với các boid hàng xóm.
Tổng hợp các hành vi thành phần hình thành hướng chuyển động cho mỗi cáthể boid và tạo nên hành vi bầy đàn như được Reynolds phát triển trong [19, 20].Trong [21], Vicsek đề xuất mô hình tính toán rời rạc để điều khiển chuyển độngtheo một hướng của n phần tử được xem như các chất điểm, hoạt động tự trị.Hướng chuyển động của từng phần tử được cập nhật bởi quy tắc cục bộ dựa vàohướng trung bình của chính nó và hướng của các phần tử hàng xóm Mô hìnhVicsek được xem như một phiên bản đặc biệt của mô hình boid Jadbabaie [22] đãcung cấp các giải thích về lý thuyết cho các hành vi quan sát được trong mô hìnhVicsek
Trong [23, 24], Mataric đề xuất tập hành vi cơ bản dựa trên tương tác cục bộgiữa các phần tử trong bầy nhân tạo và đã thử nghiệm trên các robot di động Tậphành vi này gồm: tránh va chạm (Collision avoidance/Safe-wandering) là khả năngcủa robot tránh va chạm với bất kỳ vật gì trong môi trường; bám theo (Following)
là khả năng duy trì vị trí phía sau một robot khác tạo thành chuỗi/hàng; phântán (Dispersion) là khả năng một nhóm robot trải ra không gian nhiệm vụ; hành
vi tập hợp (Aggregation) là khả năng một nhóm robot tập hợp lại với nhau, ngượcvới phân tán; hành vi về nhà (Homing) là khả năng một hoặc một nhóm các robottiếp cận vùng mục tiêu hoặc một vị trí mong muốn; hành vi bầy đàn (Flocking) làkhả năng một nhóm robot di chuyển như một tập hợp liên kết đồng nhất, bao gồmcác hành vi tránh va chạm, bám theo, phân tán và tập hợp, Trong đề xuất củaMataric, các hành vi cơ bản được thiết kế đơn giản, theo trạng thái cảm biến màrobot thu được, chẳng hạn kịch bản hành vi tránh va chạm được đề ra như sau:cảm biến của robot phát hiện robot khác ở bên phải thì nó sẽ rẽ trái và ngược lạinếu nó phát hiện bên trái thì robot sẽ rẽ phải Các hành vi cơ bản được kết hợptheo một quy tắc nhất định tùy theo nhiệm vụ cụ thể để tạo ra hành vi tổng hợpnhư: di chuyển theo bầy, tìm kiếm thức ăn,
Trong [25], Marino đề xuất thuật toán tuần tra dựa trên BC Các "hành động"như tiếp cận đường biên của vùng giám sát, tuần tra dọc đường biên, là hành
vi tổng hợp ở mức trừu tượng cao của điều khiển hành vi Nó thu được bằng cáchkết hợp nhiều hành vi cơ bản trên không gian null, viết tắt là NSB (Null SpaceBehavioral Control) Thuật toán không yêu cầu truyền thông giữa các robot NSBchuẩn xác định một tập cố định các nhiệm vụ/hành vi cơ bản và mức độ ưu tiêncủa chúng, không thay đổi theo yêu cầu nhiệm vụ và điều kiện môi trường Vì vậymột phiên bản cải tiến được trình bầy trong [26] khắc phục các nhược điểm này
6
Trang 24Trong [26], Marino đề xuất một kiến trúc ba lớp gồm lớp dưới sử dụng để thựchiện nhiệm vụ của từng robot riêng lẻ; lớp giữa định nghĩa các hành vi cơ bản.Các hành vi này sau đó được kết hợp thông qua tiếp cận NSB tạo thành hànhđộng phức tạp hơn; lớp trên đóng vai trò người giám sát các thay đổi và lựa chọnhành động thích hợp để thực hiện Trong [27], Antonelli cũng sử dụng NSB đểđiều khiển di chuyển theo bầy của một nhóm các robot Trong luận án tiến sĩ của
Lê Thị Thúy Nga [9], thuật toán điều khiển bầy robot được đề xuất để thực hiệnnhiệm vụ tụ bầy và nhiệm vụ tìm kiếm mục tiêu duy nhất dựa trên nguyên lý NSB
và hàm lực thế được tính dựa trên cơ sở logic mờ Sabattin [28] sử dụng NSB đểxây dựng bộ điều khiển MRS thực hiện hành vi tránh va chạm và bám theo tậpđiểm cho trước
Trong [29], Xu áp dụng BC cho bài toán điều khiển đội hình (formationcontrol) của MRS trong hai trường hợp: điều khiển để hình thành đội hình và điềukhiển duy trì đội hình trong quá trình di chuyển và tránh vật cản Mỗi robot cómột số hành vi thành phần như di chuyển đến mục tiêu, tránh vật cản, bám theotường, tránh va chạm với robot khác, duy trì đội hình Các hành vi thành phầnđược biểu diễn bởi các véctơ có hướng và độ lớn phụ thuộc vào trạng thái môitrường xung quanh mà robot quan sát được Chúng được tổng hợp để tạo ra hành
vi điều khiển cho robot Một nghiên cứu khác được Mendiburu trình bầy trong [30]đưa ra kỹ thuật tổng hợp hành vi di chuyển theo bầy của MRS từ các hành vi dẫnhướng, tập hợp và tránh va chạm Nghiên cứu này thực hiện trên MRS sử dụng
mô hình robot hai bánh vi sai
Nhận xét 1.2.1: Các nghiên cứu về điều khiển MRS sử dụng BC nêu trêntập trung chủ yếu đến thiết kế và tổng hợp hành vi của bầy robot Tùy theo quytắc tổng hợp mà MRS có tập hành vi khác nhau, nó cho thấy BC có tính linh hoạtcao Tuy nhiên, các hành vi được hình thành dựa trên tương tác cục bộ giữa cácrobot nên nó thường không đảm bảo duy trì kết nối của mạng toàn cục vì thế hoạtđộng phối hợp, phân nhiệm giữa các robot dựa trên mạng truyền thông không thựchiện được Điều khiển hành vi chủ yếu được sử dụng cho các bài toán điều khiển
di chuyển theo bầy hoặc tập hợp/tụ bầy
1.2.2 Trường lực thế nhân tạo
Trường lực thế nhân tạo, viết tắt là APF (Artificial Potential Force Field),
là phương pháp được Khatib đề xuất năm 1986 [31] Trong mô hình này, xungquanh mỗi robot có một trường lực thế nhân tạo ở đó điểm mục tiêu tạo ra lựchút (Attractive force) làm cho robot di chuyển về phía nó, vật cản tạo ra lực đẩy
Trang 25(Repulsive force) tỷ lệ nghịch với khoảng cách từ robot tới vật cản và có hướng đi
ra xa vật cản Hướng chuyển động của robot được tổng hợp từ hai lực này Robot
sẽ di chuyển từ nơi có trường thế tổng hợp cao đến nơi thấp dọc theo hàm độ dốc(gradient) âm của trường lực thế nhân tạo Phương pháp này đã được nghiên cứu,
áp dụng phổ biến trong điều khiển phân tán MRS
20 30 40 50 60 70 80
Figure 5: The trajectory experienced by our two-behavior robot when there is a goal and an obstacle.
be useful for a FollowWall behavior or a ReturnToTerritory behavior.
The second field is the perpendicular potential field, and is illustrated in Figure 7 It might be useful for a AvoidWall or aAvoidTerritory behavior It is obtained by setting ∆x = ±c and ∆y = 0 (or other constant values that represent the direction directions).
The fourth field is the tangential potential field, and is illustrated in Figure 8 This field is obtained by finding the magnitude and direction in the same way as for the repulsive obstacle However, θ is modified before ∆x and ∆y are defined by setting θ ← θ ± 90 ◦ which causes the vector to shift from pointing away from the center of the obstacle to pointing in the direction of the tangent to the circle The sign of the shift controls whether the tangential field causes a clockwise our counterclockwise spin It might be useful for a PatrolFlag or CircleOpponent behavior.
The sixth field is the Random potential field This field is useful because it helps the agent bounce around and avoid getting stuck in local minima that might arise when multiple fields are added together It is obtained by randomly selecting d from a uniform distribution (i.e., picking any point with equal probability) over the interval [0, γ] and θ from a uniform distribution over the interval [0, 2 ∗ π].
The final field is the AvoidPast potential field Let me motivate why we might want this field Consider the world with a box canyon diagrammed in Figure 10 If the robot starts at the bottom
of the world, it will be attracted into the box canyon by the goal As it enters the box canyon, it will begin to experience the forces from the AvoidWall behavior which will cause it to center in the canyon Eventually, it will reach a point where the attractive potential from the goal is insufficient
to overcome the repulsive potentials from the walls and the robot will be stuck.
One way to handle this box canyon effect is to introduce an AvoidPast behavior which sets ups repelling potential fields for each location that it has visited — more recently visited areas have more
6
Hình 1.2: Trường lực thế tác động lên robot trong môi trường có một điểm đích (hình tròn mầu đỏ) và một vật cản (hình tròn mầu xanh) Đường mầu đen đậm minh họa quỹ đạo chuyển động của robot Nguồn: bài giảng về lập kế hoạch đường đi sử dụng trường thế ảo của Giáo sư Michael A Goodrich của Trường Khoa học Máy tính thuộc Đại học McGill có tại https://www.cs.mcgill.ca/~hsafad/robotics.
Trong [32], Howard đã sử dụng APF để phân tán các nút cảm biến di độngvào môi trường không biết trước, có cấu trúc giống sàn của một tầng nhà gồmhành lang và các phòng Đây được xem là nghiên cứu đầu tiên áp dụng trường lựcthế nhân tạo cho mạng cảm biến di động Các nút chịu tác động của lực đẩy từnút hàng xóm của chúng và các vật cản Lực tổng hợp sẽ giúp các nút chuyển động
ra xa các nút hàng xóm và vật cản Nó làm cho các nút từ vị trí ban đầu trải ramôi trường và bao quanh vật cản Các nút di chuyển theo kiểu "ủn" nhau, nút nọ
"ủn" nút kia cho đến khi tất cả cá nút đạt trạng thái cân bằng lực Nếu bất cứ đốitượng nào (nút mạng hoặc vật cản) trong mạng thay đổi vị trí thì trạng thái cânbằng bị phá vỡ và khi đó mạng sẽ tự cấu trúc lại để tạo ra cấu trúc cân bằng mới.Điều khiển APF là phương pháp hoàn toàn phân tán bởi nó chỉ yêu cầu thông tincục bộ có được từ các cảm biến được trang bị cho các nút di động, không yêu cầutruyền thông giữa các nút
8
Trang 26Trong [33], Spears đề xuất mô hình vật lý nhân tạo, gọi tắt là AP (ArtificialPhysics) trong đó các lực ảo được tạo ra dựa trên các định luật vật lý AP coi cácphần tử trong mạng cảm biến di động như các hạt vật chất, hoạt động phỏng theo
mô hình động học phân tử trong đó lực ảo có tác dụng điều khiển hệ thống tới cấutrúc/trạng thái mong muốn có năng lượng thấp nhất Lý thuyết được áp dụng đểđiều khiển duy trì vị trí tương đối của các robot trong đội hình có cấu trúc hìnhvuông hoặc hình lục giác
Trong [34], Popa sử dụng APF để triển khai mạng cảm biến di động nhằmđạt vị trí tối ưu cho tốc độ dữ liệu, năng lượng nút, Ngoài thành phần lực hútđến mục tiêu, lực đẩy khỏi vật cản và robot hàng xóm, Popa bổ sung hai lực mới,
là lực hút dựa trên hàm tối đa dung lượng truyền thông giữa các nút và lực phụchồi dựa trên việc phạt đối với các cặp nút có khoảng cách truyền thông vượt quámức cho phép, để tối ưu vị trí của robot trong mạng
Trong [35], Dimarogonas trình bầy một chiến lược điều khiển phân tán sửdụng trường lực hút và đẩy cho bài toán tụ bầy với yêu cầu tránh vật cản và duytrì các kết nối ban đầu trong suốt quá trình triển khai Thuật toán điều khiển chophép thêm các kết nối thông qua khai thác thuộc tính của hàm độ dốc cục bộ.Trong [36], Mikkelsen tính toán trường lực thế dựa trên xác suất truyền/nhận dữliệu thành công qua kênh tín hiệu hồng ngoại Nó được sử dụng để điều khiển duytrì vị trí tương đối trong bài toán điều khiển đội hình của MRS Trong [37], Ajorlou
đề xuất một điều khiển phân tán cho duy trì kết nối giữa các robot sử dụng hàmthế Ý tưởng chính của đề xuất này là khi hai robot sắp mất kết nối, thì hàm độdốc cục bộ của chúng tương ứng với các trường thế trên hướng của cạnh kết nối
sẽ kéo chúng lại với nhau Trong [38], Julian phát triển một điều khiển dựa trênhàm độ dốc để điều khiển các robot đo thông số môi trường và tối đa các thôngtin nó quan sát được bằng việc sử dụng bộ lọc Bayes
Trong [39], Sallam đề xuất thuật toán sử dụng lực ảo VF (Virtual Force)nhằm tạo ra phân bố đều trong mạng đa robot Lực ảo có ba đối tượng tác động
là robot, vật cản và vùng ưu tiên Tương tác giữa các robot có lực hút và lực đẩytùy thuộc khoảng cách giữa chúng trong khi vật cản tạo ra lực đẩy lên robot vàvùng ưu tiên tạo ra lực hút tác động lên robot Một hàm ảo được đề xuất để nhậnbiết năng lượng của mỗi nút sao cho robot có mức năng lượng thấp có thể chuyểnsang chế độ tiết kiệm năng lượng để duy trì năng lực tối thiểu của nút trong mạng
đa robot Trong [40], Dong đề xuất một điều khiển thích nghi sử dụng kỹ thuậthàm thế cho bài toán tụ bầy kiểu bám đuổi của MRS
Nhận xét 1.2.2: Phương pháp APF tổng hợp lực đẩy và lực hút theo quy
Trang 27tắc cục bộ để xây dựng hàm điều khiển chuyển động cho MRS APF thực hiện kháđơn giản tuy nhiên do chỉ dựa trên tương tác cục bộ giữa các robot nên phươngpháp này chỉ đảm bảo duy trì kết nối cục bộ mà không đảm bảo duy trì mạngtoàn cục của MRS Bên cạnh đó, nghiên cứu trong [41] chỉ ra rằng APF có nhượcđiểm là tạo ra các điểm cực tiểu cục bộ (Local Minima) là trạng thái cân bằng ở
đó tổng hợp lực tác động lên robot bằng không Robot rơi vào trạng thái cực tiểucục bộ sẽ không thể di chuyển đến mục tiêu Đặc điểm này cũng làm cho APF chỉ
có thể áp dụng cho các chiến lược triển khai MRS mà không thể kết hợp cả haihoạt động triển khai và thu hồi MRS
1.2.3 Điều khiển kết nối đại số
Điều khiển kết nối đại số, viết tắt là ACC (Algebraic Connectivity Control),được sử dụng phổ biến trong điều khiển duy trì sự toàn vẹn của mạng đa robot.Phương pháp này sử dụng giá trị kết nối đại số của đồ thị mạng MRS làm tín hiệuđầu vào cho bộ điều khiển MRS được biểu diễn bởi đồ thị kết nối G(V, E) trong
đó V là tập đỉnh tương ứng với các robot và E là tập cạnh kết nối giữa chúng
Đồ thịG được mô tả bởi ma trận liền kề A với các phần tử aij biểu diễn trọng sốcạnh kết nối giữa roboti và robot j Gọi D là ma trận đường chéo với các phần tử
di = Pn
j=1 aij và L = D − A là ma trận Laplace Ma trận Laplace L có phổ là cácgiá trị riêng được sắp xếp theo thứ tự tăng dần 0 = λ1 ≤ λ 2 ≤ ≤ λ n trong đó giátrị riêng nhỏ nhất thứ hai λ2 đặc trưng cho thuộc tính kết nối, còn gọi là kết nốiđại số, của đồ thị G Đồ thị G được gọi là kết nối nếu và chỉ nếu λ2 > 0 [42].Trong điều khiển phân tán, λ2 được ước lượng thông qua thủ tục ước lượngkết nối đại số Thủ tục ước lượng này được đề xuất đầu tiên bởi Yang trong [43]
sử dụng thuật toán lặp PI (Power Iteration) để ước lượng véctơ riêng ˙˜v2 tương ứngvới giá trị riêngλ2 của ma trận LaplaceL Ước lượng véctơ riêng ˙˜v2 được cập nhậtnhư sau:
˙˜v2 = −k1Ave( {˜v i 2}) − k2 L˜ v2 − k3 (Ave( {(˜v i
2 )2}) − 1)˜v2 (1.1)với k1, k2, k3 > 0 là các hệ số điều khiển, Ave(.) là toán tử trung bình, v ˜ i
2 là ướclượng của roboti và cũng là thành phần thứ i của véctơ riêngv2, ˜ v2 = [˜ v 1
Trang 28P Yang et al / Automatica 46 (2010) 390–396 393
–10 –5 0
Eigenvalue Estimation
–10 –5 0
Node 1 Node 2 Node 3 Node 4 Node 5 Actual
Fig 1 (a) A five-node network with all link weights equal to 1 Nodes are numbered
counter-clockwise from 1 to 5 starting from the top node (b) Eigenvalue estimation
through Eq (13) The initial eigenvalue estimate for each agent is randomized The
inset plot shows the transient dynamics of the eigenvalue estimator.
nonlinear systems (Sussmann & Kokotović, 1991), so after a
transient period the decentralized update law(11)will agree with
the centralized one(3)
There are two ways to estimateλ2 First, noticing−Lv ˜2 = λ2v2,
agent i can estimateλ2as
whenever x i 6= 0 This equation is singular when x i passes
through zero, however Therefore we use a second method, based
onTheorem 1, which says that z i, 2 → k ˜v 2k2
Example 1 We simulated the eigenvalue estimation algorithm
over the 5-node constant graph (Fig 1), where the weights are
set as A ij = 1 for j ∈ Ni The eigenvalue spectrum of its
Laplacian matrix is {0,0.83,2.69,4.00,4.48} The gains for the
two PI average consensus estimators areγ = 25,K P = 50,K I =
10 and the gains for the eigenvector estimator are k1 = 6,k2 =
1,k3 = 20, satisfying(7)and(8).Fig 1(b) shows the estimatedλi
2
for each node i as they converge to the correct eigenvalue of 0.83
5 Control to maintain connectivity
In this section we show how the connectivity estimator can be
applied in a connectivity-maintenance algorithm for fully-actuated
point robots, where each robot’s configuration is given by p i ∈ Rd
We start by showing one additional property ofλ2
Lemma 2 Given any positively weighted graph G,λ2is a
Remark 2 This lemma is easily demonstrated from the following
Based on this property, we can choose a weight function A ijthat is
position-dependent Then we can design connectivity-maintaining
motion controllers, moving the agents to increase the connectivity
of the network
Given a scalar r as the maximal reliable inter-agent
communi-cation distance, one simple weighting choice is
The weight decreases as the inter-agent distance gets larger Wechoose the scalar parameter σ to satisfy a threshold condition
e−r2/ 2 σ 2
= , with being a small predefined threshold
We knowλ2 > 0 for connected graphs, and based onLemma 2,
λ2 increases as the graph adds more links or as individual linkweights increase as two agents come closer We can design agradient controller where each node moves to maximize λ2, andthis will in effect maintain the connectivity of a graph The gradientcontroller in Zavlanos and Pappas (2007) was designed based on
a similar idea In that paper, each node moves to maximize thedeterminant of the reduced Laplacian matrix of a graph, in effectguaranteeing the algebraic connectivityλ2 is bounded away from0
Next we derive the analytical form of the gradient controllerfor fully-actuated first-order agents We use the normalizedeigenvector corresponding toλ2to make the gradient of λ2 easier
to derive Given the normalized eigenvector v ˆ2 (k ˆ v2k = 1)corresponding toλ2, the differential ofλ2 is
Implementation of (24) requires agent k to obtain its neighbors’
positions{p j,j ∈ Nk} Agent k approximates the exactv ˜k
Hình 1.3: Ước lượng λ 2 của MRS có 5 nút trong [43] với tất cả các cạnh kết nối có trọng
số bằng 1: hình trái biểu diễn đồ thị kết nối, các nút được đánh số ngược chiều kim đồng
hồ từ 1 dến 5 từ nút ở vị trí cao nhất; hình phải biểu diễn ước lượng λ 2 hội tụ sau 12 lần
cập nhật trạng thái kết nối của mạng MRS.
trung bình ước lượng trên tập các robot hàng xóm Ni
Bộ ước lượng trung bình đồng thuận được thực hiện hai lần, lần thứ nhất với
đầu vào α i,1 = ˜ v i
2 )2}) Do vậy, Ước lượng ˙˜v2 và λ i
2 có thể thực hiện theo kiểu phântán như mô tả trong cặp phương trình sau:
2 )
(1.3)
Giá trị ước lượng ˙˜v2 và λi2 được Yang sử dụng để thiết kế luật điều khiển phân
tán cho phép duy trì kết nối toàn cục của mạng đa robot
Các nghiên cứu trong [44–54] đã sử dụng thuật toán ước lượng λ2 theo kiểu
phân tán trong [43] để phát triển các thuật toán điều khiển duy trì kết nối Cụ
thể, trong [44,45], Sabattini đề xuất một chiến lược điều khiển khai thác ước lượng
kết nối đại số và sử dụng một hàm năng lượng không âm, không tăng theo đối số
λ2 − , với là ngưỡng kết nối Sabattini đã chứng minh rằng nếu giá trị khởi tạo
λ2 lớn hơn một giá trị ngưỡng thì luật điều khiển được đề xuất luôn đảm bảo giá
trị λ2 không bao giờ giảm dưới ngưỡng kết nối Trong [46], Sabattini đưa ra khái
niệm robot tới hạn (Critical robot) cho hành động điều khiển nâng cao Một robot
được xem là robot tới hạn nếu nó có ít nhất một hàng xóm bị cô lập, có nguy cơ
mất kết nối với mạng Định nghĩa này có tính đối xứng, tức là robot bị cô lập cũng
là một robot tới hạn Một hệ số điều khiển được thêm vào luật điều khiển đã được
11
Trang 29đề xuất trong [44, 45] cho phép điều khiển tăng cường kết nối đối với các robot tớihạn.
Trong [47], Giordano phát triển bộ điều khiển gradient cho duy trì kết nốitoàn cục của mạng đa tác tử (Multi-Agents) bằng việc sử dụng hàm thế vô hướng.Hàm thế này không âm và không tăng đối với biến số λ2 tương tự như hàm nănglượng được Sabattini đề xuất trong [44] Trong điều khiển này, Các yêu cầu kết nốitổng quát của hệ thống đa tác tử được biểu diễn thông qua các hàm trọng số riêngcủa trọng số kết nối aij Cụ thể, aij = αij βij γij trong đó: (1) hàm γij biểu diễn môhình nhận biết/truyền thông của hệ thống Nếu hai tác tử không có trao đổi thôngtin và xác định vị trí tương đối của nhau thì γij = 0 và ngược lại γij > 0 (giá trịcàng lớn thì chất lượng càng tốt); (2) hàm βij đại diện cho các yêu cầu mềm nhưđiều khiển đội hình Hai tác tử giữ một khoảng cách tham chiếu khi có thể traođổi thông tin nhằm tạo ra hành vi liên kết cho chuyển động của nhóm; (3) hàm
αij đại diện cho các yêu cầu cứng Bất cứ tác tử nào phải tránh va chạm bằng việcgiữ khoảng các an toàn tối thiểu với các vật cản và tác tử khác Bộ điều khiển nàyđược sử dụng trong [48] cho bài toán khám phá đa mục tiêu
Trong [49], Williams đề xuất một mô hình tương tác chuyển mạch kết hợpđiều khiển trường thế để duy trì kết nối hệ thống đa tác tử trong bài toán tậptrung đàn cùng yêu cầu số nút hàng xóm tối đa và bài toán phân tán đàn với yêucầu số nút hàng xóm tối thiểu Một phiên bản mở rộng của phương pháp này nhằmduy trì sự toàn vẹn của mạng đa robot được trình bầy trong [50] có yêu cầu thủtục ước lượng kết nối đại số của đồ thị kết nối
Trong [51], Da Cai đề xuất một khung điều khiển duy trì kết nối mạng đarobot dựa trên phương pháp trong [43, 46] Gasparri [52] đề xuất luật điều khiểnbiên để duy trì kết nối toàn cục trong bài toán điều khiển phối hợp đa robot Đềxuất này nhằm tối ưu các tính toán để có thể thực hiện các ước lượng trong hệthống robot thật Trong [53], Karpe thực hiện một phân tích, đánh giá các ảnhhưởng của nhiễu/lỗi kết nối đối với thủ tục ước lượng phân tán và Panerati [54]
đã sử dụng các kỹ thuật dựa trên kinh nghiệm (heuristic) để phát hiện các nút bịtổn thương nhằm cải thiện kết nối khi xẩy ra lỗi mạng trong điều khiển của [45].Nhận xét 1.2.3: Phương pháp ACC sử dụng bộ điều khiển dựa trên ướclượng kết nối đại số cho duy trì mạng toàn cục của MRS Thủ tục ước lượng kếtnối đại sốλ2 yêu cầu mỗi robot phải cập nhật các kết nối của mạng toàn cục thôngqua trao đổi thông tin với các robot hàng xóm của nó Mặc dù chỉ sử dụng thôngtin cục bộ thu được từ các robot hàng xóm nhưng thủ tục ước lượng yêu cầu sốlượng lớn các bước lặp tương ứng quá trình cập nhật trạng thái kết nối của mạng
12
Trang 30để bộ ước lượng λ2 hội tụ tới giá trị đúng, thường lớn hơn 2 lần kích thước mạng(số robot có trong mạng) như thí nghiệm minh họa trong hình 1 của công trình [43](12/5 lần) và hình 2 của công trình [45] (16/5 lần) Do vậy, thủ tục này rất tốnthời gian (vài giây cho chỉ 6 robot như chỉ ra trong [43]) để thu được giá trị λ2 -được sử dụng như đầu vào của bộ điều khiển cho mỗi robot Điều này không đảmbảo khả năng điều khiển thời gian thực trên các hệ thống robot thật, đặc biệt làmạng các robot quy mô lớn.
Đánh giá 1.2: Trong số các nghiên cứu được trình bầy trên đây, vấn đềđảm bảo duy trì sự toàn vẹn của mạng MRS không được đề cập trong [9, 18–30],[32–34,36,38,39] Nó được xem xét ở phạm trù duy trì kết nối cục bộ trong [35,37,40]
và duy trì kết nối toàn cục trong [43–54] Duy trì kết nối cục bộ có nghĩa là kếtnối giữa hai robot được duy trì theo thời gian nếu chúng được kết nối lúc khởi tạo.Trong duy trì kết nối toàn cục, các robot duy trì các liên kết nối để đảm bảo toànvẹn của mạng, chúng có thể linh hoạt thêm hoặc bớt kết nối một cách linh hoạttrong quá trình hoạt động Nghiên cứu trong [55] đã chỉ ra rằng duy trì kết nốicục bộ làm hạn chế chuyển động của robot và không đồng nghĩa đảm bảo duy trì
sự toàn vẹn của mạng
Các nghiên cứu về điều khiển phân tán MRS thực hiện mục tiêu trong khiluôn đảm bảo duy trì sự toàn vẹn của mạng được trình bầy trong [43–54] yêu cầuước lượng kết nối đại số và tương tác dựa trên trường thế nhân tạo Thủ tục ướclượng kết nối đại số λ2 theo phương thức phân tán được đề xuất trong [43] yêucầu mỗi robot phải cập nhật trạng thái kết nối của mạng toàn cục thông qua traođổi thông tin với các robot hàng xóm Thủ tục ước lượng yêu cầu thời gian lớn(vài giây cho chỉ 6 robot như chỉ ra trong [43]) Điều này không đảm bảo khả năngthực thi trên các hệ thống thật, đặc biệt với mạng quy mô lớn
Ưu và nhược điểm của các phương pháp nêu trên là động lực cho luận ánnghiên cứu, đề xuất một tiếp cận mới để thiết kế bộ điều khiển phân tán cho MRSdựa trên việc xem xét cấu trúc hình học của các kết nối cục bộ, không yêu cầu ướclượng giá trị kết nối đại số λ2, và khai thác sự linh hoạt của điều khiển hành vi
1.3 Tự triển khai hệ thống đa robot
1.3.1 Theo dõi đa mục tiêu
Bài toán theo dõi đa mục tiêu nghiên cứu về cách thức phối hợp giữa cácrobot để tự phân tán vào môi trường nhằm tìm kiếm mục tiêu (Target searching),theo dõi mục tiêu (Target tracking), tĩnh hoặc đi động [56] Phát hiện mục tiêu
Trang 31nghiên cứu việc triển khai các nút cảm biến động hoặc tĩnh để quét/bao phủ môitrường tìm kiếm mục tiêu trong vùng nhìn thấy, có liên quan mật thiết tới lập
kế hoạch đường đi(path planning) Theo dõi mục tiêu nghiên cứu việc điều khiểnrobot hướng tới mục tiêu sao cho mục tiêu luôn trong tầm nhìn thấy của cảm biến,
ở gần robot nhất hoặc robot chiếm đóng được mục tiêu Nó tập trung vào các chủ
đề như định vị đích (Target Localization) nghiên cứu về việc xác định vị trí đểrobot/nút cảm biến thu được thông tin nhiều nhất; bám theo (Following) nghiêncứu việc điều khiển bám theo mục tiêu trong điều kiện tốc độ chuyển động và môhình môi trường khác nhau; quan sát (Observation) nghiên cứu vấn đề phân côngrobot để quan sát đồng thời tất cả các mục tiêu
Các nghiên cứu [9], [57–65] nhấn mạnh vào việc phát hiện một hoặc nhiềumục tiêu tĩnh trong môi trường Cụ thể, trong [57], Jung giới thiệu một phươngpháp phân vùng để triển khai các robot kết hợp với các nút cảm biến tĩnh nhằmtheo dõi các mục tiêu cố định trong môi trường có cấu trúc gồm các phòng đượcnối với nhau bởi các hành lang Các robot được cung cấp trước một bản đồ cấutrúc biểu diễn môi trường Chiến lược triển khai gồm hai mức: triển khai thô phântán các robot vào các vùng trên bản đồ và triển khai bám mục tiêu thực hiện ướclượng mức độ ưu tiên của mỗi vùng, sau đó di chuyển robot đến vị trí thuận lợi
có thể theo dõi tối đa số lượng đích trong mỗi vùng Kiến trúc hệ thống của Junggồm 3 tầng: tầng điều khiển chuyển động robot dựa trên điều khiển hành vi củaMataric trong [23]; tầng ước lượng vị trí thuận tiện để theo dõi các đích và thựchiện trao đổi thông tin giữa các robot; tầng giám sát trạng thái của bộ điều khiểntrong suốt quá trình hoạt động chẳng hạn khi băng thông của mạng bị giới hạn,robot hạn chế trao đổi thông tin, nó chỉ gửi thông tin cho chương trình giám sát
từ bên ngoài khi có yêu cầu Trong [58], Martinez nghiên cứu xác định vị trí tối ưucho nút cảm biến di động trong cả kịch bản có ngẫu nhiên và không ngẫu nhiên,
và chiến lược điều khiển phối hợp chuyển động của các nút cảm biến đến các vị trítối ưu Hàm chi phí đo lường hiệu suất cảm biến được xây dựng nhằm tối ưu vịtrí cảm biến dựa trên phép ước lượng sử dụng ma trận thông tin Fisher (FIM) chokịch bản tĩnh và bộ lọc Kalman mở rộng (EKF) cho kịch bản động Các nút cảmbiến sử dụng điều khiển hành vi cùng quy tắc cục bộ [22] và giản đồ Voronoi [66]
để di chuyển đến mục tiêu Trong [60], Lan trình bầy một điều khiển phân tánMRS phối hợp theo dõi mục tiêu Các robot được điều khiển di chuyển đến gầnmục tiêu và sau đó chuyển sang phối hợp chuyển động theo đội hình (formation)
để theo dõi mục tiêu bằng cách di chuyển thành một đường tròn xung quanh mụctiêu đó với vận tốc góc bằng nhau Trong [61], Tan trình bầy một phương pháp
14
Trang 32kết hợp các nút cảm biến di động với nút cảm biến tĩnh để tăng hiệu suất pháthiện mục tiêu Một đích khả dĩ có thể được phát hiện bởi một nhóm các cảm biếnthông qua quyết định đồng thuận trong nhóm sử dụng tổng hợp cảm biến Cácnút di động di chuyển đến mục tiêu khả dĩ được phát hiện Độ chính xác của quyếtđịnh phát hiện mục tiêu được cải thiện sau khi các nút di động di chuyển đến vịtrí đích khả dĩ và thu được tỷ lệ SNR (tín trên tạp) cao hơn Trong [9], tác giả
Lê Thị Thúy Nga đã nghiên cứu triển khai MRS để tìm kiếm một mục tiêu duynhất trong môi trường có vật cản dựa trên điều khiển hành vi NSB và lực hút/đẩyđược tính theo logic mờ Trong [62], Dames đề xuất thuật toán điều khiển và ướclượng phân tán cho phép một nhóm robot di động tìm kiếm và theo dõi các đíchkhông biết trước, có thể tĩnh hoặc động Số lượng đích có thể thay đổi theo thờigian và sử dụng cảm biến có khoảng nhìn giới hạn Các robot sử dụng bộ lọc PHD(Probability Hypothesis Density) để ước lượng số lượng đích và vị trí đích; Sử dụngthuật toán Lloyd cho mục đích bao phủ, tìm kiếm và điều khiển chuyển động trongmôi trường Trong [63], Majcherczyk triển khai bầy robot tiếp cận mục tiêu theo
mô hình phát triển cây nhị phân và hàm thế nhân tạo cho điều khiển Các robotđược lần lượt triển khai bám theo cấu trúc cây nhị phân với mạng xương sống đượchình thành trong quá trình triển khai nhờ vậy mạng luôn được duy trì Trong [64],Faridi sử dụng thuật toán tiến hóa và bầy ong nhân tạo để lập kế hoạch đường
đi cho các robot trong môi trường không biết trước để theo dõi mục tiêu tĩnh vàtránh chướng ngại vật Trong [65], Marangoz đã đề xuất thuật toán loại bỏ đích,phân cụm đích để giải quyết vấn đề gia tăng chi phí tính toán trong bài toán phâncông đa mục tiêu với kích thước vùng làm việc và số lượng robot lớn
Các nghiên cứu trong [67–77] tập trung vào các chủ đề phát hiện, giám sát
và bám đuổi mục tiêu di động Trong [67], Parker phát triển thuật toán điều khiểnphân tán dựa trên hành vi để phối hợp hoạt động một nhóm cảm biến di động chobài toán giám sát và trinh sát Chiến lược điều khiển này nhằm tối đa số lượngmục tiêu được quan sát bởi ít nhất một nút cảm biến Chiến lược phối hợp quansát được đề xuất sử dụng các véctơ lực cục bộ có trọng số Nó khiến robot bị thuhút bởi các mục tiêu gần đó và bị đẩy khỏi các robot hàng xóm Trọng số đượcđánh sao cho robot bị hút ít hơn về phía mục tiêu được quan sát bởi các robot hàngxóm Sử dụng trọng số giúp giảm việc gối lên nhau của vùng cảm nhận của cácrobot và cũng giảm khả năng một điểm đích thoát ra khỏi vùng giám sát của robot.Trong [68], Tang nghiên cứu bài toán lập kế hoạch di chuyển để giảm thiểu thờigian quan sát hai đích liên tiếp khi số lượng cảm biến di động có hạn Trong [69],Shucker phát triển bộ điều khiển phân tán dựa trên lưới liên kết ảo, dạng mở rộng
Trang 33của điều khiển dựa trên lực vật lý ảo AP, để theo dõi các đích di động dạng rời rạcnhư các xe di động hoặc liên tục như các phân tử hóa chất khuếch tán trong tựnhiên Trong [70], Chung đề xuất một thuật toán lập kế hoạch chuyển động theokiểu phân tán để phối hợp định vị và theo dõi mục tiêu di động Thuật toán sửdụng hàm chi phí tính theo chất lượng cảm nhận của các cảm biến và phương phápgradient Trong [71], Olfati-Saber điều khiển mạng cảm biến di động không dây dichuyển theo nhóm trong cấu trúc lưới lục giác để bao phủ và giám sát mục tiêu diđộng Chuyển động theo bầy được thực hiện bởi luật điều khiển trong [78] và môhình boid của Reynolds trong [18] trong đó các nút sử dụng thuật toán lọc Kalmanphân tán DKF để ước lượng trạng thái của mục tiêu di động Khác với phươngpháp của Olfati-Saber, trong [72], Harmati sử dụng lý thuyết trò chơi cùng hàmchi phí mờ để giải quyết bài toán theo dõi đích di động Trong [73], Kolling pháttriển một thuật toán điều khiển phân tán dựa trên cảm nhận và truyền thông ướclượng thời gian và năng lượng tối thiểu để tiếp cận mục tiêu Phương pháp nàygiải quyết nhược điểm trong [67] bởi cách tách thuật toán theo dõi khỏi chiến lượcphối hợp giữa các robot và các mục tiêu di động Trong [74], Tolic đề xuất một môhình lai có tính ngẫu nhiên thống kê của mạng cảm biến di động để phối hợp pháthiện và theo dõi các đích di động với quan sát rời rạc Trong [75] Laszalo giới thiệumột thuật toán phân tán cùng luật điều khiển hành vi cơ bản cho bầy robot đượctrang bị cảm biến có dải hạn chế để theo dõi và di chuyển xung quanh các đích diđộng yêu cầu Trong [76], La nghiên cứu việc quan sát và theo dõi mục tiêu độngtrong mạng cảm biến di động trong 2 trường hợp: nghiên cứu theo dõi một đíchchuyển động bởi thuật toán điều khiển bầy đàn thích nghi và theo dõi đa mục tiêuđộng bởi việc phân chia và kết hợp mạng Trong [77], Marian nghiên cứu thuậttoán phân tán cho theo dõi liên tục các mục tiêu động trong một vùng rộng lớn
sử dụng mạng không dây và các nút di động Trong [79], Banfi trình bầy một môhình tối ưu đa mục tiêu cho bài toán MRS phối hợp quan sát đa đích, có tính toán,
dự đoán chuyển động của mục tiêu và bản đồ chiếm đóng đích dựa trên phươngthức Bayes Trong [80], Hausman điều khiển nhóm robot ước lượng vị trí và theodõi mục tiêu di động sử dụng cảm biến gắn trên robot Nghiên cứu này tập trungvào các kỹ thuật ước lượng vị trí dựa trên cảm biến cục bộ Trong [81], Roldantrình bầy một ứng dụng của MRS triển khai giám sát sự thay đổi môi trường bêntrong các nhà vườn MRS gồm cả robot di động trên mặt đất và trên không cóchức năng đo nhiệt độ, độ ẩm, ánh sáng và nồng độ cabon đioxít ở mặt đất và ởtrên cao Trong [82], Tardos xem xét bài toán triển khai nhóm robot hỗn hợp hoạtđộng ở mặt đất và trên không để giám sát một khu vực Chiến lược theo dõi dựa
16
Trang 34trên thuật toán Lloyd được đề xuất cho phép các robot trên mặt đất bám theo cácrobot trên không xem như các mục tiêu và duy trì kết nối giữa chúng Nó thiết lậpcác hàm phân bố trong môi trường sao cho các mục tiêu ở vị trí quan trọng hơn sovới các vùng khác và thay đổi liên tục các giới hạn ảo của vùng làm việc theo vị trícủa mục tiêu Trong [83], Jin đề xuất thuật toán cạnh tranh cho bài toán theo dõi
đa mục tiêu với truyền thông hạn chế Ở phương pháp này, chỉ những robot chiếnthắng mới được phân bổ nhiệm vụ và kích hoạt quá trình chuyển động hướng tớimục tiêu Mô hình lấy cảm hứng từ hành vi bao vây của động vật săn mồi – mộtchiến lược hiệu quả để xử lý tình huống mục tiêu có tốc độ cao hơn đối tượng đitheo dõi Trong [84], Sung đã phát triển một thuật toán phân nhiệm cả mục tiêu
và đường đi cho các robot trong bài toán theo dõi mục tiêu di động sử dụng sốlượng lớn robot dựa trên thông tin cục bộ, khung chiến lược của Floreen và thuậttoán tham lam Trong [85], Zhou xem xét vấn đề ổn định, kháng lỗi của thuật toánlập kế hoạch cho bài toán theo dõi đa mục tiêu của MRS
Nhận xét 1.3.1: Như trình bầy ở trên, các nghiên cứu về MRS theo dõi đamục tiêu rất đa dạng về nội dung, phương pháp và kết quả Lý do là các nghiêncứu thực hiện trên nhiều mô hình môi trường khác nhau (chủ yếu là mô hình 2Ddạng liên tục hoặc chia ô lưới hoặc phân vùng kiểu Voronoi, một số ở dạng 3D);đối tượng robot khác nhau (chỉ gồm các robot hoặc các robot kết hợp các nút cảmbiến tĩnh); mục tiêu khác nhau (tĩnh hoặc động; một hoặc nhiều), Hầu hết cácnghiên cứu giả thiết rằng các robot luôn duy trì kết nối đầy đủ (Full Connectivity)trong mạng đa robot Giả thiết này được cho là đã đơn giản hóa bài toán và khôngthực sự phù hợp với thực tế và tác động mạnh đến hiệu quả của cách tiếp cận giảiquyết bài toán như chỉ ra trong [56] Khác với các nghiên cứu này, luận án này xemxét bài toán theo dõi đa mục tiêu đặt trong ràng buộc mọi robot trong bầy luônduy trì kết nối với MRS Mô hình môi trường có các ràng buộc cụ thể như các đíchphân bố ngẫu nhiên, liên thông Ràng buộc này được hiểu là nếu bầy robot chiếmđóng được một đích thì luôn nhìn thấy một đích khác, cho đến khi nhìn thấy tất
cả các đích Luận án cũng sẽ xem xét và tìm giải pháp cho trường hợp các đíchkhông liên thông
1.3.2 Bao phủ
Bài toán bao phủ nghiên cứu cách thức phối hợp giữa các robot để tạo ravùng bao phủ của cảm biến lên môi trường cho mục đích giám sát Các nghiên cứuhiện nay có thể phân chia thành ba loại gồm: tiếp cận hình học, trường thế nhântạo, và mô hình xác suất
Trang 35Fig 3 Lloyd continuous-time algorithm for 32 agents on a convex polygonal environment, with the Gaussian density function of Fig 1 The control gain
in (6) is k prop = 1 for all the vehicles The left (respectively, right) figure illustrates the initial (respectively, final) locations and Voronoi partition The central
figure illustrates the gradient descent flow.
finite number of arguments.
We shall alternatively consider networks of robotic agents
with computation, sensing, and control capabilities In this
and control capabilities as before Furthermore, we assume the
processor can detect any other agent within a closed disk of
quantity controllable by the processor.
Remark 4.1: We assume all communication between agents
and all sensing of agents locations to be always accurate and
instantaneous.
Consider the closed-loop system formed by the evolution
The network evolution is said to be Voronoi-distributed if
each u i (p 1 , , p n ) can be written as a function of the form
u i (p i , p i 1 , , p i m ), with i k ∈ N (i), k ∈ {1, , m} It
relationships in a planar Voronoi diagram [9, see Section 2.3].
As a consequence, the number of Voronoi neighbors of each
that sites are Voronoi-neighbors if they share an edge, not
just a vertex.) Accordingly, we argue that Voronoi-distributed
algorithms lead to scalable networks Finally, note that the
Voronoi-distributed dynamical system is not the same for all
possible configurations of the network In other words, the
identity of the Voronoi neighbors changes along the evolution,
i.e., the topology of the closed-loop system is dynamic.
B Voronoi cell computation and maintenance
A key requirement of the Lloyd algorithms presented in
Section III is that each agent must be able to compute its own
Voronoi cell To do so, each agent needs to know the relative
location (distance and bearing) of each Voronoi neighbor The
ability of locating neighbors plays a central role in numerous
algorithms for localization, media access, routing, and power
control in ad-hoc wireless communication networks; e.g.,
see [39], [40], [41] and references therein Therefore, any
motion control scheme might be able to obtain this information
from the underlying communication layer In what follows, we
set out to provide a distributed asynchronous algorithm for
the local computation and maintenance of Voronoi cells The algorithm is related to the synchronous scheme in [41] and is based on basic properties of Voronoi diagrams.
We present the algorithm for a robotic agent with sensing capabilities (as well as computation and control) The pro-
which provides enough information to compute the Voronoi
q k This argument guarantees the correctness of the A DJUST
this algorithm is illustrated in Fig 4.
TABLE I
At time t i , local agent i performs:
1: initialize R i , detect all p j within radius R i
algorithm can be designed for a robotic agent with cation capabilities The specifications go as in the previous
communi-Hình 1.4: Phân vùng Voronoi được tạo bởi 32 robot cùng hàm mật độ Gauss được minh họa trong [66] Hình trái và phải biểu diễn phân vùng Voronoi tương ứng vị trí khởi tạo
và kết thúc; hình giữa biểu diễn quỹ đạo chuyển động cùng điều khiển gradient.
Tiếp cận hình học chủ yếu dựa trên lý thuyết giản đồ Voronoi [86], chia khônggian nhiệm vụ thành các phân vùng Voronoi (Voronoi Partition) dựa trên vị trícủa các robot Mỗi phân vùng có một điểm tâm được xác định dựa trên hàm mật
độ phân bố của đối tượng cần giám sát Các phân vùng được cập nhật liên tục dựatrên vị trí hiện thời của robot Các robot được điều khiển di chuyển hướng đến tâmphân vùng Voronoi Nhờ vậy, các robot được trải ra môi trường, bao phủ lên cácđối tượng cần giám sát Trong [66], Cortés đề xuất thuật toán phân vùng Voronoitheo kiểu phân tán Phân vùng Voronoi của một robot được xác định thông quamột số bước lặp Trong mỗi bước lặp, phân vùng tạm thời được xác định là khônggian giao của vùng cảm nhận hình đĩa tròn và các nửa mặt phẳng chia đều khônggian giữa robot và robot khác trong vùng cảm nhận đĩa tròn của nó Bán kínhcảm nhận được khởi tạo và hiệu chỉnh trong mỗi bước lặp của thuật toán cho đếnkhi nó không bé hơn hai lần khoảng cách tới điểm xa nhất trong phân vùng Tâmphân vùng Voronoi cũng được tính toán phân tán sử dụng hàm mật độ phân bốcủa đối tượng trong môi trường Cortés cũng đề xuất bộ điều khiển bao phủ dựatrên thuật toán Lloyd cổ điển sử dụng các hàm tính phân vùng và tâm Voronoi
để điều khiển các robot hội tụ đến các điểm tâm phân vùng Voronoi Phiên bản
mở rộng áp dụng cho các robot có vùng tương tác hạn chế được Cortés trình bầytrong [87] Trong [88], Guruprasad đề xuất thuật toán phân vùng Voronoi theokiểu phân tán tương tự như [66] trong đó phân vùng Voronoi của một robot đượctạo ra bởi các cung tương ứng với các robot khác nằm trong vùng có khoảng cáchbằng hai lần bán kính cảm nhận của nó, chỉ khác là phương pháp này yêu cầu cácrobot trao đổi thông tin vị trí với nhau ở thời điểm bắt đầu của thuật toán Chiếnlược điều khiển bao phủ sử dụng phân vùng Voronoi cũng được áp dụng cho nhómcác robot đồng nhất trong môi trường có cấu trúc không lồi (non-convex) [89, 90]
Cụ thể, trong [89], Luciano phát triển thuật toán trong [66] cho trường hợp robot
sử dụng nhiều loại cảm biến khác nhau và trường hợp robot được mô hình như một
18
Trang 36đĩa tròn, không phải là một chất điểm Trong [90], Breitenmoser điều khiển baophủ bằng cách kết hợp thuật toán trong [66] để tính toán phân vùng Voronoi vàcập nhật mục tiêu tức thời, và thuật toán lập kế hoạch đường đi tới đích để tránhvật cản và xử lý các góc Khai thác [66], Schwager trong [91] phát triển luật điềukhiển thích nghi nhằm tối ưu vùng bao phủ của mạng đa robot Thuật ngữ thíchnghi được hiểu là luật điều khiển sử dụng các phép đo cảm biến và truyền thôngtrong mạng để thu nhận thông tin toàn cục về môi trường Nhờ vào việc nhậnbiết được mô hình môi trường nên điều khiển có thể thích nghi với các thay đổi.Trong một nghiên cứu khác [92], Schwager trình bầy một thuật toán điều khiểnphân tán điều khiển nhóm robot phân tán tạo ra vùng bao phủ thích nghi Cácrobot sử dụng cơ chế học trực tuyến để ước tính các khu vực trong môi trườngyêu cầu tập trung bao phủ trong khi đồng thời khám phá môi trường trước khi dichuyển đến vị trí cuối cùng để tạo ra vùng bao phủ Robot học môi trường thôngqua một hàm trọng số đại diện cho mức độ quan trọng của các vùng khác nhaucủa bộ điều khiển bao phủ sử dụng phân vùng Voronoi Trong [93], Soltero đề xuấtmột thuật toán lập kế hoạch đường đi và điều khiển gradient phân tán thích nghidựa trên phân vùng Voronoi cho MRS để thực hiện nhiệm vụ bao phủ trong môitrường không biết trước Trong [94], Bryngelsson sử dụng phương pháp phân vùngVoronoi trong [66] [90] để thực hiện bài toán bao phủ và tuần tra của MRS trong dự
án nghiên cứu hệ thống nhận thức đa robot hoạt động trong bệnh viện Trong [95],Pavone xem xét một phương pháp phân vùng không gian nơi robot cần thỏa hiệp
để cân bằng trong phân công nhiệm vụ đối với các vùng môi trường Trong [12],Việt đề xuất thuật toán BoB sử dụng cơ chế quay lui và đường cầy, tiếp cận theokiểu thị trường Robot chỉ sử dụng tương tác cục bộ và phối hợp thực hiện đồngthời các vùng không chồng lấn theo cách gia tăng thông qua chuyển động theo kiểuđường cầy và quay lui BoB sử dụng thuật toán A* để tìm kiếm, di chuyển đến cácvùng chưa viếng thăm gần nhất Các robot hoàn thành bao phủ khi không pháthiện thêm vùng tự do nào Trong [96], Alitappeh đề xuất chiến lược triển khai đểphân tán tối ưu một nhóm robot vào môi trường có cấu trúc (tòa nhà có hànhlang lớn như bệnh viện, trường học, ) trong hai ứng dụng là bao phủ và giám sátthông số Đề xuất này biểu diễn môi trường như một bản đồ cấu trúc chuyển đổibài toán hai hoặc ba chiều gốc thành bài toán đơn giản một chiều, bởi vậy giảmđược chi phí tính toán của giải pháp Vị trí tối ưu của robot được xác định thôngqua phân vùng Voronoi Robot có thể tiếp cận vị trí cuối cùng bằng cách thực hiệnmột chuỗi các lệnh trực quan, giống người mà không yêu cầu định vị toàn cục.Khác với phương pháp sử dụng giản đồ Voronoi, trong [97], GeuNho Lee dựa trên
Trang 37Lee et al. 15
Fig 10 (a) A shortest s,g-path (shown in red) in a region covered by a triangulation T The resulting T -greedy path is depicted in
(b) A triangle is intersected by a straight line L If L passes through the triangle away from one of the endpoints, then the length of
Theorem 5.4 Consider a ( ρ, α)-fat triangulation T of a
planar region R, with vertex set V, maximum and minimum
edge lengths r max and r min , respectively Let s, g be points
in R that are separated by at least one triangle, i.e the
triangles s , g in T that contain s and g do not share a
vertex Let p( s, g) be a shortest polygonal path in R that
connects s with g, and let d p ( s, g) be its length Let pT( s, g)
be a T -greedy path between s and g, of length d pT( s, g).
Then d pT( s, g) ≤ c · d p ( s, g) +2, for c = 2π
α sin(ρ α/2) , and
d pT( s, g) ≤ c· d p ( s, g), for c = 6π
α sin(ρ α/2) .
Proof Consider p( s, g), triangles s, g and the sequence
1 , , of other triangles intersected by it; by
assumption, ≥ ≥ 1, where is the number of
tri-angles contained in pT( s, g) Furthermore, note that the
disjointness of s, g implies d p ( s, g) ≥ r min.
We first show that d p ( s, g) ≥ 2π
this purpose, we charge the intersection of p( s, g) with i
to i, if its length is at least 2 sin(α/2)rmin ; if it is shorter,
we charge the length of the intersection of p( s, g) with the
r min /2-disk around one of ’s vertices p jevenly to all of the
triangles i that are incident to p j Because the minimum
angle in a triangle is bounded from below byα, the
preced-ing lemma implies the claimed lower bound on the length
of d p ( s, g).
On the other hand, it is straightforward to see that no edge
in a T -greedy s, g-path can be longer than 2r max Therefore,
d pT( s, g) ≤ 2( + 2) r max Comparing the lower bound on
d p ( s, g) and the upper bound on d pT( s, g) yields the claim
d pT( s, g) ≤ c · d p ( s, g) +2 with c as stated The additive
term of 2 results from s and g possibly being close to the
boundaries of s and g, respectively; it can be removed
by noting that ≥ ≥ 1 implies ( +2) ≤ 3 , as indicated
by the second comparison and the choice of c.
This provides constant stretch factors even under
mini-mal, highly pessimistic assumptions The practical
perfor-mance in real-world settings in which the greedy paths
do not visit worst-case points in the visited triangles is considerably better, as we show in Section 5.4.
5.4 Dual graph navigation experiments
We conducted experiments for the dual graph navigation
in a triangulation, as shown in Figure 11a The quality of the triangulation is (ρ=1.36, α = 0.88 rad)-fat Given this
triangulated network, we carried out 34 trials for the dual graph navigation from various starting to goal triangle com- binations For each trial, robots forming the triangulation successfully build a breath first tree in the dual graph Figure 11b shows the MATLAB reconstruction of the tri- angulation for the dual graph experiment by combining the data from the PDS of the triangulation with the position- ing data of each robot measured by AprilTag (Olson, 2011) Note that the AprilTag positioning data is only for plot- ting the shape of the triangulation and navigation path All robots for the triangulation and dual graph navigation do not use this positioning data in these experiments Other infor- mation including triangle ownership, primal graph, and hop
of each triangle is from the PDS The thick blue lines cate the primal graph that concatenates all pairs of owners whose triangles are adjacent with each other and maps the connected dual graph in the triangulation Although this graph is not a complete union of triangulation edges, it
indi-is a spanning graph of all triangle owners in G, which indi-is
implied by theorem 5.2 Five red-colored lines indicate the sample traces of the navigation robot among the entire 34 trials from various initial locations to the same destination triangle While the shape of most resulting paths is smooth and straight, some parts of them are undulated These incor- rect navigation paths are caused by the errors of the occu- pancy test algorithm, not by structural errors of the topology
in the dual graph Note that errors of the occupancy test algorithm occur when the navigation robot, whose bearing sensing resolution is π8, incorrectly measures the bearing of
Hình 1.5: Lưới tam giác được minh họa trong [98] Các nút đã triển khai được sử dụng
để định tuyến và dẫn đường cho các nút triển khai sau Đường mầu đỏ minh họa tuyến
đường s, g ngắn nhất, mầu vàng minh họa kết quả thực hiện đường đi bởi thuật toán
tham lam.
cấu trúc hình học để điều khiển MRS tạo lưới bao phủ có cấu trúc tam giác cân
Trong [98], S.K Lee đề xuất một chiến lược triển khai ba tầng tạo lưới tam giác
Tầng triển khai xây dựng cấu trúc tam giác dựa trên tính toán hình học từ thông
tin cục bộ và hình thành cấu trúc dữ liệu vật lý PDS (Physical Data Structure)
từ các tam giác Tầng dẫn đường sử dụng PDS cho định tuyến và dẫn đường tới
các đỉnh ảo trong cấu trúc tam giác Tầng hạ tầng toàn cục sử dụng cấu trúc tam
giác để tính gần đúng phân vùng Voronoi dạng topo bậc cao dùng cho các nhiệm
vụ phối hợp phức tạp như tuần tra của MRS Trong [99], Karapetyan phát triển
thuật toán bao phủ không gian dựa trên việc phân chia các ô lưới bởi thuật toán
tham lam Trong [100], Gao xem xét bài toán tìm đường bao phủ tối ưu cho hệ
thống đa robot trong môi trường có vật cản Tác giả sử dụng thuật toán phân chia
vùng dựa trên vị trí khởi tạo của robot để chia môi trường cần khảo sát thành các
vùng con bằng nhau và sử dụng thuật toán cây nhị phân cho lập kế hoạch đường
đi bao phủ Các nút có thể trao đổi thông tin để tạo cây bao trùm có hình dạng
lý tưởng, giảm số lượng các nhánh rẽ trong cây bao phủ Trong [101], Lopez-Perez
triển khai các robot khám phá môi trường không biết trước bằng cách sử dụng
giản đồ phân vùng kịch bản và thiết lập trọng số giữa vùng đã khám phá và vùng
chưa khám phá
Phương pháp trường lực thế nhân tạo APF kết hợp các trường lực nhân tạo
(gồm trường lực đẩy và lực hút giữa các robot, trường lực đẩy giữa robot với vật
cản, một số nghiên cứu có thêm trường lực hút giữa robot với đối tượng mục tiêu
khác [34], [39]) để tạo ra lực tổng hợp nhằm phân tán các robot vào môi trường
như đã giới thiệu trong tiểu mục 1.2.2 Ví dụ điển hình của phương pháp này
là nghiên cứu được trình bầy trong [32] Trong nghiên cứu này, Howard đã triển
20
Trang 38khai mạng cảm biến di động quy mô lớn để bao phủ môi trường có cấu trúc giốngsàn của một tầng nhà gồm hành lang và các phòng liên thông với nhau Lực thếtổng hợp trên mỗi robot có tác dụng đẩy chúng tiến sâu vào trong môi trường từ
vị trí khởi tạo giống như vết dầu loang cho đến khi chiếm toàn bộ môi trường.Trong [102], Poduri đề xuất thuật toán kinh nghiệm dựa trên APF để phân táncác nút cảm biến nhằm tối đa bao phủ của mạng môi trường không biết trước vớiràng buộc tối thiểuk nút hàng xóm Các nghiên cứu trong [33] [39] điều khiển cácrobot để sắp xếp theo cấu trúc hình vuông/lục giác hoặc phân bố đều bao phủ môitrường Nghiên cứu trong [34] triển khai các robot cho bài toán tối ưu các tiện íchcủa mạng cảm biến di động Trong [103], Sailesh phát triển thuật toán triển khaiMRS tạo lưới bao phủ lục giác dựa trên APF và thuật toán sửa lỗi Trong [104],Prabhu tạo ra vùng bao phủ có cấu trúc đường thẳng, hình tròn, lưới tam giác
và lưới vuông Một số nghiên cứu triển khai MRS theo đội hình có cấu trúc mongmuốn [105], [106], [36]
Một phương pháp phổ biến khác cho triển khai MRS là mô hình xác suất.Trong [107], Howard đề xuất một thuật toán định vị robot nhằm tối đa xác suấtphát hiện sự kiện xuất hiện trong môi trường cần giám sát Một mạng cảm biến diđộng quy mô lớn được triển khai để giám sát môi trường không biết trước có cấutrúc giống sàn của tòa nhà (gồm hành lang và các phòng) Từng nút được triểnkhai vào môi trường, nút sau sử dụng thông tin của nút trước tổng hợp trong lướichiếm đóng để xác định vị trí đích của nó Trạng thái của mỗi ô lưới chiếm đóngđược xác định bởi kỹ thuật xác suất Bayes Thuật toán triển khai thực hiện trongbốn giai đoạn là khởi tạo, lựa chọn, phân công và thực hiện Mỗi nút có ba trạngthái là đợi, hoạt động và đã triển khai Giai đoạn chọn quyết định dựa trên kỹthuật xác suất để xác định điểm mục tiêu có vùng bao phủ lớn nhất Giai đoạnphân công quyết định một robot ở vị trí thuận lợi nhất để chiếm mục tiêu chuyển
từ trạng thái đợi sang trạng thái triển khai Trong [108], Li triển khai mạng cảmbiến di động để bao phủ môi trường Không gian nhiệm vụ được mô hình hóa sửdụng một hàm phân bố đặc trưng cho tần suất xuất hiện các sự kiện trong khônggian đó Để có thể tính toán phân tán trên mỗi robot, Li đã rời rạc hàm phân bốxác suất dựa trên việc chia ô lưới trong không gian cảm nhận của robot Khi cácrobot được triển khai và dữ liệu được thu thập, một robot có thể cập nhật bản đồcủa nó thông qua việc hợp nhất những quan sát mới và thông qua các thông tintrao đổi từ các hàng xóm Bộ điều khiển độ dốc có nhiệm vụ tối đa hóa xác suấtxuất hiện của sự kiện trong không gian nhiệm vụ Trong [109], một mạng các nútcảm biến cố định được triển khai trước làm mốc để dẫn đường cho các robot di
Trang 39(b)
(c)
Fig 2 A proto-typical deployment experiment for a 100-node network (a) Initial network
configuration (b) Final configuration after 300 seconds (c) Occupancy grid generated for
the final configuration; visible space is marked in black (occupied) or white (free); unseen
space is marked in gray.
Hình 1.6: Thí nghiệm mô phỏng mạng cảm biến di động được triển khai bao phủ môi trường cấu trúc trong [32] cùng 100 nút sử dụng phương pháp trường thế nhân tạo: Hình
a, b, c tương ứng biểu diễn cấu trúc khởi tạo, triển khai sau 300 giây và cấu trúc kết thúc.
động sử dụng mô hình xác suất nhằm khám phá và bao phủ
Trong [110], Zou kết hợp trường hút và đẩy để phát triển thuật toán lực ảocho chiến lược triển khai phân cụm mạng cảm biến di động nhằm tối đa bao phủcủa vùng cảm nhận Các điểm mục tiêu trong mỗi phân cụm được xác định thôngqua thuật toán định vị sử dụng mô hình xác suất Trong [111], Howard trình bầythí nghiệm thực nghiệm cho nhóm robot di động đồng nhất quy mô lớn triển khai
để khám phá và theo dõi sự xâm nhập trong môi trường trong nhà Nghiên cứu đềcập bài toán khám phá, lập bản đồ, triển khai và phát hiện mục tiêu Thuật toán
22
Trang 40sử dụng mô hình xác suất để xây dựng lưới chiếm đóng cho hoạt động triển khai.Trong [112], Minyi-Zhong đề xuất chiến lược điều khiển gradient để điều khiển cácnút di động của mạng cảm nhận không dây nhằm tối đa xác suất phát hiện sựkiện xuất hiện ngẫu nhiên trong không gian nhiệm vụ và trích xuất thông tin từcác nguồn dữ liệu khi được phát hiện Thuật toán có khả năng phát hiện các vậtcản đa giác, duy trì kết nối sử dụng thông tin định tuyến của nút Trong [113],Liu trình bầy một phương pháp cho bao phủ động của mạng cảm biến di động sửdụng hàm phân bố không gian Poisson nhấn mạnh vào di chuyển liên tục của cáccảm biến nhằm bù đắp những vị trí bị thiếu hụt có thể không được phát hiện bởimạng cảm biến cố định Trong [114], Palacios-Gasós giải quyết bài toán bao phủđộng Các robot phải liên tục di chuyển để duy trì mức bao phủ mong muốn luônthay đổi Thuật toán được đề xuất cho phép mọi robot ước lượng hàm bao phủtoàn cục dựa trên thông tin cục bộ Hàm này xác định khả năng cải thiện vùngbao phủ ở mỗi điểm của môi trường Thuật toán đưa ra chiến lược di chuyển củarobot tới các điểm để có mức độ cải thiện bao phủ tốt nhất Trong [115], Zhongthực hiện bài toán bao phủ môi trường không biết trước (2D) dạng lồi/lõm bởi hệthống đa robot sử dụng thuật toán Max-sum dựa trên trao đổi thông tin với cácrobot hang xóm, có thể áp dụng cho mô hình cảm biến đa hướng hoặc hình quạt.Trong [116], Schwager hợp nhất ba phương pháp triển khai nêu trên trongmột chiến lược duy nhất Một hàm chi phí được đề xuất được xem như tham số,
ký hiệu là α, để phân biệt các phương pháp triển khai, cụ thể: α = 1 đại diện chophương pháp xác suất, α = −∞ cho phương pháp hình học và α = 1 cho phươngpháp trường thế
Nhận xét 1.3.2: Vùng bao phủ của cảm biến được tạo ra bởi MRS tỷ lệ vớiphân bố của các robot trong môi trường, theo cấu trúc lưới có hình dạng địnhtrước (Predefined pattern) như tam giác, tứ giác, lục giác, [97, 98, 103, 104] ở
đó các robot chiếm đóng các đỉnh của các hình, hoặc phổ biến trong hầu hết cácnghiên cứu là dạng tự do, không có cấu trúc (Free configuration) ở đó các robotđược phân bố tự do Có nhiều phương pháp triển khai bao phủ, tuy nhiên chưa cónghiên cứu nào giải quyết bài toán này bằng chiến lược theo dõi đa mục tiêu Từtồn tại này, luận án khai thác đặc trưng của vùng bao phủ có cấu trúc định trước,được sinh ra từ một bộ tạo đích ảo (Virtual Target) do vậy có thể áp dụng chiếnlược theo dõi đa mục tiêu để chiếm đóng các đích ảo từ đó tạo vùng bao phủ cócấu trúc
Đánh giá 1.3: Các nghiên cứu về triển khai MRS theo dõi đa mục tiêu vàbao phủ rất đa dạng, thường được thực hiện với giả thiết mạng MRS luôn được
... trúc liệu vật lý PDS (Physical Data Structure)từ tam giác Tầng dẫn đường sử dụng PDS cho định tuyến dẫn đường tới
các đỉnh ảo cấu trúc tam giác Tầng hạ tầng toàn cục sử dụng cấu trúc... tiêu chuyển
từ trạng thái đợi sang trạng thái triển khai Trong [108], Li triển khai mạng cảmbiến di động để bao phủ môi trường Khơng gian nhiệm vụ mơ hình hóa s? ?dụng hàm phân bố đặc trưng... vị sử dụng mơ hình xác suất Trong [111], Howard trình bầythí nghiệm thực nghiệm cho nhóm robot di động đồng quy mô lớn triển khai
để khám phá theo dõi xâm nhập môi trường nhà Nghiên cứu