Điều khiển dẫn đường hành vi cho robot di động hai bánh vi sai

Bài báo đề xuất cấu trúc điều khiển dẫn đường hành vi mới BBFM cho robot di động. Cấu trúc BBFM là sự kết hợp giữa logic mờ để thiết kế các bộ điều khiển mờ thực thi các hành vi độc lập và lý thuyết quyết định tối ưu đa mục tiêu để lựa chọn giá trị điều khiển thỏa mãn tốt nhất tất cả các mục tiêu. Mời các bạn cùng tham khảo!

Trang 1

Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)

Điều Khiển Dẫn Đường Hành Vi Cho Robot Di Động

Hai Bánh Vi Sai

Nguyễn Thị Thanh Vân, Phùng Mạnh Dương, Đặng Anh Việt, Quách Công Hoàng, Trần Quang Vinh

Khoa Điện tử - Viễn thông, Đại học Công nghệ, Đại học Quốc Gia Hà nội

144 Xuân Thủy, Cầu Giấy, Hà nội Email: vanntt@vnu.edu.vn

Abstract— Bài báo đề xuất cấu trúc điều khiển dẫn đường hành

vi mới BBFM cho robot di động Cấu trúc BBFM là sự kết hợp

giữa logic mờ để thiết kế các bộ điều khiển mờ thực thi các hành

vi độc lập và lý thuyết quyết định tối ưu đa mục tiêu để lựa chọn

giá trị điều khiển thỏa mãn tốt nhất tất cả các mục tiêu Cách

thức kết hợp này có ưu điểm khi sử dụng logic mờ thiết kế các

hàm mục tiêu dễ dàng, hiệu quả và phù hợp với đặc điểm của

môi trường hoạt động chứa nhiều yếu tố bất định, trong khi tối

ưu đa mục tiêu cho phép lựa chọn giá trị điều khiển cuối cùng

thỏa mãn tốt nhất tất cả các mục tiêu đặt ra Hiệu quả của cấu

trúc điều khiển đề xuất được kiểm chứng qua chương trình mô

phỏng, so sánh và đánh giá với các cấu trúc điều khiển dẫn

đường hành vi có trước

Keywords – Điều khiển dẫn đường hành vi, logic mờ, tối ưu đa

mục tiêu, robot di động

I GIỚITHIỆU Dẫn đường được xem như với một phần hiểu biết về môi

trường và một vị trí đích hoặc một số vị trí cùng với giá trị thu

được của cảm biến, robot có khả năng đạt tới vị trí đích một

cách hiệu quả và tin cậy [1, 2] Cấu trúc điều khiển dẫn đường

có thể được phân thành ba loại [3]: cấu trúc thứ bậc hoạt động

tuần tự với các bước cảm nhận, lập kế hoạch và hành động dựa

trên mô hình chính xác của môi trường toàn cục sẽ điều khiển

robot theo một đường đi tối ưu; cấu trúc phản ứng hay hành vi

chia nhiệm vụ phức tạp thành các nhiệm vụ nhỏ để thực hiện vì

thế đáp ứng nhanh với môi trường động và không biết trước;

cấu trúc lai là sự kết hợp của hai cấu trúc trên để tận dụng ưu

điểm lập kế hoạch của cấu trúc thứ bậc và đáp ứng nhanh của

cấu trúc phản ứng trong môi trường động

Trong ba cấu trúc điều khiển dẫn đường trên thì cấu trúc hành

vi được sử dụng nhiều trong các ứng dụng của robot hoạt động

trong môi trường chưa biết bởi tính đơn giản nhưng hiệu quả

đạt được cao Việc chia nhiệm vụ dẫn đường phức tạp thành

các nhiệm vụ nhỏ đã làm tăng hiệu suất hoạt động của toàn hệ

thống Vấn đề quan trọng trong cấu trúc điều khiển hành vi là

cách kết hợp hiệu quả hay cách giải quyết xung đột giữa các

loại hành vi khác nhau để đạt được kết quả tốt Các kỹ thuật

này được phân thành hai phần chính trong cấu trúc điều khiển

hành vi: lựa chọn hành vi và trộn lệnh Lựa chọn hành vi sẽ

quyết định một hay nhiều hành vi tham gia điều khiển tại cùng

một thời điểm Một số các kỹ thuật lựa chọn hành vi điển hình

như: cấu trúc xếp gộp của Book [4], cấu trúc ưu tiên của Dupre

[5], hay siêu luật mờ [6,7] Kỹ thuật trộn lệnh sẽ được sử dụng

khi có nhiều hành vi được lựa chọn, khi đó nó sẽ quyết định

lệnh điều khiển duy nhất từ nhiều lệnh được sinh ra bởi nhiều

hành vi khác nhau Một số kỹ thuật trộn lệnh như sơ đồ chuyển mạch [8], tổng hợp véc tơ [9], sử dụng bộ lọc thông tin phân tán [10] hay logic mờ [11]

Khi logic mờ được sử dụng cả trong kỹ thuật lựa chọn hành vi

và trộn lệnh thì phương pháp này được gọi là kết hợp phụ thuộc vào ngữ cảnh – CDB [12, 13] và đã ứng dụng nhiều trong các hệ thống dẫn đường robot di động hiện nay [14-16] Phương pháp CDB đã tạo nên cấu trúc điều khiển hành vi linh hoạt, đáp ứng nhanh với những biến động của môi trường chưa biết, tuy nhiên khi sử dụng kỹ thuật trộn lệnh để xác định giá trị điều khiển cuối cùng sẽ gặp một số hạn chế do phương pháp giải mờ đem lại Bên cạnh đó, cấu trúc MOASMs được đề xuất bởi P Pirjanian [17] được xem như là một kỹ thuật trộn lệnh

sử dụng khái niệm hành vi tối ưu Phương pháp này đã áp dụng

lý thuyết quyết định đa mục tiêu để xác định hành vi phù hợp

và tối ưu theo quan điểm Pareto từ một tập các hành vi khác nhau Phương pháp này tỏ ra hiệu quả khi kết quả tìm được là tối ưu Pareto nhưng cũng thể hiện hạn chế trong việc xác định hàm mục tiêu của hành vi

Để khắc phục hạn chế của vấn đề trộn lệnh trong các kỹ thuật trên, bài báo đề xuất một cấu trúc điều khiển dẫn đường hành

vi kết hợp logic mờ và lý thuyết quyết định tối ưu đa mục tiêu, gọi tắt là BBFM Trong cấu trúc điều khiển này, hành vi dẫn đường phức tạp được chia thành các hành vi nhỏ và mỗi hành

vi sẽ được thực thi bằng một bộ điều khiển mờ Hàm thuộc lối

ra của mỗi bộ điều khiển được xem như là hàm mục tiêu của mỗi hành vi do thể hiện mức độ mong muốn đạt được của biến điều khiển theo mục tiêu của hành vi đó Giá trị cuối cùng của các biến điều khiển sẽ được xác định bằng lý thuyết quyết định tối ưu đa mục tiêu với các hàm mục tiêu của các hành vi đã được thiết lập từ các bộ điều khiển Cấu trúc BBFM đề xuất phát huy được ưu điểm khi sử dụng logic mờ để thiết kế các bộ điều khiển mờ một cách dễ dàng, hiệu quả, thích hợp với các yếu tố bất định của robot cũng như môi trường hoạt động Đồng thời, việc sử dụng lý thuyết quyết định tối ưu đa mục tiêu cho phép xác định giá trị điều khiển tối ưu Pareto

Bài báo được trình bày thành 6 phần Phần 2 giới thiệu về mô hình hệ thống robot di động hai bánh vi sai hệ thống điều khiển dẫn đường Cấu trúc điều khiển dẫn đường hành vi BBFM đề xuất được trình bày chi tiết trong phần 3 Phần 4 trình bày ví

dụ thiết kế hệ thống dẫn đường cho robot di động sử dụng cấu trúc điều khiển đề xuất cùng với hai cấu trúc điều khiển khác là MOASMs và CDB điển hình nhằm mục đích so sánh và đánh giá Mô phỏng kiểm chứng và đánh giá so sánh được trình bày

ở phần 5 Cuối cùng là kết luận và hướng phát triển tiếp theo trong phần 6

Trang 2