1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

Điều khiển dẫn đường hành vi cho robot di động hai bánh vi sai

6 9 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 6
Dung lượng 514,46 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Bài báo đề xuất cấu trúc điều khiển dẫn đường hành vi mới BBFM cho robot di động. Cấu trúc BBFM là sự kết hợp giữa logic mờ để thiết kế các bộ điều khiển mờ thực thi các hành vi độc lập và lý thuyết quyết định tối ưu đa mục tiêu để lựa chọn giá trị điều khiển thỏa mãn tốt nhất tất cả các mục tiêu. Mời các bạn cùng tham khảo!

Trang 1

Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)

Điều Khiển Dẫn Đường Hành Vi Cho Robot Di Động

Hai Bánh Vi Sai

Nguyễn Thị Thanh Vân, Phùng Mạnh Dương, Đặng Anh Việt, Quách Công Hoàng, Trần Quang Vinh

Khoa Điện tử - Viễn thông, Đại học Công nghệ, Đại học Quốc Gia Hà nội

144 Xuân Thủy, Cầu Giấy, Hà nội Email: vanntt@vnu.edu.vn

Abstract— Bài báo đề xuất cấu trúc điều khiển dẫn đường hành

vi mới BBFM cho robot di động Cấu trúc BBFM là sự kết hợp

giữa logic mờ để thiết kế các bộ điều khiển mờ thực thi các hành

vi độc lập và lý thuyết quyết định tối ưu đa mục tiêu để lựa chọn

giá trị điều khiển thỏa mãn tốt nhất tất cả các mục tiêu Cách

thức kết hợp này có ưu điểm khi sử dụng logic mờ thiết kế các

hàm mục tiêu dễ dàng, hiệu quả và phù hợp với đặc điểm của

môi trường hoạt động chứa nhiều yếu tố bất định, trong khi tối

ưu đa mục tiêu cho phép lựa chọn giá trị điều khiển cuối cùng

thỏa mãn tốt nhất tất cả các mục tiêu đặt ra Hiệu quả của cấu

trúc điều khiển đề xuất được kiểm chứng qua chương trình mô

phỏng, so sánh và đánh giá với các cấu trúc điều khiển dẫn

đường hành vi có trước

Keywords – Điều khiển dẫn đường hành vi, logic mờ, tối ưu đa

mục tiêu, robot di động

I GIỚITHIỆU Dẫn đường được xem như với một phần hiểu biết về môi

trường và một vị trí đích hoặc một số vị trí cùng với giá trị thu

được của cảm biến, robot có khả năng đạt tới vị trí đích một

cách hiệu quả và tin cậy [1, 2] Cấu trúc điều khiển dẫn đường

có thể được phân thành ba loại [3]: cấu trúc thứ bậc hoạt động

tuần tự với các bước cảm nhận, lập kế hoạch và hành động dựa

trên mô hình chính xác của môi trường toàn cục sẽ điều khiển

robot theo một đường đi tối ưu; cấu trúc phản ứng hay hành vi

chia nhiệm vụ phức tạp thành các nhiệm vụ nhỏ để thực hiện vì

thế đáp ứng nhanh với môi trường động và không biết trước;

cấu trúc lai là sự kết hợp của hai cấu trúc trên để tận dụng ưu

điểm lập kế hoạch của cấu trúc thứ bậc và đáp ứng nhanh của

cấu trúc phản ứng trong môi trường động

Trong ba cấu trúc điều khiển dẫn đường trên thì cấu trúc hành

vi được sử dụng nhiều trong các ứng dụng của robot hoạt động

trong môi trường chưa biết bởi tính đơn giản nhưng hiệu quả

đạt được cao Việc chia nhiệm vụ dẫn đường phức tạp thành

các nhiệm vụ nhỏ đã làm tăng hiệu suất hoạt động của toàn hệ

thống Vấn đề quan trọng trong cấu trúc điều khiển hành vi là

cách kết hợp hiệu quả hay cách giải quyết xung đột giữa các

loại hành vi khác nhau để đạt được kết quả tốt Các kỹ thuật

này được phân thành hai phần chính trong cấu trúc điều khiển

hành vi: lựa chọn hành vi và trộn lệnh Lựa chọn hành vi sẽ

quyết định một hay nhiều hành vi tham gia điều khiển tại cùng

một thời điểm Một số các kỹ thuật lựa chọn hành vi điển hình

như: cấu trúc xếp gộp của Book [4], cấu trúc ưu tiên của Dupre

[5], hay siêu luật mờ [6,7] Kỹ thuật trộn lệnh sẽ được sử dụng

khi có nhiều hành vi được lựa chọn, khi đó nó sẽ quyết định

lệnh điều khiển duy nhất từ nhiều lệnh được sinh ra bởi nhiều

hành vi khác nhau Một số kỹ thuật trộn lệnh như sơ đồ chuyển mạch [8], tổng hợp véc tơ [9], sử dụng bộ lọc thông tin phân tán [10] hay logic mờ [11]

Khi logic mờ được sử dụng cả trong kỹ thuật lựa chọn hành vi

và trộn lệnh thì phương pháp này được gọi là kết hợp phụ thuộc vào ngữ cảnh – CDB [12, 13] và đã ứng dụng nhiều trong các hệ thống dẫn đường robot di động hiện nay [14-16] Phương pháp CDB đã tạo nên cấu trúc điều khiển hành vi linh hoạt, đáp ứng nhanh với những biến động của môi trường chưa biết, tuy nhiên khi sử dụng kỹ thuật trộn lệnh để xác định giá trị điều khiển cuối cùng sẽ gặp một số hạn chế do phương pháp giải mờ đem lại Bên cạnh đó, cấu trúc MOASMs được đề xuất bởi P Pirjanian [17] được xem như là một kỹ thuật trộn lệnh

sử dụng khái niệm hành vi tối ưu Phương pháp này đã áp dụng

lý thuyết quyết định đa mục tiêu để xác định hành vi phù hợp

và tối ưu theo quan điểm Pareto từ một tập các hành vi khác nhau Phương pháp này tỏ ra hiệu quả khi kết quả tìm được là tối ưu Pareto nhưng cũng thể hiện hạn chế trong việc xác định hàm mục tiêu của hành vi

Để khắc phục hạn chế của vấn đề trộn lệnh trong các kỹ thuật trên, bài báo đề xuất một cấu trúc điều khiển dẫn đường hành

vi kết hợp logic mờ và lý thuyết quyết định tối ưu đa mục tiêu, gọi tắt là BBFM Trong cấu trúc điều khiển này, hành vi dẫn đường phức tạp được chia thành các hành vi nhỏ và mỗi hành

vi sẽ được thực thi bằng một bộ điều khiển mờ Hàm thuộc lối

ra của mỗi bộ điều khiển được xem như là hàm mục tiêu của mỗi hành vi do thể hiện mức độ mong muốn đạt được của biến điều khiển theo mục tiêu của hành vi đó Giá trị cuối cùng của các biến điều khiển sẽ được xác định bằng lý thuyết quyết định tối ưu đa mục tiêu với các hàm mục tiêu của các hành vi đã được thiết lập từ các bộ điều khiển Cấu trúc BBFM đề xuất phát huy được ưu điểm khi sử dụng logic mờ để thiết kế các bộ điều khiển mờ một cách dễ dàng, hiệu quả, thích hợp với các yếu tố bất định của robot cũng như môi trường hoạt động Đồng thời, việc sử dụng lý thuyết quyết định tối ưu đa mục tiêu cho phép xác định giá trị điều khiển tối ưu Pareto

Bài báo được trình bày thành 6 phần Phần 2 giới thiệu về mô hình hệ thống robot di động hai bánh vi sai hệ thống điều khiển dẫn đường Cấu trúc điều khiển dẫn đường hành vi BBFM đề xuất được trình bày chi tiết trong phần 3 Phần 4 trình bày ví

dụ thiết kế hệ thống dẫn đường cho robot di động sử dụng cấu trúc điều khiển đề xuất cùng với hai cấu trúc điều khiển khác là MOASMs và CDB điển hình nhằm mục đích so sánh và đánh giá Mô phỏng kiểm chứng và đánh giá so sánh được trình bày

ở phần 5 Cuối cùng là kết luận và hướng phát triển tiếp theo trong phần 6

Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)

Trang 2

Điều Khiển Dẫn Đường Hành Vi Cho Robot Di Động

Hai Bánh Vi Sai

Nguyễn Thị Thanh Vân, Phùng Mạnh Dương, Đặng Anh Việt, Quách Công Hoàng, Trần Quang Vinh

Khoa Điện tử - Viễn thông, Đại học Công nghệ, Đại học Quốc Gia Hà nội

144 Xuân Thủy, Cầu Giấy, Hà nội Email: vanntt@vnu.edu.vn

Abstract— Bài báo đề xuất cấu trúc điều khiển dẫn đường hành

vi mới BBFM cho robot di động Cấu trúc BBFM là sự kết hợp

giữa logic mờ để thiết kế các bộ điều khiển mờ thực thi các hành

vi độc lập và lý thuyết quyết định tối ưu đa mục tiêu để lựa chọn

giá trị điều khiển thỏa mãn tốt nhất tất cả các mục tiêu Cách

thức kết hợp này có ưu điểm khi sử dụng logic mờ thiết kế các

hàm mục tiêu dễ dàng, hiệu quả và phù hợp với đặc điểm của

môi trường hoạt động chứa nhiều yếu tố bất định, trong khi tối

ưu đa mục tiêu cho phép lựa chọn giá trị điều khiển cuối cùng

thỏa mãn tốt nhất tất cả các mục tiêu đặt ra Hiệu quả của cấu

trúc điều khiển đề xuất được kiểm chứng qua chương trình mô

phỏng, so sánh và đánh giá với các cấu trúc điều khiển dẫn

đường hành vi có trước

Keywords – Điều khiển dẫn đường hành vi, logic mờ, tối ưu đa

mục tiêu, robot di động

I GIỚITHIỆU Dẫn đường được xem như với một phần hiểu biết về môi

trường và một vị trí đích hoặc một số vị trí cùng với giá trị thu

được của cảm biến, robot có khả năng đạt tới vị trí đích một

cách hiệu quả và tin cậy [1, 2] Cấu trúc điều khiển dẫn đường

có thể được phân thành ba loại [3]: cấu trúc thứ bậc hoạt động

tuần tự với các bước cảm nhận, lập kế hoạch và hành động dựa

trên mô hình chính xác của môi trường toàn cục sẽ điều khiển

robot theo một đường đi tối ưu; cấu trúc phản ứng hay hành vi

chia nhiệm vụ phức tạp thành các nhiệm vụ nhỏ để thực hiện vì

thế đáp ứng nhanh với môi trường động và không biết trước;

cấu trúc lai là sự kết hợp của hai cấu trúc trên để tận dụng ưu

điểm lập kế hoạch của cấu trúc thứ bậc và đáp ứng nhanh của

cấu trúc phản ứng trong môi trường động

Trong ba cấu trúc điều khiển dẫn đường trên thì cấu trúc hành

vi được sử dụng nhiều trong các ứng dụng của robot hoạt động

trong môi trường chưa biết bởi tính đơn giản nhưng hiệu quả

đạt được cao Việc chia nhiệm vụ dẫn đường phức tạp thành

các nhiệm vụ nhỏ đã làm tăng hiệu suất hoạt động của toàn hệ

thống Vấn đề quan trọng trong cấu trúc điều khiển hành vi là

cách kết hợp hiệu quả hay cách giải quyết xung đột giữa các

loại hành vi khác nhau để đạt được kết quả tốt Các kỹ thuật

này được phân thành hai phần chính trong cấu trúc điều khiển

hành vi: lựa chọn hành vi và trộn lệnh Lựa chọn hành vi sẽ

quyết định một hay nhiều hành vi tham gia điều khiển tại cùng

một thời điểm Một số các kỹ thuật lựa chọn hành vi điển hình

như: cấu trúc xếp gộp của Book [4], cấu trúc ưu tiên của Dupre

[5], hay siêu luật mờ [6,7] Kỹ thuật trộn lệnh sẽ được sử dụng

khi có nhiều hành vi được lựa chọn, khi đó nó sẽ quyết định

lệnh điều khiển duy nhất từ nhiều lệnh được sinh ra bởi nhiều

hành vi khác nhau Một số kỹ thuật trộn lệnh như sơ đồ chuyển mạch [8], tổng hợp véc tơ [9], sử dụng bộ lọc thông tin phân

tán [10] hay logic mờ [11]

Khi logic mờ được sử dụng cả trong kỹ thuật lựa chọn hành vi

và trộn lệnh thì phương pháp này được gọi là kết hợp phụ thuộc vào ngữ cảnh – CDB [12, 13] và đã ứng dụng nhiều trong các hệ thống dẫn đường robot di động hiện nay [14-16]

Phương pháp CDB đã tạo nên cấu trúc điều khiển hành vi linh hoạt, đáp ứng nhanh với những biến động của môi trường chưa biết, tuy nhiên khi sử dụng kỹ thuật trộn lệnh để xác định giá trị điều khiển cuối cùng sẽ gặp một số hạn chế do phương pháp giải mờ đem lại Bên cạnh đó, cấu trúc MOASMs được đề xuất bởi P Pirjanian [17] được xem như là một kỹ thuật trộn lệnh

sử dụng khái niệm hành vi tối ưu Phương pháp này đã áp dụng

lý thuyết quyết định đa mục tiêu để xác định hành vi phù hợp

và tối ưu theo quan điểm Pareto từ một tập các hành vi khác nhau Phương pháp này tỏ ra hiệu quả khi kết quả tìm được là tối ưu Pareto nhưng cũng thể hiện hạn chế trong việc xác định

hàm mục tiêu của hành vi

Để khắc phục hạn chế của vấn đề trộn lệnh trong các kỹ thuật trên, bài báo đề xuất một cấu trúc điều khiển dẫn đường hành

vi kết hợp logic mờ và lý thuyết quyết định tối ưu đa mục tiêu, gọi tắt là BBFM Trong cấu trúc điều khiển này, hành vi dẫn đường phức tạp được chia thành các hành vi nhỏ và mỗi hành

vi sẽ được thực thi bằng một bộ điều khiển mờ Hàm thuộc lối

ra của mỗi bộ điều khiển được xem như là hàm mục tiêu của mỗi hành vi do thể hiện mức độ mong muốn đạt được của biến điều khiển theo mục tiêu của hành vi đó Giá trị cuối cùng của các biến điều khiển sẽ được xác định bằng lý thuyết quyết định tối ưu đa mục tiêu với các hàm mục tiêu của các hành vi đã được thiết lập từ các bộ điều khiển Cấu trúc BBFM đề xuất phát huy được ưu điểm khi sử dụng logic mờ để thiết kế các bộ điều khiển mờ một cách dễ dàng, hiệu quả, thích hợp với các yếu tố bất định của robot cũng như môi trường hoạt động

Đồng thời, việc sử dụng lý thuyết quyết định tối ưu đa mục tiêu cho phép xác định giá trị điều khiển tối ưu Pareto

Bài báo được trình bày thành 6 phần Phần 2 giới thiệu về mô hình hệ thống robot di động hai bánh vi sai hệ thống điều khiển dẫn đường Cấu trúc điều khiển dẫn đường hành vi BBFM đề xuất được trình bày chi tiết trong phần 3 Phần 4 trình bày ví

dụ thiết kế hệ thống dẫn đường cho robot di động sử dụng cấu trúc điều khiển đề xuất cùng với hai cấu trúc điều khiển khác là MOASMs và CDB điển hình nhằm mục đích so sánh và đánh giá Mô phỏng kiểm chứng và đánh giá so sánh được trình bày

ở phần 5 Cuối cùng là kết luận và hướng phát triển tiếp theo trong phần 6

Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)

II MÔHÌNHHỆTHỐNG

Mô hình robot di động được xem xét trong nghiên cứu này là loại robot có hai bánh vi sai với ràng buộc không khả tích có cấu hình và tham số được thể hiện trên Hình 1 dưới đây

Hình 1: Mô hình robot di động hai bánh vi sai Trong đó, (OG, XG, YG) biểu diễn hệ tọa độ toàn cục, (OR,

XR,YR) biểu diễn hệ tọa độ cục bộ gắn liền với robot, R ký hiệu bán kính bánh xe và L là khoảng cách giữa hai bánh (x, y, θ)

là tọa độ và góc hướng hiện tại của robot trong hệ tọa độ toàn cục ρ là khoảng cách từ tâm robot tới vị trí đích và α là góc lệch giữa véctơ nối tâm của robot với điểm đích và véctơ góc hướng θ Phương trình động học của robot di động hai bánh vi sai sẽ là:

cos sin

x u

y u

 

 

 

 

(1)

u là vận tốc dài và ω là vận tốc góc của tâm robot Quan hệ ràng buộc không khả tích rút ra được từ phương trình trên được biểu diễn bởi:

y x   (2)

Mô hình rời rạc tại thời điểm tiếp theo i+1 thu được từ giá trị tại thời điểm hiện tại i và phương trình động học liên tục (1) ở trên với thời gian lấy mẫu Ts sẽ là:

1 1 1

os( ) sin( )

i i i s i

i i i s i

i i i s

x x u T c

T

(3)

Sơ đồ khối của hệ thống điều khiển dẫn đường phản hồi được trình bày ở Hình 2 Điểm đích (xd, yd, θd) cho trước trong không gian làm việc Với dữ liệu về môi trường và trạng thái hiện tại của robot thu được thông qua các cảm biến, bộ điều khiển dẫn đường sẽ đưa ra giá trị vận tốc dài u và vận tốc góc

ω phù hợp để điều khiển robot di động hai bánh vi sai có phương trình động học ở (3) về vị trí đích một cách an toàn

Để tăng thêm hiệu quả của hệ thống điều khiển thì bộ lọc EKF-FNN đã được nhóm tác giả đề xuất trong bài toán định vị robot trong một nghiên cứu khác [18] sử dụng trong vòng phản hồi Bộ lọc cho phép ước tính chính xác hơn tư thế hiện tại của robot dựa trên mô hình động học của hệ thống và phép

đo trong trường hợp hệ thống bị ảnh hưởng bởi nhiễu quá trình và nhiễu đo Khi đó giá trị lối vào bộ điểu khiển dẫn đường là giá trị ước tính từ bộ lọc EKF-FNN

, , i

i i

x y   

Hình 2: Sơ đồ khối hệ thống điều khiển dẫn đường III BỘĐIỀUKHIỂNDẪNĐƯỜNGHÀNHVIBBFM Phần này sẽ trình bày phương pháp thiết kế bộ điều khiển dẫn đường hành vi BBFM đề xuất Cấu trúc điều khiển dẫn đường hành vi BBFM mô tả như hình 3 và được chia thành 3 bước như sau:

1

ˆ arg max[ ( ), , ( )]

ˆ arg max[ ( ), , ( )]

O ON

( 1

1 )

O y

(

1 )

O y n

2 ( 1 )

O y

2 ( )

O y n

( 1 )

N

O y

( )

N

O y n

 Hình 3: Cấu trúc điều khiển dẫn đường hành vi BBFM

Bước 1: Phân tích vấn đề

Từ mục tiêu phức tạp cần thực hiện, chia thành một tập các

hành vi độc lập Xác định biến điều khiển của các hành vi: y =

(y1, y2, …,yN), yi Є Yi, Yi: tập giá trị của các biến điều khiển tương ứng

Bước 2: Thiết kế các hàm mục tiêu:

Hàm mục tiêu để thực hiện các hành vi tương ứng được thiết

kế thông qua 2 bước của quá trình thiết kế bộ điều mờ: mờ hóa, suy luận mờ Kết quả của quá trình suy luận mờ sẽ thu được hàm mục tiêu của biến điều khiển:

1( ), 2( ), , ( )

Bước 3: Lựa chọn lệnh

Quá trình trộn lệnh để xác định giá trị điều khiển cuối cùng sử dụng lý thuyết tối ưu đa mục tiêu Khi đó giá trị tham số điều khiển tối ưu Pareto y iY i phù hợp nhất với tất cả các mục tiêu đề ra theo lý thuyết lựa chọn tối ưu đa mục tiêu:

1 2

ˆ arg max[ O ( ), O ( ), , O N( )], i i

y i   y iy iy i yY (5)

A Phân tích vấn đề Mục tiêu phức tạp được chia thành các quá trình ra quyết định độc lập nhỏ được gọi là các hành vi Bk (k =1…N) Biến điều

khiển y được định nghĩa là y = {y1, y2, …,yN}, yi Є Yi, Yi: tập giá trị của các biến điều khiển tương ứng hay còn gọi là không gian tác động của biến điều khiển Mỗi hành vi được thực thi thông qua các hàm mục tiêu của biến điều khiển tương ứng

Ok(y) (k =1…N)

B Thiết kế hàm mục tiêu Hàm mục tiêu Ok để thực thi hành vi Bk được định nghĩa là sự ánh xạ từ không gian tác động Yi tới khoảng giá trị [0, 1]:

O : Y → [0, 1] (6)

Trang 3

Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)

Phép ánh xạ gán mỗi tác động yi Є Yi một giá trị thỏa mãn, tác

động thích hợp nhất sẽ được gán bằng 1 và không thích hợp

nhất gán bằng 0 Hàm mục tiêu Ok được xác định thông qua

hai bước mờ hóa và suy luận mờ Phần dưới đây sẽ mô tả chi

tiết cách thức thiết kế hàm mục tiêu thông qua hai bước thiết

kế bộ điều khiển mờ với cấu trúc tổng quát MIMO

Bước 1: Mờ hóa

Một bộ điều khiển mờ Fcó m biến ngôn ngữ lối vào {x1,

x2,…, xm} với các tập nền X1, X2…Xm và n biến ngôn ngữ lối

ra {y1, y2,…yn} với tập nền Y1, Y2,…,Yn Biến lối ra yi chính

là các biến điều khiển và tập nền Yi (i=1…n) là các không

gian tác động của các biến điều khiển

Mỗi biến ngôn ngữ có các giá trị ngôn ngữ được xác định

bằng một tập mờ định nghĩa trên tập nền của biến ngôn ngữ:

1 11 12 1 1 11 12 1

2 21 22 2 2 21 22 2

(7)

Hàm thuộc tương ứng tại giá thực của biến vào/ra được xác

định bởi:

1 1 1

1 11 1 1 1 11 1

2 21 1 2 2 21 2

: ( ), , ( ) : ( ), , ( )

: ( ), , ( ) : ( ), , ( )

: ( ), , ( ) : ( ), , ( )

b a

b a

(8)

Bước 2: Suy luận mờ

Luật điều khiển thứ k (mệnh đề hợp thành) với m mệnh đề

điều kiện có dạng:

Rk: Nếu x1=Aij và x2 = Aij và ….xm = Aij thì y1 = Bij và y2 = Bij

và … yn = Bij

Trong đó: Aij, Bij: j Є {1…a/b}: tập mờ của các giá trị ngôn

ngữ vào/ra, i Є {1…m/n}: biến ngôn ngữ lối vào vào/ra

Giá trị của mệnh đề hợp thành k cho một biến lối ra yi là một

tập mờ Rk định nghĩa trên tập nền Yi có hàm thuộc:

1 2 ij

( ) min(H, (y ))

H min{ ( ), ( ), , ( )}

y

Với k luật hay k mệnh đề hợp thành của bộ điều khiển thì giá

trị của luật hợp thành R cho một biến lối ra yi được xác định

theo luật max-min sẽ là:

1 2

( ) max( ( ), ( ), , ( ))

Hàm thuộc lối ra của biến điều khiển yi được xác định theo

(10) trên đây chính là hàm mục tiêu của biến điều khiển yi

C Lựa chọn lệnh

Bước này sẽ xác định giá trị rõ cuối cùng của các tham số điều

khiển yi thông qua N hàm mục tiêu Như đã khẳng định ở trên,

hàm mục tiêu Ok thực thi hành vi Bk chính là các tập mờ R lối

ra (10) của mỗi bộ điều khiển mờ F tương ứng với các tham số

điều khiển yi trên các tập nền Yi

  (11)

Như vậy, với N hàm mục tiêu thì tham số điều khiển ˆy iY i

tốt nhất phù hợp với tất cả các hàm mục tiêu được xác định theo cách sau:

1 2

ˆi i arg max[ O ( ),i O ( ), ,i O ( )]i

N

Nghiệm tối ưu Pareto [19]: ˆy là nghiệm không trội của i

phương trình (12) nếu không tồn tại bất kỳ giá trị yiYi nào

để O(yˆiY i)O(y )i với mọi i và

1 2

(y ) [ (y ), (y ), , (y )]

IV VÍ DỤDẪNĐƯỜNGCHOROBOTDIĐỘNG Bài toán dẫn đường yêu cầu robot di động hai bánh vi mô hình như (3) có khả năng về đích và tránh vật cản an toàn trên đường đi trong môi trường chưa biết dựa trên thông tin thu được từ các cảm biến Phần này trình bày cụ thể quá trình thiết

kế bộ điều khiển dẫn đường hành vi theo cấu trúc BBFM đề xuất

A Phân tích vấn đề Nhiệm vụ dẫn đường của robot từ bất kỳ điểm nào tới đích một cách an toàn được chia thành ba hành vi: tránh vật, duy trì hướng đích và chuyển động nhanh Hành vi tránh vật sẽ thực hiện nhiệm vụ tránh vật cục bộ bất ngờ gặp phải trên đường

di chuyển về đích Hành vi duy trì hướng đích sẽ thực hiện việc điều khiển robot luôn tiến thẳng tới đích và tốc độ về đích nhanh nhất có thể sẽ được thực hiện bởi hành vi chuyển động nhanh Nhiệm vụ của mỗi hành vi được thực thi bởi một bộ điều khiển mờ Hai hành vi duy trì hướng đích và chuyển động nhanh có thể gộp vào trong một bộ điều khiển do mỗi hành vi chỉ liên quan đến một biến điều khiển Biến điều khiển cho robot di động là vận tốc dài u và vận tốc góc ω do

đó đây cũng chính là biến lối ra của mỗi bộ điều khiển mờ:

y = {u, ω}, U = [umin umax], W = [ωmin ωmax] Hai hàm mục tiêu của biến điều khiển để thực hiện ba hành vi trên là O1(u, ω) và O2(u, ω)

B Thiết kế hàm mục tiêu

1) Bộ điều khiển tránh vật

Để thực hiện hành vi tránh vật cục bộ, robot nhận dữ liệu từ cảm biến siêu âm được mô tả như hình dưới đây

Hình 4: Mô hình cảm biến siêu âm Phạm vi quét của cảm biến là từ 0 đến 4m 8 cảm biến này được chia thành 3 nhóm: Phải (cảm biến 1, 2, 3) Trước (cảm biến 4, 5) và Trái (cảm biến 6, 7, 8) Giá trị của 3 nhóm cảm biến được tính bằng giá trị của khoảng cách nhỏ nhất trong nhóm Bộ điều khiển gồm 4 biến lối vào và 2 biến lối ra như hình 5

       (13)

Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)

Trang 4

Hình 5: Bộ điều khiển mờ tránh vật

Giá trị ngôn ngữ và miền giá trị của các biến vào/ra được xác

định như sau:

- dtrai, dtruoc, dphai = {Gần (G), Trung bình (TB), Xa

(X)} [0.2 4] m

- α = {Âm Nhiều (AN), Âm (A), Không (K), Dương

(D), Dương Nhiều (DN)}

- u = {Nhỏ (N), Trung bình (TB), Lớn (L)}, U = [0

1.3] m/s

- ω = {Âm Nhiều (ANo), Âm (Ao), Không (Ko), Dương

(DO), Dương Nhiều (DNo)}, W = [-4.33 4.33] rad/s

Hàm thuộc của các biến ngôn ngữ vào/ra là các hàm thuộc có

dạng Gauss và Sigmoid với biểu thức và dạng hàm được biểu

diễn như hình 6

2 ( ) 2 2 ( )

x c Gauss x e

 

1 e

Sigmoid x  a x b

(14)

Hình 6: Hàm thuộc của các biến: (a): lối vào khoảng cách dtrai,

dtruoc và dphai, (b): góc lệch α, (c): vận tốc dài u, (d) vận tốc góc

ω

Bảng 1 thể hiện các luật điều khiển tránh vật thường gặp Giá

trị của mệnh đề hợp thành theo luật max-min cho biến lối ra u

và ω của bộ điều khiển mờ tránh vật được xác định theo

( ) max( ( ), ( ), , ( )

( ) max( ( ), ( ), , ( ))

1, , 28

k

(15)

Với Rk là giá trị của mệnh đề hợp thành thứ k được xác định

theo (9)

2) Bộ điều khiển về đích

Bộ điều khiển về đích tương đương với việc thực hiện hai

hành vi duy trì góc hướng đích và hành vi điều khiển tốc độ

nhanh nhất có thể Sơ đồ khối của bộ điều khiển về đích với

hai biến lối vào ρ, α và hai biến lối ra u, ω được thể hiện như

trên hình 7

Hình 7: Bộ điều khiển mờ về đích

Trong đó ρ là khoảng cách từ vị trí hiện tại (x,y) của robot tới

vị trí đích (xd, yd) được xác định bằng công thức (16), giá trị ngôn ngữ và hàm thuộc được miêu tả như hình 8

 (xd x)2 (yd y)2 (16)

ρ = {Gần (G), Trung bình (TB), Xa (X)}, ρ:[0 20] m

Hình 8: Hàm thuộc của biến ρ Biến ngôn ngữ α, và ω của bộ điều khiển về đích có giá trị ngôn ngữ, miền giá trị và hàm thuộc giống như của bộ điều khiển tránh vật Các luật điều khiển về đích được trình bày trong bảng 2 Giá trị của mệnh đề hợp thành theo luật max-min cho biến lối ra u và ω của bộ điều khiển mờ về đích được xác định theo bằng công thức 17 như sau

_GR 1 2 _GR 1 2

( ) max( ( ), ( ), , ( ) ( ) max( ( ), ( ), , ( )) 1, ,15

k

(17)

Lối vào Lối ra Trường hợp

va chạm vật STT dtrai dtruoc dphai α u ω

G: Gần, TB: Trung Bình, X: Xa, K/K O : Không, A/A O : Âm, AN/AN O : Âm Nhiều, D/D O : Dương, DN/DN O : Dương Nhiều

Bảng 1: Luật điều khiển tránh vật

Trang 5

Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)

Lối vào Lối ra STT

8 TB AN TB AN O

10 TB DN TB DN O

G: Gần, TB: Trung Bình, X: Xa, K/K O :

Không, A/A O : Âm, AN/AN O : Âm Nhiều,

D/D O : Dương, DN/DN O : Dương Nhiều

Bảng 2: Luật điều khiển về đích

C Lựa chọn lệnh

Công thức (15) và (17) là hàm mục tiêu thực hiện hành vi

tránh vật và về đích đối với hai biến điều khiển u và ω Giá trị

cuối cùng của biến điều khiển ˆu U và  ˆWphù hợp nhất

với cả ba mục tiêu được xác định bởi:

_ _ _OA _

ˆ arg max[ (u), (u)]

Nghiệm tối ưu Pareto u  được tìm theo phương pháp ˆ, ˆ

Lexicographic [19] như sau:

 Hành vi theo thứ tự quan trọng giảm dần: tránh vật,

về đích (duy trì hướng đích và chuyển động nhanh)

 Quá trình loại bỏ tuần tự được thực hiện song song

đối với hai biến u và ω trên tập U và W cho đến khi

tìm được 1 nghiệm duy nhất hoặc giải hết cả P1 và

P2:

:

1 _

1

1 _

1

max

max

max

max

: (u), {u|u la nghiem cua P }

: ( ), { | la nghiem cua P }

R OA

R GR

R OA

R GR

u U

u U

W

W

u P

P

(19)

V MÔPHỎNG

Mô phỏng Monte-Carlo được thực hiện để đánh giá hiệu quả

của cấu trúc điều khiển dẫn đường hành vi BBFM đề xuất và

so sánh với các cấu trúc MOASMs và CDB điển hình Các

tham số mô phỏng được thiết lập cho robot di động hai bánh

vi sai như sau: đường kính của bánh xe R = 0,05 m; khoảng

cách giữa hai bánh xe L = 0,6 m; vận tốc dài u trong khoảng

[0, 1.3] m/s do đó vận tốc góc cực đại là ω = [-4.3 4.3] rad/s;

thời gian lấy mẫu của hệ thống TS = 100 ms; sai số cho phép

của hệ thống khi về đích là khoảng cách  = 10-1 m Mô hình

cảm biến siêu âm được thiết lập như ở phần IV

A Trường hợp 1 Môi trường hoạt động có cấu trúc được chọn giống như trong bài báo đề xuất sử dụng bộ điều khiển MOASMs Từ cấu hình xuất phát ban đầu (-2, -1.8, 180o), robot sẽ di chuyển tránh vật

an toàn về đích tại vị trí (-6, -4.8, 0o) Đường đi và đáp ứng vận tốc u, ω của robot trong trường hợp sử dụng ba bộ điều khiển dẫn đường khác nhau MOASMs, BBFM và CBD được thể hiện trong hình 9 Một số thông số từ hoạt động dẫn đường của robot nhằm mục đích so sánh thể hiện trong bảng 3 Trong

đó quãng đường đi thể hiện độ dài mà robot đã đi Thời gian tới đích là thời gian thực thi thuật toán điều khiển từ điểm bắt đầu đến khi robot đạt tới đích Sai số khi về đích là khoảng cách dừng của robot khi tới đích, thông số này sẽ đánh giá khả năng đạt được vị trí đích của cấu trúc điều khiển Hình 9 cho thấy đường đi khi sử dụng cấu trúc điều khiển BBFM tốt hơn

so với trường hợp sử dụng hai cấu trúc còn lại Điều này được khẳng định trong bảng 3 với các thông số đạt được của cấu trúc BBFM so với MOASMs và CDB là: quãng đường đi ngắn hơn, thời gian tới đích nhanh hơn và sai số về đích nhỏ hơn Cấu trúc MOASMs có thời gian thực hiện lâu nhất do hàm mục tiêu là hàm 2 biến O(u,ω) phải thực hiện hết với giá trị của tập các tham số điều khiển cho hai biến Mặt khác do hàm mục tiêu thực thi hành vi tránh vật thực hiện theo nguyên

lý robot chuyển theo đường cong quanh tâm quay ICC và giao với vật nên chiếm nhiều thời gian khi xác định vị trí của vật Chính nguyên lý xác định hàm mục tiêu này làm robot khó về đích với sai số nhỏ Điều này thể hiện trong đáp ứng vận tốc u

và ω ở hình 9(d) với giá trị vận tốc chưa đạt tới 0 tại khoảng cách rất gần đích Trong khi hàm mục tiêu xây dựng bằng logic mờ cho phép robot đạt tới vị trí đích với sai lệch nhỏ nhất, đáp ứng vận tốc tiến tới 0 khi ở vị trí gần đích như trong hình 9(b) và 9(f) Cấu trúc điều khiển CDB sử dụng siêu luật

mờ xác định trọng số của các bộ điều khiển phụ thuộc vào kinh nghiệm và trộn lệnh theo phương pháp giải mờ do đó nhiều khi đạt hiệu quả không cao Vì thế mặc dù cấu trúc CDB cho phép robot tới đích nhưng đường đi dài hơn và thời gian xử lý lâu hơn so với khi sử dụng cấu trúc BBFM

Quãng đường đi (m) 10.3587 11.0180 11.0171 Thời gian tới đích (s) 28.262 414.542 36.4367

Bảng 3: So sánh kết quả của trường hợp 1

B Trường hợp 2 Trường hợp 2 mô phỏng hoạt động của robot trong phòng thí nghiệm với mô hình các vật cản là tường và vách ngăn Robot xuất phát ban đầu với cấu hình (-7, -6, 0o) và yêu cầu di chuyển an toàn đến vị trí đích (-2.5, -1.5, 0o) Kết quả đạt được thể hiện trên hình 10 với các đường đi khác nhau của ba cấu trúc điều khiển BBFM, MOASMs và CDB Chỉ có cấu trúc điều khiển BBFM và CDB là đạt được yêu cầu dẫn đường

đề ra, còn cấu trúc MOASMs không thực hiện được nhiệm vụ dẫn đường về đích an toàn do xuất phát hướng đích ngay từ ban đầu dẫn đến bị mắc vào góc kẹt Hình 10(a) và một số thông số so sánh trong bảng 4 cho thấy đường đi của robot khi

sử dụng cấu trúc BBFM dễ dàng đạt tới đích với quãng đường

đi ngắn và thời gian tới đích nhanh hơn so với khi sử dụng cấu trúc CDB

Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015)

Trang 6

Thông số BBFM CDB

Quãng đường đã đi (m) 9.3569 15.6649

Thời gian tới đích (s) 12.092 24.153384

Bảng 4: So sánh kết quả của trường hợp 2

-10 -8 -6 -4 -2 0

-7

-6

-5

-4

-3

-2

-1

0

Target

Start

X(m)

(a)

0 100 200 300 400 -1.5

-1 -0.5 0 0.5 1

1.5

u w

(b)

-10 -8 -6 -4 -2 0

-7

-6

-5

-4

-3

-2

-1

0

Target

Start

X(m)

(c)

-4 -3 -2 -1 0 1 2 3

4

u w

(d)

-10 -8 -6 -4 -2 0

-7

-6

-5

-4

-3

-2

-1

0

Target

Start

X(m)

(e)

0 100 200 300 400 -1.5

-1 -0.5 0 0.5 1

1.5

u w

(f) Hình 9: Đường đi và đáp ứng vận tốc của robot với các cấu

trúc điều khiển khác nhau trong trường hợp 1: (a) và (b):

BBFM, (c) và (d): MOASMs, (e) và (f): CDB

-10 -8 -6 -4 -2 0

-7

-6

-5

-4

-3

-2

-1

0

Target

Start

X(m)

(a) BBFM

-10 -8 -6 -4 -2 0 -7

-6 -5 -4 -3 -2 -1 0

Target

Start

X(m)

(b) MOASMs

-10 -8 -6 -4 -2 0 -7

-6 -5 -4 -3 -2 -1 0

Target

Start

X(m)

(c) CDB Hình 10: Đường đi của robot trong các cấu trúc điều khiển dẫn

đường khác nhau trong trường hợp 2

Kết quả mô phỏng cùng đánh giá so sánh với các cấu trúc điều

khiển điển hình khác trong môi trường hoạt động khác nhau ở

trên đã khẳng định hiệu quả của cấu trúc điều khiển dẫn

đường hành vi BBFM đề xuất

VI KẾTLUẬN Một cấu trúc điều khiển dẫn đường hành vi BBFM cho

robot di động đã được đề xuất trong bài báo Cấu trúc BBFM

được tạo nên bởi sự kết hợp giữa logic mờ và lý thuyết tối ưu

đa mục tiêu thông qua ba bước thiết kế: phân tích vấn đề, thiết

kế hàm mục tiêu và lựa chọn lệnh điều khiển Hiệu quả hoạt động của cấu trúc điều khiển dẫn đường hành vi BBFM đề xuất đã được khẳng định qua chương trình mô phỏng có đánh giá so sánh với hai cấu trúc điều khiển dẫn đường hành vi điển hình MOASMs và CDB trong một số trường hợp dẫn đường khác nhau Tính mô đun hóa, tính kế thừa và cài đặt dễ dàng của cấu trúc BBFM cho phép mở rộng thêm các hành vi khác như deadend hay khẩn cấp cùng với việc sử dụng thêm các cảm biến khác như cảm biến ảnh, cảm biến địa bàn để tăng cường khả năng dẫn đường trong môi trường phức tạp và hoàn toàn áp dụng được cho các hệ thống dẫn đường thực tế

TÀILIỆUTHAMKHẢO

[1] D.Driankov, H.Hellendoorn, M.Reinfrank, An introduction to fuzzy control, Springer, 2010

[2] Siegwart Roland and Nourbakhsh Illah R – Introduction to Autonomous Mobile Robots, The MIT Press Cambridge, Massachusetts London, England, 2004

[3] D Nakhaeinia, S H Tang, S B Mohd Noor, and O Motlagh, A review

of control architectures for autonomous navigation of mobile robot, International Journal of the Physical Sciences, Vol 6(2), pp 169-174, January, 2011

[4] R.A.Brooks, A robust layered control system for a mobile robot, IEEE Journal of Robotics and Automation, 1986, pp14-23

[5] Dupre, M.E, GA optinized fuzzy control of an autonomous mobile robot, Faculty of Graduate Studies, University of Guelph, 2007 [6] M Sugeno, Fuzzy hierarchical control of an unmanned helicopter, Proc

of Int Fuzzy System Association Conference, pp179-182, 1993 [7] A.Safiotti, A multivalued logic approach to integrating planning and control, Artificial Intelligent, 481-526, 1995

[8] Dorigo, M, Comombetti, M, Robot shaping: an experiment in behavior engineering, MIT Press/Bradford Books, 1997

[9] R.C Arkin, Motor-schema based mobile robot navigation, Int J Robot Res 8 (4) (1989) 92–112

[10] Eduardo Freire, Teodiano Bastos- Filho, Mario Sarcinelli- Filho and Ricardo Carelli, A new mobile robot control approach via fusion of control signals, IEEE transactions on system, mam and cybernetics – part B: cybernetics, Vol 34, No.1, February 2004

[11] Aguirre E & Gonzales A, Fuzzy behaviors for mobile robot navigation: design, coordination and fusion, Int.J of Approximate Reasoning, Vol,

25 pp, 255-289

[12] E.H.Ruspini, Fuzzy logic in the Flakey robot, In Proco of the Int.Conf

on Fuzzy Logic and Neural Networks, 767-770, Iizuka, Japan, 1990 [13] A Saffiotti, The uses of fuzzy logic in autonomous robot navigation, Soft Computing, 180-197, Springer – Verlag 1997

[14] Andi Adriansyah, Shamsudin H M Amin, Genetic fuzzy system in behavior based mobile robot, Politeknik Elektronika Negeri Surabaya – ITS, IES 2004

[15] Amur S Al Yahmedi and Muhammed A Fatmi, Fuzzy Logic Based Navigation of Mobile Robot, Recent Advances in Mobile Robotics, ISBN: 978-953-307-909-7, InTech, DOI: 10.5772/25621, December, 14,

2011 [16] Hongwei Mo, Qirong Tang, and Longlong Meng, Behavior - based fuzzy control for mobile robot navigation, Mathematical Problems in Engineering, Volume 2013, Article ID 561451, 2013

[17] P Pirjanian, Multiple objective behavior-based control, Robotics and Autonomous Systems 31 (2000) 53–60, Elsevier

[18] Nguyen Thi Thanh Van, Phung Manh Duong, Tran Thuan Hoang, Tran Quang Vinh, “Mobile Robot Localization using fuzzy neural network

based extended kalman filter”, Journal of Computer Science and

Cybernetics, vol.29 no.2, 2013, p119-131

[19] Adrian Gambier, Essameddin Badreddin, Multi objective optimal control, 16 th IEEE International Conference on Control Applications, Part of IEEE Multi conference on systems and control, Singapore, Octerber, 2007

Ngày đăng: 27/04/2022, 10:22

HÌNH ẢNH LIÊN QUAN

II. MÔ HÌNH HỆ THỐNG - Điều khiển dẫn đường hành vi cho robot di động hai bánh vi sai
II. MÔ HÌNH HỆ THỐNG (Trang 2)
Hình 1: Mô hình robot di động hai bánh vi sai Trong  đó,  (O G,  XG,  YG )  biểu  diễn  hệ  tọa  độ  toàn  cục,  (O R ,  X R,YR ) biểu diễn hệ tọa độ cục bộ gắn liền với robot, R ký hiệu  bán kính bánh xe và L là khoảng cách giữa hai bánh - Điều khiển dẫn đường hành vi cho robot di động hai bánh vi sai
Hình 1 Mô hình robot di động hai bánh vi sai Trong đó, (O G, XG, YG ) biểu diễn hệ tọa độ toàn cục, (O R , X R,YR ) biểu diễn hệ tọa độ cục bộ gắn liền với robot, R ký hiệu bán kính bánh xe và L là khoảng cách giữa hai bánh (Trang 2)
Mô hình robot di động được xem xét trong nghiên cứu này là loại robot có hai bánh vi sai với ràng buộc không khả tích có  cấu hình và tham số được thể hiện trên Hình 1 dưới đây - Điều khiển dẫn đường hành vi cho robot di động hai bánh vi sai
h ình robot di động được xem xét trong nghiên cứu này là loại robot có hai bánh vi sai với ràng buộc không khả tích có cấu hình và tham số được thể hiện trên Hình 1 dưới đây (Trang 2)
Bài toán dẫn đường yêu cầu robot di động hai bánh vi mô hình như  (3)  có  khả  năng  về  đích  và  tránh  vật  cản  an  toàn  trên  đường  đi  trong  môi  trường  chưa  biết  dựa  trên  thông  tin  thu  được từ các cảm biến - Điều khiển dẫn đường hành vi cho robot di động hai bánh vi sai
i toán dẫn đường yêu cầu robot di động hai bánh vi mô hình như (3) có khả năng về đích và tránh vật cản an toàn trên đường đi trong môi trường chưa biết dựa trên thông tin thu được từ các cảm biến (Trang 3)
Hình 7: Bộ điều khiển mờ về đích - Điều khiển dẫn đường hành vi cho robot di động hai bánh vi sai
Hình 7 Bộ điều khiển mờ về đích (Trang 4)
Hình 5: Bộ điều khiển mờ tránh vật - Điều khiển dẫn đường hành vi cho robot di động hai bánh vi sai
Hình 5 Bộ điều khiển mờ tránh vật (Trang 4)
Hình 6: Hàm thuộc của các biến: (a): lối vào khoảng cách dtrai, - Điều khiển dẫn đường hành vi cho robot di động hai bánh vi sai
Hình 6 Hàm thuộc của các biến: (a): lối vào khoảng cách dtrai, (Trang 4)
Bảng 1 thể hiện các luật điều khiển tránh vật thường gặp. Giá trị của mệnh đề hợp thành theo luật max-min cho biến lối ra u  và ω của bộ điều khiển mờ tránh vật được xác định theo - Điều khiển dẫn đường hành vi cho robot di động hai bánh vi sai
Bảng 1 thể hiện các luật điều khiển tránh vật thường gặp. Giá trị của mệnh đề hợp thành theo luật max-min cho biến lối ra u và ω của bộ điều khiển mờ tránh vật được xác định theo (Trang 4)
Hình 8: Hàm thuộc của biến ρ - Điều khiển dẫn đường hành vi cho robot di động hai bánh vi sai
Hình 8 Hàm thuộc của biến ρ (Trang 4)
Bảng 3: So sánh kết quả của trường hợ p1 B.Trường hợp 2  - Điều khiển dẫn đường hành vi cho robot di động hai bánh vi sai
Bảng 3 So sánh kết quả của trường hợ p1 B.Trường hợp 2 (Trang 5)
Bảng 4: So sánh kết quả của trường hợp 2 - Điều khiển dẫn đường hành vi cho robot di động hai bánh vi sai
Bảng 4 So sánh kết quả của trường hợp 2 (Trang 6)
Hình 9: Đường đi và đáp ứng vận tốc của robot với các cấu trúc  điều  khiển  khác  nhau  trong  trường  hợp  1:  (a)  và  (b):  BBFM, (c) và (d): MOASMs, (e) và (f): CDB  - Điều khiển dẫn đường hành vi cho robot di động hai bánh vi sai
Hình 9 Đường đi và đáp ứng vận tốc của robot với các cấu trúc điều khiển khác nhau trong trường hợp 1: (a) và (b): BBFM, (c) và (d): MOASMs, (e) và (f): CDB (Trang 6)

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm