1. Trang chủ
  2. » Giáo án - Bài giảng

Giáo trình Điều khiển hệ đa tác tử: Phần 2 - Trịnh Hoàng Minh, Nguyễn Minh Hiệu

104 18 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Một số ứng dụng của hệ đa tác tử
Trường học Trường Đại Học Bách Khoa Hà Nội
Chuyên ngành Điều Khiển Hệ Đa Tác Tử
Thể loại Giáo trình
Thành phố Hà Nội
Định dạng
Số trang 104
Dung lượng 5,93 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

  • 5.1 Giới thiệu (3)
  • 5.2 Điều khiển đội hình dựa trên vị trí tuyệt đối (6)
  • 5.3 Điều khiển đội hình dựa trên vị trí tương đối (7)
    • 5.3.1 Trường hợp tác tử là khâu tích phân bậc nhất 77 (7)
    • 5.3.2 Trường hợp tác tử là khâu tích phân bậc hai . 79 (9)
  • 5.4 Điều khiển đội hình dựa trên khoảng cách (9)
    • 5.4.1 Lý thuyết cứng khoảng cách (10)
    • 5.4.2 Luật điều khiển đội hình 82 (12)
  • 5.5 Điều khiển đội hình dựa trên vector hướng (18)
    • 5.5.1 Lý thuyết cứng hướng trên ℝ 𝑑 (18)
    • 5.5.2 Điều khiển đội hình cứng hướng vi phân (20)
  • 5.6 Ghi chú và tài liệu tham khảo (27)
  • 5.7 Bài tập (28)
  • Tài liệu tham khảo (0)

Nội dung

Phần 2 của giáo trình Điều khiển hệ đa tác tử tiếp tục trình bày những nội dung về: một số ứng dụng của hệ đa tác tử; điều khiển đội hình; giữ liên kết và tránh va chạm; định vị mạng cảm biến; mô hình động học ý kiến; hệ đồng thuận trọng số ma trận;... Mời các bạn cùng tham khảo!

Trang 1

Phần III

Một số ứng dụng của hệ đa tác tử

Trang 2

5 Điều khiển đội hình

5.1 Giới thiệu 72

5.2 Điều khiển đội hình dựa

trên vị trí tuyệt đối 76

5.3 Điều khiển đội hình dựa

trên vị trí tương đối 77

5.3.1 Trường hợp tác tử là

khâu tích phân bậc nhất 77

5.3.2 Trường hợp tác tử là

khâu tích phân bậc hai 79

5.4 Điều khiển đội hình dựa

trên khoảng cách 79

5.4.1 Lý thuyết cứng khoảng

cách 80

5.4.2 Luật điều khiển đội hình 82

5.5 Điều khiển đội hình dựa

trên vector hướng 88

1: formation control

là một trong những bài toán quan trọng nhấttrong điều khiển hệ đa tác tử Giả sử ta có một hệ gồm 𝑛 tác tử (cóthể là UAV, UUV, xe tự lái) và ta mong muốn các phương tiện này

di chuyển như một đội hình mong muốn Đội hình mong muốn, haycòn gọi là đội hình mục tiêu, có thể được cho bởi một tập các biến vềkhoảng cách, vector hướng, hay góc lệch giữa vị trí các tác tử tronghệ

Về ứng dụng, bài toán điều khiển đội hình xuất phát từ ứng dụng vềgiao thông trên đường cao tốc thông minh, nơi các phương tiện tự thiếtlập các đội xe sao cho khoảng cách giữa các xe là không đổi và vận tốccủa các xe là như nhau [44]

[ 44 ]: Fax andothers (2004),

“Informa-tion flow and cooperative control of

[ 7 ]: Anderson andothers (2008),

“Rigid graph control architectures for

autonomous formations”

Cuối cùng, một số biến thể của bài toán điều khiển đội hình

có thể được dùng để mô phỏng, phân tích và giải thích các hiện tượng

tụ bầy ở động vật trong tự nhiên [26]

[ 26 ]: Bullo (2019), Lectures on

net-work systems

Để giải quyết bài toán điều khiển đội hình, rất nhiều phương pháp đãđược đưa ra Nhìn chung, tất cả các phương pháp điều khiển đội hìnhhiện tại đều đòi hỏi các tác tử đo một số biến hình học về đội hình, haytrao đổi thông tin với các tác tử khác trong đội hình, từ đó di chuyểnsao cho các biến này đạt tới giá trị mong muốn Trong quá trình thiếtlập đội hình, đôi khi có một số tác tử đặc biệt được chọn làm thamchiếu (tác tử dẫn đàn) cho các tác tử khác thực hiện việc điều khiểnhình dạng của toàn bộ hệ

Hiện nay, các bài toán điều khiển đội hình thường được phân loại dựatrên cơ sở là các biến đo, biến điều khiển, và điều kiện về đồ thị mô

tả luồng thông tin giữa các tác tử Bảng1 phân loại các bài toán điềukhiển đội hình theo cách phân loại này [88, 2]

[ 88 ]: Oh andothers (2015), “A survey

of multi-agent formation control”

[ 2 ]: Ahn (2019), Formation Control:

Approaches for Distributed Agents

Phươngpháp

Biến đo Biến

điềukhiển

Điều kiện

đồ thị

Tài liệu tham khảo

Dựatrên vịtrí

Vị trí Vị trí [69,156]

Dựatrên sailệch

Sai lệch Sai lệch Liên thông [44,65,72]

Trang 3

và gócđịnhhướng

Đồ thịcứngkhoảngcách

Đồ thịkhôngcứngkhoảngcách

[36,93,101]

Khoảng

cách

Khoảngcách

Đồ thịcứngkhoảngcách

Đồ thịcứnghướngtrongℝ𝑑

và gócđịnhhướngtươngđối

Đồ thịcứnghướngtrong𝑆𝐸(𝑑)

và gócđịnhhướngtươngđối

Đồ thịcứnghướngtrongℝ𝑑

[165,135,136]

Trang 4

Vị trítươngđối

Vị trítươngđối

Đồ thịcứnghướngtrongℝ𝑑

[168,166]

Kết hợpvectorhướng,góclệch vàkhoảngcách

Vectorhướng,góclệch vàkhoảngcách

Vectorhướng,góclệch vàkhoảngcách

Đồ thịcứng yếu

[23, 43, 122, 100, 94,

64]

Các biến trạng thái của một tác tử phân tán bao gồm một số đại lượngviết trong một hệ qui chiếu gắn với tác tử đó Thông thường, các biếntrạng thái được chọn gồm vị trí và vận tốc của tác tử cùng với hướngcủa các hệ tọa độ tham chiếu (gọi chung là định hướng của tác tử trongkhông gian) Để so sánh các giá trị của tác tử, vị trí và định hướng củatác tử cần phải được cho dưới cùng một hệ tọa độ tham chiếu Trongkhông gianℝ𝑑, định hướng của một tác tử 𝑖 được cho bởi một ma trận

R𝑖 ∈𝑆𝑂(𝑑), trong khi định hướng và vị trí được thể hiện bởi các phần

tử trong 𝑆𝐸(𝑑) Do mỗi tác tử có một hệ tọa độ tham chiếu riêng, địnhhướng của các tác tử thường có sai lệch so với nhau cũng như so với hệtham chiếu toàn cục

Hình 5.1: Hệ qui chiếu toàn cục (𝑔Σ),

hệ qui chiếu chung (𝑐Σ), và các hệ qui

chiếu cục bộ (𝑖Σ và𝑗Σ).

Trên hình5.1, hệ qui chiếu toàn cục được kí hiệu bởi𝑔Σ, còn các hệqui chiếu cục bộ/địa phương được kí hiệu bởi𝑖Σ và 𝑗Σ Các trục tọa độcủa tác tử 𝑖 và 𝑗 không trùng nhau cũng như không trùng với hệ tọa

độ toàn cục Ma trận R𝑖 ∈𝑆𝑂(𝑑) mô tả phép chuyển tọa độ từ hệ tọa

độ𝑔Σ tới𝑖Σ Ma trận để chuyển từ 𝑗Σ tới𝑖Σ được cho bởi R𝑖𝑗= R𝑖R−1𝑗

Như vậy, ma trận R−1𝑖 mô tả phép chuyển từ hệ tọa độ địa phương𝑖Σtới hệ tọa độ toàn cục 𝑔Σ

Kí hiệu Σ∗ là một hệ qui chiếu chung, không nhất thiết phải trùng với𝑔

Σ Một hệ tọa độ với các trục trùng với Σ∗ được gọi là một hệ quichiếu chung𝑐Σ Chú ý rằng hệ qui chiếu Σ∗≠𝑐Σ do gốc tọa độ của Σ∗

và𝑐Σ có thể khác nhau

Trong nhiều bài toán điều khiển đội hình, ta thường mong muốn cáctác tử có thể xác định vị trí và hướng dựa trên một hệ qui chiếu chung𝑐

Σ Ma trận R𝑐 ∈𝑆𝑂(3) mô tả phép chuyển tọa độ từ𝑔

Σ sang𝑐Σ Nếunhư hướng của các tác tử được điều chỉnh sao cho𝑖Σ =𝑗Σ =𝑐Σ thì tanói rằng các tác tử được đồng thuận về hướng

Với mỗi tác tử 𝑖, ta kí hiệu vị trí của tác tử này trên hệ tham chiếu toàn

cục là p𝑖∈ℝ𝑑 Với hai tác tử 𝑖 và 𝑗, vector sai lệch z𝑖𝑗= p𝑖− p𝑗 là mộtvector viết trong hệ tham chiếu toàn cục 𝑔Σ Vector này cũng có thể

biểu diễn bởi z𝑖𝑖𝑗 = p𝑖𝑖− p𝑖𝑗 = −p𝑖𝑗 trong𝑖Σ hoặc là z𝑗𝑖𝑗= p𝑗𝑗− p𝑗𝑖 = −p𝑗𝑖

trong𝑖Σ do p𝑖𝑖 = p𝑗𝑗 = 0 Chú ý rằng vector z𝑖𝑗 có hướng từ 𝑗 tới 𝑖,

trong khi z𝑗𝑖 có hướng từ 𝑖 tới 𝑗 Chú ý rằng z𝑗𝑗𝑖 = p𝑗𝑖 (vị trí của 𝑖 đobởi 𝑗 trong hệ qui chiếu𝑗Σ) hay z𝑖𝑗𝑖= −p𝑖𝑗 (vị trí của 𝑗 đo bởi 𝑖 trong

hệ qui chiếu𝑖Σ) Mặc dù p𝑗− p𝑖 = z𝑗𝑖 = −z𝑖𝑗 = −(p𝑖− p𝑗), do hệ qui

Trang 5

𝑗𝑖, z𝑖𝑗𝑗, và z𝑗𝑗𝑖 đều có độ dài như nhau và bằng khoảng cách giữa

hai tác tử 𝑖 và 𝑗 Ta kí hiệu khoảng cách từ tác tử 𝑖 tới tác tử 𝑗 bởi

𝑑𝑖𝑗= kp𝑖− p𝑗k = kz𝑖𝑖𝑗k = kz𝑗𝑖𝑗k = kz𝑖𝑗k = 𝑑𝑗𝑖

Một đại lượng (tương đối) khác có thể được đo đạc giữa hai tác tử 𝑖 và

𝑗 là vector (đơn vị) hướng g𝑖𝑗 = kp p𝑗−p𝑖

𝑗−p𝑖 k với giả thuyết rằng p𝑖 ≠ p𝑗 Dễ

thấy kg𝑖𝑖𝑗k = kg𝑖𝑗k = 1 Chú ý rằng g𝑖𝑗 = −g𝑗𝑖, tuy nhiên g𝑖𝑖𝑗≠ −g𝑗𝑗𝑖 với

cùng lý do như với các vector vị trí tương đối

Với mỗi tác tử 𝑖, ta giả thuyết rằng tác tử 𝑖 có mô hình tích phân bậc

nhất

¤

p𝑖 = u𝑖, 𝑖 = 1, , 𝑛, (5.1)

với u𝑖 là tín hiệu điều khiển Phương trình (5.1) được viết trên hệ qui

chiếu 𝑔Σ Ta có thể biến đổi (5.1) như sau

R𝑖p¤𝑖 = R𝑖u𝑖hay, ¤p𝑖𝑖 = u𝑖𝑖, (5.2)

với u𝑖𝑖 là tín hiệu điều khiển biểu diễn trên hệ qui chiếu địa phương 𝑖Σ

gắn với tác tử 𝑖

Tiếp theo, ta định nghĩa khái niệm về các cấu trúc (tập cạnh) mô tả

tương tác giữa các tác tử trong hệ, bao gồm: đo đạc, điều khiển, và

truyền tin

Định nghĩa 5.1.1 (Cấu trúc đo đạc, điều khiển, truyền tin) Nếu tác

tử 𝑖 đo một biến tương đối nào đó với tác tử 𝑗 thì tác tử 𝑗 là một

láng giềng-ra của 𝑖 trong đồ thị đo đạc 𝐺𝑠, kí hiệu bởi 𝑗 ∈ 𝑁𝑖𝑜, và

(𝑖, 𝑗) ∈ 𝐸𝑠

Nếu tín hiệu điều khiển của tác tử 𝑖 dựa trên chuyển động

của tác tử 𝑗 thì 𝑗 là một láng giềng ra của 𝑖 trong đồ thị điều khiển

𝐺𝑎

, kí hiệu bởi (𝑖, 𝑗) ∈ 𝐸𝑎 Nếu tác tử 𝑗 gửi một biến thông tin tới

tác tử 𝑖 thì 𝑗 là một láng giềng-ra của tác tử 𝑖 trong đồ thị thông tin

𝐺𝑐

, kí hiệu bởi (𝑖, 𝑗) ∈ 𝐸𝑐

Như vậy, trong một bài toán điều khiển đội hình tổng quát, các cấu trúc

về đo đạc, điều khiển, cũng như truyền tin là khác nhau: 𝐸𝑠 ≠ 𝐸𝑎≠ 𝐸𝑐

Khi nói đến một cấu trúc của một đội hình mà không nói gì thêm, ta

ngầm nói đến cả ba cấu trúc này

Khi một tác tử 𝑖 đo vị trí tương đối với tác tử 𝑗, 𝑖 có thể không cập

nhật vị trí của mình dựa trên vị trí tương đối mà chỉ dựa trên khoảng

cách giữa hai tác tử, hay dựa trên vector hướng từ 𝑖 tới 𝑗 Trong tài

liệu này, ta sử dụng thuật ngữ điều khiển đội hình dựa trên “X” nếu

như các tác tử trong hệ điều khiển vị trí của mình dựa trên biến “X” và

không tính tới việc các tác tử đo đạc hay truyền tin các biến nào khác

Với qui ước này, ta sẽ lần lượt xét các phương pháp điều khiển đội

hình dựa trên vị trí tuyệt đối, vị trí tương đối, khoảng cách và vector

Trang 6

hướng Đây là các phương pháp điều khiển đội hình đã và đang đượcquan tâm nghiên cứu gần đây.

5.2 Điều khiển đội hình dựa trên vị trí tuyệt đối

Khi tất cả các tác tử đều có thể nhận thông tin vị trí của mình từ hệtham chiếu toàn cục 𝑔Σ, bài toán điều khiển đội hình trở nên khá đơn

giản Cụ thể, khi mỗi tác tử 𝑖 biết được p𝑖 và mong muốn đạt tới vị

trí đặt p∗𝑖 thì luật điều khiển đội hình (5.1) viết cho mỗi tác tử có thểthiết kế đơn giản dưới dạng

¤

p𝑖 = u𝑖 = −𝑘𝑝(p𝑖− p∗𝑖), 𝑖 = 1, , 𝑛, (5.3)với 𝑘𝑝 > 0 là hằng số dương

Kí hiệu p = vec(p1, , p𝑛), p= vec(p∗1, , p

Để cải thiện chất lượng điều khiển, ta có thể giả thiết rằng các tác tử

có thể trao đổi thông tin về vị trí với nhau qua đồ thị 𝐺 và thêm vàoluật điều khiển đội hình (5.3) thành phầnP

tỏ thành phần điều khiển từ trao đổi thông tin có thể làm tăng tốc độđạt được đội hình

Ví dụ 5.2.1 Mô phỏng điều khiển đội hình gồm 20 tác tử dựa trên

vị trí tuyệt đối trong 2D và 3D được cho ở Hình5.2 Với luật điềukhiển đã cho, các tác tử di chuyển trực tiếp tới vị trí đặt trong khônggian (các đỉnh của một đa giác đều gồm 20 đỉnh)

Trang 7

5.3 Điều khiển đội hình dựa trên vị trí tương đối 77

Code MATLAB của ví dụ 5.2.1 (mô phỏng đội hình trên 2D) được

cho dưới đây, trong đó hàm PlotFormation dùng để biểu diễn đội hình

được dùng chung trong các ví dụ ở mục này được cho ở Phụ lục C.1

(a) Đội hình trong không gian 2 chiều

(b) Đội hình trong không gian 3 chiều

Hình 5.2: Mô phỏng thuật toán điều khiển đội hình dựa trên vị trí tuyệt đối.

5.3 Điều khiển đội hình dựa trên vị trí tương đối

Trong phương án điều khiển dựa trên vị trí tương đối, hệ các tác tử

cần thỏa mãn các giả thuyết sau:

Biến đo Các tác tử có các hệ qui chiếu cục bộ được định hướng như

nhau và giống như hệ qui chiếu toàn cục Tuy nhiên, các tác tử

không cần biết gốc tọa độ của hệ qui chiếu toàn cục này Trong

hệ tham chiếu địa phương, các tác tử có thể đo vị trí tương đối

(vector sai lệch vị trí) và vận tốc tương đối (đối với tác tử bậc

hai) của một số tác tử láng giềng Chú ý rằng do các hệ qui chiếu

địa phương là cùng hướng với hệ qui chiếu toàn cục, vector vị trí

tương đối đo trong các hệ qui chiếu đều như nhau

Đồ thị tương tác Tương tác về đo đạc giữa các tác tử được cho bởi

đồ thị vô hướng 𝐺, với giả thuyết 𝐺 = (𝑉 , 𝐸) là một đồ thị liên

thông Đội hình đặt được cho bởi một tập các vector sai lệch vị

trí mong muốn giữa các tác tử tương ứng với 𝐺

5.3.1 Trường hợp tác tử là khâu tích phân bậc nhất

Xét hệ gồm 𝑛 tác tử trong đó mỗi tác tử trong đội hình có mô hình là

khâu tích phân bậc nhất:

¤

p𝑖 = u𝑖, 𝑖 = 1, , 𝑛 (5.8)

Ở đây, p𝑖 ∈ℝ𝑑 và u𝑖 ∈ℝ𝑑 lần lượt là vị trí và tín hiệu điều khiển của

tác tử 𝑖 viết trên hệ qui chiếu toàn cục 𝑔Σ

Trang 8

Từ giả thuyết về đo đạc ở trên, mỗi tác tử 𝑖 có thể đo được z𝑖𝑗 =

p𝑗− p𝑖, ∀𝑗 ∈ 𝑁𝑖 Đội hình đặt được cho bởi tập Γ = {z

𝑖𝑗}(𝑖,𝑗)∈𝐸, và mụctiêu của mỗi tác tử là đạt được đội hình thỏa mãn tất cả các vector sailêch vị trí mong muốn đều được thỏa mãn

z𝑖𝑗 = p𝑗− p𝑖= z∗𝑖𝑗, (𝑖, 𝑗) ∈ 𝐸

Tập Γ = {z∗𝑖𝑗}(𝑖,𝑗)∈𝐸 được gọi là khả thi nếu như tập

Ep∗ ,{p ∈ℝ𝑑𝑛| p𝑗− p𝑖= z∗𝑖𝑗, ∀(𝑖, 𝑗) ∈ 𝐸}, (5.9)

là khác tập rỗng Ngược lại, nếu Ep∗ = ∅, ta gọi Γ là không khả thi

Trong mục này, ta giả sử Γ là khả thi và xét p= vec(p∗1, , p

𝑛), làmột phần tử trong Ep∗ Hơn nữa, ta giả sử rằng mỗi tác tử chỉ biết được

một số vector sai lêch đặt z∗𝑖𝑗= p∗𝑗− p

𝑖, ∀𝑗 ∈ 𝑁𝑖 chứ không biết được

p∗𝑖 và p∗𝑗 Bài toán đặt ra là đưa p tới một đội hình sai khác với p∗ bởi

một phép tịnh tiến, hay là đưa p(𝑡) hội tụ tới tập E p∗ khi 𝑡 → +∞.Với bài toán này, luật điều khiển đội hình được thiết kế như sau:

u𝑖 = 𝑘𝑝 X𝑗∈𝑁𝑖

𝑎𝑖𝑗(z𝑖𝑗− z∗𝑖𝑗) (5.10)

= 𝑘𝑝 X𝑗∈𝑁𝑖

= 1𝑛⊗ ¯𝜹, trong đó ¯𝜹 = 1

𝑛P𝑛 𝑖=1(p

𝑖(0) − p𝑖(0)) là một vectorhằng Do đó,

p− p(𝑡) →𝜹∗

, 𝑡 → +∞, hay p(𝑡) → p

−𝜹∗, 𝑡 → +∞, (5.13)

tức là p(𝑡) hội tụ tới tập E p∗.Phân tích hệ trong trường hợp tập Γ không khả thi sẽ được xét trongbài tập5.7.1

Ví dụ 5.3.1 Ta mô phỏng điều khiển đội hình dựa trên vị trí tươngđối cho hệ gồm 20 tác tử với đồ thị tương tác là chu trình 𝐶20 vàđội hình đặt là các đỉnh của một đa giác đều 20 cạnh Kết quả môphỏng được cho trong Hình5.2 Các tác tử dần tạo thành đội hìnhđặt khi 𝑡 → +∞

(a)

(b)

Hình 5.3: Mô phỏng thuật toán điều

khiển đội hình dựa trên vị trí tương

Trang 9

5.4 Điều khiển đội hình dựa trên khoảng cách 79

5.3.2 Trường hợp tác tử là khâu tích phân bậc hai

Xét hệ gồm 𝑛 tác tử được mô hình là khâu tích phân bậc hai:

¤

p𝑖 = v𝑖,

¤

v𝑖 = u𝑖, 𝑖 = 1, , 𝑛 (5.14)

Ở đây, p𝑖, v𝑖, và u𝑖 ∈ℝ𝑑 lần lượt là vị trí, vận tốc, và tín hiệu điều

khiển của tác tử 𝑖 viết trên 𝑔Σ

Luật điều khiển viết cho từng tác tử:

u𝑖 = −𝑘1X

𝑗∈𝑁𝑖

(p𝑖− p𝑗− (p∗𝑖− p∗𝑗)) −𝑘2v𝑖, 𝑖 = 1, , 𝑛, (5.15)trong đó 𝑘1 và 𝑘2 là các hệ số thực dương

Thực hiện phép đổi biến 𝜹 = p𝑖− p

𝑖, ta thu được phương trình

Đối chiếu lại với phần thiết kế hệ đồng thuận với tác tử tích phân bậc

hai ở mục trước, hệ (5.16) tiến tới đồng thuận 𝜹𝑖→𝛿∗, v𝑖 → 0𝑑 Điều

này tương đương với việc p𝑖(𝑡) → p

𝑖+𝜹∗, 𝑡 → +∞

5.4 Điều khiển đội hình dựa trên khoảng cách

Phương án điều khiển dựa trên khoảng cách (hay điều khiển đội hình

dựa trên vị trí tương đối trong hệ tọa độ riêng), hệ các tác tử cần thỏa

mãn các giả thuyết sau:

Trang 10

2: formation hoặc network

3: configuration, realization, hoặc

Σ

I Biến đo: Các tác tử có các hệ tham chiếu riêng được định hướngkhác nhau và không có thông tin về hệ tham chiếu toàn cục.Trong hệ tham chiếu riêng, các tác tử có thể đo vị trí tương đối

(vector sai lệch vị trí) p𝑖𝑖𝑗 = p𝑖𝑗− p𝑖𝑖 của các tác tử láng giềng

𝑗 ∈ 𝑁𝑖.

I Đồ thị tương tác: Tương tác về đo đạc giữa các tác tử được chobởi đồ thị vô hướng 𝐺, với giả thuyết 𝐺 là một đồ thị cứng (rigid).Đội hình đặt được cho bởi một tập các khoảng cách mong muốn

Γ = {𝑑∗𝑖𝑗 = kp∗𝑗− p

𝑖k }(𝑖,𝑗)∈𝐸.Mặc dù các tác tử trong hệ đo được vị trí tương đối của các tác tửkhác trongℝ𝑑, do các vector vị trí tương đối này không được biểu diễntrên cùng một hệ tọa độ chung, việc điều khiển đội hình dựa trên sailệch vị trí là không khả thi Thay vào đó, biến điều khiển lúc này đượcchọn là khoảng cách giữa các tác tử Dễ thấy, khoảng cách giữa cáctác tử có thể đo được dễ dàng từ vector sai lệch cục bộ và hoàn toànkhông phụ thuộc vào các hệ qui chiếu Do ta chỉ điều khiển tập cáckhoảng cách tương đối, một câu hỏi đặt ra là cần chọn bao nhiêu biếnkhoảng cách và cần chọn các biến này như thế nào để khi các biếnnày được thỏa mãn thì đội hình thu được chỉ sai khác đội hình đặt bởimột phép tịnh tiến và một phép quay Lời giải cho câu hỏi này có ở

lý thuyết cứng, một nhánh nghiên cứu của toán học thường được ứngdụng trong nghiên cứu về cơ học hay cấu trúc phân tử hóa học [153,

10,53,32]

5.4.1 Lý thuyết cứng khoảng cách

Xét đồ thị vô hướng 𝐺 = (𝑉 , 𝐸), trong đó 𝑉 = {1, , 𝑛} gồm 𝑛 đỉnh

và 𝐸 ⊂ 𝑉 × 𝑉 gồm 𝑚 cạnh Ứng với mỗi đỉnh 𝑖 ∈ 𝑉 ta có tương ứng

một điểm p𝑖 ∈ℝ𝑑 (𝑑 ≥ 2) Một đội hình (hay một mạng)2 được định

nghĩa bởi (𝐺, p), trong đó vector p = vec(p1, , p𝑛) ∈ℝ𝑑𝑛 gọi là mộtcấu hình3 của 𝐺 trênℝ𝑑 Lưu ý rằng các điểm p𝑖 đều được cho trênmột hệ qui chiếu toàn cục

Xét một tập khoảng cách Γ = {𝑑𝑖𝑗 > 0| (𝑖, 𝑗) ∈ 𝐸} Tập Γ gọi là khả thi

nếu tồn tại ít nhất một cấu hình p sao cho kp𝑗− p𝑖k = 𝑑𝑖𝑗, ∀(𝑖, 𝑗) ∈ 𝐸.Nếu không tồn tại cấu hình nào thỏa mãn tất cả các khoảng cách

trong Γ thì ta nói Γ là không khả thi Cấu hình p thỏa mãn mọi ràng

buộc khoảng cách trong Γ được gọi là một hiện thực hóa của Γ trên

ℝ𝑑 Ngược lại, mỗi cấu hình p∗ cho ta một tập khoảng cách dẫn xuất

Γ = {𝑑∗𝑖𝑗= kp∗𝑗− p

𝑖k }(𝑖,𝑗)∈𝐸

Xét hai cấu hình p và q của cùng một đồ thị 𝐺 trên ℝ𝑑 Hai cấu

hình p và q là tương đương về khoảng cách4 nếu như kp𝑖 − p𝑗k =

kq𝑖 − q𝑗k, ∀(𝑖, 𝑗) ∈ 𝐸, và là tương đồng về khoảng cách5 nếu như

kp𝑖− p𝑗k = kq𝑖− q𝑗k, ∀𝑖, 𝑗 ∈ 𝑉 , 𝑖 ≠ 𝑗

Trang 11

5.4 Điều khiển đội hình dựa trên khoảng cách 81

6: rigid

7: global rigidity

8: infinitesimal rigidity

Một cấu hình p của 𝐺 là cứng 6 nếu như tồn tại 𝜖 > 0 sao cho mọi

cấu hình q của 𝐺 thỏa mãn ∈ 𝐵𝜖 ,{q ∈ℝ𝑑𝑛| kq − pk < 𝜖} và q tương

đương về khoảng cách với p thì q cũng tương đồng về khoảng cách với

p Đội hình (𝐺, p) là cứng khoảng cách toàn cục7nếu như mọi cấu hình

q tương đương về khoảng cách với p thì cũng tương đồng về khoảng

cách với p.

(a) Đội hình không cứng

(b) Đội hình cứng

(c) Đội hình cứng toàn cục

Hình 5.4: Một số ví dụ minh họa lý thuyết cứng khoảng cách.

Việc xét trực tiếp liệu một cấu hình p có là cứng khoảng cách hay

không dựa trên định nghĩa là không đơn giản khi số đỉnh 𝑛 lớn Để

đơn giản hóa việc xác định tính cứng của đồ thị, ta có khái niệm cứng

khoảng cách vi phân8 - một xấp xỉ bậc nhất về tính cứng của p Đánh

số các cạnh của đồ thị từ 1 tới 𝑚, với kí hiệu 𝑒𝑘 ≡ 𝑒𝑘𝑖𝑗 ≡ (𝑖, 𝑗), ta có

các vector sai lệch vị trí tương ứng z𝑘 ≡ z𝑖𝑗 = p𝑗− p𝑖, 𝑘 =1, , 𝑚 Ta

định nghĩa hàm (bình phương các) khoảng cách:

f𝐺(p), kz1k2, , kz𝑚k>= [ , kz𝑖𝑗k2, ]>∈ℝ𝑚. (5.18)

Ma trận cứng (rigidity matrix) của đội hình (𝐺, p) được định nghĩa

là:

R(p) = 12

𝜕f𝐺(p)

Kí hiệu z = vec(z1, , z𝑚) = (H⊗I𝑑)p = ¯ Hp và Z = blkdiag(z1, , z𝑚),

ta có thể viết lại f𝐺(p) = Z>Z1𝑚 = Z>z Từ đó, ta viết được:

Chú ý rằng ma trận cứng luôn có ít nhất 𝑑 + 𝑑(𝑑 −1)/2 = 𝑑(𝑑 + 1)/2

vector riêng tương ứng với giá trị riêng 0 Các vector riêng này tương

ứng với các chuyển động bảo toàn tính cứng của đội hình, cụ thể là

phép tịnh tiến và phép quay theo các trục tọa độ của 𝑔Σ

Ví dụ 5.4.1 Ma trận cứng của đồ thị trên hình5.4(b) được cho như

Có thể nhận xét rằng, ma trận cứng có cấu trúc khá tương tự như

ma trận liên thuộc Tuy nhiên, ở hàng thứ 𝑘 tương ứng với cạnh

(𝑖, 𝑗) thì (p𝑖− p𝑗)>

được thay cho −1, (p𝑖− p𝑗)>

được thay cho1, và

0> được thay cho0

Đồ thị 𝐺 là cứng phổ quát trong ℝ𝑑 nếu như hầu hết mọi cấu hình

của 𝐺 trongℝ𝑑 đều là cứng, ngoại trừ một tập con của ℝ𝑑 với độ đo

Lebesgue bằng 0 Để đơn giản, người ta cũng gọi tắt 𝐺 là đồ thị cứng

với ý rằng 𝐺 là cứng phổ quát

Dựa vào ma trận cứng, nếu tồn tại một cấu hình p của 𝐺 sao cho

rank(R(p)) = 𝑑𝑛 − 𝑑(𝑑+1)2 thì 𝐺 là đồ thị cứng Cấu hình p của 𝐺 thỏa

mãn rank(R(p)) = 𝑑𝑛 − 𝑑(𝑑+1)2 gọi là một cấu hình với các tọa độ ở vị

Trang 12

[ 66 ]: Laman (1970), “On graphs and

rigidity of plane skeletal structures”

trí tổng quát, hay gọi tắt là một cấu hình tổng quát Ngược lại, cấu

hình p của 𝐺 mà ở đó rank(R(p))< 𝑑𝑛 − 𝑑(𝑑+1)2 gọi là một cấu hìnhsuy biến

Nếu đồ thị 𝐺 là cứng và có số cạnh đúng bằng 𝑑𝑛 − 𝑑(𝑑 +1)/2 thì 𝐺được gọi là cứng tối thiểu Dễ thấy, khi 𝑑 =2, đồ thị cứng tối thiểu

có2𝑛 − 3 cạnh Hơn nữa, trong trường hợp 𝑑 = 2, mọi đồ thị cứng tốithiểu đều là đồ thị Laman

Định nghĩa 5.4.1 (Đồ thị Laman) Một đồ thị 𝐺 = (𝑉 , 𝐸) là Lamankhi và chỉ khi:

1 Cộng đỉnh: Thêm một đỉnh 𝑘 và hai cạnh nối 𝑘 với hai đỉnh 𝑖, 𝑗hiện có trong đồ thị

2 Chia cạnh: Xóa một cạnh (𝑖, 𝑗) hiện có trong đồ thị và thêm vàomột đỉnh 𝑘 cùng ba cạnh (𝑘, 𝑖), (𝑘, 𝑗), (𝑘, 𝑙), trong đó 𝑙 là mộtđỉnh trong đồ thị hiện tại khác 𝑖, 𝑗

Đồ thị thu được từ xây dựng Henneberg là một đồ thị Laman Ngượclại, người ta cũng chứng minh được rằng mọi đồ thị Laman trong khônggian hai chiều đều có thể thu được nhờ xây dựng Henneberg

Định nghĩa5.4.1 cho ta một phương án để kiểm tra các đồ thị là cứngphổ quát với số cạnh tối thiểu Tuy nhiên, cách kiểm tra này đòi hỏiphải xét mọi tập con của đồ thị,do đó việc kiểm tra sẽ yêu cầu khốilượng tính toán cao Một số điều kiện tương đương khác để kiểm tramột đồ thị cứng tối thiểu với độ phức tạp thấp hơn là dựa trên định lýCrapo và định lý Récski [34,17]

5.4.2 Luật điều khiển đội hình

Với các khoảng cách được cho từ một đội hình đặt p= vec(p∗1, , p

𝑛) ∈

ℝ𝑑𝑛, ta định nghĩa các biến sai lệch khoảng cách𝜎𝑖𝑗 = kp𝑖−p𝑗k2−(𝑑∗

𝑖𝑗) =(𝑑𝑖𝑗) − (𝑑∗

Trang 13

5.4 Điều khiển đội hình dựa trên khoảng cách 83

là tổng các sai lệch khoảng cách mong muốn giữa các tác tử trong hệ

thì luật điều khiển đội hình thiết kế theo phương pháp gradient được

viết trên hệ tọa độ của tác tử 𝑖 như sau:

Dễ thấy rằng luật điều khiển (5.22) là một luật phân tán, và luật này

chỉ sử dụng các biến đo được bởi tác tử 𝑖 trong𝑖Σ

Chuyển phương trình (5.22) sang hệ quy chiếu toàn cục 𝑔Σ, ta có:

Dễ thấy, với luật điều khiển (5.25) thì (1𝑛⊗ I2 >p = 0 nên trọng tâm của¤

đội hình là bất biến theo thời gian Kết hợp với quan hệ p>(I𝑛⊗ J) ¤p = 0,

ta suy ra momen động lượng p>(I𝑛⊗ J)p của hệ cũng là không đổi theo

trong đó Q chứa các điểm cân bằng của (5.24), D là tập các điểm cân

bằng mong muốn (tập các đội hình thỏa mãn mọi khoảng cách đặt 𝑑∗𝑖𝑗),

và U là những điểm cân bằng không mong muốn Sự tồn tại của tập

U = {p ∈ℝ𝑑𝑛| R(p)>𝝈 = 0𝑑𝑛, 𝝈 ≠ 0𝑚} gây khó khăn cho việc xét tính

ổn định của các đội hình tương ứng với một đồ thị cứng bất kỳ

Ta xét trường hợp (𝐺, p) là cứng khoảng cách vi phân (rank(R(p∗)) =

2𝑛 − 3 = 𝑚) Chuyển phương trình (5.25) sang dạng phương trình theo

¤

𝑉 = −𝝈>

R(p)R(p)>𝝈 = −kR(p)>

𝝈k2 ≤ 0 (5.30)

Trang 14

là không thay đổi và chỉ phụ thuộc vào p(0), ta suy ra p là bị chặn.

Do đó, tồn tại 𝑅 = 𝑅( ¯p( 0)) sao cho tập compact 𝐵( ¯p(0), 𝑅) = {p ∈

ℝ2𝑛| kp − 1𝑛⊗ ¯pk ≤ 𝑅} chứa p(𝑡), ∀𝑡 ≥ 0 Giao của 𝐵( ¯p(0), 𝑅( ¯p(0)))

với các tập Q, D, Q do đó cũng là các tập bị chặn

Đạo hàm cấp hai của 𝑉 là một hàm phụ thuộc vào p, z,𝝈 nên cũng

là một hàm bị chặn Từ đây, theo bổ đề Barbalat, ta có ¤𝑉 → 0, hay

R>𝝈 → 0𝑚 Điều này chứng tỏ p → Q, khi 𝑡 → +∞.

Định nghĩa 𝛾 = minp∈ U𝑉(𝝈(𝑡)) > 0 Số họ cấu hình trong U (khôngtính tới phép quay và tịnh tiến) là một số hữu hạn nên𝛾 là hoàn toànđược định nghĩa Từ đây, nếu đội hình ban đầu được chọn thỏa mãn

𝑉(𝝈(0)) < 𝛾 thì rõ ràng, do 𝑉 không tăng, p không thể hội tụ tới tập

U Dop → Q = D ∪ U, U ∩ D = ∅, nên phải có p → D.

Do p → D, p bị chặn nên không thể tồn tại khả năng p → +∞ khi

𝑡 → +∞ Mặt khác, luật điều khiển thu được từ gradient của hàm thế

𝑉, nên không tồn tại khả năng p hội tụ tới một chu trình khép kín 9

trong D Điều này dẫn đến việc p(𝑡) → p, với p∈ D ∩ 𝐵( ¯p(0), 𝑅).

Trang 15

5.4 Điều khiển đội hình dựa trên khoảng cách 85

Ví dụ 5.4.2 Ở ví dụ này, ta sẽ minh họa giá trị 𝛾 trong điều kiện

hội tụ trong chứng minh ở trên (Xem Hình5.5) Xét đội hình gồm 3

tác tử, trong đó 𝐺 = 𝐶3 và cấu hình đặt là một tam giác đều cạnh

bằng 1 Phương trình viết cho ba tác tử được cho lần lượt bởi:

Ta sẽ tìm tập các cấu hình trong Q Rõ ràng, nếu 3 điểm p1, p2, p3

không thẳng hàng thì hệ các họ các cấu hình thỏa mãn ¤p1 = ¤p2 =

4(12+ 12+ 12) = 3

4 =𝛾1.Xét trường hợp 2 trong 3 điểm trùng nhau Do tính đối xứng, ta chỉ

cần xét p1 = p2≠ p3 Thay vào phương trình của tác tử 1 và 2, ta

có ¤p1 = −(𝑑132 − 1)(p1− p3) = 0 nên suy ra 𝑑13=1 và 𝑑23=1 Thay

vào phương trình của tác tử 3 ta thấy thỏa mãn ¤p3= 0 Như vậy,

ứng với họ cấu hình này, ta có 𝑉(𝜎) = 1

4((1 − 0)2) = 14 =𝛾2.Xét trường hợp 3 điểm thẳng hàng và không có 2 điểm nào trùng nhau

Do tính đối xứng, ta chỉ cần xét trường hợp điểm p2 nằm giữa p1 và

p3, tức là 𝑑12+𝑑23= 𝑑13 Phương trình ¤p2= 0 cho ta 𝑑12= 𝑑23= 1

2𝑑13.Thay vào phương trình ¤p1= −(𝑑122 − 1)(p1− p2) − 2(4𝑑2

& (e) bốn cấu hình khác nhau thuộc

U∗.

Chú ý rằng ma trận R( 𝝈) = R(𝝈)>

R(𝝈) ∈ℝ2𝑛×2𝑛 có cấu trúc tương tựmột ma trận Laplace (với các ma trận khối thay cho các phần tử vô

hướng) Do đó, trong một số tài liệu, nó được gọi là ma trận Laplace

cứng Giá trị riêng dương nhỏ nhất của ma trận này cũng là một chỉ

Với cách biểu diễn này, (5.24) có dạng một giao thức đồng thuận với

các trọng số 𝜎𝑘, 𝑘 = 1, , 𝑚, phụ thuộc vào biến trạng thái p Do các

trọng số 𝜎𝑘, 𝑘 = 1, , 𝑚 có thể nhận giá trị âm và phụ thuộc vào cấu

hình, ta không áp dụng được phương pháp phân tích như cho hệ đồng

thuận thông thường Mặt khác, (5.39) mô tả một hệ đồng thuận trọng

số phụ thuộc trạng thái p bị tác động bởi một tín hiệu đầu vào ở dạng

phản hồi trạng thái u(p) = ¯ H>(diag(f𝐺(p

)) ⊗ I2) ¯Hp.

Trang 16

Ví dụ 5.4.3 Để minh họa sự tồn tại của các điểm cân bằng khôngmong muốn, ta xét ví dụ trình bày trong [97,137] về một đội hìnhgồm 5 tác tử với đồ thị 𝐺 cho trên Hình5.7 các khoảng cách đặtmong muốn được cho bởi: 𝑑∗212 = 𝑑∗223 = 10, 𝑑∗213 =4, 𝑑∗214 = 𝑑∗234 = 5,

𝑑∗

25=41 và 𝑑∗45=26

Luật điều khiển đội hình dựa trên khoảng cách (5.23) đã được sửdụng Tương ứng với hai cấu hình ban đầu khác nhau, hệ hội tụtới hai cấu hình hoàn toàn khác nhau (mong muốn và không mongmuốn)

13 m = l e n g t h (H ( : , 1 ) ) ;14

15 p0 = 1 0 * ( rand ( 1 0 , 1 ) - 0 5 ) ;

16 o p t i o n s = o d e s e t ( ’ RelTol ’ , 1 e - 8 , ’ AbsTol ’ , 1 e - 1 0 ) ;17

18 [ t , p ] = ode45 ( @control_law , 0 : 0 0 0 0 0 1 : 2 , p0 , o p t i o n s ) ;19

20 y = P l o t F o r m a t i o n ( n , d , t , p ’ , H, o ) ;21

Trang 17

5.4 Điều khiển đội hình dựa trên khoảng cách 87

Hình 5.7: Đội hình gồm 5 tác tử: (a) và (b):p tiến tới một đến một cấu hình mong muốn; (c) và (d) p tiến tới một cấu hình

không mong muốn.

Trang 18

10: bearing equivalency

11: bearing congruency

12: globally bearing rigid

5.5 Điều khiển đội hình dựa trên vector hướng

Trong thời gian gần đây, các phương pháp điều khiển đội hình dựa trênvector hướng và góc được đặc biệt quan tâm Sự quan tâm này mộtphần đến từ sự phát triển của các thiết bị bay không người lái cỡ nhỏ

có gắn camera với khả năng xác định vector hướng từ ảnh thu được.Các phương án điều khiển chỉ sử dụng vector hướng hay chỉ sử dụnggóc lệch không đòi hỏi hệ qui chiếu toàn cục cũng như không sử dụngcác cảm biến về khoảng cách, nhờ đó mang đến một phương án thaythế khi các tác tử hoạt động ở môi trường không có GPS hay khi cáccảm biến khoảng cách bị hỏng

Công cụ lý thuyết để xây dựng các đội hình có thể điều khiển hìnhdạng dựa trên vector hướng là lý thuyết độ cứng hướng Khi ra đời,

lý thuyết độ cứng hướng đã được nghiên cứu với mục đích thuần toánhọc [153]

[ 153 ]: Whiteley (1996), Some

ma-troids from discrete applied geometry

Việc đưa lý thuyết độ cứng hướng vào các bài toán điềukhiển đội hình hay định vị mạng cảm biến được được đề xuất trongmột số công trình của T Eren và các cộng sự [41,42, 40]

[ 41 ]: Eren andothers (2006), “Using

angle of arrival (bearing) information

in network localization”

[ 42 ]: Eren andothers (2003), “Sensor

and network topologies of formations

with direction, bearing, and angle

in-formation between agents”

[ 40 ]: Eren (2012), “Formation shape

control based on bearing rigidity”

Điều khiểnđội hình dựa trên vector hướng chỉ thực sự được quan tâm rộng rãisau khi lý thuyết về độ cứng hướng trongℝ𝑑 được trình bày trongcác bài báo [165, 169]

[ 165 ]: Zhao andothers (2016),

“Bear-ing rigidity and almost global

bearing-only formation stabilization”

[ 169 ]: Zhao andothers (2016),

“Local-izability and distributed protocols for

bearing-based network localization in

arbitrary dimensions”

Chú ý rằng lý thuyết độ cứng hướng còn được

mở rộng trênℝ𝑑×𝑆𝑑−1 hay 𝑆𝐸(𝑑) trong các tài liệu [46,160,114,76]

[ 46 ]: Franchi andothers (2012),

“De-centralized control of parallel rigid

formations with direction constraints

and bearing measurements”

[ 160 ]: Zelazo andothers (2015),

“For-mation control using a SE(2) rigidity

theory”

[ 114 ]: Schiano andothers (2016), “A

rigidity-based decentralized bearing

formation controller for groups of

quadrotor UAVs”

[ 76 ]: Michieletto andothers (2016),

“Bearing rigidity theory in SE(3)”

.Điều khiển đội hình dựa trên lý thuyết độ cứng hướng trên 𝑆𝐸(𝑑) có

ưu điểm là không yêu cầu thông tin về một hệ qui chiếu chung, tuyvậy lại cần trao đổi thông tin giữa các tác tử

Ở mục này, chúng ta sẽ giới thiệu về lý thuyết độ cứng hướng trênℝ𝑑

và ứng dụng trong điều khiển đội hình chỉ sử dụng vector hướng

Xét một tập hợp gồm 𝑛 điểm trong không gian 𝑑 chiều (𝑛 ≥2, 𝑑 ≥ 2)

tại p𝑖 ∈ ℝ𝑑, trong đó p𝑖 ≠ p𝑗, ∀𝑖 ≠ 𝑗, 𝑖, 𝑗 ∈ {1, , 𝑛} Một đội hình

𝑑 chiều (𝐺, p) được cho bởi một đồ thị 𝐺 = (𝑉, 𝐸) và một cấu hình

p = vec(p1, , p𝑛) Với mỗi cạnh 𝑒𝑘= (𝑣𝑖, 𝑣𝑗) ∈𝐸, vector hướng chỉ từ

p𝑖 tới p𝑗 được định nghĩa bởi

g𝑖𝑗 = p𝑗− p𝑖

kp𝑗− p𝑖k = z𝑖𝑗

kz𝑖𝑗k,

trong đó z𝑖𝑗 = p𝑗− p𝑖 là vector sai lệch Với mỗi vector hướng g𝑖𝑗, ta

định nghĩa một ma trận chiếu vuông góc tương ứng P g𝑖𝑗 = I𝑑− g𝑖𝑗g>𝑖𝑗

Hai đội hình (𝐺, p) và (𝐺, q) là tương đương về hướng10 nếu P g𝑖𝑗(q𝑖−

q𝑗) = 0, ∀(𝑣𝑖, 𝑣𝑗) ∈ 𝐸 Hơn nữa, (𝐺, p) và (𝐺, q) là tương đồng về

hướng11 nếu P (p𝑖−p𝑗 )(q𝑖− q𝑗) = 0, ∀𝑖 ≠ 𝑗, 𝑖, 𝑗 = 1, , 𝑛 Một đội hình

(𝐺, p) là cứng hướng toàn cục12 nếu như một đội hình bất kỳ tương

đương về hướng với (𝐺, p) thì cũng tương đồng về hướng với (𝐺, p) Đặt g = vec(g1, , g𝑚) = [ , g>𝑖𝑗, ]>

, ma trận cứng hướng đượcđịnh nghĩa như sau:

Trang 19

5.5 Điều khiển đội hình dựa trên vector hướng 89

Hình 5.8: Ví dụ về tính cứng hướng vi phân: Trong ℝ 2 , các đội hình (a), (b), (c) là cứng hướng vi phân, các đội hình (d), (e), (f) là không cứng hướng vi phân Trong ℝ 3 , các đội hình (g), (h), (i), (j) là cứng hướng vi phân, các đội hình (k), (l) là không cứng hướng vi phân.

13: infinitesimally bearing rigid

[ 165 ]: Zhao andothers (2016), ing rigidity and almost global bearing-only formation stabilization”

“Bear-trong đó ¯H = H ⊗ I𝑑 và H là ma trận liên thuộc của 𝐺 Một đội hình

là cứng hướng vi phân13 trên ℝ𝑑 khi và chỉ khi rank(R𝑏) = 𝑑𝑛 − 𝑑 − 1,

hoặc ker(R𝑏) = im([1𝑛 ⊗ I𝑑, p]) Một đội hình là không cứng hướng

vi phân khi và chỉ khi rank(R𝑏) < 𝑑𝑛 − 𝑑 − 1 Ví dụ một số đội hình

cứng hướng vi phân và không cứng hướng vi phân được cho như trên

Hình5.8

Tính cứng hướng của một đội hình bảo toàn khi tăng số chiều 𝑑 của

không gian Nếu (𝐺, p) là cứng hướng vi phân trongℝ𝑑 thì (𝐺, p) cũng

cứng hướng vi phân trong ℝ𝑑+1 Hơn nữa, không gian sinh bởi các

chuyển làm thay đổi tỉ lệ của đội hình là trực giao với không gian các

chuyển động vi phân làm quay đội hình Hệ quả của nhận xét này là

trong không gian 𝑑 = 2 chiều, một đội hình là cứng hướng vi phân

trongℝ2 khi và chỉ khi nó cứng khoảng cách vi phân trongℝ2

Định nghĩa ma trận cứng hướng được hiệu chỉnh ˜R𝑏 = (diag(kz𝑘k) ⊗

Một đội hình thỏa mãn tính cứng hướng vi phân [165] thì cũng thỏa

mãn tính cứng hướng Tính cứng hướng là một tính chất phổ quát, tức

là nó được quyết định phần lớn bởi cấu trúc đồ thị hơn là bởi cấu hình

cụ thể

Định nghĩa 5.5.1 (Đồ thị cứng hướng phổ quát) [172] [ 172 ]: Zhao andothers (2017), “Laman

graphs are generically bearing rigid

in arbitrary dimensions”

Đồ thị 𝐺 làcứng hướng phổ quát14

14: generic bearing rigidity

trongℝ𝑑 nếu tồn tại ít nhất một cấu hình

p ∈ℝ𝑑𝑛 sao cho (𝐺, p) là cứng hướng vi phân.

Tập các đội hình cứng hướng vi phân là trù mật trong ℝ𝑑, tức là

nếu một đội hình (𝐺, p) là cứng hướng vi phân thì ta luôn tìm được

Trang 20

15: minimal bearing rigidity

[ 133 ]: Trinh andothers (2020),

“Mini-mal and redundant bearing rigidity:

Conditions and applications”

16: Thuật ngữ “open ear” được dùng

ở [ 154 ]

một đội hình (𝐺, q) cứng hướng vi phân trong mọi lân cận 𝐵𝜖= {p0∈

ℝ𝑑𝑛| kp0− pk< 𝜖}, với mọi 𝜖 > 0 Đồ thị 𝐺 là không cứng hướng (phổ

quát) nếu như nó không là cứng hướng phổ quát, nói cách khác (𝐺, p) không cứng hướng vi phân với mọi cấu hình p của 𝐺 trongℝ𝑑

Do tính cứng hướng vi phân là bảo toàn khi tăng số chiều của khônggian nên tính cứng hướng phổ quát cũng bảo toàn khi tăng số chiềucủa không gian Thật vậy, đồ thị chu trình 𝐶3 là cứng hướng phổ quáttrongℝ2 nên cũng cứng hướng phổ quát trongℝ𝑑, với 𝑑 ≥3 Trongkhi đó, đồ thị 𝐶4 là không cứng hướng trongℝ2 nhưng là cứng hướngphổ quát trongℝ3 Do đó, 𝐶4 cũng cứng hướng phổ quát trongℝ𝑑, với

𝑑 ≥ 3

Giả sử 𝐺 là một đồ thị gồm 𝑛 đỉnh và 𝑚 cạnh Tương tự với lý thuyếtcứng về khoảng cách, ta định nghĩa đồ thị cứng hướng tối thiểu nhưsau

Định nghĩa 5.5.2 (Đồ thị cứng hướng tối thiểu) Đồ thị 𝐺 là cứnghướng tối thiểu trongℝ𝑑 khi và chỉ khi không tồn tại đồ thị H nàogồm 𝑛 đỉnh mà H là cứng hướng phổ phát trênℝ𝑑 và có ít hơn 𝑚cạnh Với định nghĩa này, có thể chứng minh rằng đồ thị 𝐶𝑛 là cứnghướng phổ quát tối thiểu trongℝ𝑑 khi và chỉ khi 𝑛 ≤ 𝑑 +1

Đồ thị 𝐺 gồm 𝑚 cạnh là 1-thừa cứng hướng trongℝ𝑑 khi và chỉ khimỗi đồ thị con bao trùm của 𝐺 với 𝑚 −1 cạnh cũng là đồ thị cứngphổ quát Một số phương pháp xây dựng các đồ thị cứng hướng tốithiểu15 và đồ thị 1-thừa cứng hướng được trình bày tại [133] Ý tưởngchung của phương pháp xây dựng đồ thị cứng hướng phổ quát tối thiểuvới 𝑛 đỉnh trongℝ𝑑 xuất phát từ toán tử cộng đỉnh trong xây dựngHenneberg Tại mỗi bước, một chuỗi các đỉnh và cạnh16 với độ dàikhông quá 𝑑 được thêm vào hai đỉnh phân biệt của đồ thị cứng hướngphổ quát hiện tại Phương pháp xây dựng đồ thị cứng hướng phổ quátnày được mô tả ở Thuật toán1 Số cạnh tối thiểu được cho bởi hàm

5.5.2 Điều khiển đội hình cứng hướng vi phân

Xét đội hình gồm 𝑛 tác tử tích phân bậc nhất ¤p𝑖 = u𝑖, 𝑖 = 1, , 𝑛,

p𝑖 ∈ℝ𝑑, u𝑖 ∈ℝ𝑑 lần lượt là vị trí và tín hiệu điều khiển của tác tử thứ

𝑖 Đội hình đặt (𝐺, p

) là cứng hướng vi phân Mỗi tác tử 𝑖 có thể đo

được vector hướng g𝑖𝑗, ∀𝑗 ∈ 𝑁𝑖 và có thông tin về các vector hướng đặt

g∗, 𝑗 ∈ 𝑁𝑖

Trang 21

5.5 Điều khiển đội hình dựa trên vector hướng 91

Algorithm 1: Xây dựng một đồ thị cứng phổ quát tối thiểu gồm

P g𝑖𝑗g∗𝑖𝑗, 𝑖 = 1, , 𝑛, (5.42)

trong đó P g𝑖𝑗 = I𝑑− g𝑖𝑗g>𝑖𝑗 ∈ℝ𝑑×𝑑 là ma trận chiếu trực giao tính được

từ vector hướng g𝑖𝑗 Minh họa hình học của thuật toán này được cho

trên Hình 5.11(a) Với luật điều khiển (5.42), phương trình viết cho cả

Trang 22

Hình 5.9: Xây dựng đồ thị cứng hướng phổ quát trong ℝ 3 xuất phát từ một cạnh nối hai đỉnh.

Hình 5.10: Xây dựng đồ thị cứng hướng phổ quát trong ℝ 3 xuất phát từ chu trình 𝐶 4

Các điểm cân bằng của hệ (5.42) thỏa mãn ¤p = 0, hay

Như vậy, tại điểm cân bằng, P g𝑘g∗𝑘 = 0, ∀𝑘 =1, , 𝑚 Điều này chứng

tỏ rằng điểm cân bằng là tương đương về hướng với đội hình đặt p

Mặt khác, từ giả thuyết về tính cứng hướng vi phân của (𝐺, p∗), tasuy ra các điểm cân bằng đều tương đồng về hướng với đồ thị ban đầu.Kết hợp thêm điều kiện về trọng tâm ¯p∗= ¯p(0) và kích thước 𝑠∗= 𝑠(0),

ta suy ra ứng với một điều kiện đầu, tồn tại hai điểm cân bằng: p∗ ứng

với các vector hướng g𝑖𝑗= g∗𝑖𝑗, ∀𝑖, 𝑗 ∈ 𝑉; và p0

ứng với các vector hướng

√𝑛𝑠(0)}được thể hiện trên Hình5.11(c)

Ta sẽ chứng minh điểm cân bằng p = p0là không ổn định Xét hàmLyapunov 𝑉 = 12kp − p0k2 Đạo hàm của 𝑉 dọc theo một quĩ đạo của

Trang 23

5.5 Điều khiển đội hình dựa trên vector hướng 93

(c)

Hình 5.11: Minh họa phân tích ổn định thuật toán điều khiển đội hình chỉ dựa trên vector hướng: (a) Luật điều khiển chỉ sử dụng vector hướng; (b) Ví dụ về hai điểm cân bằng đối xứng tâm và có cùng trọng tâm; (c)

Từ đây, ¤𝑉1=0 khi và chỉ khi p = phoặc p = p0 Chú ý rằng hai điểm

cân bằng là rời nhau, nên khi xét một lân cận bất kỳ của p0 không

chứa p0 trong S, ta có 𝑉1 > 0 Theo định lý Chetaev, điểm cân bằng p0

là không ổn định [60]

Tiếp theo, ta chứng minh điểm cân bằng p = p∗ là ổn định Xét hàm

Lyapunov 𝑉 = 12k𝜹k2 Dọc theo một quĩ đạo của (5.43), ta có

Trang 24

g∗𝑘g∗>𝑘 )g𝑘, nên từ bất phương trình (5.47) suy ra

nênmax𝑘kz𝑘k ≤√𝑛𝑠 Từ đây, đặt 𝜁 =min𝑘kz∗𝑘k

) và𝜹k∈ im(1𝑛⊗ I𝑑, p∗)thì (5.49) có thể viết lại thành

¤

𝑉 ≤ −𝜁k𝜹⊥k2= −𝜁(sin 𝜃)2k𝜹k2,trong đó𝜃 ∈ [0,𝜋

Như vậy, điểm cân bằng p = p∗ là ổn định tiệm cận theo hàm mũ Với

mọi điều kiện đầu p(0) ≠ p0 thì p(𝑡) → p∗, khi 𝑡 → +∞

Ví dụ 5.5.2 Để minh họa thuật toán điều khiển đội hình chỉ dựa trênvector hướng, ta mô phỏng đội hình gồm 4 tác tử như trên Hình5.12.Cấu hình đặt là một hình vuông song song với mặt phẳng Oxy Nhìnchung, thời gian hội tụ của thuật toán chỉ sử dụng vector hướng khá

dài do khi góc sai lệch là nhỏ thì tín hiệu điều khiển u𝑖 cũng gần nhưbằng 0 Việc tăng tốc luật điều khiển đội hình sử dụng vector hướng

có thể thực hiện bằng cách thêm một hệ số khuếch đại 𝑘𝑝 trong luậtđiều khiển hoặc biến đổi luật điều khiển để hệ đạt tới cấu hình đặttrong thời gian hữu hạn [130, 82]

[ 130 ]: Tran andothers (2019),

“Finite-time bearing-only formation control

via distributed global orientation

es-timation”

[ 82 ]: Nguyen andothers (2021),

“Coor-dination of multi-agent systems with

arbitrary convergence time”

g = [ 0 , 0 , 1 , 1 , 0 , 1 , 0 , 1 , 1 , 1 , 1 , 1 ] ;

Trang 25

5.5 Điều khiển đội hình dựa trên vector hướng 95

36 l i n e ( [ p1_0 ( 1 , t_end ) , p2_0 ( 1 , t_end ) ] , [ p1_0 ( 2 , t_end ) , p2_0

( 2 , t_end ) ] , [ p1_0 ( 3 , t_end ) , p2_0 ( 3 , t_end ) ] , ’ C o l o r ’ , ’

r ’ , ’ LineWidth ’ , 1 5 , ’ L i n e S t y l e ’ , ’ - - ’ ) ; % ( 2 , 1 )

37 l i n e ( [ p1_0 ( 1 , t_end ) , p4_0 ( 1 , t_end ) ] , [ p1_0 ( 2 , t_end ) , p4_0

( 2 , t_end ) ] , [ p1_0 ( 3 , t_end ) , p4_0 ( 3 , t_end ) ] , ’ C o l o r ’ , ’

r ’ , ’ LineWidth ’ , 1 5 , ’ L i n e S t y l e ’ , ’ - - ’ ) ; % ( 4 , 1 )

l i n e ( [ p4_0 ( 1 , t_end ) , p2_0 ( 1 , t_end ) ] , [ p4_0 ( 2 , t_end ) , p2_0

Trang 26

( 2 , t_end ) ] , [ p4_0 ( 3 , t_end ) , p2_0 ( 3 , t_end ) ] , ’ C o l o r ’ , ’

r ’ , ’ LineWidth ’ , 1 5 , ’ L i n e S t y l e ’ , ’ - - ’ ) ; % ( 4 , 2 )

39 l i n e ( [ p3_0 ( 1 , t_end ) , p2_0 ( 1 , t_end ) ] , [ p3_0 ( 2 , t_end ) , p2_0

( 2 , t_end ) ] , [ p3_0 ( 3 , t_end ) , p2_0 ( 3 , t_end ) ] , ’ C o l o r ’ , ’

r ’ , ’ LineWidth ’ , 1 5 , ’ L i n e S t y l e ’ , ’ - - ’ ) ; % ( 3 , 2 )

40 l i n e ( [ p4_0 ( 1 , t_end ) , p3_0 ( 1 , t_end ) ] , [ p4_0 ( 2 , t_end ) , p3_0

( 2 , t_end ) ] , [ p4_0 ( 3 , t_end ) , p3_0 ( 3 , t_end ) ] , ’ C o l o r ’ , ’

r ’ , ’ LineWidth ’ , 1 5 , ’ L i n e S t y l e ’ , ’ - - ’ ) ; % ( 4 , 3 )41

48 % % Mark end p o s i t i o n s

49 p l o t 3 ( p1_0 ( 1 , t_end ) , p1_0 ( 2 , t_end ) , p1_0 ( 3 , t_end ) , ’ s ’ , ’

M a r k e r S i z e ’ , 1 3 , ’ MarkerEdgeColor ’ , ’ r ’ , ’MarkerFaceColor ’ , ’ w ’ ) ;

50 p l o t 3 ( p2_0 ( 1 , t_end ) , p2_0 ( 2 , t_end ) , p2_0 ( 3 , t_end ) , ’ s ’ , ’

M a r k e r S i z e ’ , 1 3 , ’ MarkerEdgeColor ’ , ’ r ’ , ’MarkerFaceColor ’ , ’ w ’ ) ;

51 p l o t 3 ( p3_0 ( 1 , t_end ) , p3_0 ( 2 , t_end ) , p3_0 ( 3 , t_end ) , ’ s ’ , ’

M a r k e r S i z e ’ , 1 3 , ’ MarkerEdgeColor ’ , ’ r ’ , ’MarkerFaceColor ’ , ’ w ’ ) ;

52 p l o t 3 ( p4_0 ( 1 , t_end ) , p4_0 ( 2 , t_end ) , p4_0 ( 3 , t_end ) , ’ s ’ , ’

M a r k e r S i z e ’ , 1 3 , ’ MarkerEdgeColor ’ , ’ r ’ , ’MarkerFaceColor ’ , ’ w ’ ) ;

Trang 27

5.6 Ghi chú và tài liệu tham khảo 97

5.6 Ghi chú và tài liệu tham khảo

Tạo đội hình đặt là bài toán cơ bản trong điều khiển đội hình Chương

này đã giới thiệu một số phương pháp điều khiển đội hình dựa trên các

biến đo, biến điều khiển khác nhau, đồng thời giới thiệu những phương

pháp đã và đang được nghiên cứu khác Một số hướng phát triển gần

đây đi vào một số khía cạnh khác như: xét mô hình tác tử gần hơn với

thực tế [27], ảnh hưởng của nhiễu [150] và trễ tới việc thành lập đội

hình, điều động đội hình (đội hình di chuyển theo một số tác tử dẫn

đầu) [149], thay đổi đội hình đặt, ghép/chia đội hình, kết hợp thêm

một số tính năng khác ngoài tạo đội hình đặt như tránh va chạm, giữ

liên kết, giữ tính cứng, Ngoài ra, một loạt các bài toán điều khiển

tạo đội hình dừng ở các đội hình với đồ thị vô hướng Việc điều khiển

Trang 28

các đội hình có hướng gần hơn với cấu trúc thực tế về đo đạc cũng nhưtruyền thông trong đội hình, tuy vậy đặt ra những vấn đề về kĩ thuậtkhi tính đối xứng của đội hình bị phá vỡ Do đó, hiện điều khiển độihình dựa trên khoảng cách hay vector hướng giải quyết được với cáccấu trúc đặc biệt như tác tử dẫn đàn-tác tử theo sau [29,55,157,120,

96,100,132, 135], hoặc chu trình có hướng [139] Một số phương ánđiều khiển trong thời gian hữu hạn hay trong thời gian định trước gầnđây cũng đã được áp dụng trong điều khiển đội hình và định vị mạngcảm biến [123,138,130,82]

5.7 Bài tập

Bài tập 5.7.1 [37] Xét bài toán điều khiển đội hình dựa trên vị trí

tương đối trong đó tập các vector sai lệch vị trí đặt Γ = {z∗𝑖𝑗}(𝑖,𝑗)∈𝐸

là không khả thi Chứng minh rằng khi đó, với luật điều khiển độihình:

¤

p𝑖= X𝑗∈𝑁𝑖

Bài tập 5.7.4 So sánh các phương pháp điều khiển đội hình dựa trênkhoảng cách và dựa trên vector hướng về các giả thiết chính, luậtđiều khiển, ưu nhược điểm

Bài tập 5.7.5 (Tính chất của các ma trận chiếu trực giao) Với x ≠ 0𝑑,

định nghĩa ma trận chiếu trực giao P x = I𝑑− xx>

kxk2 Chứng minh rằng:

i P x = P>x ≥ 0

ii P x có 𝑛 −1 giá trị riêng bằng 1 và một giá trị riêng bằng 0

iii ker(P x ) = im(1𝑛)

iv P x y = 0𝑑 khi và chỉ khi y = 𝑘x, 𝑘 ∈

v Nếu x ≠ 𝑘y (không cùng phương) thì M = P x + P x là một ma

trận đối xứng, xác định dương Tìm các giá trị riêng của M.

vi Nếu tồn tại ít nhất hai trong số các vector x1, , x𝑚 không

cùng phương thì ma trận M =P𝑚

𝑖=1P x𝑖 là đối xứng và xác địnhdương

vii Với vector hướng g𝑖𝑗= kp p𝑗−p −p𝑖k thì 𝜕g𝑖𝑗

𝜕p = −

P g𝑖𝑗

kp −pk

Trang 29

5.7 Bài tập 99

Bài tập 5.7.6 (Tổng của hai ma trận chiếu trực giao) Cho hai vector

hướng không cùng phương g1 và g2 ∈ℝ𝑑, 𝑑 ≥3 Chứng mình rằng

ma trận M = P g1+ P g2 là đối xứng, xác định dương Tìm các giá

trị riêng và vector riêng tương ứng của M (Gợi ý: chứng minh M

nhận P g1g2± P g2g1 là các vector riêng tương ứng với các giá trị riêng

1 ± g>1g2, và các vector riêng v𝑘 ⊥ span(g1, g2), 𝑘 = 3, , 𝑑, tương

ứng với các giá trị riêng 2

Bài tập 5.7.7 Xác định tính cứng khoảng cách phổ quát của các đồ

thị 𝐺1 và 𝐺2 như trên Hình5.13 Tìm xây dựng Henneberg để xây

dựng các đồ thị đó

(a)

(b) Hình 5.13: Các đồ thị 𝐺1 và 𝐺2.

Bài tập 5.7.8 [172] Giả sử đồ thị 𝐺 = (𝑉 , 𝐸) là cứng hướng trênℝ𝑑

thì khi thêm vào 𝐺 một số cạnh bất kỳ để được đồ thị 𝐺0 thì đồ thị

mới này cũng cứng hướng

Bài tập 5.7.9 [133] Giả sử hai đồ thị 𝐺1 và 𝐺2 là cứng hướng phổ

quát trênℝ𝑑 Chứng minh rằng:

i Khi 𝑑 =2, ta cần thêm ít nhất 3 cạnh để ghép hai đồ thị 𝐺1,

𝐺2 thành một đồ thị cứng hướng phổ quát.

ii Nếu 𝑑 ≥3, ta cần thêm ít nhất 2 cạnh để ghép hai đồ thị 𝐺1,

𝐺2 thành một đồ thị cứng hướng phổ quát.

Bài tập 5.7.10 [133] Chứng minh đồ thị 𝐶𝑛 với 𝑛 ≤ 𝑑 +1 là cứng

hướng phổ quát trongℝ𝑑

Bài tập 5.7.11 [165] Chứng minh nếu đội hình (𝐺, p) là cứng khoảng

cách vi phân trongℝ2 thì nó cũng cứng hướng vi phân trongℝ𝑑

Bài tập 5.7.12 [133] Chứng minh rằng một đồ thị 𝐺 = (𝑉 , 𝐸) với

|𝑉 | = 𝑛 là cứng hướng trênℝ𝑑 thì có tối thiểu là

Bài tập 5.7.13 [30] Xét một hệ gồm ba tác tử, trong đó tác tử số

1 đứng yên, tác tử thứ hai cần đạt được khoảng cách đặt 𝑑12∗ với

tác tử 1, và tác tử số 3 cần đạt được hai khoảng cách đặt 𝑑∗31và 𝑑32∗

Giả sử hai tác tử 2 và 3 sử dụng luật điều khiển đội hình dựa trên

Trang 30

Xác định các tập điểm cân bằng ứng với tác tử 2 và tác tử 3 Chứngminh rằng với luật điều khiển cho như trên, trong hầu hết mọi trườnghợp, ba tác tử sẽ đạt được đội hình đặt khi 𝑡 → +∞ Xác định tậpcác điều kiện đầu mà các tác tử sẽ không đạt được đội hình đặt Kếtquả sẽ thay đổi như thế nào nếu cả ba tác tử đều di chuyển, đồ thịtương tác là chu trình hữu hướng 𝐶3, và đội hình đặt là tam giác với

với g∗31và g∗32là hai vector hướng đặt cho trước

1 Tìm điều kiện của p1 và p2 để tồn tại điểm cân bằng p∗3 thỏamãn cả hai vector hướng cho trước Khi đó, xác định công thức

tìm p∗3 theo p1, p2, g∗31và g∗32

2 Chứng minh rằng với điều kiện tìm được ở ý 1 thì điểm cân bằngcủa hệ (nghiệm của ¤p3= 0) là duy nhất và là p3 = p∗3 Sử dụnghàm Lyapunov 𝑉 = 12kp3− p∗3k2để chứng minh p3 𝑡) → p

3khi

𝑡 → +∞

3 Với cùng phương án điều khiển trên, áp dụng cho đồ thị thuđược từ xây dựng Henneberg Chứng minh tính ổn định tiệmcận của đội hình gồm 𝑛 tác tử dựa trên lý thuyết ổn định ISS[60]

Bài tập 5.7.15 (Điều khiển đội hình chỉ sử dụng vector hướng trongthời gian hữu hạn [130]) Xét bài toán điều khiển đội hình dựa trênvector hướng với 𝐺 là đồ thị vô hướng, cứng hướng phổ quát theoluật điều khiển:

¤

p𝑖= −X𝑗∈𝑁𝑖

P g𝑖𝑗 sig P g𝑖𝑗g∗𝑖𝑗

 𝛼, 𝑖 = 1, , 𝑛,

trong đó hàm sig(·) được định nghĩa như sau: với x = [𝑥1, , 𝑥𝑑]>∈

ℝ𝑑 thì sig(x)𝛼 = [sign(𝑥1)|𝑥1|𝛼, , sign(𝑥𝑑)|𝑥𝑑|𝛼]>

, với sign(·) là hàmdấu cho bởi sign(𝑥𝑘) = 1 nếu 𝑥𝑘 > 0, sign(𝑥𝑘) = −1 nếu 𝑥𝑘 < 0 vàsign(𝑥𝑘) = 0 nếu 𝑥𝑘=0

Bài tập 5.7.16 (Điều động đội hình dựa trên lý thuyết cứng hướng[167]) Xét bài toán điều khiển đội hình trong đó 𝐺 là đồ thị vôhướng, cứng hướng vi phân trongℝ𝑑

i Giả sử các tác tử di chuyển theo luật điều khiển:

¤

p𝑖= −X𝑗∈𝑁𝑖

P g∗𝑖𝑗(p𝑖− p𝑗), 𝑖 = 1, , 𝑛,

trong đó g∗𝑖𝑗 là các vector hướng đặt Chứng minh rằng với luật

điều khiển trên, p → Ω = {p ∈ ℝ𝑑𝑛| P g

𝑖𝑗g𝑖𝑗 = 0, ∀𝑖 ≠ 𝑗, 𝑖, 𝑗 ∈

𝑉 }, khi 𝑡 → +∞

ii Giả sử trong đội hình có một vài tác tử đánh số từ 1 tới 𝑙 ≥2

di chuyển với vận tốc hằng h ∈ℝ𝑑, tức là ¤p𝑖= h, h = 0¤ 𝑑, 𝑖 =

Trang 31

5.7 Bài tập 101

1, , 𝑙 Các tác tử này (gọi là các tác tử dẫn đàn) ban đầu đã

ở vị trí thỏa mãn các vector hướng đặt Các tác tử còn lại di

chuyển với luật điều khiển cho bởi:

¤

p𝑖 = −X𝑗∈𝑁𝑖

P g∗𝑖𝑗(p𝑖− p𝑗) +𝝃𝑖,

¤

𝝃𝑖 = −X𝑗∈𝑁𝑖

Bài tập 5.7.17 (Điều động đội hình chỉ dựa trên vector hướng [164])

Xét bài toán điều khiển đội hình trong đó 𝐺 là đồ thị vô hướng, cứng

hướng vi phân trongℝ𝑑

i Giả sử các tác tử di chuyển theo luật điều khiển:

¤

p𝑖=X𝑗∈𝑁𝑖

(g𝑖𝑗− g∗𝑖𝑗), 𝑖 = 1, , 𝑛,

trong đó g∗𝑖𝑗 là các vector hướng đặt Viết lại hệ dưới dạng ma

trận và chứng minh rằng với luật điều khiển trên, p → Ω =

{p ∈ℝ𝑑𝑛| P g∗𝑖𝑗g𝑖𝑗 = 0, ∀𝑖 ≠ 𝑗, 𝑖, 𝑗 ∈ 𝑉 }, khi 𝑡 → +∞.

ii Giả sử trong đội hình có một vài tác tử đánh số từ 1 tới 𝑙 ≥2

di chuyển với vận tốc hằng h ∈ℝ𝑑, tức là ¤p𝑖= h, h = 0¤ 𝑑, 𝑖 =

1, , 𝑙 Các tác tử này (gọi là các tác tử dẫn đàn) ban đầu đã

ở vị trí thỏa mãn các vector hướng đặt Các tác tử còn lại di

chuyển với luật điều khiển cho bởi:

¤

p𝑖= X𝑗∈𝑁𝑖

(g𝑖𝑗− g∗𝑖𝑗) +𝝃𝑖,

¤

𝝃𝑖= X𝑗∈𝑁𝑖

(g𝑖𝑗− g∗𝑖𝑗), 𝑖 = 𝑙 + 1, , 𝑛

Chứng minh rằng khi 𝑡 → +∞, hệ gồm 𝑛 tác tử dần đạt được

g𝑖𝑗→ g∗𝑖𝑗, ∀𝑖, 𝑗 ∈ 𝑉 , 𝑖 ≠ 𝑗 và ¤p𝑖 → h, ∀𝑖 = 𝑙 + 1, , 𝑛.

Trang 32

[ 159 ]: Zavlanos andothers (2007),

“Potential fields for maintaining

con-nectivity of mobile networks”

vụ điều khiển đội hình Phương pháp chung giải quyết các vấn đề này

là định nghĩa một hàm thế sao cho khi điều kiện ràng buộc không đượcthỏa mãn thì giá trị của hàm thế sẽ tiến tới vô cùng Từ đây, luật điềukhiển được thiết kế theo hướng ngược chiều gradient sẽ giúp các tác tửkhông vi phạm các ràng buộc được đặt ra Nội dung về điều khiển giữliên kết và tránh va chạm trong chương này dựa trên tài liệu [159]

6.1 Giữ liên kết

Hình 6.1: Minh họa bài toán giữ liên

kết: mỗi tác tử có một miền trao đổi

thông tin mô tả bởi một hình tròn

tâm tại vị trí tác tử Nếu hai tác tử

nằm trong miền thông tin của nhau

thì tồn tại một cạnh mô tả sự tương

tác giữa hai tác tử.

Xét hệ gồm 𝑛 tác tử tích phân bậc nhất mô tả bởi:

¤

p𝑖(𝑡) = u𝑖(𝑡), (6.1)trong đó 𝑖 =1, , 𝑛, p𝑖∈ℝ𝑑 là vị trí của tác tử 𝑖 trong không gian

Kí hiệu p = vec(p1, , p𝑛) ∈ℝ𝑑𝑛.Giả sử hai tác tử 𝑖 có thể liên lạc với tác tử 𝑗 khi khoảng cách củachúng thỏa mãn 𝑑𝑖𝑗= kp𝑖− p𝑗k ≤𝛿, với 𝛿 > 0 gọi là giới hạn về khoảngcách trao đổi thông tin giữa các tác tử như mô tả ở Hình6.1.∗

Định nghĩa đồ thị tiệm cận vô hướng 𝐺(p(𝑡)) = (𝑉 , 𝐸(p(𝑡))) trong đó

𝑉 = {1, , 𝑛} và 𝐸(p(𝑡)) = {(𝑖, 𝑗)| 𝑑𝑖𝑗(𝑡) < 𝛿} và tập C𝑛 gồm mọi đồ

thị liên thông gồm 𝑛 đỉnh Bài toán giữ liên kết yêu cầu thiết kế u𝑖 sao

cho nếu 𝐺(p(0)) ∈ C𝑛 thì 𝐺(p(𝑡)) ∈C𝑛, ∀𝑡 ≥ 0

Chú ý rằng một đồ thị 𝐺 là liên thông khi và chỉ khi giá trị riêng

𝜆2(L(𝐺))> 0 Vì vậy, giá trị riêng này là một chỉ số về mức độ liên

∗Thực tế, giới hạn về trao đổi thông tin của mỗi tác tử 𝑖, kí hiệu bởi𝛿 𝑖 , có thể khác nhau Lúc này, ta có thể chọn 𝛿 = min 𝑖= , ,𝑛 𝛿 𝑖

Trang 33

6.1 Giữ liên kết 103

thông của đồ thị và việc giữ cho𝜆2 𝑡) dương cũng tương đương với việc

giữ tính liên thông của đồ thị

Định nghĩa ma trận kề phụ thuộc vị trí A(p(𝑡)) = [𝑎𝑖𝑗(p(𝑡))] ∈ℝ𝑛×𝑛

Với định nghĩa trên, do 𝑑𝑖𝑗= 𝑑𝑗𝑖, ma trận kề thỏa mãn tính đối xứng

A(p) = A(p)> Định nghĩa ma trận LaplaceL(p(𝑡)) = diag(A(p(𝑡))1𝑛)−

A(p(𝑡)) Các giá trị riêng của ma trận Laplace thỏa mãn:

0 =𝜆1(p(𝑡)) ≤𝜆2(p(𝑡)) ≤ ≤𝜆𝑛(p(𝑡)). (6.2)

Định nghĩa tậpXC 𝑛= {p(𝑡) ∈ℝ𝑑𝑛|𝜆2(p(𝑡))> 0} tương ứng với các cấu

hình làm cho đồ thị liên thông Ta phát biểu lại bài toán giữ liên kết

dưới dạng: “Thiết kế luật điều khiển u𝑖(𝑡) sao cho nếu p(0) ∈ XC𝑛 thì

p(𝑡) ∈XC 𝑛, ∀𝑡 ≥ 0

Để thiết kế luật điều khiển giữ liên kết, ta cần có thông tin về𝜆2(L(𝑡)).

Việc ước lượng𝜆2 có thể thực hiện được nhưng sẽ đòi hỏi thuật toán

khá phức tạp Thay vì trực tiếp ước lượng giá trị 𝜆2 và điều khiển

để giá trị này dương, ta sẽ giữ cho giá trịQ𝑛

𝑖=2𝜆𝑖(p) là dương Định nghĩa ma trận M(p = Q>LQ trong đó Q = [q1, , q𝑛−1] ∈ℝ𝑛×(𝑛−1)

với các vector q𝑖 ∈ℝ𝑛 thỏa mãn: (i) q>𝑖 q𝑗 =0, ∀𝑖 ≠ 𝑗, 𝑖 = 1, , 𝑛 − 1

các giá trị riêng của M(p) lần lượt là𝜆2(L(𝑡)) ≤ ≤𝜆𝑛(p(𝑡)) Do đó,

𝜆2(L(p))> 0 thỏa mãn khi và chỉ khi

cho bởi:

u𝑖 = −∇ Φ𝑐(p(𝑡)) (6.6)

Trang 34

[ 162 ]: Zelazo andothers (2015),

“De-centralized rigidity maintenance

con-trol with range measurements for

Với 𝑗 = 1, , 𝑛 − 1, khai triển định thức theo công thức Laplace

của M theo cột thứ 𝑗 cho ta det(M(p)) =P𝑛−1

𝑖=1 𝑐𝑖𝑗(p)𝑚𝑖𝑗(p), và do đó,

𝜕

𝜕𝑚 𝑖𝑗detM(p) = 𝑐𝑖𝑗(p) Từ đây suy ra với 𝑘 = 1, , 𝑛 và 𝑙 = 1, , 𝑑

thì𝑑

luật điều khiển đội hình chứg không dùng độc lập Nếu các tác tử chỉ

sử dụng luật giữ liên kết (6.6), khi 𝑡 → +∞, các tác tử có xu hướng tụlại về một điểm

Một cách tương tự, ta có thể định nghĩa bài toán giữ tính cứng khoảngcách [162], giữ tính cứng hướng, hay tổng quát hơn là giữ hạng củamột ma trận đối xứng bán xác định dương

6.2 Tránh va chạm

Trong bài toán tránh va chạm, mỗi tác tử cần giữ khoảng cách đủ xa

với các tác tử khác cũng như với vật cản Gọi p𝑖, p𝑗 lần lượt là vị trícủa tác tử 𝑖 và vị trí của tác tử 𝑗 hoặc vật cản Tác tử 𝑖 cần giữ cho

Trang 35

6.2 Tránh va chạm 105

𝑑𝑖𝑗= kp𝑖− p𝑗k > 0, ∀𝑡 ≥ 0 Do việc tránh va chạm khi khoảng cách giữ

các tác tử ở khá xa nhau là không cần thiết, ta xét bài toán khi mỗi

tác tử 𝑖 có miền tác động là một hình tròn tâm tại vị trí p𝑖 và bán

kính 𝑑> 0 Khi có tác tử hoặc vật cản ở trong miền tác động, tác tử 𝑖

sẽ thực hiện thuật toán tránh va chạm tương ứng (xem Hình6.3)

Hình 6.3: Minh họa việc tránh va chạm của các tác tử.

Tương tự như với bài toán điều khiển giữ liên kết, ta sẽ thiết kế tương

ứng hàm thế tránh va chạm nhận giá trị tại +∞ khi các tác tử va chạm

với nhau Gọi𝛽𝑖𝑗(p(𝑡)) là hàm trọng số thỏa mãn:

trong đó 𝜇 = 1+𝑑 4

𝑑 4 và 𝜌 = 1

2 1 − sign(kp𝑖− p𝑗k2−𝑑2 

Hình6.4 biểudiễn đồ thị của 𝛽𝑖𝑗(kp𝑖− p𝑗k) với một số giá trị khác nhau của tham số

𝑑

(c) 𝑑 = 1.5

Hình 6.4: Biểu diễn hàm 𝛽 𝑖𝑗(kp𝑖− p𝑗 k) với 𝑑 = 0.75, 1, 1.5.

Trang 36

Hàm thế tránh va chạm tương ứng được cho bởi

Φ𝑎(p(𝑡)) = 1

𝛽(p(𝑡))𝛼, (6.12)trong đó𝛽(p(𝑡)) =Q𝑛

dụng hàm thế Φ(p(𝑡)) = 𝑐1Φ𝑐(p(𝑡)) + 𝑐2Φ𝑎(p(𝑡)), với 𝑐1, 𝑐2> 0 là trọng

số cho mỗi nhiệm vụ Luật điều khiển tương ứng là u = −∇ p Φ p(𝑡)

Dễ thấy khi một tác tử có nhiều hơn một nhiệm vụ, các nhiệm vụ này

có thể xung đột nhau và phụ thuộc vào việc chọn trọng số cho từngviệc

Ví dụ 6.2.1 Mô phỏng thuật toán giữ liên thông với các tham sốđược chọn 𝑛 =10, 𝑑 = 2,𝛿 = 1, 𝜎 = 0.25, 𝜖 = 0.4547, 𝑔𝑎𝑖𝑛 = 10 và

𝛼 = 0.25 Các tọa độ x,y ban đầu của các tác tử được lấy ngẫu nhiêntrong khoảng [−10, 10]

chứa mọi giá trị riêng khác 0 củaL.

Kết quả mô phỏng được cho trên Hình 6.5, với các mốc thời gian

𝑡 = 10, 20, 50, 100, 200, và 500 giây Với các tham số đã chọn, cáctác tử hội tụ dần tới một điểm Code MATLAB mô phỏng hệ trongtrường hợp này được cho ở dưới đây

1 % Mo phong Vi du 7 1

2 c l e a r a l l3

4 g l o b a l n d sigma e p s i l o n J a l p h a g a i n Q5

6 n = 1 0 ; d = 2 ; sigma = 0 2 5 ; e p s i l o n = 0 4 5 4 7 ; g a i n =

1 0 ;

7 J = e y e ( n ) - 1/ n* o n e s ( n , n ) ; a l p h a = 0 2 5 ;

v = ( n - s q r t ( n ) ) / ( n * ( n - 1 ) ) ;

Trang 38

40 [ t6 , p t 6 ] = ode45 ( @updateLaw , [ 0 , 5 0 0 ] , p0 ) ;

41 f i g u r e ( 6 )

42 P l o t F o r m a t i o n 1 ( n , d , t6 , pt6 ’ , 1 ) ;43

63 % Ham t i n h ma t r a n L a p l a c e64

65 f u n c t i o n L = c a l c L ( p )

66 g l o b a l n d sigma e p s i l o n

67 P = r e s h a p e ( p , d , n ) ;

68 A = z e r o s ( n , n ) ;69

80 % Ham t i n h dao ham ma t r a n L a p l a c e81

Trang 39

Ví dụ 6.2.2 Trong ví dụ này, ta xét luật đồng thuận thông thường

kết hợp với luật tránh va chạm Xét tác tử 1 là một tác tử leader

không tham gia vào luật đồng thuận, di chuyển với vận tốc cho bởi

u1= [0.1 + 2 sin(𝑡/10), 2 cos(𝑡/10)]> Mỗi tác tử 𝑖 =2, , 20 có

u𝑖 = −∇p𝑖Φ𝐶− ∇p𝑖Φ𝐶𝐴, (6.15)

trong đó hàm thế đồng thuận được cho bởi Φ𝐶 = 12p>(L ⊗ I2)p và

hàm thế tránh va chạm được chọn là Φ𝐶𝐴= −ln(𝛽) Đồ thị tương

tác giữa các tác tử được cho bởi 𝐺 = 𝐶𝑛 (chu trình gồm 20 đỉnh)

Kết quả mô phỏng hệ được biểu diễn ở Hình6.6 Các tác tử tiến lại

gần nhau và di chuyển theo tác tử 1 nhưng giữ khoảng cách không

quá gần

Code mô phỏng hệ đa tác tử trong Ví dụ6.2.2được cho ở dưới đây (a) 𝑡 =10s

(b) 𝑡 = 20s

(c) 𝑡 = 50s Hình 6.6: Mô phỏng luật giữ liên kết trong Ví dụ 6.2.2

1 % Mo phong v i du 7 2 , l u a t dong thuan k e t hop g i u

Trang 40

25 [ t2 , p t 2 ] = ode45 ( @updateLaw , [ 0 : 0 0 1 : 5 0 ] , p0 ) ;

26 f i g u r e ( 2 )

27 P l o t F o r m a t i o n 1 ( n , d , t2 , pt2 ’ , 1 ) ;28

29 % Ve do t h i tu 0 - 100 s

30 [ t3 , p t 3 ] = ode45 ( @updateLaw , [ 0 : 0 0 1 : 1 0 0 ] , p0 ) ;

31 f i g u r e ( 3 )

32 P l o t F o r m a t i o n 1 ( n , d , t3 , pt3 ’ , 1 ) ;33

34

35 f u n c t i o n dxdt = updateLaw ( t , p )

36 g l o b a l n d g a i n L37

38 % Tinh thanh phan d i e u k h i e n dong thuan

39 uC = - g a i n * kron ( L , e y e ( 2 ) ) *p ;40

57 % L e a d e r ( t a c tu 1 ) d i chuyen

58 uL = [ 0 1 + 2* s i n ( t / 1 0 ) ;

59 2* c o s ( t / 1 0 ) ; z e r o s ( 2 * ( n - 1 ) , 1 ) ] ;60

61 % Tong hop c a c thanh phan

62 S = b l k d i a g ( z e r o s ( 2 , 2 ) , e y e ( d * ( n - 1 ) , d * ( n - 1 ) ) ) ;

63 dxdt = S * (uC + uCAV) + uL ;

64 end65 66

Ngày đăng: 30/12/2022, 16:37

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm