Phần 2 của giáo trình Điều khiển hệ đa tác tử tiếp tục trình bày những nội dung về: một số ứng dụng của hệ đa tác tử; điều khiển đội hình; giữ liên kết và tránh va chạm; định vị mạng cảm biến; mô hình động học ý kiến; hệ đồng thuận trọng số ma trận;... Mời các bạn cùng tham khảo!
Trang 1Phần III
Một số ứng dụng của hệ đa tác tử
Trang 25 Điều khiển đội hình
5.1 Giới thiệu 72
5.2 Điều khiển đội hình dựa
trên vị trí tuyệt đối 76
5.3 Điều khiển đội hình dựa
trên vị trí tương đối 77
5.3.1 Trường hợp tác tử là
khâu tích phân bậc nhất 77
5.3.2 Trường hợp tác tử là
khâu tích phân bậc hai 79
5.4 Điều khiển đội hình dựa
trên khoảng cách 79
5.4.1 Lý thuyết cứng khoảng
cách 80
5.4.2 Luật điều khiển đội hình 82
5.5 Điều khiển đội hình dựa
trên vector hướng 88
1: formation control
là một trong những bài toán quan trọng nhấttrong điều khiển hệ đa tác tử Giả sử ta có một hệ gồm 𝑛 tác tử (cóthể là UAV, UUV, xe tự lái) và ta mong muốn các phương tiện này
di chuyển như một đội hình mong muốn Đội hình mong muốn, haycòn gọi là đội hình mục tiêu, có thể được cho bởi một tập các biến vềkhoảng cách, vector hướng, hay góc lệch giữa vị trí các tác tử tronghệ
Về ứng dụng, bài toán điều khiển đội hình xuất phát từ ứng dụng vềgiao thông trên đường cao tốc thông minh, nơi các phương tiện tự thiếtlập các đội xe sao cho khoảng cách giữa các xe là không đổi và vận tốccủa các xe là như nhau [44]
[ 44 ]: Fax andothers (2004),
“Informa-tion flow and cooperative control of
[ 7 ]: Anderson andothers (2008),
“Rigid graph control architectures for
autonomous formations”
Cuối cùng, một số biến thể của bài toán điều khiển đội hình
có thể được dùng để mô phỏng, phân tích và giải thích các hiện tượng
tụ bầy ở động vật trong tự nhiên [26]
[ 26 ]: Bullo (2019), Lectures on
net-work systems
Để giải quyết bài toán điều khiển đội hình, rất nhiều phương pháp đãđược đưa ra Nhìn chung, tất cả các phương pháp điều khiển đội hìnhhiện tại đều đòi hỏi các tác tử đo một số biến hình học về đội hình, haytrao đổi thông tin với các tác tử khác trong đội hình, từ đó di chuyểnsao cho các biến này đạt tới giá trị mong muốn Trong quá trình thiếtlập đội hình, đôi khi có một số tác tử đặc biệt được chọn làm thamchiếu (tác tử dẫn đàn) cho các tác tử khác thực hiện việc điều khiểnhình dạng của toàn bộ hệ
Hiện nay, các bài toán điều khiển đội hình thường được phân loại dựatrên cơ sở là các biến đo, biến điều khiển, và điều kiện về đồ thị mô
tả luồng thông tin giữa các tác tử Bảng1 phân loại các bài toán điềukhiển đội hình theo cách phân loại này [88, 2]
[ 88 ]: Oh andothers (2015), “A survey
of multi-agent formation control”
[ 2 ]: Ahn (2019), Formation Control:
Approaches for Distributed Agents
Phươngpháp
Biến đo Biến
điềukhiển
Điều kiện
đồ thị
Tài liệu tham khảo
Dựatrên vịtrí
Vị trí Vị trí [69,156]
Dựatrên sailệch
Sai lệch Sai lệch Liên thông [44,65,72]
Trang 3và gócđịnhhướng
Đồ thịcứngkhoảngcách
Đồ thịkhôngcứngkhoảngcách
[36,93,101]
Khoảng
cách
Khoảngcách
Đồ thịcứngkhoảngcách
Đồ thịcứnghướngtrongℝ𝑑
và gócđịnhhướngtươngđối
Đồ thịcứnghướngtrong𝑆𝐸(𝑑)
và gócđịnhhướngtươngđối
Đồ thịcứnghướngtrongℝ𝑑
[165,135,136]
Trang 4Vị trítươngđối
Vị trítươngđối
Đồ thịcứnghướngtrongℝ𝑑
[168,166]
Kết hợpvectorhướng,góclệch vàkhoảngcách
Vectorhướng,góclệch vàkhoảngcách
Vectorhướng,góclệch vàkhoảngcách
Đồ thịcứng yếu
[23, 43, 122, 100, 94,
64]
Các biến trạng thái của một tác tử phân tán bao gồm một số đại lượngviết trong một hệ qui chiếu gắn với tác tử đó Thông thường, các biếntrạng thái được chọn gồm vị trí và vận tốc của tác tử cùng với hướngcủa các hệ tọa độ tham chiếu (gọi chung là định hướng của tác tử trongkhông gian) Để so sánh các giá trị của tác tử, vị trí và định hướng củatác tử cần phải được cho dưới cùng một hệ tọa độ tham chiếu Trongkhông gianℝ𝑑, định hướng của một tác tử 𝑖 được cho bởi một ma trận
R𝑖 ∈𝑆𝑂(𝑑), trong khi định hướng và vị trí được thể hiện bởi các phần
tử trong 𝑆𝐸(𝑑) Do mỗi tác tử có một hệ tọa độ tham chiếu riêng, địnhhướng của các tác tử thường có sai lệch so với nhau cũng như so với hệtham chiếu toàn cục
Hình 5.1: Hệ qui chiếu toàn cục (𝑔Σ),
hệ qui chiếu chung (𝑐Σ), và các hệ qui
chiếu cục bộ (𝑖Σ và𝑗Σ).
Trên hình5.1, hệ qui chiếu toàn cục được kí hiệu bởi𝑔Σ, còn các hệqui chiếu cục bộ/địa phương được kí hiệu bởi𝑖Σ và 𝑗Σ Các trục tọa độcủa tác tử 𝑖 và 𝑗 không trùng nhau cũng như không trùng với hệ tọa
độ toàn cục Ma trận R𝑖 ∈𝑆𝑂(𝑑) mô tả phép chuyển tọa độ từ hệ tọa
độ𝑔Σ tới𝑖Σ Ma trận để chuyển từ 𝑗Σ tới𝑖Σ được cho bởi R𝑖𝑗= R𝑖R−1𝑗
Như vậy, ma trận R−1𝑖 mô tả phép chuyển từ hệ tọa độ địa phương𝑖Σtới hệ tọa độ toàn cục 𝑔Σ
Kí hiệu Σ∗ là một hệ qui chiếu chung, không nhất thiết phải trùng với𝑔
Σ Một hệ tọa độ với các trục trùng với Σ∗ được gọi là một hệ quichiếu chung𝑐Σ Chú ý rằng hệ qui chiếu Σ∗≠𝑐Σ do gốc tọa độ của Σ∗
và𝑐Σ có thể khác nhau
Trong nhiều bài toán điều khiển đội hình, ta thường mong muốn cáctác tử có thể xác định vị trí và hướng dựa trên một hệ qui chiếu chung𝑐
Σ Ma trận R𝑐 ∈𝑆𝑂(3) mô tả phép chuyển tọa độ từ𝑔
Σ sang𝑐Σ Nếunhư hướng của các tác tử được điều chỉnh sao cho𝑖Σ =𝑗Σ =𝑐Σ thì tanói rằng các tác tử được đồng thuận về hướng
Với mỗi tác tử 𝑖, ta kí hiệu vị trí của tác tử này trên hệ tham chiếu toàn
cục là p𝑖∈ℝ𝑑 Với hai tác tử 𝑖 và 𝑗, vector sai lệch z𝑖𝑗= p𝑖− p𝑗 là mộtvector viết trong hệ tham chiếu toàn cục 𝑔Σ Vector này cũng có thể
biểu diễn bởi z𝑖𝑖𝑗 = p𝑖𝑖− p𝑖𝑗 = −p𝑖𝑗 trong𝑖Σ hoặc là z𝑗𝑖𝑗= p𝑗𝑗− p𝑗𝑖 = −p𝑗𝑖
trong𝑖Σ do p𝑖𝑖 = p𝑗𝑗 = 0 Chú ý rằng vector z𝑖𝑗 có hướng từ 𝑗 tới 𝑖,
trong khi z𝑗𝑖 có hướng từ 𝑖 tới 𝑗 Chú ý rằng z𝑗𝑗𝑖 = p𝑗𝑖 (vị trí của 𝑖 đobởi 𝑗 trong hệ qui chiếu𝑗Σ) hay z𝑖𝑗𝑖= −p𝑖𝑗 (vị trí của 𝑗 đo bởi 𝑖 trong
hệ qui chiếu𝑖Σ) Mặc dù p𝑗− p𝑖 = z𝑗𝑖 = −z𝑖𝑗 = −(p𝑖− p𝑗), do hệ qui
Trang 5𝑗𝑖, z𝑖𝑗𝑗, và z𝑗𝑗𝑖 đều có độ dài như nhau và bằng khoảng cách giữa
hai tác tử 𝑖 và 𝑗 Ta kí hiệu khoảng cách từ tác tử 𝑖 tới tác tử 𝑗 bởi
𝑑𝑖𝑗= kp𝑖− p𝑗k = kz𝑖𝑖𝑗k = kz𝑗𝑖𝑗k = kz𝑖𝑗k = 𝑑𝑗𝑖
Một đại lượng (tương đối) khác có thể được đo đạc giữa hai tác tử 𝑖 và
𝑗 là vector (đơn vị) hướng g𝑖𝑗 = kp p𝑗−p𝑖
𝑗−p𝑖 k với giả thuyết rằng p𝑖 ≠ p𝑗 Dễ
thấy kg𝑖𝑖𝑗k = kg𝑖𝑗k = 1 Chú ý rằng g𝑖𝑗 = −g𝑗𝑖, tuy nhiên g𝑖𝑖𝑗≠ −g𝑗𝑗𝑖 với
cùng lý do như với các vector vị trí tương đối
Với mỗi tác tử 𝑖, ta giả thuyết rằng tác tử 𝑖 có mô hình tích phân bậc
nhất
¤
p𝑖 = u𝑖, 𝑖 = 1, , 𝑛, (5.1)
với u𝑖 là tín hiệu điều khiển Phương trình (5.1) được viết trên hệ qui
chiếu 𝑔Σ Ta có thể biến đổi (5.1) như sau
R𝑖p¤𝑖 = R𝑖u𝑖hay, ¤p𝑖𝑖 = u𝑖𝑖, (5.2)
với u𝑖𝑖 là tín hiệu điều khiển biểu diễn trên hệ qui chiếu địa phương 𝑖Σ
gắn với tác tử 𝑖
Tiếp theo, ta định nghĩa khái niệm về các cấu trúc (tập cạnh) mô tả
tương tác giữa các tác tử trong hệ, bao gồm: đo đạc, điều khiển, và
truyền tin
Định nghĩa 5.1.1 (Cấu trúc đo đạc, điều khiển, truyền tin) Nếu tác
tử 𝑖 đo một biến tương đối nào đó với tác tử 𝑗 thì tác tử 𝑗 là một
láng giềng-ra của 𝑖 trong đồ thị đo đạc 𝐺𝑠, kí hiệu bởi 𝑗 ∈ 𝑁𝑖𝑜, và
(𝑖, 𝑗) ∈ 𝐸𝑠
Nếu tín hiệu điều khiển của tác tử 𝑖 dựa trên chuyển động
của tác tử 𝑗 thì 𝑗 là một láng giềng ra của 𝑖 trong đồ thị điều khiển
𝐺𝑎
, kí hiệu bởi (𝑖, 𝑗) ∈ 𝐸𝑎 Nếu tác tử 𝑗 gửi một biến thông tin tới
tác tử 𝑖 thì 𝑗 là một láng giềng-ra của tác tử 𝑖 trong đồ thị thông tin
𝐺𝑐
, kí hiệu bởi (𝑖, 𝑗) ∈ 𝐸𝑐
Như vậy, trong một bài toán điều khiển đội hình tổng quát, các cấu trúc
về đo đạc, điều khiển, cũng như truyền tin là khác nhau: 𝐸𝑠 ≠ 𝐸𝑎≠ 𝐸𝑐
Khi nói đến một cấu trúc của một đội hình mà không nói gì thêm, ta
ngầm nói đến cả ba cấu trúc này
Khi một tác tử 𝑖 đo vị trí tương đối với tác tử 𝑗, 𝑖 có thể không cập
nhật vị trí của mình dựa trên vị trí tương đối mà chỉ dựa trên khoảng
cách giữa hai tác tử, hay dựa trên vector hướng từ 𝑖 tới 𝑗 Trong tài
liệu này, ta sử dụng thuật ngữ điều khiển đội hình dựa trên “X” nếu
như các tác tử trong hệ điều khiển vị trí của mình dựa trên biến “X” và
không tính tới việc các tác tử đo đạc hay truyền tin các biến nào khác
Với qui ước này, ta sẽ lần lượt xét các phương pháp điều khiển đội
hình dựa trên vị trí tuyệt đối, vị trí tương đối, khoảng cách và vector
Trang 6hướng Đây là các phương pháp điều khiển đội hình đã và đang đượcquan tâm nghiên cứu gần đây.
5.2 Điều khiển đội hình dựa trên vị trí tuyệt đối
Khi tất cả các tác tử đều có thể nhận thông tin vị trí của mình từ hệtham chiếu toàn cục 𝑔Σ, bài toán điều khiển đội hình trở nên khá đơn
giản Cụ thể, khi mỗi tác tử 𝑖 biết được p𝑖 và mong muốn đạt tới vị
trí đặt p∗𝑖 thì luật điều khiển đội hình (5.1) viết cho mỗi tác tử có thểthiết kế đơn giản dưới dạng
¤
p𝑖 = u𝑖 = −𝑘𝑝(p𝑖− p∗𝑖), 𝑖 = 1, , 𝑛, (5.3)với 𝑘𝑝 > 0 là hằng số dương
Kí hiệu p = vec(p1, , p𝑛), p∗ = vec(p∗1, , p∗
Để cải thiện chất lượng điều khiển, ta có thể giả thiết rằng các tác tử
có thể trao đổi thông tin về vị trí với nhau qua đồ thị 𝐺 và thêm vàoluật điều khiển đội hình (5.3) thành phầnP
tỏ thành phần điều khiển từ trao đổi thông tin có thể làm tăng tốc độđạt được đội hình
Ví dụ 5.2.1 Mô phỏng điều khiển đội hình gồm 20 tác tử dựa trên
vị trí tuyệt đối trong 2D và 3D được cho ở Hình5.2 Với luật điềukhiển đã cho, các tác tử di chuyển trực tiếp tới vị trí đặt trong khônggian (các đỉnh của một đa giác đều gồm 20 đỉnh)
Trang 75.3 Điều khiển đội hình dựa trên vị trí tương đối 77
Code MATLAB của ví dụ 5.2.1 (mô phỏng đội hình trên 2D) được
cho dưới đây, trong đó hàm PlotFormation dùng để biểu diễn đội hình
được dùng chung trong các ví dụ ở mục này được cho ở Phụ lục C.1
(a) Đội hình trong không gian 2 chiều
(b) Đội hình trong không gian 3 chiều
Hình 5.2: Mô phỏng thuật toán điều khiển đội hình dựa trên vị trí tuyệt đối.
5.3 Điều khiển đội hình dựa trên vị trí tương đối
Trong phương án điều khiển dựa trên vị trí tương đối, hệ các tác tử
cần thỏa mãn các giả thuyết sau:
Biến đo Các tác tử có các hệ qui chiếu cục bộ được định hướng như
nhau và giống như hệ qui chiếu toàn cục Tuy nhiên, các tác tử
không cần biết gốc tọa độ của hệ qui chiếu toàn cục này Trong
hệ tham chiếu địa phương, các tác tử có thể đo vị trí tương đối
(vector sai lệch vị trí) và vận tốc tương đối (đối với tác tử bậc
hai) của một số tác tử láng giềng Chú ý rằng do các hệ qui chiếu
địa phương là cùng hướng với hệ qui chiếu toàn cục, vector vị trí
tương đối đo trong các hệ qui chiếu đều như nhau
Đồ thị tương tác Tương tác về đo đạc giữa các tác tử được cho bởi
đồ thị vô hướng 𝐺, với giả thuyết 𝐺 = (𝑉 , 𝐸) là một đồ thị liên
thông Đội hình đặt được cho bởi một tập các vector sai lệch vị
trí mong muốn giữa các tác tử tương ứng với 𝐺
5.3.1 Trường hợp tác tử là khâu tích phân bậc nhất
Xét hệ gồm 𝑛 tác tử trong đó mỗi tác tử trong đội hình có mô hình là
khâu tích phân bậc nhất:
¤
p𝑖 = u𝑖, 𝑖 = 1, , 𝑛 (5.8)
Ở đây, p𝑖 ∈ℝ𝑑 và u𝑖 ∈ℝ𝑑 lần lượt là vị trí và tín hiệu điều khiển của
tác tử 𝑖 viết trên hệ qui chiếu toàn cục 𝑔Σ
Trang 8Từ giả thuyết về đo đạc ở trên, mỗi tác tử 𝑖 có thể đo được z𝑖𝑗 =
p𝑗− p𝑖, ∀𝑗 ∈ 𝑁𝑖 Đội hình đặt được cho bởi tập Γ = {z∗
𝑖𝑗}(𝑖,𝑗)∈𝐸, và mụctiêu của mỗi tác tử là đạt được đội hình thỏa mãn tất cả các vector sailêch vị trí mong muốn đều được thỏa mãn
z𝑖𝑗 = p𝑗− p𝑖= z∗𝑖𝑗, (𝑖, 𝑗) ∈ 𝐸
Tập Γ = {z∗𝑖𝑗}(𝑖,𝑗)∈𝐸 được gọi là khả thi nếu như tập
Ep∗ ,{p ∈ℝ𝑑𝑛| p𝑗− p𝑖= z∗𝑖𝑗, ∀(𝑖, 𝑗) ∈ 𝐸}, (5.9)
là khác tập rỗng Ngược lại, nếu Ep∗ = ∅, ta gọi Γ là không khả thi
Trong mục này, ta giả sử Γ là khả thi và xét p∗ = vec(p∗1, , p∗
𝑛), làmột phần tử trong Ep∗ Hơn nữa, ta giả sử rằng mỗi tác tử chỉ biết được
một số vector sai lêch đặt z∗𝑖𝑗= p∗𝑗− p∗
𝑖, ∀𝑗 ∈ 𝑁𝑖 chứ không biết được
p∗𝑖 và p∗𝑗 Bài toán đặt ra là đưa p tới một đội hình sai khác với p∗ bởi
một phép tịnh tiến, hay là đưa p(𝑡) hội tụ tới tập E p∗ khi 𝑡 → +∞.Với bài toán này, luật điều khiển đội hình được thiết kế như sau:
u𝑖 = 𝑘𝑝 X𝑗∈𝑁𝑖
𝑎𝑖𝑗(z𝑖𝑗− z∗𝑖𝑗) (5.10)
= 𝑘𝑝 X𝑗∈𝑁𝑖
= 1𝑛⊗ ¯𝜹, trong đó ¯𝜹 = 1
𝑛P𝑛 𝑖=1(p∗
𝑖(0) − p𝑖(0)) là một vectorhằng Do đó,
p∗− p(𝑡) →𝜹∗
, 𝑡 → +∞, hay p(𝑡) → p∗
−𝜹∗, 𝑡 → +∞, (5.13)
tức là p(𝑡) hội tụ tới tập E p∗.Phân tích hệ trong trường hợp tập Γ không khả thi sẽ được xét trongbài tập5.7.1
Ví dụ 5.3.1 Ta mô phỏng điều khiển đội hình dựa trên vị trí tươngđối cho hệ gồm 20 tác tử với đồ thị tương tác là chu trình 𝐶20 vàđội hình đặt là các đỉnh của một đa giác đều 20 cạnh Kết quả môphỏng được cho trong Hình5.2 Các tác tử dần tạo thành đội hìnhđặt khi 𝑡 → +∞
(a)
(b)
Hình 5.3: Mô phỏng thuật toán điều
khiển đội hình dựa trên vị trí tương
Trang 95.4 Điều khiển đội hình dựa trên khoảng cách 79
5.3.2 Trường hợp tác tử là khâu tích phân bậc hai
Xét hệ gồm 𝑛 tác tử được mô hình là khâu tích phân bậc hai:
¤
p𝑖 = v𝑖,
¤
v𝑖 = u𝑖, 𝑖 = 1, , 𝑛 (5.14)
Ở đây, p𝑖, v𝑖, và u𝑖 ∈ℝ𝑑 lần lượt là vị trí, vận tốc, và tín hiệu điều
khiển của tác tử 𝑖 viết trên 𝑔Σ
Luật điều khiển viết cho từng tác tử:
u𝑖 = −𝑘1X
𝑗∈𝑁𝑖
(p𝑖− p𝑗− (p∗𝑖− p∗𝑗)) −𝑘2v𝑖, 𝑖 = 1, , 𝑛, (5.15)trong đó 𝑘1 và 𝑘2 là các hệ số thực dương
Thực hiện phép đổi biến 𝜹 = p𝑖− p∗
𝑖, ta thu được phương trình
Đối chiếu lại với phần thiết kế hệ đồng thuận với tác tử tích phân bậc
hai ở mục trước, hệ (5.16) tiến tới đồng thuận 𝜹𝑖→𝛿∗, v𝑖 → 0𝑑 Điều
này tương đương với việc p𝑖(𝑡) → p∗
𝑖+𝜹∗, 𝑡 → +∞
5.4 Điều khiển đội hình dựa trên khoảng cách
Phương án điều khiển dựa trên khoảng cách (hay điều khiển đội hình
dựa trên vị trí tương đối trong hệ tọa độ riêng), hệ các tác tử cần thỏa
mãn các giả thuyết sau:
Trang 102: formation hoặc network
3: configuration, realization, hoặc
Σ
I Biến đo: Các tác tử có các hệ tham chiếu riêng được định hướngkhác nhau và không có thông tin về hệ tham chiếu toàn cục.Trong hệ tham chiếu riêng, các tác tử có thể đo vị trí tương đối
(vector sai lệch vị trí) p𝑖𝑖𝑗 = p𝑖𝑗− p𝑖𝑖 của các tác tử láng giềng
𝑗 ∈ 𝑁𝑖.
I Đồ thị tương tác: Tương tác về đo đạc giữa các tác tử được chobởi đồ thị vô hướng 𝐺, với giả thuyết 𝐺 là một đồ thị cứng (rigid).Đội hình đặt được cho bởi một tập các khoảng cách mong muốn
Γ = {𝑑∗𝑖𝑗 = kp∗𝑗− p∗
𝑖k }(𝑖,𝑗)∈𝐸.Mặc dù các tác tử trong hệ đo được vị trí tương đối của các tác tửkhác trongℝ𝑑, do các vector vị trí tương đối này không được biểu diễntrên cùng một hệ tọa độ chung, việc điều khiển đội hình dựa trên sailệch vị trí là không khả thi Thay vào đó, biến điều khiển lúc này đượcchọn là khoảng cách giữa các tác tử Dễ thấy, khoảng cách giữa cáctác tử có thể đo được dễ dàng từ vector sai lệch cục bộ và hoàn toànkhông phụ thuộc vào các hệ qui chiếu Do ta chỉ điều khiển tập cáckhoảng cách tương đối, một câu hỏi đặt ra là cần chọn bao nhiêu biếnkhoảng cách và cần chọn các biến này như thế nào để khi các biếnnày được thỏa mãn thì đội hình thu được chỉ sai khác đội hình đặt bởimột phép tịnh tiến và một phép quay Lời giải cho câu hỏi này có ở
lý thuyết cứng, một nhánh nghiên cứu của toán học thường được ứngdụng trong nghiên cứu về cơ học hay cấu trúc phân tử hóa học [153,
10,53,32]
5.4.1 Lý thuyết cứng khoảng cách
Xét đồ thị vô hướng 𝐺 = (𝑉 , 𝐸), trong đó 𝑉 = {1, , 𝑛} gồm 𝑛 đỉnh
và 𝐸 ⊂ 𝑉 × 𝑉 gồm 𝑚 cạnh Ứng với mỗi đỉnh 𝑖 ∈ 𝑉 ta có tương ứng
một điểm p𝑖 ∈ℝ𝑑 (𝑑 ≥ 2) Một đội hình (hay một mạng)2 được định
nghĩa bởi (𝐺, p), trong đó vector p = vec(p1, , p𝑛) ∈ℝ𝑑𝑛 gọi là mộtcấu hình3 của 𝐺 trênℝ𝑑 Lưu ý rằng các điểm p𝑖 đều được cho trênmột hệ qui chiếu toàn cục
Xét một tập khoảng cách Γ = {𝑑𝑖𝑗 > 0| (𝑖, 𝑗) ∈ 𝐸} Tập Γ gọi là khả thi
nếu tồn tại ít nhất một cấu hình p sao cho kp𝑗− p𝑖k = 𝑑𝑖𝑗, ∀(𝑖, 𝑗) ∈ 𝐸.Nếu không tồn tại cấu hình nào thỏa mãn tất cả các khoảng cách
trong Γ thì ta nói Γ là không khả thi Cấu hình p thỏa mãn mọi ràng
buộc khoảng cách trong Γ được gọi là một hiện thực hóa của Γ trên
ℝ𝑑 Ngược lại, mỗi cấu hình p∗ cho ta một tập khoảng cách dẫn xuất
Γ = {𝑑∗𝑖𝑗= kp∗𝑗− p∗
𝑖k }(𝑖,𝑗)∈𝐸
Xét hai cấu hình p và q của cùng một đồ thị 𝐺 trên ℝ𝑑 Hai cấu
hình p và q là tương đương về khoảng cách4 nếu như kp𝑖 − p𝑗k =
kq𝑖 − q𝑗k, ∀(𝑖, 𝑗) ∈ 𝐸, và là tương đồng về khoảng cách5 nếu như
kp𝑖− p𝑗k = kq𝑖− q𝑗k, ∀𝑖, 𝑗 ∈ 𝑉 , 𝑖 ≠ 𝑗
Trang 115.4 Điều khiển đội hình dựa trên khoảng cách 81
6: rigid
7: global rigidity
8: infinitesimal rigidity
Một cấu hình p của 𝐺 là cứng 6 nếu như tồn tại 𝜖 > 0 sao cho mọi
cấu hình q của 𝐺 thỏa mãn ∈ 𝐵𝜖 ,{q ∈ℝ𝑑𝑛| kq − pk < 𝜖} và q tương
đương về khoảng cách với p thì q cũng tương đồng về khoảng cách với
p Đội hình (𝐺, p) là cứng khoảng cách toàn cục7nếu như mọi cấu hình
q tương đương về khoảng cách với p thì cũng tương đồng về khoảng
cách với p.
(a) Đội hình không cứng
(b) Đội hình cứng
(c) Đội hình cứng toàn cục
Hình 5.4: Một số ví dụ minh họa lý thuyết cứng khoảng cách.
Việc xét trực tiếp liệu một cấu hình p có là cứng khoảng cách hay
không dựa trên định nghĩa là không đơn giản khi số đỉnh 𝑛 lớn Để
đơn giản hóa việc xác định tính cứng của đồ thị, ta có khái niệm cứng
khoảng cách vi phân8 - một xấp xỉ bậc nhất về tính cứng của p Đánh
số các cạnh của đồ thị từ 1 tới 𝑚, với kí hiệu 𝑒𝑘 ≡ 𝑒𝑘𝑖𝑗 ≡ (𝑖, 𝑗), ta có
các vector sai lệch vị trí tương ứng z𝑘 ≡ z𝑖𝑗 = p𝑗− p𝑖, 𝑘 =1, , 𝑚 Ta
định nghĩa hàm (bình phương các) khoảng cách:
f𝐺(p), kz1k2, , kz𝑚k>= [ , kz𝑖𝑗k2, ]>∈ℝ𝑚. (5.18)
Ma trận cứng (rigidity matrix) của đội hình (𝐺, p) được định nghĩa
là:
R(p) = 12
𝜕f𝐺(p)
Kí hiệu z = vec(z1, , z𝑚) = (H⊗I𝑑)p = ¯ Hp và Z = blkdiag(z1, , z𝑚),
ta có thể viết lại f𝐺(p) = Z>Z1𝑚 = Z>z Từ đó, ta viết được:
Chú ý rằng ma trận cứng luôn có ít nhất 𝑑 + 𝑑(𝑑 −1)/2 = 𝑑(𝑑 + 1)/2
vector riêng tương ứng với giá trị riêng 0 Các vector riêng này tương
ứng với các chuyển động bảo toàn tính cứng của đội hình, cụ thể là
phép tịnh tiến và phép quay theo các trục tọa độ của 𝑔Σ
Ví dụ 5.4.1 Ma trận cứng của đồ thị trên hình5.4(b) được cho như
Có thể nhận xét rằng, ma trận cứng có cấu trúc khá tương tự như
ma trận liên thuộc Tuy nhiên, ở hàng thứ 𝑘 tương ứng với cạnh
(𝑖, 𝑗) thì (p𝑖− p𝑗)>
được thay cho −1, (p𝑖− p𝑗)>
được thay cho1, và
0> được thay cho0
Đồ thị 𝐺 là cứng phổ quát trong ℝ𝑑 nếu như hầu hết mọi cấu hình
của 𝐺 trongℝ𝑑 đều là cứng, ngoại trừ một tập con của ℝ𝑑 với độ đo
Lebesgue bằng 0 Để đơn giản, người ta cũng gọi tắt 𝐺 là đồ thị cứng
với ý rằng 𝐺 là cứng phổ quát
Dựa vào ma trận cứng, nếu tồn tại một cấu hình p của 𝐺 sao cho
rank(R(p)) = 𝑑𝑛 − 𝑑(𝑑+1)2 thì 𝐺 là đồ thị cứng Cấu hình p của 𝐺 thỏa
mãn rank(R(p)) = 𝑑𝑛 − 𝑑(𝑑+1)2 gọi là một cấu hình với các tọa độ ở vị
Trang 12[ 66 ]: Laman (1970), “On graphs and
rigidity of plane skeletal structures”
trí tổng quát, hay gọi tắt là một cấu hình tổng quát Ngược lại, cấu
hình p của 𝐺 mà ở đó rank(R(p))< 𝑑𝑛 − 𝑑(𝑑+1)2 gọi là một cấu hìnhsuy biến
Nếu đồ thị 𝐺 là cứng và có số cạnh đúng bằng 𝑑𝑛 − 𝑑(𝑑 +1)/2 thì 𝐺được gọi là cứng tối thiểu Dễ thấy, khi 𝑑 =2, đồ thị cứng tối thiểu
có2𝑛 − 3 cạnh Hơn nữa, trong trường hợp 𝑑 = 2, mọi đồ thị cứng tốithiểu đều là đồ thị Laman
Định nghĩa 5.4.1 (Đồ thị Laman) Một đồ thị 𝐺 = (𝑉 , 𝐸) là Lamankhi và chỉ khi:
1 Cộng đỉnh: Thêm một đỉnh 𝑘 và hai cạnh nối 𝑘 với hai đỉnh 𝑖, 𝑗hiện có trong đồ thị
2 Chia cạnh: Xóa một cạnh (𝑖, 𝑗) hiện có trong đồ thị và thêm vàomột đỉnh 𝑘 cùng ba cạnh (𝑘, 𝑖), (𝑘, 𝑗), (𝑘, 𝑙), trong đó 𝑙 là mộtđỉnh trong đồ thị hiện tại khác 𝑖, 𝑗
Đồ thị thu được từ xây dựng Henneberg là một đồ thị Laman Ngượclại, người ta cũng chứng minh được rằng mọi đồ thị Laman trong khônggian hai chiều đều có thể thu được nhờ xây dựng Henneberg
Định nghĩa5.4.1 cho ta một phương án để kiểm tra các đồ thị là cứngphổ quát với số cạnh tối thiểu Tuy nhiên, cách kiểm tra này đòi hỏiphải xét mọi tập con của đồ thị,do đó việc kiểm tra sẽ yêu cầu khốilượng tính toán cao Một số điều kiện tương đương khác để kiểm tramột đồ thị cứng tối thiểu với độ phức tạp thấp hơn là dựa trên định lýCrapo và định lý Récski [34,17]
5.4.2 Luật điều khiển đội hình
Với các khoảng cách được cho từ một đội hình đặt p∗ = vec(p∗1, , p∗
𝑛) ∈
ℝ𝑑𝑛, ta định nghĩa các biến sai lệch khoảng cách𝜎𝑖𝑗 = kp𝑖−p𝑗k2−(𝑑∗
𝑖𝑗) =(𝑑𝑖𝑗) − (𝑑∗
Trang 135.4 Điều khiển đội hình dựa trên khoảng cách 83
là tổng các sai lệch khoảng cách mong muốn giữa các tác tử trong hệ
thì luật điều khiển đội hình thiết kế theo phương pháp gradient được
viết trên hệ tọa độ của tác tử 𝑖 như sau:
Dễ thấy rằng luật điều khiển (5.22) là một luật phân tán, và luật này
chỉ sử dụng các biến đo được bởi tác tử 𝑖 trong𝑖Σ
Chuyển phương trình (5.22) sang hệ quy chiếu toàn cục 𝑔Σ, ta có:
Dễ thấy, với luật điều khiển (5.25) thì (1𝑛⊗ I2 >p = 0 nên trọng tâm của¤
đội hình là bất biến theo thời gian Kết hợp với quan hệ p>(I𝑛⊗ J) ¤p = 0,
ta suy ra momen động lượng p>(I𝑛⊗ J)p của hệ cũng là không đổi theo
trong đó Q chứa các điểm cân bằng của (5.24), D là tập các điểm cân
bằng mong muốn (tập các đội hình thỏa mãn mọi khoảng cách đặt 𝑑∗𝑖𝑗),
và U là những điểm cân bằng không mong muốn Sự tồn tại của tập
U = {p ∈ℝ𝑑𝑛| R(p)>𝝈 = 0𝑑𝑛, 𝝈 ≠ 0𝑚} gây khó khăn cho việc xét tính
ổn định của các đội hình tương ứng với một đồ thị cứng bất kỳ
Ta xét trường hợp (𝐺, p∗) là cứng khoảng cách vi phân (rank(R(p∗)) =
2𝑛 − 3 = 𝑚) Chuyển phương trình (5.25) sang dạng phương trình theo
¤
𝑉 = −𝝈>
R(p)R(p)>𝝈 = −kR(p)>
𝝈k2 ≤ 0 (5.30)
Trang 14là không thay đổi và chỉ phụ thuộc vào p(0), ta suy ra p là bị chặn.
Do đó, tồn tại 𝑅 = 𝑅( ¯p( 0)) sao cho tập compact 𝐵( ¯p(0), 𝑅) = {p ∈
ℝ2𝑛| kp − 1𝑛⊗ ¯pk ≤ 𝑅} chứa p(𝑡), ∀𝑡 ≥ 0 Giao của 𝐵( ¯p(0), 𝑅( ¯p(0)))
với các tập Q, D, Q do đó cũng là các tập bị chặn
Đạo hàm cấp hai của 𝑉 là một hàm phụ thuộc vào p, z,𝝈 nên cũng
là một hàm bị chặn Từ đây, theo bổ đề Barbalat, ta có ¤𝑉 → 0, hay
R>𝝈 → 0𝑚 Điều này chứng tỏ p → Q, khi 𝑡 → +∞.
Định nghĩa 𝛾 = minp∈ U𝑉(𝝈(𝑡)) > 0 Số họ cấu hình trong U (khôngtính tới phép quay và tịnh tiến) là một số hữu hạn nên𝛾 là hoàn toànđược định nghĩa Từ đây, nếu đội hình ban đầu được chọn thỏa mãn
𝑉(𝝈(0)) < 𝛾 thì rõ ràng, do 𝑉 không tăng, p không thể hội tụ tới tập
U Dop → Q = D ∪ U, U ∩ D = ∅, nên phải có p → D.
Do p → D, p bị chặn nên không thể tồn tại khả năng p → +∞ khi
𝑡 → +∞ Mặt khác, luật điều khiển thu được từ gradient của hàm thế
𝑉, nên không tồn tại khả năng p hội tụ tới một chu trình khép kín 9
trong D Điều này dẫn đến việc p(𝑡) → p∗, với p∗∈ D ∩ 𝐵( ¯p(0), 𝑅).
Trang 155.4 Điều khiển đội hình dựa trên khoảng cách 85
Ví dụ 5.4.2 Ở ví dụ này, ta sẽ minh họa giá trị 𝛾 trong điều kiện
hội tụ trong chứng minh ở trên (Xem Hình5.5) Xét đội hình gồm 3
tác tử, trong đó 𝐺 = 𝐶3 và cấu hình đặt là một tam giác đều cạnh
bằng 1 Phương trình viết cho ba tác tử được cho lần lượt bởi:
Ta sẽ tìm tập các cấu hình trong Q Rõ ràng, nếu 3 điểm p1, p2, p3
không thẳng hàng thì hệ các họ các cấu hình thỏa mãn ¤p1 = ¤p2 =
4(12+ 12+ 12) = 3
4 =𝛾1.Xét trường hợp 2 trong 3 điểm trùng nhau Do tính đối xứng, ta chỉ
cần xét p1 = p2≠ p3 Thay vào phương trình của tác tử 1 và 2, ta
có ¤p1 = −(𝑑132 − 1)(p1− p3) = 0 nên suy ra 𝑑13=1 và 𝑑23=1 Thay
vào phương trình của tác tử 3 ta thấy thỏa mãn ¤p3= 0 Như vậy,
ứng với họ cấu hình này, ta có 𝑉(𝜎) = 1
4((1 − 0)2) = 14 =𝛾2.Xét trường hợp 3 điểm thẳng hàng và không có 2 điểm nào trùng nhau
Do tính đối xứng, ta chỉ cần xét trường hợp điểm p2 nằm giữa p1 và
p3, tức là 𝑑12+𝑑23= 𝑑13 Phương trình ¤p2= 0 cho ta 𝑑12= 𝑑23= 1
2𝑑13.Thay vào phương trình ¤p1= −(𝑑122 − 1)(p1− p2) − 2(4𝑑2
& (e) bốn cấu hình khác nhau thuộc
U∗.
Chú ý rằng ma trận R( 𝝈) = R(𝝈)>
R(𝝈) ∈ℝ2𝑛×2𝑛 có cấu trúc tương tựmột ma trận Laplace (với các ma trận khối thay cho các phần tử vô
hướng) Do đó, trong một số tài liệu, nó được gọi là ma trận Laplace
cứng Giá trị riêng dương nhỏ nhất của ma trận này cũng là một chỉ
Với cách biểu diễn này, (5.24) có dạng một giao thức đồng thuận với
các trọng số 𝜎𝑘, 𝑘 = 1, , 𝑚, phụ thuộc vào biến trạng thái p Do các
trọng số 𝜎𝑘, 𝑘 = 1, , 𝑚 có thể nhận giá trị âm và phụ thuộc vào cấu
hình, ta không áp dụng được phương pháp phân tích như cho hệ đồng
thuận thông thường Mặt khác, (5.39) mô tả một hệ đồng thuận trọng
số phụ thuộc trạng thái p bị tác động bởi một tín hiệu đầu vào ở dạng
phản hồi trạng thái u(p) = ¯ H>(diag(f𝐺(p∗
)) ⊗ I2) ¯Hp.
Trang 16Ví dụ 5.4.3 Để minh họa sự tồn tại của các điểm cân bằng khôngmong muốn, ta xét ví dụ trình bày trong [97,137] về một đội hìnhgồm 5 tác tử với đồ thị 𝐺 cho trên Hình5.7 các khoảng cách đặtmong muốn được cho bởi: 𝑑∗212 = 𝑑∗223 = 10, 𝑑∗213 =4, 𝑑∗214 = 𝑑∗234 = 5,
𝑑∗
25=41 và 𝑑∗45=26
Luật điều khiển đội hình dựa trên khoảng cách (5.23) đã được sửdụng Tương ứng với hai cấu hình ban đầu khác nhau, hệ hội tụtới hai cấu hình hoàn toàn khác nhau (mong muốn và không mongmuốn)
13 m = l e n g t h (H ( : , 1 ) ) ;14
15 p0 = 1 0 * ( rand ( 1 0 , 1 ) - 0 5 ) ;
16 o p t i o n s = o d e s e t ( ’ RelTol ’ , 1 e - 8 , ’ AbsTol ’ , 1 e - 1 0 ) ;17
18 [ t , p ] = ode45 ( @control_law , 0 : 0 0 0 0 0 1 : 2 , p0 , o p t i o n s ) ;19
20 y = P l o t F o r m a t i o n ( n , d , t , p ’ , H, o ) ;21
Trang 175.4 Điều khiển đội hình dựa trên khoảng cách 87
Hình 5.7: Đội hình gồm 5 tác tử: (a) và (b):p tiến tới một đến một cấu hình mong muốn; (c) và (d) p tiến tới một cấu hình
không mong muốn.
Trang 1810: bearing equivalency
11: bearing congruency
12: globally bearing rigid
5.5 Điều khiển đội hình dựa trên vector hướng
Trong thời gian gần đây, các phương pháp điều khiển đội hình dựa trênvector hướng và góc được đặc biệt quan tâm Sự quan tâm này mộtphần đến từ sự phát triển của các thiết bị bay không người lái cỡ nhỏ
có gắn camera với khả năng xác định vector hướng từ ảnh thu được.Các phương án điều khiển chỉ sử dụng vector hướng hay chỉ sử dụnggóc lệch không đòi hỏi hệ qui chiếu toàn cục cũng như không sử dụngcác cảm biến về khoảng cách, nhờ đó mang đến một phương án thaythế khi các tác tử hoạt động ở môi trường không có GPS hay khi cáccảm biến khoảng cách bị hỏng
Công cụ lý thuyết để xây dựng các đội hình có thể điều khiển hìnhdạng dựa trên vector hướng là lý thuyết độ cứng hướng Khi ra đời,
lý thuyết độ cứng hướng đã được nghiên cứu với mục đích thuần toánhọc [153]
[ 153 ]: Whiteley (1996), Some
ma-troids from discrete applied geometry
Việc đưa lý thuyết độ cứng hướng vào các bài toán điềukhiển đội hình hay định vị mạng cảm biến được được đề xuất trongmột số công trình của T Eren và các cộng sự [41,42, 40]
[ 41 ]: Eren andothers (2006), “Using
angle of arrival (bearing) information
in network localization”
[ 42 ]: Eren andothers (2003), “Sensor
and network topologies of formations
with direction, bearing, and angle
in-formation between agents”
[ 40 ]: Eren (2012), “Formation shape
control based on bearing rigidity”
Điều khiểnđội hình dựa trên vector hướng chỉ thực sự được quan tâm rộng rãisau khi lý thuyết về độ cứng hướng trongℝ𝑑 được trình bày trongcác bài báo [165, 169]
[ 165 ]: Zhao andothers (2016),
“Bear-ing rigidity and almost global
bearing-only formation stabilization”
[ 169 ]: Zhao andothers (2016),
“Local-izability and distributed protocols for
bearing-based network localization in
arbitrary dimensions”
Chú ý rằng lý thuyết độ cứng hướng còn được
mở rộng trênℝ𝑑×𝑆𝑑−1 hay 𝑆𝐸(𝑑) trong các tài liệu [46,160,114,76]
[ 46 ]: Franchi andothers (2012),
“De-centralized control of parallel rigid
formations with direction constraints
and bearing measurements”
[ 160 ]: Zelazo andothers (2015),
“For-mation control using a SE(2) rigidity
theory”
[ 114 ]: Schiano andothers (2016), “A
rigidity-based decentralized bearing
formation controller for groups of
quadrotor UAVs”
[ 76 ]: Michieletto andothers (2016),
“Bearing rigidity theory in SE(3)”
.Điều khiển đội hình dựa trên lý thuyết độ cứng hướng trên 𝑆𝐸(𝑑) có
ưu điểm là không yêu cầu thông tin về một hệ qui chiếu chung, tuyvậy lại cần trao đổi thông tin giữa các tác tử
Ở mục này, chúng ta sẽ giới thiệu về lý thuyết độ cứng hướng trênℝ𝑑
và ứng dụng trong điều khiển đội hình chỉ sử dụng vector hướng
Xét một tập hợp gồm 𝑛 điểm trong không gian 𝑑 chiều (𝑛 ≥2, 𝑑 ≥ 2)
tại p𝑖 ∈ ℝ𝑑, trong đó p𝑖 ≠ p𝑗, ∀𝑖 ≠ 𝑗, 𝑖, 𝑗 ∈ {1, , 𝑛} Một đội hình
𝑑 chiều (𝐺, p) được cho bởi một đồ thị 𝐺 = (𝑉, 𝐸) và một cấu hình
p = vec(p1, , p𝑛) Với mỗi cạnh 𝑒𝑘= (𝑣𝑖, 𝑣𝑗) ∈𝐸, vector hướng chỉ từ
p𝑖 tới p𝑗 được định nghĩa bởi
g𝑖𝑗 = p𝑗− p𝑖
kp𝑗− p𝑖k = z𝑖𝑗
kz𝑖𝑗k,
trong đó z𝑖𝑗 = p𝑗− p𝑖 là vector sai lệch Với mỗi vector hướng g𝑖𝑗, ta
định nghĩa một ma trận chiếu vuông góc tương ứng P g𝑖𝑗 = I𝑑− g𝑖𝑗g>𝑖𝑗
Hai đội hình (𝐺, p) và (𝐺, q) là tương đương về hướng10 nếu P g𝑖𝑗(q𝑖−
q𝑗) = 0, ∀(𝑣𝑖, 𝑣𝑗) ∈ 𝐸 Hơn nữa, (𝐺, p) và (𝐺, q) là tương đồng về
hướng11 nếu P (p𝑖−p𝑗 )(q𝑖− q𝑗) = 0, ∀𝑖 ≠ 𝑗, 𝑖, 𝑗 = 1, , 𝑛 Một đội hình
(𝐺, p) là cứng hướng toàn cục12 nếu như một đội hình bất kỳ tương
đương về hướng với (𝐺, p) thì cũng tương đồng về hướng với (𝐺, p) Đặt g = vec(g1, , g𝑚) = [ , g>𝑖𝑗, ]>
, ma trận cứng hướng đượcđịnh nghĩa như sau:
Trang 195.5 Điều khiển đội hình dựa trên vector hướng 89
Hình 5.8: Ví dụ về tính cứng hướng vi phân: Trong ℝ 2 , các đội hình (a), (b), (c) là cứng hướng vi phân, các đội hình (d), (e), (f) là không cứng hướng vi phân Trong ℝ 3 , các đội hình (g), (h), (i), (j) là cứng hướng vi phân, các đội hình (k), (l) là không cứng hướng vi phân.
13: infinitesimally bearing rigid
[ 165 ]: Zhao andothers (2016), ing rigidity and almost global bearing-only formation stabilization”
“Bear-trong đó ¯H = H ⊗ I𝑑 và H là ma trận liên thuộc của 𝐺 Một đội hình
là cứng hướng vi phân13 trên ℝ𝑑 khi và chỉ khi rank(R𝑏) = 𝑑𝑛 − 𝑑 − 1,
hoặc ker(R𝑏) = im([1𝑛 ⊗ I𝑑, p]) Một đội hình là không cứng hướng
vi phân khi và chỉ khi rank(R𝑏) < 𝑑𝑛 − 𝑑 − 1 Ví dụ một số đội hình
cứng hướng vi phân và không cứng hướng vi phân được cho như trên
Hình5.8
Tính cứng hướng của một đội hình bảo toàn khi tăng số chiều 𝑑 của
không gian Nếu (𝐺, p) là cứng hướng vi phân trongℝ𝑑 thì (𝐺, p) cũng
cứng hướng vi phân trong ℝ𝑑+1 Hơn nữa, không gian sinh bởi các
chuyển làm thay đổi tỉ lệ của đội hình là trực giao với không gian các
chuyển động vi phân làm quay đội hình Hệ quả của nhận xét này là
trong không gian 𝑑 = 2 chiều, một đội hình là cứng hướng vi phân
trongℝ2 khi và chỉ khi nó cứng khoảng cách vi phân trongℝ2
Định nghĩa ma trận cứng hướng được hiệu chỉnh ˜R𝑏 = (diag(kz𝑘k) ⊗
Một đội hình thỏa mãn tính cứng hướng vi phân [165] thì cũng thỏa
mãn tính cứng hướng Tính cứng hướng là một tính chất phổ quát, tức
là nó được quyết định phần lớn bởi cấu trúc đồ thị hơn là bởi cấu hình
cụ thể
Định nghĩa 5.5.1 (Đồ thị cứng hướng phổ quát) [172] [ 172 ]: Zhao andothers (2017), “Laman
graphs are generically bearing rigid
in arbitrary dimensions”
Đồ thị 𝐺 làcứng hướng phổ quát14
14: generic bearing rigidity
trongℝ𝑑 nếu tồn tại ít nhất một cấu hình
p ∈ℝ𝑑𝑛 sao cho (𝐺, p) là cứng hướng vi phân.
Tập các đội hình cứng hướng vi phân là trù mật trong ℝ𝑑, tức là
nếu một đội hình (𝐺, p) là cứng hướng vi phân thì ta luôn tìm được
Trang 2015: minimal bearing rigidity
[ 133 ]: Trinh andothers (2020),
“Mini-mal and redundant bearing rigidity:
Conditions and applications”
16: Thuật ngữ “open ear” được dùng
ở [ 154 ]
một đội hình (𝐺, q) cứng hướng vi phân trong mọi lân cận 𝐵𝜖= {p0∈
ℝ𝑑𝑛| kp0− pk< 𝜖}, với mọi 𝜖 > 0 Đồ thị 𝐺 là không cứng hướng (phổ
quát) nếu như nó không là cứng hướng phổ quát, nói cách khác (𝐺, p) không cứng hướng vi phân với mọi cấu hình p của 𝐺 trongℝ𝑑
Do tính cứng hướng vi phân là bảo toàn khi tăng số chiều của khônggian nên tính cứng hướng phổ quát cũng bảo toàn khi tăng số chiềucủa không gian Thật vậy, đồ thị chu trình 𝐶3 là cứng hướng phổ quáttrongℝ2 nên cũng cứng hướng phổ quát trongℝ𝑑, với 𝑑 ≥3 Trongkhi đó, đồ thị 𝐶4 là không cứng hướng trongℝ2 nhưng là cứng hướngphổ quát trongℝ3 Do đó, 𝐶4 cũng cứng hướng phổ quát trongℝ𝑑, với
𝑑 ≥ 3
Giả sử 𝐺 là một đồ thị gồm 𝑛 đỉnh và 𝑚 cạnh Tương tự với lý thuyếtcứng về khoảng cách, ta định nghĩa đồ thị cứng hướng tối thiểu nhưsau
Định nghĩa 5.5.2 (Đồ thị cứng hướng tối thiểu) Đồ thị 𝐺 là cứnghướng tối thiểu trongℝ𝑑 khi và chỉ khi không tồn tại đồ thị H nàogồm 𝑛 đỉnh mà H là cứng hướng phổ phát trênℝ𝑑 và có ít hơn 𝑚cạnh Với định nghĩa này, có thể chứng minh rằng đồ thị 𝐶𝑛 là cứnghướng phổ quát tối thiểu trongℝ𝑑 khi và chỉ khi 𝑛 ≤ 𝑑 +1
Đồ thị 𝐺 gồm 𝑚 cạnh là 1-thừa cứng hướng trongℝ𝑑 khi và chỉ khimỗi đồ thị con bao trùm của 𝐺 với 𝑚 −1 cạnh cũng là đồ thị cứngphổ quát Một số phương pháp xây dựng các đồ thị cứng hướng tốithiểu15 và đồ thị 1-thừa cứng hướng được trình bày tại [133] Ý tưởngchung của phương pháp xây dựng đồ thị cứng hướng phổ quát tối thiểuvới 𝑛 đỉnh trongℝ𝑑 xuất phát từ toán tử cộng đỉnh trong xây dựngHenneberg Tại mỗi bước, một chuỗi các đỉnh và cạnh16 với độ dàikhông quá 𝑑 được thêm vào hai đỉnh phân biệt của đồ thị cứng hướngphổ quát hiện tại Phương pháp xây dựng đồ thị cứng hướng phổ quátnày được mô tả ở Thuật toán1 Số cạnh tối thiểu được cho bởi hàm
5.5.2 Điều khiển đội hình cứng hướng vi phân
Xét đội hình gồm 𝑛 tác tử tích phân bậc nhất ¤p𝑖 = u𝑖, 𝑖 = 1, , 𝑛,
p𝑖 ∈ℝ𝑑, u𝑖 ∈ℝ𝑑 lần lượt là vị trí và tín hiệu điều khiển của tác tử thứ
𝑖 Đội hình đặt (𝐺, p∗
) là cứng hướng vi phân Mỗi tác tử 𝑖 có thể đo
được vector hướng g𝑖𝑗, ∀𝑗 ∈ 𝑁𝑖 và có thông tin về các vector hướng đặt
g∗, 𝑗 ∈ 𝑁𝑖
Trang 215.5 Điều khiển đội hình dựa trên vector hướng 91
Algorithm 1: Xây dựng một đồ thị cứng phổ quát tối thiểu gồm
P g𝑖𝑗g∗𝑖𝑗, 𝑖 = 1, , 𝑛, (5.42)
trong đó P g𝑖𝑗 = I𝑑− g𝑖𝑗g>𝑖𝑗 ∈ℝ𝑑×𝑑 là ma trận chiếu trực giao tính được
từ vector hướng g𝑖𝑗 Minh họa hình học của thuật toán này được cho
trên Hình 5.11(a) Với luật điều khiển (5.42), phương trình viết cho cả
Trang 22Hình 5.9: Xây dựng đồ thị cứng hướng phổ quát trong ℝ 3 xuất phát từ một cạnh nối hai đỉnh.
Hình 5.10: Xây dựng đồ thị cứng hướng phổ quát trong ℝ 3 xuất phát từ chu trình 𝐶 4
Các điểm cân bằng của hệ (5.42) thỏa mãn ¤p = 0, hay
Như vậy, tại điểm cân bằng, P g𝑘g∗𝑘 = 0, ∀𝑘 =1, , 𝑚 Điều này chứng
tỏ rằng điểm cân bằng là tương đương về hướng với đội hình đặt p∗
Mặt khác, từ giả thuyết về tính cứng hướng vi phân của (𝐺, p∗), tasuy ra các điểm cân bằng đều tương đồng về hướng với đồ thị ban đầu.Kết hợp thêm điều kiện về trọng tâm ¯p∗= ¯p(0) và kích thước 𝑠∗= 𝑠(0),
ta suy ra ứng với một điều kiện đầu, tồn tại hai điểm cân bằng: p∗ ứng
với các vector hướng g𝑖𝑗= g∗𝑖𝑗, ∀𝑖, 𝑗 ∈ 𝑉; và p0
ứng với các vector hướng
√𝑛𝑠(0)}được thể hiện trên Hình5.11(c)
Ta sẽ chứng minh điểm cân bằng p = p0là không ổn định Xét hàmLyapunov 𝑉 = 12kp − p0k2 Đạo hàm của 𝑉 dọc theo một quĩ đạo của
Trang 235.5 Điều khiển đội hình dựa trên vector hướng 93
(c)
Hình 5.11: Minh họa phân tích ổn định thuật toán điều khiển đội hình chỉ dựa trên vector hướng: (a) Luật điều khiển chỉ sử dụng vector hướng; (b) Ví dụ về hai điểm cân bằng đối xứng tâm và có cùng trọng tâm; (c)
Từ đây, ¤𝑉1=0 khi và chỉ khi p = p∗ hoặc p = p0 Chú ý rằng hai điểm
cân bằng là rời nhau, nên khi xét một lân cận bất kỳ của p0 không
chứa p0 trong S, ta có 𝑉1 > 0 Theo định lý Chetaev, điểm cân bằng p0
là không ổn định [60]
Tiếp theo, ta chứng minh điểm cân bằng p = p∗ là ổn định Xét hàm
Lyapunov 𝑉 = 12k𝜹k2 Dọc theo một quĩ đạo của (5.43), ta có
Trang 24g∗𝑘g∗>𝑘 )g𝑘, nên từ bất phương trình (5.47) suy ra
nênmax𝑘kz𝑘k ≤√𝑛𝑠 Từ đây, đặt 𝜁 =min𝑘kz∗𝑘k
) và𝜹k∈ im(1𝑛⊗ I𝑑, p∗)thì (5.49) có thể viết lại thành
¤
𝑉 ≤ −𝜁k𝜹⊥k2= −𝜁(sin 𝜃)2k𝜹k2,trong đó𝜃 ∈ [0,𝜋
Như vậy, điểm cân bằng p = p∗ là ổn định tiệm cận theo hàm mũ Với
mọi điều kiện đầu p(0) ≠ p0 thì p(𝑡) → p∗, khi 𝑡 → +∞
Ví dụ 5.5.2 Để minh họa thuật toán điều khiển đội hình chỉ dựa trênvector hướng, ta mô phỏng đội hình gồm 4 tác tử như trên Hình5.12.Cấu hình đặt là một hình vuông song song với mặt phẳng Oxy Nhìnchung, thời gian hội tụ của thuật toán chỉ sử dụng vector hướng khá
dài do khi góc sai lệch là nhỏ thì tín hiệu điều khiển u𝑖 cũng gần nhưbằng 0 Việc tăng tốc luật điều khiển đội hình sử dụng vector hướng
có thể thực hiện bằng cách thêm một hệ số khuếch đại 𝑘𝑝 trong luậtđiều khiển hoặc biến đổi luật điều khiển để hệ đạt tới cấu hình đặttrong thời gian hữu hạn [130, 82]
[ 130 ]: Tran andothers (2019),
“Finite-time bearing-only formation control
via distributed global orientation
es-timation”
[ 82 ]: Nguyen andothers (2021),
“Coor-dination of multi-agent systems with
arbitrary convergence time”
g = [ 0 , 0 , 1 , 1 , 0 , 1 , 0 , 1 , 1 , 1 , 1 , 1 ] ;
Trang 255.5 Điều khiển đội hình dựa trên vector hướng 95
36 l i n e ( [ p1_0 ( 1 , t_end ) , p2_0 ( 1 , t_end ) ] , [ p1_0 ( 2 , t_end ) , p2_0
( 2 , t_end ) ] , [ p1_0 ( 3 , t_end ) , p2_0 ( 3 , t_end ) ] , ’ C o l o r ’ , ’
r ’ , ’ LineWidth ’ , 1 5 , ’ L i n e S t y l e ’ , ’ - - ’ ) ; % ( 2 , 1 )
37 l i n e ( [ p1_0 ( 1 , t_end ) , p4_0 ( 1 , t_end ) ] , [ p1_0 ( 2 , t_end ) , p4_0
( 2 , t_end ) ] , [ p1_0 ( 3 , t_end ) , p4_0 ( 3 , t_end ) ] , ’ C o l o r ’ , ’
r ’ , ’ LineWidth ’ , 1 5 , ’ L i n e S t y l e ’ , ’ - - ’ ) ; % ( 4 , 1 )
l i n e ( [ p4_0 ( 1 , t_end ) , p2_0 ( 1 , t_end ) ] , [ p4_0 ( 2 , t_end ) , p2_0
Trang 26( 2 , t_end ) ] , [ p4_0 ( 3 , t_end ) , p2_0 ( 3 , t_end ) ] , ’ C o l o r ’ , ’
r ’ , ’ LineWidth ’ , 1 5 , ’ L i n e S t y l e ’ , ’ - - ’ ) ; % ( 4 , 2 )
39 l i n e ( [ p3_0 ( 1 , t_end ) , p2_0 ( 1 , t_end ) ] , [ p3_0 ( 2 , t_end ) , p2_0
( 2 , t_end ) ] , [ p3_0 ( 3 , t_end ) , p2_0 ( 3 , t_end ) ] , ’ C o l o r ’ , ’
r ’ , ’ LineWidth ’ , 1 5 , ’ L i n e S t y l e ’ , ’ - - ’ ) ; % ( 3 , 2 )
40 l i n e ( [ p4_0 ( 1 , t_end ) , p3_0 ( 1 , t_end ) ] , [ p4_0 ( 2 , t_end ) , p3_0
( 2 , t_end ) ] , [ p4_0 ( 3 , t_end ) , p3_0 ( 3 , t_end ) ] , ’ C o l o r ’ , ’
r ’ , ’ LineWidth ’ , 1 5 , ’ L i n e S t y l e ’ , ’ - - ’ ) ; % ( 4 , 3 )41
48 % % Mark end p o s i t i o n s
49 p l o t 3 ( p1_0 ( 1 , t_end ) , p1_0 ( 2 , t_end ) , p1_0 ( 3 , t_end ) , ’ s ’ , ’
M a r k e r S i z e ’ , 1 3 , ’ MarkerEdgeColor ’ , ’ r ’ , ’MarkerFaceColor ’ , ’ w ’ ) ;
50 p l o t 3 ( p2_0 ( 1 , t_end ) , p2_0 ( 2 , t_end ) , p2_0 ( 3 , t_end ) , ’ s ’ , ’
M a r k e r S i z e ’ , 1 3 , ’ MarkerEdgeColor ’ , ’ r ’ , ’MarkerFaceColor ’ , ’ w ’ ) ;
51 p l o t 3 ( p3_0 ( 1 , t_end ) , p3_0 ( 2 , t_end ) , p3_0 ( 3 , t_end ) , ’ s ’ , ’
M a r k e r S i z e ’ , 1 3 , ’ MarkerEdgeColor ’ , ’ r ’ , ’MarkerFaceColor ’ , ’ w ’ ) ;
52 p l o t 3 ( p4_0 ( 1 , t_end ) , p4_0 ( 2 , t_end ) , p4_0 ( 3 , t_end ) , ’ s ’ , ’
M a r k e r S i z e ’ , 1 3 , ’ MarkerEdgeColor ’ , ’ r ’ , ’MarkerFaceColor ’ , ’ w ’ ) ;
Trang 275.6 Ghi chú và tài liệu tham khảo 97
5.6 Ghi chú và tài liệu tham khảo
Tạo đội hình đặt là bài toán cơ bản trong điều khiển đội hình Chương
này đã giới thiệu một số phương pháp điều khiển đội hình dựa trên các
biến đo, biến điều khiển khác nhau, đồng thời giới thiệu những phương
pháp đã và đang được nghiên cứu khác Một số hướng phát triển gần
đây đi vào một số khía cạnh khác như: xét mô hình tác tử gần hơn với
thực tế [27], ảnh hưởng của nhiễu [150] và trễ tới việc thành lập đội
hình, điều động đội hình (đội hình di chuyển theo một số tác tử dẫn
đầu) [149], thay đổi đội hình đặt, ghép/chia đội hình, kết hợp thêm
một số tính năng khác ngoài tạo đội hình đặt như tránh va chạm, giữ
liên kết, giữ tính cứng, Ngoài ra, một loạt các bài toán điều khiển
tạo đội hình dừng ở các đội hình với đồ thị vô hướng Việc điều khiển
Trang 28các đội hình có hướng gần hơn với cấu trúc thực tế về đo đạc cũng nhưtruyền thông trong đội hình, tuy vậy đặt ra những vấn đề về kĩ thuậtkhi tính đối xứng của đội hình bị phá vỡ Do đó, hiện điều khiển độihình dựa trên khoảng cách hay vector hướng giải quyết được với cáccấu trúc đặc biệt như tác tử dẫn đàn-tác tử theo sau [29,55,157,120,
96,100,132, 135], hoặc chu trình có hướng [139] Một số phương ánđiều khiển trong thời gian hữu hạn hay trong thời gian định trước gầnđây cũng đã được áp dụng trong điều khiển đội hình và định vị mạngcảm biến [123,138,130,82]
5.7 Bài tập
Bài tập 5.7.1 [37] Xét bài toán điều khiển đội hình dựa trên vị trí
tương đối trong đó tập các vector sai lệch vị trí đặt Γ = {z∗𝑖𝑗}(𝑖,𝑗)∈𝐸
là không khả thi Chứng minh rằng khi đó, với luật điều khiển độihình:
¤
p𝑖= X𝑗∈𝑁𝑖
Bài tập 5.7.4 So sánh các phương pháp điều khiển đội hình dựa trênkhoảng cách và dựa trên vector hướng về các giả thiết chính, luậtđiều khiển, ưu nhược điểm
Bài tập 5.7.5 (Tính chất của các ma trận chiếu trực giao) Với x ≠ 0𝑑,
định nghĩa ma trận chiếu trực giao P x = I𝑑− xx>
kxk2 Chứng minh rằng:
i P x = P>x ≥ 0
ii P x có 𝑛 −1 giá trị riêng bằng 1 và một giá trị riêng bằng 0
iii ker(P x ) = im(1𝑛)
iv P x y = 0𝑑 khi và chỉ khi y = 𝑘x, 𝑘 ∈ℝ
v Nếu x ≠ 𝑘y (không cùng phương) thì M = P x + P x là một ma
trận đối xứng, xác định dương Tìm các giá trị riêng của M.
vi Nếu tồn tại ít nhất hai trong số các vector x1, , x𝑚 không
cùng phương thì ma trận M =P𝑚
𝑖=1P x𝑖 là đối xứng và xác địnhdương
vii Với vector hướng g𝑖𝑗= kp p𝑗−p −p𝑖k thì 𝜕g𝑖𝑗
𝜕p = −
P g𝑖𝑗
kp −pk
Trang 295.7 Bài tập 99
Bài tập 5.7.6 (Tổng của hai ma trận chiếu trực giao) Cho hai vector
hướng không cùng phương g1 và g2 ∈ℝ𝑑, 𝑑 ≥3 Chứng mình rằng
ma trận M = P g1+ P g2 là đối xứng, xác định dương Tìm các giá
trị riêng và vector riêng tương ứng của M (Gợi ý: chứng minh M
nhận P g1g2± P g2g1 là các vector riêng tương ứng với các giá trị riêng
1 ± g>1g2, và các vector riêng v𝑘 ⊥ span(g1, g2), 𝑘 = 3, , 𝑑, tương
ứng với các giá trị riêng 2
Bài tập 5.7.7 Xác định tính cứng khoảng cách phổ quát của các đồ
thị 𝐺1 và 𝐺2 như trên Hình5.13 Tìm xây dựng Henneberg để xây
dựng các đồ thị đó
(a)
(b) Hình 5.13: Các đồ thị 𝐺1 và 𝐺2.
Bài tập 5.7.8 [172] Giả sử đồ thị 𝐺 = (𝑉 , 𝐸) là cứng hướng trênℝ𝑑
thì khi thêm vào 𝐺 một số cạnh bất kỳ để được đồ thị 𝐺0 thì đồ thị
mới này cũng cứng hướng
Bài tập 5.7.9 [133] Giả sử hai đồ thị 𝐺1 và 𝐺2 là cứng hướng phổ
quát trênℝ𝑑 Chứng minh rằng:
i Khi 𝑑 =2, ta cần thêm ít nhất 3 cạnh để ghép hai đồ thị 𝐺1,
𝐺2 thành một đồ thị cứng hướng phổ quát.
ii Nếu 𝑑 ≥3, ta cần thêm ít nhất 2 cạnh để ghép hai đồ thị 𝐺1,
𝐺2 thành một đồ thị cứng hướng phổ quát.
Bài tập 5.7.10 [133] Chứng minh đồ thị 𝐶𝑛 với 𝑛 ≤ 𝑑 +1 là cứng
hướng phổ quát trongℝ𝑑
Bài tập 5.7.11 [165] Chứng minh nếu đội hình (𝐺, p) là cứng khoảng
cách vi phân trongℝ2 thì nó cũng cứng hướng vi phân trongℝ𝑑
Bài tập 5.7.12 [133] Chứng minh rằng một đồ thị 𝐺 = (𝑉 , 𝐸) với
|𝑉 | = 𝑛 là cứng hướng trênℝ𝑑 thì có tối thiểu là
Bài tập 5.7.13 [30] Xét một hệ gồm ba tác tử, trong đó tác tử số
1 đứng yên, tác tử thứ hai cần đạt được khoảng cách đặt 𝑑12∗ với
tác tử 1, và tác tử số 3 cần đạt được hai khoảng cách đặt 𝑑∗31và 𝑑32∗
Giả sử hai tác tử 2 và 3 sử dụng luật điều khiển đội hình dựa trên
Trang 30Xác định các tập điểm cân bằng ứng với tác tử 2 và tác tử 3 Chứngminh rằng với luật điều khiển cho như trên, trong hầu hết mọi trườnghợp, ba tác tử sẽ đạt được đội hình đặt khi 𝑡 → +∞ Xác định tậpcác điều kiện đầu mà các tác tử sẽ không đạt được đội hình đặt Kếtquả sẽ thay đổi như thế nào nếu cả ba tác tử đều di chuyển, đồ thịtương tác là chu trình hữu hướng 𝐶3, và đội hình đặt là tam giác với
với g∗31và g∗32là hai vector hướng đặt cho trước
1 Tìm điều kiện của p1 và p2 để tồn tại điểm cân bằng p∗3 thỏamãn cả hai vector hướng cho trước Khi đó, xác định công thức
tìm p∗3 theo p1, p2, g∗31và g∗32
2 Chứng minh rằng với điều kiện tìm được ở ý 1 thì điểm cân bằngcủa hệ (nghiệm của ¤p3= 0) là duy nhất và là p3 = p∗3 Sử dụnghàm Lyapunov 𝑉 = 12kp3− p∗3k2để chứng minh p3 𝑡) → p∗
3khi
𝑡 → +∞
3 Với cùng phương án điều khiển trên, áp dụng cho đồ thị thuđược từ xây dựng Henneberg Chứng minh tính ổn định tiệmcận của đội hình gồm 𝑛 tác tử dựa trên lý thuyết ổn định ISS[60]
Bài tập 5.7.15 (Điều khiển đội hình chỉ sử dụng vector hướng trongthời gian hữu hạn [130]) Xét bài toán điều khiển đội hình dựa trênvector hướng với 𝐺 là đồ thị vô hướng, cứng hướng phổ quát theoluật điều khiển:
¤
p𝑖= −X𝑗∈𝑁𝑖
P g𝑖𝑗 sig P g𝑖𝑗g∗𝑖𝑗
𝛼, 𝑖 = 1, , 𝑛,
trong đó hàm sig(·) được định nghĩa như sau: với x = [𝑥1, , 𝑥𝑑]>∈
ℝ𝑑 thì sig(x)𝛼 = [sign(𝑥1)|𝑥1|𝛼, , sign(𝑥𝑑)|𝑥𝑑|𝛼]>
, với sign(·) là hàmdấu cho bởi sign(𝑥𝑘) = 1 nếu 𝑥𝑘 > 0, sign(𝑥𝑘) = −1 nếu 𝑥𝑘 < 0 vàsign(𝑥𝑘) = 0 nếu 𝑥𝑘=0
Bài tập 5.7.16 (Điều động đội hình dựa trên lý thuyết cứng hướng[167]) Xét bài toán điều khiển đội hình trong đó 𝐺 là đồ thị vôhướng, cứng hướng vi phân trongℝ𝑑
i Giả sử các tác tử di chuyển theo luật điều khiển:
¤
p𝑖= −X𝑗∈𝑁𝑖
P g∗𝑖𝑗(p𝑖− p𝑗), 𝑖 = 1, , 𝑛,
trong đó g∗𝑖𝑗 là các vector hướng đặt Chứng minh rằng với luật
điều khiển trên, p → Ω = {p ∈ ℝ𝑑𝑛| P g∗
𝑖𝑗g𝑖𝑗 = 0, ∀𝑖 ≠ 𝑗, 𝑖, 𝑗 ∈
𝑉 }, khi 𝑡 → +∞
ii Giả sử trong đội hình có một vài tác tử đánh số từ 1 tới 𝑙 ≥2
di chuyển với vận tốc hằng h ∈ℝ𝑑, tức là ¤p𝑖= h, h = 0¤ 𝑑, 𝑖 =
Trang 315.7 Bài tập 101
1, , 𝑙 Các tác tử này (gọi là các tác tử dẫn đàn) ban đầu đã
ở vị trí thỏa mãn các vector hướng đặt Các tác tử còn lại di
chuyển với luật điều khiển cho bởi:
¤
p𝑖 = −X𝑗∈𝑁𝑖
P g∗𝑖𝑗(p𝑖− p𝑗) +𝝃𝑖,
¤
𝝃𝑖 = −X𝑗∈𝑁𝑖
Bài tập 5.7.17 (Điều động đội hình chỉ dựa trên vector hướng [164])
Xét bài toán điều khiển đội hình trong đó 𝐺 là đồ thị vô hướng, cứng
hướng vi phân trongℝ𝑑
i Giả sử các tác tử di chuyển theo luật điều khiển:
¤
p𝑖=X𝑗∈𝑁𝑖
(g𝑖𝑗− g∗𝑖𝑗), 𝑖 = 1, , 𝑛,
trong đó g∗𝑖𝑗 là các vector hướng đặt Viết lại hệ dưới dạng ma
trận và chứng minh rằng với luật điều khiển trên, p → Ω =
{p ∈ℝ𝑑𝑛| P g∗𝑖𝑗g𝑖𝑗 = 0, ∀𝑖 ≠ 𝑗, 𝑖, 𝑗 ∈ 𝑉 }, khi 𝑡 → +∞.
ii Giả sử trong đội hình có một vài tác tử đánh số từ 1 tới 𝑙 ≥2
di chuyển với vận tốc hằng h ∈ℝ𝑑, tức là ¤p𝑖= h, h = 0¤ 𝑑, 𝑖 =
1, , 𝑙 Các tác tử này (gọi là các tác tử dẫn đàn) ban đầu đã
ở vị trí thỏa mãn các vector hướng đặt Các tác tử còn lại di
chuyển với luật điều khiển cho bởi:
¤
p𝑖= X𝑗∈𝑁𝑖
(g𝑖𝑗− g∗𝑖𝑗) +𝝃𝑖,
¤
𝝃𝑖= X𝑗∈𝑁𝑖
(g𝑖𝑗− g∗𝑖𝑗), 𝑖 = 𝑙 + 1, , 𝑛
Chứng minh rằng khi 𝑡 → +∞, hệ gồm 𝑛 tác tử dần đạt được
g𝑖𝑗→ g∗𝑖𝑗, ∀𝑖, 𝑗 ∈ 𝑉 , 𝑖 ≠ 𝑗 và ¤p𝑖 → h, ∀𝑖 = 𝑙 + 1, , 𝑛.
Trang 32[ 159 ]: Zavlanos andothers (2007),
“Potential fields for maintaining
con-nectivity of mobile networks”
vụ điều khiển đội hình Phương pháp chung giải quyết các vấn đề này
là định nghĩa một hàm thế sao cho khi điều kiện ràng buộc không đượcthỏa mãn thì giá trị của hàm thế sẽ tiến tới vô cùng Từ đây, luật điềukhiển được thiết kế theo hướng ngược chiều gradient sẽ giúp các tác tửkhông vi phạm các ràng buộc được đặt ra Nội dung về điều khiển giữliên kết và tránh va chạm trong chương này dựa trên tài liệu [159]
6.1 Giữ liên kết
Hình 6.1: Minh họa bài toán giữ liên
kết: mỗi tác tử có một miền trao đổi
thông tin mô tả bởi một hình tròn
tâm tại vị trí tác tử Nếu hai tác tử
nằm trong miền thông tin của nhau
thì tồn tại một cạnh mô tả sự tương
tác giữa hai tác tử.
Xét hệ gồm 𝑛 tác tử tích phân bậc nhất mô tả bởi:
¤
p𝑖(𝑡) = u𝑖(𝑡), (6.1)trong đó 𝑖 =1, , 𝑛, p𝑖∈ℝ𝑑 là vị trí của tác tử 𝑖 trong không gian
Kí hiệu p = vec(p1, , p𝑛) ∈ℝ𝑑𝑛.Giả sử hai tác tử 𝑖 có thể liên lạc với tác tử 𝑗 khi khoảng cách củachúng thỏa mãn 𝑑𝑖𝑗= kp𝑖− p𝑗k ≤𝛿, với 𝛿 > 0 gọi là giới hạn về khoảngcách trao đổi thông tin giữa các tác tử như mô tả ở Hình6.1.∗
Định nghĩa đồ thị tiệm cận vô hướng 𝐺(p(𝑡)) = (𝑉 , 𝐸(p(𝑡))) trong đó
𝑉 = {1, , 𝑛} và 𝐸(p(𝑡)) = {(𝑖, 𝑗)| 𝑑𝑖𝑗(𝑡) < 𝛿} và tập C𝑛 gồm mọi đồ
thị liên thông gồm 𝑛 đỉnh Bài toán giữ liên kết yêu cầu thiết kế u𝑖 sao
cho nếu 𝐺(p(0)) ∈ C𝑛 thì 𝐺(p(𝑡)) ∈C𝑛, ∀𝑡 ≥ 0
Chú ý rằng một đồ thị 𝐺 là liên thông khi và chỉ khi giá trị riêng
𝜆2(L(𝐺))> 0 Vì vậy, giá trị riêng này là một chỉ số về mức độ liên
∗Thực tế, giới hạn về trao đổi thông tin của mỗi tác tử 𝑖, kí hiệu bởi𝛿 𝑖 , có thể khác nhau Lúc này, ta có thể chọn 𝛿 = min 𝑖= , ,𝑛 𝛿 𝑖
Trang 336.1 Giữ liên kết 103
thông của đồ thị và việc giữ cho𝜆2 𝑡) dương cũng tương đương với việc
giữ tính liên thông của đồ thị
Định nghĩa ma trận kề phụ thuộc vị trí A(p(𝑡)) = [𝑎𝑖𝑗(p(𝑡))] ∈ℝ𝑛×𝑛
Với định nghĩa trên, do 𝑑𝑖𝑗= 𝑑𝑗𝑖, ma trận kề thỏa mãn tính đối xứng
A(p) = A(p)> Định nghĩa ma trận LaplaceL(p(𝑡)) = diag(A(p(𝑡))1𝑛)−
A(p(𝑡)) Các giá trị riêng của ma trận Laplace thỏa mãn:
0 =𝜆1(p(𝑡)) ≤𝜆2(p(𝑡)) ≤ ≤𝜆𝑛(p(𝑡)). (6.2)
Định nghĩa tậpXC 𝑛= {p(𝑡) ∈ℝ𝑑𝑛|𝜆2(p(𝑡))> 0} tương ứng với các cấu
hình làm cho đồ thị liên thông Ta phát biểu lại bài toán giữ liên kết
dưới dạng: “Thiết kế luật điều khiển u𝑖(𝑡) sao cho nếu p(0) ∈ XC𝑛 thì
p(𝑡) ∈XC 𝑛, ∀𝑡 ≥ 0
Để thiết kế luật điều khiển giữ liên kết, ta cần có thông tin về𝜆2(L(𝑡)).
Việc ước lượng𝜆2 có thể thực hiện được nhưng sẽ đòi hỏi thuật toán
khá phức tạp Thay vì trực tiếp ước lượng giá trị 𝜆2 và điều khiển
để giá trị này dương, ta sẽ giữ cho giá trịQ𝑛
𝑖=2𝜆𝑖(p) là dương Định nghĩa ma trận M(p = Q>LQ trong đó Q = [q1, , q𝑛−1] ∈ℝ𝑛×(𝑛−1)
với các vector q𝑖 ∈ℝ𝑛 thỏa mãn: (i) q>𝑖 q𝑗 =0, ∀𝑖 ≠ 𝑗, 𝑖 = 1, , 𝑛 − 1
các giá trị riêng của M(p) lần lượt là𝜆2(L(𝑡)) ≤ ≤𝜆𝑛(p(𝑡)) Do đó,
𝜆2(L(p))> 0 thỏa mãn khi và chỉ khi
cho bởi:
u𝑖 = −∇ Φ𝑐(p(𝑡)) (6.6)
Trang 34[ 162 ]: Zelazo andothers (2015),
“De-centralized rigidity maintenance
con-trol with range measurements for
Với 𝑗 = 1, , 𝑛 − 1, khai triển định thức theo công thức Laplace
của M theo cột thứ 𝑗 cho ta det(M(p)) =P𝑛−1
𝑖=1 𝑐𝑖𝑗(p)𝑚𝑖𝑗(p), và do đó,
𝜕
𝜕𝑚 𝑖𝑗detM(p) = 𝑐𝑖𝑗(p) Từ đây suy ra với 𝑘 = 1, , 𝑛 và 𝑙 = 1, , 𝑑
thì𝑑
luật điều khiển đội hình chứg không dùng độc lập Nếu các tác tử chỉ
sử dụng luật giữ liên kết (6.6), khi 𝑡 → +∞, các tác tử có xu hướng tụlại về một điểm
Một cách tương tự, ta có thể định nghĩa bài toán giữ tính cứng khoảngcách [162], giữ tính cứng hướng, hay tổng quát hơn là giữ hạng củamột ma trận đối xứng bán xác định dương
6.2 Tránh va chạm
Trong bài toán tránh va chạm, mỗi tác tử cần giữ khoảng cách đủ xa
với các tác tử khác cũng như với vật cản Gọi p𝑖, p𝑗 lần lượt là vị trícủa tác tử 𝑖 và vị trí của tác tử 𝑗 hoặc vật cản Tác tử 𝑖 cần giữ cho
Trang 356.2 Tránh va chạm 105
𝑑𝑖𝑗= kp𝑖− p𝑗k > 0, ∀𝑡 ≥ 0 Do việc tránh va chạm khi khoảng cách giữ
các tác tử ở khá xa nhau là không cần thiết, ta xét bài toán khi mỗi
tác tử 𝑖 có miền tác động là một hình tròn tâm tại vị trí p𝑖 và bán
kính 𝑑> 0 Khi có tác tử hoặc vật cản ở trong miền tác động, tác tử 𝑖
sẽ thực hiện thuật toán tránh va chạm tương ứng (xem Hình6.3)
Hình 6.3: Minh họa việc tránh va chạm của các tác tử.
Tương tự như với bài toán điều khiển giữ liên kết, ta sẽ thiết kế tương
ứng hàm thế tránh va chạm nhận giá trị tại +∞ khi các tác tử va chạm
với nhau Gọi𝛽𝑖𝑗(p(𝑡)) là hàm trọng số thỏa mãn:
trong đó 𝜇 = 1+𝑑 4
𝑑 4 và 𝜌 = 1
2 1 − sign(kp𝑖− p𝑗k2−𝑑2
Hình6.4 biểudiễn đồ thị của 𝛽𝑖𝑗(kp𝑖− p𝑗k) với một số giá trị khác nhau của tham số
𝑑
(c) 𝑑 = 1.5
Hình 6.4: Biểu diễn hàm 𝛽 𝑖𝑗(kp𝑖− p𝑗 k) với 𝑑 = 0.75, 1, 1.5.
Trang 36Hàm thế tránh va chạm tương ứng được cho bởi
Φ𝑎(p(𝑡)) = 1
𝛽(p(𝑡))𝛼, (6.12)trong đó𝛽(p(𝑡)) =Q𝑛
dụng hàm thế Φ(p(𝑡)) = 𝑐1Φ𝑐(p(𝑡)) + 𝑐2Φ𝑎(p(𝑡)), với 𝑐1, 𝑐2> 0 là trọng
số cho mỗi nhiệm vụ Luật điều khiển tương ứng là u = −∇ p Φ p(𝑡)
Dễ thấy khi một tác tử có nhiều hơn một nhiệm vụ, các nhiệm vụ này
có thể xung đột nhau và phụ thuộc vào việc chọn trọng số cho từngviệc
Ví dụ 6.2.1 Mô phỏng thuật toán giữ liên thông với các tham sốđược chọn 𝑛 =10, 𝑑 = 2,𝛿 = 1, 𝜎 = 0.25, 𝜖 = 0.4547, 𝑔𝑎𝑖𝑛 = 10 và
𝛼 = 0.25 Các tọa độ x,y ban đầu của các tác tử được lấy ngẫu nhiêntrong khoảng [−10, 10]
chứa mọi giá trị riêng khác 0 củaL.
Kết quả mô phỏng được cho trên Hình 6.5, với các mốc thời gian
𝑡 = 10, 20, 50, 100, 200, và 500 giây Với các tham số đã chọn, cáctác tử hội tụ dần tới một điểm Code MATLAB mô phỏng hệ trongtrường hợp này được cho ở dưới đây
1 % Mo phong Vi du 7 1
2 c l e a r a l l3
4 g l o b a l n d sigma e p s i l o n J a l p h a g a i n Q5
6 n = 1 0 ; d = 2 ; sigma = 0 2 5 ; e p s i l o n = 0 4 5 4 7 ; g a i n =
1 0 ;
7 J = e y e ( n ) - 1/ n* o n e s ( n , n ) ; a l p h a = 0 2 5 ;
v = ( n - s q r t ( n ) ) / ( n * ( n - 1 ) ) ;
Trang 3840 [ t6 , p t 6 ] = ode45 ( @updateLaw , [ 0 , 5 0 0 ] , p0 ) ;
41 f i g u r e ( 6 )
42 P l o t F o r m a t i o n 1 ( n , d , t6 , pt6 ’ , 1 ) ;43
63 % Ham t i n h ma t r a n L a p l a c e64
65 f u n c t i o n L = c a l c L ( p )
66 g l o b a l n d sigma e p s i l o n
67 P = r e s h a p e ( p , d , n ) ;
68 A = z e r o s ( n , n ) ;69
80 % Ham t i n h dao ham ma t r a n L a p l a c e81
Trang 39Ví dụ 6.2.2 Trong ví dụ này, ta xét luật đồng thuận thông thường
kết hợp với luật tránh va chạm Xét tác tử 1 là một tác tử leader
không tham gia vào luật đồng thuận, di chuyển với vận tốc cho bởi
u1= [0.1 + 2 sin(𝑡/10), 2 cos(𝑡/10)]> Mỗi tác tử 𝑖 =2, , 20 có
u𝑖 = −∇p𝑖Φ𝐶− ∇p𝑖Φ𝐶𝐴, (6.15)
trong đó hàm thế đồng thuận được cho bởi Φ𝐶 = 12p>(L ⊗ I2)p và
hàm thế tránh va chạm được chọn là Φ𝐶𝐴= −ln(𝛽) Đồ thị tương
tác giữa các tác tử được cho bởi 𝐺 = 𝐶𝑛 (chu trình gồm 20 đỉnh)
Kết quả mô phỏng hệ được biểu diễn ở Hình6.6 Các tác tử tiến lại
gần nhau và di chuyển theo tác tử 1 nhưng giữ khoảng cách không
quá gần
Code mô phỏng hệ đa tác tử trong Ví dụ6.2.2được cho ở dưới đây (a) 𝑡 =10s
(b) 𝑡 = 20s
(c) 𝑡 = 50s Hình 6.6: Mô phỏng luật giữ liên kết trong Ví dụ 6.2.2
1 % Mo phong v i du 7 2 , l u a t dong thuan k e t hop g i u
Trang 4025 [ t2 , p t 2 ] = ode45 ( @updateLaw , [ 0 : 0 0 1 : 5 0 ] , p0 ) ;
26 f i g u r e ( 2 )
27 P l o t F o r m a t i o n 1 ( n , d , t2 , pt2 ’ , 1 ) ;28
29 % Ve do t h i tu 0 - 100 s
30 [ t3 , p t 3 ] = ode45 ( @updateLaw , [ 0 : 0 0 1 : 1 0 0 ] , p0 ) ;
31 f i g u r e ( 3 )
32 P l o t F o r m a t i o n 1 ( n , d , t3 , pt3 ’ , 1 ) ;33
34
35 f u n c t i o n dxdt = updateLaw ( t , p )
36 g l o b a l n d g a i n L37
38 % Tinh thanh phan d i e u k h i e n dong thuan
39 uC = - g a i n * kron ( L , e y e ( 2 ) ) *p ;40
57 % L e a d e r ( t a c tu 1 ) d i chuyen
58 uL = [ 0 1 + 2* s i n ( t / 1 0 ) ;
59 2* c o s ( t / 1 0 ) ; z e r o s ( 2 * ( n - 1 ) , 1 ) ] ;60
61 % Tong hop c a c thanh phan
62 S = b l k d i a g ( z e r o s ( 2 , 2 ) , e y e ( d * ( n - 1 ) , d * ( n - 1 ) ) ) ;
63 dxdt = S * (uC + uCAV) + uL ;
64 end65 66