Nhận ra vấn đề trên, từ những năm 70 của thế kỉ XX, điều khiển đảm bảo giá trị đã được đưa ra để giải quyết vấn đề sai số giữa mô hình toán và hệ thống thực.. Mục đích là để thiết kế một
Trang 1TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA TOÁN
——————–o0o———————
NGUYỄN THỊ THANH HƯƠNG
TÌM HIỂU VỀ BÀI TOÁN
ĐIỀU KHIỂN ĐẢM BẢO GIÁ TRỊ
KHÓA LUẬN TỐT NGHIỆP
HÀ NỘI, 2018
Trang 2TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA TOÁN
——————–o0o———————
NGUYỄN THỊ THANH HƯƠNG
TÌM HIỂU VỀ BÀI TOÁN
ĐIỀU KHIỂN ĐẢM BẢO GIÁ TRỊ
Chuyên ngành: Toán Ứng dụng
KHÓA LUẬN TỐT NGHIỆP
Người hướng dẫn khoa học:
ThS NGUYỄN TRUNG DŨNG
HÀ NỘI, 2018
Trang 3LỜI CẢM ƠN
Khóa luận tốt nghiệp đại học này được thực hiện tại khoa Toán, trườngĐại học Sư phạm Hà Nội 2, dưới sự hướng dẫn khoa học của ThS Nguyễn TrungDũng
Tôi xin tỏ lòng biết ơn sâu sắc tới thầy Nguyễn Trung Dũng đã định hướng
và chỉ dẫn sát sao trong suốt quá trình học tập, nghiên cứu và hoàn thành khóaluận tốt nghiệp đại học này Sự chuyên nghiệp, nghiêm túc trong nghiên cứu vànhững định hướng đúng đắn của thầy là tiền đề quan trọng giúp tôi có đượcnhững kết quả trình bày trong khóa luận tốt nghiệp đại học này
Tôi xin chân thành cảm ơn Ban Chủ nhiệm khoa Toán và các thầy giáo,
cô giáo trong bộ môn Toán Ứng dụng, đã trực tiếp giảng dạy và truyền đạt chotôi những kiến thức về chuyên môn cũng như kinh nghiệm nghiên cứu khoa họctrong thời gian qua
Đặc biệt, tôi thực sự thấy hạnh phúc và biết ơn khi họ luôn bên tôi, chia
sẻ và động viên, là động lực để tôi cố gắng và hoàn thành khóa luận tốt nghiệpđại học của mình đó là những người thân trong gia đình, bạn bè
Sinh viên
Trang 4LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi, được hoànthành dưới sự hướng dẫn của ThS Nguyễn Trung Dũng Các kết quả trình bàytrong khóa luận tốt nghiệp đại học này là trung thực, đã được sự nhất trí củacác đồng tác giả, và chưa từng được công bố trong luận văn hay luận án nàokhác
Sinh viên
Trang 5MỤC LỤC
Trang
Lời cảm ơn 1
Lời cam đoan 2
Kí hiệu 3
1 BÀI TOÁN ĐIỀU KHIỂN ĐẢM BẢO GIÁ TRỊ VỚI NHIỄU TRẠNG THÁI 7
1.1 Đặt bài toán 7
1.2 Thiết kế bộ điều khiển 8
1.3 Điều khiển phản hồi đầu ra 12
2 BÀI TOÁN ĐIỀU KHIỂN ĐẢM BẢO GIÁ TRỊ VỚI NHIỄU TRONG ĐIỀU KHIỂN 18
2.1 Đặt bài toán 18
2.2 Điều khiển đảm bảo giá trị với nhiễu cộng tính 20
Kết luận 26
TÀI LIỆU THAM KHẢO 26
Trang 6KÍ HIỆU
R+ Tập hợp các số thực không âm
Rn Không gian vectơ Euclide n-chiều
Z[a, b] Tập hợp các số nguyên trong đoạn [a, b]
Z0 Tập hợp các số nguyên không âm
λ(A) Tập các giá trị riêng của ma trận A
λmax(A) max {Reλ : λ ∈ λ(A)}
λmin(A) min {Reλ : λ ∈ λ(A)}
σ(A) Bán kính phổ của ma trận A (i.e max{|λ| : λ ∈ λ(A)}).LMIs Bất đẳng thức ma trận tuyến tính
Trang 7MỞ ĐẦU
1 Lí do chọn đề tài
Từ những năm 1960, các nhà điều khiển học đã thay đổi phương pháp đểthiết kế bộ điều khiển, thay vì sử dụng các phương pháp dựa trên miền tần số đểđánh giá tính đảm bảo giá trị thì họ sử dụng nhiều đến phương pháp dựa trênmiền thời gian Tuy nhiên, trong thực tế có thể có hai vấn đề làm cho việc ứngdụng lý thuyết điều khiển này (điều khiển tối ưu) không thành công Đó chínhlà: sự không chính xác của mô hình toán so với đối tượng điều khiển thật và vấn
đề thứ hai là nhiễu tác động vào hệ thống Nhận ra vấn đề trên, từ những năm
70 của thế kỉ XX, điều khiển đảm bảo giá trị đã được đưa ra để giải quyết vấn
đề sai số giữa mô hình toán và hệ thống thực Đặc biệt, từ những năm 1980,phương pháp sử dụng tối ưu lồi (chính là sử dụng bất đẳng thức ma trận tuyếntính LMIs) đã trở thành một công cụ hữu hiệu, được sử dụng một cách phổ biếntrong lý thuyết điều khiển
Hệ thống điều khiển đảm bảo giá trị cho miền thời gian rời rạc là đề tàinghiên cứu có được sự quan tâm trong những năm gần đây Mục đích là để thiết
kế một bộ điều khiển sao cho hệ đóng ổn định trong khi giá trị của hàm chi phíứng với hệ đóng bị chặn trên Một phương pháp nghiên cứu hiệu quả đó là sửdụng phương pháp thứ hai Lyapunov để tìm kiếm các điều khiển đảm bảo giátrị dạng LMIs Điều kiện LMIs thu được khả năng giải bài toán một cách dễdàng bằng các gói công cụ có sẵn và có thể thực hiện bằng máy tính hiện đại.Dưới sự gợi ý và giúp đỡ tận tình của Thầy Nguyễn Trung Dũng cùng sựsay mê của bản thân, tôi xin chọn đề tài "Tìm hiểu về bài toán điều khiển đảmbảo giá trị" làm đề tài khóa luận tốt nghiệp đại học của mình
2 Mục đích nghiên cứu
Mục đích của khóa luận là thiết kế một bộ điều khiển phản hồi sao cho hệđóng là ổn định đồng thời hàm chi phí ứng với hệ đóng bị chặn trên
Trang 83 Đối tượng và phạm vi nghiên cứu
• Đối tượng nghiên cứu là các hệ thống điều khiển với thời gian rời rạc
• Phạm vi nghiên cứu là các tiêu chuẩn đảm bảo giá trị của các hệ thống điềukhiển với thời gian rời rạc
4 Phương pháp nghiên cứu
• Nghiên cứu lí thuyết dựa trên các tài liệu tham khảo
5 Cấu trúc của khóa luận
Ngoài phần mở đầu, kết luận, danh mục tài liệu tham khảo, khóa luận tốtnghiệp gồm 2 chương
• Chương 1: Bài toán điều khiển đảm bảo giá trị với nhiễu trạngthái
Nội dung chính của chương này trình bày các kết quả liên quan đến bàitoán điều khiển đảm bảo giá trị cho lớp hệ điều khiển tuyến tính rời rạc vớinhiễu trạng thái
• Chương 2: Bài toán điều khiển đảm bảo giá trị với nhiễu trongđiều khiển
Nội dung của chương này trình bày các kết quả của bài toán điều khiểnđảm bảo giá trị cho lớp hệ điều khiển rời rạc với nhiễu trong điều khiển
Trang 9trong đó x(k) ∈ Rn là vectơ trạng thái , u(k) ∈Rm là điểu khiển đầu vào, A và
B là các ma trận cho trước với số chiều phù hợp, các ma trận ∆A(k) và ∆B(k)
mô tả nhiễu tác động lên trạng thái của hệ và giả sử có dạng như sau:
trong đó Q và R là ma trận đối xứng và xác định dương
Trong chương này, chúng ta xét bộ điều khiển phản hồi có dạng như sau:
ở đó K là ma trận đạt được sẽ được thiết kế
Với bộ điều khiển (1.4), ta có hệ đóng của (1.1) như sau:
Trang 10x(k + 1) = [A + BK + ∆A(k) + ∆B(k)]x(k) x(0) = x0
với hàm chi phí tương ứng như sau:
kx(k, x0)k < , ∀k ≥ 0,
với mọi nhiễu ∆A(k) và ∆B(k) thỏa mãn (1.2)
Mục đích chính của chương này là thiết kế một bộ điều khiển phản hồi tiếp
có dạng (1.4) sao cho hệ đóng là ổn định vững và hàm giá trị đảm bảo khôngvượt quá một mức nhất định
Định nghĩa 1.1.2 Với hệ (1.1) và chi phí (1.3), nếu tồn tại bộ điều khiển u∗(.)
và hằng số dương J∗ sao cho hệ đóng ổn định vững và J ≤ J∗ thì J∗ được gọi làgiá trị bảo đảm và u∗(.) được gọi là bộ điều khiển đảm bảo giá trị
1.2 Thiết kế bộ điều khiển
Bổ đề sau được sử dụng loại bỏ nhiễu trong mô hình
Bổ đề 1.2.1 (xem Lemma 9.1.2 [2]) Cho JA, DA, EA là các ma trận thực với sốchiều thích hợp và JA là ma trận đối xứng Khi đó
JA+ DAFA(k)EA+ (DAFA(k)EA)> < 0
với mọi FA(k) thỏa mãn FA>(k)FA(k) ≤ I nếu và chỉ nếu tồn tại εA > 0 sao cho
JA+ εADADA>+ ε−1A EA>EA < 0.
Định lí sau cho kết quả thiết kế bộ điều khiển ổn định hóa hệ (1.1)
Định lí 1.2.2 (xem Theorem 9.2.2 [2]) Nếu tồn tại ma trận đối xứng xác địnhdương X, ma trận Y và các hằng số dương εA, εB sao cho bất đẳng thức ma trận
Trang 11Mục đích của phần này là thiết kế bộ điều khiển phản hồi sao cho hệ đóng
ổn định vàJ ≤ J∗ Định lí sau đưa ra điều kiện để hệ đóng là ổn định và J ≤ J∗.Định lí 1.2.3 Cho trước ma trận đạt được của điều khiển K Nếu tồn tại các
ma trận đối xứng và xác định dương P, U, V, và các số dương εA và εB sao chobất đẳng thức LMI sau thỏa mãn:
thì hệ đóng là ổn định và cận trên của chi phí là J ≤ xT (0) P x (0)
Chứng minh Từ điều kiện LMI (1.5) và Định lý 1.2.2, hệ đóng là ổn định Xéthàm Lyapunov cho bởi:
trong đó P là nghiệm của bất đẳng thức ma trận tuyến tính LMI (1.5)
Tính sai phân của hàm Lyapunov (1.6) theo quỹ đạo nghiệm của hệ đóng,
Trang 12Vậy định lí được chứng minh.
Dựa vào Định lí 1.2.3 chúng ta thiết kế bộ điều khiển phản hồi như sau
Trang 13Định lí 1.2.4 Nếu tồn tại các ma trận đối xứng và xác định dương X, U, V và
ma trận Y cùng với các số dương εA, εB sao cho bất đẳng thức LMI sau đúng:
Chứng minh Đặt X = P−1 sau đó nhân trước và nhân sau điều kiện (1.5) với
ma trận đường chéo diag{X, X,I,I,I,I} ta được
Đặt Y = KX ta thu được các điều kiện của định lí
Để minh họa cho các điều kiện thu được, ta xét ví dụ sau
Ví dụ 1.2.1 Xét hệ (1.1) với dữ liệu như sau:
,
, DB =
,
EA =h0.3 0 0.2i, EB =h0.2i.
Trước tiên, ta có thể kiểm tra rằng hệ thống không ổn định Thật vậy, các
Trang 14giá trị riêng của ma trận A là
s 1 = 1.6992
s2 = 0.8122
s3 = 0.5886
Ta có s 1 > 1 suy ra hệ không ổn định Sử dụng gói công cụ trong Matlab, chúng
ta thu được các điều kiện của Định lí 1.2.3 như sau:
,
Y =
h
−6.5607 −10.5129
i ,
,
V =h203.4407i.
Ma trận đạt được cho bởi
K =h−20.0355 0.5198 3.3356
i
1.3 Điều khiển phản hồi đầu ra
(1.8)
trong đó u(k) ∈Rm là điều khiển đầu vào, y(k) ∈Rp là tín hiệu đầu ra, A, B, C,
và D là các ma trận thực đã biết với số chiều phù hợp, ∆A(k), ∆B(k), ∆C(k) lànhiễu hệ thống được giả thiết thỏa mãn điều kiện sau:
∆A(k) = DAFA(k)EA,
∆B(k) = DBFB(k)EB,
∆C(k) = DCFC(k)EC,
Trang 15trong đó DA, EA, DB, EB, DC, EC là các ma trận đã biết.
Phiếm hàm chi phí tương ứng với hệ (1.8) được cho bởi (1.3)
Ta xét bộ điều khiển phản hồi
trong đó K ma trận đạt được cần xác định
Với bộ điều khiển (1.9), ta có hệ đóng của (1.8) như sau
x(k + 1) = [A + ∆A(k) + BKC + ∆B(k)KC]x(k). (1.10)Theo Định lí 1.2.3 nếu tồn tại các ma trận đối xứng xác định dương P, U,
V, các hằng số dương εA, εB sao cho
Tiến hành tương tự như trong chứng minh Định lí 1.2.4, ta đặt X = P−1
sau đó nhân trước và sau bất đẳng thức trên với diag{X, X,I,I,I,I} ta được
Sử dụng đẳng thức này và đặt Y = KN chúng ta thu được định lí sau
Định lí 1.3.1 Nếu tồn tại các ma trận đối xứng xác định dương X, U, V, N và
Trang 16ma trận Y cùng với các số dương εA và εB sao cho thỏa mãn LMI sau:
thì hệ ổn định đối với bộ điều khiển u(k) = Y N−1x(k) và J ≤ xT(0)X−1x(0).Tiếp theo, chúng ta thiết kế bộ điều khiển phản hồi tín hiệu đầu ra Bộđiều khiển được cho bởi
Mục đích của mục này là thiết kế một bộ điều khiển dạng (1.13) sao cho
hệ đóng là ổn định và đảm bảo chi phí bị chặn với mọi nhiễu chấp nhận được.Giả sử nhiễu có dạng
˜ x(k)
Trang 17Phiếm hàm chi phí tương ứng là
Định lí 1.3.2 Cho trước các ma trận đạt được KA, KB và KC Nếu tồn tại các
ma trận đối xứng và xác định dương X, U, V và các số dương εAvà εC thỏa mãn
điều kiện LMI sau:
Chứng minh Từ bất đẳng thưc LMI (1.16) và Định lí 1.2.3, hệ đóng là ổn định
Xét hàm Lyapunov cho bởi
V (η (k)) = ηT(k) ˜ P η (k)
trong đó P = ˜˜ X−1 là nghiệm của LMI (1.16)
Tính sai phân của V theo quỹ đạo nghiệm của hệ đóng, ta được
Trang 18suy ra J ≤ xT(0)P x(0) Vậy định lí được chứng minh.
Từ kết quả của định lí trên, chúng ta có định lí sau
Định lí 1.3.3 Xét hệ (1.8) với bộ điều khiển phản hồi tín hiệu đầu ra, khi đó,
hệ (1.8) là ổn định hóa vững nếu tồn tại các ma trận đối xứng và xác định dương
X, U, V và ma trận Y cùng với các số dương εA và εC sao cho điều kiện LMIs
Trang 191 Bộ điều khiển phản hồi tín hiệu đầu ra cho bởi
theo bổ đề Schur, xT (0) X−1x (0) < ρ có thể viết lại như sau
Trang 21với mọi ∆K thỏa mãn (2.4).
Bổ đề sau chỉ ra rằng bài toán điều khiển đảm bảo giá trị cho hệ (2.1) sẽđảm bảo hệ đóng (2.5) ổn định và xác định cận trên của hàm chi phí (2.2)
Bổ đề 2.1.1 Xét hệ (2.1) với hàm chi phí (2.2) Giả sử rằng bộ điều khiển(2.3) với nhiễu (2.4) là điều khiển đảm bảo giá trị với ma trận P > 0 Khi đó hệđóng (2.5) là ổn định và
Chứng minh Hệ (2.5) ổn định được suy ra trực tiếp từ Định nghĩa 2.1.1 và 2.1.2.Lấy hàm Lyapunov V (x(k)) = xT(k)P x(k) Khi đó, sai phân của V theo quỹ đạocủa (2.5), ta có
Vậy bổ đề được chứng minh
Kết quả tương tự Bổ đề 1.2.1 của Chương 1 như sau
Trang 222.2 Điều khiển đảm bảo giá trị với nhiễu cộng tính
Trong mục này, ta xét bài toán đảm bảo giá trị với bộ điều khiển có nhiễucộng tính (2.4) Trước hết, chúng ta có định lí sau đây
Định lí 2.2.1 Xét hệ (2.1) với hàm chi phí (2.2) Tồn tại bộ điều khiển phảnhồi trạng thái (2.3) có ma trận đạt được K với nhiễu (2.4) là điều khiển đảmbảo giá trị với ma trận chi phí P khi và chỉ khi tồn tại một hằng số ε > 0 thỏamãn
R 2 = R 2 (P, ε) = I − εH∆ 1T BTP B + RH 1 > 0, (2.7)và
Sa(P, ε) = A∆ TP A − P + ρ
εE
T
1 E1+ Q − ATP BBTP B + R−1BTP A < 0. (2.8)Hơn nữa, nếu (2.7) và (2.8) thỏa mãn, khi đó, ma trận đạt được của điều khiểnđảm bảo giá trị cho bởi
Trang 23với mọi nhiễu ∆K có dạng (2.4) The bổ đề Schur và (2.4), bất đẳng thức trêntương đương với bất đẳng thức sau:
∆1=h(A + BK)T KT
i M
A + BK K
Trang 24trong đó
R1= BTM11B + M22+ M12TB + BTM12. (2.12)Chúng ta thấy rằng M > 0 là tương đương với bất đẳng thức (2.7) Bằngcách tính trực tiếp, ta có
Theo (2.14), (2.15), (2.16) và (2.17) suy ra
∆1 = ATP A − P + ρεE1TE1+ Q
−A T P B[(I + εH1R−12 H1TX)X−1− εH1R−12 H1T]BT P A+[KT + ATP BX−1]R1[KT + ATP BX−1]T
kế ε để đảm bảo giá trị của hệ kín là nhỏ nhất Kí hiệu
εa = sup{ε > 0 : Sa(P, ε) = 0 có nghiệm ổn định hóa P ≥ 0 và (2.7) đúng}.
(2.19)
Trang 25Khi đó, tham số thiết kế ε đảm bảo giá trị cho hệ kín nằm trong khoảng 0 <
ε < εa Định lí tiếp theo sẽ chỉ ra điều khiển đảm bảo giá trị tối ưu (tức là, quytắc điều khiển cực tiểu hàm chi phí được định nghĩa trong (2.2)) đạt được tạigiá trị biên ε = ε a
Định lí 2.2.2 Xét hệ (2.1) với hàm giá chi phí (2.2) Giả sử cặp (A, B) là ổnđịnh hóa Nếu tồn tại một bộ điều khiển phản hồi (2.3) với nhiễu cộng tính (2.4)
là bộ điều khiển đảm bảo giá trị với ma trận chi phí P 0, khi đó phương trìnhRiccati với εa được xác định bởi 2.19 có duy nhất nghiệm Popt > 0 thỏa mãn
S a (P, ε0) = 0 Từ đó ta có P 01 ≤ P 0 và R 2 (P 01 , ε0) > 0 Do đó, ε a trong (2.19)
là định nghĩa tốt Chọn dãy {εn}∞n=1 và {Pn}∞n=1 sao cho 0 < εn ≤ εn+1 εn →
εa(n → ∞), Pn là nghiệm của Sa(P, εn) = 0 và R2(Pn, εn) > 0 Theo định nghĩacủaSa(P, ε) trong (2.8) và định lí so sánh, ta cóPn ≥ Pn+1 > 0 (n = 1, 2, ) Do
đó, lim
n→∞ Pn = P∞ ≥ 0 tồn tại và P∞ thỏa mãn Sa(P∞, εa) = 0 và R2(P∞, εa) ≥ 0
Từ đó ta suy ra P∞ và nghiệm của Sa(P∞, εa) = 0 và P∞ > 0 Xét dãy {ε0n}∞n=1
với σ n > 0, σ n → 0 (n → ∞), khi đó tồn tại dãy con{ε n }∞n=1 với0 < ε 0n < ε a , ε 0n →
εa(n → ∞) thỏa mãn
Sa(P∞, ε0n) − σnI < 0, n = 1, 2,
Theo chứng minh của Định lí 2.2.1, suy ra
[A + B (K + ∆K)]TP∞[A + B (K + ∆K)] − P∞+(K + ∆K)TR (K + ∆K) + Q − σ n I < 0, n = 1, 2,
Trang 26trong đó K được cho bởi (2.22) với Popt = P∞ và ∆K được cho bởi (2.4) Cho
n → ∞ ta có
[A + B (K + ∆K)]TP∞[A + B (K + ∆K)] − P∞+(K + ∆K)TR (K + ∆K) + Q ≤ 0.
Đặt Pδ = δP∞ với δ > 1 Khi đó, từ Q > 0 và bất đẳng thức trên, ta có
P∞≤ P01 ≤ P0 Đặt Popt= P∞ suy ra định lí được chứng minh
Nhận xét 2.2.1 Định lí 2.2.2 đưa ra một thủ tục thiết kế để bộ điều khiển đảmbảo giá trị tối ưu và hàm chi phí của hệ đóng J bị chặn bởi giá trị nhỏ nhất
xT0Poptx0 Từ (2.7), tham số εa trong Định lí 2.2.2 thuộc khoảng 0 < εa ≤ λa,trong đó
εa = max{0 < ε < λa : Sa(P, ε) = 0có nghiệm ổn định dươngP và R2(P, ε) ≥ 0}.
(2.25)Với mỗiε ∈ (0, λa]cho trước, ta có thể giải phương trình RiccatiSa(P, εa) ≥ 0
với nghiệmP > 0và kiểm tra xemP có thỏa mãnR2(P, εa) ≥ 0 Vì thế, bằng cáchkhởi tạo tại ε = λa và cho giảm dần ε đến khi tồn tại nghiệm (với Sa(P, ε) = 0,
P > 0 và R2(P, ε) ≥ 0 ) có thể thu được giá trị tối ưu εa Tuy nhiên, việc tìmkiếmε a trên khoảng(0, ε a )có thể gặp khó khăn nếu khoảng (0, λ]là rất lớn Hơn
Trang 27nữa, vì giá trị tối ưu của tham số εa nằm trên biên của khoảng (0, εa) cho một
họ các bộ khiển đảm bảo giá trị Ngoài ra, phương trình Riccati (2.21) tươngứng với điều khiển tối ưu bậc hai cho hệ (2.1) với hàm chi phí
Để minh họa cho các kết quả ở trên, chúng ta xét ví dụ sau đây
Ví dụ 2.2.1 Xét hệ (2.1) với hàm chi phí (2.2) và bộ điều khiển phản hồi (2.3)với
εa = 0.0266 Ma trận Popt và ma trận đạt được K cho bởi
Popt=
44.1062 −14.3698
−14.3698 17.7787
, K =h−1.7120 −1.0375
i ,
các giá trị riêng của hệ đóng là −0.6315 và 0.1540 suy ra hệ đóng ổn định