Bài toán đảm bảo giá trị điều khiển tối ưu các hệ phương trình vi phân có trễ
Trang 1TRƯỜNG ĐẠI HỌC SƯ PHẠM
- -HOÀNG THANH NGA
BÀI TOÁN ĐẢM BẢO GIÁ TRỊ ĐIỀU KHIỂN TỐI ƯU CÁC
Trang 2Mục lục
Một số ký hiệu 2
Lời nói đầu 3
1 Cơ sở toán học 5 1.1 Bài toán ổn định và ổn định hóa 5
1.1.1 Bài toán ổn định 5
1.1.2 Phương pháp hàm Lyapunov 7
1.1.3 Bài toán ổn định hóa 8
1.2 Bài toán ổn định và ổn định hóa hệ có trễ 9
1.2.1 Bài toán ổn định hệ có trễ 9
1.2.2 Bài toán ổn định hóa hệ phương trình vi phân và điều khiển có trễ 10
1.3 Bài toán điều khiển tối ưu 11
1.3.1 Một số bài toán tối ưu đặc biệt 12
1.3.2 Bài toán tối ưu toàn phương tuyến tính 13
1.4 Một số bổ đề bổ trợ 14
2 Bài toán đảm bảo giá trị điều khiển tối ưu 15 2.1 Bài toán đảm bảo giá trị điều khiển tối ưu cho hệ tuyến tính 15
2.2 Bài toán đảm bảo giá trị điều khiển tối ưu hệ tuyến tính có trễ 18 3 Bài toán đảm bảo giá trị điều khiển tối ưu cho hệ tuyến tính có độ trễ không khả vi 24 3.1 Bài toán đảm bảo giá trị điều khiển tối ưu cho hệ tuyến tính có độ trễ không khả vi 24
3.2 Ví dụ 36
Tài liệu tham khảo 40
Trang 4Lời nói đầu
Lý thuyết điều khiển tối ưu ra đời vào cuối những năm 50 của thế kỉ haimươi Trải qua quá trình phát triển mạnh mẽ nó đã thu được nhiều thành tựurực rỡ Ngày nay, các bài toán điều khiển tối ưu có tầm quan trọng đặc biệt,thu hút sự quan tâm của đông đảo các nhà khoa học Lý thuyết điều khiểntối ưu đã trở thành một lĩnh vực nghiên cứu quan trọng trong toán học, cónhiều ứng dụng to lớn trong đời sống kinh tế, khoa học và kĩ thuật
Phát triển từ bài toán tối ưu hóa cổ điển, bài toán điều khiển tối ưu là bàitoán tìm quá trình tối ưu cho các hệ điều khiển mô tả bởi phương trình toánhọc Trên thực tế các hệ thống điều khiển thường bị tác động bởi nhiều điềukiện phát sinh từ đặc tính vật lí của đối tượng và yêu cầu thiết kế đặt ra Vìvậy, việc nghiên cứu hệ thống điều khiển tối ưu là một nhiệm vụ quan trọngcủa lý thuyết điều khiển toán học
Mục đích của luận văn là nghiên cứu bài toán điều khiển giá trị tối ưucho các hệ động lực được mô tả bởi hệ phương trình vi phân có trễ Luận vănbao gồm 3 chương:
Chương 1: Cơ sở toán học
Trong chương này, trước hết chúng tôi trình bày một số kiến thức cơ sở về
hệ phương trình vi phân và điều khiển có trễ, bài toán ổn định, ổn định hóa
hệ phương trình vi phân và điều khiển có trễ, một số bổ đề dùng để chứngminh kết quả ở chương sau
Chương 2: Bài toán đảm bảo giá trị điều khiển tối ưu
Chương này, chúng tôi trình bày một số kết quả cơ sở giải bài toán đảm bảogiá trị điều khiển tối ưu Phần đầu chương trình bày về bài toán đảm bảo giátrị điều khiển tối ưu cho hệ tuyến tính với hàm mục tiêu toàn phương Phầntiếp theo chúng tôi trình bày bài toán đảm bảo giá trị điều khiển tối ưu cho
hệ tuyến tính có trễ Phần cuối của chương là mở rộng kết quả định lí cho
hệ có trễ biến thiên
Chương 3: Bài toán đảm bảo giá trị điều khiển tối ưu cho hệ tuyến tính
có độ trễ không khả vi Mục đích của chương này là việc tìm lời giải cho bàitoán đảm bảo giá trị điều khiển cho hệ tuyến tính có độ trễ không khả vi
Trang 5Trong chương này, chúng tôi cũng đưa ra một ví dụ minh họa cho kết quảchứng minh.
Tôi xin bày tỏ sự biết ơn sâu sắc tới GS TSKH Vũ Ngọc Phát, người thầy
đã tận tình chỉ bảo tôi trong suốt thời gian tôi làm luận văn
Tôi rất biết ơn Trường ĐHSP Thái Nguyên, Khoa Toán, Khoa Sau đại học
đã giúp đỡ tạo điều kiện cho tôi trong quá trình học tập tại trường
Tôi xin cảm ơn người thân, đồng nghiệp, bạn bè đã cổ vũ động, viên tôitrong quá trình làm luận văn
Mặc dù đã cố gắng rất nhiều nhưng vì thời gian và trình độ còn hạn chếnên luận văn không thể tránh khỏi những thiếu sót và sai lầm Tôi rất mongnhận được sự chỉ bảo và những đóng góp của thầy cô và các bạn
Tôi xin chân thành cảm ơn!
Trang 6Chương 1
Cơ sở toán học
Trong chương này, chúng tôi trình bày một số khái niệm cơ bản về tính ổn
định và ổn định hóa được của hệ phương trình vi phân thường và hệ phươngtrình vi phân có trễ và một số bổ đề bổ trợ cho chứng minh các định lý chính
1.1 Bài toán ổn định và ổn định hóa
hàm véc tơ cho trước Giả thiết f(t, x) là hàm thỏa mãn các điều kiện sao cho
luôn có nghiệm Khi đó dạng tích phân của nghiệm được cho bởi công thức
t 0
f (s, x(s))ds
Định nghĩa 1.1.1 Nghiệm x(t) của hệ (1.1) gọi là ổn định nếu với mọi số
ε > 0, t0 ≥ 0sẽ tồn tại số δ > 0 ( phụ thuộc vào ε, t0) sao cho bất kỳ nghiệm
đẳng thức
k y(t) − x(t) k< ε, ∀t ≥ t0
Trang 7Nói cách khác, nghiệm x(t) là ổn định khi mọi nghiệm khác của hệ cógiá trị ban đầu đủ gần với giá trị ban đầu của x(t) thì vẫn đủ gần nó trongsuốt thời gian t ≥ t0.
Định nghĩa 1.1.2 Nghiệm x(t) của hệ (1.1) gọi là ổn định tiệm cận nếu nó
lim
Nghĩa là, nghiệm x(t) là ổn định tiệm cận nếu nó ổn định và mọi nghiệm
khi t tiến tới vô cùng
trình (1.1) sẽ được đưa về dạng
trong đó F (τ, 0) = 0, và khi đó sự ổn định của một nghiệm x(t) nào đó của
hệ (1.1) sẽ được đưa về nghiên cứu tính ổn định của nghiệm 0 của hệ (1.2)
Để ngắn gọn, từ nay ta sẽ nói hệ (1.2) là ổn định thay vào nói nghiệm 0 của
hệ là ổn định Do đó, từ bây giờ ta xét hệ (1.1) với giả thiết hệ có nghiệm 0,
Hệ (1.1) là ổn định nếu với bất kì > 0, t0 ∈ R+ sẽ tồn tại số δ > 0 ( phụ
Nếu số δ > 0 trong các định nghĩa trên không phụ thuộc vào thời điểm
(hay ổn định tiệm cận đều)
Định nghĩa 1.1.3 Hệ (1.1) là ổn định mũ nếu tồn tại các số M > 0 δ > 0
k x(t) k≤ M e−δ(t−t0 )
k x0 k, ∀t ≥ t0
là nghiệm 0 của hệ không những ổn định tiệm cận mà mọi nghiệm của nótiến tới 0 nhanh với tốc độ theo hàm số mũ
Trang 81.1.2 Phương pháp hàm Lyapunov
Trước tiên ta xét hệ phương trình phi tuyến dừng
(ii) V (x) = 0 khi và chỉ khi x = 0
nếu
(ii) V (x) là hàm xác định dương
Hàm V(x) gọi là hàm Lyapunov chặt nếu nó là hàm Lyapunov và thêm vào
đó, bất đẳng thức trong điều kiện iii) là thực sự âm, với mọi x nằm ngoàimột lân cận 0 nào đó, chính xác hơn:
nghiệm x(t) với x(t0) = x0, t0 ≥ 0
Đối với hệ phi tuyến không dừng tổng quát (1.4) thì hàm Lyapunov được
định nghĩa tương tự cho hàm hai biến V(t, x) Kí hiệu K là tập các hàm liên
Trang 9Định lý 1.1.6 Nếu hệ phi tuyến không dừng (1.4) có hàm Lyapunov thì hệ
ổn định Nếu hàm Lyapunov đó là chặt thì hệ là ổn định tiệm cận
1.1.3 Bài toán ổn định hóa
Xét hệ điều khiển mô tả bởi hệ phương trình vi phân
(
˙x(t) = f (t, x(t), u(t)), t ≥ t0,
Định nghĩa 1.1.8 Hệ (1.5) gọi là ổn định hóa được nếu tồn tại hàm
vi phân
˙x(t) = f (t, x(t), h(x(t))), t ≥ 0
Trang 10là ổn định Như vậy, mục đích của bài toán ổn định hóa là tìm các hàm điềukhiển ngược h(.) hoặc ma trận K sao cho hệ là ổn định theo nghĩa Lyapunov.
Định lý 1.1.9 Hệ điều khiển (1.5) được gọi là ổn định hóa được dạng mũ
˙x(t) = f (t, x(t), g(x(t))), t ≥ 0
là ổn định mũ
1.2 Bài toán ổn định và ổn định hóa hệ có trễ
1.2.1 Bài toán ổn định hệ có trễ
Chúng ta nhận thấy rằng hệ phương trình vi phân thường (1.1) mô tả mốiquan hệ giữa biến thời gian t, trạng thái của hệ thống x(t) và vận tốc thay
đổi của trạng thái x(t) tại cùng một thời điểm t
Song trên thực tế, các quá trình xảy ra trong tự nhiên thường có sự liên quan
đến quá khứ, đều ít nhiều mang tính di truyền Vì vậy, khi mô tả quá trìnhnày, chúng sẽ được biểu diễn bằng lớp các phương trình vi phân có trễ.Giả sử một hệ thống phụ thuộc vào quá khứ với độ trễ (0 ≤ h ≤ +∞), với
Trang 11x(t) là một hàm có trễ liên tục trên R+ nhận giá trị trong Rn, chúng ta xây
đạo trên [t − h; t] của hàm x(.) với chuẩn trong C được xác định bởi
mũ cho hệ
ì C → R sao cho(i) ∃λ1, λ2 > 0 : λ1 k x(t) k2≤ V (t, xt) ≤ λ2 k xt k2, ∀t ≥ 0
mọi nghiệm x(t) là bị chặn, tức là
∃N > 0 :k x(t, φ) k≤ N k φ k, ∀t ≥ 0
Nếu điều kiện ii, được thay bằng điều kiện
(iii) ˙V (t, xt) < 0 thì hệ (1.7) là ổn định tiệm cận
Nếu điều kiện ii, được thay bằng điều kiện
(iv) ∃λ3 > 0 : ˙V (t, xt) ≤ −2λ3V (t, xt)với mọi nghiệm x(t) của hệ (1.7) thì
Trang 12trong đó x(t) ∈ Rnlà véc tơ trạng thái u(t) ∈ Rm là véc tơ điều khiển,xt ∈ C,
Định nghĩa 1.2.3 Cho số α > 0 Hệ điều khiển (1.7) được gọi là α - ổn
(
˙x(t) = f (t, xt, g(x(t))), t ≥ 0,
1.3 Bài toán điều khiển tối ưu
Bây giờ ta có thể mô tả bài toán điều khiển tối ưu như sau Xét hệ điều khiển
˙x(t) = f (t, x(t), u(t), t ∈ [t0, t1] = Ix(t0) = x0, x(t) ∈ Rn,
(1.11)
trạng thái Cho phiếm hàm mục tiêu
J (u) =
Z
I
Trang 13Điều khiển u∗(t) tìm được sẽ được gọi là điều khiển tối ưu cho bài toán tối
Người ta phân loại các bài toán điều khiển tối ưu căn cứ theo cấu trúc củahàm mục tiêu Nếu hàm mục tiêu có dạng (1.12) thì ta có bài toán tối ưuLagrange
Nếu J(u) có dạng
khiển tối ưu Meyer Còn nếu hàm mục tiêu cho bởi
J (u) =
Z
I
f0(t, x, u)dt + g(t1, x(t1)),
tức là, kết hợp giữa (1.12) và (1.13) thì ta có bài toán tối ưu Bolza
Mục đích chính của các nghiên cứu trong lý thuyết điều khiển tối ưu là:
- Tìm các điều kiện cần hoặc đủ để một điều khiển chấp nhận được làtối ưu
- Nghiên cứu các bài toán tồn tại điều khiển tối ưu
- Xây dựng và thiết kế thuật toán tìm các điều khiển tối ưu
- Ưng dụng các kết quả lý thuyết bài toán điều khiển tối ưu vào các bàitoán trong kỹ thuật, kinh tế
1.3.1 Một số bài toán tối ưu đặc biệt
Dựa trên nguyên lí cực đại cho bài toán tối ưu tổng quát, người ta đã giải
được nhiều bài toán tối ưu cụ thể, đặc biệt đối với các hệ điều khiển tuyếntính Mặc dù việc tìm các điều khiển tối ưu cho các hệ điều khiển tuyến tínhtrong nhiều trường hợp vẫn đòi hỏi nhiều kĩ thuật phức tạp, xong đối với một
số bài toán tối ưu tuyến tính đặc thù thì ta có thể giải và tìm điều kiện tối ưugián tiếp từ nguyên lí cực đại Pontriagin dưới các công thức tính toán cụ thể
và đơn giản
Trang 141.3.2 Bài toán tối ưu toàn phương tuyến tính
Bài toán tối ưu toàn phương tuyến tính là bài toán điều khiển tối ưu cho hệtuyến tính
dương Xét lớp hàm điều khiển u(t) ∈ L2([t0, t1], Rm)
Từ nguyên lí cực đại, đối với bài toán tối ưu (1.14) và (1.15) ta có:
Trang 15Bổ đề 1.4.3 (Bổ đề Schur) Cho các ma trận hằng số đối xứng X, Y, Z X =
Z −Y
< 0
Trang 16Chương 2
Bài toán đảm bảo giá trị điều khiển tối
ưu
Trong chương này, chúng tôi trình bày một số kết quả cơ sở giải bài toán
đảm bảo giá trị điều khiển tối ưu
2.1 Bài toán đảm bảo giá trị điều khiển tối ưu cho hệ tuyến
Định nghĩa 2.1.1 Xét bài toán điều khiển tuyến tính giá trị tối ưu (2.1) với
Định lý 2.1.2 Xét hệ (2.1) với hàm mục tiêu (2.2) Giả sử tồn tại ma trận
đối xứng xác định dương P sao cho bất đẳng thức ma trận tuyến tính (LMI)
Trang 17J∗ = λmax(P−1) k x0 k2 là giá trị mục tiêu tối ưu.
Chứng minh Xét hàm Lyapunov - Krasovskii sau
Từ bất đẳng thức ma trận tuyến tính LMI (2.3) ta có:
là điều khiển ngược làm ổn định hóa hệ (2.1)
Trang 19từ đó điều khiển ngược giá trị tối ưu là:
Định lý 2.2.1 Xét hệ (2.4), với hàm mục tiêu (2.5) Giả sử tồn tại ma trận
đối xứng xác định dương P sao cho bất đẳng thức ma trận tuyến tính (LMI)sau thỏa mãn
Trang 20DÔ dµng kiÓm tra ®îc:
λmin(P−1) k x k2≤ V (xt) ≤ [(h + 1)λmax(P−1) + hλmax(Q2)] k xt k2
+ hP y(t), y(t)i − hP y(t − h), y(t − h)i]
ta cã:
˙
Trang 21là điều khiển ngược làm ổn định hóa hệ (2.4).
[hQ1x, xi + hQ2x(t − h), x(t − h)i + hRu, ui] < − ˙V (xt)
Lấy tích phân hai vế từ 0 tới t, ta có:
J (u) ≤ V (x0) ≤ [(h + 1)λmax(P−1) + hλmax(Q2)] k ϕ k2= J∗
Ví dụ 2.2.2 Xét hệ (2.4) với hàm mục tiêu (2.5),
Trang 22từ đó điều khiển ngược đảm bảo giá trị tối ưu là:
Định lý 2.2.3 Xét hệ (2.7) với hàm mục tiêu (2.8) Giả sử tồn tại ma trận
đối xứng xác định dương P sao cho bất đẳng thức ma trận tuyến tính sauthỏa mãn:
Trang 23trong đó
Dễ dàng kiểm tra được
λmin(P−1) k x k2≤ V (xt) ≤ [(h + 1)λmax(P−1) + ηhλmax(Q2)] k xt k2
˙
+ hP y(t), y(t)i − (1 − δ)hP y(t − h(t)), y(t − h(t))i
Trang 24Suy ra theo định lí Lyapunov, hệ là ổn định tiệm cận và u∗ = −12B P−1x(t)
là điều khiển ngược làm ổn định hóa hệ (2.7)
Ví dụ 2.2.4 Xét hệ (2.7) với hàm mục tiêu (2.8),
Trang 25Chương 3
Bài toán đảm bảo giá trị điều khiển tối
ưu cho hệ tuyến tính có độ trễ không khả vi
3.1 Bài toán đảm bảo giá trị điều khiển tối ưu cho hệ tuyến
x(t) = φ(t), t ∈ [−d, 0], d = max{h1max, h2max, k1, k2}
Trang 26Định nghĩa 3.1.1 Cho α > 0 Hệ (3.1), trong đó u(t) = 0, là α - ổn địnhnếu tồn tại β > 0 sao cho mọi nghiệm x(t, φ) thỏa mãn:
Định nghĩa 3.1.2 Cho α > 0 Hệ (3.1) là α - ổn định hóa nếu tồn tại điều
Ta sẽ tìm điều khiển ngược cho hệ (3.1) với hàm mục tiêu (3.3) sao cho hệ
Định nghĩa 3.1.3 Cho hệ (3.1) với hàm mục tiêu (3.3), nếu tồn tại điều
2 λmax(T1) +
k22
2 λmax(T2) + h
2 1medλmax(R1)+ h22medλmax(R2) + 2δ1h1medλmax(S1) + 2δ2h2medλmax(S2)),
Trang 27H1 = h1medM h1medM h1medM h1medMT ,
Trang 28Định lý 3.1.4 Xét hệ (3.1) với hàm mục tiêu (3.3) với α > 0, Q > 0 và R >
0 Nếu tồn tại ma trận đối xứng xác định dương N, P, Q1, Q2, R1, R2, S1, S2,
trị mục tiêu tối ưu là:
Trang 29XÐt hµm Lyapunov - Krasovskii cho hÖ (3.5)
Trang 31Từ đó
˙
V (t, xt) + 2αV (t, xt)
≤ 2xT(t)P ˙x(t) + xT(t)[Q1 + Q2 + k1T1 + k2T2 + 2αP ]x(t)
− e−2αh1medxT(t − h1medQ1x(t − h1med)
− e−2αh2medxT(t − h2medQ2x(t − h2med)
˙xT(s)Si˙x(s)ds) ≤ −
Z t−hi(t)−δit−h imed
Đặt
ζT(t) = xT(t) xT(t − h1med) xT(t − h2med) ˙xT(t)
Trang 33Mặt khác, từ bổ đề (1.4.1) và (1.4.2) khi h1(t) ≥ h1med, ta có:
Z t−h1medt−h 1 (t)
˙x(s)ds
≤ e2α(h1med +δ 1 )δ1ζT(t)WTA1S1−1AT1W ζ(t)+ e−2α(h1med +δ1)
δ1−1
Z t−h 1 (t) t−h 1med
˙x(s)ds
S1
Z t−h 1 (t) t−h 1med
˙x(s)ds
≤ e2α(h1med +δ 1 )δ1ζT(t)WTA1S1−1AT1W ζ(t)+ e−2α(h1med +δ 1 )
Z t−h 1 (t) t−h 1med
Z t−h 1med
t−h 1 (t)
˙xT(s)S1˙x(s)ds
(3.14)Tương tự (3.14), ta cũng nhận được
Z t−h2medt−h 2 (t)
˙x(s)ds
≤ e2α(h2med +δ 2 )δ2ζT(t)WTB1KS2−1KTB1TW ζ(t)+ sgn(4h2(t))e−2α(h2med +δ 2 )
Z t−h 2med
t−h 2 (t)
˙xT(s)S2˙x(s)ds
(3.15)
Trang 34t−k 1
xT(s)T1x(s)ds
(3.16)Tương tự (3.16), ta cũng nhận được :
˙
V (t, xt) + 2αV (t, xt)
≤ 2xT(t)P ˙x(t) + xT(t)[Q1 + Q2 + k1T1 + k2T2 + 2αP ]x(t)
− e−2αh1medxT(t − h1medQ1x(t − h1med)
− e−2αh2medxT(t − h2medQ2x(t − h2med)
+ e2α(h2med +δ 2 )δ2ζT(t)WTB1KS2−1KTB1TW
+ k1e2αk1WTA2T1−1AT2W + k2e2αk2WTB2KT2−1KTB2TW
ζ(t)
Trang 35AT2W + k2e2αk2WTB2KT2
−1
KTB2TW
Trang 36Mặt khác, sử dụng bổ đề Schur, điều kiện Ω ≤ 0 tương đương với điều kiện
λ k x(t, φ) k2≤ V (t, xt) ≤ V (0, x0)e−2αt ≤ Λe−2αt k φ k2
Trang 37Khi đó, nghiệm x(t, φ) của hệ thỏa mãn
k x(t, φ) k≤
rΛ
Trang 38Y = 0.0389 0.0066 ,
Trang 39và từ đó điều khiển ngược đảm bảo giá trị tối ưu là u(t) = 0.0389 0.0066 x(t).Hơn nữa nghiệm của hệ đóng thỏa mãn:
và giá trị mục tiêu tối ưu là:
Trang 40Kết luận
Trong luận văn này, chúng tôi đã trình bày một số kết quả nghiên cứu vềbài toán đảm bảo giá trị điều khiển tối ưu cho hệ phương trình vi phân cótrễ
Các kết quả chính của luận văn :
Chương 2, chúng tôi trình bày một số kết quả cơ sở giải bài toán điềukhiển đảm bảo giá trị tối ưu Phần đầu của chương là bài toán điều khiển giátrị tối ưu cho hệ tuyến tính với hàm mục tiêu toàn phương, phần tiếp theo làbài toán điều khiển tuyến tính giá trị tối ưu cho hệ tuyến tính có trễ và phầncuối của chương là mở rộng kết quả này cho hệ có trễ biến thiên
Chương 3, sử dụng phương pháp hàm Lyapunov và một số kĩ thuật đánhgiá chứng minh phù hợp, chúng tôi giải bài toán điều khiển giá trị tối ưu cho
hệ tuyến tính có độ trễ không khả vi và minh họa chúng bằng ví dụ
Trang 41Tµi liÖu tham kh¶o
[1] Vò Ngäc Ph¸t, (2001), NhËp m«n lý thuyÕt ®iÒu khiÓn to¸n häc NhµxuÊt b¶n §¹i häc Quèc gia Hµ Néi
[2] Mai V Thuan and Vu N Phat, Optimal guaranteed cost control of linearsystems with mixed interval time-varying delayed state and control
J Optime.Theovy Appl, To appear
[3] Costa E.F., Oliveira V.A (2002), On the design of guaranteed costcontrollers for a class of uncertain linear systems , Syst Contr.Letters,Vol.46, No1, 17-29
[4] Shi P., Boukas E.K., Shi Y.(2003), Kagarwal R., Optimal guaranteedcost control of uncertain discrete time-delay systems J Comput Appl.Math., Vol 157, No3, 435-451