Báo cáo Ứng dụng nguyên lí biến phân Ekeland trong bài toán điều khiển tối ưu trình bày một ứng dụng của nguyên lí biến phân Ekeland trong lí thuyết điều khiển tối ưu. Cụ thể, nhóm tác giả sẽ thảo luận một mở rộng của nguyên lí cực tiểu Pontryagin cho điều khiển tối ưu xấp xỉ.
Trang 1ỨNG DỤNG NGUYÊN LÍ BIẾN PHÂN EKELAND TRONG BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU
Nguyễn Thị Tâm, Lớp K60C, Khoa Toán – Tin
GVHD: TS Nguyễn Như Thắng
Tóm tắt: Báo cáo trình bày một ứng dụng của nguyên lí biến phân Ekeland trong lí thuyết điều khiển
tối ưu Cụ thể, chúng tôi sẽ thảo luận một mở rộng của nguyên lí cực tiểu Pontryagin cho điều khiển tối ưu xấp xỉ
Từ khóa: Phương pháp biến phân Ekerland, nguyên lí cực tiểu Pontryagin, hàm mục tiêu Bolza
I MỞ ĐẦU
Lí thuyết điều khiển tối ưu xuất hiện từ những năm 50 của thế kỉ hai mươi với một loạt các công trình tiêu biểu của các nhà toán học Xô Viết Bài toán điều khiển tối ưu là bài toán tìm các quá trình tối ưu cho các hệ điều khiển mô tả bởi các phương trình toán học Nền tảng của lí thuyết điều khiển tối ưu là nguyên lí cực đại (cùng với các các dạng biến thể) và một loạt các công trình của các nhà toán học Xô Viết đứng đầu là L.C Pontryagin Nguyên lí cực đại cổ điển là một biểu thức cực trị toán học mà từ đó ta có thể đoán nhận được điều khiển là tối ưu hay không, tức là cho ta một điều kiện cần của bài toán điều khiển tối ưu, chi tiết có thể xem trong [5] Tuy nhiên, không phải lúc nào ta cũng tìm được điều kiện cần của bài toán điều khiển tối ưu Mặt khác, theo nguyên lí cực đại cổ điển dù có tìm ra điều kiện tối ưu thì theo quan điểm kiến thiết, việc xây dựng thuật toán để tìm các điều kiện tối ưu cũng gặp rất nhiều khó khăn và có thể là không tìm ra cụ thể
Để phần nào giải quyết hai vấn đề đó, trong báo cáo này chúng tôi áp dụng nguyên lí Ekeland vào bài toán điều khiển tối ưu để mở rộng nguyên lí cực đại Pontryagin cho trường hợp nghiệm tối ưu xấp xỉ, tức là các điều kiện có giá trị ngay cả khi bài toán tối ưu ban đầu không có nghiệm chính xác Vào đầu những năm 70, nhà toán học Ivar I Ekeland trong bài báo [1] đã đề xuất nguyên lí biến phân suy rộng, mà ngày nay thường gọi là nguyên lí biến phân Ekeland Công trình này ngay lập tức nhận được sự quan tâm của cả cộng đồng toán học lí thuyết và ứng dụng, và tính đến nay (4/2014) đã có 1403 lượt trích dẫn (theo số liệu Google), còn theo cơ sở dữ liệu Hội toán học Mỷ có 473 bài báo khoa học
đã trích dẫn và 57 lượt trích dẫn từ người viết nhận xét Một trong những điểm thú vị của nguyên lí biến phân Ekeland là một mặt nó mở rộng nguyên lí biến phân cổ điển, nhưng
mặt khác nó xây dựng khái niệm lời giải xấp xỉ thích hợp ngay cả khi lời giải chính xác
không tồn tại
Nội dung chính của báo cáo được trích từ tài liệu [1] Chúng tôi hi vọng nguyên lí biến phân Ekeland sẽ là công cụ quan trọng chính, là bước khởi đầu để nghiên cứu bài toán điều khiển tối ưu trong đạo hàm riêng
II NỘI DUNG
1 Kết quả tổng quan
Định nghĩa 1.1: Cho X là không gian topo Hausdorff Hàm số :X {+ } được gọi là nửa liên tục dưới tại x0 khi và chỉ khi:
Trang 20
Hàm được gọi là nửa liên tục dưới trên X nếu là nửa liên tục tại mọi điểm của X
Định lí 1.2 (Nguyên lí biến phân Ekeland): Cho ( , ) X d là không gian metric đầy và
là hàm nửa liên tục dưới và bị chặn dưới Cho 0 và uX cho trước sao cho:
X
2
(1.1)
Khi đó, với 0 bất kì, tồn tại uX sao cho:
(u) ( ),u
(1.2)
d u u (1.3)
(u) ( )u d u u( , ),
u u. (1.4)
Chứng minh: Để đơn giản hóa kí hiệu ta đặt 1
Ta xác định thứ tự bộ phận trên X như sau:
u v u v d u v
Dễ dàng thấy được:
(i) Tính phản xạ: u u
(ii) Tính phản đối xứng: u v và v u u v
(iii) Tính bắc cầu : u v và v w u w,
với mọi u v, , wX
Bây giờ, ta xây dựng (S n) trong tập con của X như sau:
Với u1u ta có tập:
S u2S1 sao cho
1
2
Bằng phương pháp quy nạp ta có:
n
n
S u n1S n sao cho 1 1
S
2
n
Rõ ràng, S1S2 S n và S n là các tập đóng, với mọi n Thật vậy, cho
x S với x j x X Ta có (x j) (u n)d x u( ,j n) Mặt khác, là nửa liên tục dưới và d liên tục nên ta suy ra xS n
Trang 3Bây giờ, ta chứng minh đường kính của các tập S n tiến đến0(được kí hiệu là: diamS n0) Thật vậy, cho điểm xS n bất kì, xu n suy ra
( )x ( )u n d x u( , n)
(1.5)
Mặt khác, vì S n1S n nên xS n1 Theo cách xác định của các tập S n và chọn
1
u S ta có:
2
(1.6)
Từ (1.5) và (1.6) ta được:
( , n) 2 ,n
d x u với mọi xS n,
Với diamS n2 n1 Do S n là các tập đóng lồng nhau thắt dần có đường kính tiến dần đến 0 trong không gian metric đầy theo định lí Cantor các tập S n có một điểm chung duy nhất và điểm chung ấy thỏa mãn các điều kiện (1.2), (1.3) và (1.4)
Đặt:
1
{u }
n n
Chọn u1u Vì uS1 nên suy ra (1.2) là hiển nhiên
Với uu, ta có uu (vì nếu uuthì uS1 với mọi n mâu thuẫn với tính duy
nhất của u) nghĩa là:
( )u (u) d u u( , )
Ta được (1.4)
Ta chứng minh (1.3) Do
1
j
Suy ra ta có:
1
1
n j
n j
Bổ đề 1.3 (Bất đẳng thức Gronwall): Cho hàm số liên tục không âm u:[a,b]
thỏa mãn:
t
a
u t C Ku d t [a,b],
trong đó C K, là các hằng số không âm Khi đó,
( )
u t Ce t [a,b]. (1.7)
Chứng minh của bổ đề có thể tìm thấy trong [2, 5]
Trang 42 Nguyên lí cực tiểu Pontryagin
Xét hệ điều khiển xác định bởi phương trình:
0
( ) ( ( ), ( ), ),( )
dx
dt
(2.1)
trong đó x t( ) n mô tả trạng thái của hệ điều khiển, u t ( ) là hàm điều khiển phụ thuộc thời gian t, và thuộc vào tập compact khả metric K Cho T 0 và giả sử rằng:
a) và 'x ( / x1, / x2, , / x n) là hàm liên tục trên
[0,T]
n
K
b) x, ( , , ) t x u c(1 x 2), với c là hằng số
Cho trước hàm điều khiển đo được u:[0,T]K Điều kiện a) đảm bảo tồn tại nghiệm duy nhất X của phương trình vi phân (2.1) trên khoảng đủ nhỏ [0, ] Từ điều kiện b) và bất đẳng thức Gronwall (Bổ đề 1.3) ta được:
2
0
x t x cT e (2.2)
Và do đó đảm bảo sự tồn tại nghiệm trên khoảng thời gian [0,T] Hơn nữa, từ (2.2)
ta có:
dx
( )
dt t max{ (t,x,u) (t,x,u) [0,T] B K}, (2.3)
trong đó, B là hình cầu bán kính ( x0 22cT e) 2cT Áp dụng định lí Ascoli, nhận thấy họ các quỷ đạo X của hệ điều khiển (2.1) đồng liên tục và bị chặn, do đó nó compact tương đối trong topo đều
Xét phiếm hàm mục tiêu Bolza
0
T
ở đó : n thuộc lớp hàm C1, L và L'x liên tục trên n K [0,T] Ta tìm hàm điều khiển đo được u sao cho quỷ đạo tương ứng x làm cực tiểu hóa J u ( ) trong số tất cả các nghiệm của (2.1)
Định lí 2.1: Với mỗi 0, tồn tại một phiếm hàm điều khiển đo được u có quỹ đạo tương ứng là x, thỏa mãn:
U
J u J u (2.4)
Trang 5( ( ), ( ), ), ( ) ( ( ), ( ), ) min ( ( ), ( ), ), ( ) ( ( ), ( ), ) , (2.5)
u K
x t u t t t L x t u t t x t u t t t L x t u t t
(2.5) trong đó, là nghiệm của phương trình vi phân tuyến tính:
( )
' ( ( ), ( ), ) ( ) ' ( ( ), ( ), )
t x
dt
(2.6)
trong đó, t'x là chuyển vị của 'x
Nhận xét: Nếu ở (2.4) ta cho 0 thì ta có thể lấy 0 trong (2.5) Nói cách khác,
nếu tồn tại một điều khiển tối ƣu, thì nguyên lí cực đại Pontryagin thỏa mãn Hơn nữa,
định lí còn đúng ngay cả khi không có nghiệm tối ƣu
Bổ đề 2.2: Giả sử U là tập hợp các hàm điều khiển đo được u: 0, T K
Trên U xét hàm khoảng cách:
( ,u u ) meas t 0,T |u t( ) u t( )
(2.7)
Khi đó ( , )U là một không gian metric đầy
Chứng minh: Đầu tiên, ta kiểm tra là khoảng cách Lấyu u u1, 2, 3 bất kì trong U :
t u t| 1( )u t2( ) t u t| 1( )u t3( ) u t2( )u t3( ) (2.8)
( ,u u ) ( ,u u ) ( ,u u )
(2.10)
Lấy u n n N là dãy Cauchy trong U Ta có thể lấy ra một dãy con u n k n N
sao cho
1
1 ,
2
n n k
Ta sẽ chứng minh dãy con này hội tụ Thật vậy, đặt:
1
2
p k
(2.11)
Ta có:
1
k k k
p k
measA
và A k A k1
Xác định uUnhƣ sau:
k
(2.12)
Theo định nghĩa, dãy con ( )
k
n k N
u hội tụ tới u Dãy u n n N là Cauchy, nên nó hội tụ đếnu
Trang 6Bổ đề 2.3: Ánh xạ U u ( ( ))x T , trong đó xlà nghiệm tương ứng của (2.1) là
liên tục trên U
Chứng minh:Cho dãy u n n N hội tụ đếnu trong U Dãy quỷ đạo x n n N compact
tương đối, do đó tồn tại dãy con x khội tụ đều tớix Ta có thể chứng minh là quỷ đạo
tương ứng với u
Biến đổi phương trình (2.1) ta có:
0 0
t
Chok ; x k x u; k u ( )h k n và tích phân
0
( ( ), ( ), )
t
k k
x s u s s ds
bởi (2.3) Áp dụng định lí hội tụ Lebesgue ta được:
0
0
t
x t x x s u s s ds (2.14)
Bổ đề 2.4:
d
Chứng minh: Đây là một kết quả cổ điển chúng tôi chỉ trình bày vắn tắt chứng minh:
0 0
t
t
x t( )0 (dx/dt t)( )0 ( ( ),x t 0 u t0, )0 O( ) (2.15)
Nghĩa là:
d
Do đó:
d
Trong đó R T t( , )0 là ma trận nghiệm cơ bản của phương trình tuyến tính:
( ) '( ( ), ( ), ) ( )
d
(2.18)
Ta có: d ( ( )) |x T 0 '(x T( )), d x T( ) | 0
Trang 7
'( ( )), ( , )[ ( ( ),x T R T t x t u t, ) ( ( ),x t u t( ), )]t
t
Nhưng t R T t( , )0 '( ( ))x T ( )t0 trong đó là nghiệm của (2.6) Do đó bổ đề
được chứng minh
Chứng minh định lí 2.1
Bước 1: Trước hết giả sử L0 tức là ta có hàm mực tiêu Meyer J u( ) ( ( ))x T Từ
bổ đề 2.2; 2.3, áp dụng định lí 1.4, tồn tại hàm điều khiển đo được uUthỏa mãn:
2
U
(2.20)
(2.21)
Quỷ đạo tương ứngx của uđược cho bởi
0
( ) ( ( ), ( ), );( )
(0)
dx
dt
(2.22)
Lấy t0(0, ),T u0K và xác địnhvU với mỗi 0theo các bước sau:
( )
v t
(2.23)
Rõ ràng ( ,v u ), trong đó là đủ nhỏ Kí hiệu xlà quỷ đạo tương ứng, áp
dụng bổ đề 2.4 ta có:
d
dt (2.24)
Nhưng theo (2.21) ta có:
( ( ))x T ( ( ))x T
với 0 (2.25)
Từ (2.24) và (2.25) ta được:
( ( ),x t u t, ) ( ( ),x t u t( ), ),t ( )t
Cuối cùng, do là điểmu0 bất kì của K và t0là điểm bất kì trong(0, )T nên thu được
điều kiện (2.5) , với hạn chế L0
Bước 2: Trường hợp tổng quát L0 được đưa về trường hợp trên bằng cách
thêm biến
Thật vậy, kí hiệu 1
0
t n
x t L x u s ds
Trang 8Khi đó ta có hệ điều khiển:
0
( ) ( ( ), ( ), ); 0, (0) ( , 0);
(2.27)
Trong đó
1
( ( ), n ( )),
y x t x t
( ( ), ( ), ) ( ( ), ( ), )
( ( ), ( ),
x t u t t
F y t u t t
L x t u t t
Và hàm mục tiêu
1
( ( ))y T ( ( ))x T x n ( )T
(2.28)
Phương trình liên hợp của bài toán theo biến mới có dạng
'
'
( ( ), ( ), ) ( )
t
y
t
y
(2.29)
ở đóp( ,p p n1) Dễ thấy phương trình này tương đương với phương trình (2.6) và
1 1
n
p
Xét bài toán điều khiển tối ưu của hệ (2.27) với hàm mục tiêu (2.28), bài toán được
đưa về bước 1 Do đó định lí được chứng minh
III KẾT LUẬN
Trong báo cáo này chúng tôi trình bày mở rộng của nguyên lí cực đại Pontryagin cho
bài toán điều khiển tối ưu với hàm mục tiêu Bolza trong không gian hữu hạn chiều Tuy
đây không phải là kết quả hoàn toàn mới (xem [1] cho trường hợp hàm mục tiêu Meyer)
nhưng là bước đầu tiên để tiến tới nghiên cứu bài toán điều khiển tối ưu trong không gian
vô hạn chiều (điều khiển tối ưu của bài toán phương trình đạo hàm riêng) Một trong
những khó khăn chính khi chuyển sang bài toán điều khiển tối ưu trong không gian vô hạn
chiều là thiếu vắng các bổ đề về tính compact hay những tính toán trên toán tử nghiệm cơ
bản đòi hỏi những hiểu biết sâu sắc về lí thuyết nửa nhóm sinh bởi một toán tử tuyến tính
không bị chặn Do khả năng còn hạn chế với thời lượng nghiên cứu không nhiều, chúng tôi
mới chỉ xét bài toán điều khiển tối ưu trong không gian hữu hạn chiều Trong tương lai,
chúng tôi sẽ dành nhiều thời gian để trả lời phần nào các câu hỏi mở trên
TÀI LIỆU THAM KHẢO
[1] Ekenland, I., On the Variantionl Principle, Journal of Mathematiccal Analysis and
Application 47, 324-353, 1974
[2] Evans, L.C., Partial differential equations, American Mathematical Soc., 2010
[3] De Figueiredo, D.G., Lectures on The Eleland Variational Principle with Applications
and Detour, Tata Institute of Fundamental Research, Bombay 1989
[4] Zabczyk J., Mathematical control theory, Birkhauser, 1992
[5] Vũ Ngọc Phát, Nhập môn Lí thuyết điều khiển toán học, Nhà xuất bản ĐHQG Hà
Nội, 2007
[6] Trần Đức Vân, Lí thuyết phương trình vi phân đạo hàm riêng, Nhà xuất bản ĐHQG
Hà Nội, 2005