Ứng dụng nguyên lí biến phân Ekeland trong bài toán điều khiển tối ưu

Báo cáo Ứng dụng nguyên lí biến phân Ekeland trong bài toán điều khiển tối ưu trình bày một ứng dụng của nguyên lí biến phân Ekeland trong lí thuyết điều khiển tối ưu. Cụ thể, nhóm tác giả sẽ thảo luận một mở rộng của nguyên lí cực tiểu Pontryagin cho điều khiển tối ưu xấp xỉ.

Trang 1

ỨNG DỤNG NGUYÊN LÍ BIẾN PHÂN EKELAND TRONG BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU

Nguyễn Thị Tâm, Lớp K60C, Khoa Toán – Tin

GVHD: TS Nguyễn Như Thắng

Tóm tắt: Báo cáo trình bày một ứng dụng của nguyên lí biến phân Ekeland trong lí thuyết điều khiển

tối ưu Cụ thể, chúng tôi sẽ thảo luận một mở rộng của nguyên lí cực tiểu Pontryagin cho điều khiển tối ưu xấp xỉ

Từ khóa: Phương pháp biến phân Ekerland, nguyên lí cực tiểu Pontryagin, hàm mục tiêu Bolza

I MỞ ĐẦU

Lí thuyết điều khiển tối ưu xuất hiện từ những năm 50 của thế kỉ hai mươi với một loạt các công trình tiêu biểu của các nhà toán học Xô Viết Bài toán điều khiển tối ưu là bài toán tìm các quá trình tối ưu cho các hệ điều khiển mô tả bởi các phương trình toán học Nền tảng của lí thuyết điều khiển tối ưu là nguyên lí cực đại (cùng với các các dạng biến thể) và một loạt các công trình của các nhà toán học Xô Viết đứng đầu là L.C Pontryagin Nguyên lí cực đại cổ điển là một biểu thức cực trị toán học mà từ đó ta có thể đoán nhận được điều khiển là tối ưu hay không, tức là cho ta một điều kiện cần của bài toán điều khiển tối ưu, chi tiết có thể xem trong [5] Tuy nhiên, không phải lúc nào ta cũng tìm được điều kiện cần của bài toán điều khiển tối ưu Mặt khác, theo nguyên lí cực đại cổ điển dù có tìm ra điều kiện tối ưu thì theo quan điểm kiến thiết, việc xây dựng thuật toán để tìm các điều kiện tối ưu cũng gặp rất nhiều khó khăn và có thể là không tìm ra cụ thể

Để phần nào giải quyết hai vấn đề đó, trong báo cáo này chúng tôi áp dụng nguyên lí Ekeland vào bài toán điều khiển tối ưu để mở rộng nguyên lí cực đại Pontryagin cho trường hợp nghiệm tối ưu xấp xỉ, tức là các điều kiện có giá trị ngay cả khi bài toán tối ưu ban đầu không có nghiệm chính xác Vào đầu những năm 70, nhà toán học Ivar I Ekeland trong bài báo [1] đã đề xuất nguyên lí biến phân suy rộng, mà ngày nay thường gọi là nguyên lí biến phân Ekeland Công trình này ngay lập tức nhận được sự quan tâm của cả cộng đồng toán học lí thuyết và ứng dụng, và tính đến nay (4/2014) đã có 1403 lượt trích dẫn (theo số liệu Google), còn theo cơ sở dữ liệu Hội toán học Mỷ có 473 bài báo khoa học

đã trích dẫn và 57 lượt trích dẫn từ người viết nhận xét Một trong những điểm thú vị của nguyên lí biến phân Ekeland là một mặt nó mở rộng nguyên lí biến phân cổ điển, nhưng

mặt khác nó xây dựng khái niệm lời giải xấp xỉ thích hợp ngay cả khi lời giải chính xác

không tồn tại

Nội dung chính của báo cáo được trích từ tài liệu [1] Chúng tôi hi vọng nguyên lí biến phân Ekeland sẽ là công cụ quan trọng chính, là bước khởi đầu để nghiên cứu bài toán điều khiển tối ưu trong đạo hàm riêng

II NỘI DUNG

1 Kết quả tổng quan

Định nghĩa 1.1: Cho X là không gian topo Hausdorff Hàm số :X  {+ } được gọi là nửa liên tục dưới tại x0 khi và chỉ khi:

Trang 2

0

Hàm  được gọi là nửa liên tục dưới trên X nếu  là nửa liên tục tại mọi điểm của X

Định lí 1.2 (Nguyên lí biến phân Ekeland): Cho ( , ) X d là không gian metric đầy và

   là hàm nửa liên tục dưới và bị chặn dưới Cho  0 và uX cho trước sao cho:

X

2

    (1.1)

Khi đó, với 0 bất kì, tồn tại uX sao cho:

(u) ( ),u

   (1.2)

d u u  (1.3)

(u) ( )u  d u u( , ),



     u u. (1.4)

Chứng minh: Để đơn giản hóa kí hiệu ta đặt 1





Ta xác định thứ tự bộ phận trên X như sau:

u  v u   v d u v

Dễ dàng thấy được:

(i) Tính phản xạ: u  u

(ii) Tính phản đối xứng: u  v và v    u u v

(iii) Tính bắc cầu : u  v và v    w u w,

với mọi u v, , wX

Bây giờ, ta xây dựng (S n) trong tập con của X như sau:

Với u1u ta có tập:

S    u2S1 sao cho

1

2

Bằng phương pháp quy nạp ta có:

n

S    u n1S n sao cho 1 1

S

2

n

Rõ ràng, S1S2   S n và S n là các tập đóng, với mọi n Thật vậy, cho

x S với x j x X Ta có (x j) (u n)d x u( ,j n) Mặt khác,  là nửa liên tục dưới và d liên tục nên ta suy ra xS n

Trang 3

Bây giờ, ta chứng minh đường kính của các tập S n tiến đến0(được kí hiệu là: diamS n0) Thật vậy, cho điểm xS n bất kì, xu n suy ra

( )x ( )u n d x u( , n)

    (1.5)

Mặt khác, vì S n1S n nên xS n1 Theo cách xác định của các tập S n và chọn

1

u S  ta có:

2

    (1.6)

Từ (1.5) và (1.6) ta được:

( , n) 2 ,n

d x u   với mọi xS n,

Với diamS n2 n1 Do S n là các tập đóng lồng nhau thắt dần có đường kính tiến dần đến 0 trong không gian metric đầy theo định lí Cantor các tập S n có một điểm chung duy nhất và điểm chung ấy thỏa mãn các điều kiện (1.2), (1.3) và (1.4)

Đặt:

1

{u }

n n



Chọn u1u Vì uS1 nên suy ra (1.2) là hiển nhiên

Với uu, ta có uu (vì nếu uuthì uS1 với mọi n mâu thuẫn với tính duy

nhất của u) nghĩa là:

( )u (u) d u u( , )

Ta được (1.4)

Ta chứng minh (1.3) Do

1

j





Suy ra ta có:

1

n j





Bổ đề 1.3 (Bất đẳng thức Gronwall): Cho hàm số liên tục không âm u:[a,b]

thỏa mãn:

t

a

u t  C Ku  d  t [a,b],

trong đó C K, là các hằng số không âm Khi đó,

( )

u t Ce    t [a,b]. (1.7)

Chứng minh của bổ đề có thể tìm thấy trong [2, 5]

Trang 4

2 Nguyên lí cực tiểu Pontryagin

Xét hệ điều khiển xác định bởi phương trình:

0

( ) ( ( ), ( ), ),( )

dx

dt







(2.1)

trong đó x t( ) n mô tả trạng thái của hệ điều khiển, u t ( ) là hàm điều khiển phụ thuộc thời gian t, và thuộc vào tập compact khả metric K Cho T 0 và giả sử rằng:

a)  và      'x ( / x1, / x2, , / x n) là hàm liên tục trên

[0,T]

n

K

 

b) x, ( , , ) t x u c(1 x 2), với c là hằng số

Cho trước hàm điều khiển đo được u:[0,T]K Điều kiện a) đảm bảo tồn tại nghiệm duy nhất X của phương trình vi phân (2.1) trên khoảng đủ nhỏ [0, ] Từ điều kiện b) và bất đẳng thức Gronwall (Bổ đề 1.3) ta được:

2

0

x t  x  cT e (2.2)

Và do đó đảm bảo sự tồn tại nghiệm trên khoảng thời gian [0,T] Hơn nữa, từ (2.2)

ta có:

dx

( )

dt t max{ (t,x,u) (t,x,u) [0,T] B K},    (2.3)

trong đó, B là hình cầu bán kính ( x0 22cT e) 2cT Áp dụng định lí Ascoli, nhận thấy họ các quỷ đạo X của hệ điều khiển (2.1) đồng liên tục và bị chặn, do đó nó compact tương đối trong topo đều

Xét phiếm hàm mục tiêu Bolza

0

T

ở đó  : n  thuộc lớp hàm C1, L và L'x liên tục trên n K [0,T] Ta tìm hàm điều khiển đo được u sao cho quỷ đạo tương ứng x làm cực tiểu hóa J u ( ) trong số tất cả các nghiệm của (2.1)

Định lí 2.1: Với mỗi 0, tồn tại một phiếm hàm điều khiển đo được u có quỹ đạo tương ứng là x, thỏa mãn:

U

J u  J u  (2.4)

Trang 5

( ( ), ( ), ), ( ) ( ( ), ( ), ) min ( ( ), ( ), ), ( ) ( ( ), ( ), ) , (2.5)

u K

x t u t t   t L x t u t t  x t u t t  t L x t u t t 



(2.5) trong đó,  là nghiệm của phương trình vi phân tuyến tính:

( )

' ( ( ), ( ), ) ( ) ' ( ( ), ( ), )

t x

dt





 

(2.6)

trong đó, t'x là chuyển vị của 'x

Nhận xét: Nếu ở (2.4) ta cho  0 thì ta có thể lấy 0 trong (2.5) Nói cách khác,

nếu tồn tại một điều khiển tối ƣu, thì nguyên lí cực đại Pontryagin thỏa mãn Hơn nữa,

định lí còn đúng ngay cả khi không có nghiệm tối ƣu

Bổ đề 2.2: Giả sử U là tập hợp các hàm điều khiển đo được u: 0, T K

Trên U xét hàm khoảng cách:

 

( ,u u ) meas t 0,T |u t( ) u t( )

    (2.7)

Khi đó ( , )U  là một không gian metric đầy

Chứng minh: Đầu tiên, ta kiểm tra  là khoảng cách Lấyu u u1, 2, 3 bất kì trong U :

t u t| 1( )u t2( )  t u t| 1( )u t3( )  u t2( )u t3( ) (2.8)

( ,u u ) ( ,u u ) ( ,u u )

   (2.10)

Lấy  u n n N là dãy Cauchy trong U Ta có thể lấy ra một dãy con  u n k n N

 sao cho

 1

1 ,

2

n n k

   Ta sẽ chứng minh dãy con này hội tụ Thật vậy, đặt:

1

2

p k



   (2.11)

Ta có:

1

k k k

p k

measA







  và A k A k1

Xác định uUnhƣ sau:

k

   (2.12)

Theo định nghĩa, dãy con ( )

k

n k N

u  hội tụ tới u Dãy  u n n N là Cauchy, nên nó hội tụ đếnu

Trang 6

Bổ đề 2.3: Ánh xạ U u ( ( ))x T , trong đó xlà nghiệm tương ứng của (2.1) là

liên tục trên U

Chứng minh:Cho dãy u n n N hội tụ đếnu trong U Dãy quỷ đạo  x n n N compact

tương đối, do đó tồn tại dãy con x khội tụ đều tớix Ta có thể chứng minh là quỷ đạo

tương ứng với u

Biến đổi phương trình (2.1) ta có:

0 0

t

Chok ; x k x u; k u ( )h k n và tích phân

0

( ( ), ( ), )

t

k k

x s u s s ds



bởi (2.3) Áp dụng định lí hội tụ Lebesgue ta được:

0

t

x t x   x s u s s ds (2.14)

Bổ đề 2.4:

d

Chứng minh: Đây là một kết quả cổ điển chúng tôi chỉ trình bày vắn tắt chứng minh:

0 0

t





    

x t( )0 (dx/dt t)( )0   ( ( ),x t 0 u t0, )0 O( ) (2.15)

Nghĩa là:

d

Do đó:

d

Trong đó R T t( , )0 là ma trận nghiệm cơ bản của phương trình tuyến tính:

( ) '( ( ), ( ), ) ( )

d

  (2.18)

Ta có: d ( ( )) |x T 0 '(x T( )), d x T( ) | 0

   

Trang 7

'( ( )), ( , )[ ( ( ),x T R T t x t u t, ) ( ( ),x t u t( ), )]t

t

Nhưng t R T t( , )0 '( ( ))x T ( )t0 trong đó là nghiệm của (2.6) Do đó bổ đề

được chứng minh

Chứng minh định lí 2.1

Bước 1: Trước hết giả sử L0 tức là ta có hàm mực tiêu Meyer J u( ) ( ( ))x T Từ

bổ đề 2.2; 2.3, áp dụng định lí 1.4, tồn tại hàm điều khiển đo được uUthỏa mãn:

2

U

   (2.20)

      (2.21)

Quỷ đạo tương ứngx của uđược cho bởi

0

( ) ( ( ), ( ), );( )

(0)

dx

dt



 



(2.22)

Lấy t0(0, ),T u0K và xác địnhvU với mỗi  0theo các bước sau:

( )

v t









 

 (2.23)

Rõ ràng ( ,v u ), trong đó là đủ nhỏ Kí hiệu xlà quỷ đạo tương ứng, áp

dụng bổ đề 2.4 ta có:

d

dt           (2.24)

Nhưng theo (2.21) ta có:

( ( ))x T ( ( ))x T 

     với  0 (2.25)

Từ (2.24) và (2.25) ta được:

( ( ),x t u t, ) ( ( ),x t u t( ), ),t ( )t 

Cuối cùng, do là điểmu0 bất kì của K và t0là điểm bất kì trong(0, )T nên thu được

điều kiện (2.5) , với hạn chế L0

Bước 2: Trường hợp tổng quát L0 được đưa về trường hợp trên bằng cách

thêm biến

Thật vậy, kí hiệu 1

0

t n

x t L x u s ds

Trang 8

Khi đó ta có hệ điều khiển:  

0

( ) ( ( ), ( ), ); 0, (0) ( , 0);



 (2.27)

Trong đó

1

( ( ), n ( )),

y x t x  t

( ( ), ( ), ) ( ( ), ( ), )

( ( ), ( ),

x t u t t

F y t u t t

L x t u t t



Và hàm mục tiêu

1

( ( ))y T ( ( ))x T x n ( )T

    (2.28)

Phương trình liên hợp của bài toán theo biến mới có dạng

'

( ( ), ( ), ) ( )

t

y

t

y



 

  (2.29)

ở đóp( ,p p n1) Dễ thấy phương trình này tương đương với phương trình (2.6) và

1 1

n

p 

Xét bài toán điều khiển tối ưu của hệ (2.27) với hàm mục tiêu (2.28), bài toán được

đưa về bước 1 Do đó định lí được chứng minh

III KẾT LUẬN

Trong báo cáo này chúng tôi trình bày mở rộng của nguyên lí cực đại Pontryagin cho

bài toán điều khiển tối ưu với hàm mục tiêu Bolza trong không gian hữu hạn chiều Tuy

đây không phải là kết quả hoàn toàn mới (xem [1] cho trường hợp hàm mục tiêu Meyer)

nhưng là bước đầu tiên để tiến tới nghiên cứu bài toán điều khiển tối ưu trong không gian

vô hạn chiều (điều khiển tối ưu của bài toán phương trình đạo hàm riêng) Một trong

những khó khăn chính khi chuyển sang bài toán điều khiển tối ưu trong không gian vô hạn

chiều là thiếu vắng các bổ đề về tính compact hay những tính toán trên toán tử nghiệm cơ

bản đòi hỏi những hiểu biết sâu sắc về lí thuyết nửa nhóm sinh bởi một toán tử tuyến tính

không bị chặn Do khả năng còn hạn chế với thời lượng nghiên cứu không nhiều, chúng tôi

mới chỉ xét bài toán điều khiển tối ưu trong không gian hữu hạn chiều Trong tương lai,

chúng tôi sẽ dành nhiều thời gian để trả lời phần nào các câu hỏi mở trên

TÀI LIỆU THAM KHẢO

[1] Ekenland, I., On the Variantionl Principle, Journal of Mathematiccal Analysis and

Application 47, 324-353, 1974

[2] Evans, L.C., Partial differential equations, American Mathematical Soc., 2010

[3] De Figueiredo, D.G., Lectures on The Eleland Variational Principle with Applications

and Detour, Tata Institute of Fundamental Research, Bombay 1989

[4] Zabczyk J., Mathematical control theory, Birkhauser, 1992

[5] Vũ Ngọc Phát, Nhập môn Lí thuyết điều khiển toán học, Nhà xuất bản ĐHQG Hà

Nội, 2007

[6] Trần Đức Vân, Lí thuyết phương trình vi phân đạo hàm riêng, Nhà xuất bản ĐHQG

Hà Nội, 2005

Định dạng
Số trang	8
Dung lượng	509,55 KB