Dùng phương pháp Monte Carlo để giải một lớp bài toán điều khiển ngẫu nhiên tổng hợp liên quan đến quá trình điểm gắn mã và áp dụng
Trang 1LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi được hoànthành dưới sự hướng dẫn của GS.TS Nguyễn Quý Hỷ và PGS.TS TốngĐình Quỳ Các kết quả được viết chung với các tác giả khác đã được sựnhất trí của đồng tác giả khi đưa vào luận án Các kết quả nêu trong luận
án là trung thực và chưa từng được công bố trong bất kỳ công trình nàotrước thời gian công bố
Hà Nội, ngày 15 tháng 02 năm 2014
Tác giả của luận án
Trần Thị Ngân
Trang 2LỜI CẢM ƠN
Trước hết, em xin bày tỏ lòng biết ơn chân thành và sâu sắc tới các thầyhướng dẫn, GS.TS Nguyễn Quý Hỷ và PGS.TS Tống Đình Quỳ Em vôcùng biết ơn sự giúp đỡ tận tình, quí báu mà các thầy đã dành cho emtrong suốt quá trình thực hiện luận án Em xin chân thành cảm ơn sự giúp
đỡ, góp ý của PGS.TS Bùi Khởi Đàm, TS Trần Cảnh Các thầy đã dànhnhiều thời gian hướng dẫn và chỉ bảo cho em những vấn đề có liên quanđến luận án để em có thể hoàn thiện như ngày hôm nay
Em xin chân thành cảm ơn các thầy cô và các cán bộ nghiên cứu thuộcViện Toán ứng dụng và tin học Em xin cảm ơn Ban giám hiệu, các thầy
cô thuộc Viện đào tạo sau đại học trường Đại học Bách Khoa Hà Nội đãtạo một môi trường làm việc hết sức thuận lợi giúp em thực hiện tốt côngviệc nghiên cứu của mình
Em cũng xin chân thành cảm ơn Ban giám hiệu Trường đại học Côngnghệ thông tin và Truyền thông, Ban chủ nhiệm khoa Khoa học cơ bản,
đã hết sức tạo điều kiện về thời gian và công việc để em có thể tập trunghoàn thành quá trình học tập, nghiên cứu của mình Đồng thời, em xingửi lời cảm ơn đến các thầy cô, các đồng nghiệp đã động viên, giúp đỡ emtrong suốt quá trình nghiên cứu
Em xin cảm ơn gia đình và bạn bè, người thân đã luôn là nguồn độngviên để em có thể tiếp tục học tập và nghiên cứu Các thành viên tronggia đình luôn sẻ chia những khó khăn vất vả trong quá trình nghiên cứu
và hoàn thiện đề tài
Em xin chân thành cảm ơn!
Trang 3Mục lục
Chương 1
Một số công cụ giải tích và ngẫu nhiên có liên quan 7
1.1 Phương trình vi phân 7
1.1.1 Phương trình vi phân thường 7
1.1.2 Phương trình vi phân suy rộng 11
1.1.3 Bất đẳng thức Gronwall 19
1.2 Phương pháp số giải bài toán điều khiển tối ưu 20
1.2.1 Bài toán điều khiển tối ưu suy rộng 20
1.2.2 Giải số bài toán Mayer không có ràng buộc thông thường 22 1.2.3 Giải số bài toán Mayer có ràng buộc trạng thái cuối thông thường 26
1.3 Các công cụ ngẫu nhiên hỗ trợ 28
1.3.1 Mô hình hợp lý cực đại 28
1.3.2 Mô hình dò tìm ngẫu nhiên 30
Chương 2 Thuật toán Monte Carlo giải 1 loại bài toán Mayer suy rộng không lồi 33 2.1 Đặt bài toán và các chú ý mở đầu 35
2.2 Nghiệm tựa tối ưu và sự hội tụ của nó 39
2.3 Thuật toán Monte Carlo giải bài toán 51
2.4 Kết luận 66
Trang 4Chương 3
Giải một loại bài toán Mayer không lồi mở rộng với ràng
3.1 Đặt bài toán và một số chú ý mở đầu 69
3.2 Sự hội tụ của dãy điều khiển tựa tối ưu 75
3.3 Quy trình Monte Carlo giải bài toán 99
3.4 Kết luận 107
Chương 4 Áp dụng vào mô hình hợp lý cực đại 108 4.1 Mô hình hợp lý cực đại liên tục hóa 108
4.2 Mô hình hợp lý cực đại ước lượng tham hàm 113
4.3 Mô hình hợp lý cực đại liên tục hóa ước lượng tham số 120
4.4 Kết luận 128
Danh mục các công trình đã công bố của luận án 130
Trang 5DANH MỤC CÁC TỪ VIẾT TẮT
PTVP phương trình vi phân
ĐKTƯ điều khiển tối ưu
PPMC phương pháp Monte Carlo
QHĐĐ quy hoạch đo được
DTNN dò tìm ngẫu nhiên
XXTT xấp xỉ tuyến tính
HLCĐ hợp lý cực đại
CNĐ chấp nhận được
vtnn vec tơ ngẫu nhiên
đlnn đại lượng ngẫu nhiên
MPTTƯ mô phỏng tựa tối ưu
MPTT mô phỏng tuyến tính tựa tối ưu
ĐKRR điều khiển rời rạc
hcc hầu chắc chắn
hkn hầu khắp nơi
ƯLKC ước lượng không chệch
TSH tham số hóa
BT bậc thang (hằng từng khúc)
mes (B) độ đo Lebesgue của tập B
CTTĐ công trình thủy điện
RRĐĐ rủi ro động đất
Trang 6DANH MỤC CÁC BẢNG VÀ HÌNH ẢNH
Bảng 2.1: Bảng nghiệm dò tìm ngẫu nhiên thứ r = 1.000.000
Bảng 2.2: Bảng so sánh các nghiệm DTNN, tựa tối ưu, MPTTƯ và MPTTBảng 4.1: Bảng các giá trị Uk(r) := (ak, dk), k = 0, , 4
Bảng 4.2: Bảng tham số hàm mật độ chấn cấp từ dãy DTNN đơn giản.Hình 4.1: Mật độ và đường đồng mức xác suất trên dải chấn cấp 4.5 - 5.0Hình 4.2: Mật độ và đường đồng mức xác suất trên dải chấn cấp 5.0 - 5.5Hình 4.3: Mật độ và đường đồng mức xác suất trên dải chấn cấp 5.5 - 6.0Hình 4.4: Mật độ và đường đồng mức xác suất trên dải chấn cấp 6.0 - 6.5Hình 4.5: Mật độ và đường đồng mức xác suất trên dải chấn cấp 6.5 - 7.0Hình 4.6: Đồ thị hàm g(s) = g(s; u), u = u(r) = u(100.000) = 0.182
Trang 7MỞ ĐẦU
Các bài toán điều khiển tối ưu (ĐKTƯ) dạng tất định (deterministic timal control) xuất hiện trên quốc tế đã quá nửa thế kỷ nay, gắn với têntuổi của Pontriagin (1959), Bellman (1957) và với những mô hình ứng dụngphong phú trong điều khiển học của nhiều lãnh vực kỹ thuật và quản lýkinh tế Trong bài toán này, vào mỗi thời điểm t ∈ [to, T ] ⊂ R1 (thời gianđiều khiển) đối tượng được điều khiển y(t) ∈ Rn (gọi là biến trạng thái)liên hệ với yếu tố điều khiển u(t) ∈ Rm (gọi là biến điều khiển) bởi 1 hệphương trình vi phân (PTVP) thường (hoặc đạo hàm riêng) theo ẩn hàm
op-y(t) (to ≤ t ≤ T ) (gọi là hệ động lực) và biến điều khiển có thể không phụthuộc biến trạng thái (gọi là điều khiển theo chương trình - programmecontrol) hoặc phụ thuộc biến trạng thái u(t) = u t; y(s)
(to ≤ s ≤ t) (gọi
là điều khiển tổng hợp - synthetic, feedback control) Ngoài ra, biến điềukhiển u(t) (to ≤ t ≤ T ) còn cần phải thỏa mãn một số điều kiện ràng buộcnào đó, để nó trở thành điều khiển chấp nhận được (CNĐ) Việc giải bàitoán ĐKTƯ nói trên đồng nghĩa với việc lựa chọn trong số các điều khiểnCNĐ một điều khiển tối ưu, làm cho hàm mục tiêu của bài toán đạt mứccực đại (hoặc cực tiểu)
Do tầm quan trọng của các bài toán ĐKTƯ nói trên đối với thực tiễnứng dụng nên từ khi ra đời cho đến nay, việc giải số các bài toán này đãnhận được sự quan tâm của không ít tác giả trong và ngoài nước Đã cónhiều phương pháp được sử dụng, tuy nhiên mỗi phương pháp chỉ giải đượcmột lớp bài toán nhất định Ta có thể điểm sơ lược 1 số phương pháp tiếpcận chính với vấn đề này như dưới đây
- Phương pháp gián tiếp [21] (tr.240): Đối với các bài toán điều khiển theochương trình, xét bài toán điều khiển lồi, trong đó hàm mục tiêu có dạngBolza, hệ động lực có dạng tuyến tính, tập hợp các điều khiển CNĐ khôngphụ thuộc thời gian và là một tập hợp lồi, đóng Cơ sở của phương phápgián tiếp dùng để giải bài toán này là nguyên lý cực đại Pontryagin (dưới
Trang 8dạng điều kiện cần và đủ của ĐKTƯ [21] (240-258)), dùng để chuyển bàitoán ĐKTƯ thành các bài toán cực đại trung gian Liên quan đến việcgiải số các bài toán cực đại này là bài toán giá trị biên 2 điểm Các kỹthuật Neuton - Raphson (Quasilinearization technique [21] tr.188-189) vàbắn (Shooting method [21] tr.187-188) của giải tich số có thể thực hiệnđiều trên một cách gần đúng Nhằm hữu hạn hóa số (không đếm được)các bài toán cực đại cần giải trong nguyên lý Pontryagin, ta có thể chọnbiến điều khiển thuộc lớp hàm bậc thang (hoặc tuyến tính từng khúc) trên
[to, T ] với lưu ý rằng: Do hàm mục tiêu trong các bài toán cực đại là hàmlõm (theo u) trên miền lồi, nên ta có thể sử dụng công cụ của quy hoạchlồi (xem, chẳng hạn [40]) để giải bằng số các bài toán đặt ra
Khi vượt ra ngoài khuôn khổ của những bài toán điều khiển lồi nói trên,nguyên lý Pontryagin (trong dạng điều kiện cần của điều khiển "tối ưu")cũng đã được phát biểu ([21] tr.231-232) cho bài toán điều khiển không cótính lồi và không có điều kiện ràng buộc, với hàm mục tiêu có dạng Mayer
và biến điều khiển thuộc lớp những hàm liên tục từng khúc Tuy nhiên,
do bài toán điều khiển (theo chương trình) này không có tính lồi và donguyên lý cực đại nói trên chỉ là điều kiện cần, nên khái niệm "tối ưu"trong trường hợp này chỉ được hiểu theo nghĩa địa phương (không phải làtối ưu toàn cục) Ngoài ra, do bài toán cực đại trong nguyên lý Pontryaginnói chung không có dạng của bài toán quy hoạch lồi nên phải dùng phươngpháp Monte Carlo [13] (tr.271-309) để giải nó
- Phương pháp ẩn : Phương pháp này thường sử dụng cho bài toán điềukhiển tổng hợp Mayer có biến trạng thái hoặc điều khiển là bình phươngkhả tích và có điều kiện ràng buộc đối với biến trạng thái Cơ sở của phươngpháp ẩn dùng để giải bài toán này là nguyên lý quy hoạch động Bellman[29] (Mục IV.3), mà liên quan đến việc thiết lập các bài toán cực đại trongnguyên lý này ta cần giải phương trình quy hoạch động (trong dạng phươngtrình đạo hàm riêng đối với ẩn hàm Bellman Larson (1968) và Lamarechal(1972) đã dùng phương pháp lưới (sai phân) [21] (tr.184-185) để giải quyết
Trang 9vấn đề này nhưng cũng gập nhiều khó khăn, khi phải nội suy kết quả tínhtoán trên lưới nhất là khi số chiều n lớn; thậm chí có khó khăn không khắcphục được như trường hợp n ≥ 4 Michailevich và Shor đã tránh đượcphần nào khó khăn nói trên bằng cách sử dụng phương pháp chổi Kiev[1] (tr.97-104) Nhưng phương pháp này cũng có nhược điểm bởi tính địaphương của những điều khiển "tối ưu" mà nó thu được và cũng bị hạn chế
về số chiều n của biến trạng thái, khi sử dụng các phương pháp này trêncác máy tính tuần tự (do sử dụng nhiều bộ nhớ cùng thời gian tính toán)
- Phương pháp trực tiếp : Khác với các phương pháp ẩn và gián tiếp (chuyểnbài toán điều khiển về các bài toán cực đại và giải các bài này), trong cácphương pháp trực tiếp ta có thể dùng cách tiếp cận giải tích hàm hoặctham số hóa (TSH) hàm điều khiển để giải trực tiếp bài toán ĐKTƯ.+ Đối với cách tiếp cận giải tích hàm [21] (tr.193-195), người ta thườngxét bài toán Mayer với hàm mục tiêu là một phiếm hàm xác định trênkhông gian hàm U nào đó của các hàm điều khiển, thông qua biến trạngthái vào thời điểm cuối T Trên cơ sở này, thiết lập bài toán cực tiểu phiếmhàm Các công cụ của phép tính biến phân [29] (Mục I.2-I.6) hoặc củagiải tích số như: phương pháp đường dốc nhất [35] (Mục XV.4), gradient[21] (tr.192-195) đã được sử dụng để giải các bài toán cực tiểu phiếm hàm
đã thiết lập Đương nhiên là cách tiếp cận này không có điều kiện xét tớinhững ràng buộc trạng thái và ràng buộc hỗn hợp giữa biến trạng thái vàđiều khiển, cũng không xét tới bài toán điều khiển tổng hợp
+ Đối với cách tiếp cận của phương pháp TSH hàm điều khiển, tuy ta
có thể xét bài toán điều khiển theo chương trình với những điều kiện ràngbuộc hỗn hợp nói trên trong bài toán điều khiển, nhưng cần chỉ ra rằnghàm điều khiển có thể TSH bởi các tham số để cho số không đếm đượcnhững điều kiện ràng buộc (phụ thuộc thời gian) được thay bằng một sốhữu hạn các ràng buộc theo các tham số Khi đó ta có thể chuyển bài toántrên về bài toán điều khiển theo tham số Trong những năm gần đây nhiềutác giả trong và ngoài nước như [9], [30], [15], [17], [10], [14], [43] thường
Trang 10quan tâm đến cách tiếp cận này.
- Phương pháp sai phân : Khi chia thời đoạn [to, T ] bởi lưới điểm cáchđều {tn := to + nh}N
n=0 với bước lưới h và thay thế đạo hàm (thường hoặcriêng phần) trong hệ động lực của bài toán ĐKTƯ (trong mô hình liên tục)bởi sai phân tương ứng, ta có thể rời rạc hóa hệ động lực nói trên thànhphương trình sai phân (gọi là hệ động lực rời rạc) và rời rạc hóa bài toánĐKTƯ thành mô hình ĐKTƯ rời rạc ứng với bài toán ĐKTƯ ban đầu.Trong những điều kiện nhất định về hàm mục tiêu và hệ động lực của bàitoán Mayer (có hoặc không có ràng buộc trạng thái), người ta đã chỉ ra [27](tr.12-33) sự hội tụ (theo mục tiêu) của hàm điều khiển hằng từng khúc(còn gọi là điều khiển bậc thang (BT)) lập từ lời giải bài toán rời rạc về lờigiải của bài toán ĐKTƯ (liên tục) tương ứng Khi đó, nếu bài toán ĐKTƯ
có tính lồi thì bài toán rời rạc tương ứng là 1 bài toán quy hoạch lồi và ta
có thể dùng các phương pháp sai phân trực tiếp, như gradien, hướng có thể,Errou - Gurvitz [27] (tr.83-90) của quy hoạch phi tuyến để giải bài toánđiều khiển rời rạc này Ta cũng cũng có thể sử dụng các phương pháp củaquy hoạch ngẫu nhiên như: phạt ngẫu nhiên [26](tr.212-214), tựa gradientngẫu nhiên [26](tr.101-104) để giải nó Ngoài ra, người ta còn dùng cácphương pháp sai phân gián tiếp để giải bài toán trên dựa vào nguyên lý cựcđại rời rạc [27] (tr.61-83)
- Phương pháp Monte Carlo (PPMC) :
+ Trong các bài toán ĐKTƯ có tính lồi, phương pháp TSH hàm điều khiển
đã được sử dụng kết hợp với việc mô phỏng nghiệm của hệ động lực (tuyếntính) ngẫu nhiên hóa để chuyển nó về một bài toán cực tiểu phiếm hàm[31] hoặc quy hoạch ngẫu nhiên lồi [6] (tr.33-57) và dùng phương pháp xấp
xỷ ngẫu nhiên để giải nó
+ Trong các bài toán điều khiển rời rạc, phương pháp PPMC được xem
là một loại phương pháp sai phân trực tiếp dùng để giải các bài toán quyhoạch đo được (không có tính lồi) [6], [5], [2] hoặc ngẫu nhiên hóa các bàitoán này [9] để sử dụng các mô hình dò tìm ngẫu nhiên Cũng có thể xem
Trang 11PPMC là một loại phương pháp sai phân gián tiếp, dùng để thiết lập cácnguyên lý cực đại rời rạc mô phỏng [4] và đưa về việc sử dụng các mô hình
dò tìm ngẫu nhiên
+ Không chỉ các bài toán ĐKTƯ rời rạc nói trên, PPCM còn được sử dụngtrong các phương pháp trực tiếp để giải 1 số bài toán ĐKTƯ bằng phươngpháp gradient [31], phương pháp xấp xỷ ngẫu nhiên [16], [30], phương phápbắn ngẫu nhiên Markov [17], phương pháp dò tìm ngẫu nhiên hỗn hợp [6](tr.122-145), phương pháp chiếu gradient ngẫu nhiên [6] (tr.73-95) Trongtrường hợp bài toán ĐKTƯ (có tính lồi) được giải bằng phương pháp giántiếp, PPMC cũng đã được sử dụng để mô phỏng nghiệm của hệ động lựcngẫu nhiên [7] (tr.114-119) hoặc của bài toán biên 2 điểm [8] (320-334).Bản luận án này nhằm mục đích mở rộng phạm vi ứng dụng của PPMCvào việc giải số 2 lớp mới trong số các bài toán ĐKTƯ (dạng Mayer) không
có tính lồi và không (hoặc có) điều kiện ràng buộc trạng thái cuối, trong đó
hệ động lực gồm cả phương trình vi phân thường lẫn đạo hàm riêng (vớiđạo hàm hiểu theo nghĩa thông thường hoặc suy rộng)
Hai lớp bài toán trên đây có nguồn gốc từ việc giải quyết 1 chủ đề ƯDtoán học của Semina Các phương pháp ngẫu nhiên & giải tích số (thuộcHội ƯD Toán học VN) về việc mô phỏng các trận động đất trên vùng TâyBắc bộ, để giải bài toán Giảm thiểu độ rủi ro động đất cho Công trìnhThủy điện (CTTĐ) Sơn La [12] (tr.37-45) Cấu trúc của luận án bao gồm:Chương 1 : Giới thiệu một số công cụ được sử dụng trong luận án, trongđó: Phương trình vi phân với đạo hàm suy rộng và mô hình hợp lý cực đạidùng để đặt bài toán ĐKTƯ từ 1 thực tế ứng dụng, các phương pháp sốtrong ĐKTƯ và mô hình dò tìm ngẫu nhiên dùng để giải bài toán
Chương 2 : Thiết lập mô hình rời rạc của bài toán Mayer không có tính lồi,trong ngữ cảnh hệ động lực là PTVP (thường và đạo hàm riêng) với đạohàm suy rộng và các giả thiết về tính Lipschitz theo tất cả các biến (trạngthái, điều khiển và thời gian) của hàm ở vế phải và hàm mục tiêu Đồngthời chỉ ra sự hội tụ (theo mục tiêu) của điều khiển BT lập từ ĐKTƯ
Trang 12trong bài toán rời rạc về ĐKTƯ trong bài toán liên tục Phương phápMonte Carlo được sử dụng để giải số bài toán rời rạc nói trên và để thiếtlập điều khiển ngẫu nhiên BT hội tụ hầu chắc chắn (hcc) theo mục tiêu vềĐKTƯ của bài toán Mayer nói trên.
Chương 3 : Thiết lập mô hình rời rạc của bài toán Mayer không lồi córàng buộc trạng thái, trong đó hệ động lực là PTVP (thường và đạo hàmriêng) với đạo hàm thông thường và các giả thiết về tính Lipschitz theobiến trạng thái, liên tục theo biến điều khiển và Lebesgue-khả tích theobiến thời gian của hàm ở vế phải và hàm mục tiêu Đồng thời chỉ ra sự hội
tụ (theo mục tiêu) của điều khiển BT lập từ ĐKTƯ trong bài toán rời rạc
về ĐKTƯ trong bài toán liên tục Phương pháp Monte Carlo cũng được
sử dụng để giải số bài toán rời rạc nói trên và để thiết lập điều khiển ngẫunhiên BT hội tu hcc theo mục tiêu về ĐKTƯ của bài toán Mayer có ràngbuộc trạng thái nói trên
Chương 4 : Mở rộng mô hình hợp lý cực đại (HLCĐ) kinh điển về ướclượng (ƯL) tham số thành Mô hình HLCĐ liên tục hóa ƯL tham hàm và
Mô hình HLCĐ liên tục hóa ƯL tham số (trong dạng bài toán ở Chương
2 và 3), để dùng kết quả 2 chương này vào việc giải số bài toán UL thamhàm trong mật độ xác suất có điều kiện của chấn tâm động đất và bài toán
UL tham số trong mật độ xác suất của biên độ chấn cấp động đất Cáckết quả tính toán đều gắn với các số liệu thực trên vùng Tây Bắc Bộ nước
ta và có thể dùng để mô phỏng các trận động đất trên vùng này, phục vụviệc giải bài toán giảm thiểu độ rủi ro động đất cho CTTĐ Sơn La
Các nội dung trên đã được công bố trong các bài báo [2], [3], [4] củaTác giả luận án cùng người hướng dẫn và bài báo [1] của Tác giả cùngcác đồng nghiệp Một số phần trong đó có trong các báo cáo khoa học tạiHội nghị chuyên ngành quốc gia năm 2010, 2013 và báo cáo tại Hội nghịchuyên ngành quốc tế năm 2013; Đồng thời được báo cáo tại seminar Cácphương pháp ngẫu nhiên & giải tích số (của Hội Ứng dụng Toán học VN)
và seminar của Viện Toán ứng dụng & Tin học (trường ĐHBK HN)
Trang 13Chương 1
Một số công cụ giải tích và ngẫu
nhiên có liên quan
Trang 14Từ giải tích cơ sở, ta biết rằng: Nếu f, F : [to, T ] → R1 là những hàm số,với f ∈ C(to, T ), F ∈ C1(to, T ) và các tích phân hiểu theo nghĩa Rieman,thì ta có công thức khôi phục hàm số từ nguyên hàm và Neuton-Leibnitz :
ddt
Nhằm mở rộng công thức (1.1.6) một cách tương tự, trước hết ta mở rộng
ra trường hợp n-chiều khái niệm "hàm số tuyệt đối liên tục" trong [36](Định nghĩa VI.3.1), để thu được:
Định nghĩa 1.1.1 Hàm véc tơ f : [to, T ] → Rn gọi là tuyệt đối liên tụctrên [to, T ], nếu∀ε > 0, ∃ δ = δ(ε) > 0, sao cho đối với mọi hệ(ak, bk) K
k=1hữu hạn khoảng:
Trang 15gắn với khái niệm hàm số f (t) tuyệt đối liên tục [36] (Định nghĩa VI.3.1).Chú ý 1.1.1 Hàm véc tơ f (t) = f1(t), · · · , fn(t)
là tuyệt đối liên tụctrên [to, T ] nếu và chỉ nếu mọi thành phần fi(t) (i = 1 ÷ n) là những hàm
số tuyệt đối liên tục trên [to, T ] Khi đó hàm véc tơ f (t) là liên tục đềutrên [to, T ]
Trường hợp n = 1 (hàm số tuyệt đối liên tục), ta có các mệnh đề sau:
Bổ đề 1.1.1 ([36], Mục VI.4.4) Mọi hàm số f : [to, T ] → R1 liên tục tuyệtđối đều có thể biểu diễn dưới dạng hiệu của 2 hàm đơn điệu không giảm,liên tục tuyệt đối trên [to, T ]
Bổ đề 1.1.2 ([36], Định lý VI.1.1) Mọi hàm số f : [to, T ] → R1 đơn điệu
đều có trên [to, T ] (hkn) đạo hàm (hữu hạn):
| ˙f (t)| < +∞ (∀t ∈ [to, T ] (hkn))
Từ Chú ý 1.1.1 và các Bổ đề 1.1.1 ÷ 1.1.2 ta có thể mở rộng ra trườnghợp n-chiều các Định lý VI.4.2 - VI.4.3 trong [36] về hàm số tuyệt đối liêntục, dưới dạng véc tơ:
Định lý 1.1.2 Giả sử hàm véc tơ f = (f1, · · · , fn) ∈ L1(to, T ) Khi đóhàm véc tơ F (t) = F1(t), · · · , Fn(t) là tuyệt đối liên tục trên [to, T ], nếu
(1.1.11)
Trang 16Bây giờ ta xét Bài toán Cauchy trên [to, T ] trong Rn:
˙y(t) = g t, y(t)
y(to) = yo := (yo1, · · · , yon) ∈ Rn, (1.1.13)trong đó (1.1.12) là hệ n phương trình vi phân (gọi là phương trình vi phân(thường) trong Rn) với ẩn hàm y(t) = y1(t), · · · , yn(t)
(t ∈ [to, T ]) cóđạo hàm ˙y(t) = ˙y1(t), · · · , ˙yn(t) thông thường và hàm đã cho g(t, y) =
g1(t, y), · · · , gn(t, y), xác định với mọi (t, y) ∈ [to, T ] × Rn; Còn (1.1.13)
là điều kiện đầu, xác định bởi véc tơ yo := (yo1, · · · , yon) ∈ Rn (đã cho).Liên quan đến sự tồn tại duy nhất lời giải của bài toán Cauchy (còn gọi
là nghiệm của phương trình vi phân) (1.1.12)-(1.1.13), người ta thường đưa
ra 1 loại điều kiện đủ (gọi là điều kiện Lipschitz) dưới đây:
kg(t, y0) − g(t, y”)k ≤ Lky0 − y”k (∀t ∈ [to, T ], y0, y” ∈ Rn), (1.1.14)trong đó hằng số L>0 gọi là hằng số Lipschitz toàn cục, theo nghĩa gắn vớimọi y0, y” ∈ Rn Khi đó, ta có:
Định lý 1.1.4 ([45], Mục 13.35) Nếu hàm véc tơ g(t, y) ∈ Rn liêntục ∀(t, y) ∈ [to, T ] × Rn và nếu hàm này thỏa mãn điều kiện Lipschitz
(1.1.14) thì phương trình vi phân (1.1.12)-(1.1.13) có nghiệm duy nhất
y(t) ∈ Rn (to ≤ t ≤ T ), khả vi trên [to, T ]
Để nghiên cứu phương trình vi phân (1.1.12)-(1.1.13) thông qua phươngtrình tích phân, người ta thường dùng phương pháp chuyển nó về phươngtrình tích phân Voltera tương ứng (gọi là phương pháp tích phân phươngtrình vi phân), nêu trong mệnh đề sau:
Định lý 1.1.5 Nếu hàm hợp véc tơ g(t) := g t, y(t)
Trang 17đều là nghiệm của phương trình vi phân (1.1.12)-(1.1.13), trong đó đẳngthức (1.1.12) đúng với mọi t ∈ (to, T ] (hkn) Ngoài ra, nếu phương trìnhnày có nghiệm khả vi duy nhất trên [to, T ] thì phương trình tích phân(1.1.16) tương ứng cũng có duy nhất nghiệm.
Chứng minh Giả sử y(t) ∈ Rn (t ∈ [to, T ]) là nghiệm của phương trình(1.1.16) Khi đó từ giả thiết (1.1.15) và biểu diễn dưới dạng tích phân phiếmđịnh của nghiệm này trong (1.1.16), ta có thể sử dụng Định lý 1.1.2 để thuđược tính liên tục tuyệt đối của hàm véc tơ y(t) trên [to, T ] và do đó, từĐịnh lý 1.1.3 suy ra sự tồn tại hữu hạn đạo hàm ˙y(t) (∀t ∈ [to, T ] (hkn)).Trên cơ sở này, khi lấy đạo hàm 2 vế của (1.1.16) ta có:
Mặt khác, từ (1.1.16) ta còn suy ray(to) = yo Kết hợp điều này với (1.1.17)
ta thấy rằng: Nghiệm y(t) (t ∈ [to, T ]) nói trên của phương trình tích phân(1.1.16) cũng là nghiệm của phương trình vi phân (1.1.12)-(1.1.13)
Ngoài ra, nếu phương trình (1.1.16) có 2 nghiệm phân biệt thì 2 nghiệmnày cũng là các nghiệm phân biệt của phương trình (1.1.12)-(1.1.13) Điềunày chỉ ra tính duy nhất nghiệm của phương trình (1.1.16), khi phươngtrình (1.1.12)-(1.1.13) có nghiệm duy nhất
1.1.2 Phương trình vi phân suy rộng
Để xét phương pháp tích phân phương trình vi phân với đạo hàm hiểutheo nghĩa suy rộng (distribution), trước hết ta xét các khái niệm liên quanđến "hàm suy rộng" dưới đây
Trang 18Cho khoảng đóng [a, b] ⊂ R1 và hàm số khả vi vô hạn ϕ ∈ C∞(a, b)trên[a,b], nghĩa là ϕ ∈ Ck(a, b) (∀k ≥ 1) (ϕ có đạo hàm liên tục ở mọi cấp).Một khoảng đóng[α, β] ⊂ (a, b) được gọi là giá (support) compac trên [a,b]của ϕ ∈ C∞(a, b), nếu:
ϕ(k)(t) ≡ 0 (∀k ≥ 0, t ∈ [a, b] \ [α, β]), với : ϕ(o)(t) := ϕ(t), (1.1.18)
⇒ ϕ(t) := ϕ1(t) + ϕ2(t) (∀t ∈ (a, b)),(λϕ) D (a,b)
n≥1⊂ D(a, b)gọi là hội tụ về hàm
cơ sở ϕ ∈ D(a, b), nếu: Tồn tại giá compac chung cho mọi hàm của dãy,trên đó mọi dãy ϕ(k)n (t)
n≥1 đạo hàm cấp k (k ≥ 0) hội tụ đều về đạohàm ϕ(k)(t) (cấp k) của ϕ(t):
∃ [α, β] ≡ supϕn ⊂ (a, b) (∀n ≥ 1) : lim
n→∞ϕ(k)n [α,β]
= ϕ(k)(∀k ≥ 0), (1.1.20)
và ký hiệu: lim
n→∞ϕn D(a,b)= ϕ , hay : ϕn D(a,b)→ ϕ (n → ∞)
Định nghĩa 1.1.4 [22], [36] (IV.4.3) Một phiếm hàm Y : D(a, b) → R1
1 Mà chỉ là 1 không gian tuyến tính đa chuẩn [36] (Mục IV.4.2)
Trang 19được gọi là hàm suy rộng (distribution) trên (a,b), nếu nó liên tục theonghĩa hội tụ trong không gian cơ sở D(a, b):
Hàm khả tích y : (a, b) → R1 trong biểu diễn tích phân nói trên gọi là hàmsinh của hàm suy rộng chính quy Y = Yy : D(a, b) → R1 Hàm suy rộng
diễn được dưới dạng tích phân (1.1.22)
Để đơn giản cách trình bày, dưới đây ta chỉ xét các hàm suy rộng chínhquy và gọi tắt nó là hàm suy rộng Khi đó, có thể mở rộng Định nghĩa 1.1.4thành khái niệm "hàm suy rộng véc tơ", như sau:
Định nghĩa 1.1.5 Mỗi ánh xạ tuyến tính liên tục Y = (Y1, · · · , Yn) :
nếu mọi thành phần Yi : D(a.b) → R1 (i = 1 ÷ n) đều là những hàm suyrộng trên (a,b) và có thể biểu diễn mỗi ánh xạ này dưới dạng tích phân,gắn với một hàm véc tơ y = (y1, · · · , yn) ∈ L1(a, b):
yi(t)ϕ(t)dt = (yi, ϕ) (i = 1 ÷ n),
(1.1.22*)
trong đó y = (y1, · · · , yn) ∈ L1(a, b) gọi là hàm sinh của hàm suy rộng véc
tơ Y = Yy
Chú ý 1.1.2 Từ định nghĩa trên ta thấy rằng: Mỗi hàm suy rộng véc tơ
hàm suy rộng này (theo (1.1.22*)) đưa về việc xác định hàm sinh (véc tơ)
y = (y1, · · · , yn) ∈ L1(a, b)
Trang 20Định nghĩa 1.1.5* Tập hợp D∗(a, b) được gọi là không gian các hàm suyrộng véc tơ trên (a,b), nếu nó là lớp các ánh xạ tuyến tính liên tục (dạng(1.1.22*)) Y = Yy : D(a.b) → Rn (∀y ∈ L1(a, b)), nghĩa là:
y(t)ϕ(t)dt(∀ϕ ∈ D(a, b)), y ∈ L1(a, b)
Yλy D∗:=(a,b) λ.Yy (∀ϕ ∈ D∗(a, b), λ ∈ R1)
⇒ Yλy(ϕ) = λ.Yy(ϕ) (∀ϕ ∈ D(a, b))
(1.1.24*)
Chú ý 1.1.3 Từ (1.1.23) ta dễ dàng nhận thấy rằng: Các phép toán đưa
ra trong (1.1.24)-(1.1.24*) có tính đóng trong không gian D∗(a, b) và nótrở thành 1 không gian tuyến tính
Không gian tuyến tính nói trên tuy không định chuẩn, nhưng ta có thể đưa
ra khái niệm "hội tụ" (phép tính giới hạn trong D∗(a, b)) theo nghĩa sau:Định nghĩa 1.1.6 Dãy các hàm suy rộng véc tơ Yn
phân (1.1.23))
Với chú ý rằng: Nếu ϕ ∈ D(a, b) thì đạo hàm cấp 1 của nó ϕ(1) ∈ D(a, b)
Trang 21Bởi vậy ta có thể đưa ra khái niệm "đạo hàm" (phép tính đạo hàm trong
D∗(a, b)), theo nghĩa sau:
Định nghĩa 1.1.7 Đối với mỗi hàm suy rộng véc tơ Y = Yy ∈ D∗(a, b)
trên (a,b) có hàm sinh là y = (y1, · · · , yn) ∈ L1(a, b), ta gọi hàm suyrộng véc tơ Y ≡˙ dYdt ∈ D∗(a, b) là đạo hàm suy rộng của Y, nếu ánh xạ
yi(t)ϕ(1)(t)dt = −(yi, ϕ(1))(∀i = 1 ÷ n, ϕ ∈ D(a, b))
có tính đóng trong không gian tuyến tính D∗(a, b)
Khái niệm đạo hàm suy rộng đưa ra trong định nghĩa trên còn gọi làđạo hàm yếu, vì khi xây dựng nó (theo (1.1.26)) ta chỉ cần tính khả tíchcủa hàm sinh tương ứng (y ∈ L1(a, b)) Điều kiện này đã giảm nhẹ điềukiện về tính khả vi, khi xây dựng khái niệm đạo hàm thông thường Ngoài
ra nếu hàm sinh có tính khả vi liên tục thì đạo hàm suy rộng tương ứng
có mối liên hệ với đạo hàm thông thường, qua mệnh đề sau:
Bổ đề 1.1.3 Nếu hàm suy rộng véc tơ Yy có hàm sinh y ∈ C1(a, b) thìđạo hàm suy rộng Y˙y là 1 hàm suy rộng véc tơ có hàm sinh là ˙y ∈ C(a, b):
Trang 22Chứng minh Nếu ϕ ∈ D(a, b) là 1 hàm cơ sở nào đó thì từ (1.1.19) ta suy
ra tính liên tục của các hàm số ϕ(t), ϕ(1)(t) trên [a,b] Khi đó do các hàmvéc tơ ˙y, y ∈ C(a, b) và do ϕ(a) = ϕ(b) = 0 (xem (1.1.18)), nên từ côngthức tích phân từng phần (véc tơ) ta có:
˙y(t)ϕ(t)dt = y(t)ϕ(t)
b
a−
Z b a
y(t)ϕ(1)(t)dt
Từ công thức trên và từ định nghĩa của khái niệm hàm suy rộng véc tơY˙y ∈
D∗(a, b) trong (1.1.23), ta có: Y˙y(ϕ) = −
Z b a
y(t)ϕ(1)(t)dt (∀ϕ ∈ D(a, b))
Kết hợp điều này với (1.1.26) ta thu được (1.1.28)
Từ Chú ý 1.1.5 ta nhận thấy đạo hàm suy rộng véc tơ Y˙y (y ∈ L1(a, b))
cũng là 1 hàm suy rộng véc tơ Y˙y ∈ D∗(a, b) Bởi vậy từ Định nghĩa 1.1.5
ta có thể mở rộng một cách hình thức công thức (1.1.28) (trong trườnghợp y ∈ C1(a, b)), để biểu diễn hàm suy rộng này dưới dạng:
˙
và đưa ra khái niệm dưới đây:
Định nghĩa 1.1.8 Hàm véc tơ ˙y ≡ dy
dt ∈ L1(a, b) được gọi là đạo hàm yếu(suy rộng) của hàm véc tơ y ∈ L1(a, b), nếu nó là hàm sinh của hàm suyrộng cho bởi đạo hàm suy rộng Y˙y ≡ dYy
dt ∈ D∗(a, b) của Yy ∈ D∗(a, b).Chú ý 1.1.6 Từ (1.1.29) ta nhận thấy rằng việc xác định đạo hàm suy rộng
˙
2 Để đơn giản, sau đây ta sẽ gọi các hàm véc tơ là hàm, các hàm suy rộng véc tơ là hàm suy rộng
Trang 23đạo hàm Y˙ được hiểu theo nghĩa thông thường (hoặc suy rộng) và Y gọi
là nghiệm của phương trình vi phân (1.1.30)
- Nếu G = G(t) ∈ Rn (a < t < b) là hàm thường và đạo hàm Y = ˙˙ Y (t) ∈
Rn (a < t < b) được hiểu theo nghĩa thông thường, thì (1.1.30) có dạng:
˙
và ta gọi nó là phương trình vi phân thường NghiệmY (t) ∈ Rn(a < t < b)
của nó gọi là nghiệm thông thường (hay cổ điển)
- Nếu G = Gg ∈ D∗(a, b) là hàm suy rộng và đạo hàm Y = ˙˙ Yy ∈ D∗(a, b)
được hiểu theo nghĩa suy rộng (với y, g ∈ L1(a, b)), thì (1.1.30) có dạng:
˙
Yy D∗(a,b)= Gg ⇔ ˙Yy(ϕ) = Gg(ϕ) (∀ϕ ∈ D(a, b)), (1.1.32)
và ta gọi nó là phương trình vi phân suy rộng Nghiệm Y = Yy ∈ D∗(a, b)
của nó gọi là nghiệm suy rộng
- Nếu G = Gg ∈ D∗(a, b) là hàm suy rộng và đạo hàm Y = ˙˙ Yy ∈ D∗(a, b)
được hiểu theo nghĩa suy rộng (với y, g ∈ L1(a, b)), thì từ Chú ý 1.1.6 ta
Định lý 1.1.6 ([36], Định lý IV.4.1) Phương trình vi phân suy rộng:
˙
Yy D∗(a,b)= 0 ∈ D∗(a, b) (1.1.34)chỉ có nghiệm Yy ∈ D∗(a, b) với hàm sinh y ∈ L1(a, b) là hàm hằng:
Trang 24Định lý 1.1.7 ([36], Định lý IV.4.2) Với mỗi hàm suy rộng Gg ∈ D∗(a, b),phương trình vi phân suy rộng (1.1.32) có nghiệm suy rộng Yy ∈ D∗(a, b).Định lý 1.1.8 ([25], Mục 5.9) Nếu g ∈ C(a, b)vày(t) ∈ Rn (a < t < b)lànghiệm của phương trình vi phân với đạo hàm yếu (1.1.33) thìy ∈ C1(a, b).Khi xét phương trình vi phân (1.1.33) trên [to, T ] ⊂ (a, b):
(1.1.35)
với ˙y ∈ L1(a, b)là đạo hàm yếu củay ∈ L1(a, b), ta có thể dựa vào Định lý1.1.8 để dùng phương pháp tích phân phương trình vi phân chuyển (1.1.35)
về phương trình tích phân tương ứng, như dưới đây:
Hệ quả 1.1.1 Nếu hàm hợp g(t) := g t, y(t)
là nghiệm của phương trình tích phân (1.1.37), với tích phân hiểu theonghĩa Lebesgue
Ngược lại, nếu y(t) ∈ Rn (t ∈ [to, T ]) là nghiệm của phương trình tíchphân (1.1.37) thì từ (1.1.5) ta suy ra:
Trang 25Khi đó, từ (1.1.36) ta thu đượcy ∈ C1(a, b) Ngoài ra, từ (1.1.37) ta còn có
y(to) = yo Kết hợp điều này với (1.1.38) ta suy ra nghiệm y(t) ∈ Rn (t ∈[to, T ]) nói trên của (1.1.37) cũng là nghiệm của phương trình vi phân(1.1.35), trong đó do y ∈ C1(a, b) nên từ (1.1.28) và Định nghĩa 1.1.8 ta
có thể xem đạo hàm thông thường ˙y(t) trong (1.1.38) như 1 dạng đặc biệtcủa đạo hàm yếu trong (1.1.35)
1.1.3 Bất đẳng thức Gronwall
Khi ước lượng miền biến thiên của nghiệm y(t) ∈ Rn phương trìnhtích phân (1.1.37) hoặc khoảng cách ky(t) − y(t0)k của nghiệm này tại cácthời điểm t và t’, trong luận án chúng tôi thường sử dụng bất đẳng thứcGronwall, cho bởi mệnh đề dưới đây:
Định lý 1.1.9 [29] (Phụ lục A) Giả sử m(t) là hàm liên tục, g(t) ≥ 0
là hàm khả tích, h(t) ≥ 0 là hàm giới nội trên [s, T ], sao cho:
Trang 261.2 Phương pháp số giải bài toán điều khiển tối ưu
1.2.1 Bài toán điều khiển tối ưu suy rộng
Giả sử U là 1 lớp hàm nào đó xác định trên [to, T ] ⊂ R1 và nhận giátrị trong U ⊂ Rm (chẳng hạn, lớp các hàm liên tục từng khúc, tuyến tínhtừng khúc, khả tích ):
trong đó (1.2.5) là phương trình vi phân với đạo hàm yếu (suy rộng) và
y(·) ≡ y(·; u) ∈ L1(to, T ) là nghiệm yếu của phương trình này ứng với
ứng, ta có thể đưa ra khái niệm sau:
Định nghĩa 1.2.1 Bài toán ĐKTƯ (1.2.4)-(1.2.6) được gọi là bài toánĐKTƯ suy rộng với lớp hàm điều khiển U và hàm mục tiêu J, trong đó:
- Hàm u ∈ U gọi là biến điều khiển, u(t) ∈ U gọi là điều khiển vào thờiđiểm t ∈ [to, T ];
- Phương trình (1.2.5) gọi là hệ động lực (hay phương trình trạng thái);
Trang 27- Hệ động lực gọi là điều khiển được bởi lớp hàm U, nếu phương trình viphân (1.2.5) có nghiệm duy nhất với mỗi biến điều khiển u ∈ U.
- Nếu có tính điều khiển được nói trên của hệ động lực, thì nghiệm yếu
y(·) ≡ y(·, u) ∈ L1(to, T ) của phương trình vi phân này được xác định duynhất với mỗi biến điều khiển u ∈ U và nó được gọi là biến trạng thái ứngvới biến điều khiển u Khi đó y(t, u) ∈ Rn gọi là trạng thái vào thời điểm
t ∈ [to, T ] của điều khiển u ∈ U;
- Lớp Uo ⊂ U gọi là tập hợp các điều khiển chấp nhận được (CNĐ), nếu:
(1.2.4) Nếu V (t) ≡ Rn × U (∀t ∈ [to, T ]), thì điều kiện (1.2.6) được thỏa mãn 1cách hiển nhiên và bài toán (1.2.4)-(1.2.6) gọi là không có (điều kiện) ràngbuộc, với Uo = U
- Nếu V (t) = Y(t) × U (∀t ∈ [to, T ]), thì điều kiện (1.2.6) có dạng:
và bài toán (1.2.4)-(1.2.6) gọi là có (điều kiện) ràng buộc trạng thái
- Nếu V (t) = Rn × U (∀t ∈ [to, T )), thì điều kiện (1.2.6) có dạng:
thì từ Định lý 1.1.8 và tính điều khiển được của hệ động lực (1.2.5) ta suy
ra phương trình này là phương trình vi phân thường và bài toán ĐKTƯ
Trang 28suy rộng (1.2.4)-(1.2.6) trở thành bài toán ĐKTƯ thông thường [21], [29].Nghĩa là các bài toán ĐKTƯ quen biết (thông thường) chỉ là 1 trường hợpriêng của bài toán ĐKTƯ suy rộng (trong Định nghĩa 1.2.1).
Với ý nghĩa trên, khi gọi tên các bài toán ĐKTƯ trong chương này, taphân thành 2 loại: suy rộng và thông thường, để phân biệt phương trình viphân tương ứng Tuy nhiên, sự phân biệt này là không cần thiết trong cácchương sau của Luận án Chẳng hạn, bài toán ĐKTƯ suy rộng ở Chương 2
và bài toán ĐKTƯ thông thường ở Chương 3 đều gọi là "bài toán ĐKTƯ".Tương tự như trong trường hợp thông thường [29] (Chương II, Mục 4),
ta cũng xét 3 loại bài toán ĐKTƯ suy rộng quan trọng dưới đây:
Định nghĩa 1.2.3 Bài toán ĐKTƯ suy rộng (1.2.4)-(1.2.6) được gọi là :
- Bài toán Mayer suy rộng, nếu hàm mục tiêu có dạng:
Chú ý 1.2.2 Tương tự như trong trường hợp thông thường [29] (Chương
II, Mục 4), ta có thể chỉ ra rằng: Các bài toán Lagrange và Bolza suy rộngđều có thể chuyển về bài toán Mayer suy rộng Bởi vậy, sau đây ta chỉ cầnnghiên cứu bài toán này
1.2.2 Giải số bài toán Mayer không có ràng buộc thông thường
Xét bài toán Mayer không có ràng buộc thông thường:
J(u) := fo y(T, u)
→ inf, u ∈ U = u : [to, T ] → U ⊂ Rm (1.2.14)
Trang 29˙y(t) = g t, y(t), u(t)
∈ Rn (to < t ≤ T ), y(to) = yo ∈ Rn (1.2.15)
với fo : Rn → R1 và đạo hàm ˙y(t) hiểu theo nghĩa thông thường, U là lớphàm liên tục từng khúc với U là tập compac Khi giải số bài toán này, tarời rạc hóa nó bằng cách xây dựng phân hoạch {ti}Ni=o ⊂ [to, T ]:
o , U ∗ , , U ∗
N −1 ),trong đó ta gọi: y∗(t) := y(t, u∗) (t ∈ [to, T ]) là quỹ đạo tối ưu (TƯ) ,
u∗(t), y∗(t)
(t ∈ [to, T ]) là nghiệm TƯ của bài toán liên tục; và Yi∗ :=
Yi(U∗) N −1
i=0 là quỹ đạo TƯ ,(Ui−1∗ , Yi∗) N
i=1 là nghiệm TƯ của bài toán rờirạc Khi đó từ nghiệm TƯ của bài toán Mayer rời rạc ta thiết lập nghiệmxấp xỉ TƯ uˆN(t), ˆyN(t)
(t ∈ [to, T ]) của bài toán Mayer liên tục, dạng:
ˆ
uN(t) := Ui∗ (ti ≤ t < ti+1 , i = 0 ÷ N − 1), (1.2.18)ˆ
yN(t) := Yi∗+(t−ti)g(ti, Yi∗, Ui∗) (ti ≤ t < ti+1 , i = 0÷N −1) (1.2.19)
Liên quan đến điều kiện hội tụ của điều khiển xấp xỉ TƯ, ta giả thiết rằng:
(A) - Bài toán Mayer liên tục tồn tại ĐKTƯ
(B) - Bài toán Mayer rời rạc tương ứng tồn tại ĐKTƯ
(C) - Hàm g : [to, T ] × Rn × U → Rn thỏa mãn điều kiện Lipschitz:
kg(t0, y0, u0) − g(t”, y”, u”)k ≤ Lt|t0 − t”| + Lyky0 − y”k + Luku0 − u”k
(∀t0, t” ∈ [to, T ], y0, y” ∈ Rn, u0, u” ∈ U) (1.2.20)
(D) - Hàm fo : Rn → R1 thỏa mãn điều kiện Lipschitz:
|fo(y0) − fo(y”)| ≤ Loyky0 − y”k (∀y0, y” ∈ Rn) (1.2.21)
Trang 30Chú ý 1.2.1 Nếu lớp hàm điều khiển U trong (1.2.1) là liên tục từngkhúc, thì từ giả thiết (C) và Định lý 1.1.4 dễ dàng suy ra tính điều khiểnđược của hệ động lực (1.2.15) bởi lớp hàm U nói trên.
Sự hội tụ (khi N → ∞) của điều khiển xấp xỉ TƯ uˆN(t) về ĐKTƯ u∗(t)
trong bài toán Mayer (1.2.14)-(1.2.15) được chỉ ra trong mệnh đề sau:Định lý 1.2.1 [27] (tr.13-17) Nếu các điều kiện (A) −(D) được thỏa mãn
và nếu lớp hàm điều khiển U là liên tục từng khúc, thì dãy điều khiển xấp
xỉ TƯ uˆN(t)
toán Mayer không có ràng buộc thông thường:
lim
Cần chú ý rằng: Khi sử dụng định lý trên để giải số bài toán (1.2.15), ta gập phải khó khăn về sự kiểm tra các giả thiết (A), (B) vàviệc giải số bài toán Mayer rời rạc tương ứng (bằng các phương pháp củaquy hoạch lồi) Bởi lý do đó mà theo các phương pháp kinh điển, người tathường xét bài toán Mayer lồi không có ràng buộc:
(1.2.14)-J(u) := fo y(T, u)
˙y(t) = y(t)F (t) + u(t)G(t) + g(t) (to < t ≤ T ), y(to) = yo ∈ Rn (1.2.24)
với đạo hàm ˙y(t) hiểu theo nghĩa thông thường và giả thiết rằng:
bài toán này thì cần và đủ là (∀t ∈ [to, T ]):
H y∗(t), u∗(t), p(t), t
= max
v∈U H y∗(t), v, p(t), t
Trang 31trong đó "biến liên hợp" p(t) với quỹ đạo TƯ y∗(t) (to ≤ t ≤ T ) được xác
định từ nghiệm của phương trình vi phân:
− ˙p(t) = p(t)FT(t) (to ≤ t < T ) , p(T ) = − ˙fo y∗(T )
; (1.2.26)Còn "hàm Hamilton" H : Rn× Rm× Rn × [to, T ] → R1 có dạng:
H y, v, q, t
:= q , yF (t) + vG(t) + g(t)
(1.2.27)(∀y ∈ Rn, v ∈ Rm, q ∈ Rn, t ∈ [to, T ])
Từ (1.2.16)-(1.2.17) ta nhận thấy rằng: Bài toán Mayer lồi rời rạc không
có ràng buộc ứng với bài toán Mayer lồi (1.2.23)-(1.2.24) có dạng:
có thể dùng các phương pháp của quy hoạch lồi để xác định nghiệm TƯcủa bài toán Mayer rời rạc (1.2.28)-(1.2.29) và do đó thiết lập được (theo(1.2.18)-(1.2.19)) nghiệm xấp xỉ TƯ của bài toán này Đây là nội dung củacác phương pháp trực tiếp giải bằng số bài toán Mayer lồi không có ràngbuộc (1.2.23)-(1.2.24)
Nhằm phân rã bài toán quy hoạch lồi nói trên thành N bài toán quyhoạch có kích thước nhỏ hơn ( mỗi bài toán này gọi là một bài toán cơbản), ta có thể dùng phương pháp đối ngẫu của quy hoạch toán học (thôngqua việc xây dựng hàm Lagrange tương ứng) để xây dựng nguyên lý cựcđại rời rạc và phát biểu các bài toán cơ bản đó [27] (tr.67-68), như là sựrời rạc hóa của Định lý 1.2.2 Đây là nội dung của các phương pháp giántiếp giải bằng số bài toán Mayer lồi không có ràng buộc (1.2.23)-(1.2.24)
Trang 321.2.3 Giải số bài toán Mayer có ràng buộc trạng thái cuối thông thường
Khi giải số bài toán Mayer có ràng buộc trạng thái cuối thông thường:
i=o ⊂ [to, T ], ta thiết lập bài toán Mayer rời rạc
có ràng buộc trạng thái cuối tương ứng, dưới dạng:
là nghiệm TƯ của nó
Tương tự, gắn với giả thiết (B)đối với bài toán rời rạc (1.2.33)-(1.2.35),
ta gọi U∗ = (Uo∗, U1∗, , UN −1∗ ) là ĐKTƯ, Yi∗ := Yi(U∗) N −1
i=0 là quỹ đạo
TƯ và (Ui−1∗ , Yi∗) N
i=1 là nghiệm TƯ của bài toán này Khi đó từ nghiệm
TƯ của bài toán Mayer rời rạc ta cũng có thể thiết lập nghiệm xấp xỉ TƯ
(∀y0, y” ∈ Rn, t ∈ [to, T ], u ∈ U)
(D∗) - Các hàm fj : Rn → R1 (j = 0 ÷ k) liên tục và tồn tại dãy
Trang 33trong đó S(T ) là bao đóng của S(T ) ⊂ Rn.
Chú ý 1.2.2 Do lớp hàm U là liên tục từng khúc nên từ giả thiết (C∗) ta
có thể mở rộng Định lý 1.1.4 đẻ suy ra tính điều khiển được của hệ độnglực (1.2.31) bởi lớp hàm U
Sự hội tụ (khi N → ∞) của điều khiển xấp xỉ TƯ uˆN(t) về ĐKTƯ u∗(t)
của bài toán Mayer (1.2.30)-(1.2.32) được chỉ ra trong mệnh đề sau:
Định lý 1.2.2 [27] (tr.30-33) Nếu các điều kiện (A), (B), (C∗), (D∗) đượcthỏa mãn và nếu lớp hàm điều khiển U là liên tục từng khúc, thì dãy điềukhiển xấp xỉ TƯ uˆN(t)
N⊂ U trong (1.2.18) hội tụ theo mục tiêu về
ĐKTƯ u∗(t) của bài toán Mayer có ràng buộc trạng thái cuối (1.2.32) thông thường:
(1.2.30)-lim
Nhằm sử dụng công cụ của lý thuyết quy hoạch lồi để kiểm tra giả thiết
(A) đối với bài toán liên tục (1.2.30)-(1.2.32); giả thiết(B)đối với bài toánrời rạc (1.2.33)-(1.2.35) và giải số bài toán này, người ta cũng xét bài toánMayer lồi có ràng buộc trạng thái cuối:
Trang 34- Tồn tại điều khiển CNĐ u ∈ Uo, sao cho:
fj y(T, u)
Tương tự như trường hợp bài toán (1.2.23)-(1.2.24), ta thấy rằng: Giảthiết (A) của bài toán (1.2.39)-(1.2.42) cũng được kiểm tra bởi Nguyên lýcực đại tương ứng (xem [21] tr.256-258) và dạng rời rạc của bài toán bàitoán Mayer lồi (1.2.39)-(1.2.41) là:
Ta cũng có thể dùng phương pháp gián tiếp để phân rã bài toán quyhoạch lồi nói trên thành các bài toán cơ bản, thông qua nguyên lý cực đạirời rạc [27] (tr.67-68) đối với bài toán Mayer lồi rời rạc có ràng buộc trạngthái cuối (1.2.43)-(1.2.45)
x(i) = (x(i)1 , · · · , x(i)n ) ∈ Rn (i = 1 ÷ N), (1.3.2)
Trang 35Từ chú ý trên đây ta có thể đặt bài toán (1.3.5) dưới dạng bài toán quyhoạch lồi [40] (tr 24-27) và giải nó (khi Θ = Rm) theo phương pháp sau:Định lý 1.3.1 [39] Nếu hàm L : Rm → R1 (trong (1.3.5)) khả vi đến cấp
2 với ma trận L”(θ) các đạo hàm cấp 2 là xác định âm 3
thì ƯLHLCĐ θˆ của véc tơ tham số θ trong hàm mật độ (1.3.1) là nghiệm
θ = ˆθ của hệ m phương trình sau:
∂L(θ)
Với những giả thiết của Định lý 1.3.1, hệ phương trình phi tuyến (1.3.7)gọi là phương trình hợp lý Nghiệm θ = ˆˆ θ(x(1), · · · , x(N )) của phương trìnhnày là một "ƯL thống kê" của các tham số θ, theo nghĩa sau:
Định nghĩa 1.3.2 ([28] Mục 1.2) Mỗi hàm θ = ee θ(x(1), · · · , x(N )) của các
3
Nghĩa là L(θ) (θ ∈ R m ) là 1 hàm lõm trên R m
Trang 36kết quả quan sát (1.3.1) được gọi là một ƯL thống kê của các tham số θ.
- Mỗi ƯL thống kê θecủa θ gọi là một ƯL không chệch (KC) của θ, nếu:
- Mỗi ƯLKC θ∗ của θ gọi là một ƯL hiệu dụng (cực tiểu phương sai), nếu:
D{eθ} − D{θ∗} 0 −ma trận xác định không âm (∀eθ : E{eθ} = θ),với:
D{eθ} := E eθ− θT θ − θe , D{θ∗} := E θ∗ − θT θ∗ − θ (1.3.9)Những đặc điểm thống kê của ƯLHLCĐ θ = ˆˆ θ(x(1), · · · , x(N )) cho bởimệnh đề sau:
Định lý 1.3.2 [37] (tr.491-492) ƯLHLCĐ θˆ của véc tơ tham số θ trongĐịnh lý 1.3.1 cũng là ƯL hiệu dụng của véc tơ tham số này
1.3.2 Mô hình dò tìm ngẫu nhiên
Xét bài toán quy hoạch đo được gắn với không gian độ đo (D, Σ, µ):
Σ là σ-đại số các phân tập nào đó của D, µ là một độ đo xác định trên Σ,
f là hàm Σ-đo được trên D, với giả thiết rằng:
và bài toán (1.3.10) tồn tại ít nhất một lời giải (tối ưu) x∗ ∈ D trong tập
D các lời giải chấp nhận được (CNĐ), sao cho hàm mục tiêu f đạt giá trịnhỏ nhất (toàn cục): f (x∗) ≤ f(x) (∀x ∈ D) Để giải bài toán (1.3.10)
ngẫu nhiên (DTNN) đơn giản {xn}n≥1 ⊂ D theo công thức lặp:
Trang 37f là đo được trên không gian độ đo (D, Σ, µ) và bài toán (1.3.7) có lời giải
x∗ ∈ D ⊂ Rm, thì ta có công thức đánh giá sai số tương đối µN (của xấp
xỉ N trong dãy DTNN đơn giản {xn}n≥1) như sau:
Trang 38Chú ý 1.3.1 NếuD là tập compac trong Rn và hàm mục tiêu f (x) (x ∈ D)
liên tục, thì D là 1 tập Borel trong Rn, Σ = B(D) là σ-đại số các tập Boreltrong D ([11] tr.125), µ = λ là độ đo Lebesgue trong Rn ([11] tr.145-146),
f là hàm đo được (Borel đo được) trên D ([36], Định lý V.4.1) Khi đó bàitoán quy hoạch (1.3.10) gắn với không gian độ đo (D, B(D), λ) gọi là "Bàitoán quy hoạch liên tục" và bài toán này luôn có giá trị cực tiểu f∗ không
sự tồn tại của 1 miền hữu hạnD ⊃ D Chẳng hạn, D là hình hộp m-chiều:
Trang 39Chương 2
Thuật toán Monte Carlo giải 1 loại bài toán Mayer suy rộng không lồi
Giới thiệu vấn đềTrong Chương 1 (Mục 1.2.2) ta đã xét bài toán Mayer thông thường(không có ràng buộc) dưới dạng (1.2.14)-(1.2.15), với đạo hàm hiểu theonghĩa thông thường Quy trình giải số bài toán này bắt đầu từ việc rời rạchóa nó thành bài toán Mayer rời rạc (1.2.16)-(1.2.17) tương ứng Gắn vớicác giả thiết (A), (B) (về sự tồn tại ĐKTƯ của mỗi bài toán Mayer liêntục và rời rạc) và các giả thiết(C), (D) (về sự thỏa mãn điều kiện Lipschitzcủa hàm mục tiêu và hàm trong vế phải của hệ động lực), ta có thể dựavào ĐKTƯ của bài toán rời rạc để thiết lập dãy "điều khiển xấp xỉ TƯ"
và chỉ ra (trong Định lý 1.2.1) sự hội tụ (theo mục tiêu) của dãy này vềĐKTƯ của bài toán liên tục
Trong trường hợp bài toán (1.2.14)-(1.2.15) suy biến thành dạng đặcbiệt của bài toán Mayer lồi (1.2.23)-(1.2.24), ta có thể dùng các phươngpháp nêu ở cuối Mục 1.2.2 để giải số bài toán này (qua việc sử dụng cácphương pháp trực tiếp hoặc gián tiếp giải bài toán rời rạc tương ứng).Tuy nhiên, nếu bài toán (1.2.14)-(1.2.15) ở dạng tổng quát như đã phátbiểu (không có tính lồi) thì nhiều thách thức được đặt ra đối với việc giải
số bài toán này Vì rằng, các công cụ của quy hoạch lồi không còn hiệu lực
Trang 40để giải các bài toán quy hoạch trong dạng bài toán ĐKTƯ rời rạc (1.2.17) Bởi vậy, các phương pháp heuristic vẫn là công cụ chủ yếu màcho đến những năm gần đây nhiều tác giả nước ngoài, như: G Zhao, M.Davison [47] (2009), Y Kyung, J Kim, S Jung and K Eom [38] (2010),
(1.2.16)-V Sharmaa, R Jhab and R Naresha [44] (2007) còn sử dụng để giải sốbài toán ĐKTƯ rời rạc Các công cụ quy hoạch tất định như của T D.Quoc, C Savorgnan and M Diehl [41] (2009) và T.D Quoc and M Diehl[42] (2010), cũng tham gia giải quyết bài toán này, nhưng lại hạn chế lờigiải tìm được chỉ là tối ưu (cực trị) địa phương
Bước đầu khắc phục những hạn chế nói trên, các tác giả như: T Cảnh,T.Đ Quỳ [4] (2005), T Cảnh, M.V Được, T.Đ Quỳ [5] (2008), W Jiekang,
Z Jianquan, C Goutong, Z Hongliang [33] (2008) đã sử dụng PPMC kếthợp với các phương pháp trực tiếp và gián tiếp của ĐKTƯ hoặc với phươngpháp lai (Hybrid method) để tiếp cận với lời giải tối ưu toàn cục, nhưng chỉcủa một số lớp bài toán ĐKTƯ rời rạc Vấn đề hội tụ của các lời giải này
về lời giải của bài toán ĐKTƯ trong mô hình liên tục tương ứng còn chưađược đặt ra trong các công trình đã nêu Ngoài ra, khi sử dụng PPMC đểgiải trực tiếp bài toán ĐKTƯ một số tác giả như N.Q Hỷ, M.V Được [14](2009), M.V Được, N.Q Hỷ [9] (2009) còn dựa vào cấu trúc đặc biệt củabài toán để thiết lập bài toán quy hoạch không lồi tương ứng (gọi là bàitoán quy hoạch đo được - QHĐĐ) hoặc thông qua việc tham số hóa biếnđiều khiển để thiết lập gần đúng bài toán QHĐĐ Trên cơ sở này sử dụngcác mô hình DTNN tổng quát và hỗn hợp [13] (tr.293-309) của PPMC đểtiếp cận với lời giải tối ưu toàn cục của bài toán ĐKTƯ
Nhằm phát triển và mở rộng những nghiên cứu trên đây, trong chươngnày chúng tôi xét việc giải số cho dạng mở rộng của bài toán Mayer thôngthường (1.2.14)-(1.2.15) là Bài toán Mayer suy rộng không có ràng buộc,trong đó hệ động lực phi tuyến gồm cả PTVP suy rộng và đạo hàm riêngsuy rộng (các đạo hàm hiểu theo nghĩa suy rộng), hàm mục tiêu không cótính lồi Do bài toán được xét không có tính lồi nên cần sử dụng các công
... (1.2.23)-(1.2.24), ta dùng phươngpháp nêu cuối Mục 1.2.2 để giải số toán (qua việc sử dụng cácphương pháp trực tiếp gián tiếp giải toán rời rạc tương ứng).Tuy nhiên, toán (1.2.14)-(1.2.15) dạng tổng qt phátbiểu... sử dụng PPMC kếthợp với phương pháp trực tiếp gián tiếp ĐKTƯ với phươngpháp lai (Hybrid method) để tiếp cận với lời giải tối ưu toàn cục, chỉcủa số lớp toán ĐKTƯ rời rạc Vấn đề hội tụ lời giải. .. class="page_container" data-page="26">1.2 Phương pháp số giải toán điều khiển tối ưu
1.2.1 Bài toán điều khiển tối ưu suy rộng
Giả sử U lớp hàm xác định [to,