12 2 NGHIỆM VISCOSITY CỦA BÀI TOÁN ĐIỀU KHIỂN VỚI THỜI GIAN THOÁT RA 15 2.1 Bài toán điều khiển tối ưu với thời gian thoát ra.. Bài toán điều khiển tối ưu đặt ra là tìm điều khiển chấp n
Trang 1ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC SƯ PHẠM
LÊ THỊ HƯƠNG
NGHIỆM VISCOSITY CỦA BÀI TOÁN ĐIỀU
KHIỂN VỚI THỜI GIAN THOÁT RA
Chuyên ngành: TOÁN GIẢI TÍCH
Mã số: 60460102
LUẬN VĂN THẠC SĨ TOÁN HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS NGUYỄN HOÀNG
Thừa Thiên Huế, năm 2016
Trang 2LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứucủa riêng tôi, các số liệu và kết quả nghiêncứu ghi trong Luận văn là trung thực Tôihoàn toàn chịu trách nhiệm trước khoa và nhàtrường về sự cam đoan này
Lê Thị Hương
Trang 3LỜI CẢM ƠN
Lời đầu, xin gửi đến PGS.TS Nguyễn Hoàng lời cảm ơn sâu sắc về sự tậntình giúp đỡ của thầy đối với tôi trong suốt quá trình Thầy giảng dạy tại lớpCao học K23 và nhất là trong quá trình tôi hoàn thành Luận văn này
Tôi cũng xin chân thành cảm ơn tất cả quý thầy, cô khoa Toán của TrườngĐại học Sư phạm Huế đã tận tình giảng dạy và truyền đạt những kiến thức bổích trong suốt khóa học tại Trường Đại học Sư phạm Huế
Chân thành cảm ơn các Anh, Chị học viên Cao học khóa 23, đặc biệt là cácAnh, Chị chuyên ngành Toán Giải Tích và cũng như tất cả bạn bè của tôi đãluôn hỗ trợ tôi suốt quá trình tôi học tập
Cuối cùng tôi xin cảm ơn Bố, Mẹ và toàn thể gia đình tôi, những người đãđộng viên tôi rất nhiều và cũng là động lực giúp tôi hoàn thành Luận văn này.Mặc dù đã cố gắng hết sức nhưng Luận văn sẽ không tránh khỏi những thiếusót Tôi rất mong các thầy cô giáo cùng các bạn đánh giá, góp ý để Luận vănđược hoàn chỉnh hơn
Lê Thị Hương
Trang 4Mục lục
1.1 Tập lồi, hàm nửa lồi, hàm nửa lõm 6
1.2 Phương trình vi phân thường 9
1.3 Nghiệm viscosity của phương trình Hamilton-Jacobi 10
1.4 Bài toán điều khiển tối ưu 12
2 NGHIỆM VISCOSITY CỦA BÀI TOÁN ĐIỀU KHIỂN VỚI THỜI GIAN THOÁT RA 15 2.1 Bài toán điều khiển tối ưu với thời gian thoát ra 15
2.2 Tính liên tục Lipschitz và tính nửa lõm của hàm giá 26
2.3 Tính nửa lồi của hàm thời gian tối tiểu T trên hệ điều khiển tuyến tính 47
2.4 Điều kiện tối ưu 52
Kết luận 65 Tài liệu tham khảo 66
Trang 5BẢNG CÁC KÝ HIỆU
Ký hiệu Ý nghĩa ký hiệu
Rn Không gian vector thực n-chiều
Ω Miền mở trong không gian Rn
Rn×n Tập hợp các ma trận vuông thực cấp n
C(Ω) Không gian các hàm liên tục trên Ω
C1(Ω) Không gian các hàm khả vi liên tục trên Ω
C1,1(Ω) Không gian các hàm khả vi liên tục
và có đạo hàm riêng liên tục Lipschitz trên Ω
Cloc1,1(Ω) Không gian các hàm khả vi liên tục, có đạo hàm
riêng liên tục Lipschiz địa phương trên Ω.SCLloc(Ω) Không gian các hàm nửa lõm
với modun tuyến tính địa phương trên Ω
L1(Ω) Không gian các hàm thực đo được trên Ω
sao cho |f |khả tích theo nghĩa Lebesgue
L1loc(Ω) Không gian các hàm thực đo được trên Ω
sao cho |f |khả tích địa phương theo nghĩa Lebesgue
∂K Biên của tập hợp K
Lx Đạo hàm riêng của hàm L theo biến x
∇u Gradient của hàm u theo biến x
Br(x) hoặc B(x, r) Hình cầu mở tâm x bán kính r
x.y hoặc < x, y > Tích vô hướng trong Rn
[x, y] Đoạn thẳng nối hai điểm x và y với mọi x, y ∈Rn
|x| Chuẩn Euclid trong Rn
||x||∞ Chuẩn maximum trong Rn
Trang 6MỞ ĐẦU
Lý thuyết điều khiển tối ưu xuất hiện từ những năm 50 của thế kỷ 20với một loạt công trình tiêu biểu của các nhà toán học Xô viết đứng đầu làL.C P ontryagin về nguyên lý cực đại để tìm điều kiện cần các quá trình tối ưu
Lý thuyết này được phát triển từ những bài toán tối ưu hóa cổ điển như bàitoán biến phân, bài toán quy hoạch động Bài toán điều khiển tối ưu là bài toántìm các quá trình tối ưu cho các hệ điều khiển mô tả bởi các phương trình toánhọc, có thể bắt nguồn từ việc sử dụng nguyên lý cực đại Pontryagin (điều kiệncần) hoặc bằng cách giải phương trình Hamilton-Jacobi-Bellman (điều kiện đủ)
Ta có thể mô tả bài toán điều khiển tối ưu một cách giải tích như sau Xét
I × X × U → X là hàm mô tả quá trình chuyển động của trạng thái Phiếm hàmmục tiêu được định nghĩa bởi
J (u) =
Z
I
f0(t, y, u)dt,
trong đó f0(t, y, u) : I × X × U → R là hàm cho trước Bài toán điều khiển tối
ưu đặt ra là tìm điều khiển chấp nhận được u∗(t) ∈ U sao cho cùng với quỹ đạotương ứng y∗(t) của hệ điều khiển, phiếm hàm mục tiêu sẽ đạt cực tiểu tại điềukhiểnu∗(t) Điều khiểnu∗(t)sẽ được gọi là điều khiển tối ưu cho bài toán tối ưu,cặp (u∗(t), y∗(t)) gọi là quá trình tối ưu của hệ điều khiển Người ta phân loạibài toán điều khiển tối ưu theo cấu trúc của hàm mục tiêu Nếu hàm mục tiêu
có dạng như trên thì ta có bài toán điều khiển tối ưu Lagrange Nếu hàm mụctiêu có dạng
J (u) = g(T, y(T )),trong đó T là thời gian cuối cố định trước của thì ta có bài toán điều khiển tối
ưu Mayer Còn nếu hàm mục tiêu có dạng
J (u) =
Z
I
f0(t, y, u)dt + g(T, y(T )),
Trang 7thì ta có bài toán điều khiển tối ưu Bolza Lagrange, Bolza, Mayer là tên ba nhàtoán học đã có những nghiên cứu đầu tiên về bài toán tối ưu với các hàm mụctiêu đó.
Ta định nghĩa hàm giá của bài toán điều khiển tối ưu có dạng
u∈U −p.f (t, x, u), còn đối với bài toán Bolza thìH(x, p) = max
u∈U [−p.f (t, x, u) − f0(t, x, u)] Các định lý đã được chứng minh cho thấyrằng hàm giáV (t, x) là nghiệm viscosity của phương trình quy hoạch động tươngứng với mỗi bài toán điều khiển tối ưu cho trước Khái niệm nghiệm viscosityđược M.G Crandall và P.L Lions đưa ra vào những năm đầu của thập kỷ 80,
mở ra một hướng nghiên cứu hiệu quả trong việc nghiên cứu phương trình đạohàm riêng phi tuyến cấp 1, cấp 2, trong đó có phương trình Hamilton-Jacobi.Thay vì buộc nghiệm phải thỏa mãn phương trình và khả vi cấp k, các tác giảchỉ đòi hỏi nghiệm liên tục, thỏa mãn các bất đẳng thức vi phân thông qua hàmthử đủ trơn hoặc qua khái niệm trên vi phân, dưới vi phân
Bài toán điều khiển tối ưu với thời gian thoát ra là một dạng của bài toánđiều khiển tối ưu Bolza, trong đó thời gian cuối của hệ là không cố định mà phụthuộc vào mục tiêu được cho trước Một trường hợp đặc biệt của bài toán thờigian thoát ra là bài toán thời gian tối tiểu với mong muốn là cực tiểu hóa thờigian cuối để quá trình tối ưu đạt mục tiêu cho trước
Xuất phát từ những kiến thức tìm hiểu được, chúng tôi chọn đề tài:
"Nghiệm viscosity của bài toán điều khiển với thời gian thoát ra" đểnghiên cứu với hy vọng có thể hiểu sâu hơn một số kết quả trong lý thuyết củaphương trình đạo hàm riêng
Luận văn chia làm hai chương Trong chương 1, chúng tôi trình bày một
số kiến thức cơ bản của giải tích làm nền tảng cho các chứng minh ở chươngsau Trong chương 2, chúng tôi trình bày các kết quả của bài toán điều khiểntối ưu với thời gian thoát ra có cấu trúc như sau Mục 2.1 chúng tôi giới thiệu
về bài toán thời gian thoát ra và một số kết quả về sự tồn tại của điều khiển tối
Trang 8ưu Mục 2.2 chúng tôi xem xét hàm giá tương ứng của bài toán, chỉ ra rằng hàmgiá là liên tục Lipschitz địa phương và là hàm nửa lõm với modun tuyến tính.Mục 2.3 chúng tôi nghiên cứu một vài kết quả của hàm thời gian tối tiểu trên
hệ tuyến tính Và cuối cùng, mục 2.4 nghiên cứu điều kiện tối ưu của bài toánthời gian thoát ra, các kết quả của nguyên lý cực đại Pontryagin trong trườnghợp của mục tiêu trơn và dưới những giả thiết thích hợp, chúng tôi chỉ ra rằngquỹ đạo tối ưu là nghiệm của hệ Hamilton liên kết và tương ứng một-một vớireachable gradients của hàm giá
Mặc dù đã có nhiều cố gắng, song trong quá trình nghiên cứu và trìnhbày khó tránh khỏi các sai sót, mong quý độc giả góp ý thêm để Luận văn đượchoàn thiện hơn
Trang 9CHƯƠNG 1
MỘT SỐ KIẾN THỨC CƠ SỞ
Chương này có mục đích trình bày một số kiến thức về giải tích được sử dụng
ở chương sau, các nội dung được trích ra từ các tài liệu [2], [4], [6]
Định nghĩa 1.1.1 Cho A ⊂Rn,
(i) Tập A được gọi là tập lồi nếu với mọi x1, x2 ∈ A thì [x1, x2] ⊂ A Nói cáchkhác, A lồi nếu với mọi x1, x2 ∈ A và λ ∈ [0, 1] ta có λx + (1 − λ)y ∈ A.(ii) Bao lồi của một tập A, ký hiệu coA, là giao của tất cả các tập lồi chứa A
coA là một tập lồi và là tập lồi bé nhất chứa A
(iii) Tập A được gọi là nón nếu với mọi điểm a ∈ A và λ > 0 ta có λa ∈ A Nếuhơn nữa, A là tập lồi thì nó sẽ được gọi là nón lồi
(iv) Bao nón của một tập A, ký hiệu conA = {λa| λ > 0; a ∈ A} là giao của tất
Trang 10ρ→0 + ω(ρ) = 0 và
λu(x) + (1 − λ)u(y) − u(λx + (1 − λ)y) ≤ λ(1 − λ)|x − y|ω(|x − y|),với mọi cặp x, y ∈ A sao cho [x, y] ⊂ A và với mọi λ ∈ [0, 1], ω được gọi làmô-đun nửa lõm của u trên A
(ii) Cho hàm nửa lõm u : A → R với mô-đun nữa lõm ω, nếu ω(h) = C2h với
C ≥ 0thì hàm nửa lõm với mô-đun này được gọi là hàm nửa lõm với mô-đuntuyến tính, nghĩa là, tồn tại C ≥ 0 sao cho
λu(x) + (1 − λ)u(y) − u(λx + (1 − λ)y) ≤ Cλ(1 − λ)
2 |x − y|2,với mọi x, y ∈ A sao cho [x, y] ⊂ A với mọi λ ∈ [0, 1], C được gọi là hằng sốnửa lõm của u trên A
Hàm u được gọi là nửa lồi (nửa lồi với mô-đun tuyến tính) trên A nếu −u lànửa lõm (nửa lõm với mô-đun tuyến tính) Ký hiệu SC(A)là không gian của tất
cả các hàm nửa lõm trên A và SCL(A) là không gian của các hàm nửa lõm vớimô-đun tuyến tính trên A
Mệnh đề 1.1.3 Cho u : A →R với A ⊂Rn là tập lồi mở, và cho C ≥ 0, khi đócác tính chất sau là tương đương:
(i) u là nửa lõm với mô-đun tuyến tính trên A với hằng số nửa lõm C,
(ii) u thỏa mãn
u(x + h) + u(x − h) − 2u(x) ≤ C|h|2,với mọi x, h ∈Rn sao cho [x − h, x + h] ⊂ A
(iii) Hàm x → u(x) − C2|x|2 là lõm trên A
Định nghĩa 1.1.4 Tập A ⊂Rn được gọi là thỏa mãn điều kiện hình cầu trongvới r > 0 nếu A là hợp của các hình cầu đóng bán kính r, tức là, với mọi x ∈ Atồn tại y sao cho x ∈ Br(y) ⊂ A
Mệnh đề 1.1.5 Cho A ⊂ Rn là tập đóng, A 6= ∅, A 6=Rn Khi đó hàm khoảngcách dA(x) = min
y∈A |y − x|, ∀x ∈Rn thỏa mãn các tính chất sau đây:
(i) d2A ∈ SCL(Rn ) với hằng số nửa lõm 2
Trang 11(ii) dA ∈ SCLloc(Rn\ A) Chính xác hơn, cho tậpS (không cần thiết là compact)sao cho dist(S, A) > 0, dA là nửa lõm trên S với hằng số nửa lõm bằngdist(S, A)−1.
(iii) Nếu A thỏa mãn điều kiện hình cầu trong với r > 0 thì dA ∈ SCL(Rn \ A)với hằng số nửa lõm là r−1
(iv) dA không nửa lõm địa phương trên toàn bộ không gian Rn
Định nghĩa 1.1.6 Cho V ⊂Rn là tập lồi Nếu v ∈ V thì nón pháp tuyến của
Trang 12Hệ quả 1.1.11 Cho V ⊂ Rn là tập lồi có biên là mặt trơn (n − 1)-chiều Nếu
M ⊂Rn là tập lồi và σV(p) = 1 với mọi p ∈ M thì M là đơn tử
Cho Ω ⊂ Rn là tập mở và một hàm u : Ω → R Một điểm x ∈ Ω được gọi làđiểm kì dị của hàm u nếu u là không khả vi tại x Ký hiệu P
(u) là tập tất cảcác điểm kì dị trong Ω của hàm u được gọi là tập kì dị Ta gọi cung là một ánh
xạ liên tục x : [0, ρ] → Rn, ρ > 0 Cung x là cung kì dị của hàm u nếu giá của x
là chứa trong Ω và x(s) ∈P(u) với mọi s ∈ [0, ρ]
Định lý 1.1.12 Chox0 ∈ Ωlà một điểm kì dị của hàmu ∈ SCL(Ω) Giả sử rằng
∂D+u(x0) \ D∗u(x0) 6= ∅ Khi đó tồn tại một cung kì dị Lipschitz x : [0, ρ] → Rncủa u, với x(0) = x0 và một số dương δ sao cho
lim
s→0 +
x(s) − x 0
s 6= 0, diam(D+u(x(s))) ≥ δ, s ∈ [0, ρ].
Hơn nữa, x(s) 6= x0 với mọi s ∈ (0, ρ]
Cho tập mở Ω ⊂ R×Rn, I là một khoảng trong R và hàm F : Ω → Rn, xétphương trình vi phân thường
x0(t) = F (t, x(t)).
Giả sử phương trình thỏa mãn điều kiện sau
(C): Hàm x → F (t, x) là liên tục với mọit cố định và hàm t → F (t, x)là đo đượcvới mọi x cố định
Gọi x : I → Rn, x được gọi là nghiệm của phương trình vi phân thường nếu nóliên tục tuyệt đối và thỏa mãn
Giả sử ma trận jacobian F x tồn tại và liên tục hầu khắp theo x Xét (t 0 , x 0 ) ∈ Ω
và tập x(.) = x(., t ˜ 0, x0), I là khoảng compact mà x(t) ˜ được xác định Cho một
Trang 13v ∈Rn, gọi v(t) là nghiệm của bài toán Cauchy tuyến tính
v0(t) = Fx(t, ˜ x(t))v(t)với điều kiện đầu v(t0) = v Khi đó với mọi t ∈ I ta có
lim
ε→0
x(t, t0, x0+ εv) − ˜ x(t)
= 0,giới hạn này là đều với t ∈ I, |v| ≤ 1
Xét hệ phương trình vi phân tuyến tính có dạng
x0(t) = A(t)x(t), t ∈ I, (1)với A(t) là ma trận vuông cấp n × n đo được và bị chặn địa phương với t ∈ I
Hệ phương trình liên hợp liên kết với (1) được cho bởi
w0(t) = −AT(t)w(t), t ∈ I (2)với AT là ma trận chuyển vị của ma trận A Khi đó nghiệm của hai hệ phươngtrình thỏa mãn mối liên hệ
sở tiêu chuẩn của Rn
Trang 14Từ định nghĩa ta suy ra rằng, với mọi x ∈ Ω,
D−(−u)(x) = −D+u(x).
D−u(x) và D+u(x) là khác rỗng nếu và chỉ nếu u khả vi tại x, trong trường hợpnày ta có
D+u(x) = D−u(x) = {Du(x)}.
Cho Ω ⊂Rn và H ∈ C(Ω ×R×Rn) Xét phương trình đạo hàm riêng phituyến cấp 1 tuyến tính tổng quát như sau
H(x, u, Du) = 0, x ∈ Ω ⊂Rn (∗)Định nghĩa 1.3.2 Hàm u ∈ C(Ω) được gọi là một nghiệm dưới viscosity củaphương trình (∗) nếu với mọi x ∈ Ω thỏa mãn
Hơn nữa, với mọi (x, u) mà H(x, u, ) lồi chặt trong p thì u ∈ C1(Ω)
Định nghĩa 1.3.4 Cho u : Ω → R Lipschitz địa phương Vector p ∈ Rn đượcgọi là reachable gradient của u tạix ∈ Ω, nếu tồn tại một dãy {xk} ⊂ Ω \ {x}saocho u khả vi tại xk với mỗi k ∈ N và lim
k→∞ xk = x, lim
k→∞ Du(xk) = p Tập hợp tất
cả reachable gradients của u tại x ký hiệu là D∗u(x)
Mệnh đề 1.3.5 Cho u : Ω → R là hàm nửa lõm với mô-đun ω và x ∈ Ω Khi
đó các tính chất sau là đúng
(a) Nếu {xk} ⊂ Ω, xk → x và nếu pk ∈ D + u(xk), pk → p ∈Rn thì p ∈ D+u(x).(b) D∗u(x) ⊂ ∂D+u(x)
Trang 15(c) D+u(x) 6= ∅.
(d) Nếu D+u(x) là đơn tử thì u khả vi tại x
(e) Nếu D+u(y) là đơn tử với mọi y ∈ A thì u ∈ C1(Ω)
Định lý 1.3.6 Cho u : Ω →R là hàm nửa lõm Khi đó
D+u(x) = coD∗u(x), x ∈ Ω.
Do đó trên vi phân D+u(x) là khác rỗng với mọi x, hơn nữa u khả vi tại x nếu
và chỉ nếu D+u(x) là đơn tử
Hệ quả 1.3.7 Cho Ω ⊂Rn là tập lồi mở và u : Ω → R đồng thời vừa nửa lồi
và nửa lõm với mô-đun tuyến tính với hằng số C Khi đó u ∈ C1,1(Ω) và hằng sốLipschitz của Du là bằng C
Định nghĩa 1.4.1 Một hệ điều khiển bao gồm một cặp (f, U ) với U ⊂Rm làmột tập đóng và f : Rn× U → Rn là hàm liên tục Tập U được gọi là tập điềukhiển, hàm f được gọi là hàm động lực của hệ Phương trình trạng thái liên kếtvới hệ là:
y0(t) = f (y(t), u(t)), t ∈ [t0, +∞), y(t0) = x,
Trang 16với t0 ∈R, x ∈ Rn và u ∈ L1loc([t0, +∞), U ) Hàm u được gọi là điều khiển chiếnlược hay điều khiển Ký hiệu nghiệm của hệ là y(., t0, x, u) và ta gọi là quỹ đạocủa hệ tương ứng với điều kiện đầu y(t0) = x và điều khiển u.
Ta đưa ra một vài giả thiết cơ sở cho hệ điều khiển như sau:
(H0) Tập điều khiển U là compact
(H1) Tồn tạiK1 > 0 sao cho|f (x2, u) − f (x1, u)| ≤ K1|x2− x1|với mọi x1, x2 ∈Rn;
u ∈ U
(H2) fx tồn tại và liên tục Hơn nữa, tồn tại K2 > 0 sao cho ||fx(x2, u) −
f x (x 1 , u)|| ≤ K 2 |x 2 − x 1 |, với mọi x 1 , x 2 ∈Rn; u ∈ U
Bổ đề 1.4.2 Cho t 0 , t 1 với t 0 < t 1
(i) Cho f thỏa điều kiện(H0), (H1) Khi đó với mọi r > 0tồn tại R > 0 sao cho
|y(t, t0, x, u)| ≤ R, ∀t ∈ [t0, t1],với mọi điều khiển u : [t0, t1] → U và mọi x ∈ Br
(ii) Cho f thỏa mãn (H1) Khi đó tồn tại c > 0 sao cho
|y(t, t0, x0, u) − y(t, t0, x1, u)| ≤ c|x0− x1|, ∀t ∈ [t0, t1],với mọi u : [t 0 , t 1 ] → U và x 0 , x 1 ∈Rn
(iii) Nếu f thỏa mãn (H1), (H2) thì tồn tại hằng số c trong (ii) sao cho
...
là tập điều khiển Trong phần ta xét toán điều khiển tối ưutrong phiếm hàm mục tiêu cần cực tiểu hóa, xác định trênmột khoảng thời gian cố định mà phụ thuộc vào thời gian thoát τ... class="page_container" data-page="18">
CHƯƠNG 2
NGHIỆM VISCOSITY CỦA BÀI TOÁN ĐIỀU KHIỂN VỚI THỜI GIAN THOÁT RA< /h2>
Nội dung chương trích từ tài liệu tham khảo [6], 230 −... Hàm u gọi điều khiển chiếnlược hay điều khiển Ký hiệu nghiệm hệ y(., t0, x, u) ta gọi quỹ đạocủa hệ tương ứng với điều kiện đầu y(t0)