Trường Đại học Vinh ---dương thị nguyệt Dưới gradient của hàm giá trị trong bài toán điều khiển tối ưu chứa tham số luận văn thạc sĩ toán học NGHệ An - 2014... Trường Đại học Vinh ---dươ
Trang 1Trường Đại học Vinh
-dương thị nguyệt
Dưới gradient của hàm giá trị trong bài toán
điều khiển tối ưu chứa tham số
luận văn thạc sĩ toán học
NGHệ An - 2014
Trang 2Trường Đại học Vinh
-dương thị nguyệt
dưới gradient của hàm giá trị trong bài toán
điều khiển tối ưu chứa tham số
Trang 3Mục lục
1.1 Một số khái niệm và tính chất cơ sở 91.2 Dưới gradient của hàm giá trị trong bài toán quy hoạch toánhọc chứa tham số 11
Chương 2 Dưới gradient của hàm giá trị trong bài toán điều
2.1 Dưới gradient của hàm giá trị trong bài toán điều khiển tối
ưu chứa tham số 132.2 Ví dụ minh họa 31
Trang 4Mét sè ký hiÖu
R := R ∪ {±∞} tËp c¸c sè thùc suy réng
hx∗, xi gi¸ trÞ cña x∗ ∈ X∗ t¹i x ∈ X
Trang 5N (z0; Ω) nón pháp tuyến Fréchet của Ω tại z0
N (z0; Ω) nón pháp tuyến Mordukhovich của Ω tại z0
∇zf (¯z, ¯w)) đạo hàm theo hướng z của f tại (¯z, ¯w)b
∂ϕ(¯z) dưới vi phân Fréchet của ϕ tại ¯z
b
∂+ϕ(¯z) dưới vi phân trên của ϕ tại ¯z
Trang 6Mở đầu
Trong vài thập niên gần đây, các kỹ thuật điều khiển tự động và điềukhiển tối ưu đã được ứng dụng trong nhiều lĩnh vực như truyền thông vũtrụ, dây chuyền sản xuất, lắp ráp công nghệ và các thiết bị dân dụng Các nghiên cứu về điều khiển tối ưu không những có vai trò quan trọngtrong việc hoàn thiện lý thuyết điều khiển tối ưu mà còn có ý nghĩa to lớntrong việc phân tích, nhằm đưa ra những lời giải tốt cho các bài toán điềukhiển do thực tế đặt ra như: điều khiển quỹ đạo chuyển động quay củacác cỗ máy trong không gian, điều khiển các thiết bị động lực với yêu cầurút ngắn thời gian thực hiện, tiết kiệm nhiên liệu tiêu thụ Việc khảo sát,phân tích các thuật toán điều khiển trên các thiết bị cụ thể là phức tạp,thường phải thực hiện trong một thời gian dài, với chi phí lớn Vì thế, lýthuyết điều khiển tối ưu và mô hình hóa trên máy tính đã trở thành nhữngcông cụ mạnh, được ứng dụng rộng rãi
Việc nghiên cứu một cách có hệ thống các bài toán điều khiển tối ưu
được bắt đầu vào cuối những năm 1950, khi các nhà khoa học công bốhai phát minh quan trọng Một là nguyên lý cực đại Pontriagin, đưa racác điều kiện cần cực trị trong bài toán điều khiển tối ưu Hai là nguyên
lý quy hoạch động Bellman, cho phép chuyển việc tìm nghiệm của bàitoán điều khiển tối ưu về việc tìm nghiệm của một phương trình đạo hàmriêng (đó là phương trình Hamilton-Jacobi)
Theo B V Kolmanovskii (lời tựa bản Tiếng Nga cho [6]), "Các vấn
đề khác nhau liên quan đến việc phân tích độ nhạy là vấn đề truyền thốngtrong lý thuyết điều khiển tự động Những năm gần đây, đề tài này đã trởthành một vấn đề thời sự, thu hút sự quan tâm của nhiều nhà khoa học
Đặc biệt, mối liên hệ giữa lý thuyết điều khiển tối ưu với các ứng dụng
Trang 7thực tế và những khó khăn trong lý thuyết đã đặt ra nhiều bài toán thúvị."
Trong ba thập kỷ gần đây, người ta đã đưa ra nhiều phương phápkhác nhau để ước lượng sự ảnh hưởng của nhiễu lên hệ thống Phân tích
độ nhạy đã phát triển và trở thành một chuyên ngành của lý thuyết điềukhiển hệ thống Việc đo đạc độ nhạy được thực hiện bởi Bode [2], người
đã phát triển độ đo định lượng của tín hiệu phản hồi Hàm độ nhạy códạng tỉ số sự biến thiên của hàm hệ thống (trạng thái) và độ lệch của dữliệu (tham số), nghĩa là nó được định nghĩa như đạo hàm của trạng tháitương ứng với tham số
Như vậy, bên cạnh sự tồn tại nghiệm, điều kiện cần và đủ cực trị,tính chất của tập nghiệm và các thuật toán tìm nghiệm, việc nghiên cứu
độ nhạy nghiệm (solution sensitivity hay sensitivity analysis) là những vấn
đề cơ bản của lý thuyết điều khiển tối ưu và ứng dụng
Với các lí do nêu trên, chúng tôi đã chọn đề tài nghiên cứu "Dướigradient của hàm giá trị trong bài toán điều khiển tối ưu chứa thamsố" cho luận văn này
Nghiên cứu độ nhạy nghiệm trong điều khiển tối ưu là khảo sát tốc
độ thay đổi của tập nghiệm và của giá trị tối ưu theo tham số, bao gồmviệc tính toán đạo hàm (theo nghĩa cổ điển hoặc theo nghĩa suy rộng), đối
đạo hàm (đối đạo hàm Fréchet, đối đạo hàm Mordukhovich, ) của ánhxạ nghiệm hoặc hàm giá trị tối ưu của các bài toán phụ thuộc tham số.Nghiên cứu dáng điệu bậc nhất của hàm giá trị là một vấn đề quantrọng trong giải tích và tối ưu Một ví dụ về dạng toán này là hàm khoảngcách và ứng dụng của nó vào bài toán điều khiển tối ưu với bao hàm thức
vi phân (xem [7]) Có nhiều công trình khoa học nghiên cứu các tính chấtkhả vi và dưới vi phân Fréchet của hàm giá trị (xem [5], [10], [12]) Giảthiết rằng các dữ liệu thỏa mãn các điều kiện Lipschitz và tập nghiệm củabài toán nhiễu có giao khác rỗng với một tập compact, Clarke [5, Định
lý 6.5.2] đã thiết lập được một công thức cho gradient suy rộng (gradienttheo nghĩa Clarke) của hàm giá trị Bằng cách xét họ các giả thiết liênquan đến tính liên kết (coherence property), Penot [12] đã chỉ ra rằng
Trang 8hàm giá trị khả vi Fréchet Kết quả của Penot chỉ xác lập các điều kiện
đủ để hàm giá trị là khả vi Fréchet, không bao gồm công thức tính đạohàm của hàm giá trị Trong khi đó, không sử dụng các giả thiết Lipschitz,Mordukhovich và các đồng tác giả [10] đã đưa ra các công thức tính toánhoặc đánh giá dưới vi phân Fréchet của hàm giá trị của bài toán quy hoạchtoán học chứa tham số trong không gian Banach Bên cạnh việc nghiêncứu các tính chất vi phân bậc nhất của hàm giá trị của các bài toán quyhoạch chứa tham số, việc nghiên cứu các tính chất vi phân bậc nhất củahàm giá trị trong các bài toán điều khiển tối ưu cũng được nhiều tác giảquan tâm (xem [11], [4], [13]) Cụ thể, [11] đã thu được một công thứccho dưới vi phân xấp xỉ theo nghĩa giải tích lồi của hàm giá trị trongtrường hợp hàm mục tiêu là hàm lồi và ràng buộc của bài toán điều khiểntối ưu là tuyến tính Chú ý rằng, nếu hàm mục tiêu là lồi thì chúng ta cóthể tính dưới vi phân của hàm giá trị thông qua dưới vi phân của hàm lồi.Tuy nhiên, tình huống sẽ trở nên phức tạp hơn nếu hàm mục tiêu khôngcòn là hàm lồi Gần đây, Toan và các đồng tác giả [4], [13] đã đưa ra côngthức đánh giá trên cho dưới vi phân Fréchet của hàm giá trị của bài toán
điều khiển tối ưu chứa tham số trong trường hợp hàm mục tiêu không làhàm lồi Trong luận văn này, bằng cách tiếp cận không gian nền khác vớicác không gian nền trong [4] và [13], chúng ta đưa ra công thức mới đểtính dưới vi phân Fréchet của hàm giá trị
Luận văn được chia làm hai chương cùng với phần Mở đầu, Kết luận
và Tài liệu tham khảo Cụ thể:
Chương 1 Một số khái niệm và kiến thức cơ sở
Chương này đưa ra đánh giá trên cho dưới gradient của hàm giá trịtrong bài toán quy hoạch toán học chứa tham số và được chia thành haimục:
Mục thứ nhất: Một số khái niệm và tính chất cơ sở Mục này trìnhbày một số khái niệm về dưới gradient của một hàm, nón pháp tuyến củamột tập hợp, hàm biến phân bị chặn, ánh xạ đa trị có lát cắt Lipschitz trên
địa phương
Mục thứ hai: Dưới gradient của hàm giá trị trong bài toán quy hoạch
Trang 9toán học chứa tham số Mục này trình bày đánh giá trên cho dưới gradientcủa hàm giá trị trong bài toán quy hoạch toán học chứa tham số.
Chương 2 Dưới gradient của hàm giá trị trong bài toán điều khiểntối ưu chứa tham số
Chương này trình bày kết quả chính của luận văn và cũng được chialàm hai mục:
Mục thứ nhất: Dưới gradient của hàm giá trị trong bài toán điều khiểntối ưu chứa tham số Mục này đưa ra và chứng minh đánh giá trên chodưới vi phân Fréchet của hàm giá trị trong bài toán điều khiển tối ưu chứatham số
Mục thứ hai: Ví dụ minh họa Mục này đưa ra một ví dụ cụ thể minhhọa cho kết quả chính của luận văn
Luận văn này được hoàn thành tại Trường Đại học Vinh dưới sựhướng dẫn của TS Nguyễn Thị Toàn Tác giả xin được bày tỏ lòng biết
ơn sâu sắc của mình tới cô giáo hướng dẫn, người đã trực tiếp đặt bài toán,giúp đỡ tận tình, chu đáo trong suốt quá trình tác giả thực hiện và hoànthành luận văn
Trong quá trình học tập và viết luận văn, tác giả cũng nhận được sựgiúp đỡ tận tình của các thầy cô giáo trong tổ Giải tích trường Đại họcVinh
Cũng trong dịp này, tác giả xin được cảm ơn đến PGS TS TrầnVăn Ân, PGS TS Đinh Huy Hoàng, PGS TS Phạm Ngọc Bội, TS KiềuPhương Chi, TS Nguyễn Văn Đức và các thầy, cô giáo trong khoa KhoaSư phạm Toán, Phòng đào tạo Sau đại học trường Đại học Vinh và cácbạn lớp cao học 20 chuyên nghành Giải tích
Tác giả xin gửi lời cảm ơn tới Ban giám hiệu, tổ Toán và đồng nghiệptrường THPT Cửa Lò đã động viên và giúp đỡ để luận văn được hoàn thành
đúng kế hoạch Tác giả xin tỏ lòng biết ơn gia đình và bạn bè đã chia sẻ,
động viên tác giả trong quá trình học tập và hoàn thành luận văn
Trang 10Cuèi cïng, do kh¶ n¨ng cßn nhiÒu h¹n chÕ nªn kh«ng tr¸nh kháinh÷ng sai sãt, t¸c gi¶ rÊt mong ®îc sù gãp ý cña quý thÇy gi¸o, c« gi¸ocïng tÊt c¶ c¸c b¹n.
Vinh, th¸ng 9 n¨m 2014
T¸c gi¶
Trang 11Chương 1
Một số khái niệm và kiến thức cơ sở
1.1 Một số khái niệm và tính chất cơ sở
Giả sử rằng F : E1 → 2E 2 là hàm đa trị giữa các không gian Banach
Ký hiệu miền hữu hiệu và đồ thị của F tương ứng bởi
được gọi là - dưới vi phân Fréchet của ϕ tại ¯z Mỗi vectơ z∗ ∈ b∂ϕ(¯z)
được gọi là một -dưới gradient Fréchet của ϕ tại ¯z Khi = 0, tập hợpb
∂ϕ(¯z) := b∂0ϕ(¯z) được gọi là dưới vi phân Fréchet của ϕ tại ¯z Mỗi vectơ
z∗ ∈ b∂ϕ(¯z) được gọi là một dưới gradient Fréchet của ϕ tại ¯z Ta biết
Trang 12rằng, dưới vi phân Fréchet trùng với đạo hàm Fréchet cổ điển nếu hàm số
được xét là khả vi Fréchet Ngoài ra, ta cũng biết rằng nếu hàm được xét
là lồi thì dưới vi phân Fréchet trùng với dưới vi phân theo nghĩa giải tíchlồi Tập ˆ∂+ϕ(¯z) := − ˆ∂(−ϕ)(¯z)được gọi là dưới vi phân trên của ϕ tại ¯z.Cho Ω là một tập con khác rỗng của Z Lấy một điểm ¯z ∈ Ω và ≥ 0.Tập -pháp tuyến của Ω tại ¯z được xác định bởi
Khi = 0, tập Nb0(¯z; Ω) được gọi là nón pháp tuyến Fréchet của Ω tại ¯z
và ký hiệu bởi N (¯b z; Ω) Vectơ z∗ ∈ Z∗ được gọi là một pháp tuyến quagiới hạn của Ω tại ¯z nếu tồn tại một dãy k → 0+, zk → ¯z, và z∗
k → z∗ saocho z∗
k ∈ bNk(zk; Ω) với mọi k Họ các pháp tuyến như vậy được gọi lànón pháp tuyến Mordukhovich của Ω tại ¯z và được ký hiệu bởi N(¯z; Ω)
Rõ ràng ta có N (¯b z; Ω) ⊂ N (¯z; Ω) Nếu Ω lồi thì
1.1.2 Định nghĩa Cho X, Y là các không gian Banach và cho tập con
D ⊂ X
Trang 131 ánh xạ đơn trị h : D → Y được gọi là Lipschitz trên địa phương tại
1.2 Dưới gradient của hàm giá trị trong bài toán quy hoạch toán họcchứa tham số
Trong mục này, chúng ta giả thiết rằng X, W và Z là các không gianBanach với các không gian đối ngẫu tương ứng là X∗, W∗ và Z∗ Ngoài
ra, giả sử rằng M : Z → X và T : W → X là các ánh xạ tuyến tính, liêntục; M∗ : X∗ → Z∗ và T∗ : X∗ → W∗ tương ứng là các ánh xạ liên hợpcủa M và T Cho f : Z ì W → ¯R là một hàm có giá trị thực suy rộng
và Ω là một tập lồi, đóng trong Z Với mỗi w ∈ W ta đặt
Trang 14Định lý sau trình bày một công thức tính dưới vi phân Fréchet của htại ¯w.
1.2.1 Định lý (xem [4, Định lý 3.1]) Giả sử hàm giá trị h xác định bởi(1.2.1) hữu hạn tại ¯w ∈ dom ˆS và
(i) f là khả vi Fréchet tại (¯z, ¯w),
Trang 15Xét bài toán điều khiển tối ưu chứa tham số sau:
Tìm một vectơ điều khiển u ∈ C0([0, 1], Rm) và một vectơ trạng thái
x ∈ C1([0, 1], Rn), sao cho hàm mục tiêu sau đạt cực tiểu
g(x(1)) +
Z 1 0
L(t, x(t), u(t), θ(t))dt (2.1.1)với phương trình trạng thái
˙x(t) = A(t)x(t) + B(t)u(t) + T (t)θ(t) h.k t ∈ [0, 1], (2.1.2)giá trị ban đầu
Trang 16xạ khả vi x : [0, 1] → Rn sao cho đạo hàm của nó ˙x ∈ C0([0, 1], Rn).Chuẩn của x ∈ C1
Các ký hiệu trong (2.1.1)-(2.1.4) có ý nghĩa như sau:
x, u tương ứng là biến trạng thái và biến điều khiển,
(α, θ) ∈ Rn ì C0([0, 1], Rk) là các tham số,
g : Rn → ¯R, L : [0, 1] ì Rnì Rmì Rk → ¯R là các hàm có giá trị thựcsuy rộng,
A(t) = (aij(t))nìn, B(t) = (bij(t))nìm và T (t) = (cij(t))nìk là cáchàm với giá trị là các ma trận,
Trang 17Với mỗi w = (α, θ) ∈ W , đặt
J (x, u, w) = g(x(1)) +
Z 1 0
ở đây, W1,p([0, 1], Rn)là không gian Sobolev gồm các hàm liên tục tuyệt
đối x : [0, 1] → Rn sao cho ˙x ∈ Lp
([0, 1], Rn) Bằng cách tiếp cận cáckhông gian nền khác như bài toán đặt ra ở trên, chúng ta sẽ đưa ra mộtcông thức mới để tính dưới vi phân Fréchet của V tại ¯w = ( ¯α, ¯θ)
Trong mục này ta cần các giả thiết sau:
(H1) Các hàm L : [0, 1] ì Rn ì Rm ì Rk → ¯R và g : Rn → ¯R
có tính chất: L(ã, x, u, v) là liên tục với mọi (x, u, v) ∈ Rn ì Rm ì Rk,L(t, ã, ã, ã) và g(ã) là khả vi liên tục với mọi t ∈ [0, 1]
Trang 18M : X ì U → X và T : W → X được xác định bởi
Ax = x −
Z (ã) 0
Bu = −
Z (ã) 0
T (α, θ) = α +
Z (ã) 0
Axdτ +
Z (ã) 0
Budτ +
Z (ã) 0
T θdτ }
= {(x, u) ∈ X ì U | x −
Z (ã) 0
Axdτ −
Z (ã) 0
Budτ = α +
Z (ã) 0
T θdτ }
= {(x, u) ∈ X ì U | M(x, u) = T (w)}
Trong phần tiếp theo, ta kí hiệu U∗ và X∗ là các không gian đối ngẫu của
C0([0, 1], Rm) và C1([0, 1], Rn) tương ứng Theo định lí Riesz về sự biểudiễn (xem [7, mục 1 và mục 2 trang 17]), mỗi hàm tuyến tính liên tục
Trang 19u∗ ∈ U∗ có thể được biểu diễn duy nhất dưới dạng
ui(t)dài(t), (2.1.11)trong đó a ∈ Rm và ài(t), ,àm(t)là các hàm biến phân bị chặn, các hàm
đó liên tục phải tại 0 và ài(0) = 0, ∀i = 1, m Cũng như vậy, mọi hàmtuyến tính liên tục x∗ ∈ X∗ có thể được biểu diễn duy nhất dưới dạng
˙xi(t)dλi(t), (2.1.12)trong đó b, c ∈ Rn và λi(t), ,λn(t) là các hàm biến phân bị chặn, cáchàm đó liên tục phải tại 0 và λi(0) = 0, ∀i = 1, n ở đây, các tích phântrong (2.1.11) và (2.1.12) là tích phân Riemann-Stieltjes
Vì vậy, ta có thể đặt tương ứng u∗ với (a, à) và x∗ với (b, c, λ), trong
˙
BT(s)λ(s)ds,
Trang 20và A∗(b, c, λ) = (b∗, c∗, λ∗), trong đó
b∗ = b − AT(0)c −
Z 1 0
AT(t)dλ(t), c∗ = c,
λ∗(t) = λ(t) +
Z t 0
AT(s)λ(s)ds − t
Z 1 0
AT(s)dλ(s) −
Z t 0
ϕ1(s)ds,với ϕ1(s) = R0sA˙T(τ )λ(τ )dτ
Chứng minh (a) Do chuẩn kx(0)k + || ˙x||0 tương đương với chuẩn
||x||0 + || ˙x||0 với mỗi x ∈ X, nên từ định nghĩa của toán tử A, tồntại các hằng số k0, k1 sao cho
M liên tục Tương tự, ta cũng có thể chứng minh được rằng T là toán tửliên tục
(b) Lấy y bất kì thuộc X, xét phương trình Ax = y, phương trình nàytương đương với
Trang 21(c) Giả sử rằng T ∗(b, c, λ) = (d, a, à) Bằng định nghĩa của toán tử liênhợp và theo (2.1.10), ta có
h(b, c, λ), T (α, θ)i = h(d, a, à), (α, θ)i
Do đó,
hb, αi + hc, T (0)θ(0)i +
Z 1 0
T (t)θ(t)dλ(t)
= hd, αi + ha, θ(0)i +
Z 1 0
θ(t)dà(t)
Suy ra
hb, αi + T(0)c, θ(0) +
Z 1 0
T (t)θ(t)dλ(t)
= hd, αi + ha, θ(0)i +
Z 1 0
λ(t)d(T (t)θ(t))
= T (t)θ(t)λ(t)|10 −
Z 1 0
λ(t)T (t)dθ(t) −
Z 1 0
λ(t)θ(t)dT (t)
= T (t)θ(t)λ(t)|10 − λ(t)T (t)θ(t)|10 +
Z 1 0
θ(t)d(λ(t)T (t))
−
Z 1 0
λ(t)θ(t) ˙T (t)dt
=
Z 1 0
θ(t)d(TT(t)λ(t)) −
Z 1 0
˙
TT(t)λ(t)θ(t)dt
=
Z 1 0
θ(t)d
TT(t)λ(t) −
Z t 0
˙
TT(τ )λ(τ )dτ
.(2.1.15)
Trang 22Thế (2.1.15) vào (2.1.14), ta được
hb, αi + T(0)c, θ(0) +
Z 1 0
θ(t)d
TT(t)λ(t) −
Z t 0
Theo định nghĩa toán tử liên hợp, ta có
h(b, c, λ), Bui = h(a, à), ui , ∀u ∈ U
Theo (2.1.8) , đẳng thức trên tương đương với
hb, 0i + hc, −B(0)u(0)i −
Z 1 0
B(t)u(t)dλ(t) = ha, u(0)i +
Z 1 0
u(t)dà(t)
Do đó,
T(0)c, u(0) −
Z 1 0
B(t)u(t)dλ(t) = ha, u(0)i +
Z 1 0
u(t)dà(t).(2.1.16)
Trang 23= B(t)u(t)λ(t)|10−
Z 1 0
λ(t)B(t)du(t) −
Z 1 0
λ(t)u(t)dB(t)
= B(t)u(t)λ(t)|10− λ(t)B(t)u(t)|10 +
Z 1 0
u(t)d(BT(t)λ(t))
−
Z 1 0
u(t)d
Z t 0
u(t)d
−BT(t)λ(t) +
Z t 0
Trang 24Theo (2.1.7), đẳng thức trên tương đương với
hb, x(0)i + hc, ˙x(0) − A(0)x(0)i +
Z 1 0
( ˙x(t) − A(t)x(t))dλ(t)
= hb∗, x(0)i + hc∗, ˙x(0)i +
Z 1 0
˙x(t)dλ∗(t)
Do đó,
T(0)c, x(0) + hc, ˙x(0)i +
Z 1 0
˙x(t)dλ(t) −
Z 1 0
A(t)x(t))dλ(t)
= hb∗, x(0)i + hc∗, ˙x(0)i +
Z 1 0
λ(t)d(A(t)x(t))
= A(t)x(t)λ(t)|10 −
Z 1 0
λ(t)A(t)dx(t) −
Z 1 0
λ(t)x(t)dA(t)
= A(1)x(1)λ(1) −
Z 1 0
λ(t)A(t) ˙x(t)dt −
Z 1 0
˙
AT(t)λ(t)x(t)dt
= A(1)x(1)λ(1) −
Z 1 0
˙x(t)d
Z t 0
AT(s)λ(s)ds
−
Z 1 0
x(t)d
Z t 0
˙x(t)d
Z t 0
AT(s)λ(s)ds
−
x(t)
Z t 0
˙
AT(s)λ(s)ds
1
0 +
Z 1 0
Z t 0
˙
AT(s)λ(s)ds
dx(t)
= A(1)x(1)λ(1) − x(1)
Z 1 0
˙
AT(t)λ(t)dt +
Z 1 0
˙x(t)d
Z t 0
ϕ1(s)ds
−
Z 1 0
˙x(t)d
Z t 0
AT(s)λ(s)ds
, (2.1.19)với ϕ1(s) = R0sA˙T(t)λ(t)dt