Người ta thiết lập các điều kiện tối ưu chocác bài toán tối ưu không trơn với các hàm Lipschitz địa phươngdưới ngôn ngữ các dưới vi phân khác nhau, chẳng hạn dưới vi phânhàm lồi, các dướ
Trang 1ĐẠI HỌC THÁI NGUYÊNTRƯỜNG ĐẠI HỌC KHOA HỌC
Trang 2ĐẠI HỌC THÁI NGUYÊNTRƯỜNG ĐẠI HỌC KHOA HỌC
LUẬN VĂN THẠC SĨ TOÁN HỌC
Người hướng dẫn khoa học:
PGS.TS ĐỖ VĂN LƯU
Thái Nguyên - 2013
Trang 3Mục lục
1.1 Hàm ổn định và đạo hàm tiếp liên 3
1.2 Các quy tắc tính đạo hàm tiếp liên 11
2 Điều kiện tối ưu 18 2.1 Jacobian suy rộng Clarke 18
2.2 Các hàm vững 21
2.3 Các điều kiện tối ưu 30
2.4 Các quy tắc nhân tử Lagrange 37
Trang 4Mở đầu
Lý thuyết các điều kiện tối ưu vectơ là một phần quan trọngcủa lý thuyết tối ưu hóa Người ta thiết lập các điều kiện tối ưu chocác bài toán tối ưu không trơn với các hàm Lipschitz địa phươngdưới ngôn ngữ các dưới vi phân khác nhau, chẳng hạn dưới vi phânhàm lồi, các dưới vi phân Clarke, Michel Penot, Mordukhovich Lớp các hàm ổn định tại mỗi điểm của một tập rộng hơn lớp cáchàm Lipschitz địa phương trên tập đó Bài toán tối ưu vectơ với cáchàm ổn định được Jimenez - Novo [6] nghiên cứu và thiết lập cácđiều kiện tối ưu dưới ngôn ngữ đạo hàm tiếp liên Jimenez - Novo[6] cũng chỉ ra đạo hàm tiếp liên có nhiều tính chất phong phú tronglớp các hàm ổn định Đây là vấn đề thời sự được nhiều tác giả quantâm nghiên cứu Chính vì thế em chọn đề tài: " Điều kiện tối ưu chonghiệm hữu hiệu của bài toán tối ưu đa mục tiêu với các hàm ổnđịnh "
Luận văn trình bày lý thuyết đạo hàm tiếp liên cho hàm ổn định,hàm vững và các điều kiện tối ưu của Jimenez - Novo [6] cho bàitoán tối ưu đa mục tiêu tổng quát trong không gian định chuẩn vàbài toán tối ưu đa mục tiêu với ràng buộc nón và ràng buộc đẳngthức trong không gian hữu hạn chiều
Luận văn bao gồm phần mở đầu, hai chương, kết luận và danhmục các tài liệu tham khảo
Chương 1 Hàm ổn định và đạo hàm tiếp liên
Trình bày các kết quả nghiên cứu của Jimenez - Novo ([6], 2008)
về hàm ổn định và đạo hàm tiếp liên của các hàm ổn định, các quytắc tính đạo hàm tiếp liên trong lớp các hàm ổn định bao gồm: quy
Trang 5tắc hàm hợp, đạo hàm tiếp liên của một tổng, một tích, một thươnghai hàm và max của một số hữu hạn hàm ổn định.
Chương 2 Điều kiện tối ưu
Trình bày các kết quả của Jimenez - Novo [6] về hàm vững, mốiquan hệ với hàm ổn định, hàm khả vi Hadamard, hàm Lipschitz địaphương, đạo hàm tiếp liên của hàm vững, và các điều kiện tối ưucho bài toán tối ưu vectơ tổng quát với các hàm ổn định và hàmvững dưới ngôn ngữ đạo hàm tiếp liên Chương 2 cũng trình bày cácđiều kiện cần và đủ tối ưu dưới dạng các quy tắc nhân tử Lagrangecho bài toán tối ưu vectơ với ràng buộc nón và ràng buộc đẳng thứctrong không gian hữu hạn chiều, dưới ngôn ngữ đạo hàm tiếp liên.Luận văn này được hoàn thành tại trường Đại học Khoa học, Đạihọc Thái Nguyên dưới sự hướng dẫn tận tình của PGS TS Đỗ VănLưu Em xin bày tỏ lòng biết ơn chân thành và sâu sắc về sự tậntâm và nhiệt tình của Thầy trong suốt quá trình em thực hiện luậnvăn
Em xin chân thành cảm ơn Ban Giám hiệu, phòng Đào tạo Khoahọc và Quan hệ quốc tế, Khoa Toán - Tin trường Đại học Khoa học,Đại học Thái Nguyên đã quan tâm và giúp đỡ em trong suốt thờigian học tập tại trường
Em cũng xin gửi lời cảm ơn đến gia đình, bạn bè và các đồngnghiệp đã động viên, giúp đỡ em trong quá trình học tập của mình
Do thời gian và kiến thức còn hạn chế nên luận văn không tránhkhỏi những thiếu sót Em rất mong nhận được sự góp ý của cácthầy cô để luận văn được hoàn thiện hơn Em xin chân thành cảm ơn!
Thái Nguyên, ngày 15 tháng 7 năm 2013
Tác giả
Trịnh Duy Bình
Trang 6Chương 1
Hàm ổn định và đạo hàm tiếp liên
Chương 1 trình bày các kết quả nghiên cứu của Jimenez - Novo([6], 2008) về hàm ổn định và đạo hàm tiếp liên của các hàm ổnđịnh, các quy tắc tính đạo hàm tiếp liên trong lớp các hàm ổn địnhbao gồm: quy tắc hàm hợp, đạo hàm tiếp liên của một tổng, mộttích, một thương hai hàm và max của một số hữu hạn hàm ổn định.1.1 Hàm ổn định và đạo hàm tiếp liên
Giả sử X, Y là các không gian định chuẩn, M là một tập con của
X Ký hiệu B (x0, δ) là hình cầu mở tâm x0, bán kính δ
Kí hiệu intM , clM , coM , coneM tương ứng là phần trong của M,bao đóng của M, bao lồi của M, nón sinh bởi M, và
Cone+M = {αx : α > 0, x ∈ M } Nón D ⊂ Y được gọi là nón nhọn nếu D ∩ (−D) = {0} Trongchương này ta giả thiết D là nón lồi đóng nhọn có phần trong khácrỗng Nón D sinh ra thứ tự trong không gian Y
Trang 7(b) Nón các phương đạt được của M tại x0 là
A(M, x0) =
n
v ∈ X : ∀tn → 0+, ∃vn → vsao cho x0 + tnvn ∈ M, ∀n ∈ No;(c) Nón tiếp tuyến phần trong của M tại điểm x0 là
IT (M, x0) =
n
v ∈ X : ∃δ > 0 sao cho x0 + tu ∈ M
∀t ∈ (0, δ] , ∀u ∈ B (v, δ)o;(d) Nón tiếp tuyến phần trong dãy của M tại x0 là
ITs(M, x0) =nv ∈ X : ∃δ > 0, ∃tn → 0+ sao cho
x0 + tnu ∈ M ∀n ∈ N, ∀u ∈ B (v, δ)
o
.Chú ý rằng ta luôn có A (M, x0) ⊂ T (M, x0) Tập hợp M đượcgọi là khả dẫn xuất (derivable) tại điểm x0 (xem [10]) nếu
A(M, x0) = T (M, x0)
Ta nói rằng hàm f : X → Y là khả dẫn xuất đồ thị (graph derivable) tại x0 theo phương v ∈ X nếu với ∀y ∈ Y ,
-(v, y) ∈ T (graphf , (x0, f (x0))) ⇒ (v, y) ∈ A (graphf , (x0, f (x0))),trong đó graphf = {(x, y) ∈ X × Y : y = f (x)}
Hàm f là khả dẫn xuất đồ thị tại x0 nếu f là khả dẫn xuất đồthị tại x0 theo mọi phương ∀v ∈ X khi và chỉ khi
T (graphf, (x0, f (x0))) = A (graphf, (x0, f (x0)))
tức là tập hợp graphf là khả dẫn xuất tại điểm (x0, f (x0))
Sau đây là một ví dụ về hàm khả dẫn xuất đồ thị
Ví dụ 1.1.1
Giả sử f : R → R được cho bởi f (x) = x sin
1x
nếu x 6= 0 và
f (0) = 0 Khi đó f là khả dẫn xuất đồ thị tại 0
Đạo hàm Hadamard của f : X → Y tại x0 theo phương v ∈ X là
df (x0, v) = lim
(t,u)→(0 + ,v)
f (x0 + tu) − f (x0)
Trang 8f là hàm khả vi Hadamard tại x0 theo phương v nếu df (x0, v) tồntại, và f là hàm khả vi Hadamard tại x0 nếu df (x0, v) tồn tại vớimọi v ∈ X Nếu f khả vi Frechet tại x0, đạo hàm Frechet của nóđược kí hiệu bởi ∇f (x0).
Nếu hàm f : X → R thì đạo hàm Hadamard dưới và trên của f tại
x0 được định nghĩa bởi
Ta nói rằng f : X → Y là một hàm ổn định tại x0 ∈ X nếu tồntại một miền lân cận U của x0 và k > 0 sao cho
kf (x) − f (x0)k ≤ kkx − x0k, ∀x ∈ U
Nếu kf (x) − f (x0)k ≤ kkx − x0k, ∀x, x0 ∈ U , ta sẽ nói rằng f làhàm Lipschitz địa phương tại x0
Nếu với mỗi x0 ∈ X, tồn tại một lân cận U của x0 sao cho f làhàm Lipschitz địa phương tại x0 thì ta nói rằng f là hàm Lipschitzđịa phương trên X
Rõ ràng rằng hàm f Lipschitz địa phương trên X kéo theo f làhàm ổn định tại mỗi x0 ∈ X, nhưng điều ngược lại không đúng
Ví dụ hàm f trong Ví dụ (1.1.1) là ổn định với mỗi x0 ∈ R nhưng fkhông là hàm Lipschitz địa phương tại 0
Chúng ta sẽ sử dụng đạo hàm theo phương sau đây cho ánh xạ
n→∞(f (x0 + tnvn) − f (x0)) /tn = yo
Trang 9Chú ý rằng ∂∗f (x0)v được gọi là đạo hàm tiếp liên của ánh xạ đatrị x 7→ {f (x)} Do đó ∂∗f (x0)v là một tập hợp đóng và ánh xạ đatrị v 7→ ∂∗f (x0) v thuần nhất dương.
Nếu f khả vi Hadamard tại x0 thì
∂∗f (x0)v = {df (x, v)} ∀v ∈ X
Cho f : X → Y và g : X → Z, trong đó Z là một không gianđịnh chuẩn khác
Hàm (f, g) : X → Y × Z được xác định bởi (f, g)(x) = (f (x), g(x)).Trong không gian Y × Z, ta lấy k(y, z)k = kyk + kzk
Định lý sau (cách chứng minh rất đơn giản) cho ta một số tínhchất của hàm (f, g) liên quan đến tính ổn định và đạo hàm tiếp liên.Mệnh đề 1.1.1 [6]
(i) f và g ổn định tại x0 ⇔ (f, g) ổn định tại x0
(ii) Với mỗi v ∈ X, ∂∗(f, g) (x0) v ⊂ ∂∗f (x0) v × ∂∗g (x0) v Nếu fhoặc g khả vi Hadamard tại x0 theo phương v thì ta có dấu bằng.Bao hàm thức trong (ii) có thể đúng như ví dụ 1.1.2 dưới đây.Nhận xét 1.1.1
Trang 10(3) Nếu Y =R và df (x0, v), df (x0, v) hữu hạn thì
{df (x0, v), df (x0, v)} ⊂ ∂∗f (x0)v ⊂ [df (x0, v), df (x0, v)].Chiều ngược lại của bao hàm thức cũng đúng khi f liên tụctrong một lân cận của x0
x0
Ví dụ 1.1.2
(a) Giả sử A = {2−n : n ∈ N} ∪ {0} và f : R →R được xác định bởi
f (x) = dist(x, A) Khi đó f là một hàm Lipschitz toàn cụctrên R hằng số 1 Nhưng f không khả vi Hadamard tại x0 = 0theo phương v = 1
và chúng ta xác định g : R →R bởi g(x) = 2dist(x, B) Khi đó,
g là Lipschitz toàn cục và thỏa mãn
0 ≤ g (x) ≤ f (x) ≤ x/3, ∀v ∈ [0, 1/2]
Trang 11.(c) Giả sử h = (f, g) Khi đó, h là Lipschitz toàn cục và ta có
Tập này không lồi trong R2
Những kết quả sau đây cho ta những tính chất của hàm ổn định
và đạo hàm tiếp liên
kf (x0 + tu) − f (x0)k
t < ∀t ∈ (0, δ1), u ∈ B(v, δ2). (1.1)Chọn a cố định, η ∈ (0, δ2) và δ = η · δ1 Khi đó,
B(0, δ) \ {0} ⊂ (0, δ1) · Sη ⊂ (0, δ1) · B(0, δ2),trong đó Sη = {x ∈ X : kxk = η} Thật vậy, cho w ∈ B(0, δ) \ {0},
ta xác định t = kwk/η và u = t−1w Khi đó, t < δ1 và kuk = η
Vì vậy, w = t · u ∈ (0, δ1) · δη Bao hàm thức thứ hai là hiển nhiên.Nếu 0 < kx − x0k < δ, nó sẽ là w = x − x0 = t · u
với t ∈ (0, δ1), kuk = η
Trang 12= k(bất đẳng thức cuối đúng do phương trình (1.1)).
Mệnh đề 1.1.3
Giả sử f : X → Y, x0, v ∈ X và y ∈ Y
(i) Nếu df (x0, v) = y thì ∂∗f (x0)v = {y}
(ii) Nếu Y là hữu hạn chiều, f ổn định tại x0 và ∂∗f (x0)v = {y} thì
thì df (x0, v) = y Bởi vì f ổn định tại x0 dãy (yn) bị chặn,
tức là yn ∈ clB(0, r), ∀n ∈ N với r > 0, nào đó Với mỗi k ∈ N taxác định
yn → y
Nếu f chỉ liên tục tại x0 thì Mệnh đề 1.1.3(ii) là sai Ví dụ sauminh họa điều đó
Trang 13x0, ta có tn → 0+, và từ (1.2), ta suy ra vn → 0.
Lấy dãy con nếu cần thiết, ta có thể giả sử rằng
yn := (f (x0+tnvn)−f (x0))/tn hội tụ tới y nào đó y ∈ Rp với kyk = 1bởi vì kynk = 1 Do đó, y ∈ ∂∗f (x0)0 Điều này mâu thuẫn với giảthiết
Nếu ∂∗f (x0)0 6= {0} thì f không ổn định tại x0 do hệ quả 1.1.1nhưng f có thể liên tục tại x0
Chẳng hạn f : R → R, f (x) = p| x |, x0 = 0 Lấy tn = 1/n và
vn = 1/n, ta có lim
x→∞f (tnvn) /tn = 1 ∈ ∂∗f (x0) 0
Trang 14Hệ quả 1.1.2.
f : X → Rp liên tục tại x0 và ∂∗f (x0) 0 = {0} và tương đương với
df (x0, 0) = 0
Hệ quả 1.1.2 được suy ra từ các Mệnh đề 1.1.4 và 1.1.2
1.2 Các quy tắc tính đạo hàm tiếp liên
Tiếp theo chúng ta sẽ trình bày một số quy tắc tính toán đạo hàmtiếp liên Giả sử rằng Z là một không gian định chuẩn
Định lý 1.2.1 (Quy tắc hàm hợp)
Giả sử f : X → Y và g : Y → Z khả vi Hadamard tại f (x0).Khi đó,
dg(f (x0), ·)(∂∗f (x0)v) ⊂ ∂∗(g ◦ f )(x0)v, ∀v ∈ X (1.3)Hơn nữa, nếu Y hữu hạn chiều và f ổn định tại x0 thì g ◦ f ổnđịnh tại x0 và có đẳng thức trong (1.3)
g (f (x0 + tnvn)) = g (f (x0) + tnyn)
= g (f (x0)) + tndg (f (x0) , y) + tnα (tn, yn)
Trang 16Chú ý rằng khi Y hữu hạn chiều và ψ : Y → Z là một hàm affinethì ψ liên tục trên Y
Chứng minh
Phần thứ nhất suy ra từ Hệ quả 1.2.1 với (f, g) : X → Y × Y thaycho f và ψ : Y × Y → Y được cho bởi công thức ψ(y, z) = y + z.Phần thứ hai suy ra từ định nghĩa và chú ý đến Nhận xét 1.2.1(1)
và phần thứ ba suy ra từ Định nghĩa
Các hàm f và g trong Ví dụ 1.2.1(c) cho thấy bao hàm thức (1.7)
có thể chặt
Để minh họa quy tắc tổng này, ta xét h : X × Y → Rp
được cho bởi h(x, y) = f (x) + g(y),
trong đó f : X →Rp, g : Y →Rp và (x0, y0), (v, u) ∈ X × Y
Nếu f ổn định tại x0 thì
∂∗h(x0, y0)(v, u) ⊂ ∂∗f (x0)v + ∂∗g(y0)u,
và đẳng thức xảy ra nếu f khả vi Hadamard tại x0 theo phương v
Để chứng minh điều này, ta xét f và g từ X × Y vào Rp
f (x, y) = f (x) và g(x, y) = g(y) và khi đó áp dụng Mệnh đề 1.2.1cho h = f + g, ta nhận được
∂∗f (x0, y0) (v, u) = ∂∗f (x0) v,và
∂∗g (x0, y0) (v, u) = ∂∗g (y0) u
Trang 17Mệnh đề 1.2.2 (Quy tắc tích)
Giả sử f, g là hai hàm từ X vào R Khi đó,
{g(x0)y + f (x0)z : (y, z) ∈ ∂∗(f, g)(x0)v} ⊂ ∂∗(f g)(x0)v (1.8)Nếu f ổn định tại x0, và hoặc f (x0) 6= 0 hoặc g liên tục tại x0, thì
∂∗(f g)(x0)v ⊂ g(x0)∂∗f (x0)v + f (x0)∂∗g(x0)v (1.9)Hơn nữa, nếu f khả vi Hadamard tại x0 theo phương v thì đẳng thứcxảy ra trong (1.8) và (1.9)
Nếu f, g ổn định tại x0 thì f g ổn định x0, và đẳng thức này xảy
ra trong (1.8) Hơn nữa,
∂∗(f g)(x0)v = ∂∗(g(x0)f + f (x0)g)(x0)v (1.10)Chứng minh
Giả sử h : R2 →R là một hàm h(y, z) = yz Hàm này khả vi phânFrechet, với ∇h(y0, z0)(u, w) = z0u + y0w Chú ý rằng f g = h ◦ (f, g)
và áp dụng Định lý 1.2.1 để nhận được phần 1, tức là bao hàm thức(1.8)
Nếu (wn) hội tu tới w ∈ ∂∗(f g)(x0)v, thì do Nhận xét 1.1.1(1)(ta lấy thêm 1 dãy con nếu cần thiết), ta nhận được
Trang 18Nếu f (x0) = 0 và g liên tục tại x0, vì yn = f (xn)/tn → y, ta suyra
Để chứng minh đẳng thức (1.10) ta hãy xét phiếm hàm tuyến tính
ψ : R2 → R được định nghĩa bởi : ψ(y, z) = g(x0)y + f (x0)z
Ví dụ sau đây cho thấy bao hàm thức trong Mệnh đề 1.2.2 có thể
là chặt
Ví dụ 1.2.1
Giả sử f : R →R, g : R → R, x0 = 0 và v = 1 Để cho ngắn gọn,
Trang 19(a) f (x) = x, g(x) = sin(1/x), nếu x 6= 0 và g(0) = 1 Khi đó f khả
vi Hadamard tại x0 nhưng không liên tục tại x0,
∂∗(f, g)(x0)v = {(y, −y) : −1 ≤ y ≤ 1},
∂∗f (x0)v = ∂∗g(x0)v = [−1, 1], A = B = D = {0} và C = [- 2,2];(1.8) và (1.10) thỏa mãn đẳng thức, và (1.9) thỏa mãn với baohàm thức chặt
Tương tự vào Mệnh đề 1.2.2, ta có mệnh đề sau đây
g liên tục tại x0) thì
∂∗(f /g)(x0)v ⊂ g(x0)∂∗f (x0)v − f (x0)∂∗g(x0)v
Trang 20Hơn nữa, nếu g khả vi Hadamard tại x0 theo phương v thì ta có đẳngthức trong (1.12) và (1.13).
Nếu f và g ổn định tại x0 thì f /g ổn định tại x0, và ta có đẳngthức trong (1.12)
g(x) = max {fi(x) : i = 1, 2, , p} Khi đó,
Trang 21Chương 2
Điều kiện tối ưu
Chương 2 trình bày các kết quả của Jimenez - Novo [6] về hàmvững, mối quan hệ với hàm ổn định, hàm khả vi Hadamard, hàmLipschitz địa phương, đạo hàm tiếp liên của hàm vững, và các điềukiện tối ưu cho bài toán tối ưu vectơ tổng quát với các hàm ổn định
và hàm vững dưới ngôn ngữ đạo hàm tiếp liên Trong chương này,chúng tôi cũng trình bày các điều kiện cần và đủ tối ưu dưới dạngcác quy tắc nhân tử Lagrange cho bài toán tối ưu vectơ với ràngbuộc nón và ràng buộc đẳng thức trong không gian hữu hạn chiều,dưới ngôn ngữ đạo hàm tiếp liên
2.1 Jacobian suy rộng Clarke
Cho hàm vectơ f : Rn →Rm Khi đó hàm f có dạng:
f (x) = (f1(x) , , fm(x))Giả sử mỗi hàm fi là Lipschitz địa phương tại x Khi đó, hàm f làLipschitz địa phương tại x
Định lí Rademacher khẳng định rằng hàm f khả vi hầu khắp nơitrong một lân cận của x (mà trên đó f Lipschitz), tức là mỗi fi khả
vi hầu khắp nơi trong lân cận đó của x
Ký hiệu Ωf là tập các điểm mà hàm f không khả vi Nếu tại xhàm f có đạo hàm, thì ta ký hiệu J f (x) là m × n- ma trận Jacobianthông thường của f
Trang 22(i) ∂f (x) 6= ∅, lồi, compắc trong Rm×n;
(ii) Ánh xạ đa trị ∂f là đóng tại x, tức là nếu
xi → x, Zi ∈ ∂f (xi) , Zi → Z, thì Z ∈ ∂f (x) ;(iii) ∂f nửa liên tục trên tại x: ∀ε > 0, ∃δ > 0, ∀x ∈ x + δB
∂f (x) ⊂ ∂f (x) + εBm×n;(iv) Nếu fi Lipschitz địa phương tại x với hằng số Ki, thì
f Lipschitz địa phương tại x với hằng số K = k(K1, , Km)k
Trang 23Định lý 2.1.2 (Định lí về giá trị trung bình cho hàm vectơ) [1]Giả sử f là hàm vectơ Lipschitz trên tập lồi mở U ⊂ Rn; x, y ∈ UKhi đó,
f (y) − f (x) ∈ co ∂f ([x, y]) (y − x) (2.1)
Vế phải của (2.1) có nghĩa là bao lồi của tất cả các điểm dạng
Z (y − x),
trong đó Z ∈ ∂f (u), với u nào đó thuộc [x, y] và
[co ∂f ([x, y])] (y − x) = co [∂f ([x, y]) (y − x)]
Định lý 2.1.3 (Jacobian suy rộng của hàm hợp)[1]
Giả sử h : Rn → Rm Lipschitz địa phương tại x, g : Rm → RLipschitz địa phương tại h (x) , f = g ◦ h
Khi đó, f cũng Lipschitz địa phương tại x, và
∂f (x) ⊂ co {∂g (h (x)) ∂h (x)} (2.2)Hơn nữa, nếu g khả vi chặt Hadamard tại h (x), thì (2.2) có dấubằng, và phép toán co có thể bỏ được
Bây giờ ta sẽ so sánh đạo hàm liên tục với Jacobian suy rộng Giả
sử f :Rn → Rp là hàm Lipschitz địa phương tại x0
Quan hệ giữa Jacobian suy rộng Clarke và ∂∗f (x0) v được đưa ratrong Mệnh đề 2.1.1 Trước hết ta cần một kết quả sau
Giả sử vn được xác định bởi đẳng thức xn = x0+ tnvn thì vn → v
Sử dụng định lý giá trị trung bình (Định lý 2.1.2) ta nhận được
f (xn) − f (x0) = Antnvn