18 2 Điều kiện tối ưu và đối ngẫu cho các nghiệm hữu hiệu và nghiệm hữu hiệu yếu của bài toán tối ưu đa mục tiêu không trơn 24 2.1.. Chuong [2], 2013 đã sử dụng giải tích biến phân, dạng
Các định nghĩa và kết quả bổ trợ
Nón cực của Ω ⊂ R n là tập
Cho ánh xạ đa trị F :R n ⇒ R n , ta kí hiệu:
F(x) := {v ∈ R n : ∃x n → xvàv n → vvớiv n ∈ F(x n ), ∀n ∈N} là giới hạn trên (ngoài) Painlevé - Kuratowski dãy của F khi x → x.
Xét Ω ⊂ ℝ^n: Ω được gọi là đóng xung quanh x ∈ Ω nếu tồn tại một lân cận U của x sao cho Ω ∩ cl(U) là một tập đóng Ta nói Ω đóng địa phương nếu Ω đóng xung quanh x với mọi x ∈ Ω Cho Ω ⊂ ℝ^n là một tập đóng xung quanh x ∈ Ω, nón pháp tuyến Fréchet của Ω tại x ∈ Ω được định nghĩa bằng tập hợp các vectơ v ∈ ℝ^n thỏa mãn ⟨v, y − x⟩ ≤ o(‖y − x‖) khi y ∈ Ω và y → x.
Nb(x,Ω) :( x ∗ ∈ R n | Lim sup x −→x Ω hx ∗ , x−xi kx−xk ≤ 0
, (1.2) trong đó x−→ Ω x nghĩa là x→ x với x ∈ Ω.
Nếu x /∈ Ω ta đặt Nb(x,Ω) =∅. Nón pháp tuyến Mordukhovich Nb(x,Ω) của Ω tại x ∈ Ω nhận được từ các nón pháp tuyến Fréchet bằng việc lấy giới hạn trên Painlevé - Kuratowski dãy như sau
Nếu x /∈ Ω ta đặt N(x,Ω) := ∅ Đặc biệt, nếu Ω là tập lồi địa phương xung quanh x, nghĩa là có một lân cận U ⊂ R n của x sao cho Ω∩U là tập lồi thì ta có
N(x,Ω) := {x ∗ ∈ R n | hx ∗ , x−xi ≤ 0, ∀x ∈ Ω∩U} (1.4) Với một hàm giá trị thực mở rộng ϕ : R n → R :=R n ∪ {∞}, ta đặt domϕ :={x∈ R n |ϕ(x) 0 sao cho
(iii) Điểm x ∈ C được gọi là nghiệm hữu hiệu chính thường địa phương của bài toán (1.11) nếu tồn tại một lân cận U của x và λ ∈ intR m + sao cho
Trong bài toán (1.11), ta kí hiệu ba tập nghiệm hữu hiệu địa phương là locS(P), locS iv (P) và locS p (P) Khi U := R^n, ta kí hiệu các tập nghiệm tương ứng trên không gian này bằng S(P), S iv (P) và S p (P) Những tập nghiệm này phản ánh trạng thái tối ưu cục bộ của bài toán và cho phép so sánh giữa các khái niệm nghiệm hữu hiệu tại chỗ với nghiệm hữu hiệu toàn cục.
Ta biết rằng (xem [4]), locS iv (P) ⊂ locS(P) và locS p (P) ⊂ locS(P).
Nhưng bao hàm thức ngược lại không đúng Chú ý rằng các tập locS iv (P) và locS p (P) có thể khác nhau.
Xét hai ví dụ sau:
Ví dụ 1.1 Cho f :R → R 2 xác định bởi f(x) := (f1(x), f2(x)) với f1(x) :( x, nếu x ≥ 0, 3x, nếu x < 0, f2(x) :( −3x, nếu x≥ 0,
−x, nếu x < 0, và cho g, h : R → R được xác định bởi g(x) := −|x| và h(x) := 0 với x∈ R Ta xét bài toán (1.11) với m= 2,Ω =R Chọn x= 0 ∈ C =R và ν = 1 ta có max{f 1 (x)−f 1 (x), f 2 (x)−f 2 (x)} = |x| ≥ ν|x|= ν|x−x|,∀x∈ C.
Như vậy x thuộc locS iv (P) nhưng x không thuộc locS p (P) Giả sử ngược lại tồn tại một lân cận U của x và một cặp số dương (λ1, λ2) ∈ intR^2_+ sao cho λ1 f1(x) + λ2 f2(x) ≥ 0 với mọi x ∈ U ∩ C; điều này tương đương với một điều kiện ràng buộc tuyến tính giữa hai hàm f1 và f2 được đánh giá trên tập U ∩ C.
( λ1x−3λ2x≥ 0, nếu x∈ U ∩(0,+∞), 3λ 1 x−λ 2 x≥ 0, nếu x∈ U ∩(−∞,0). Điều này cho ta λ2 ≥ 9λ2 (mâu thuẫn).
Ví dụ 1.2 Cho f : R → R 2 được xác định bởi f(x) := (f 1 (x), f 2 (x)) trong đó f1(x) := −x 4 , f2(x) := x 4 , và chog, h :R → Rxác định bởi g(x) := x−1, h(x) := 0 với x ∈ R Ta xét bài toán (1.11) với m = 2,Ω = R Chọn x= 0 ∈ C = (−∞,1] và λ :1
2f2(x), ∀x∈ C. Điều này cho thấy x ∈ locS p (P), trong khi đó x /∈ locS iv (P) với ν > 0.
Thật vậy, với v > 0 cố định bất kì, bất đẳng thức max{f 1 (x)−f1(x), f2(x)−f2(x)} = x 4 ≥ ν|x|= ν|x−x|.
(không thỏa mãn ∀x ∈ C gần x) Do đó, x /∈ locS iv (P).
Vớix ∈ Ω, ta đặt I(x) = {i ∈ I|gi(x) = 0} và J(x) = {j ∈ J|hj(x) = 0}. Định nghĩa 1.2 Ta nói điều kiện chính quy (CQ) được thỏa mãn tại x∈ Ω nếu khụng tồn tại à i ≥ 0, i ∈I(x) và γ j ≥ 0 ∈ J(x) sao cho P i∈I(x) ài+ P j∈J (x) γj 6= 0 và
Xét x ∈ C xác định trong (1.12) với Ω = ℝ^n, điều kiện CQ được nêu ở trên đúng khi điều kiện chính quy Mangasarian - Fromovitz đúng trong trường hợp trơn Định lý sau đưa ra một điều kiện cần cho nghiệm hữu hiệu cô lập của bài toán (1.11) dưới định nghĩa trên (CQ) Định lý 1.1 cho CQ được xác định trong Định nghĩa 1.2 và thỏa mãn tại x ∈ C.
Ω Nếu x ∈locS iv (P) với ν > 0 nào đó thì νB R n ⊂ X k∈K λk∂fk(x) +X i∈I ài∂gi(x)
Chứng minh Lấy x ∈ locS iv (P) Đặt ϕ(x) = max
Xét bài toán tối ưu sau: minx∈C ϕ(x).
Xét x thuộc tập nghiệm cục bộ của bài toán (P), tồn tại một lân cận U của x sao cho φ(y) ≥ φ(x) với mọi y ∈ U ∩ C Điều này cho thấy x là cực tiểu địa phương của bài toán (1.14) Do đó, x là cực tiểu địa phương của bài toán tối ưu hóa vô hướng không có ràng buộc x ∈ R^n, min φ(x) + δ(x, C) (1.15) Áp dụng dạng không trơn của quy tắc Fermat (1.8) cho bài toán (1.15) ta có 0 ∈ ∂φ(x) + ∂δ(x, C) = ∂φ(x) + N_C(x).
1≤k≤m{f k (x)−f k (x)}+δ(x, C) và ϕ 2 (x) := −kkx−xk Khi đó, ϕ+δ(., C) = ϕ1 +ϕ2 Do (1.16) nên ta có
Dễ thấy −ϕ2 là hàm lồi nên
Sử dụng Bổ đề 1.1 và (1.17) ta có
. Điều này dẫn dến νB R n ⊂ ∂ϕb 1(x) Như vậy, νB R n ⊂ ∂ϕ1(x) =∂
Với 1 ≤ k ≤ m, hiệu fk(·) − fk(x) là một hàm Lipschitz quanh x và δ(·, C) là nửa liên tục dưới quanh điểm này Từ quy tắc tổng (1.10) áp dụng cho (1.18) và nhờ mối quan hệ trong (1.7), ta suy ra νB R^n ⊂ ∂.
(x) +N(x, C) (1.19) Đặt Ω :=e {x ∈ R n |g i (x) ≤ 0, i ∈ I, h i = 0, j ∈ J} Ta có C = Ωe ∩Ω. Điều kiện (CQ) thỏa món tại x kộo theo khụng tồn tại ài ≥ 0, i ∈ I(x) và γ j ≥ 0, j ∈J(x) = J sao cho P i∈I (x) à i + P j∈J(x) γ j 6= 0 và
Do đó, từ Mordukhovich [7, Hệ quả 4.36] ta có
Vì điều kiện (CQ) được thỏa mãn tại x, từ [7, Hệ quả 3.37] ta có
Bên cạnh đó, sử dụng công thức cho dưới vi phân cơ bản của hàm max (xem [7], Định lý 3.46(ii)) và quy tắc tổng (1.10) ta thu được
Đặt a_i = 0 với i ∉ I(x); từ (1.20) và (1.21) suy ra (1.13), và định lý được chứng minh dựa trên mối quan hệ giữa các công thức này Tuy nhiên, định lý 1.1 có thể sai nếu điều kiện CQ không thỏa mãn tại điểm đang xét, như được minh họa trong ví dụ sau:
Ví dụ 1.3 cho f: R → R^2 được xác định bởi f(x) := (f1(x), f2(x)) với f1(x) = f2(x) = x và cho g, h: R → R được xác định bởi g(x) = x^2, h(x) = 0 với mọi x ∈ R Xét bài toán (1.11) với m = 2 và Ω = R Chú ý rằng C = {0} và x := 0 ∈ S_iv(P) với ν > 0 bất kỳ Dễ thấy điều kiện CQ không thỏa tại x, vì vậy (1.13) không thỏa Để xây dựng điều kiện đủ cho cực tiểu cô lập địa phương của bài toán (1.11), trong định lý tiếp theo ta nhắc lại khái niệm một hàm φ: Ω ⊂ R^n → R là hàm lồi địa phương (affine địa phương) tại x ∈ Ω nếu tồn tại một lân cận của x trong Ω mà φ là một hàm affine.
Xét một điểm x sao cho tồn tại một mở U với Ω∩U là tập lồi và φ là hàm lồi (affine) trên Ω∩U Theo Định lý 1.2, với x ∈ C, giả sử các hàm fk (k ∈ K) và các hàm gi, i (i ∈ I) là hàm lồi địa phương tại x, đồng thời các hàm hj, j (j ∈ J) là hàm affine địa phương tại x Nếu x thỏa mãn (1.13) thì x ∈ locS iv (P).
Từ giả thiết của định lý, tồn tại một lân cận U của x sao cho U ∩ Ω là một tập lồi; f_k (k ∈ K) và g_i (i ∈ I) là các hàm lồi trên U ∩ Ω, còn h_j (j ∈ J) là các hàm affine trên U ∩ Ω Chú ý rằng với mọi z ∈ R^n, kzk = max_{y ∈ B_R^n} ⟨z, y⟩ Do đó tồn tại một z* ∈ B_R^n sao cho kzk = ⟨z, z*⟩.
Lấy bất kì x ∈U ∩C, tồn tại z ∗ ∈ B R n sao cho kx−xk =hx ∗ , x−xi (1.22)
Vì x∈ C thỏa mãn (1.13) nên tồn tại λ k ≥ 0, k ∈ K với P k∈K λ k = 1, z k ∗ ∈
∂fk(x), k ∈ K, ài ≥ 0, x ∗ i ∈ ∂gi(x) với àigi(x) = 0, i ∈ I, γj ≥ 0, y i ∗ ∈
∂h j (x)∪∂(−h j )(x), j ∈ J sao cho vx ∗ − X k∈K λkz k ∗ +X i∈I àix ∗ i +X i∈J γjy j ∗
Từ (1.4) suy ra νhx ∗ , x−xi − X k∈K λ k hz k ∗ , x−xi+X i∈I à i hx ∗ i , x−xi
Từ tính chất lồi địa phương của fk, gi và tính chất affine địa phương của h j ta có
X k∈K λkhz k ∗ , x−xi+X i∈I àihx ∗ i , x−xi+X i∈J γjhy j ∗ , x−xi
≤ X k∈K λk[fk(x)−fk(x)] +X i∈I ài[gi(x)−gi(x)]
(1.24) trong đó ωj ∈ {−1,1} và bất đẳng thức sau đúng vì à i g i (x) = 0, à i g i (x)≤ 0, i ∈ I và h j (x) = 0, h j (x) = 0, j ∈ J.
Kết hợp (1.22) với (1.23) và (1.24) ta nhận được νkx−xk ≤ X k∈K λk[fk(x)−fk(x)].
Hơn nữa, X k∈K λk[fk(x)−fk(x)] ≤ X k∈K λk max
Suy ra x ∈ locS iv (P) vì x bất kì trong U ∩C
Ví dụ tiếp theo cho thấy tính lồi địa phương của hàm mục tiêu f tại điểm x trong Định lý 1.2 đóng vai trò rất quan trọng Cụ thể, một điểm khả thi x thỏa mãn điều kiện (1.13) không nhất thiết là cực tiểu cô lập của bài toán (1.11) nếu thiếu tính lồi địa phương của f tại x.
Ví dụ 1.4 Cho f :R → R 2 được xác định bởi f(x) := (f 1 (x), f 2 (x)) với f1(x) = f2(x) :
0, nếu x= 0, và gọi g, h : R → R được xác định bởi g(x) := x− 1 và h(x) := 0 với x∈ R Xét bài toán (1.11) vớim = 2,Ω = RthìC = (−∞,1] Chú ý rằng f1, f2 là Lipschitz địa phương tại x= 0 ∈ C và∂f1(x) = ∂f2(x) = [−1,1].
Định lý 1.3 cho thấy điều kiện cần cho nghiệm hữu hiệu chính địa phương của bài toán (1.11) khi điều kiện (CQ) được áp dụng như Định nghĩa 1.2 Giả sử (CQ) thỏa mãn tại x ∈ Ω Nếu x ∈ locS_p(P) thì tồn tại tập các tham số λ_k > 0 (k ∈ K), các hệ số a_i ≥ 0 (i ∈ I) và γ_j ≥ 0 (j ∈ J) sao cho các điều kiện tương ứng được thỏa mãn.
Chứng minh Giả sử x ∈ locS p (P) Khi đó tồn tại một lân cận U của x và λ :(λ1, λm)∈ intR m + sao cho
X k∈K λ k [f k (x)−f k (x)]≥ 0, ∀x∈ U ∩C. Điều đó có nghĩa là x là một cực tiểu địa phương của bài toán tối ưu không có ràng buộc sau: minx∈C θ(x), trong đó θ(x) = X k∈K λkfk(x) (1.26)
Xét x là cực tiểu địa phương của bài toán tối ưu không ràng buộc min_{x∈R^n} θ(x) + δ(x, C) (1.27) Áp dụng dạng không trơn của quy tắc Fermat (1.8) cho bài toán này ta có điều kiện cần thiết: 0 ∈ ∂θ(x) + ∂δ(x, C) Vì δ(x, C) là hàm chỉ thị của tập C nên ∂δ(x, C) = N_C(x) là nón pháp tuyến của C tại x, và do đó điều kiện này được viết dưới dạng 0 ∈ ∂θ(x) + N_C(x) Nói cách khác, tồn tại p ∈ ∂θ(x) và n ∈ N_C(x) sao cho p + n = 0.
Vì θ là Lipschitz địa phương tại x và δ(., C)) là nửa liên tục dưới quanh x, từ (1.10) và (1.7), ta có
0 ∈ ∂θ(x) +∂δ(x, C)) =∂θ(x) +N(x, C) (1.29) Tương tự chứng minh của Định lý 1.3 ta nhận được
(1.30) Áp dụng quy tắc tổng (1.10), từ (1.30) ta nhận được
0 ∈ X k∈K λk∂fk(x) +X i∈I ài∂gi(x) +X j∈J γj(∂hj(x)∪∂(−hj(x)) +N(x, Ω), à i ≥ 0, i ∈I(x), γ i ≥ 0, j ∈J(x).
Lấy à i = 0, i ∈ I(x) trong (1.31) ta nhận được (1.25) Định lý được chứng minh
Như đã chỉ ra trong Ví dụ 1.3, kết quả của Định lý 1.3 có thể không đúng nếu điều kiện (CQ) không thỏa mãn Để trình bày điều kiện đủ cho nghiệm hữu hiệu toàn cục của bài toán (1.11) trong định lý tiếp theo, ta cần khái niệm lồi bất biến vô hạn (suy rộng) cho hàm Lipschitz địa phương Định nghĩa 1.3 Ta nói (f, g, h) là L‑lồi bất biến trên Ω tại x ∈ Ω nếu ∀ x ∈ Ω, z_k^* ∈ ∂f_k(x), k ∈ K, x_i^* ∈ ∂g_i(x), i ∈ I và y_j^* ∈ (∂h_j(x) ∪ …) -**Support Pollinations.AI:**🌸 **Quảng cáo** 🌸 Đảm bảo tối ưu SEO cho bài viết toán học của bạn cùng Pollinations.AI – [Ủng hộ chúng tôi](https://pollinations.ai/redirect/kofi) để duy trì công cụ AI miễn phí!
Đối với mỗi j ∈ J, tồn tại v ∈ N(x, Ω) sao cho các bất đẳng thức liên quan đến f_k, g_i và h_j được thể hiện bằng f_k(x) − f_k(x) ≥ h_k^* z_k, vi, k ∈ K; g_i(x) − g_i(x) ≥ h_i^* z_i, vi, i ∈ I; và h_j(x) − h_j(x) = ω_j h_j^* y_j, với y_j^* ∈ ∂h_j(x) (tương ứng y_j^* ∈ ∂(−h_j)(x) khi ω_j = −1) Chú ý rằng ω_j = 1 (tương ứng y_j^* ∈ ∂h_j(x)) hoặc ω_j = −1 (tương ứng y_j^* ∈ ∂(−h_j)(x)) Nếu Ω lồi, f_k (k ∈ K) và g_i (i ∈ I) lồi, h_j (j ∈ J) affine thì (f, g, h) là L−lồi bất biến trên Ω tại mọi x ∈ Ω với v = x − x Định lý 1.4 cho x ∈ C và giả sử (f, g, h) là L−lồi bất biến trên Ω tại x Nếu x thỏa mãn (1.25) thì x ∈ S_p(P).
Chứng minh Giả sử tồn tại λ k > 0, k ∈ K, à i ≥ 0, i ∈ I và γ j ≥ 0, j ∈ Ω thỏa món (1.25) Khi đú, tồn tại z k ∗ ∈ ∂f k (x), k ∈ K, x ∗ i ∈ ∂g i (x) với à i g i (x) 0, i ∈ I và y j ∗ ∈ (∂hj(x)∪∂(−hj)(x)), j ∈ J sao cho
Do tính chất L - lồi bất biến của (f, g, h) trên Ω tại x, với mỗi x ∈Ω ta có v ∈ N(x,Ω) o sao cho
P k∈K λ k hz k ∗ , vi+P i∈I à i hx ∗ i , vi+ P j∈J γ j hy j ∗ , vi
≤ X k∈K λk[fk(x)−fk(x)] +X i∈I ài[gi(x)−gi(x)] +X j∈J
1 ω j γj[hj(x)−hj(x)], trong đó ωj ∈ {−1,1} Từ định nghĩa của nón cực (1.1), từ (1.32) và v ∈ N(x,Ω) o ta suy ra
0 ≤ X k∈K λkhz k ∗ , vi+X i∈I àihx ∗ i , vi+X j∈J γjhy j ∗ , vi
Vì vậy, X k∈K λkfk(x)+X i∈I àigi(x)+X j∈J σjhj(x) ≤ X k∈K λkfk(x)+X i∈I àigi(x)+X j∈J σjhj(x), trong đó σ j = γ j ωj
∈ R, j ∈ J Chỳ ý rằng à i g i (x) = 0, i ∈ I và h j (x) 0, j ∈ J Do đó, khi x∈ C,
Từ đó suy ra x ∈ S p (P) Định lý được chứng minh
Một điểm thỏa mãn điều kiện (1.25) không nhất thiết là nghiệm hữu hiệu chính của bài toán (1.11), ngay cả trong trường hợp trơn và khi tính chất L - lồi bất biến trên Ω tại điểm xc của (f, g, h) không đúng Điều này được minh họa bằng ví dụ sau.
Đối ngẫu cho nghiệm hữu hiệu chính thường
Cho z ∈ ℝ^n, λ = (λ_k) với λ_k > 0 (k ∈ K) và α = (α_i) với α_i ≥ 0 (i ∈ I); ta đặt fe(z, λ, α, γ) dựa trên f(z) và các thành phần liên quan đến g(z) và h(z) cùng với các tham số λ, α và γ, e = (1, …, 1) ∈ ℝ^m Với bài toán tối ưu đa mục tiêu có ràng buộc (P) được cho trong (1.11), ta xét bài toán đối ngẫu đa mục tiêu Dw theo nghĩa Wolfe với mục tiêu tối đa hóa các hàm đối ngẫu liên quan Fe được hiểu là hàm tổng hợp mô tả mức độ tối ưu của z thông qua f, g, h và các tham số λ, α, γ cùng vector e, nhằm kết nối bài toán tối ưu đa mục tiêu có ràng buộc (P) với bài toán đối ngẫu Dw theo Wolfe và từ đó phân tích các điều kiện tối ưu cũng như tính khả thi của nghiệm tối ưu nhiều mục tiêu.
Tập chấp nhận được C w được xác định bởi
Chú ý rằng nghiệm hữu hiệu địa phương (tương ứng nghiệm hữu hiệu chính thường địa phương) của bài toán đối ngẫu (1.33) được định nghĩa tương tự như trong định nghĩa (1.11) bằng việc thay −R m + (tương ứng intR m +) bởi R m + (tương ứng -intR m +) Tập các nghiệm hữu hiệu (tương ứng nghiệm hữu hiệu chính thường) của bài toán (1.33) được kí hiệu bởi S(Dw) (tương ứng Sp(Dw)) Để thuận tiện, ta sử dụng kí hiệu: uv ⇔ u−v ∈ −Rm+ \ {0}, uv là phủ định của uv Định lý sau miêu tả quan hệ đối ngẫu yếu giữa bài toán cơ sở (P) trong (1.11) và bài toán đối ngẫu Dw trong (1.33) Định lý 1.5 (Đối ngẫu yếu) Giả sử x ∈ C và (z, λ, α, γ) ∈ Cw Nếu (f, g, h) là L - lồi bất biến trên Ω tại z, thì f(x) ≤ f(z, λ, α, γ).
K, à = ài, ài ≥ 0, x ∗ i ∈ ∂gi(z), i ∈ I và γ := (γj), γj ≥ 0, y j ∗ ∈ ∂hj(z)∪
Giả sử ngược lại, f(x) fe(z, λ, à, γ) (1.37)
Do λ∈ int R m +, ta cú hλ, f(x)−fe(z, λ, à, γ)i < 0 Điều này tương đương với bất đẳng thức sau hλ, f(x)−f(z)i − hà, g(z)i − hγ, h(z)i < 0 (1.38)
Do tính chất L - lồi bất biến của (f, g, h) trên Ω tại z, với mỗi x như vậy tồn tại v ∈ N(z,Ω) o sao cho
P k∈K λkhz k ∗ , vi+P i∈I àihx ∗ i , vi+ P j∈J γjhy j ∗ , vi
1 ω j γ j [h j (x)−h j (z)], trong đó ωj ∈ {−1,1} Từ định nghĩa của nón cực (1.1), từ (1.34) và v ∈ N(z,Ω), ta suy ra
0 ≤ X k∈K λ k hz k ∗ , vi+X i∈I à i hx ∗ i , vi+X j∈J γ j hy j ∗ , vi.
Như vậy, bằng cách đặt σj := γj ω j ∈R, j ∈ J, ta có
0 ≤ hλ, f(x)−f(z)i+hà, g(x)−g(z)i+hσ, h(x)−h(z)i (1.39) trong đúσ = (σ j ), j ∈ J Do x∈ C, ta suy ra hà, g(x)i ≤ 0 và hσ, h(x)i 0 Vì vậy, (1.39) trở thành
Chú ý rằng kσk = kγk, do kσjk = kγjk, với mọi j ∈ J Kết hợp (1.36), (1.38), (1.40) ta đi đến mâu thuẫn Định lý được chứng minh
Ví dụ sau chỉ ra rằng tính chất L - lồi bất biến của (f, g, h) trên Ω ở định lý trên không thể bỏ được.
Ví dụ 1.6 cho f: R → R^2 được xác định bởi f(x) = (f1(x), f2(x)) với f1(x) = f2(x) = x^5, và gọi g, h: R → R được xác định bởi g(x) = −|x| và h(x) = x^2 + x Xét bài toán (1.11) với m = 2, Ω = R Khi đó C = {−1, 0} và ta lấy x = −1 ∈ C Xét bài toán đối ngẫu D_w trong (1.33) Chọn z = 0 ∈ Ω.
, à = 1 và γ = 1 ta cú (z, λ, à, γ) ∈ C w Ta thấy (f, g, h) khụng là L - lồi bất biến trên Ω tại x Khi đó, f(x) = (−1,−1) (0,0) = fe(z, λ, à, γ)i.
Nhận xét 1.2 cho thấy khác biệt rõ rệt so với các kết quả trước về đối ngẫu trong tối ưu đa mục tiêu Ở đây tồn tại quan hệ h(z) ∈ (γ−S(0, kγk)) o (1.41) khi được biểu diễn trong tập ràng buộc Cw của bài toán đối ngẫu được trình bày trong (1.34) Quan hệ này làm rõ cách diễn đạt giới hạn ràng buộc của bài toán đối ngẫu và nhấn mạnh sự khác biệt so với các kết quả trước đó về đối ngẫu đa mục tiêu.
Quan hệ (1.41) không xuất hiện trong các bài toán khởi phát không có ràng buộc đẳng thức, tức là J = ∅; với các bài toán khởi phát có ràng buộc đẳng thức, quan hệ này tự động thỏa mãn khi h = 0, tuy nhiên quan hệ đã nêu trên lại là một điều kiện có sẵn của bài toán với h6= 0 Định lý tiếp theo trình bày một mối đối ngẫu mạnh giữa bài toán khởi phát (P) trong (1.11) và bài toán đối ngẫu (Dw) trong (1.33) Định lý 1.6 (Đối ngẫu mạnh) cho biết: giả sử x ∈ locS p (P) sao cho điều kiện CQ được xác định trong Định nghĩa 2.1 thỏa mãn tại điểm đó; khi đó tồn tại λ = (λk) với λk > 0, k ∈ K, α = (αi) với αi ≥ 0, i ∈ I, và γ = (γj) với γj ≥ 0, j ∈ J, sao cho các điều kiện đối ngẫu liên quan được thỏa mãn.
0, j ∈ J sao cho (x, λ, à, γ) ∈ C w và f(x) := f(x, λ, à, γ) Hơn nữa, nếu (f, g, h) là L - lồi bất biến trờn Ω tại mọi z ∈ Ω, thỡ (x, λ, à, γ) ∈ S(D w ).
Chứng minh Theo Định lý 1.3, x thỏa mãn (1.25) nghĩa là tồn tại λk > 0, k ∈
Trong khuôn khổ bài toán tối ưu, ta xét các tập chỉ số J, K, I cùng các véc-tơ λ=(λk) với λk>0, à=(ài) với ai≥0 và γ=(γj) với γj>0, j∈J, đồng thời với hλ, ei=1 và à := (ài) Ta nhận thấy công thức (1.42) vẫn đúng khi ta thay lần lượt λk, ài, γj bằng λk, ài, γj Xét x∈C ta có h_j(x)=0 với mọi j∈J; từ đó suy ra h_{γ}−σ, ⟨h(x),i⟩=0 với mọi σ=(σj) sao cho kσk=kγk, nghĩa là h(x)∈(γ−S(0,kγk))⊖ Do đó, x, λ, à, γ∈Cw Tiếp đó, g(x)i=hγ, ⟨h(x),i⟩=0 nên f(x)=f(x)+h_a, g(x)i e+hγ, ⟨h(x),i⟩e = f_e(x,λ,à,γ)i (1.43) Giả sử (f,g,h) là L‑lồi bất biến trên Ω với mọi z∈Ω Sử dụng kết quả đối ngẫu yếu trong Định lý 1.5 ta khẳng định f(x) ≤ f(z,λ,à,γ) với mọi (z,λ,à,γ)∈…
Cw Từ đú và (1.43) ta suy ra (x, λ, à, γ) ∈ S(Dw)
Cần nhận thấy điều kiện CQ ở định lý trên đóng vai trò quan trọng Nếu x là nghiệm hữu hiệu chính, thường địa phương, của bài toán xuất phát và điều kiện CQ không thoả mãn, ta có thể không tìm được bộ ba (λ, α, γ) như mô tả trong Định lý 1.6 để sao cho (x, λ, α, γ) thuộc tập chấp nhận được của bài toán đối ngẫu Trong trường hợp này, quan hệ đối ngẫu mạnh sẽ không được thiết lập Để thấy rõ điều này, ta xem lại
Nhận xét 1.3 cho thấy kết quả đối ngẫu mạnh được trình bày trong Định lý 1.6 không xuất hiện một cách thông thường Cụ thể, nghiệm của bài toán đối ngẫu không phải là nghiệm tối ưu chính thường của bài toán gốc, mà chỉ là một nghiệm tối ưu của bài toán đối ngẫu, cho thấy hai bài toán có thể có nghiệm tối ưu khác nhau Ví dụ sau cho thấy nói chung ta không thể thu được nghiệm tối ưu chính thường cho bài toán đối ngẫu, kể cả khi bài toán là lồi Tuy nhiên, với một số giả thiết bổ sung, ta có thể thu được nghiệm tối ưu chính thường cho bài toán đối ngẫu.
Ví dụ 1.7 Cho f : R → R 2 được xác định bởi f(x) := (f1(x), f2(x)), trong đó f 1 (x) := x, f 2 (x) := −x và g : R → R được xác định bởi g(x) = x − 1 với x ∈ R Xét bài toán (1.11) với m = 2, Ω = R, I {1}, J = ∅ thì C = (−∞,1] và chọn x= 0 ∈ C Suy ra x := 0 ∈ S p (P), vì 1
Xét bài toán đối ngẫu (Dw) trong (1.33) Tập ràng buộc
Cw := {(z, λ, à)|λ1 −λ2+à = 0, λ1 +λ2 = 1}, trong đó z ∈ R, λ := (λ1, λ2), λ1 > 0, λ2 > 0, à ≥ 0 Hàm mục tiêu fe(z, λ, à) := (fe1(z, λ, à),fe2(z, λ, à)) với fe1(z, λ, à) := z + à(z − 1) và fe2(z, λ, à) := −z + à(z − 1) Ta thấy điều kiện (CQ) thỏa mãn tại x Vì fk, k = 1,2 và g là hàm lồi, (f, g) là L - lồi bất biến trên Ω tại mọi z ∈ Ω Theo Định lý 1.6 tồn tại λ := (λ1, λ2) với λ1 > 0, λ2 > 0 và à ≥ 0 sao cho (x, λ, à) ∈ S(D w ).
Ta sẽ chỉ ra rằng (x, λ, à) ∈ S/ p (Dw) Thật vậy, giả sử ngược lại, (x, λ, à)∈ S p (D w ), nghĩa là tồn tại (β 1 , β 2 )∈ intR 2 + sao cho β1fe1(z, λ, à) +β2fe2(z, λ, à) ≤ β1fe1(x, λ, à)
Với bất kỡ à ∈ (0,1), lấy λ = (λ 1 , λ 2 ) với λ 1 = 1−à
2 ta có (z, λ, à) ∈ Cw, ∀z ∈ R Hơn nữa, với mọi z ∈R đủ lớn, fe 1 (z, λ, à)−fe 1 (x, λ, à) =z(1 +à)−à+à > 0, fe2(x, λ, à)−fe2(z, λ, à) = z(1−à) +à−à > 0,
Do đó và từ (1.44) ta thu được β1 β 2 ≥ fe1(z, λ, à)−fe1(x, λ, à) fe 2 (x, λ, à)−fe 2 (z, λ, à) = z(1 +à)−à+à z(1−à) +à−à (1.45)
Vỡ phõn số cuối trong (1.45) tiến đến vụ cựng khi à → 1 và z → ∞ nờn ta thu được mâu thuẫn.
Chương 2 Điều kiện tối ưu và đối ngẫu cho các nghiệm hữu hiệu và nghiệm hữu hiệu yếu của bài toán tối ưu đa mục tiêu không trơn
Chương 2 trình bày các điều kiện cần thiết cho nghiệm hữu hiệu yếu và nghiệm hữu hiệu của bài toán tối ưu đa mục tiêu với ràng buộc đẳng thức và bất đẳng thức, được xây dựng trên công cụ giải tích biến phân của T.D Chuong và D.S Kim [3] Các điều kiện đủ cho nghiệm hữu hiệu yếu và nghiệm hữu hiệu được đưa ra đi kèm với giả thiết về tính lồi suy rộng và diễn giải dưới ngôn ngữ vi phân giới hạn Chương này cũng trình bày các định lý đối ngẫu yếu, các định lý mạnh theo Wolfe và Mond–Weir.
2.1 Các kết quả bổ trợ
Ta kí hiệu chuẩn trong không gian tuyến tính định chuẩn là k.k Trong không gianX×Y thì chuẩn được xác định bởik(x, y)k =kxk+kyk, ∀x∈
X và y ∈ Y Cặp chính tắc giữa không gian X và đối ngẫu X* được ký hiệu bằng ⟨·,·⟩ Ký hiệu B_X(x, r) là hình cầu đóng trong X có tâm ở x ∈ X và bán kính r > 0; hình cầu đóng đơn vị trong X thường ký hiệu là B_X(0,1) = B_X Bao đóng và phần trong của Ω ⊂ X được ký hiệu tương ứng là cl Ω và int Ω Nón cực của Ω ⊂ X là tập hợp { x* ∈ X* : ⟨x*, x⟩ ≤ 0 với mọi x ∈ Ω }. -**Support Pollinations.AI:**🌸 **Quảng cáo** 🌸 Bạn là người sáng tạo nội dung? Tối ưu hóa bài viết với [Pollinations.AI](https://pollinations.ai/redirect/kofi) và nhận hỗ trợ SEO chuyên sâu!
Trong chương này, X được giả thiết là không gian Ausplund, nghĩa là X là một không gian Banach sao cho mọi không gian con tách được của X đều có đối ngẫu tách được Tính chất Ausplund này đóng vai trò nền tảng cho việc phân tích cấu trúc và hành vi của X, đặc biệt là khi xét các không gian con tách được và đối ngẫu của chúng trong ngữ cảnh lý thuyết không gian Banach.
Nhắc lại: Không gian định chuẩn X (vô hạn chiều) được gọi là tách được nếu X có một tập con đếm được trù mật trong X.
Kí hiệu R m + là orthant không âm của R m với m ∈N, m :={1,2, }.
Cho hàm đa trị F :X ⇒X ∗ từ X vào X ∗ Ta kí hiệu Limx→x supF(x) := {x ∗ ∈ X ∗ | ∃xn →x, x ∗ n w
−→ x ∗ , x ∗ n ∈F(xn), ∀n ∈ N} là giới hạn trên/ ngoài Painlevé - Kuratowski dãy củaF khi x→ x, trong đó kí hiệu w
−→ chỉ sự hội tụ theo tô pô yếu của X* Trong không gian X, tập hợp Ω ⊂ X được coi là đóng quanh một x ∈ Ω nếu tồn tại một lân cận U của x sao cho Ω ∩ clU là một tập đóng Ω được gọi là đóng địa phương nếu Ω bị đóng quanh x với mọi x ∈ Ω.
Các nón pháp tuyến Fréchet của Ω quanh x∈ Ω được xác định bởi
Nb(x,Ω) :( x ∗ ∈ X ∗ | Lim sup x −→x Ω hx ∗ , x−xi kx−xk ≤ 0
, (2.1) trong đó x−→ Ω x nghĩa là x→ x với x ∈ Ω.
Nếu x /∈ Ω ta đặt Nb(x,Ω) =∅. Nón pháp tuyến Mordukhovich Nb(x,Ω) của Ω tại x ∈ Ω nhận được từ nón pháp tuyến Fréchet bằng cách lấy giới hạn trên Painlevé - Kuratowski dãy như sau
Trong phân tích trên không gian metric X, ta nhắc lại khái niệm cực trị địa phương của một tập hợp Với hai tập Ω1 và Ω2 ⊆ X, x ∈ Ω1 ∩ Ω2 được gọi là một điểm cực trị địa phương của Ω1 và Ω2 trong X khi tồn tại một lân cận mở U chứa x sao cho với mọi ε > 0 tồn tại một vectơ a sao cho ||a|| ≤ ε và x + a ∈ Ω1 ∩ Ω2 Điều kiện này cho thấy quanh x luôn xuất hiện các điểm thuộc giao Ω1 ∩ Ω2 ở mọi khoảng cách nhỏ, chứng tỏ x là một điểm giới hạn địa phương của giao Khái niệm này hữu ích cho việc nhận diện cấu trúc lân cận của các tập hợp và có ứng dụng trong tối ưu hóa, phân tích tập hợp và lý thuyết không gian.
Chú ý rằng điều kiện Ω1 ∩ Ω2 = {x} không nhất thiết kéo theo x là một điểm cực trị địa phương của {Ω 1 ,Ω2} Để minh họa điều này, ta xét
Giả sử X là không gian Asplund, nguyên lý cực trị xấp xỉ đúng trong X nghĩa là, nếu x ∈ Ω 1 ∩Ω 2 là một điểm cực trị địa phương của Ω 1 và Ω 2 , thì với mọi ε > 0, tồn tại x 1 ∈ Ω 1 ∩B X (x, ε), x 2 ∈ Ω 2 ∩B X (x, ε), x ∗ ∈
Cho hàm thực mở rộng ϕ :X →R := [−∞,∞] Ta đặt domϕ :={x∈ X |ϕ(x) < ∞}, epiϕ :={(x, à) ∈X ìR|à ≥ ϕ(x)}.
Dưới vi phân Mordukhovich và dưới vi phân Fréchet của ϕ tại x∈ X với
Cho f : X → R m và y ∗ ∈ R m , ta định nghĩa hy ∗ , fi(x) := hy ∗ , f(x)i, x ∈
Các kết quả tiếp theo là các công thức vô hướng hóa của đối đạo hàm.
Bổ đề 2.1 [7, 8] Cho y ∗ ∈R m và f : X → R m là hàm liên tục Lipschitz quanh x∈ X Ta có
Quy tắc tổng dưới vi phân giới hạn sau là cần thiết có các chứng minh tiếp theo.
Điều kiện tối ưu
Phần này trình bày các điều kiện tối ưu cho bài toán tối ưu đa mục tiêu.
ChoΩlà tập con khác rỗng, đóng địa phương của X vàK :={1,2, , m};
I := {1,2, , p} ∪ ∅, J := {1,2, , q} ∪ ∅ là các tập chỉ số Giả sử f := (f 1 , f 2 , , f m ); g := (g 1 , g 2 , , g p ) và h := (h 1 , h 2 , , h q ) là các hàm vectơ với thành phần Lipschitz địa phương trên X Sau đây, Ω luôn được giả thiết là (SNC) tại điểm đang được xét, giả định này tự động được thỏa mãn khi X là không gian hữu hạn chiều.
Xét bài toán tối ưu đa mục tiêu có ràng buộc (P) sau: min
{f(x)|x∈ C}. Ở đây, tập C được xác định bởi
C := {x ∈ Ω|g i (x) ≤ 0, i ∈ I, h j (x) = 0, j ∈J} (2.7) Định nghĩa 2.1 (i) Ta nói rằng x ∈C được gọi là nghiệm hữu hiệu của bài toán (P) và viết x ∈ S(P), nếu
(ii) Điểmx ∈ C được gọi là nghiệm hữu hiệu yếu của bài toán (P) và viết x∈ S w (P), nếu
I(x) := {i ∈ I |gi(x) = 0}, J(x) := {j ∈ J |hj(x) = 0}. Định nghĩa 2.2 Ta nói điều kiện (CQ) thỏa mãn tại x ∈ Ω nếu không tồn tại βi ≥ 0, i ∈I(x) và γj ≥ 0, j ∈J(x) sao cho
Khi xét x ∈ C trong (2.7) với Ω = X, điều kiện (CQ) thỏa mãn do điều kiện chính quy Mangasarian - Fromovitz trong bài toán trơn.
Bây giờ ta phát biểu điều kiện Karush - Kuhn - Tucker (KKT) Điểmx∈ C thỏa mãn điều kiện (KKT) nếu tồn tại λ := (λ1, λ2, , λm) ∈
Với f, g, h là các hàm trơn, điều kiện (2.8) được xem như điều kiện Karush–Kuhn–Tuhn (KKT) cổ điển cho bài toán tối ưu có ràng buộc Định lý 2.1 cho ta một điều kiện cần cho nghiệm hữu hiệu (hoặc yếu) của bài toán (P) khi CQ được thỏa mãn tại x ∈ Ω Cụ thể, nếu x ∈ S_w(P) thì x thỏa mãn điều kiện (KKT).
Chứng minh Đặt y := f(x) và giả sử f là hàm Lipschitz quanh x với hằng số
` > 0 Trước hết, ta chứng minh rằng với mỗi k ∈ N, tồn tại x 1k ∈
Nb(x 1k ;C) với kx ∗k k ≤`+ 1 và λ k ∈ Nb(y k ;y −R m +) với kλ k k = 1 sao cho
Ta thấy rằng, (x, y) là một diểm cực trị địa phương của {Ω 1 ,Ω 2 } Nếu không, đối với bất kì lân cận U nào của (x, y) tồn tại εU >0 sao cho với mỗi a∈ ε U B X × R m ,
Do đó, ta chọn a := (a 1 , a 2 ) ∈ ε U B X × R m với a 1 := 0 ∈ X, a 2 ∈ − intR m +.
Do (2.10), tồn tại (x, f(x)) ∈ U thỏa mãn
(x, f(x))∈ C ×(y−R m +) + (0, a 2 ). Điều này kéo theo x ∈C và f(x)−y ∈a 2 −R m + Mối quan hệ thứ hai cho ta f(x)−f(x) ∈ −intR m +, mâu thuẫn vớix ∈ S w (P) Vậy, (x, y) là một điểm cực trị địa phương của {Ω1,Ω2}.
Ta chọn ε k > 0 thỏa mãn εk 0, ta chia (2.16) cho ky k 1∗ k Đặt x ∗k := x 1∗ k ky 1∗ k k ∈ Nb(x 1k ;C), λ k := y k 1∗ ky k 1∗ k ∈ Nb(y k ;y − R m +), ta có ||λ k|| = 1 và ||x ∗k|| ≤ ε + 1, trong đó bất đẳng thức đúng do (2.17) và (2.11) Sử dụng (2.11) một lần nữa, ta có (2.9) từ (2.16).
Tiếp theo, ta chỉ ra sự tồn tại của λ ∈ N(y, y −R m +) với kλk = 1 sao cho
Theo sự khẳng định trong (2.9), chuỗi {x ∗k } và {λ k } bị chặn Hơn thế, do X là Asplund, không mất tính chất tổng quát ta giả sử rằng x ∗k w
Xét một vector x* ∈ X* và một dãy λ_k ∈ R^m sao cho λ_k → λ khi k → ∞ với ||λ_k|| = 1 Theo định nghĩa nón pháp tuyến Mordukhovich (như ở (2.2)) ta có x* ∈ N(x, C) và λ ∈ N(y; y − R^m_+) Ngoài ra, từ (2.9) suy ra với mỗi k ∈ N tồn tại x* k ∈ ∂h_{λ_k} b_k và b* k ∈ B_{X*} sao cho e x* k := − x* k − (1/k) b* k Như trên, không mất tính tổng quát, ta giả sử rằng b* k đáp ứng các điều kiện đã nêu và tiếp tục thảo luận với các yếu tố tương ứng.
−→∗ b ∗ ∈BX khi k → ∞, và do đó xe ∗k −→ −x w ∗ ∗ khi k → ∞ Theo Bổ đề 2.1 bao hàm thức x ∗k ∈∂hλb k , fi(x 2k ) tương đương với
, k ∈ N (2.20) Cho k → ∞ trong (2.20) và lưu ý (2.2) ta nhận được
(−x ∗ ,−λ) ∈ N((x, f(x)); gphf). Điều này tương đương với
−x ∗ ∈ ∂hλ, fi(x) do Bổ đề 2.1 Vì thế, (2.19) được chứng minh. Đặt
Khi đó, ta cóC = Ω∩Ω Điều kiện (CQ) thỏa mãn tạie x, cho nên không tồn tạiβi ≥ 0, i ∈ I(x)và γj ≥ 0, j ∈ J(x) =J sao cho P i∈I(x) βi+ P j∈J (x) γj 6= 0 và
(2.21) bởi vì điều kiện (CQ) thỏa mãn tại x vàΩ được giả thiết là SNC tại điểm này, áp dụng Bổ đề 2.4 ta có
N(x;C) = N(x;Ωe ∩Ω) ⊂ N(x;Ω) +e N(x; Ω). Điều này cùng với (2.19) và (2.21) dẫn đến
Do λ∈ N(y;y−R m +) = R m +, ta có thể giả định rằng λ := (λ 1 , λ 2 , , λ m ) ∈
R m + Sử dụng quy tắc tổng (2.6), do (2.22) ta nhận được
Cuối cùng, lấy βi := 0 với i /∈ I(x), từ (2.23) ta suy ra x thỏa mãn điều kiện (KKT) Định lý được chứng minh
Ví dụ đơn giản dưới đây cho thấy kết luận của Định lý 2.1 có thể không đúng khi điều kiện (CQ) không được thỏa mãn tại điểm được xét Điều kiện CQ đóng vai trò quyết định trong phạm vi áp dụng của Định lý và khi CQ không được đảm bảo, các kết luận của định lý có thể sai lệch ở điểm xét Ví dụ minh hoạ cho thấy sự phụ thuộc giữa giả thiết CQ và kết quả của Định lý 2.1, nhờ đó ta hiểu rõ lý do vì sao CQ cần được kiểm tra kỹ ở mỗi điểm trước khi khẳng định kết quả.
Ví dụ 2.1 cho f: R → R^2 được xác định bởi f(x) = (f1(x), f2(x)) với f1(x) = f2(x) = x, x ∈ R, và g, h: R → R được xác định bởi g(x) = x^2, h(x) = 0 Xét bài toán tối ưu (P) với m = 2 và Ω = R Trong trường hợp này C = {0}, và x = 0 ∈ S_w(P) (= S(P)) Có thể dễ dàng nhận thấy điều kiện CQ không thỏa tại x, đồng thời x cũng không thỏa mãn điều kiện KKT.
Nhìn chung, một điểm thỏa mãn (KKT) của bài toán (2.8) chưa chắc đã là nghiệm hữu hiệu yếu của bài toán (P), ngay cả khi bài toán được xem là trơn Điều này được minh họa bằng ví dụ sau đây.
Ví dụ 2.2 cho f: R → R^2 được xác định bởi f(x) := (f1(x), f2(x)) với f1(x) = f2(x) := x^3, g(x) := −x^2 và h(x) := 0, x ∈ R Xét bài toán (P) với m = 2, Ω = R Trong trường hợp này thì C = R, và do đó x = 0 ∈ C; ta thấy x thỏa mãn điều kiện KKT, tuy nhiên x ∉ S_w(P) Để trình bày các điều kiện đủ tối ưu cho nghiệm hữu hiệu (yếu) của bài toán tối ưu (P), trong định lý tiếp theo, chúng ta cần các khái niệm lồi affine suy rộng cho hàm Lipschitz địa phương Định nghĩa 2.3 (i) Ta nói (f, g, h) là L - lồi bất biến trên Ω tại x ∈ Ω nếu với mọi x ∈ Ω, z_k^* ∈ ∂f_k(x), k ∈ K, x_i^* ∈ ∂g_i(x) i ∈ I, y_j^* ∈ ∂h_j(x) ∪
∂(−hj)(x)j ∈J, tồn tại v ∈ N(x; Ω) o sao cho fk(x)−fk(x) ≥ hz ∗ k , vi, k ∈ K, g i (x)−g i (x) ≥ hx ∗ i , vi, i ∈ I, hj(x)−hj(x) =ωjhy ∗ j , vi, j ∈ J, trong đó ω j = 1 (tương ứng ω j = −1) khi y j ∗ ∈ ∂h j (x) (tương ứng y j ∗ ∈ ∂(−hj)(x)).
(ii) Ta nói (f, g, h) là L - lồi bất biến chặt trên Ω tại x ∈ Ω nếu với mọi x ∈ Ω\ {x}, z k ∗ ∈ ∂f k (x), k ∈ K, x ∗ i ∈ ∂g i (x)i ∈ I, y ∗ j ∈ ∂h j (x)∪
∂(−hj)(x)j ∈J, tồn tại v ∈ N(x; Ω) o sao cho f k (x)−f k (x) > hz k ∗ , vi, k ∈ K, gi(x)−gi(x) ≥ hx ∗ i , vi, i ∈ I, h j (x)−h j (x) =ω j hy ∗ j , vi, j ∈ J, trong đó ωj = 1 (tương ứng ωj = −1) khi y j ∗ ∈ ∂hj(x) (tương ứng y j ∗ ∈ ∂(−h j )(x)).
Chú ý rằng, nếu Ω là tập lồi, f_k (k ∈ K) và g_i (i ∈ I) là các hàm lồi, và h_j (j ∈ J) là các hàm affine, thì (f, g, h) là L - lồi bất biến trên Ω tại x ∈ Ω với v := x−x cho mỗi x ∈ Ω; Định lý 2.2 cho biết rằng giả sử x ∈ C thỏa mãn điều kiện (KKT).
(i) Nếu (f, g, h) là L - lồi bất biến trên Ω tại x thì x ∈S w (P).
(ii) Nếu (f, g, h) là L - lồi bất biến chặt trên Ω tại x thì x∈ S(P).
Do x∈ C thỏa mãn điều kiện (KKT) nên tồn tại λ := (λ 1 , λ 2 , , λ m ) ∈
∂fk(x), k ∈ K, x ∗ i ∈ ∂gi(x), i ∈ I với àigi(x) = 0 và y j ∗ ∈ ∂hj(x) ∪
Trước hết ta chứng minh (i) Giả sử ngược lại x /∈ S w (P) Điều này có nghĩa là tồn tại xb∈ C sao cho f(x)b −f(x) ∈ −intR m + (2.25)
Theo định nghĩa của nón cực và do (f, g, h) là L - lồi bất biến, từ (2.24) ta suy ra với xbnhư vậy thì tồn tại v ∈ N(x; Ω) o sao cho
0 ≤ P k∈K λ k hz k ∗ , vi+P i∈I à i hx ∗ i , vi+ P j∈J γ j hy j ∗ , vi
≤ P k∈K λk[fk(x)b −fk(x)]+P i∈I ài[gi(x)b −gi(x)]+P j∈J
≤ X k∈K λ k f k (bx) +X i∈I à i g i (x) +b X j∈J σ j h j (x).b trong đó, σj = γj ω j ∈ R, j ∈ J Để ý rằng àigi(x) = 0, àigi(bx) ≤ 0i ∈ I và hj(x) = 0, hj(x) = 0, jb ∈ J Vì vậy, ta có
Do đó, tồn tại k 0 ∈ K sao cho f k 0 (x) ≤ f k 0 (x),b (2.26) bởi vì λ ∈ R m + \ {0} Kết hợp (2.26) với (2.25) dẫn đến một mâu thuẫn. Điều đó chứng tỏ (i) đúng.
Giờ ta sẽ chứng minh (ii) Giả sử ngược lại, x /∈ S(P) Điều đó có nghĩa là tồn tại bx∈ C sao cho f(bx)−f(x) ∈ −R m + \ {0} (2.27)
Theo định nghĩa của nón cực và do (f, g, h) là L - lồi bất biến chặt, và λ ∈R m + \ {0}, ta suy ra từ (2.24) rằng với xbnhư vậy, tồn tại v ∈ N(x; Ω) o sao cho
0 ≤ P k∈K λ k hz k ∗ , vi+P i∈I à i hx ∗ i , vi+ P j∈J γ j hy j ∗ , vi
< P k∈K λk[fk(bx)−fk(x)]+P i∈I ài[gi(bx)−gi(x)]+P j∈J
Do đó, X k∈K λ k f k (x)+X i∈I à i g i (x)+X j∈J σ j h j (x) < X k∈K λ k f k (bx)+X i∈I à i g i (bx)+X j∈J σ j h j (bx), trong đó, σj = γ j ωj
∈ R, j ∈ J Ta cú àigi(x) = 0, àigi(x)b ≤ 0i ∈ I và hj(x) = 0, hj(x) = 0b j ∈J Vì vậy, ta có
≤ P k∈K λ k f k (x).b Điều này kéo theo tồn tại k0 ∈K sao cho f k 0 (x) < f k 0 (x).b
Cùng với (2.27) ta đẫn đến mâu thuẫn Do đó (ii) đúng Định lý được chứng minh.
Các định lý đối ngẫu
Đối ngẫu kiểu Wolfe
Cho z ∈ X, λ := (λ1, , λm) ∈ R m +, à := (à1, à2, , àp) ∈ R p +, γ :(γ1, γ2, , γq) ∈ R q + và e := (1, ,1) ∈ R m Trong bài toán (P), ta xem xét bài toán tối ưu đa mục tiêu đối ngẫu kiểu Wolfe của bài toán (P): max
{fe(z, λ, à, γ) := f(z)+hà, g(z)ie+hγ, h(z)ie|(z, λ, à, γ) ∈Cw} (Dw) Ở đây, tập ràng buộc Cw được xác định bởi
Cw :(z, λ, à, γ) ∈ ΩìR m + ìR p +ìR q + |0 ∈ X k∈K λk∂fk(z)
+X i∈I ài∂gi(z) +X j∈J γj(∂hj(z)∪∂(−hj)(z)) +N(z,Ω), hλ, ei = 1, h(z) ∈ (γ−S(0,kγk)) o
Một nghiệm hữu hiệu (nghiệm hữu hiệu yếu) của bài toán "max" khi xem như bài toán đối ngẫu (D_w) được định nghĩa tương tự như Định nghĩa 2.1 bằng cách thay thế -R_m^+ và -intR_m^+ bằng R_m^+ và intR_m^+ Ta ký hiệu tập nghiệm hữu hiệu (nghiệm hữu hiệu yếu) của bài toán (D_w) lần lượt là S(D_w) và S_w(D_w).
Để thuận tiện, các ký hiệu được sử dụng như sau: u ≺ v ⇔ u − v ∈ −intRm+, u ⊀ v là phủ định của u ≺ v, u ≼ v ⇔ u − v ∈ −Rm+ \ {0}, và u ≽ v là phủ định của u ≼ v Định lý sau mô tả mối quan hệ đối ngẫu yếu giữa bài toán xuất phát (P) và bài toán (Dw) Định lý 2.3 (Đối ngẫu yếu) giả sử x ∈ C và cho (z, λ, α, γ) ∈ Cw (i) Nếu (f, g, h) là L‑lồi bất biến trên Ω tại z thì f(x) ⊀ fe(z, λ, α, γ).
(ii) Nếu (f, g, h) là L - lồi bất biến chặt trên Ω tại z thì f(x) fe(z, λ, à, γ).
Do (z, λ, à, γ) ∈ Cw, tồn tại λ := (λ1, , λm) ∈R m +, à := (à1, à2, , àp)
∈ R p +, γ := (γ 1 , γ 2 , , γ q ) ∈ R q +, z k ∗ ∈ ∂f k (z), k ∈ K, x ∗ i ∈ ∂g i (z), i ∈ I và y j ∗ ∈ ∂hj(z)∪∂(−hj)(z), j ∈ j, sao cho
∈ N(z; Ω) (2.29) hλ, ei, hγ −σ, h(z)i ≤ 0, ∀σ ∈ R q , kσk = kγk (2.30) Đầu tiên ta chứng minh (i) Giả sử ngược lại, f(x) ≺ fe(z, λ, à, γ).
Vỡ thế,hλ, f(x)− fe(z, λ, à, γ)i < 0 Điều này tương đương với bất đẳng thức sau: hλ, f(x)−f(z)i − hà, g(z)i − hγ, h(z)i < 0 (2.31)
Theo định nghĩa của nón cực và tính chất L - lồi bất biến của (f, g, h) trên Ω tại z, từ (2.29) ta suy ra với mỗi x, tồn tại v ∈ N(z,Ω) o sao cho
0 ≤ P k∈K λkhz k ∗ , vi+P i∈I àihx ∗ i , vi+ P j∈J γjhy j ∗ , vi
≤ P k∈K λk[fk(x)−fk(z)]+P i∈I ài[gi(x)−gi(z)]+P j∈J
1 ωj γj[hj(x)−hj(z)]. Đặt σj := γj ω j ∈ R, j ∈J, ta có
0 ≤ hλ, f(x)−f(z)i+ hà, g(x)−g(z)i+ hσ, h(x)−h(z)i, (2.32) trong đú, σ := (σ1, , σq) ∈ R q Do x ∈ C nờn ta cú hà, g(x)i ≤ 0, hσ, h(x)i = 0 Vì vậy, (2.32) dẫn đến
Vì kσk =kγk, kết hợp (2.30), (2.31) và (2.33) ta dẫn đến mâu thuẫn Vì vậy (i) đã được chứng minh.
Giờ ta chứng minh (ii) Giả sử ngược lại, f(x) fe(z, λ, à, γ) (2.34)
Vỡ thế, hλ, f(x)−fe(z, λ, à, γ)i ≤ 0 tương đương với bất đẳng thức sau hλ, f(x)−f(z)i − hà, g(z)i − hγ, h(z)i ≤ 0 (2.35)
Từ (2.34) ta có x 6=z Thật vậy, nếu x =z thì f(x)−fe(z, λ, à, γ) =−hà, g(x)ie− hγ, h(x)ie.
Do x ∈ C,hà, g(x)i ≤ 0 và hγ, h(x)i = 0 Vỡ vậy, (2.34) kộo theo
Giả sử g(x) ∈ −R^m_+ \ {0} Điều này không thể xảy ra, nên x ≠ z Từ định nghĩa của nón cực và tính chất L‑lồi bất biến chặt của (f, g, h) trên Ω tại z, dựa theo công thức (2.29) ta suy ra rằng với mọi x, tồn tại v ∈ N(z, Ω) sao cho điều kiện liên quan được thỏa mãn.
0 ≤ P k∈K λkhz k ∗ , vi+P i∈I àihx ∗ i , vi+ P j∈J γjhy j ∗ , vi
0