1. Trang chủ
  2. » Giáo Dục - Đào Tạo

(Luận văn thạc sĩ) về sự phát triển của điều kiện tối ưu trong bài toán quy hoạch lồi

61 6 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 61
Dung lượng 423,4 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

  • 1.1 Tập lồi (7)
    • 1.1.1 Các định nghĩa cơ bản về tập lồi (7)
    • 1.1.2 Toán tử chiếu tập lồi (16)
  • 1.2 Hàm lồi (21)
  • 2.1 Bài toán quy hoạch lồi (27)
  • 2.2 Điều kiện cần và đủ tối ưu (28)
    • 2.2.1 Điều kiện tối ưu theo nguyên lý Fermat của bài toán tối ưu không ràng buộc hàm một biến khả vi 24 (28)
    • 2.2.2 Điều kiện với ràng buộc hình học (37)
    • 2.2.3 Điều kiện có ràng buộc đẳng thức và bất đẳng thức (41)

Nội dung

Tập lồi

Các định nghĩa cơ bản về tập lồi

Một tập C ⊆ R n được xem là tập lồi nếu nó bao gồm tất cả các đoạn thẳng nối giữa bất kỳ hai điểm nào trong tập Điều này có nghĩa là C lồi khi và chỉ khi mọi đoạn thẳng đi qua hai điểm thuộc C cũng nằm hoàn toàn trong C.

Ta nói x là tổ hợp lồi của các điểm (véc - tơ) x 1 , , x k nếu x k

Tương tư, x là tổ hợp a-phin của các điểm (véc - tơ) x 1 , , x k nếu x k

Tập hợp các tổ hợp a-phin của các điểm x1, , xk được gọi là bao a-phin Định lý 1.1.2 khẳng định rằng một tập hợp C là lồi nếu và chỉ nếu nó chứa mọi tổ hợp lồi của các điểm trong tập hợp đó Nói cách khác, C lồi khi và chỉ khi

Để chứng minh điều kiện cần, ta áp dụng phương pháp quy nạp theo số điểm Với k = 2, điều này rõ ràng từ định nghĩa của tập lồi và tổ hợp lồi Giả sử định lý đúng với k−1 điểm, nhiệm vụ còn lại là chứng minh cho trường hợp k điểm.

Giả sử x là tổ hợp lồi của k điểm x 1 , , x k ∈ C Tức là x k

X j=1 λj ξ = 1 và λ j ξ >0 với mọi j = 1, , k−1, nên theo giả thiết quy nạp, điểm y : k − 1

X j=1 λ j = 1, nên x là một tổ hợp lồi của hai điểm y và x k đều thuộc C Vậy x ∈ C

Lớp các tập lồi trong không gian R^n được xác định là đóng với các phép giao, phép cộng đại số và phép nhân tích Descartes Cụ thể, nếu A và B là các tập lồi trong R^n, và C là tập lồi trong R^m, thì các tập hợp sau đây cũng sẽ là tập lồi.

Tập hợp A×C được định nghĩa là tập hợp các điểm x thuộc R n+m, với x được biểu diễn dưới dạng (a, c), trong đó a thuộc A và c thuộc C Điều này có thể được chứng minh dễ dàng từ định nghĩa đã cho Theo định nghĩa 1.1.4, một tập C được gọi là tập a-phin nếu nó chứa đường thẳng đi qua bất kỳ hai điểm nào trong tập của nó.

Tập a-phin là một trường hợp đặc biệt của tập lồi, với các không gian con là ví dụ tiêu biểu Một ví dụ khác về tập a-phin là siêu phẳng, được định nghĩa trong không gian R^n như một tập hợp các điểm có dạng cụ thể.

{x ∈ R n |a T x =α}, trong đó a∈ R n là một véc - tơ khác 0 và α ∈R.

Véc - tơ a, hay véc - tơ pháp tuyến của siêu phẳng, đóng vai trò quan trọng trong việc phân chia không gian thành hai nửa không gian Theo định nghĩa 1.1.6, nửa không gian được xác định là một tập hợp có dạng nhất định.

{x|a T x≥ α}, trong đó a6= 0 và α ∈ R Đây là nửa không gian đóng Tập

{x|a T x≥ α} là nửa không gian mở.

Một siêu phẳng chia không gian thành hai nửa không gian, mỗi nửa ở một phía của siêu phẳng Nếu hai nửa không gian này đều đóng, phần giao của chúng chính là siêu phẳng Định lý 1.1.7 chỉ ra rằng tập a-phin M khác rỗng là a-phin nếu và chỉ nếu nó có dạng M = L + a, trong đó L là một không gian con duy nhất và a thuộc M.

Không gian L trong định lý được gọi là không gian con song song với M, hay đơn giản là không gian con của M Thứ nguyên của một tập a-phin M được xác định bởi thứ nguyên của không gian song song với M, ký hiệu là dimM Định nghĩa 1.1.8 cho biết một tập lồi đa diện là giao của một số hữu hạn các nửa không gian đóng.

Tập lồi đa diện được định nghĩa là tập hợp các nghiệm của một hệ thống hữu hạn các bất phương trình tuyến tính Dạng tường minh của tập lồi đa diện được thể hiện rõ ràng như sau:

Hoặc nếu ta ký hiệu A là ma trận có m hàng là các véc - tơ a j (j 1, , m) và véc - tơ b T = (b1, , bm), thì hệ trên viết được là:

Tập D được định nghĩa là {x ∈ R n | Ax ≤ b}, trong đó các phương trình có thể được chuyển đổi thành bất phương trình, tức là ha, xi = b có thể biểu diễn dưới dạng hai bất phương trình ha, xi ≤ b và h−a, xi ≤ b Do đó, tập nghiệm của một hệ thống gồm các phương trình và bất phương trình hữu hạn sẽ tạo thành một tập lồi đa diện Theo định nghĩa 1.1.9, một tập C được gọi là nón nếu

Gốc tọa độ có thể nằm trong hoặc ngoài nón, và một nón không nhất thiết phải là một tập lồi Ví dụ minh họa cho điều này.

C := {x ∈ R | x ≠ 0} được định nghĩa là một nón không lồi Một nón được gọi là nón lồi nếu nó là một tập lồi Nón lồi không chứa đường thẳng được gọi là nón nhọn, với điểm 0 là đỉnh của nón Nếu nón lồi này đồng thời là một tập lồi đa diện, nó được xem là nón lồi đa diện Một ví dụ tiêu biểu về nón lồi đa diện là tập hợp nghiệm của hệ bất phương trình tuyến tính có dạng.

Một tập C được gọi là nón lồi nếu và chỉ nếu nó thỏa mãn các tính chất nhất định Cụ thể, tập C có thể được biểu diễn dưới dạng {x | Ax ≥ 0}, trong đó A là một ma trận thực có kích thước hữu hạn.

Chứng minh Giả sử C là một nón lồi Do C là một nón, nên ta có (i) Do C là một tập lồi, nên với mọi x, y ∈ C, thì 1

Nếu giả sử có điều kiện (i) và (ii), ta có thể kết luận rằng C là một nón Với x, y thuộc C và λ trong khoảng [0,1], từ (i) cho thấy λx và (1−λ)y đều thuộc C Theo điều kiện (ii), ta có λx + (1−λ)y cũng nằm trong C, do đó C là một nón lồi Trong phần tiếp theo, chúng ta sẽ xem xét một số nón lồi điển hình thường được áp dụng trong giải tích lồi.

Toán tử chiếu tập lồi

Định nghĩa 1.1.18 Cho C 6= ∅ (không nhất thiết lồi) và y là một véc-tơ bất kỳ, đặt d C (y) := inf x ∈ Ckx−yk.

Khoảng cách từ y đến tập lồi đóng C được ký hiệu là dC(y) Nếu tồn tại π ∈ C sao cho dC(y) = kπ−yk, thì π được gọi là hình chiếu vuông góc của y trên C Định lý 1.1.19 khẳng định rằng với C là một tập lồi đóng khác rỗng, hai tính chất sau đây là tương đương: với mọi y ∈ Rn, π ∈ C, nếu π = pC(y) thì y−π ∈ NC(π) Hình chiếu pC(y) của y trên C luôn tồn tại và duy nhất cho mọi y ∈ Rn Nếu y không thuộc C, thì điều kiện hpC(y) −y, x−pC(y)i = 0 xác định siêu phẳng tựa.

Trong bài viết này, chúng ta xem xét ánh xạ y ֒→ pC(y) với các tính chất quan trọng Đầu tiên, ánh xạ này tách biệt y khỏi C, đảm bảo rằng hp C (y)−y, x−p C (y)i ≥ 0 cho mọi x thuộc C, và hp C (y)−y, y−p C (y)i < 0 Thứ hai, ánh xạ này không giãn, tức là kp C (x)−p C (y)k ≤ kx−yk cho mọi x và y Cuối cùng, ánh xạ này còn có tính đồng bức, được thể hiện qua bất đẳng thức hp C (x)−p C (y), x−yi ≥ kp C (x)−p C (y)k^2 Để chứng minh các tính chất này, giả sử có a), với x thuộc C và λ nằm trong khoảng (0,1), ta đặt x λ := λx + (1−λ)π.

Do x, π ∈ C và C lồi, nên x λ ∈ C Vì π là hình chiếu của y, ta có kπ−yk ≤ ky−x λ k, từ đó suy ra kπ−yk 2 ≤ kλ(x−π) + (π−y)k 2 Khi khai triển và ước lượng, chia hai vế cho λ > 0, ta được λkx−πk 2 + 2hx−π, π−yi ≥ 0 Điều này đúng với mọi x ∈ C và λ ∈ (0,1) Khi cho λ tiến đến 0, ta có hπ−y, x−πi ≥ 0 ∀x∈ C.

Bây giờ giả sử có b) Với mọi x∈ C, có

Từ đây và b), dùng bất đẳng thức Cauchy-Schwarz ta có: ky−πk 2 ≤ (y−π) T (y−x) ≤ ky−πkky−xk.

Suy ra rằng khoảng cách giữa y và π không vượt quá khoảng cách giữa y và bất kỳ x nào trong tập C, tức là π = p(y) Hơn nữa, với dC(y) là giá trị nhỏ nhất của khoảng cách giữa x và y với x thuộc C, theo định nghĩa của cận dưới, tồn tại một dãy xk thuộc C sao cho giới hạn của dãy này khi k tiến tới vô cùng sẽ bằng dC(y) và nhỏ hơn vô cực.

Dãy {x k} bị chặn nên tồn tại một dãy con {x kj} hội tụ đến một điểm π Vì C là tập đóng, nên π thuộc C Do đó, ta có kπ−yk = lim j kx kj −yk = lim k kx k −yk = d C (y).

Chứng tỏ π là hình chiếu của y trên C.

Bây giờ ta chỉ ra tính duy nhất của hình chiếu Thật vậy, nếu tồn tại hai điểm π và π 1 đều là hình chiếu của y trên C, thì y −π ∈ N C (π), y−π 1 ∈ N C (π 1 ).

Cộng hai bất đẳng thức này ta suy ra kπ − π 1 k ≤ 0, và do đó π = π 1 iii) Do y−π ∈ N C (π), nên hπ−y, x−πi ≥ 0 ∀x∈ C.

Vậy hπ−y, xi = hπ−y, πi là một siêu phẳng tựa củaC tạiπ Siêu phẳng này tách y khỏi C vì y 6=π, nên hπ−y, y −πi =−kπ−yk 2 < 0. iv) Theo phần (ii) ánh xạ x ֒→ p(x) xác định khắp nơi Do z−p(z) ∈

N C (p(z)) với mọi z, nên áp dụng với z =x và z = y, ta có: hx−p(x), p(y)−p(x)i ≤ 0 và hy−p(y), p(x)−p(y)i ≤ 0.

Cộng hai bất đẳng thức lại sẽ được hp(y)−p(x), p(y)−p(x) +x−yi ≤ 0.

Theo bất đẳng thức Cauchy-Schwarz, ta có kp(x)−p(y)k ≤ kx−yk Để chứng minh tính đồng bức, áp dụng tính chất b) của (i) cho p(x) và p(y), ta nhận được hp(x)−x, p(x)−p(y)i ≤ 0 và hy−p(y), p(x)−p(y)i ≤ 0.

Cộng hai bất đẳng thức ta được hp(x)−p(y) +y−x, p(x)−p(y)i

Chuyển vế ta có hp(x)−p(y), x−yi ≥ kp(x)−p(y)k 2, thể hiện tính đồng bức cần chứng minh Định lý 1.1.20 (Định lý tách 1) khẳng định rằng, với hai tập lồi khác rỗng C và D trong R n, có C∩D =∅, tồn tại một siêu phẳng tách biệt C và D Định lý tách này có thể được suy ra từ Bổ đề 1.1.21, liên quan đến việc tách một tập lồi và một phần tử không thuộc nó.

Bổ đề 1.1.21 (Bổ đề liên thuộc) Cho C ⊂ R n là một tập lồi khác rỗng Giả sử x 0 ∈ C Khi đó tồn tại t ∈ R n , t6= 0 thỏa mãn ht, xi ≥ ht, x 0 i∀x∈ C (1.4)

Chứng minh Định lý 1.1.20 cho thấy rằng nếu C và D là hai tập lồi, thì hiệu C − D cũng là một tập lồi Hơn nữa, do C và D không giao nhau (C ∩ D = ∅), nên 0 không thuộc C − D Áp dụng bổ đề với x₀ = 0, tồn tại véc-tơ t ∈ Rⁿ (t ≠ 0) sao cho ht, zi ≥ 0 với mọi z ∈ C − D Với z được định nghĩa là z = x − y, trong đó x ∈ C và y ∈ D, ta có ht, xi ≥ ht, yi cho mọi x ∈ C và y ∈ D.

Giả sử α := sup y ∈ Dht, yi, thì siêu phẳng ht, xi = α có khả năng tách hai tập lồi đóng C và D, với điều kiện C ∩ D = ∅ Theo Định lý 1.1.22 (Định lý tách), nếu ít nhất một trong hai tập C hoặc D là compact, thì chúng có thể được tách mạnh bởi một siêu phẳng.

Định lý tách mạnh có thể được suy ra từ bổ đề về sự tách mạnh giữa một tập lồi đóng và một điểm bên ngoài tập này.

Bổ đề 1.1.23 Cho C ⊂ R n là một tập lồi đóng khác rỗng sao cho

0 ∈/ C Khi đó tồn tại một véc-tơ t ∈ R n , t 6= 0 và α > 0 sao cho ht, xi ≥ α > 0, ∀x ∈C.

Chứng minh Định lý 1.1.22 Giả sửC là tập compact Ta chỉ ra tập

Tập C−D là một tập đóng, vì nếu z k ∈ C−D và z k → z, thì z k có thể biểu diễn dưới dạng z k = x k − y k với x k ∈ C và y k ∈ D Do C là tập compact, nên tồn tại một dãy con x k j → x khi j → +∞ Từ đó, ta có y k j = z k j − x k j → z − x ∈ D, dẫn đến z = x − y ∈ C − D Hơn nữa, vì 0 ∉ C−D, theo bổ đề, tồn tại t ≠ 0 sao cho ht, x−yi ≥ α > 0 với mọi x ∈ C và y ∈ D, do đó xinf ∈ Cht, xi − α.

Chứng tỏ C và D có thể tách mạnh

Hệ quả 1.1.24 Cho A là một ma trận thực cấp m×n và a∈ R n Khi đó trong hai hệ dưới đây có một hệ và chỉ duy nhất một hệ có nghiệm:

Hàm lồi

Định nghĩa 1.2.1 Cho ∅ 6= C ⊆ R n lồi và f : C → R Ta nói f là hàm lồi trên C, nếu epif là một tập lồi trong R n+1 Định nghĩa 1.2.2 Cho f : R n → R∪ {+∞} (không nhất thiết lồi),

C ⊆ R n là một tập lồi khác rỗng và η là một số thực Ta nói η là hệ số lồi của f trên C, nếu với mọi λ ∈(0,1), mọi x, y thuộc C, ta có f[(1−λ)x+λy] ≤ (1−λ)f(x) +λf(y)− 1

2ηλ(1−λ)kx−yk 2 Định lý 1.2.3 Giả sử f là một hàm lồi chính thường trên R n Khi đó f liên tục tại mọi điểm x∈ int(domf).

Do f lồi, nên domf và int(domf) là các tập lồi Có một đơn hình n-chiều S ⊂ int(domf) với các đỉnh v1, , vn+1 Với mọi x ∈ S, ta có x n+1.

Do phần trong của đơn hình S không rỗng, hàm f bị chặn trên một lân cận của điểm x₀ thuộc int S, dẫn đến việc f liên tục trên tập int(dom f).

Hệ quả 1.2.4 chỉ ra rằng, nếu f là một hàm lồi chính thường trên R n, thì với mọi tập compact C thuộc int(domf), tập f(C) cũng sẽ là compact Định nghĩa 1.2.5 cho thấy x ∗ ∈ R n được gọi là dưới đạo hàm của f tại x nếu điều kiện hx ∗ , z−xi+f(x) ≤ f(z) được thỏa mãn với mọi z Định nghĩa 1.2.6 xác định rằng một toán tử T : R n → 2 R n là đơn điệu tuần hoàn trên C nếu với mọi số nguyên dương m và mọi cặp (x i , y i ) thuộc G(T), điều kiện hx 1 −x 0 , y 0 i+hx 2 −x 1 , y 1 + +x 0 −x m , y m i ≥ 0 được giữ Cuối cùng, định nghĩa 1.2.7 mô tả một toán tử T là đơn điệu cực đại nếu nó không phải là tập con thực sự của đồ thị của một toán tử đơn điệu khác, và được gọi là đơn điệu tuần hoàn cực đại nếu nó đồng thời là đơn điệu tuần hoàn và không phải là tập con thực sự của đồ thị của một toán tử đơn điệu tuần hoàn khác.

Hệ quả 1.2.8 khẳng định rằng mọi toán tử đơn điệu tuần hoàn cực đại trong R n đều là dưới vi phân của một hàm lồi, đóng chính thường trên R n Định nghĩa 1.2.9 mô tả rằng một ánh xạ T : R n → 2 R n được gọi là đóng tại x, nếu với mọi dãy x k tiến tới x, và mọi y k thuộc T(x k) cũng tiến tới y, thì y phải thuộc T(x).

Ánh xạ T được coi là đóng khi và chỉ khi đồ thị của nó là một tập đóng Theo định nghĩa, ánh xạ T : 2 R n → 2 R n được xem là nửa liên tục tại điểm x nếu với mọi tập mở G chứa T(x), luôn tồn tại một lân cận mở.

Ta sẽ nói ánh xạ T là đóng (nửa liên tục trên) trên tập C, nếu nó đóng (nửa liên tục trên) tại mọi điểm thuộc C.

Do hàm f là lồi và liên tục trên tập int(domf), từ định nghĩa dưới vi phân và tính liên tục của tích vô hướng, ta có thể suy ra rằng ánh xạ dưới vi phân x → ∂f(x) là đóng trên tập C = int(domf) Định lý 1.2.11 chỉ ra rằng nếu U ⊆ R^n là một tập lồi, mở và f là hàm lồi nhận giá trị hữu hạn trên U, thì với dãy các hàm lồi hữu hạn {f_i} hội tụ theo từng điểm đến f, khi dãy {x_i} ⊂ U hội tụ đến x ∈ U, tồn tại chỉ số i_ǫ cho mọi ǫ > 0.

∂f i (x i ) ⊂ ∂f(x) +ǫB(0,1) ∀i≥ i ǫ , trong đó B(0,1) là hình cầu đơn vị, đóng tâm ở 0.

Chứng minh Bạn đọc tham khảo tài liệu [1]. Định lý 1.2.12 (Moreau-Rockafellar) Cho f i , i = 1, , m là các hàm lồi chính thường trên R n Khi đó m

X i=1 f i (x)) ∀x. Để chứng minh định lý trên ta sử dụng mệnh đề sau.

Mệnh đề 1.2.13 nêu rằng cho các hàm lồi hữu hạn f 1, , f m trên một tập lồi D không rỗng và A là ma trận thực cấp k×n, nếu b thuộc phần trong của A(D), thì hệ phương trình x thuộc D, Ax = b, và f i (x) < 0 cho i = 1, , m sẽ không có nghiệm Điều này xảy ra khi và chỉ khi tồn tại một vector t thuộc R k và các hệ số λ i không âm cho i = 1, , m.

Ta chỉ cần chứng minh cho m = 2 Với m > 2 dùng quy nạp Điều khẳng định n

X i=1 f i (x)) ∀x có thể dễ dàng kiểm tra dựa vào định nghĩa dưới vi phân. Để chứng minh bao hàm thức ngược lại, ta lấy x 0 ∈ R n và x ∗ ∈

∂(f 1 +f 2 )(x 0 ) Theo định nghĩa của dưới vi phân thì hệ

(f 1 (x) +f 2 (y)−f 1 (x 0 )−f 2 (x 0 )− hx ∗ , x−x 0 i < 0 x−y = 0 không có nghiệm Lấy D = domf 1 ×domf 2 và A(x, y) = x− y Theo giả thiết f1 liên tục tại một điểm a ∈domf1∩domf2, nên tồn tại một lân cận U của gốc sao cho

Với 0 ∈ intA(D), áp dụng Mệnh đề 1.2.13 cho f(x, y) = f1(x) + f2(y) − f1(x0) − f2(x0) − ⟨hx*, x − x0⟩ và A(x, y) = x − y, ta có bất đẳng thức ht, x − yi + [f1(x) + f2(y) − f1(x0) − f2(x0) − ⟨hx*, x − x0⟩] ≥ 0 với mọi x ∈ domf1, y ∈ domf2 Đối với x không thuộc domf1 và y không thuộc domf2, bất đẳng thức này hiển nhiên đúng Khi chọn y = x0, ta nhận được ht, x − x0i + [f1(x) + f2(x0) − ⟨hx*, x − x0⟩] ≥ 0 với mọi x.

Bây giờ lại lấy x = x 0 , thì ht, x 0 −yi+ [f 2 (y)−f 2 (x 0 ) ≥ 0∀x.

Vậy x ∗ ∈∂f 1 (x 0 ) +∂f 2 (x 0 ) Định lý 1.2.14 Cho g(x) = (g 1 (x), , g m (x)) sao cho với mỗi g i :

R n → R lồi Giả sử ϕ : R m → R lồi, đơn điệu không giảm trên R n Khi đó hàm hợp f :=ϕ◦g lồi trên R n và

Để chứng minh Định lý trên ta sử dụng mệnh đề sau

Mệnh đề 1.2.15 chỉ ra rằng, với các hàm lồi hữu hạn f 0, f 1, , f m trên tập lồi D (D 6= ∅), hệ phương trình x ∈ D, f i (x) < 0 (với i = 0, 1, , m) sẽ không có nghiệm nếu và chỉ nếu tồn tại các số λ i ≥ 0 (với i = 0, 1, , m) mà không đồng thời bằng 0.

Ngoài ra nếu có điều kiện chính quy Slater: tồn tại x 0 ∈ D, f i (x 0 ) < 0 với mọi i = 1, , m, thì λ 0 > 0.

Bạn đọc tham khảo tài liệu [1]. Định lý 1.2.16 Cho f = max{f 1 , , f m }, trong đó f i : R n → R Đặt

Để chứng minh rằng ∂f(x) = co{∂f j (x)|j ∈ J(x)}, giả sử p ∈∂f(x 0 ) Khi đó, điều kiện f(x)−f(x 0 )− hp, x−x 0 i < 0 không có nghiệm Điều này cho thấy rằng với mọi x, tồn tại một chỉ số j (phụ thuộc vào x) sao cho f(x) = f j (x) Do đó, hệ f j (x)−f(x 0 )− hp, x−x 0 i < 0 với j = 1, , m cũng không có nghiệm Theo Mệnh đề 1.2.15, tồn tại các λ j ≥ 0.

Lấy x= x 0 và chú ý là f(x 0 ) = fj(x 0 ) với j ∈J(x 0 ), ta được

Từ đây và do f j (x 0 ) < f(x 0 ) với mọi j /∈ J(x 0 ), ta suy ra λ j = 0 với mọi j /∈ J(x0) Vậy

Theo Định lý Moreau-Rockaffellar ta có p = X j ∈ J(x 0 ) λjp j với p j ∈

Dưới vi phân của hàm lồi đóng chính thường trên R n được mô tả bởi ∂f(x 0 ) ⊆ co{∪∂fj(x 0 )|j ∈J(x 0 )} Điều này có thể dễ dàng suy ra từ định nghĩa của dưới vi phân Định lý Minty (Định lý 1.2.17) khẳng định rằng dưới vi phân là một toán tử đơn điệu tuần hoàn cực đại.

Trong chương này, chúng tôi sẽ trình bày những kiến thức cơ bản về Giải tích lồi, bao gồm các định nghĩa thiết yếu về tập lồi và toán tử chiếu tập lồi Bên cạnh đó, chúng tôi cũng sẽ khám phá các định nghĩa và tính chất của hàm lồi, cùng với khái niệm dưới vi phân của hàm lồi.

Chương 2 Điều kiện tối ưu của bài toán quy họach lồi

Chương này giới thiệu kiến thức về bài toán quy hoạch lồi và các tính chất nghiệm của nó Bài viết cũng đề cập đến điều kiện cần và đủ để đạt được tối ưu, bao gồm nguyên lý Fecmat cho bài toán tối ưu không ràng buộc với hàm một biến khả vi, cũng như các điều kiện liên quan đến ràng buộc hình học.

Bài toán quy hoạch lồi

Cho D ⊆ R n và f : R n → R, bài toán quy hoạch toán học được định nghĩa là min{f(x) : x∈ D} Một điểm x ∗ ∈ D được xem là lời giải tối ưu địa phương của bài toán (P) nếu tồn tại một lân cận U của x ∗ sao cho f(x ∗ )≤ f(x) với mọi x thuộc U ∩ D Nếu f(x ∗ ) ≤ f(x) cho mọi x ∈ D, thì x ∗ được gọi là lời giải tối ưu toàn cục của (P) Điều kiện cần và đủ để tồn tại nghiệm tối ưu toàn cục của bài toán (P) sẽ được trình bày trong định lý 2.1.2.

F + (D) := {t ∈ R :f(x) ≤ t, x ∈ D}, đóng và bị chặn dưới.

Chứng minh Nếux ∗ là nghiệm tối ưu thì F + (D) = [f(x ∗ ),+∞]đóng (là phần bù của một tập mở) và bị chặn dưới.

Ngược lại, giả sử F + D bị chặn dưới Đăt t ∗ = infF + (D) thì t > −∞.

Điều kiện cần và đủ tối ưu

Điều kiện tối ưu theo nguyên lý Fermat của bài toán tối ưu không ràng buộc hàm một biến khả vi 24

tối ưu không ràng buộc hàm một biến khả vi Ở đây, không gian X trong bài toán (P) là X = R

Hoặc max{f(x);x∈ R} (P’1) trong đó f : R−→ R khả vi Định lý Fermat sau cho ta một điều kiện cần tối ưu cho bài toán (P) và (P1) Định lý 2.2.1 (Định lý Fermat).

Nếu f : R −→ R là một hàm số khả vi thì mỗi điểm cực đại (cực tiểu) địa phương đều là điểm dừng, nghĩa là là nghiệm của phương trình f ′ (x) = 0.

Giả sử hàm số f(x) có cực đại địa phương tại x = 0 và đạo hàm tại điểm này bằng 0 Khi đó, hàm f(x) được xác định trên khoảng (x−δ; x+δ) với δ > 0, và trong khoảng này, điều kiện f(x0 + ∆x) − f(x0) ≤ 0 được thỏa mãn với mọi |∆x| < δ.

Định lý Fermat chỉ ra rằng nếu f ′ (x0) = 0, thì x0 là một điểm cần thiết để xác định cực trị Tuy nhiên, mệnh đề đảo của định lý này không đúng, như trường hợp hàm số f(x) = x^3 tại x = 0 Để xác định các cực trị, chúng ta sử dụng Định lý Fermat để tìm các điểm "nghi vấn" và sau đó áp dụng các điều kiện đủ để kiểm tra sự tồn tại của cực trị.

Pierre de Fermat, sinh ngày 17 tháng 8 năm 1601 tại Pháp và qua đời năm 1665, được biết đến như một học giả vĩ đại và nhà toán học nổi tiếng Ông được coi là cha đẻ của lý thuyết số hiện đại.

Fermat, xuất thân từ một gia đình khá giả, đã học tập tại Toulouse và đạt được bằng cử nhân luật dân sự trước khi trở thành chánh án Tuy nhiên, niềm đam mê toán học của ông rất lớn, nổi bật với thói quen ghi chú bên lề trong các quyển sách.

Fermat, được mệnh danh là "Ông Hoàng của những người nghiệp dư", là một học giả nghiệp dư nổi bật Ông thường gửi thư cho các nhà toán học với những phát biểu về định lý mới mà không kèm theo chứng minh, thách thức họ tìm ra giải pháp Sự bí ẩn này khiến nhiều người, như Rene Descartes và John Wallis, cảm thấy bực bội và chỉ trích ông Khi Blaise Pascal yêu cầu ông công bố chứng minh, Fermat từ chối, khẳng định rằng công trình của mình xứng đáng được công bố nhưng không muốn tên mình xuất hiện Ông ưu tiên sự riêng tư và sẵn sàng hy sinh danh tiếng để tránh bị quấy rầy bởi những câu hỏi từ các nhà phê bình.

Hàm số f(x) liên tục trên khoảng K = (x 0 −δ; x 0 +δ) và có đạo hàm trên K hoặc K \ {x 0}, với δ > 0 Nếu f ′ (x) > 0 trên khoảng (x 0 − δ; x 0) và f ′ (x) < 0 trên khoảng (x 0; x 0 + δ), thì x 0 là điểm cực đại của hàm số f(x) Ngược lại, nếu f ′ (x) < 0 trên khoảng (x 0 − δ; x 0) và f ′ (x) > 0 trên khoảng (x 0; x 0 + δ), thì x 0 là điểm cực tiểu của hàm số f(x) Cuối cùng, nếu f ′ (x) không đổi dấu khi x đi qua x 0, thì hàm số không đạt cực trị tại x 0.

Hàm số f(x) liên tục trên K và có đạo hàm f′(x) > 0 trên khoảng (x₀ - δ; x₀) cùng với f′(x) < 0 trên khoảng (x₀; x₀ + δ) cho thấy rằng f(x₀ + ∆x) - f(x₀) ≤ 0 với mọi |∆x| < δ, hay f(x₀ + ∆x) ≤ f(x₀) với mọi |∆x| < δ Điều này chứng minh rằng f(x) ≤ f(x₀) với mọi x ∈ (x₀ - δ; x₀ + δ), xác nhận rằng x₀ là điểm cực đại của hàm số Chứng minh tương tự cũng áp dụng cho trường hợp b).

Ví dụ 2.2.3 Hàm số f(x) = x 3 + x 2 − x + 1 có đạo hàm f ′ (x) 3x 2 + 2x−1 và f ′ (x) = 0 ⇔ x = −1;x= 1

3 Ta có f(x) đổi đấu từ + sang − khi x đi qua điểm −1 và đổi đấu từ − sang + khi x đi qua 1

Do đó x= 1 là điểm cực đại và x = 1

3 là điểm cực tiểu của hàm số. Định lý 2.2.4 (Điều kiện đủ cực trị)

Giả sử f(x) được khai triển theo công thức Taylor trong một khoảng mở nào đó chứa x 0 : f(x) =f(x 0 ) + n

Khi xét hàm số f tại điểm x0 với điều kiện f(k) x 0 k! (x−x 0) k + o((x−x 0) n) và đạo hàm đầu tiên khác 0 tại x0, ta có f ′ (x0) = f ′′ (x0) = = f (n − 1) (x0) = 0 và f (n) (x0) ≠ 0 Nếu n là số lẻ, hàm f không có cực trị tại x0 Ngược lại, nếu n là số chẵn, hàm f có cực trị tại x0; cụ thể, nếu f (n) (x0) > 0 thì x0 là điểm cực tiểu, còn nếu f (n) (x0) < 0 thì x0 là điểm cực đại của hàm số.

Ta cóf ′ (0) = f ′′ (0) = 0, f (3) (0) = 6 f ′ (0) = f ′′ (0) = 0; f (3) (0) 6 nên x = 0 không phải là điểm cực trị.

2 + 2nπ (n ∈ Z) là các điểm cực đại của hàm số.

Nếu hàm số f: R→R liên tục và f(x) hướng tới +∞ khi |x| tiến tới +∞, thì hàm này sẽ đạt giá trị nhỏ nhất trong R Đặc biệt, nếu f là hàm lồi và khả vi, nó sẽ có điểm cực tiểu tuyệt đối.

Chứng minh Ta coi Mệnh đề 2.2.6 là hệ quả được suy ra từ định lý ở phần sau.

Xét bài toán: min{f(x);x ∈C}, C ⊂ R (P2) hoặc max{f(x);x ∈C}, C ⊂ R (P’2) trong đó f : C −→R khả vi, C có thể là một khoảng, hoặc đoạn trên

Khi xét bài toán tối ưu trên một tập ràng buộc thì Định lý Fermat không còn đúng nữa.

Xét hàm số f(x) = x² trên đoạn [-1; 2], ta có f ′(x) = 2x, và f ′(x) = 0 tại x = 0, với x = 0 thuộc [-1; 2] và f ′′(0) = 2 > 0, do đó x = 0 là điểm cực tiểu của hàm số Tuy nhiên, nếu thay đổi đoạn thành [1; 2] không chứa điểm dừng, x = 0 không còn là nghiệm cực trị, mà điểm cực trị sẽ nằm ở các điểm biên Đối với hàm f lồi trên đoạn [a; b], quy trình giải bài toán như sau: Giải phương trình f ′(x) = 0 để tìm nghiệm x* Nếu x* thuộc [a; b], x* là nghiệm cực tiểu; nếu x* không thuộc [a; b], xét hai trường hợp: nếu x* < a, thì a là nghiệm cực tiểu, còn nếu x* > b, thì b là nghiệm cực tiểu.

Trong trường hợp hàm số lõm, cực tiểu được xác định tại một trong hai đầu biên của đoạn [a;b] Tuy nhiên, đối với bài toán tối ưu một biến có ràng buộc, Định lý 2.2.1 không còn áp dụng Thay vào đó, ta sử dụng Định lý 2.2.7, theo đó, nếu f là hàm số khả vi trên đoạn [a;b], thì cực đại hoặc cực tiểu sẽ xảy ra tại điểm x₀ ∈ [a, b], là nghiệm của f′(x) = 0 hoặc tại các điểm biên x = a hoặc x = b.

Giả sử hàm số f(x) đạt cực trị tại x 0 ∈ [a;b], theo quy tắc Fermat thì x 0 là một nghiệm của f ′ (x) = 0.

Trong trường hợp f ′ (x) = 0 không có nghiệm trên đoạn [a, b] thì rõ ràng cực trị đạt được tại hai biên x = a hoặc x= b.

Để giải bài toán cực tiểu và cực đại trên đoạn [a;b], chúng ta chỉ cần so sánh giá trị của hàm số tại các điểm dừng trong đoạn này với giá trị tại các điểm biên, mà không cần áp dụng điều kiện đủ như trước đây.

Ví dụ 2.2.8 (Đề thi tuyển sinh đại học khối B năm 2004).

Tìm giá trị lớn nhất và nhỏ nhất của hàm sốy = ln 2 x x trên đoạn[1;e 3 ]. Giải Ta có y ′

2lnx x x−ln 2 x x 2 = 2 lnx− ln 2 x x 2 Với mọi x∈ (1;e 3 ) ta có y ′ = 0 ⇔ 2 lnx−ln 2 x= 0 ⇔ lnx = 0 hoặc lnx = 2

= 4 e 2 , đạt được ⇔ x= e 2 Điều kiện tồn tại giá trị nhỏ nhất của một hàm số liên tục.

Nếu C không phải là một khoảng đóng và không có điểm cực biên, để xác định giá trị cực trị trong một miền mở, ta cần áp dụng nhận xét sau đây.

Mệnh đề 2.2.9 Nếu hàm số f : (a, b) −→R liên tục và f(x)−→ +∞ khi x −→a, x −→b thì nó đạt được giá trị cực tiểu trong (a, b).

Chứng minh Ta coi Mệnh đề 2.2.9 là hệ quả được suy ra từ định lý ở phần sau.

Ví dụ 2.2.10 Tìm giá trị lớn nhất và nhỏ nhất của hàm số f(x) x 2 +x+ 1 x+ 1 trên (−1; +∞).

(x+ 1) 3 Với mọi x∈ (−1; +∞) ta có f ′ (x) = 0⇔ x = 0 hoặc x= −2 ⇔ x = 0 (−2 ∈/ (−1; +∞)) f ′′ (0) >

0 nên x = 0 là nghiệm cực tiểu địa phương trên (−1; +∞), hơn nữa điều kiện bức thỏa mãn vì f(x) −→ +∞ khi x −→ −1, x −→ +∞ nên x= 0 là nghiệm cực tiểu trên toàn khoảng (−1; +∞).

Nếu ta dùng tính chất hàm lồi thì bài toán sẽ có lời giải ngắn gọn hơn nữa.

(x+ 1) 3 > 0, do đó f là hàm lồi trên (−1; +∞), vậy x = 0 là nghiệm cực tiểu toàn cục trên khoảng

Trong bài toán tối ưu hàm nhiều biến không có ràng buộc, khi C = R^n, ta xét bài toán min{f(x) : x ∈ R^n} Theo Định lý 2.2.11, nếu x* là nghiệm cực tiểu địa phương của bài toán này, thì đạo hàm riêng ∇f(x*) bằng 0 Định lý 2.2.12 chỉ ra rằng nếu hàm f khả vi liên tục hai lần trên R^n và x* là điểm cực tiểu địa phương của f, thì điều kiện này cũng được thỏa mãn.

∇f(x ∗ ) = 0 và ∇ 2 f(x ∗ ) nửa xác định dương.

∇f(x ∗ ) = 0 và ∇ 2 f(x ∗ ) xác định dương, thì x ∗ là điểm cực tiểu địa phương chặt của f trên R n

Với mọi d ∈ R n mà 0 < kdk ≤ ε với ε đủ nhỏ, khai triển Taylor của hàm f tại x ∗ là f(x ∗ +d) =f(x ∗ ) +h∇f(x ∗ ), di+ 1

2d T ∇ 2 f(ξ) với ξ = λx ∗ + (1− λ)d và 0 < λ < 1 (hay kξ − x ∗ k ≤ kdk < ε) Vì x ∗ là điểm cực tiểu địa phương của f trên R n nên theo Định lý 2.2.11,

∇f(x ∗ ) = 0 và biểu thức trở thành f(x ∗ +d) = f(x ∗ ) + 1

Bây giờ ta chứng minh∇ 2 f(x ∗ )nửa xác định dương, tức v T ∇ 2 f(x ∗ )v ≥

Giả sử tồn tại v ∈ R n, v ≠ 0 sao cho v T ∇ 2 f(x ∗ )v < 0 Ta có thể giả định rằng kvk < ε Vì f là hàm khả vi liên tục hai lần tại x ∗, các thành phần của ma trận Hessian ∇ 2 f(x ∗ ) là các hàm số liên tục tại x ∗, dẫn đến v T ∇ 2 f(x)v cũng là hàm liên tục tại x ∗ Theo tính chất của hàm liên tục, ta có v T ∇ 2 f(ξ)v < 0 với mọi ξ sao cho kξ − x ∗ k đủ nhỏ Kết hợp điều này với kết quả trước đó, ta suy ra f(x ∗ + v) < f(x ∗ ), tạo ra mâu thuẫn với tính cực tiểu địa phương của x ∗.

Điều kiện với ràng buộc hình học

Bài toán tối ưu được phát biểu như sau min{f(x) : x ∈ C} (P) hoặc max{f(x) : x ∈ C} (P’) trong đó C ⊆ R n khác rỗng và f : C −→R. Định lý 2.2.18 (Weierstrass)

Nếu C là tập compact và f nửa liên tục dưới C thì bài toán (P) có nghiệm tối ưu.

Chứng minh. Đặtα := inf x ∈ Df(x) Khi đó có một dãy{x k } ⊂C sao cho lim k −→ + ∞f(x k ) α Do C compact nên tồn tại một dãy con của {x k } nên hội tụ về x 0

Hàm f nửa liên tục dưới có điều kiện α > −∞ và với x 0 ∈ C, ta có α := inf x ∈ Df(x) dẫn đến f(x 0 ) ≥ α, từ đó suy ra f(x 0 ) = α Định lý 2.2.19 chỉ ra rằng nếu C là một tập đóng khác rỗng trong R n và hàm f nửa liên tục dưới trên C, đồng thời thỏa mãn điều kiện bức (coercive), thì các tính chất của hàm này sẽ được đảm bảo.

C, f(x) −→+∞ khi x∈ C và kxk −→ +∞ thì bài toán (P) có nghiệm tối ưu.

Hàm f liên tục trên miền C(x₀) bị chặn, dẫn đến việc f có điểm cực tiểu tại C(x₀), đồng thời đây cũng là điểm cực tiểu của f trên toàn miền C Theo định lý 2.2.20, nếu C là một tập lồi không rỗng trong Rⁿ và hàm f: Rⁿ → R∪{+∞}, thì điều kiện ri(dom f) ∩ ri C ≠ ∅ sẽ được thỏa mãn.

Khi đó điều kiện cần và đủ để x ∈ C là cực tiểu của f trên C là

N C (x) := {w|hw, x−xi ≤ 0 ∀x∈ C} là nón pháp tuyến ngoài của C tại x.

Gọi δC(.) là hàm chỉ của tập C Điểm x là cực tiểu của hàm f trên C khi và chỉ khi nó là cực tiểu của hàm h(x) = f(x) + δC(x) trên toàn không gian Điều kiện cần và đủ để x là cực tiểu của h trên R^n là 0 ∈ ∂h(x) Nếu Dori(domf) ∩ riC ≠ ∅, theo Định lý Moreau-Rockafellar, có thể rút ra kết luận quan trọng.

Ví dụ 2.2.21 Tìmmin{f(x), x ∈ [0,1]}trong đóf(x) = max{x,−2x+

3 ≤ x ≤ 1 f khả vi tại mọi điểm x ∗ ∈

Gọi x ∗ là nghiệm tối ưu của bài toán, ta có 0 ∈ ∂f(x ∗ ) + N [0,1] (x ∗ ), điều này tương đương với 0 ∈ ∂f(x ∗ ) hay h0, x−x ∗ i+f(x ∗ ) ≤ f(x) ∀x⇔ x ∗ = 1

Trong trường hợp C = R n thì N c (x ∗ ) = 0, do đó 0 ∈ ∂f(x ∗ ) và nếu bổ sung thêm điều kiện f khả vi thì ta có 0 = ∇f(x ∗ ).

Trong một số trường hợp thường gặp, khi tập các điều kiện ràng buộc được cho bởi

C := {x ∈R n :g j (x) ≤ 0, j = 1, , m, h i (x) = 0, i = 1, , k} và các hàm f, g j , h i khả vi Người ta dùng hàm Lagrange để có thể áp dụng quy tắc Fermat cho hàm Lagrange. Điều kiện chính quy

Xét tập tuyến tính hóa tại x 0 ∈C

Với A(x 0 ) := {j : g j (x 0 ) = 0} tập các chỉ số tích cực.

Khi đó ta nói điều kiện chính quy thỏa mãn tại x 0 nếu

S(x 0 ) = C(x 0 ) với C(x 0 ) = {d ∈ R n , d 6= 0| ∃λ 0 > 0 : x 0 +λd ∈ C, λ ∈ [0, λ 0 ]} tập các vec tơ chấp nhận được của C. Định lý 2.2.22 (Kuhn - Tucker)

Giả sử trong bài toán (P), tập ràng buộc C được cho bởi

C := {x ∈R n :g j (x) ≤ 0, j = 1, , m, h i (x) = 0, i = 1, , k} và các hàm f, g j , h i khả vi.

Nếu x ∗ là nghiệm của (P) và điều kiện chính quy thỏa mãn thì tồn tại λ ∗ 1 , λ ∗ 2 , , λ ∗ m ≥ 0 và à ∗ 1 , à ∗ 2 , , à ∗ k ∈ R sao cho.

Ngược lại nếu x ∗ ∈ C và f, g j lồi, h i affine thỏa mãn điều kiện (2.1) và (2.2) thì x ∗ là nghiệm tối ưu toàn cục của (P).

Sử dụng khai triển Taylor f(x ∗ +λd) = f(x ∗ ) +h∇f(x ∗ ), λdi+r(λd)

Ta có h∇f(x ∗ ), di ≥ 0 với mọi d ∈ C(x ∗ ) Từ C(x ∗ ) = S(x ∗ ), ta có h∇f(x ∗ ), di ≥ 0 với mọi d ∈S(x ∗ ) Đặt ma trận

 j ∈A(x ∗ );i = 1, , k Áp dụng bổ đề Farkas, ta có các số λ j ≥ 0, j ∈ A(x ∗ ) và α ∗ i ≥ 0, β i ∗ ≥

(α ∗ i −β i ∗ )∇h i (x ∗ ) = 0 Đặt λ j = 0 ∀j /∈ A(x ∗ ) và à ∗ i = α ∗ i −β i ∗ ≥ 0 với mọi i ta cú (2.1) và (2.2).

Ví dụ 2.2.23 Xét bài toán min{f(x, y) := x 2 −y 2 } với điều kiện C :={(x, y) : x≤ 1}.

Giải Ta có hàm điều kiện duy nhất là g 1 (x, y) := x−1 ≤ 0.

Bài toán có hàm mục tiêu là một hàm lõm, g 1 (x) là hàm afin nên điều kiện chính quy thỏa mãn tại mọi điểm nghiệm nhận được của bài toán.

! điều kiện (2.1) và (2.2) của bài toán này là

! là nghiệm cực đại toàn cục của bài toán, còn điểm x y

! không phải nghiệm cực tiểu địa phương nhưng cũng không phải cực đại địa phương của bài toán đang xét.

X i=1 àihi(x) Khi đó điều kiện (2.1) được viết lại như sau:

Điều kiện có ràng buộc đẳng thức và bất đẳng thức

Hệ quả 2.2.24 Giả sử D là tập lồi và f là hàm lồi, khả dưới vi phân trên D, nếu x ∗ ∈ intD là nghiệm tối ưu của bài toán (P) thì 0 ∈

∂f(x ∗ ) Hơn nữa, nếu f khả vi và D = R n thì 0 = ∇f(x ∗ ).

Ta xét bài toán min{f(x) : x ∈X, g j (x)≤ 0, j = 1, , m}, (P) trong đó X ⊆ R n là tập lồi khác rỗng Từ bài toán trên, ta định nghĩa bài toán tối ưu khác có dạng max{d(y) : y ∈ Y}, (D) trong đó Y ∈ R m

Bài toán (D) là đối ngẫu của bài toán (P) khi với mọi điểm chấp nhận được x của (P) và mọi y chấp nhận được của (D), ta có f(x) ≥ d(y) Nếu (D) là bài toán đối ngẫu chính xác của (P), thì tồn tại x ∗ ∈ P và y ∗ ∈ D sao cho f(x ∗ ) ≤ d(y ∗ ) Định lý 2.2.25 (Karush-Kuhn-Tucker) mô tả mối quan hệ này.

Bài toán (P) được định nghĩa bởi hàm tối thiểu hóa f(x) với điều kiện x thuộc tập D, trong đó D là tập hợp các x thuộc X thỏa mãn g_j(x) ≤ 0 và h_i(x) = 0 Ở đây, X là một tập con không rỗng của R^n, và các hàm f, g_j, h_i đều là các hàm từ R^n tới R Bài toán (P) được gọi là bài toán lồi nếu như X là một tập lồi đóng và các hàm f, g_j là lồi, trong khi h_i là hàm affine.

Giả sử (P) là bài toán lồi Nếu x ∗ là một nghiệm tối ưu của bài toán

(P) thỡ tồn tại λ ∗ i ≥ 0 (i = 0,1, , m) và à ∗ j (j = 1, , k) khụng đồng thời bằng 0 sao cho

L(x ∗ , λ ∗ , à ∗ ) = min x ∈ X L(x, λ ∗ , à ∗ )(Điều kiện đạo hàm triệt tiờu), λ ∗ i g i (x ∗ ) = 0 (i = 1, , m)(Điều kiện bù).

Hơn nữa, nếu intX 6= ∅ và điều kiện Slater

Trong bài toán tối ưu (P), nếu tồn tại một điểm x₀ trong miền D sao cho gᵢ(x₀) < 0 với i = 1, , m, cùng với các hàm affine hᵢ (i = 1, , k) độc lập tuyến tính trên X, thì các điều kiện λ₀* và các điều kiện đạo hàm triệt tiêu cùng điều kiện bù sẽ là đủ để xác định điểm chấp nhận x* là nghiệm tối ưu.

Chứng minh Giả sử x ∗ là một nghiệm tối ưu của bài toán (P) Đặt

Do X 6= ∅ lồi, f, g i là các hàm lồi và h j là hàm affine trên X, nên C là tập lồi đóng, khác rỗng trong R m+k+1 Hơn nữa 0 ∈/ C vì nếu 0 ∈ C thì tồn tại một điểm chấp nhận đượcxsao cho f(x)< f(x ∗ ).Điều này mâu thuẫn với giả thiết x ∗ là nghiệm tối ưu của bài toán (P) Theo định lý siờu phẳng tỏch, cú cỏc số λ ∗ i (i = 0,1, , m), à ∗ j (j = 1, , k) không đồng thời bằng 0 sao cho m

Nếu λ 0 , , λ m > 0, thì thay x = x ∗ , ta được:

Vì thế có thẻ xem (λ ∗ 0 , λ ∗ 1 , , λ ∗ m ) ≥ 0 Hơn nữa, với ǫ > 0 và x ∈ X, ta lấy: λ 0 =f(x)−f(x ∗ ) +ǫ, λ i =g i (x) (i = 1, , m), à j = h j (x) (i = 1, , k) và thay vào (2.3), cho ǫ → 0 ta được: λ ∗ 0 f(x) + m

Điều kiện tối ưu L(x ∗ , λ ∗ , à ∗ ) ≤ L(x, λ ∗ , à ∗ ) được chứng minh cho mọi x thuộc X Để xác nhận điều kiện bù, ta nhận thấy rằng x ∗ là điểm chấp nhận được với gj(x ∗ ) ≤ 0 cho mọi j Nếu tồn tại chỉ số j sao cho g i (x ∗ ) = ξ < 0, thì với mọi ǫ > 0, điều kiện này vẫn được thỏa mãn.

Thay vào (2.3)và cho ǫ → 0, ta có λ ∗ i ≥ 0.Nhưng vì ξ 0 Thật vậy, nếu λ ∗ 0 = 0, do điều kiện hàm triệt tiêu và điều kiện bù, ta có:

Do λ ∗ 0 = 0, nên xảy ra 2 trường hợp:

• Trường hợp 1: Tồn tại chỉ số i sao cho λ ∗ i > 0 Khi đó thay thế x= x 0 vào bất đẳng thức (2.5) ta được:

• Trường hợp 2: λ ∗ i = 0 với mọi i và tồn tại j sao cho à ∗ j > 0 Ta cú

Do intX 6=∅ và hj là hàm affine với mọi j nên ta có k

Theo giả thiết, cỏc hàm h j độc lập tuyến tớnh trờn X, nờn à ∗ j = 0 với mọij Điều này mõu thuẫn với giả thiếtλ ∗ i và à ∗ j khụng đồng thời bằng

0 Do đó λ ∗ 0 > 0 và chia cả hai vế của (2.4) cho λ ∗ 0 , ta có thể giả sử hàm Lagrange của bài toán (P) có dạng:

Sử dụng điều kiện đạo hàm triệt tiêu và điều kiện bù, với mọi nghiệm chấp nhận được x ∗ , ta có f(x ∗ ) = f 0 (x ∗ ) + m

X j=1 à ∗ j h j (x) ≤ f(x). Điều này chứng tỏ rằng x ∗ là một nghiệm tối ưu của bài toán (P)

Hệ quả 2.2.26 Nếu X là tập mở (hơn nữa, X là toàn bộ không gian), thì theo Moreau-Rockafellar, điều kiện đạo hàm triệt tiêu kéo theo

Khi f và mọi hàm g j (j = 1,2, , m) đều khả vi thì điều kiện trên trở thành

X i=1 à ∗ i ∇h i (x ∗ ). Định nghĩa 2.2.27 Một véc - tơ d 6= 0 được gọi là một hướng chấp nhận được của tập D tại x ∗ ∈D nếu: x ∗ +λd∈ D, ∀λ >0 đủ nhỏ.

Ký hiệu D(x ∗ ) đại diện cho tập hợp tất cả các hướng chấp nhận được tại điểm x ∗ trong miền D, và D(x ∗ ) là bao đóng của tập hợp này Định lý 2.2.28 nêu rằng nếu hàm f khả vi trên một tập mở chứa D và x ∗ là điểm cực tiểu địa phương của f trên D, thì điều kiện d T ∇f(x ∗ )≥ 0 sẽ đúng với mọi hướng d thuộc D(x ∗ ) Để chứng minh điều này, ta sử dụng khai triển Taylor của f tại x ∗, được biểu diễn bởi f(x ∗ +λd) = f(x ∗ ) +λh∇f(x ∗ ), di + o(λkdk).

Do x ∗ là cực tiểu địa phương của bài toán (P) nên f(x ∗ +λd)−f(x ∗ )≥ 0, ∀λ > 0 đủ nhỏ.

Từ (2.7) ta được: d T ∇f(x ∗ ) + o(λkdk) λ ≥ 0, đủ nhỏ.

Một điểm x ∗ ∈ D mà thỏa mãn điều kiện (2.6) được gọi là điểm dừng của f trên D Một điểm dừng chưa chắc lad điểm cực tiểu địa phương.

Mệnh đề 2.2.29 (i) Giả sử f là một hàm lồi chính thường trên R n và C ⊆ R n là một tập lồi Khi đó nếu f đạt cực đại hữu hạn trên

C tại một điểm trong tương đối của C, thì f là hằng số trên C.

(ii) Nếu f là một hàm lồi, chính thường trên R n và bị chặn trên trong một tập a-phin, thì nó là hằng số trên tập này.

Giả sử a ∈ riC là điểm cực đại của hàm f trên tập C Theo tính chất điểm trong không gian tương đối, với mọi x ∈ C, tồn tại y ∈ C sao cho a nằm trong khoảng (x, y) Do f(x) ≤ f(a) và f(y) ≤ f(a), cùng với tính chất f lồi, ta có thể kết luận rằng f(x) = f(a).

Nếu hàm f không phải là hằng số trên tập a-phin M, thì tồn tại hai điểm a, b ∈ M sao cho f(a) < f(b) Mọi điểm x nằm trên nửa đường thẳng bắt đầu từ a và hướng về b−a đều có dạng x = a + λ(b−a) với λ > 0 Khi đó, b có thể được biểu diễn dưới dạng b = (1/λ)x + ((λ−1)/λ)a.

Với mọi λ > 1, theo tính lồi của f ta có f(b) ≤ 1 λf(x) + λ−1 λ f(a).

Dựa vào giả thiết f(x) ≤ m < ∞ với mọi x ∈ M, ta có f(b) − f(a) = 1/λ f(x) − 1/λ f(a) ≤ 1/λ [m − f(a)] Điều này đúng với mọi λ > 1, và khi λ → +∞, do f(a) hữu hạn, vế phải tiến tới 0, trong khi vế trái f(b) − f(a) > 0 Sự mâu thuẫn này cho thấy rằng f phải là hằng số trên tập a-phin M.

Nếu một hàm lồi đạt cực đại trên một tập lồi có điểm cực biên, thì cực đại sẽ xảy ra tại một điểm cực biên của tập lồi đó.

Giả sử x ∗ là điểm cực đại của hàm f trên tập lồi C Nếu x ∗ không phải là điểm cực biên của C, thì tồn tại hai điểm a, b ∈ C và một số λ ∈ (0,1) sao cho x ∗ = λa + (1−λ)b Theo Mệnh đề 2.2.30, ta có f(x ∗ ) = f(x) với mọi x ∈ [a, b].

Ví dụ 2.2.31 Xét bài toán minf(x) = x 3 trênC = [−1,2].

Rõ ràng x ∗ = 0 là điểm dừng của f(x) nhưng điểm cực tiểu của f(x) trên C đạt tại x =−1.

Ví dụ 2.2.32 (SGK BT 12 CB) Trong các hình trụ nội tiếp hình cầu bán kính R, hãy tìm hình trụ có thể tích lớn nhất.

Kí hiệu chiều cao, bán kính đáy và thể tích của hình trụ nội tiếp hình cầu lần lượt là h, r và V Khi đó: V = hπr 2

Ví dụ trở thành tìm giá trị lớn nhất của hàm sốV(h) = π hR 2 − h 3

Từ BBT, suy ra max

3 Vậy hình trụ nội tiếp hình cầu bán kính R có thể tích lớn nhất khi chiều cao của nó bằng 2R

√3 Khi đó, thể tích khối trụ là 4πR 3

Một tấm kẽm hình vuông ABCD có cạnh 30 cm được gập theo hai cạnh EF và GH, khiến hai cạnh AD và BC trùng nhau, tạo thành một hình lăng trụ khuyết hai đáy.

Giá trị của x để thể tích khối lăng trụ lớn nhất là

Ta có: DF =CH = x, F H = 30−2x⇒ p △ DHF = 15.

Thể tích khối lăng trụ như hình vẽ là

Xét hàm số f(x) = (15−x) 2 (2x−15) f ′ (x) =−2(15−x)(2x−15) + 2(15−x) 2 = −2(15−x)(3x−30) f ′ (x) = 0 ⇔x = 10 hoặc x= 15 Bảng biến thiên:

Do đó thể tích khối lăng trụ như hình vẽ lớn nhất khi x = 10 (cm). Khi đó V max = 750√

Ví dụ 2.2.34 (SGK BT 12 CB) Hãy tìm tam giác vuông có diện tích lớn nhất nếu tổng của một cạnh góc vuông và cạnh huyền bằng hằng số a (a > 0).

Kí hiệu cạnh góc vuông AB là x, x ∈

Khi đó, cạnh huyền BC = a−x, cạnh góc vuông kia là

Diện tích tam giác ABC là S(x) = 1

Từ BBT, suy ra max

Trong ví dụ 2.2.35, một nhà sinh vật học nghiên cứu nuôi cá trong hồ và phát hiện rằng, nếu có n con cá trên mỗi đơn vị diện tích mặt hồ, thì trọng lượng trung bình của mỗi con cá sau một vụ sẽ là P(n) = 480 - 20n (gam) Câu hỏi đặt ra là cần thả bao nhiêu con cá trên mỗi đơn vị diện tích để đạt được sản lượng thu hoạch tối đa sau một vụ.

Trên mỗi đơn vị diện tích của mặt hồ, nếu có n con cá, thì sau một vụ, số cá trung bình trên mỗi đơn vị diện tích mặt hồ sẽ có trọng lượng được tính bằng công thức f(n) = nP(n) = 480n - 20n² (gam).

(Biến số n lấy các giá trị nguyên dương được thay thế bởi biến số x lấy các giá trị trên khoảng (0; +∞)).

Ta có: f ′ (x) = 480−40x = 0 ⇔x = 12 Bảng biến thiên:

Từ BBT, trên(0; +∞), hàm sốf đạt giá trị lớn nhất tại điểmx = 12 Từ đó, suy ra f(n) đạt giá trị lớn nhất tại điểm n = 12.

Để tính liều lượng thuốc cần tiêm cho bệnh nhân nhằm đạt được mức giảm huyết áp tối đa, ta sử dụng công thức G(x) = 0,025x²(30 - x), trong đó x là liều lượng thuốc tính bằng miligam Bằng cách tìm giá trị x tối ưu, chúng ta có thể xác định liều lượng thuốc cần thiết để đạt được hiệu quả giảm huyết áp cao nhất và tính toán độ giảm huyết áp tương ứng.

Từ BBT, suy ra max

(0;+ ∞ )G(x) = G(20) = 100 Vậy liều lượng thuốc cần tiêm cho bệnh nhân để huyết áp giảm nhiều nhất là 20 mg Khi đó, độ giảm huyết áp là 100.

Ngày đăng: 10/06/2021, 09:06

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[2] Đỗ Văn Lưu and Phan Huy Khải (2000), Giải tích lồi, NXB Khoa Học Kỹ Thuật Sách, tạp chí
Tiêu đề: Giải tích lồi
Tác giả: Đỗ Văn Lưu, Phan Huy Khải
Nhà XB: NXB Khoa Học Kỹ Thuật
Năm: 2000
[3] Trần Vũ Thiệu, Nguyễn Thị Thu Thủy (2011), Giáo trình tối ưu phi tuyến, NXB Đại học Quốc Gia Hà Nội.Tiếng Anh Sách, tạp chí
Tiêu đề: Giáo trình tối ưu phi tuyến
Tác giả: Trần Vũ Thiệu, Nguyễn Thị Thu Thủy
Nhà XB: NXB Đại học Quốc Gia Hà Nội
Năm: 2011
[5] H. Tuy (2003), Convex Analysis and Global Optimization, Kluwer Publisher Sách, tạp chí
Tiêu đề: Convex Analysis and Global Optimization
Tác giả: H. Tuy
Nhà XB: Kluwer Publisher
Năm: 2003
[1] Nguyễn Văn Hiển, Lê Dũng Mưu, Nguyễn Hữu Điền (2009), Giáo trình giải tích ứng dụng, NXB Đại học Quốc Gia Hà Nội Khác
[4] T.R. Rockafellar (1970), Convex Analysis, Rinceton Press Khác

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm