Em xin khẳng định kết quả của đề tài “Quy tắc nhân tử hóa mờcủa bài toán tối ưu có ràng buộc và ứng dụng” không có sự trùnglặp với kết quả của các đề tài khác... Lí do chọn đề tài Giải t
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠOTRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
Trang 2Lời cảm ơn
Trong quá trình học tập, nghiên cứu và hoàn thành Luận văn, tác giả
đã nhận được sự động viên, giúp đỡ của các bạn bè, đồng nghiệp, ngườithân, của các thầy giáo, cô giáo Khoa Toán, các thầy, cô phòng Sau đạihọc và của các thầy, cô trực tiếp giảng dạy Tôi xin được bày tỏ lòngbiết ơn tất cả mọi người đã hỗ trợ tôi để hoàn thành Luận văn này.Đặc biệt, tôi xin cảm ơn TS Trần Văn Bằng, người thầy đã địnhhướng và chỉ bảo tận tình để tôi có thể hoàn thành Luận văn này
Tôi xin trân trọng cảm ơn!
Hà Nội, 20 tháng 11 năm 2014
Tác giả
Đặng Thị Thanh Huyền
Trang 3Lời cam đoan
Luận văn này là kết quả của bản thân em đạt được trong quá trìnhhọc tập và nghiên cứu, dưới sự hướng dẫn của TS Trần Văn Bằng và sựgiúp đỡ của các Thầy, Cô trong khoa Toán Trường ĐHSP Hà Nội 2 vàcủa các Thầy, Cô đã trực tiếp giảng dạy chúng em
Trong khi nghiên cứu, hoàn thành bản Luận văn này em đã thamkhảo một số tài liệu đã ghi trong phần tài liệu tham khảo
Em xin khẳng định kết quả của đề tài “Quy tắc nhân tử hóa mờcủa bài toán tối ưu có ràng buộc và ứng dụng” không có sự trùnglặp với kết quả của các đề tài khác
Hà Nội, 20 tháng 11 năm 2014
Tác giả
Đặng Thị Thanh Huyền
Trang 4Mục lục
Chương 1 Một số kiến thức chuẩn bị 5
1.1 Một số khái niệm về không gian Banach 5
1.2 Hàm trên không gian Banach 7
1.3 Dưới vi phân Fréchet 9
1.4 Quy tắc tổng mờ 13
Chương 2 Quy tắc nhân tử hóa mờ và ứng dụng 22
2.1 Bài toán tối ưu 22
2.2 Quy tắc nhân tử hóa mờ và ứng dụng 28
2.2.1 Bài toán cực tiểu với hữu hạn ràng buộc 28
2.2.2 Ứng dụng 35
2.2.3 Bài toán cực tiểu với vô hạn ràng buộc 38
2.2.4 Ứng dụng 40
Tài liệu tham khảo 43
Trang 5Mở đầu
1 Lí do chọn đề tài
Giải tích không trơn ra đời trong những năm 70 của thế kỷ 20 khinhững nhà điều khiển học muốn tìm điều kiện cần tối ưu cho bài toánvới dữ kiện không trơn, như với các dữ kiện Lipschitz hay với các dữkiện chỉ nửa liên tục
Cho tới nay đã có nhiều khái niệm “đạo hàm suy rộng” đã được đưa
ra và thường được gọi dưới cái tên “dưới vi phân” như: dưới vi phân suyrộng của Clark, dưới vi phân Fréchet, dưới vi phân Mordukhovich, Các đạo hàm suy rộng đó đã đáp ứng được phần nào các yêu cầu đặt ra.Tuy nhiên vẫn còn rất nhiều vấn đề liên quan tới chúng cần được tiếptục tìm hiểu và khai thác Đặc biệt là việc mở rộng các tiêu chuẩn, quytắc đã biết đối với đạo hàm cổ điển sang cho các đạo hàm suy rộng này.Toán học tính toán là để tìm ra cái “tối ưu” nhằm phục vụ con người.Một trong những bài toán tối ưu quan trọng nhất là tìm cực trị có điềukiện của một hàm vô hướng Đối với trường hợp hàm mục tiêu và cácràng buộc trơn, Lagrange đã cho chúng ta một quy tắc nhân tử hóa rấttuyệt vời để chuyển bài toán cực trị có điều kiện về bài toán cực trị tự
Trang 6do Vấn đề đặt ra là khi hàm mục tiêu và các dữ kiện không trơn, nóicách khác là khi sử dụng dưới vi phân thì quy tắc nhân tử hóa sẽ là nhưthế nào?
Được sự hướng dẫn của TS Trần Văn Bằng, tôi mạnh dạn chọn đềtài nghiên cứu:
“Quy tắc nhân tử hóa mờ của bài toán tối ưu có ràng buộc
và ứng dụng”
2 Mục đích nghiên cứu
Tìm hiểu về dưới vi phân Fréchet, quy tắc nhân tử hóa mờ của bàitoán tối ưu có ràng buộc và ứng dụng của chúng
3 Nhiệm vụ nghiên cứu
Hệ thống, tổng hợp các kiến thức về dưới vi phân Fréchet cùng một
số ứng dụng của nó vào lý thuyết tối ưu
4 Đối tượng và phạm vi nghiên cứu
Đối tượng: Dưới vi phân Fréchet và ứng dụng
Phạm vi: Nghiên cứu trong lớp hàm nửa liên tục dưới
5 Phương pháp nghiên cứu
Sử dụng các phương pháp nghiên cứu của giải tích hàm và lý thuyếttối ưu
Trang 76 Những đóng góp của Luận văn
Trình bày hệ thống một số kết quả về dưới vi phân Fréchet, quy tắcnhân tử hóa mờ và ứng dụng
Trang 8Chương 1
Một số kiến thức chuẩn bị
Trong chương này ta sẽ trình bày những khái niệm cơ bản về khônggian Banach, hàm trên không gian Banach, dưới vi phân Fréchet và quytắc tổng mờ
1.1 Một số khái niệm về không gian Banach
Trong luận văn này, khi nói tới không gian Banach chúng ta luôn hiểu
đó là một không gian Banach thực, thường kí hiệu là X, với chuẩnk.kX hay đơn giản là k.k Cho X là không gian Banach Kí hiệu hìnhcầu đơn vị (đóng) và mặt cầu đơn vị trong X lần lượt là các tập hợp
BX := {x ∈ X : kxk ≤ 1}, SX := {x ∈ X : kxk = 1}
Ví dụ 1.1 ([1],[4],[8]) Ta có:
1 Không gian tuyến tính Rk với chuẩn kxk = Pk
i=1|xi| là không gianBanach
2 Cho Ω ⊂ Rk là tập con đo được Lebesgue Khi đó không gian tuyếntính Lp(Ω) (1 ≤ p < ∞) tất cả các hàm số thực đo được x = x(t)
Trang 9trên Ω sao cho RΩ|x(t)|pdt < ∞ với chuẩn kxk = RΩ|x(t)|pdt1/p làkhông gian Banach Không gian tuyến tính L∞(Ω) tất cả các hàm
số thực đo được x = x(t) trên Ω sao cho esssupΩ|x(t)| < +∞ vớichuẩn kxk = supΩ|x(t)| là không gian Banach
3 Không gian tuyến tính lp (1 ≤ p < ∞) tất cả các dãy số thực x =(x(i)) sao cho chuỗi
là không gian Banach
4 Không gian tuyến tính C[a, b] các hàm thực liên tục trên một đoạn[a, b] với chuẩn kxk = max
[a,b]
|x(t)| là không gian Banach
Với không gian định chuẩn X, kí hiệu X∗ là tập hợp tất cả các phiếmhàm tuyến tính liên tục trên X và gọi là không gian đối ngẫu của X.Nếu x∗ ∈ X∗ và x ∈ X thì giá trị của x∗ tại x được kí hiệu là hx∗, xi Định lý 1.2 ([1], Định lý 2.6, trang 78 ) Không gian đối ngẫu X∗ củakhông gian định chuẩn X với chuẩn xác định bởi
kx∗k = sup
x6=0
|hx∗, xi|
kxk
là một không gian Banach
Ví dụ 1.3 ([1], trang 108, 110) Không gian đối ngẫu của Lp(Ω),
lp (1 < p < ∞) lần lượt là không gian Lq(Ω), lq với q là số mũ liên hợpcủa p, tức là 1/p + 1/q = 1 Đặc biệt không gian đối ngẫu của L1(Ω), l1tương ứng là L∞(Ω), l∞
Trang 10Định nghĩa 1.4 Không gian liên hợp của không gian X∗ gọi là khônggian liên hợp thứ hai của không gian định chuẩn X và kí hiệu X∗∗ Nhưvậy X∗∗ = (X∗)∗.
Định nghĩa 1.5 Không gian định chuẩn X gọi là không gian phản xạ,nếu X = X∗∗
Ví dụ 1.6 ([1, 8]) Các không gian Lp(Ω), lp (1 < p < ∞) là các khônggian phản xạ
Theo Định lý 1.2, nếu X phản xạ thì X là một không gian Banach.Định nghĩa 1.7 Không gian Banach X được gọi là tách được nếu nó
có một tập con đếm được trù mật
Ví dụ 1.8 ([8], trang 103) Các không gian Lp(Ω) (1 ≤ p < ∞), C[a, b]
là không gian tách được; các không gian L∞(Ω), l∞ là không tách được
1.2 Hàm trên không gian Banach
Cho X, Y là các không gian Banach, f : X → Y là một ánh xạ.Định nghĩa 1.9 Ánh xạ f được gọi là khả vi Fréchet (hay đơn giản
là khả vi ) tại x ∈ X nếu tồn tại một phiếm hàm tuyến tính liên tục
Trang 11Khi Y = R thì đạo hàm (nếu tồn tại) của hàm f được xác định bởimột phần tử của x∗ ∈ X∗ và biểu thức định nghĩa thường được viết là:
Ví dụ 1.11 Chuẩn Euclide trên một không gian Hilbert H là chuẩntrơn Fréchet Thật vậy, do
Trang 12Định lý 1.14 ([9], Hệ quả 3.3, trang 51) Cho X là không gian Banachtách được Khi đó X có chuẩn tương đương trơn Fréchet khi và chỉ khi
X∗ tách được
Ví dụ 1.15 Các không gian Lp(Ω) (1 < p < ∞) là không gian có chuẩntương đương trơn Fréchet vì nó và không gian đối ngẫu của nó táchđược.Tổng quát hơn, mọi không gian Banach phản xạ tách được đều cóchuẩn tương đương trơn Fréchet
1.3 Dưới vi phân Fréchet
Từ đây về sau ta luôn giả thiết X là không gian Banach có chuẩntương đương trơn Fréchet và trên X ta luôn giả thiết chuẩn nói đến
là chuẩn trơn Fréchet Do vậy, ta nói X là không gian có chuẩn trơnFréchet Hơn nữa chúng ta cũng xét các hàm với giá trị thực mở rộng,tức là có giá trị trong R := R ∪ {+∞}
Cho hàm f : X → R Ta gọi
domf := {x ∈ X : f (x) ∈ R},epif := {(x, λ) ∈ X × R : x ∈ X, λ ≥ f (x)}
Trang 13tương ứng là miền hữu hiệu và trên đồ thị của f.
Hàm f được gọi là chính thường (proper) nếu domf 6= ∅
Định nghĩa 1.16 ([8], trang 10) Hàm f : X → R được gọi là nửa liêntục dưới (l.s.c.) nếu với mọi λ ∈ R, tập {x ∈ X : f (x) ≤ λ} là tập đóng.Định lý 1.17 ([8], trang 10) Cho X là không gian Banach, f là hàmchính thường trên X Khi đó ta có các khẳng định a) - d) sau đây làtương đương
a) Hàm f nửa liên tục dưới
b) Trên đồ thị epif là tập đóng trong X × R
c) Với mọi x ∈ X, với mọi ε > 0 đều tồn tại một lân cận V của xsao cho f (y) > f (x) − ε với mọi y ∈ V
d) Với mọi dãy (xn) hội tụ tới x trong X ta đều có lim infn→∞f (xn) ≥
f (x)
Hơn nữa ta có:
e) Nếu f1, f2 nửa liên tục dưới thì f1 + f2 cũng nửa liên tục dưới.f) Nếu (fi)i∈I là một họ các hàm l.s.c thì f (x) = supi∈Ifi(x) cũngl.s.c
g) Nếu f l.s.c và E ⊂ X là tập compact thì f đạt giá trị lớn nhấttrên E
Ví dụ 1.18 i) Mọi hàm liên tục đều nửa liên tục dưới
a, nếu x = 2
Trang 14nửa liên tục dưới khi và chỉ khi a ≤ 4.
Định nghĩa 1.19 ([6], Định nghĩa 1.3) Cho f : X → R là hàm l.s.c.,
S ⊂ X là tập con đóng Ta nói, f là dưới khả vi Fréchet với dưới đạohàm Fréchet x∗ tại x nếu tồn tại C1 - hàm, lõm g sao cho ∇g(x) = x∗
và f − g đạt cực tiểu địa phương tại x Tập mọi dưới đạo hàm Fréchetgọi là dưới vi phân Fréchet của f tại x và ký hiệu là D−f (x)
Nón pháp Fréchet của S tại x là tập hợp
N (S, x) := D−δS(x),trong đó δS là hàm chỉ của tập S, xác định bởi
Định lý 1.20 ([6], trang 5) Cho X là không gian Banach với chuẩntrơn Fréchet, f là hàm l.s.c trên X Khi đó x∗ ∈ D−f (x) khi và chỉ khi
ta có rất nhiều tính chất của dưới vi phân Fréchet, mối liên hệ của dưới
vi phân Fréchet và các loại dưới vi phân khác như dưới vi phân Gâteaux,dưới vi phân Clarke, Chẳng hạn
i) Nếu f khả vi Fréchet tại x thì D−f (x) = {Df (x)};
Trang 15ii) Nếu f lồi trên X thì
D−f (x) = {x∗ ∈ X∗ : f (y) − f (x) − hx∗, y − xi ≥ 0, ∀y ∈ X}
Ví dụ 1.22 i) Cho hàm f (x) = |x|, x ∈ R Khi đó, tại x > 0 thì
f khả vi nên D−f (x) = {Df (x)} = {1}; tại x < 0 thì f khả vi nên
D−f (x) = {Df (x)} = {−1} Tại x = 0 hàm f không khả vi Do f lồinên ta có thể sử dụng Nhận xét 1.21 ii) để tính dưới vi phân Cụ thể
D−f (0) = {p ∈ R : |y| − py ≥ 0, ∀y ∈ R}
Chọn y = −1 và y = 1 ta suy ra −1 ≤ p ≤ 1 Với p ∈ [−1, 1] ta luôn có
py ≤ |py| ≤ |y| nên D−f (0) = [−1, 1]
ii) Tương tự ta có nếu X là không gian Hilbert và f (x) = kxk thì tacũng có
o, nếu x 6= 0
Khi đó tồn tại C1- hàm lồi g trên X và v ∈ X sao cho:
( i ) Hàm x 7→ f (x) + g(x) đạt cực tiểu toàn cục tại x = v
( ii ) ||u − v|| < α
( iii )f (v) < ε + inf
X f ( iv) ||∇g(v)|| < 2ελ
Trang 16Nhận xét 1.24 Ta hình dung u là điểm cực tiểu của f (hoặc thuộcmột dãy cực tiểu) Khi đó có thể nhiễu f bởi một hàm lồi, trơn, nhỏ
do (k ∇g(v) k< 2ελ ) thì ta nhận được một điểm v bên cạnh u ( vì
k u − v k< λ ) là cực tiểu của hàm nhiễu f + g mà giá trị của f tại đó(f (v)) vẫn không thay đổi so với f (u) theo nghĩa
inf
X f ≤ f (v) < ε + inf
X f
1.4 Quy tắc tổng mờ
Để phát triển các công cụ của giải tích qua khái niệm dưới vi phân, ta
có thể dựa trên một kết quả mang tính chất nền tảng đó là quy tắc tổng
mờ Quy tắc này có hai phiên bản: không địa phương và địa phương Kíhiệu đường kính của tập S ⊂ X là số
diam(S) := sup {kx − yk : x, y ∈ S} Định lý 1.25 (Quy tắc tổng mờ không địa phương, [6], Định lý 2.1).Cho f1, , fN : X → R là các hàm nửa liên tục dưới và bị chặn dưới với
Trang 17η→0inf {f1(y1) + f2(y2) : ky1 − y2k ≤ η} < ∞
Kết quả (1.3) trong quy tắc tổng mờ không địa phương là tương tựnhư trong quy tắc tổng mờ địa phương Tuy nhiên, kết quả (1.1) chỉ chochúng ta biết các điểm xn là gần nhau, điều này khác với quy tắc tổng
mờ địa phương, ở đó khẳng định rằng, các điểm này gần với điểm cựctiểu của tổng (với một số giả thiết bổ sung) Lưu ý rằng, kết quả (1.1)còn cho phép ta kiểm soát “cỡ” của các dưới đạo hàm tham gia trongtổng Điều này rất hữu ích trong các ứng dụng Kết luận (1.2) cho tađiểm tựa vào giá trị của các hàm nửa liên tục dưới Trong các ứng dụng,điều này thường mang lại thông tin gián tiếp về việc xác định vị trí cácđiểm xn Ta sẽ minh họa điều này qua ví dụ sau
Ví dụ 1.27 (Tính trù mật của các điểm dưới khả vi) Cho f : X → R
là một hàm nửa liên tục dưới, x ∈ domf và ε ∈ (0, 1) Áp dụng Định lý
Trang 181.25 đối với f1 = f + δx+BX và f2 = δ{x} ta có: tồn tại x1 và x2 sao cho
kx1 − x2k < ε, 0 ∈ D−f1(x1) + D−δ{x}(x2) + εBX∗ và
f1(x1) + δ{x}(x2) < f (x) + ε
Bất đẳng thức cuối suy ra x2 = x và do đó x1 phải thuộc phần trong của
x + BX nên D−f1(x1) = D−f (x1) Chứng tỏ, dom(D−f ) trù mật trongdomf
Đây là một kết quả khá mạnh Cụ thể vì dưới đạo hàm của hàm lõm
tự động là đạo hàm nên từ đây suy ra các hàm lõm liên tục trên cáckhông gian trơn Fréchet là khả vi Fréchet trù mật
Tiếp theo ta đề cập tới quy tắc tổng mờ địa phương, một kết quả quantrọng trong lý thuyết các bài toán tối ưu hóa và là cơ sở để xây dựngcác quy tắc tính dưới vi phân Như đã đề cập từ trước, quy tắc tổng mờđịa phương cần phải có các giả thiết bổ sung
Định nghĩa 1.28 (Nửa liên tục dưới đều, [6], Định nghĩa 2.4) Cho
f1, , fN : X → R là các hàm nửa liên tục dưới và E là một tập conđóng của X Ta nói bộ (f1, , fn) là nửa liên tục dưới đều trên E nếu
Chúng ta nói (f1, fN) là nửa liên tục dưới đều địa phương tại
x ∈ N∩
n=1domfn nếu (f1, fN) là nửa liên tục dưới đều trên mọi hình cầuđóng tâm trong lân cận nào đó của x
Trang 19Nhận xét 1.29 Có hai trường hợp đơn giản đảm bảo hệ (f1, fN) lànửa liên tục dưới đều địa phương tại x là
(a) Tất cả, chỉ trừ ra một trong các hàm fn liên tục đều trong mộtlân cận của x;
(b) Có ít nhất một trong các hàm fn có các tập mức compact trongmột lân cận của x
Định lý 1.30 (Quy tắc tổng mờ địa phương mạnh, [6], Định lý 2.6) Cho
f1, fN : X → R là các hàm nửa liên tục dưới Giả sử (f1, fN) nửa liêntục dưới đều địa phương tại x và
N
P
n=1
fn đạt cực tiểu địa phương tại x Khi
đó, với mọi ε > 0, tồn tại xn ∈ x + εB và x∗n ∈ D−fn(xn), n = 1, , Nsao cho
Định lý 1.31 (Quy tắc tổng mờ địa phương yếu, [6], Định lý 2.7).Cho f1, , fN : X → R là các hàm nửa liên tục dưới Giả sử x∗ ∈
D−(PN
n=1fn)(x) Khi đó với bất kì ε > 0 và bất kì lân cận yếu ∗ V của
Trang 200 trong X∗, đều tồn tại xn ∈ x + εB, x∗n ∈ D−fn(xn), n = 1, , N saocho |fn(xn) − fn(x)| < ε, kx∗nk diam({x1, , xN}) < ε, n = 1, 2, , N và
1, 2, , N, r = 1, 2, thuộc x + ηBX và kxnr − xmrk → 0 khi r → ∞, tồntại một dãy {ur} các phần tử thuộc hình cầu sao cho kxnr − urk → 0 và
Ví dụ 1.33 Cho X là một không gian Banach vô hạn chiều và lấy mộtdãy ek trong X sao cho kekk = 1 và kek − elk ≥ 1/2 khi k 6= l Đặt
A := {ek/l : k, l = 1, 2, } ∪ {0},
B := {(ek + e1/k)/l : k, l = 1, 2, } ∪ {0}
Khi đó cả A và B đều là các tập con đóng và A ∩ B = {0} Đặt f1 := δA
và f2 := δB Ta chứng tỏ rằng, với bất kì η > 0, (f1, f2) không là nửa liên
Trang 21tục dưới đều địa phương trên ηB Thật vậy, nếu l là một số nguyên saocho 2/l < η và cho x1r = er/l; x2r = (er+ e1/r)/l thì kx1r − x2rk → 0 và
f1(x1r) = f2(x2r) = 0 ∀r Nếu ur là dãy sao cho kxnr − urk → 0, n = 1, 2thì ta phải có ur 6= 0 với r đủ lớn Vì thế có ít nhất một trong hai giátrị f1(ur), f2(ur) bằng ∞ và do đó
Ví dụ 1.34 Lấy X := l2 và ek là một cơ sở trực chuẩn trong X Khi
đó x ∈ X có thể biểu diễn duy nhất x = P∞
Do vậy k · k∞ là hàm Lipschitz với hằng số Lipschitz bằng 2
Đặt Fn = {x : kxk ≤ 3, x(i) ≥ 0 và x(i) = 0 khi i mod 3 6= 0 vàkhi i ≤ 3n} Ta xét hai hàm
Trang 22Rõ ràng domf1 ∩ domf2 = {0} nên theo tính duy nhất của biểu diễnqua cơ sở suy ra f1 + f2 đạt cực tiểu tại 0 Từ định nghĩa ta thấy f1 và
f2 đều bị chặn dưới bởi −7 vì k · k∞ là Lipschitz với hằng số Lipschitzbằng 2
Bây giờ chúng ta chỉ ra f1 là nửa liên tục dưới Giả sử xn ∈ domf1 và
Nếu x 6= 0 thì kn 6→ ∞ Thật vậy, nếu kn → ∞ thì với mỗi i ta có
xn(i) → 0 khi n → ∞ vì xn(i) = 0 với mọi i ≤ 3kn− 1
Do giới hạn theo chuẩn và giới hạn theo từng tọa độ phải trùng nhaunếu cả hai tồn tại, nên xn → 0 theo chuẩn
Do kn 6→ ∞ nên kn = n0 với mọi n đủ lớn (bởi vì, khi n 6= m,
Trang 23Điều này chứng tỏ f1 là nửa liên tục dưới Tương tự, ta cũng có f2 nửaliên tục dưới.
Tiếp theo, ta chứng minh rằng với mọi xi ∈ B và x∗i ∈ D−fi(xi) ta đều
có kx∗1 + x∗2k ≥ 1 Thật vậy, gọi gi là các hàm tương ứng với x∗i, i = 1, 2như trong định nghĩa dưới đạo hàm Fréchet Để ý rằng D−f1(0) = ∅ vì