Đề tài Phương pháp Newton nửa trơn cho bài toán ngược phi tuyến với nghiệm thưa không âm nghiên cứu bài toán ngược, bài toán đặt không chỉnh; nghiên cứu phương pháp chỉnh hóa thưa; bghiên cứu phương pháp chỉnh hóa thưa không âm; nghiên cứu Phương pháp Newton nửa trơn trong chỉnh hóa thưa; nghiên cứu Phương pháp Newton nửa trơn trong chỉnh hóa thưa không âm.
Không gian Banah
Khong gian Hilbert 8
Định nghĩa 1.1.6 (Tích vô hướng) Cho # là một không gian vectơ trên trường số thực Tớch vụ hướng trờn # là một ỏnh xạ (.,:) : H x H —› ùR, xỏc định như sau:
(z.u) € H x H (z,u) 6ẹ thỏa mãn các điều kiện:
1 Với mọi z € H, ta cú (z,z) > 0 Hơn nữa, (z,z) = 0 ô z = 0
Số thực (z.g) được gọi là tích vô hướng của hai vectơ z và Cặp (H (- )) được gọi là không gian tiền Hilbert
Dinh lí 1.1.7 (Bất đẳng thức Sehuarz) Với mọi z, trong không gian tiền Hilbert
H ta luôn có đẳng thức sau đâu
Giả sử # 0, khi đó Ya € R ta có
Do đó bất đẳng thức (1.1) đúng a
Dinh Ii 1.1.8 Cho H là không gian tiền Hilbert Ánh zạ ||-||: H — R được định nghĩa nll = Vea), ten (12) là một chuẩn trên H
Chứng mình Từ công thức (12) ta có lizl= VŒ.z) >0.Vz € H
Ngoài ra |lz||= 0 © (z,z) =0 œz =0 Hơn nữa lazll= vfaz.az) = v/a5(,z) = với mọi z € H và œ €R
Mặt khác, với mọi z, thuộc # ta có le +ul? = (e+ 2+)
Định nghĩa 1.1.9 (Không gian Hilbert): Không gian Hilbert là một không gian véc-tơ có tích vô hướng ⟨·,⟩ và đầy đủ (hoàn chỉnh) theo chuẩn cảm ứng từ tích vô hướng đó Chuẩn này được xác định bằng ||x|| = sqrt(⟨x,x⟩) cho mọi véc-tơ x, và khoảng cách giữa hai véc-tơ x và y là ||x − y||.
Cơ sở trực chuẩn Bee Ẳa)} 13 Hàm số và đạo hàm Erếchet
Định nghĩa 1.2.1 Cho # là một không gian tiền Hilbert, A/ và é là các tập con của H Ta có các định nghĩa sau đây:
1 Hai phần tit x va „ thuộc / được gọi là trực giao với nhau, nếu (z,/) = 0 Ký hiệu là z 1
'Vectơ z trực giao với tap N néu x L y véi mọi € N
N+ la tap gdm tắt cả các phan tit x true giao véi N
Mot hé M c H duoc gọi là hệ trực giao nếu hai phần tử phân biệt bất kỳ của
M thì trực giao với nhau, tức là Vz, € Af và z # y ta có z L ự
Trong đại số tuyến tính, hệ A được gọi là hệ trực chuẩn khi mọi phần tử của hệ đó vừa trực giao với nhau vừa có chuẩn bằng 1 Điều này có nghĩa là với mọi vectơ u, v thuộc A, tích vô hướng ⟨u, v⟩ = 0 khi u ≠ v và ||u|| = ||v|| = 1 Định lý 1 khẳng định rằng nếu n phần tử tạo thành một hệ trực giao, thì ta có đẳng thức Pythagore: với bất kỳ vectơ x, khi viết x theo cơ sở của hệ trực giao này, bình phương chuẩn của x bằng tổng bình phương các hệ số tương ứng, tức ||x||^2 = ∑_{i=1}^n ⟨x, e_i⟩^2 Hệ trực chuẩn cho phép phân tích vectơ theo cơ sở trực giao, giúp tính toán chuẩn và độ dài của vectơ một cách dễ dàng và tối ưu.
=D lel = là một hệ trực giao nên (z¡,z;) = 0 với mọi 1 < ¿,j llzullÊ hoi tu va hie đó n=l
Su =1 +12 + + 7n ứm = ll#Iấ + lzalấ + + lzn|ẫ
“Từ đẳng thức này ta thấy (S,)„ là dãy Cauchy trong # khi và chỉ khi (z„)„ là dãy Cauchy trong R
Trong phân tích toán học, một không gian metric được gọi là đầy đủ nếu mọi dãy Cauchy thuộc không gian đó đều có giới hạn nằm trong chính không gian ấy Điều này có nghĩa là với mỗi dãy {x_n} thỏa mãn d(x_m, x_n) → 0 khi m, n → ∞, tồn tại một điểm x ∈ S sao cho d(x_n, x) → 0 Vì vậy, ở một không gian đầy đủ, mọi dãy hội tụ trong S đồng thời là dãy Cauchy và mọi dãy Cauchy thuộc S đều có giới hạn thuộc S, tức là có một điểm giới hạn trong S Ví dụ điển hình cho khái niệm này là không gian thực số R với chuẩn thông thường: mọi dãy Cauchy trên R đều có giới hạn thực, nên R là không gian đầy đủ Tính đầy đủ đóng vai trò then chốt trong phân tích, đảm bảo sự tồn tại của giới hạn và sự hội tụ của dãy số trong giải tích thực và phức.
Dinh lý được chimg minh a
Hệ quả 1.2.4 Cho (e,n = 1,2, } là một hệ trực chuẩn trong không gian Hilbert uà dãy (A„)„ là dãy số thực Ta có chuỗi ven hoi tu vé x © H khi va chỉ khi
Chứng mình Ta áp dụng Định lý (1.33) cho hệ trực giao {run = 1.2 } với
Trong một không gian Hilbert H, với một hệ trực chuẩn {e_n} (n = 1, 2, …), mỗi x ∈ H có hệ số Fourier c_n = ⟨x, e_n⟩ và các tổng partial S_N = ∑_{n=1}^N c_n e_n S_N hội tụ về x nếu và chỉ khi dãy các hệ số c_n có tổng bình phương hữu hạn, tức ∑_{n=1}^∞ |⟨x, e_n⟩|^2 < ∞ Bởi bất đẳng thức Bessel, ta luôn có ∑_{n=1}^∞ |⟨x, e_n⟩|^2 ≤ ||x||^2 Nếu {e_n} là một cơ sở trực chuẩn đầy đủ, thì Parseval cho ta ∑_{n=1}^∞ |⟨x, e_n⟩|^2 = ||x||^2 và S_N hội tụ về x cho mọi x ∈ H Đồng thời, mỗi vector trong hệ trực chuẩn có chuẩn 1, nên ||e_n|| = 1 cho mọi n (n = 1, 2, …).
`8 IAseal2 = 3ˆ lu „=1 n= n Định nghĩa 1.2.5 (Chuỗi Fourier) Cho không gian Hilbert # và hệ trực chuẩn
E = {en.n = 1,2, } Cho z là một vectơ trong # Ta lập chuỗi hình thức sau đây
Định nghĩa 1.2.6: Cho E = {e_n} là một hệ trực chuẩn trong không gian Hilbert H Với mọi x ∈ H, chuỗi Fourier của x đối với hệ E được cho bởi x̂ = Σ_{n=1}^∞ (x, e_n) e_n, trong đó các số (x, e_n) được gọi là hệ số Fourier của x với hệ E Các hệ số Fourier chính là các tọa độ của x theo cơ sở E, và chuỗi Fourier này hội tụ trong H, tức là các tổng S_N = Σ_{n=1}^N (x, e_n) e_n tiến tới x trong chuẩn của H Nếu E là một cơ sở trực chuẩn, chuỗi Fourier sẽ hội tụ đầy đủ và x = Σ_{n=1}^∞ (x, e_n) e_n.
Chiing minh Dat yn 2-Seeye i=l
IIzlÊ = lym? + II 2 z:elÊ = yl? + > bail? =
Vì bất đẳng thức này đúng với mọi n, nén khi cho n — ov, ta được
Định lý hình chiếu trực giao (Định lý 1.2.7) cho biết: với M là một không gian con đóng của không gian Hilbert H, mỗi phần tử z ∈ H có phân rã duy nhất thành z = u + v với u ∈ M và v ∈ M⊥ Phần v thuộc bổ sung trực giao của M và z − u cũng trực giao với mọi phần tử của M, tức ⟨z − u, w⟩ = 0 với mọi w ∈ M Quá trình này cho ta hình chiếu trực giao của z lên M, ký hiệu P_M(z) = u, và nó là công cụ quan trọng trong phân tích, tối ưu hóa và xử lý tín hiệu trên không gian Hilbert.
Xét một điểm x và tập M, khoảng cách từ x tới M được định nghĩa là d(x,M) = inf{ ||x − m|| : m ∈ M } Đặt d = d(x,M) Theo tính chất của infimum, tồn tại một chuỗi y_n ∈ M sao cho ||x − y_n|| → d Do đó d là giới hạn của các khoảng cách từ x tới các phần tử của M; nếu M đóng hoặc có phần tử chiếu gần nhất, ta có y ∈ M sao cho ||x − y|| = d(x,M) Khi đó z = x − y là một vector thỏa mãn ||z|| = d(x,M) Đây là mối liên hệ giữa vectơ hiệu và khoảng cách tối thiểu tới M, và trong bài viết ta có thể xem xét dưới dạng u + z với z thỏa mãn điều kiện tương ứng để chứng minh các kết luận liên quan.
A là không gian con đóng của một không gian Hilbert H, nên A cũng là một không gian Hilbert với tích nội tại và chuẩn được thừa kế từ H Vì vậy để chứng minh dãy (y_n) hội tụ trong A, ta chỉ cần kiểm tra nó là dãy Cauchy trong A Áp dụng đẳng thức hình bình hành cho hai vectơ y_n − z và y_m − z với z ∈ A, ta có ||y_n − y_m||^2 = ||(y_n − z) − (y_m − z)||^2 ≤ (||y_n − z|| + ||y_m − z||)^2 Nhờ tính đóng kín của A và tính chất hoàn chỉnh của không gian Hilbert, nếu tồn tại một z ∈ A sao cho (y_n − z) là dãy Cauchy trong A thì (y_n) là dãy Cauchy và do đó hội tụ trong A.
|lm + tụ — 2| + [lm — Yall? = 2 (lan — z| + llua — z|) - (14)
Do M Ia khong gian con nen Y+¥# ee
€ M Hon nita, do d = inf {\lx— ull} nên ue
7 +‡| > #8 Lúc này, từ đẳng thức (1.4), ta có 2
0 < [lym = a|Š = 2(llwm — #ÍÊ + llưn — z|Ê) — lly + va — 2z|lÊ
Cho mụn — so ta có 2(||wm — z|2 + |Ìpu — z||2) — 4d + 0 nên |Ìw„ — yall > 0 Vay
Lai c6 M là không gian đầy đủ nên tồn tại € A/ sao cho lim ya = y Từ đó ta có
Bây giờ ta đặt z = z — y hay z =w+z Ta chỉ cần chứng minh ring z € M+ Thật vậy, giả sử u € A/ và u #0 Với mọi a € ta có ý + au € A/ nên lel? = llz = wilÊ < [lx — (w + œw)|Ê aul?
Do dé | (z,u)| (y.y) =0 > y =0
(2) = (3) Do £ là hệ trực chuẩn nên
(3) = (4) Trong đẳng thức ở (3), thay bởi z ta có ngay đẳng thức ở (4)
(4) = (1) Gọi Af là không gian con sinh bởi £ Do ă là không gian con đóng của 3í nên theo Định lý 1.2.7 ta có
Do dé ta chi cin chimg minh 37~ = {0} That ứng vay, véi moi hy M* = M* tacé 1
15 zLu,Yu € M Dac biét zLen nén (z,en) ,Vn Tit ding thức (4) ta có lel? = S71 (ze) |? =0 ơ
Vậy ?4 = M nờn E là cơ sở trực chuẩn của 2ý ủ
1.3 Hàm số và đạo hàm Fréchet Định nghĩa 1.3.1 (Hàm coercive): Hàm f : E → ℝ được gọi là coercive nếu với mọi dãy z_n ⊂ E sao cho ||z_n|| → +∞ thì f(z_n) → +∞ Định nghĩa 1.3.2: Cho X, Y là hai không gian Banach (định chuẩn) Toán tử f : X → Y' được gọi là liên tục tại z0 ∈ X nếu với mọi ε > 0 tồn tại δ > 0 sao cho với mọi z ∈ X, nếu ||z − z0|| < δ thì ||f(z) − f(z0)||_{Y'} < ε.
+€ X mà ||z = ze|| < ở ta đều có ||ƒ(z) = ƒ(zo)ll < e
Nhận xét 1.3.3 Ta có thể định nghĩa toán tử ƒ liên tục tại zo theo một cách khác
Định nghĩa 1.3.4 cho biết một toán tử f được gọi là liên tục tại z nếu mọi dãy z_n với z_n → z đều thỏa mãn f(z_n) → f(z); từ đó f được coi là liên tục trên X khi f liên tục tại mọi z ∈ X Định nghĩa 1.3.5 đặt ra khái niệm toán tử bị chặn giữa hai không gian định chuẩn X và Y: f: X → Y là bị chặn nếu tồn tại một hằng số A ≥ 0 sao cho ||f(z)|| ≤ A ||z|| với mọi z ∈ X Định nghĩa 1.3.6 định nghĩa ánh xạ tuyến tính từ X sang Y: f: X → Y là ánh xạ tuyến tính nếu với mọi z1, z2 ∈ X và mọi a ∈ trường F ta có f(z1 + z2) = f(z1) + f(z2) và f(a z) = a f(z).
3 f(az) = œƒ(z) Định lí 1.3.7 Cho X,Y là hai không gian định chuẩn tà ƒ : X — Y là toán tử tuyến tính Khi đó các mệnh đề sau là tương đương:
(9) ƒ liên tục tại một điểm xo
(1) + @) Điều này hiển nhiên theo định nghĩa toán tử liên tục trên X
(2) = (3) Giả sử có di liên tục tại zọ ta có ƒ(z„ + zo) => /(zo) Do ƒ tuyến tính nên
(#„)„ mà z„ = 0 Khi đó z„ + zo => zo nên theo giả thiết f
Suy ra /(z„) => 0 Từ đó ƒ liên tục tại 0
(3) = (4) Theo định nghĩa, do ƒ liên tục tại 0 nên với e = 1 tồn tại 6 > 0 sao cho nếu z€ X và tel a, Vr € 29 +U
Hàm ƒ được gọi là nửa liên tục dưới yếu nếu nó nửa liên tục dưới tại mọi z € X
Định nghĩa 1.4.1: Cho X, Y là các không gian Banach và U là tập con mở của X Một ánh xạ f: U → Y được gọi là kha vi Newton tại x ∈ U nếu tồn tại một ánh xạ tuyến tính liên tục L: X → Y sao cho lim_{h→0} ||f(x+h) − f(x) − L(h)|| / ||h|| = 0 Khi đó f có đạo hàm Newton tại x và L được gọi là đạo hàm Newton của f tại x, ký hiệu f′(x) hoặc df(x) Đồng thời, f(x+h) = f(x) + L(h) + o(||h||) khi h → 0.
(1) F được gọi là đạo hàm Newton của ƒ trên X nếu F là đạo hàm Newton của ƒ tại mọi z € X
(2) Hàm ƒ có đạo hàm Newton tại mọi điểm được gọi là hàm Newton nửa trơn
(3) Nếu hàm số ƒ có đạo hàm cổ điển /' liên tục trên tập mở U thì ƒ là hàm nửa trơn trên U va dao ham Newton của f la f’
Thật vậy, với mọi w € U, ta có os Messe) e+ nnd "` `“ — ƒG) — Ƒ" i CỐ
18 khi A > 0 Vay f 1a ham nifa trơn trén U và có một đạo ham Newton la F = f"
Đạo hàm Newton là trường hợp tổng quát của đạo hàm Fréchet, có nghĩa là mọi hàm có đạo hàm Fréchet sẽ có đạo hàm Newton Điều này cho thấy đạo hàm Newton mở rộng khái niệm đạo hàm trong phân tích hàm số Hơn nữa, đạo hàm Newton có các tính chất cơ bản tương tự đạo hàm Fréchet, như tính tuyến tính đối với tổng và tích của các hàm khả vi Newton, đồng thời vẫn liên hệ với các đặc trưng của đạo hàm Fréchet.
Định đề 1.4.3 cho thấy U là một tập mở và F: U → X là một hàm có khả vi Fréchet, đồng thời đạo hàm Jacobian J = DF thỏa Lipschitz trên U; khi đó, áp dụng phương pháp Newton cho bài toán F(x) = 0 với khởi tạo x0 ∈ U, các bước x_{k+1} = x_k − J(x_k)^{-1}F(x_k) tồn tại và ||x_k|| bị giới hạn, do đó nghiệm của bài toán được đặc trưng bởi hàm hợp T được cho bởi công thức T(u) = u − J(u)^{-1}F(u).
T(u) = ý(J(u)) khé vi Newton tai u vdi dao ham Newton la
Chứng mình Hàm J c6 dao ham Fréchet lién tuc Lipschitz tai u nén
Vi |[r(h)|] < Eine Thật vậy, ta có lIr@)|l = lÍJ(w + h) = J(u) = J'()8||
Do J la Lipschitz nén ||J"(u + th) — J'(u)]| < Li|(u + t.h) — ul] = ZIh||t Suy ra lo irons f ; k(h) = J'(u)h + r(h)
19 và rút gọn ta có
=llg(J(w) + k(R)) — BIC) = X(I(u) + ACH) I (ut AA
Sllx(7(ứ) + k(ủ))||(|7'(w + h) = J(u) INA + Ur (ADI) llx(7(w) + k(ủ))|\ (ô + 3 Wal?
Cho |[hl| +0 thi () — 0 Lúc này do ý khả vi Newton tại /(u) nên tim WU) + (A) - #(709) — x(J(0) + k(B))k(B)||
Mặt khác ||k(")|| < lI2/(a)|llh|| + llr(®)|| nên
Tức là aa bị chặn khi |[Al] + 0 Hon nita theo giả thiết ta có ||x(u)]) bi chan đều nên ||x(J(u) + &(h))]| bi chan Do d6 tim [Du A) = T(u) = Hu bh _ 0
Bổ đề được chứng minh n
1.5 Phương pháp Newton nửa trơn
Gia sit H : R" + R" la Lipschitz địa phương nhưng không nhất thiết khả vi liên tục Việc giải phương trình
H(x) =0 (16) trở thành một trong những hướng nghiên cứu tích cực nhất trong lập trình toán học
Với giả thiết H là Lipschitz địa phương, # khả vi hầu khắp nơi Dặt
Jacobian cia H tai x được định nghĩa bởi
OpH(z)={ pr eDu lìm H'(x!)}, và conv() là bao lồi của tập ệ
1.5.2 Phương pháp Newton nửa trơn
Phương pháp Newton tổng quát để giải (1.6) có thể được định nghĩa như sau: Cho vectơ zÈ, vectơ zF+! được xác định bởi công thức