Cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận (LV thạc sĩ)Cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận (LV thạc sĩ)Cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận (LV thạc sĩ)Cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận (LV thạc sĩ)Cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận (LV thạc sĩ)Cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận (LV thạc sĩ)Cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận (LV thạc sĩ)Cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận (LV thạc sĩ)Cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận (LV thạc sĩ)Cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận (LV thạc sĩ)Cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận (LV thạc sĩ)Cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận (LV thạc sĩ)Cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận (LV thạc sĩ)Cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận (LV thạc sĩ)Cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận (LV thạc sĩ)
Trang 1ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC KHOA HỌC
Trang 2ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC KHOA HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC
TS NGUYỄN THANH SƠN
Thái Nguyên - 2016
Trang 3Mục lục
Danh mục ký hiệu
1 Kiến thức chung về ma trận 4
1.1 Ma trận 4
1.1.1 Định nghĩa ma trận 4
1.1.2 Ma trận trực giao 5
1.2 Véc tơ riêng, giá trị riêng 6
1.3 Chuẩn của véc tơ và chuẩn của ma trận 7
1.4 Khai triển SVD (singular value decomposition) của ma trận 10
2 Một số cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận hằng 14 2.1 Cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận đường chéo trội 14 2.2 Cận dưới cho giá trị kỳ dị của H - ma trận 19
3 Cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận phụ thuộc tham số 24 3.1 Ma trận affine bức 24
3.2 Cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận bức affine 25
3.3 Ví dụ 27
Kết luận 29 Tài liệu tham khảo 30
Trang 4σi(A), i = 1, 2, · · · , n tập hợp các giá trị kỳ dị của ma trận A
λi(A), i = 1, 2, · · · , n tập hợp các giá trị riêng của A
Trang 5Mở đầu
Giá trị kỳ dị của ma trận không chỉ đóng vai trò quan trọng trong toán học
lý thuyết mà còn đối với toán học ứng dụng Trong toán học tính toán nó là một
phần cấu thành số điều kiện của ma trận Đây là đại lượng quyết định tính ổn
định hay không ổn định của thuật toán Nếu ta tìm được cận dưới cho giá trị kỳ
dị nhỏ nhất của ma trận thì ta đã tìm được một cận trên cho số điều kiện của matrận Đó là đại lượng không thể thiếu trong các đánh giá sai số
Thật vậy, hãy xét hệ phương trình tuyến tính n ẩn số,
Xin lưu ý rằng đây hầu như vẫn là bài toán quan trọng bậc nhất trong toán họctính toán vì để ra được kết quả cuối cùng, gần như mọi bài toán đều quy về hoặcliên quan đến giải hệ phương trình tuyến tính Vế phải và ma trận hệ số của (1)thường thu được do quá trình đo đạc ngoài thực địa hoặc là kết quả của một quátrình tính toán xấp xỉ trước đó Dù bằng cách nào, A và b không thể tránh khỏinhững sai số mà ta lần lượt ký hiệu là ∆A, δ b Như vậy đáng ra, ta có hệ (1) nhưngthực tế, ta lại có hệ
(A + ∆A) ˜x= b + δ b (2)Điều chúng ta quan tâm ở đây là ˜xcách x bao xa hay là độ lớn của sai số Người
ta đã chỉ ra rằng nếu k∆Ak < 1
kA−1k và b 6= 0 thì
kx − ˜xkkxk ≤
cond (A)
1 − kA−1k k∆Ak
k∆AkkAk +
kδ bk
trong đó, cond(A) = kAk A−1 là số điều kiện của ma trận A Bất đẳng thức (3)chỉ ra rằng, sai số tương đối của nghiệm bị chặn trên bởi một đại lượng phụ thuộcvào sai số tương đối của dữ liệu (tất nhiên!) và vào bản thân ma trận hệ số Tacũng sẽ thấy rằng,
cond (A) = kAk A−1 = σ1(A) 1
σn(A),
Trang 6trong đó, σ1(A) và σn(A) lần lượt là giá trị kỳ dị lớn nhất và nhỏ nhất của ma trận
A Nếu ta tìm được cận dưới dương α ≤ σn(A) thì ta có
cond(A) = σ1(A)
σn(A) ≤ σ1(A)
Thay (4) vào (3), ta thu được một cận trên mới cho sai số tương đối
Ngoài ra, tìm cận dưới cho giá trị kỳ dị nhỏ nhất của ma trận phụ thuộc tham
số cũng đóng vai trò quan trọng trong phương pháp giảm cơ sở Xin xem [3] và[5] để biết thêm chi tiết
Chính vì tầm quan trọng của vấn đề, chúng tôi quyết định chọn đó làm đềtài luận văn thạc sĩ Để làm rõ chủ đề này, luận văn của chúng tôi bao gồm nhữngphần sau
Chương 1 Chúng tôi trình bày một số kiến thức chung về ma trận như kháiniệm về ma trận, ma trận đơn vị, ma trận trực giao, véc tơ riêng, giá trị riêng,chuẩn của véc tơ và chuẩn của ma trận, đặc biệt là dạng khai triển giá trị kỳ
dị SVD của ma trận Đó đều là những kiến thức cơ bản, làm cơ sở nghiên cứuchương sau
Chương 2 Chúng tôi trình bày về một số cận dưới cho giá trị kỳ dị nhỏ nhấtcủa ma trận hằng Trước tiên, chúng tôi sẽ trình bày một vài kết quả liên quanđến cận dưới cho chuẩn của ma trận nghịch đảo Sau đó, dựa vào mối quan hệcủa chuẩn của ma trận nghịch đảo và giá trị kỳ dị nhỏ nhất của ma trận ta thuđược cận dưới cho giá trị kỳ dị của hai lớp ma trận đặc biệt: ma trận đường chéotrội và H−ma trận Cuối cùng, chúng tôi đưa hai ví dụ để minh họa cho các cậntìm được
Chương 3 Chúng tôi sẽ trình bày một kết quả về cận dưới cho giá trị kỳ
dị nhỏ nhất của ma trận phụ thuộc tham số cùng với nó là một ví dụ minh họa.Trong các ví dụ ở cả 2 chương, chúng tôi đều sử dụng MATLAB như một phầnmềm để tính toán và minh họa kết quả
Luận văn này được hoàn thành tại trường Đại học Khoa học - Đại học TháiNguyên Trước khi trình bày nội dung chính của luận văn, tôi xin gửi lời cảm ơnchân thành, sâu sắc tới TS Nguyễn Thanh Sơn Thầy là người trực tiếp hướngdẫn, tận tình chỉ bảo, giúp đỡ và động viên tôi trong suốt quá trình nghiên cứu và
Trang 7hoàn thành luận văn.
Tôi cũng xin chân thành cảm ơn ban lãnh đạo phòng Sau Đại học, quý thầy
cô trong khoa Toán - Tin, các bạn học viên lớp cao học Toán 8a đã tạo điều kiệnthuận lợi, giúp đỡ, động viên tôi trong suốt quá trình học tập và nghiên cứu tạitrường
Qua đây, tôi xin bày tỏ lòng biết ơn sâu sắc tới người thân trong gia đình,bạn bè đã luôn động viên khích lệ tôi trong suốt quá trình hoàn thành khóa học
Thái Nguyên, ngày 7 tháng 7 năm 2016
Tác giả
Bùi Thị Tuyến
Trang 8Chương 1
Kiến thức chung về ma trận
Để phục vụ cho Chương 2, ta sẽ nhắc lại một số kiến thức cơ bản giúp choviệc trình bày nội dung của Chương 2 được rõ ràng Trước hết, ta nhắc lại cáckhái niệm về ma trận Chương này được viết chủ yếu dựa vào tài liệu [1, 2, 4]
A= (ai j)m×n.Trong đó, ai j là phần tử của ma trận nằm trên dòng i, cột j, i = 1, 2, · · · , m, j =
1, 2, · · · , n Các phần tử aii gọi là phần tử nằm trên đường chéo chính
Nếu m = n thì A được gọi là một ma trận vuông
Định nghĩa 1.2 Ma trận đơn vị là ma trận vuông có mọi phần tử nằm trên đường
Trang 9Định nghĩa 1.3 Ma trận đường chéo là ma trận vuông có các phần tử nằm ngoài
Định nghĩa 1.4 Ma trận chuyển vị là một ma trận ở đó các hàng được thay thế
bằng các cột và ngược lại Ma trận chuyển vị của ma trận A được kí hiệu là AT
Nếu A là một ma trận có kích thước m × n với các giá trị ai j tại hàng i, cột
j thì ma trận chuyển vị B = AT là ma trận có kích thước n × m với các giá trị
bi j= aji
Định nghĩa 1.5 Ma trận A được gọi là ma trận đối xứng nếu AT = A Ma trận đốixứng A được gọi là xác định dương (nửa xác định dương) nếu xTAx> 0, ∀x 6= 0(xTAx≥ 0)
Tính chất 1.7. • Ma trận trực giao A là khả nghịch và có A−1= AT
Trang 10• Ma trận A trực giao khi và chỉ khi các vec tơ cột và các hàng của A tạo thànhcác hệ trực chuẩn.
• Ta có
|ATA| = |I| = 1 → |A| = ±1
1.2 Véc tơ riêng, giá trị riêng
Định nghĩa 1.8 Cho A là ma trận vuông cấp n,
tơ riêng luôn là thực
Ta nhắc lại ở đây một kết quả quan trọng của đại số tuyến tính Đó chính làĐịnh lý Courant-Fischer Để tiện cho việc hiểu và vận dụng, chúng tôi trích mộtphần của định lý Phát biểu đầy đủ và chứng minh của định lý có thể tìm thấytrong [4]
Định lý 1.9 (Định lý 4.2.6, [4])
Giả sử A là ma trận thực đối xứng cấp n Gọi λn(A) là giá trị riêng nhỏ nhất theo
nghĩa đại số của nó Khi đó,
λn(A) = min
x6=0
xTAx
xTx
Từ định lý này, ta suy ra ngay một hệ quả sau
Hệ quả 1.10 Nếu A là một ma trận đối xứng xác định dương (nửa xác định
dương) thì các giá trị riêng của nó đều dương (không âm)
Trang 111.3 Chuẩn của véc tơ và chuẩn của ma trận
Định nghĩa 1.11 Cho véc tơ x, chuẩn của x kí hiệu là kxk được xác định là một
số không âm thỏa mãn các tính chất sau,
Chuẩn này còn được gọi là chuẩn Taxicab, chuẩn Manhattan hoặc đơn giản
là chuẩn L1 Khoảng cách tương ứng thường được gọi là khoảng cách Manhattan,khoảng cách L1
Trang 12Chuẩn Euclide còn gọi là chuẩn L2.
Chuẩn vô cực
Trong công thức chuẩn - p, cho p → +∞ ta được chuẩn cực đại,
kxk∞= max(|x1| , |x2| , · · · , |xn|)
Bổ đề 1.12 Cho k.kαvà k.kβ là hai chuẩn của Rn Khi đó, với mỗi x ta luôn có
c1kxkα ≤ kxkβ ≤ c2kxkα với c1, c2 là hằng số Chúng ta cũng nói rằng chuẩn
k.kαvà k.kβ là tương đương.
Bổ đề 1.13 (Mối quan hệ giữa các loại chuẩn)
chuẩn như sau,
kxk2≤ kxk1≤√n kxk2,kxk∞≤ kxk2≤√n kxk∞,kxk∞≤ kxk1 ≤ n kxk∞
Ngoài các chuẩn về véc tơ, chúng tôi cũng sẽ cần chuẩn của ma trận để đánhgiá sai số trên các ma trận
Định nghĩa 1.14 Cho ma trận A ∈ Rm×n, chuẩn của A kí hiệu kAk là một sốkhông âm thỏa mãn,
1 kAk ≥ 0 và kAk = 0 khi và chỉ khi A = 0
2 kαAk = |α| kAk với mọi α ∈ R
Trang 13Trường hợp đặc biệt, với p = 1 thì chuẩn toán tử trở thành chuẩn cực đại theo cột,
Bổ đề 1.15. 1 kQAZk = kAk nếu Q và Z là các ma trận trực giao hoặc đồng
x6=0
kAk∞kxk∞ = maxi ∑
j
|ai j| = giá trị lớn nhất trong tổng các giá trị
tuyệt đối của phần tử theo hàng.
x6=0
kAk1kxk1 = A
T
∞= max
j ∑i
pλmax(ATA), trong đó λmax là giá trị riêng lớn nhất.
Trang 146 Nếu A là (n × n) - ma trận, thì n−1/2kAk2 ≤ kAk1 ≤ n1/2kAk2.
7 Nếu A là (n × n) - ma trận, thì n−1/2kAk2 ≤ kAk∞≤ n1/2kAk2
8 Nếu A là (n × n) - ma trận, thì n−1kAk∞≤ kAk1≤ n kAk∞
9 Nếu A là (n × n) - ma trận, thì kAk1 ≤ kAkF ≤ n1/2kAk2
1.4 Khai triển SVD (singular value decomposition) của
ma trận
Định lý 1.16 Cho A là một (m × n) - ma trận tùy ý với m ≥ n Khi đó, ta có
Khi n = 1 (khi m ≥ n), ta viết A = U ΣVT với U = A
kAk2, Σ = kAk2 và V = 1.Bước tiếp theo, chọn v sao cho kvk2 = 1 và kAk2 = kAvk2 > 0 Tức là véc tơ vtạo nên bởi định nghĩa kAk2 = max
kvk2=1kAvk2 Đặt u = Av
kAvk2, là một véc tơ đơn
vị Chọn ˜U và ˜V sao cho U = [u, ˜U] là một (m × m) - ma trận bất kỳ, và V = [v, ˜V]
Khi đó,
uTAv= (Av)
T(Av)kAvk2 =
kAvk22kAvk2 = kAvk2= kAk2 ≡ σ ,
và ˜UTAv = ˜UTu kAvk2 = 0 Ta cũng có uTA ˜V = 0 vì σ = kAk2 = UTAV 2 ≥[1, 0, · · · , 0]UTAV 2 = [σ |uTA ˜V|] 2 > σ
Trang 15Bây giờ, chúng ta có thể áp dụng công thức để thay ˜A bởi ˜A = U1Σ1V1T, trong
đó U1 là (m − 1) × (n − 1) - ma trận, Σ1 là (n − 1) × (n − 1) - ma trận, và V1 là(n − 1) × (n − 1) - ma trận Vì vậy,
σ 0
0 Σ1
(V1 0
0 V1
)T
Đó là điều chúng ta phải chứng minh
Ví dụ 1.17 Tìm khai triển SVD của ma trận,
A=1 1 0
0 0 1
Trước tiên, ta tìm các giá trị riêng của ma trận ATA
√20
001
√20
Trang 16Tiếp theo ta đi tìm ma trận U Ta có,
√20
,
u2 = 11
=01
⇒ U =1 0
0 1
Định lý 1.18 Đặt A = U ΣVT là một SVD của (m × n) - ma trận A, trong đó
m≥ n
Λ = diag(λ1, · · · , λn),U = [u1, · · · , un], và UUT = I Khi đó, một SVD của
A là A = U ΣVT, trong đó σi= |λi| và vi= sign(λi)ui, trong đó sign(0) = 1.
2 Giá trị riêng của ma trận đối xứng ATA là σi2 Véc tơ kỳ dị phải vilà véc tơ riêng tương ứng của A.
vàcond(A) = kAk2 A−1 2 = σ1
σn
2 ATA= V ∑UTU ∑VT = V ∑2VT Đây là một dạng khai triển của ATA, vớicác cột của V là các véc tơ riêng và các khối chéo của ∑2là các giá trị riêng
Trang 173 Đây là trường hợp đúng để chỉ ra 2−chuẩn của một ma trận đường chéo làtổng tuyệt đối lớn nhất trên đường chéo của nó Khi đó, từ 4 của Bổ đề 1.15, kAk2 = UTAV 2 = k∑k2 = σ1 và A−1 2 = VTA−1U 2 = ∑−1 2 =
σn−1
Nhận xét 1.19 Nếu A là ma trận đối xứng, nửa xác định dương thì các giá trị
riêng của A là không âm và theo mục 1 của Định lí 1.18 thì các giá trị riêng chính
là các giá trị kỳ dị của nó
Trang 18Định nghĩa 2.1 Cho A ∈ Rn×n, A được gọi là chéo trội hàng nếu
|aii| >∑
j6=i
|ai j|, 1 ≤ i ≤ n
Ma trận A được gọi là chéo trội cột nếu AT là chéo trội hàng
Mệnh đề 2.2 Giả sử A ∈ Rn×n là chéo trội hàng và đặt
Akhông khả nghịch tồn tại u ∈ Rnsao cho Au = 0 Giả sử uilà thành phần có giá
Trang 19trị tuyệt đối lớn nhất Ta luôn có thể giả sử ui > 0 (vì nếu không, ta thay u bằng
−u) Khi đó, xét hàng i của tích Au, ta có
Điều này mâu thuẫn với giả thiết chéo trội hàng
Tiếp theo ta chứng minh bất đẳng thức (2.1) Theo định nghĩa,
A−1
∞= supx6=0
A−1x
∞kxk∞ = supy6=0
kyk∞kAyk∞,hay
A−1 −1
supy6=0
kyk∞kAyk∞
= infy6=0kAyk∞
Trang 20Kết quả trên được phát biểu cho ma trận chéo cột như sau.
Hệ quả 2.3 Giả sử A là ma trận chéo trội cột và
kAk22 ≤ kAk1kAk∞
ra khẳng định sau là đúng: cho A ∈ Rm×nbất kỳ Khi đó, tồn tại z ∈ Rn, kzk2 = 1sao cho,
ATAz= kAk22z (2.3)Thật vậy, theo định nghĩa chuẩn, tồn tại z ∈ Rn, kzk2= 1 sao cho,
12
Điều kiện (2.5) cho (2.6) được viết gọn lại dưới dạng ma trận,
ATAz= (zTATAz)z (2.7)
Đẳng thức (2.3) được suy ra từ (2.4) và (2.7)
Trang 21Bây giờ, ta chứng minh Mệnh đề 2.4 Từ (2.3),
kAk22kzk1 = kAk22z1
1 = ATAz 1
≤ AT 1kAk1kzk1
= kAk∞kAk1kzk1,hay
kAk22 ≤ kAk∞kAk1
Định lý 2.5 Nếu A là ma trận vuông chéo trội hàng và chéo trội cột, thì
Dễ dàng nhận thấy ma trận A là ma trận chéo trội hàng và chéo trội cột Khi đó,bằng việc sử dụng phần mềm MATLAB ta tính được các giá trị α = 11, β =
18, σ10(A) và lắp vào biểu thức của Định lý 2.5 ta có giá trị kỳ dị nhỏ nhất của
ma trận A là
σ10(A) = 51, 6404 >pα β =
√
11 × 18 ≈ 14, 0712
Trang 22Một câu hỏi tự nhiên được đặt ra là liệu các kết quả phát biểu ở trên có thể
mở rộng ra ma trận khối Phần trình bày dưới đây sẽ đưa ra câu trả lời khẳngđịnh
Định nghĩa 2.7 Cho ma trận A ở dạng khối, A = (Ai j) trong đó các khối Aii đều
là các ma trận vuông và khả nghịch Khi đó, A được gọi là chéo trội khối hàng(block diagonally dominant by rows) nếu
Định lý 2.9 Giả sử A thỏa mãn các giả thiết của Mệnh đề 2.8 và thêm vào đó, A
là ma trận chéo trội khối cột (block diagonally dominant by columns) Đặt
Trang 232.2 Cận dưới cho giá trị kỳ dị của H - ma trận
Trong mục này, chúng tôi sẽ trình bày một số kết quả liên quan đến lớp H
-ma trận Nguyên liệu cho phần trình bày này được tham khảo từ [7] Trước tiên
ta nhắc lại một vài ký hiệu sẽ được dùng đến trong mục này
Định nghĩa 2.10 Cho A ∈ Rn×n, ta định nghĩa ma trận M (A) = (αi j) ∈ Rn×nvới,
αii = |aii|, αi j= −|ai j|, i 6= j, i, j ∈ N
ma trận không suy biến nếu,M (A) là một M - ma trận không suy biến
Các khái niệm trong các Định nghĩa 2.10 và Định nghĩa 2.11 liên hệ vớinhau qua định lý sau đây
Định lý 2.12 Với A ∈ Rn×nlà ma trận bất kỳ thì ba phát biểu sau là tương đương, i) A là một H- ma trận không suy biến.
ii) M (A) là một M- ma trận không suy biến.
iii) UAlà khác rỗng.
Trang 24Bây giờ, ta giả sử A là một H- ma trận không suy biến, theo Định lý 2.12 thìđại lượng
fA(u) = min
i∈N{(M (A)u)i} > 0, ∀u ∈ UA (2.9)
Dễ thấy rằng hàm fA(.) là hàm liên tục đối với biến u trên UA và tính liên tụcnày có thể mở rộng lên bao đóng của UA Tuy nhiên, trên biên ∂UA thì fA đồngnhất không Do đó, giá trị lớn nhất của fA(.) đạt được tại một phần tử u nào đócủa UA và do vậy
0 < max{ fA(u) : u ∈ UA} = fA( ˆu), ˆu∈ UA
Giá trị đó được tìm thấy trong bổ đề sau đây
Bổ đề 2.13 Cho A ∈ Rn×nlà một H− ma trận không suy biến Khi đó
Gọi D là ma trận chéo có các phần tử chéo là u1, u2, · · · , un Từ (2.11) ma trận AD
là ma trận chéo trội Áp dụng Mệnh đề 2.2 ta suy ra
(AD)−1
∞≤ 1αAD,trong đó, αAD là đại lượng được định nghĩa như ở Mệnh đề 2.2 nhưng áp dụngcho ma trận AD Không khó để nhận ra đó chính là fA(u) Tức là
Vì thế
(AD)−1
∞= D−1A−1
∞= maxi∈N{∑
j∈N
ci j
ui }
Trang 25
ci j }
maxj∈N{uj} =
A−1
∞maxj∈N{uj} = A
và điều này suy ra khẳng định của Bổ đề 2.13
Nhận xét 2.14 Giả sử A là ma trận chéo trội, ta suy ra nó là một H - ma trận
không suy biến Chọn u = [1, 1, · · · , 1] ∈ UA Khi đó, Mệnh đề 2.2 được suy ra từ
Bổ đề 2.13
Để thu được kết quả tốt hơn, ta quan sát thấy rằng Bổ đề 2.13 vẫn đúng nếuthay ma trận A bởi một ma trận bất kỳ B = (bi j) sao cho |bi j| = |ai j|, ∀i, j Đểtrình bày ta ký hiệu,
ΩA = {B = (bi j) : ...
ci j}
maxj∈N{uj} =
A−1
∞maxj∈N{uj} = A...
Bổ đề 2.13
Để thu kết tốt hơn, ta quan sát thấy Bổ đề 2.13 nếuthay ma trận A ma trận B = (bi j) cho |bi j| = |ai j|, ∀i, j Đểtrình bày ta ký hiệu,
ΩA... A
và điều suy khẳng định Bổ đề 2.13
Nhận xét 2.14 Giả sử A ma trận chéo trội, ta suy H - ma trận< /b>
không suy biến Chọn u = [1, 1, · · · , 1] ∈ UA Khi đó,