Có thể định nghĩa giá trị ma trận của một hàm số bất kì như sau:Với A ∈ MnC là một ma trận vuông phức cấp n tự liên hợp vớigiá trị riêng thuộc khoảng a; b ⊆ R và f : a; b −→ R là một hàm
Trang 3Luận văn được hoàn thành nhờ sự hướng dẫn và giúp đỡ tận tình củaPGS TS Lê Công Trình, Trường Đại học Quy Nhơn Do đó, tôi xin bày
tỏ sự kính trọng và lòng biết ơn sâu sắc đến thầy Đồng thời, tôi cũng xinchân thành gửi lời cảm ơn sâu sắc đến quý Ban lãnh đạo Trường Đại họcQuy Nhơn, Phòng Đào tạo sau đại học, Khoa Toán và Thống kê, Khoa Sưphạm cùng quý thầy cô giáo giảng dạy các lớp Cao học Toán khoá 23, giađình và bạn bè đã tạo mọi điều kiện thuận lợi giúp tôi hoàn thành luậnvăn này
Bình Định, ngày 28 tháng 8 năm 2022
Học viên
Nguyễn Thị Đạo
1
Trang 4MỞ ĐẦU 1
1.1 Khai triển Taylor và khai triển Maclaurin của hàm số 3
1.2 Một số kiến thức cơ bản về ma trận 5
1.2.1 Dạng chuẩn tắc Jordan 5
1.2.2 Ma trận chéo hoá được 7
1.2.3 Phổ và giá trị riêng 8
1.2.4 Vết và định thức 9
1.2.5 Ma trận dương 9
1.2.6 Một số bất đẳng thức ma trận cơ bản 10
1.2.7 Chuẩn ma trận 11
2 MỘT SỐ HÀM MA TRẬN 12 2.1 Hàm mũ ma trận 12
2.2 Một số hàm ma trận khác 23
3 ĐẠO HÀM MA TRẬN 28 3.1 Đạo hàm của hàm mũ và hàm logarit 28
3.2 Đạo hàm của hàm vết 30
3.3 Đạo hàm Fréchet 36
TÀI LIỆU THAM KHẢO
2
Trang 5Có thể định nghĩa giá trị ma trận của một hàm số bất kì như sau:
Với A ∈ Mn(C) là một ma trận vuông phức cấp n tự liên hợp vớigiá trị riêng thuộc khoảng (a; b) ⊆ R và f : (a; b) −→ R là một hàm
số, ma trận f (A) được định nghĩa thông qua sự phân tích phổ và phépchéo hoá của A, tức là, nếu A = Pk
i=1αiPi là sự phân tích phổ của A và
A = U Diag(α1, , αk)U∗ là phép chéo hoá của A, thì
Phép tính đạo hàm ma trận được sử dụng trong thống kê, đặc biệt là
để phân tích thống kê phân phối nhiều biến, phân phối chuẩn nhiều biến
và các phân phối eliptic khác ([2], [5], [4]) Phép tính đạo hàm ma trậncòn có nhiều ứng dụng trong giải tích nhiều biến ([1], 2012)
Do đó, chúng tôi đã chọn đề tài "Một số vấn đề về hàm ma trận
và đạo hàm ma trận" để nghiên cứu và trình bày trong luận văn này
Trang 6Mục tiêu của luận văn là nhằm tìm hiểu một số hàm ma trận và đạo hàmcủa một số hàm ma trận đó, đặc biệt là đạo hàm Fréchet.
Luận văn bao gồm: Mở đầu, Nội dung, Kết luận và Tài liệu tham khảo.Nội dung của luận văn gồm ba chương, cụ thể
Chương 1 Kiến thức chuẩn bị
Trong chương này chúng tôi trình bày một số kiến thức cơ bản trongGiải tích cổ điển và một số kiến thức cơ bản về ma trận liên quan đến cácchương sau của luận văn
Mặc dù bản thân đã cố gắng nhưng do năng lực bản thân và thời giannghiên cứu còn hạn chế nên luận văn không thể tránh khỏi những thiếusót Rất mong nhận được sự góp ý của quý Thầy, cô và các bạn để luậnvăn được hoàn thiện hơn Xin chân thành cảm ơn
Trang 7Chương 1
KIẾN THỨC CHUẨN BỊ
Trong chương này chúng tôi trình bày một số kiến thức cơ bản trong Giảitích cổ điển và một số kiến thức cơ bản về ma trận liên quan đến cácchương sau của luận văn Các kết quả liên quan đến khai triển Taylor củahàm số có thể tìm được trong các giáo trình Giải tích cổ điển Các kháiniệm và kết quả cơ bản về ma trận trong chương này có thể tham khảotrong chương 1 của tài liệu [3]
1.1 Khai triển Taylor và khai triển Maclaurin của
k,
trong đó P(k)(x0) kí hiệu cho đạo hàm của P tại x = x0 Công thức nàyđược gọi là công thức Taylor với tâm x0 của đa thức P (x)
Đối với các hàm khả vi cấp n tại x0 ∈ R, ta có
Định nghĩa 1.1.2 Cho f : I −→ R là một hàm khả vi cấp n tại x0 ∈ I
k
Trang 8được gọi là đa thức Taylor với tâm x0 của hàm f khả vi cấp n tại x0.Đặt Rn(f ; x) = f (x) − Tn(f ; x) Khi đó công thức
f (x) = Tn(f ; x) + Rn(f ; x)
được gọi là công thức Taylor với tâm x0 của hàm f Trong trường hợp
x0 = 0 công thức này được gọi là công thức Maclaurin Đại lượng Rn(f ; x)
được gọi là phần dư của công thức Taylor
Định lý 1.1.3 (Taylor) Giả sử hàm số f khả vi liên tục đến cấp n − 1
trong δ− lân cận Vδ(x0) của x0 và có đạo hàm hữu hạn cấp n tại x0 Khi
đó f có thể biểu diễn dưới dạng
k
+ o((x − x0)n)
khi x −→ x0 Công thức trên được gọi là công thức Taylor (dạng địaphương) với phần dư P eano
Định lý 1.1.4 (Taylor) Giả sử hàm số f khả vi liên tục đến cấp n trong
(a; b) và có đạo hàm cấp n + 1 tại mọi x ∈ (a; b) có thể trừ ra điểm
x0 ∈ (a; b) Khi đó giữa x0 và x ∈ (a; b) bất kì tồn tại c sao cho
Công thức (1.1) được gọi là công thức Taylor của hàm f với phần dư Rn+1
dưới dạng Schomilch - Roche
Sau đây là công thức Maclaurin của một số hàm số sơ cấp
(1) Hàm sốf (x) = ex có đạo hàm mọi cấp trên R vàf(n)(x) = ex, ∀n nên
1(n + 1)!e
θxxn+1, θ ∈ (0; 1)
Trang 9(2) Hàm số f (x) = sin x có đạo hàm mọi cấp trên R và f(n)(x) =sin
sinhθx + (2n + 1)π
2
i
x2n+1(2n + 1)!
Trang 10Nếu a ̸= 0 thì det Jk(a) ̸= 0 và do đó Jk(a) khả nghịch Ta có thể tìmnghịch đảo của phương trình dạng
Trang 11Định lý 1.2.2 (Dạng chuẩn tắc Jordan) Với mọi ma trận X ∈ Mn, tồntại một ma trận khả nghịch S ∈Mn sao cho
1.2.2 Ma trận chéo hoá được
Một ma trậnA ∈ Mn là chéo hoá được nếu tồn tại một ma trận khả nghịch
S ∈Mn sao cho
A = S Diag(λ1, λ2, , λn)S−1,
với λ1, λ2, , λn ∈ C là các giá trị riêng của A Trong trường hợp này
f (A) = S Diag(f (λ1), f (λ2), , f (λn))S−1, (1.2)trong đó f là hàm biến phức xác định trên tập hợp chứa các giá trị riêngcủa A
Nếu các số λ1, λ2, , λn khác nhau thì ta có đa thức p(x) bậcn − 1 saocho p(λi) = f (λi) :
Trang 121.2.3 Phổ và giá trị riêng
Cho A ∈ Mn và λ ∈ C, ta nói λ là một giá trị riêng của A nếu tồn tại
v ∈ Cn\ {0} sao cho Av = λv Vectơv được gọi là vectơ riêng củaA tươngứng với giá trị riêng λ Kí hiệu σ(A) là tập tất cả các giá trị riêng của A
Do đó,
σ(A) = λ ∈ C\ det(A − λI) = 0
Cho A ∈ Mn là một ma trận Hermit Khi đó với σ(A) = {λ1, , λn}
tồn tại các giá trị riêng v1, , vn tạo thành một cơ sở trực chuẩn của Cnvới Avi = λivi, ∀i Khi đó ta có phân tích
ma trận Hermit A có các giá trị riêng µ1 > µ2 > > µk, khi đó
trong đó tổng được lấy trên tất cả các chỉ số i sao cho λi = µj
Phân tích này luôn là duy nhất
Cho f : (a, b) ⊆ R → R là một hàm số, A ∈ Mn là một ma trận có giátrị riêng thuộc (a, b) Nếu A có phân tích phổ A = Pk
j=1µjPj với µi làcác giá trị riêng khác nhau của A thì ma trận f (A) được định nghĩa bởi
Trang 13Ma trận A ∈ Mn được gọi là Hermit (hay tự liên hợp) nếu A = A∗.
Ma trận U ∈ Mn được gọi là unita nếu U∗U = U U∗ = I
Tập tất cả các ma trận Hermit cấp n dược kí hiệu bởi Msan
Định nghĩa 1.2.6 Ma trậnA ∈ Mn được gọi là dương (hay nửa xác địnhdương) nếu x∗Ax ≥ 0, ∀x ∈ Cn, kí hiệu A ≥ 0
Chú ý rằng A ≥ 0 thì A là Hermit Hơn nữa, nếu A1 ≥ 0, A2 ≥ 0 thì
A1 + A2 ≥ 0
Định lý 1.2.7 ChoA ∈ Mn Khi đó các điều kiện sau đây là tương đương
1 A là ma trận dương
2 A = A∗ và phổ của A nằm trong R+ = [0, ∞)
3 A được viết dưới dạng A = B∗B với toán tử B ∈ Mn
Chú ý rằng A ∈ Mn là dương nếu và chỉ nếu U AU∗ dương vớiU là một
ma trận unita
Trang 14Định lý 1.2.8 Cho A là một ma trận dương Khi đó tồn tại duy nhấtmột ma trận dương B sao cho B2 = A.
Ma trận dương khả nghịch được gọi là ma trận xác định dương Nếu A
Cij = AijBij (1 ≤ i, j ≤ n)
xác định một ma trận dương
Ma trậnC gồm các hệ tửCij của định lý trên được gọi là tích Hadamard(hoặc tích Schur) của ma trận A và B, kí hiệu C = A ◦ B
Trang 151.2.7 Chuẩn ma trận
Định nghĩa 1.2.14 Không gian Mn các ma trận trở thành không gianHilbert với tích vô hướng
⟨A, B⟩ = T rA∗B
Tích vô hướng này được gọi là tích vô hướng Hilbert -Schmidt
Định nghĩa 1.2.15 Chuẩn Hilbert -Schmidt của ma trậnA = (Aij)n×n ∈
Mn được định nghĩa như sau
Định nghĩa 1.2.16 Chuẩn toán tử của một ma trận A ∈Mn được xácđịnh bởi
∥A∥:= supn∥Ax∥: x ∈ Cn, ∥x∥= 1o
Nếu∥A∥≤ 1thì ma trậnAđược gọi là một ma trận co rút (contraction)
Ví dụ 1.2.17 Giả sử A ∈ Mn và ∥A∥< 1 Khi đó I − A là khả nghịch và
Trang 16Chương 2
MỘT SỐ HÀM MA TRẬN
Trong chương này chúng tôi trình bày một số vấn đề liên quan đến giá trị
ma trận của các hàm số: hàm mũ,hàm luỹ thừa, hàm logarit, Các kháiniệm và kết quả trong chương này được trình bày từ cuốn sách Hiai vàPetz [3]
2.1 Hàm mũ ma trận
Định nghĩa 2.1.1 Cho A ∈ Mn(C) là một ma trận vuông phức cấp n.Hàm mũ của A, được kí hiệu là eA hoặc exp(A), là một ma trận vuôngcấp n được định nghĩa bởi chuỗi luỹ thừa sau:
Trang 17P
n=1
an−1(n − 1)!J +
12
∞
P
n=2
an−2(n − 2)!J
2 + 16
∞
P
n=3
an−3(n − 3)!J
Trang 19eA = lim
n→∞
I + An
n
□Tổng quát hơn ta có kết quả sau
An
Trang 20An
k
giao hoán Do đó
eA − Tm,n(A) = Bn − Tn = (B − T )(Bn−1 + Bn−2T + + Tn−1)
Ta có đánh giá
∥eA− Tm,n(A)∥ ≤ ∥B − T ∥n × max{∥B∥i∥T ∥n−i−1 : 0 ≤ i ≤ n − 1}
Vì ∥T ∥ ≤ e∥A∥n và ∥B∥ ≤ e∥A∥n nên
∥eA − Tm,n(A)∥ ≤ n∥eAn − T ∥en−1n ∥A∥
Bằng cách chặn phần dư của chuỗi Taylor,
hội tụ đến 0 trong cả hai trường hợp m → ∞ và n → ∞
Định lý 2.1.6 Cho A, B ∈ Mn(C) Khi đó AB = BA khi và chỉ khi
k = eA+B
Trang 21Ngoài ra, ta có thể chứng minh mệnh đề trên bằng phép lấy vi phân.Thật vậy, theo khai triển (2.1),ta có d
Thay C bởi A + B vào phương trình trên ta được eAeB = eA+B
Đạo hàm cấp 1 hai vế của phương trình et(A+B) = etAetB ta được
2 − λ 3
= 0
Trang 22Ma trận A có hai giá trị riêng là λ1 = 5 và λ2 = −1.
Với λ1 = 5, xét hệ phương trình
(
−3v11+ 3v21 = 03v11− 3v21 = 0 =⇒ v11 − v21 = 0
Chọn vectơ riêng tương ứng với giá trị riêng λ1 = 5 là v1 = [1 1]T
Với λ2 = −1, xét hệ phương trình
(
3v12 + 3v22 = 03v12 + 3v22 = 0 =⇒ v12 + v22 = 0.
Chọn vectơ riêng tương ứng với giá trị riêng λ2 = −1 là v2 = [−1 1]T
#
= 12
#
= 12
"
11e5t− e−t11e5t+ e−t
#
□Định lý 2.1.8 Cho A ∈ Mn với đa thức đặc trưng
Trang 23Chứng minh Ta kiểm tra được hàm giá trị ma trận
F1(t) = x0(t)I + x1(t)A + + xn−1(t)An−1
và F2(t) = etA thoả mãn các điều kiện
trong biểu diễn với các ma trận Pauli Dễ dàng kiểm tra A2 = I Do đó
A2n = I, nhưng A2n+1 = A Chọn c ∈R và kết hợp kiến thức về mối liên
hệ giữa hàm mũ, sin và cos ta được
eicA = P∞
n=0
incnAnn! = P∞
n=0
(−1)nc2nA2n(2n)! + iP∞
n=0
(−1)nc2n+1A2n+1(2n+1)!
= (cos c)I + i(sin c)A
Xét ma trận tổng quát C = c0I + cA ta được
eiC = eic0(cos c)I + ieic0(sin c)A
□Định lý 2.1.10 (Công thức Lie-Trotter) Cho A, B ∈ Mn(C) Khi đó
Trang 24Suy ra
∥Xn− Yn∥≤ ntn−1∥X − Y ∥
với t là hằng số sao cho ∥X∥, ∥Y ∥≤ t
Bây giờ ta chọn Xn := eA+Bn và Yn := eAneBn Từ đánh giá trên ta có
∥Xnn− Ynn∥≤ nu∥Xn − Yn∥, (2.3)nếu ta có thể tìm một hằng số u sao cho ∥Xn∥n−1, ∥Yn∥n−1≤ u Vì
ta có thể chọn u = e∥A∥+∥B∥ để có đánh giá (2.3) Định lý trên được suy
ra từ (2.3) nên ta có thể chứng minh n∥Xn− Yn∥−→ 0 Khai triển chuỗiluỹ thừa của hàm mũ suy ra
Xn = I + A + B
12
A + Bn
An
Bn
với một hằng số dương c Từ đó ta có điều phải chứng minh
Nếu Avà B là các ma trận tự liên hợp, giới hạn trên tiến tới eA+B càngnhanh vì là giới hạn của các ma trận tự liên hợp
Trang 25Chú ý rằng, công thức Lie - Trotter có thể mở rộng cho nhiều ma trận:
eA1 +A2+ +Ak −eA1n eA2n eAkn
n
≤ 2n
dt2
Z tk−10
Trang 26Một công thức quan trọng khác đối với hàm mũ là công thức Campbell-Hausdorff :
trong đó [A, B] := AB − BA
Định nghĩa 2.1.14 Một hàm f : R+ = [0, ∞) −→ R được gọi là đơn
điệu hoàn toàn (completely monotone) nếu đạo hàm cấp n của f có dấu
(−1)n trên R+, với mọi n ∈ N
Định lý 2.1.15 Cho A, B ∈ Msan và t ∈ R Khi đó các phát biểu sau làtương đương:
(i) Đa thức t 7→ T r (A + tB)p chỉ có hệ số dương với mọi A, B ≥ 0 và
ta có thể suy ra dấu của đạo hàm
(iii) =⇒ (i): Ta chỉ cần giả thiết trong (iii) với p ∈ N Với A khả nghịch,
ta thấy đạo hàm cấp r của T r(A0 + tB0)−p tại t = 0 tương ứng với hệ sốcủatr trongT r(A + tB)p như trong công thức (3.7), trong đóA, A0, B, B0
có mối liên hệ như trong Bổ đề 3.2.9 Vế trái của công thức (3.7 ) có dấu
(−1)r bởi vì nó là đạo hàm của một hàm đơn điệu hoàn toàn Do đó vếphải có dấu như trong phát biểu (i) Trường hợp Akhông khả nghịch đượcsuy ra bằng cách lập luận tương tự
Trang 27Nhắc lại, phép biến đổi Laplace của độ đo µ trên R+ là
Trước tiên với một đa thức một biến p(x), ta định nghĩa đa thức ma trân
p(X) với X ∈Mn Xét phân tích Jordan chuẩn tắc của X như sau
Trang 28Từ đó chúng ta suy ra rằng nếu ta biết dạng chuẩn tắc Jordan của X, ta
có thể tính f (X), với f là một đa thức hoặc là một hàm trơn
Trang 29=
"
(R + 1)(R + z) (1 − R)(R − z)w(1 + R) −w(1 − R)
Ma trận X/2 là một ma trận mật độ và có ứng dụng trong lí thuyết lượng
Trang 30Định lý 2.2.3 Nếu fk và gk là các hàm số (α, β) −→ R sao cho với
Thay f bởi hàm số −η(t) = t log t ta có
T rA log A ≥ T rB log B + T r(A − B) + T r(A − B) log B
Trang 31hoặc tương đương
T r(log A − log B) − T r(A − B) ≥ 0
Vế trái là lượng tử entopy tương đối S(A∥B) của các ma trận xác địnhdương A, B
Nếu T rA = T rB thì S(A∥B) được gọi là entropy tương đối Umegaki :
S(A∥B) = T r(log A − log B) Điều này cho ta một đánh giá tốt hơn Nếu
T rA = T rB = 1 thì tất cả các giá trị riêng nằm trong đoạn [0; 1] Tức là,với ξ ∈ (x, y)
−η(x) + η(y) + (x − y)η′(y) = −1
Bất đẳng thức Streater (2.4) có hệ quả là A = B nếu entropy tương đối là
0 Tốt hơn, bất đẳng thức mạnh được gọi là bất đẳng thức Pinsker : Nếu
Trang 32Chương 3
ĐẠO HÀM MA TRẬN
Trong chương này chúng tôi trình bày một số vấn đề liên quan đến đạohàm ma trận của một số hàm thường gặp như: hàm mũ, hàm logarit, Bêncạnh đó, chúng tôi trình bày đạo hàm của hàm vết và đạo hàm Fréchet.Các kết quả trong chương này được chúng tôi tổng hợp và trình bày lại từcuốn sách của Hiai và Petz [3]
3.1 Đạo hàm của hàm mũ và hàm logarit
Mệnh đề 3.1.2 ChoA ∈ Mn là ma trận khả nghịch dương Khi đóA+tT
cũng khả nghịch dương với T ∈Msan và số thực nhỏ t Khi đó
Trang 33dt2 log(A + tT ) = −2
0
(xI + A)−1T (xI + A)−1T (xI + A)−1dx
Hơn nữa, ta có khai triển Taylor
Nói cách khác, đạo hàm của hàm (A + tT )−1 tại t = 0 được tính bằng
−AT−1A−1 Với t ̸= 0 nhỏ, nếu A + tT khả nghịch thì
d
dt(A + tT )
−1 = −(A + tT )−1T (A + tT )−1
Trang 34Cho f : (α, β) −→ R là hàm khả vi liên tục và giả sử rằng các giá trị riêng
của A + tB thuộc (α, β) với t − t0 nhỏ Khi đó
d
dtT rf (A + tB)
t=t0 = T r(Bf′(A + t0B)) (3.2)Chứng minh Nếuf là một đa thức, dễ dàng kiểm tra trực tiếp rằngT r(A+tB)n là một đa thức theo biến t Ta quan tâm đến hệ số của t được tínhbằng
T r(An−1B + An−2BA + + ABAn−2+ BAn−1) = nT rAn−1B
Do đó định lý đúng cho trường hợp f là một đa thức Do mỗi hàm khả viliên tục có thể xấp xỉ bằng một dãy đa thức nên ta có kết quả của địnhlý
Trang 35Ví dụ 3.2.2 Cho f : (α, β) −→ R là một hàm tăng liên tục và phổ của
các ma trận tự liên hợp A và C nằm trong (α, β) Ta sử dụng Định lý3.2.1 để chứng minh
A ≤ C =⇒ T rf (A) ≤ T rf (C) (3.3)Giả sử f là hàm trơn Vì A ≤ C nên B ≥ 0 với B = C − A Đạo hàmcủa T rf (A + tB) là T r(Bf′(A + tB)) và T r(Bf′(A + tB)) là dương (vìđây là vết của tích hai toán tử dương)
Ngoài ra, ta có thể chứng minh công thức (3.3) bằng cách sử dụng Định
lý 1.2.11: Cho các giá trị riêng củaA, C sao choλk(A) ≤ λk(C)(1 ≤ k ≤ n)
và do đó T rf (A) = P
kf (λk(A)) ≤ P
kf (λk(C)) = T rf (C) □Định lý 3.2.3 Chof : (α, β) −→ R là một hàm thuộc lớpC1 vàA =Diag
(t1, t2, , tn) với α < ti < β(1 ≤ i ≤ n) Nếu B = B∗ thì đạo hàm củahàm t 7→ f (A + tB) là một tích Schur:
d
dtf (A + tB)
X := d
dtf (A + tB)