Có thể định nghĩa giá trị ma trận của một hàm số bất kì như sau:Với A ∈ MnC là một ma trận vuông phức cấp n tự liên hợp vớigiá trị riêng thuộc khoảng a; b ⊆ R và f : a; b −→ R là một hàm
Khai triển Taylor và khai triển Maclaurin của hàm số
hàm số Định lý 1.1.1 Cho P(x) là đa thức đại số bậc n với hệ số thực
Khi đó với mọi x 0 ∈ R đa thức P(x) có thể biểu diễn duy nhất dưới dạng
P (k) (x 0 ) k! (x−x 0 ) k , trong đó P (k) (x 0 ) kí hiệu cho đạo hàm của P tại x = x 0 Công thức này được gọi là công thức Taylor với tâm x 0 của đa thức P(x). Đối với các hàm khả vi cấp n tại x 0 ∈ R, ta có Định nghĩa 1.1.2 Cho f :I −→ R là một hàm khả vi cấp n tại x 0 ∈ I. Đa thức
X k=0 f (k) (x 0 ) k! (x−x 0 ) k được gọi là đa thức Taylor với tâm x 0 của hàm f khả vi cấp n tại x 0 Đặt R n (f;x) =f(x)−T n (f;x) Khi đó công thức f(x) = T n (f;x) +R n (f;x) được gọi là công thức Taylor với tâm x0 của hàm f Trong trường hợp x0 = 0 công thức này được gọi làcông thức Maclaurin Đại lượng Rn(f;x) được gọi là phần dư của công thức Taylor. Định lý 1.1.3 (Taylor) Giả sử hàm số f khả vi liên tục đến cấp n−1 trong δ− lân cận V δ (x 0 ) của x 0 và có đạo hàm hữu hạn cấp n tại x 0 Khi đó f có thể biểu diễn dưới dạng f(x) n
X k=0 f (k) (x 0 ) k! (x−x0) k +o((x−x0) n ) khi x −→ x 0 Công thức trên được gọi là công thức Taylor (dạng địa phương) với phần dư P eano. Định lý 1.1.4 (Taylor) Giả sử hàm số f khả vi liên tục đến cấp n trong (a;b) và có đạo hàm cấp n + 1 tại mọi x ∈ (a;b) có thể trừ ra điểm x 0 ∈ (a;b) Khi đó giữa x 0 và x ∈ (a;b) bất kì tồn tại c sao cho f(x) n
Công thức (1.1) được gọi là công thức Taylor của hàm f với phần dư R n+1 dưới dạng Schomilch - Roche.
Sau đây là công thức Maclaurin của một số hàm số sơ cấp.
(1) Hàm sốf(x) = e x có đạo hàm mọi cấp trên R vàf (n) (x) =e x ,∀nnên ta có e x = 1 +x+ x 2
(2) Hàm số f(x) = sinx có đạo hàm mọi cấp trên R và f (n) (x) sin x+ nπ
(3) Hàm số f(x) = cosx có đạo hàm mọi cấp trên R nên ta có cosx= 1−x 2
(4) Hàm số f(x) = ln(1 +x) có đạo hàm mọi cấp tại mọi x > −1 và ta có ln(1 +x) = x− x 2
Một số kiến thức cơ bản về ma trận
Dạng chuẩn tắc Jordan
Một khối Jordan là một ma trận có dạng
, trong đó a ∈ C Đây là ma trận tam giác trên J k (a) ∈ M k Chúng ta thường sử dụng kí hiệu J k := J k (0) Khi đó
Jk(a) = aIk +Jk trong đó I k và J k giao hoán.
Ví dụ 1.2.1 Ma trận Jk xác định bởi
Nhận thấy nếu luỹ thừa của J k càng tăng, dòng chứa 1 sẽ dịch chuyển lên càng cao Cụ thể J k k = 0 Các ma trận J k m (0 ≤ m ≤ k − 1) là độc lập tuyến tính.
Nếu a ̸= 0 thì detJk(a) ̸= 0 và do đó Jk(a) khả nghịch Ta có thể tìm nghịch đảo của phương trình dạng
Phương trình trên có thể viết lại như sau ac 0 I k + k−1
Ta tìm được c j = −(−a) −j−1 (0≤ j ≤ k−1). Đặc biệt, với k = 3, ta có
□ Định lý 1.2.2 (Dạng chuẩn tắc Jordan) Với mọi ma trận X ∈ M n , tồn tại một ma trận khả nghịch S ∈ M n sao cho
S −1 = SJ S −1 , trong đó k 1 +k 2 + +k m = n Ma trận Jordan J được xác định duy nhất. Định lý 1.2.3 (Cayley - Hamilton) Nếu p là đa thức đặc trưng của
Ma trận chéo hoá được
Một ma trậnA ∈ M n làchéo hoá được nếu tồn tại một ma trận khả nghịch
A = S Diag(λ1, λ2, , λn)S −1 , với λ 1 , λ 2 , , λ n ∈ C là các giá trị riêng của A Trong trường hợp này f(A) = S Diag(f(λ 1 ), f(λ 2 ), , f(λ n ))S −1 , (1.2) trong đó f là hàm biến phức xác định trên tập hợp chứa các giá trị riêng của A.
Nếu các số λ1, λ2, , λn khác nhau thì ta có đa thức p(x) bậcn−1sao cho p(λi) =f(λi) : p(x) n
Công thức trên được gọi là công thức nội suy Lagrange Do đó ta có f(A) =p(A) n
A−λ i I λ j −λ i f(λj),trong đó I kí hiệu cho ma trận đơn vị cấp n trong Mn.
Phổ và giá trị riêng
Cho A ∈ M n và λ ∈ C, ta nói λ là một giá trị riêng của A nếu tồn tại v ∈ C n \ {0} sao cho Av = λv Vectơv được gọi làvectơ riêng củaA tương ứng với giá trị riêng λ Kí hiệu σ(A) là tập tất cả các giá trị riêng của A.
Cho A ∈ M n là một ma trận Hermit Khi đó với σ(A) = {λ 1 , , λ n } tồn tại các giá trị riêng v 1 , , v n tạo thành một cơ sở trực chuẩn của C n với Avi = λivi,∀i Khi đó ta có phân tích
Phân tích này được gọi là phân tích phân tích Schmidt của A Phân tích Schmidt được gọi là duy nhất nếu tất cả các giá trị riêng là phân biệt. Một phân tích khác cũng thường được dùng là phân tích phổ Giả sử ma trận Hermit A cú cỏc giỏ trị riờng à 1 > à 2 > > à k , khi đú
X j=1 à j P j , (1.4) trong đó P j là phép chiếu trực giao lên không gian riêng tương ứng với các giỏ trị riờng à j
P j = X i v i v i ∗ , trong đú tổng được lấy trờn tất cả cỏc chỉ số i sao cho λi = àj.
Phân tích này luôn là duy nhất.
Cho f : (a, b) ⊆R → R là một hàm số, A ∈ M n là một ma trận có giá trị riờng thuộc (a, b) Nếu A cú phõn tớch phổ A = P k j=1 à j P j với à i là các giá trị riêng khác nhau của A thì ma trận f(A) được định nghĩa bởi f(A) k
Vết và định thức
Với mỗi ma trận A = (Aij) n×n ∈ M n , vết của A được định nghĩa là tổng các phần tử trên đường chéo chính của A, tức là
T rA = A 11 +A 22 + +A nn Giả sử σ(A) ={λ 1 , λ 2 , , λ n } Khi đó
Y i=1 λ i Định lý 1.2.4 Định thức của ma trận dương A ∈ M n không vượt quá tích các phần tử trên đường chéo chính detA ≤ n
Ma trận dương
Định nghĩa 1.2.5 Với mỗi A = (A ij ) n×n ∈ M n , kí hiệu A T là ma trận chuyển vị của A, kí hiệu A ∗ là ma trận chuyển vị liên hợp của A, tức là liên hợp của A T
Ma trận A ∈ M n được gọi là Hermit (hay tự liên hợp) nếu A = A ∗
Ma trận U ∈ M n được gọi là unita nếu U ∗ U = U U ∗ = I.
Tập tất cả các ma trận Hermit cấp n dược kí hiệu bởi M sa n Định nghĩa 1.2.6 Ma trận A ∈ M n được gọi làdương (hay nửa xác định dương) nếu x ∗ Ax ≥ 0,∀x ∈ C n , kí hiệu A ≥ 0.
Chú ý rằng A ≥ 0 thì A là Hermit Hơn nữa, nếu A 1 ≥ 0, A 2 ≥ 0 thì
A1 +A2 ≥0. Định lý 1.2.7 ChoA ∈ M n Khi đó các điều kiện sau đây là tương đương.
2 A= A ∗ và phổ của A nằm trong R + = [0,∞).
3 A được viết dưới dạng A = B ∗ B với toán tử B ∈ M n
Chú ý rằng A ∈ M n là dương nếu và chỉ nếu U AU ∗ dương vớiU là một ma trận unita. Định lý 1.2.8 Cho A là một ma trận dương Khi đó tồn tại duy nhất một ma trận dương B sao cho B 2 = A.
Ma trận dương khả nghịch được gọi là ma trận xác định dương Nếu A là một ma trận xác định dương, kí hiệu A > 0. Định nghĩa 1.2.9 Cho các số λ 1 , λ 2 , , λ n > 0 Ma trận A được gọi là ma trận Cauchy nếu
A(t) ij := e −tλ i e −tλ j là dương với mọi t∈ R Do đó
Một số bất đẳng thức ma trận cơ bản
Định lý 1.2.10 Giả sử 0 < A, B ∈ M n là các ma trận khả nghịch và
A ≤B Khi đó B −1 ≤ A −1 Định lý 1.2.11 Nếu A ≤ B thì λ k (A) ≤ λ k (B) với mọi k.
Bổ đề 1.2.12 Giả sử A, B ∈ M n là các ma trận Hermit.
2 Nếu 0 ≤ A≤ B thì detA≤ detB. Định lý 1.2.13 Cho A = (A ij ) n×n và B = (B ij ) n×n là các ma trận vuông dương cấp n Khi đó
Cij = AijBij (1 ≤i, j ≤ n) xác định một ma trận dương.
Ma trậnC gồm các hệ tửC ij của định lý trên được gọi làtích Hadamard(hoặc tích Schur) của ma trận A và B, kí hiệu C = A◦B.
Chuẩn ma trận
Định nghĩa 1.2.14 Không gian M n các ma trận trở thành không gian Hilbert với tích vô hướng
Tích vô hướng này được gọi là tích vô hướng Hilbert -Schmidt. Định nghĩa 1.2.15 Chuẩn Hilbert -Schmidt của ma trậnA = (A ij ) n×n ∈
Mn được định nghĩa như sau
(1.5) Định nghĩa 1.2.16 Chuẩn toán tử của một ma trận A ∈ M n được xác định bởi
∥A∥:= supn∥Ax∥: x ∈ C n ,∥x∥= 1o. Nếu∥A∥≤ 1thì ma trậnAđược gọi là mộtma trận co rút(contraction).
Ví dụ 1.2.17 Giả sử A∈ M n và ∥A∥< 1 Khi đó I −A là khả nghịch và
Công thức (1.6) được gọi là chuỗi Neumann □
MỘT SỐ HÀM MA TRẬN
Trong chương này chúng tôi trình bày một số vấn đề liên quan đến giá trị ma trận của các hàm số: hàm mũ,hàm luỹ thừa, hàm logarit, Các khái niệm và kết quả trong chương này được trình bày từ cuốn sách Hiai vàPetz [3].
Hàm mũ ma trận
Định nghĩa 2.1.1 Cho A ∈ M n (C) là một ma trận vuông phức cấp n. Hàm mũ của A, được kí hiệu là e A hoặc exp(A), là một ma trận vuông cấp n được định nghĩa bởi chuỗi luỹ thừa sau: e A : ∞
Chuỗi ở trên là chuỗi hội tụ vì
Do đó hàm mũ của A là xác định.
Ví dụ 2.1.2 Cho ma trận
Ví dụ 2.1.3 Cho ma trận
Ví dụ 2.1.4 Cho ma trận
Ma trận chuẩn tắc Jordan J của B bằng
□ Chú ý rằng với ma trận A trên đây ta có e A = lim n→∞
Thật vậy, ta có e aI +J = lim n−→∞
□ Tổng quát hơn ta có kết quả sau. Định lý 2.1.5 Ký hiệu
Chứng minh Ma trận B = e A n và ma trận
A n k giao hoán Do đó e A −Tm,n(A) =B n −T n = (B −T)(B n−1 +B n−2 T + +T n−1 ).
∥e A −T m,n (A)∥ ≤ n∥e A n −T∥e n−1 n ∥A∥ Bằng cách chặn phần dư của chuỗi Taylor,
∥A∥ n m+1 e ∥A∥ n e n−1 n ∥A∥ hội tụ đến 0 trong cả hai trường hợp m → ∞ và n→ ∞. Định lý 2.1.6 Cho A, B ∈ M n (C) Khi đó AB = BA khi và chỉ khi e t(A+B) = e tA e tB (t ∈ R).
Chứng minh Giả sử AB = BA Khi đó e A e B ∞
Vì AB = BA và C k = (A+B) k nên e A e B ∞
Ngoài ra, ta có thể chứng minh mệnh đề trên bằng phép lấy vi phân.
Thật vậy, theo khai triển (2.1),ta có d dte tA = e tA A = Ae tA
Vì AC = CA nên d dte tA e C−tA = e tA Ae C−tA −e tA Ae C−tA = 0.
Do đó hàm t 7→ e tA e C−tA là hàm hằng Đặc biệt e A e C−A = e C
Thay C bởi A+B vào phương trình trên ta được e A e B = e A+B Đạo hàm cấp 1 hai vế của phương trình e t(A+B) = e tA e tB ta được e t(A+B) (A+B) = e tA Ae tB +e tA e tB B và đạo hàm cấp hai là e t(A+B) (A+B) 2 = e tA A 2 e tB +e tA Ae tB B +e tA Ae tB B +e tA e tB B 2 Cho t = 0 ta có AB = BA.
Ví dụ 2.1.7 Hàm mũ ma trận được sử dụng để biểu diễn nghiệm của phương trình vi phân tuyến tính cấp 1 Cụ thể, giả sử x(t)
Khi đó nghiệm của phương trình vi phân x ′ (t) = Ax(t), x(0) = x 0 là x(t) = e tA x0.
Một cách cụ thể hơn, xét phương trình vi phân sau x ′ (t) "
Ma trận A có hai giá trị riêng là λ 1 = 5 và λ 2 = −1.
Với λ 1 = 5, xét hệ phương trình
Chọn vectơ riêng tương ứng với giá trị riêng λ 1 = 5 là v 1 = [1 1] T
Với λ 2 = −1, xét hệ phương trình
Chọn vectơ riêng tương ứng với giá trị riêng λ 2 = −1 là v 2 = [−1 1] T Xét ma trận H "
# Khi đó ma trận chéo tương ứng với A là J = H −1 AH "
Do đó e tA = He tJ H −1 = 1
# Vậy phương trình tuyến tính đã cho có nghiệm là x(t) =e tA
□ Định lý 2.1.8 Cho A ∈ M n với đa thức đặc trưng p(λ) (λI −A) = λ n +c n−1 λ n−1 + +c 1 λ+c 0
Khi đó e tA = x0(t)I +x1(t)A+ +xn−1(t)A n−1 , trong đó vectơ x(t) = (x 0 (t), x 1 (t), , x n−1 (t)) thoả mãn phương trình vi phân cấp n x (n) (t) +c n−1 x (n−1) (t) + +c 1 x ′ (t) +c 0 x(t) = 0 với điều kiện ban đầu x (k) (0) = (0, ,0,1,0, ,0) với 0≤ k ≤n−1 và phần tử 1 ở vị trí thứ k trong vectơ x (k) (0).
Chứng minh Ta kiểm tra được hàm giá trị ma trận
F 1 (t) =x 0 (t)I + x 1 (t)A+ +x n−1 (t)A n−1 và F 2 (t) = e tA thoả mãn các điều kiện
Ví dụ 2.1.9 Đối với các ma trận vuông cấp 2, việc sử dụng các ma trận Pauli σ 1 "
# là hiệu quả, cùng với I chúng tạo thành một hệ trực giao tương ứng với đến tích vô hướng Hilbert - Schmidt.
Thật vậy, giả sử A∈ M sa 2 sao cho
A= c 1 σ 1 +c 2 σ 2 +c 3 σ 3 , c 2 1 + c 2 2 +c 2 3 = 1 trong biểu diễn với các ma trận Pauli Dễ dàng kiểm tra A 2 = I Do đó
A 2n = I, nhưng A 2n+1 = A Chọn c ∈ R và kết hợp kiến thức về mối liên hệ giữa hàm mũ, sin và cos ta được e icA = P ∞ n=0 i n c n! n A n = P ∞ n=0 (−1) (2n)! n c 2n A 2n +iP ∞ n=0 (−1) n (2n+1)! c 2n+1 A 2n+1
Xét ma trận tổng quát C = c 0 I + cA ta được e iC = e ic 0 (cosc)I +ie ic 0 (sinc)A.
□ Định lý 2.1.10 (Công thức Lie-Trotter) Cho A, B ∈ M n (C) Khi đó e A+B = lim m→∞ e A/m e B/m n
∥X n −Y n ∥≤ nt n−1 ∥X −Y∥ với t là hằng số sao cho ∥X∥,∥Y∥≤ t.
Bây giờ ta chọn X n := e A+B n và Y n := e A n e B n Từ đánh giá trên ta có
∥X n n −Y n n ∥≤ nu∥X n −Yn∥, (2.3) nếu ta có thể tìm một hằng số u sao cho ∥X n ∥ n−1 ,∥Y n ∥ n−1 ≤ u Vì
≤ e ∥A∥ e ∥B∥ , ta có thể chọn u = e ∥A∥+∥B∥ để có đánh giá (2.3) Định lý trên được suy ra từ (2.3) nên ta có thể chứng minh n∥X n −Y n ∥−→ 0 Khai triển chuỗi luỹ thừa của hàm mũ suy ra
Dễ thấy tất cả các hạng tử có chứa n 1 và hạng tử hằng đều bị triệt tiêu.
∥X n −Y n ∥≤ c n 2 với một hằng số dương c Từ đó ta có điều phải chứng minh.
Nếu Avà B là các ma trận tự liên hợp, giới hạn trên tiến tới e A+B càng nhanh vì là giới hạn của các ma trận tự liên hợp.
= e − 2n A e A n e B n n e 2n A Cho n −→ ∞ ta được điều phải chứng minh.
Chú ý rằng, công thức Lie - Trotter có thể mở rộng cho nhiều ma trận: e A 1 +A 2 + +A k − e A n 1 e A n 2 e Ak n n
e n+2 n P k j=1 ∥A j ∥ Định lý 2.1.12 Với các ma trận A, B ∈ M n , khai triển Taylor của hàm t7→ e A+tB , t ∈ R là
Chứng minh Ta có thể viết lại như sau:
Z s 0 e −t 1 A BA k−1 (t 1 )dt 1 với k ≥ 1 Do đó d dsA k (s) = Ae sA
A k (s) thoả mãn phương trình vi phân
Do đó F(s) = e s(A+B) Nếu s = 1 và ta thay B bởi tB, ta có khai triển của e A+tB
Một công thức quan trọng khác đối với hàm mũ là công thức Barker- Campbell-Hausdorff: e tA e tB = exp t(A+B) + t 2
12([A,[A, B]]−[B,[A, B]]) +O(t 4 ) trong đó [A, B] := AB −BA. Định nghĩa 2.1.14 Một hàm f : R + = [0,∞) −→ R được gọi là đơn điệu hoàn toàn (completely monotone) nếu đạo hàm cấp n của f có dấu (−1) n trên R + , với mọi n ∈ N. Định lý 2.1.15 Cho A, B ∈ M sa n và t ∈ R Khi đó các phát biểu sau là tương đương:
(i) Đa thức t 7→ T r(A+tB) p chỉ có hệ số dương với mọi A, B ≥ 0 và p∈ N.
(ii) Với mọi ma trận tự liên hợp A, B ≥ 0, hàm t 7→ T r e (A−tB) là đơn điệu hoàn toàn trên [0;∞).
(iii) Với mọi A > 0, B ≥ 0 và mọi p ≥0, hàm t7→ T r(A+tB) −p là đơn điệu hoàn toàn trên [0;∞).
Chứng minh (i) =⇒(ii) : Ta có
Theo Định lý Bernstein và với giả thiết (i), vế phải là biến đổi Laplace của một độ đo dương với giá trong [0; +∞).
(ii) =⇒ (iii) : Từ phương trình ma trận
Z ∞ 0 e −u(A+tB) u p−1 du, ta có thể suy ra dấu của đạo hàm.
(iii) =⇒(i): Ta chỉ cần giả thiết trong (iii) với p ∈ N Với A khả nghịch, ta thấy đạo hàm cấp r của T r(A 0 +tB 0 ) −p tại t = 0 tương ứng với hệ số củat r trongT r(A+tB) p như trong công thức (3.7), trong đóA, A 0 , B, B 0 có mối liên hệ như trong Bổ đề 3.2.9 Vế trái của công thức (3.7 ) có dấu(−1) r bởi vì nó là đạo hàm của một hàm đơn điệu hoàn toàn Do đó vế phải có dấu như trong phát biểu (i) Trường hợp Akhông khả nghịch được suy ra bằng cách lập luận tương tự.
Nhắc lại, phộp biến đổi Laplace của độ đo à trờn R + là f(t) Z ∞ 0 e −tx dà(x) (t ∈ R + ). Định lý Bernstein phỏt biểu rằng độ đo à tồn tại nếu và chỉ nếu f là một hàm đơn điệu hoàn toàn.
Một số hàm ma trận khác
Trước tiên với một đa thức một biến p(x), ta định nghĩa đa thức ma trân p(X) với X ∈ M n Xét phân tích Jordan chuẩn tắc của X như sau
Vì J k (λ) = λI n + J k (0) = λI n + J k là tổng của các ma trận giao hoán, nên ta có thể tính luỹ thừa bậc m bằng cách sử dụng công thức nhị thức:
Các luỹ thừa của J k có thể tính được một cách chi tiết.
Từ đó chúng ta suy ra rằng nếu ta biết dạng chuẩn tắc Jordan của X, ta có thể tính f(X), với f là một đa thức hoặc là một hàm trơn. Định lý 2.2.1 Với X ∈ M n , ta luôn có det e X = e (T rX)
Ví dụ 2.2.2 Xét ma trận tự liên hợp
Xét đa thức đặc trưng p(λ) (X −λI) Khi đó p(λ) = 0
Do đó X có hai giá trị riêng là λ1 = 1 +R và λ2 = 1−R với R = px 2 +y 2 + z 2
Nếu R < 1 thì X là dương và khả nghịch.
Do đó XS = S∆ hay X = S∆S −1 Để tính S −1 ta dùng công thức
Ma trận X/2là một ma trận mật độ và có ứng dụng trong lí thuyết lượng tử □
Nhắc lại rằng, với f : I −→ R là một hàm liên tục trên I ⊆ R và với
A ∈ M n (C), giả sửA = P r i=1 λ i p i là phân tích phổ của A (λ i là các giá trị riêng và p i là phép chiếu trực giao lên không gian vectơ riêng tương ứng với giá trị riêng λ i ) Khi đó f(A) r
X i=1 f(λi)pi. Định lý 2.2.3 Nếu fk và gk là các hàm số (α, β) −→ R sao cho với ck ∈ R
X k c k T rf k (A)g k (B) ≥ 0 với mọi A, B là các ma trận tự liên hợp với phổ nằm trong (α, β).
Chứng minh Giả sử A = P i λ i P i và B = P j à j Q j lần lượt là cỏc phõn tích phổ của A và B Khi đó
Trong định lý, giả sử P kckfk(x)gk(y) = 0nếu và chỉ nếu x = y Khi đó ta có thể chứng minh P kc k T rf k (A)g k (B) = 0 nếu và chỉ nếu A = B Từ chứng minh trên ta cóP kc k T rf k (A)g k (B) = 0nếu và chỉ nếuT rP i Q j > 0 suy ra λ i = à j Từ tớnh chất suy ra
Q j AQ j = X i λ i Q j P i Q j = à j Q j , và tương tự Q j A 2 Q j = à 2 j Q j Do đú
(AQ j −à j Q j ) ∗ (AQ j −à j Q j ) = Q j A 2 Q j −2à j Q j AQ j + à 2 j Q j = 0 do đú AQ j = à j Q j = BQ j với mọi j, suy ra A = B Điều ngược lại là hiển nhiên.
Ví dụ 2.2.4 Xét f là một hàm lồi, f : I −→ R Khi đó f(x)−f(y)−(x−y)f ′ (y) ≥ 0 và
Thay f bởi hàm số −η(t) =tlogt ta có
T rAlogA ≥ T rBlogB+ T r(A−B) + T r(A−B) logB hoặc tương đương
Vế trái là lượng tử entopy tương đối S(A∥B) của các ma trận xác định dương A, B.
Nếu T rA = T rB thì S(A∥B) được gọi là entropy tương đối Umegaki: S(A∥B) =T r(logA−logB) Điều này cho ta một đánh giá tốt hơn Nếu
T rA = T rB = 1 thì tất cả các giá trị riêng nằm trong đoạn [0; 1] Tức là, với ξ ∈ (x, y)
2(x−y) 2 trong đó x, y ∈ [0; 1] Theo Định lý 2.2.3, ta có
Bất đẳng thức Streater (2.4) có hệ quả là A = B nếu entropy tương đối là
0 Tốt hơn, bất đẳng thức mạnh được gọi là bất đẳng thức Pinsker: Nếu
2∥A−B∥ 2 1 ,trong đó ∥A−B∥ 1 := T r|A−B| là chuẩn vết của A−B □
Chương 3 ĐẠO HÀM MA TRẬN
Trong chương này chúng tôi trình bày một số vấn đề liên quan đến đạo hàm ma trận của một số hàm thường gặp như: hàm mũ, hàm logarit, Bên cạnh đó, chúng tôi trình bày đạo hàm của hàm vết và đạo hàm Fréchet.Các kết quả trong chương này được chúng tôi tổng hợp và trình bày lại từ cuốn sách của Hiai và Petz [3].
Đạo hàm của hàm mũ và hàm logarit
Mệnh đề 3.1.1 Với mỗi ma trận A ∈ M n (R), xét hàm ma trận R →
Mn(C), t 7→e tA ,∀t∈ R Khi đó d dt(e tA ) = Ae tA (3.1)
Chứng minh Ta có d dt(e tA ) = d dt
Mệnh đề 3.1.2 ChoA ∈ M n là ma trận khả nghịch dương Khi đóA+tT cũng khả nghịch dương với T ∈ M sa n và số thực nhỏ t Khi đó log(A+ tT) Z ∞ 0
(x+ 1) −1 I −(xI +A+ tT) −1 dx; d dtlog(A+tT) Z ∞ 0
(xI +A) −1 T(xI +A) −1 dx; d 2 dt 2 log(A+tT) = −2
(xI +A) −1 T(xI + A) −1 T(xI +A) −1 dx. Hơn nữa, ta có khai triển Taylor log(A+tT) = logA+tR 0 ∞ (x+A) −1 T(x+A) −1 dx
= logA−P ∞ n=1 (−t) n R 0 ∞ (x+A) −1 2 ×((x+A) −1 2 T(x+A) −1 2 ) n (x+A) −1 2 dx. Để chứng minh Mệnh đề 3.1.2, cần kết quả sau về đạo hàm cấp cao của hàm (A+tT) −1
Bổ đề 3.1.3 Cho A ∈ M n là một ma trận khả nghịch Khi đó A+tT là khả nghịch với mọi T ∈ M n , t là số thực nhỏ Hơn nữa d dt(A+tT) −1 = −(A+tT) −1 T(A+tT) −1 ; d 2 dt 2 (A+tT) −1 = 2(A+tT) −1 T(A+tT) −1 T(A+tT) −1 ; d 3 dt 3 (A+ tT) −1 = −6(A+tT) −1 T(A+tT) −1 T(A+tT) −1 T(A+ tT) −1
Từ đó ta có khai triển Taylor
1 t (A+tT) −1 −A −1 = −A −1 T A −1 Nói cách khác, đạo hàm của hàm (A + tT) −1 tại t = 0 được tính bằng
−AT −1 A −1 Với t ̸= 0 nhỏ, nếu A+tT khả nghịch thì d dt(A+tT) −1 = −(A+tT) −1 T(A+tT) −1
Tương tự d 2 dt 2 (A+tT) −1 = 2(A+tT) −1 T(A+tT) −1 T(A+tT) −1 d 3 dt 3 (A+ tT) −1 = −6(A+tT) −1 T(A+tT) −1 T(A+tT) −1 T(A+ tT) −1
Do đó khai triển Taylor của hàm (A+tT) −1 là
A −1 2 nên ta có thể nhận được khai triển Taylor của hàm (A+ tT) −1 từ chuỗi Neumann của
Đạo hàm của hàm vết
Định lý 3.2.1 Cho A, B ∈ M n (C) là các ma trận tự liên hợp và t ∈ R. Cho f : (α, β) −→ R là hàm khả vi liên tục và giả sử rằng các giá trị riêng của A+tB thuộc (α, β) với t−t0 nhỏ Khi đó d dtT rf(A+tB) t=t 0 = T r(Bf ′ (A+t 0 B)) (3.2)
Chứng minh Nếuf là một đa thức, dễ dàng kiểm tra trực tiếp rằngT r(A+ tB) n là một đa thức theo biến t Ta quan tâm đến hệ số của t được tính bằng
T r(A n−1 B +A n−2 BA+ +ABA n−2 +BA n−1 ) = nT rA n−1 B.
Do đó định lý đúng cho trường hợp f là một đa thức Do mỗi hàm khả vi liên tục có thể xấp xỉ bằng một dãy đa thức nên ta có kết quả của định lý.
Ví dụ 3.2.2 Cho f : (α, β) −→ R là một hàm tăng liên tục và phổ của các ma trận tự liên hợp A và C nằm trong (α, β) Ta sử dụng Định lý 3.2.1 để chứng minh
Giả sử f là hàm trơn Vì A ≤ C nên B ≥ 0 với B = C −A Đạo hàm của T rf(A+tB) là T r(Bf ′ (A+ tB)) và T r(Bf ′ (A+tB)) là dương (vì đây là vết của tích hai toán tử dương).
Ngoài ra, ta có thể chứng minh công thức (3.3) bằng cách sử dụng Định lý 1.2.11: Cho các giá trị riêng củaA, C sao choλk(A) ≤ λk(C)(1 ≤ k ≤ n) và do đó T rf(A) = P k f(λ k (A)) ≤ P k f(λ k (C)) =T rf(C) □ Định lý 3.2.3 Chof : (α, β) −→ Rlà một hàm thuộc lớpC 1 vàA =Diag (t 1 , t 2 , , t n ) với α < t i < β(1 ≤ i ≤ n) Nếu B = B ∗ thì đạo hàm của hàm t 7→f(A+tB) là một tích Schur: d dtf(A+tB) t=t 0
= D ◦B, (3.4) trong đó D là ma trận sai phân:
Chứng minh Ta có f(A+tB) = 1
Z β α f(z)(zI −(A+tB)) −1 dz (3.5) Đạo hàm của hàm f(A+tB) là
Từ công thức (3.6) và công thức Frobenius suy ra
Z β α f(z) (z −t i )(z −t j )dz = f(ti)−f(tj) t i −t j (tức là f ′ (t i ) nếu t i = t j ) Do đó
1 z −t j dz = f(t i )−f(t j ) t i −t j Bij.Định lý được chứng minh.
Như vậy, một hàm thuộc lớp C 1 và đạo hàm của nó đều có thể xấp xỉ bằng các đa thức.
Cho f : (α, β) −→ R là một hàm liên tục Khi đó f được gọi là đơn điệu ma trận nếu
A ≤ C suy ra f(A) ≤ f(C) trong đó phổ của các ma trận tự liên hợp A và C thuộc (α, β).
Ta có f(x) =−1/xlà một hàm đơn điệu ma trận Tính đơn điệu ma trận nghĩa là f(A+tB) là hàm tăng khi B ≥0 Tính tăng là tương đương với tính dương của đạo hàm Chúng ta sử dụng Định lý 3.2.3 trước để chứng minh hàm f(x) =√ x là đơn điệu ma trận.
Hệ quả 3.2.4 Hàm số f : (0; +∞) −→ R, f(x) = √ x,∀x ∈ (0; +∞) là đơn điệu ma trận.
Chứng minh Giả sử A > 0là ma trận đường chéo A = Diag(t1, t2, , tn). Khi đó đạo hàm của hàm √
2 √ t i nếu t i −t j = 0. Đây là một ma trận Cauchy và nó dương Nếu B dương thì D ◦B cũng dương Vì đạo hàm dương nên f(x) = √ x là đơn điệu ma trận. Định nghĩa 3.2.5 Tập con K ⊂ M n là lồi nếu với bất kì A, B ∈ K và với bất kì số thực 0 < λ < 1 λA+ (1−λ)B ∈ K.
Hàm số F : K −→R là lồi nếu A, B ∈ K và với bất kì số thực 0< λ < 1 ta có bất đẳng thức
F(λA+ (1−λ)B) ≤λF(A) + (1−λ)F(B) luôn đúng Bất đẳng thức này tương đương với tính lồi của hàm
Ta đã biết tính lồi liên quan đến đạo hàm cấp 2 Định lý sau chứng tỏ tính lồi của hàm vết tương ứng với một hàm lồi. Định lý 3.2.6 Cho K là tập hợp các ma trận tự liên hợp cấp n với phổ nằm trong khoảng (α, β) Giả sử hàm f : (α, β) −→ R là một hàm lồi thuộc lớp C 2 Khi đó phiếm hàm A 7→ T rf(A) là lồi trên K.
Chứng minh Tính lồi của phiếm hàm A 7→T rf(A) tương đương với tính lồi của hàm số t7→ T rf(tX 1 + (1−t)X 2 ) =T r(X 2 +t(X 1 −X 2 )) (t ∈ [0,1]).
Do đó ta chỉ cần chứng minh đạo hàm cấp hai của hàm sốt 7→T rf(A+tB) là dương tại t= 0. Đạo hàm cấp một của hàm t 7→ T rf(A+tB) là T rf ′ (A+ tB)B Để tính đạo hàm cấp hai ta lấy đạo hàm của hàm f ′ (A+ tB) Giả sử A là ma trận đường chéo và đạo hàm tại t= 0 Sử dụng (3.4) ta có d dtf ′ (A+tB) t=0 i,j
Do đó d 2 dt 2 T rf(A+tB) t=0
= P i,k f ′′ (s ik )|B ik | 2 , trong đó s ik nằm giữa t i và t k Tính lồi của f suy ra f ′′ (s ik ) ≥0, do đó d 2 dt 2 T rf(A+ tB) t=0
Ta có điều phải chứng minh.
Ví dụ 3.2.7 Hàm số η(x) ( −xlogx nếu x > 0,
0 nếu x = 0 liên tục và lõm trên R + Với một ma trận dương D ≥ 0,
S(D) := T r η(D) được gọi là entropy von Neumann Theo định lý trên, S(D) là hàm lõm theo D Chú ý rằng ta không thể áp dụng định lý, vì η không có đạo hàm tại 0 Do đó ta nên áp dụng định lý với f(x) := η(x+ ε), với ε > 0 và cho ε−→ 0 □
Ví dụ 3.2.8 Cho H là một ma trận tự liên hợp Trạng thái của một hệ lượng tử được mô tả bằng ma trận mật độ D với tính chất D ≥ 0 và
Trạng thái cân bằng được xác định bằng cách cực tiểu
F(D) = T rDH − 1 βS(D), trong đó β là một số dương Để tìm cực tiểu, ta giải phương trình
∂tF(D +tX) t=0 = 0 với ma trận tự liên hợp X thoả mãn T rX = 0 Phương trình này là
H + 1 βlogD+ 1 βI phải bằng cI Do đó cực tiểu là
T re −βH , được gọi là trạng thái Gibbs □
Bổ đề sau được sử dụng để chứng minh Định lý 2.1.15.
Bổ đề 3.2.9 Cho A 0 , B 0 ∈ M sa n và A 0 > 0 Định nghĩa A = A −1 0 và
B = A −1/2 0 B 0 A −1/2 0 và t ∈ R Với p, r ∈ N d r dt r T r(A0 +tB0) −p t=0 = p p+r(−1) r d r dt r T r(A+tB) p+r t=0 (3.7)
Chứng minh Bằng quy nạp ta chứng minh được rằng d r dt r T r(A+tB) p+r = r! X
Lấy vết tại t= 0 ta có
Hơn nữa, lập luận tương tự ta có d r dt r (A 0 +tB 0 ) −p
Lấy vết tại t= 0 và sử dụng tính lặp lại ta có
K 2 = p p+r(−1) r K 1 Để thấy được điều này ta có thể viết lại K 1 theo cách sau đây: Định nghĩa p+r ma trận M j bởi
Giả sử Sn ký hiệu nhóm các phép thế trên {1, , n} Khi đó
Vì tính tuần hoàn của vết ta có thể sắp xếp tích sao cho Mp+r có vị trí đầu tiên trong vết Vì có p+ r vị trí thích hợp cho M p+r xuất hiện trong tích trên và tất cả các tích là như nhau, ta có
M π(j) , do đó ta được điều phải chứng minh.
Đạo hàm Fréchet
Cho f là một hàm nhận giá trị thực trên (a;b) ⊂R,và kí hiệu M sa n (a;b) là tập tất cả các ma trận A ∈ M sa n với σ(A) ⊂ (a;b) Trong mục này chúng tôi trình bày tính khả vi của hàm ma trận A 7→f(A) khi A ∈ M sa n (a;b). Trường hợp n = 1 tương ứng với phép tính đạo hàm trong giải tích cổ điển Giả sử x 1 , x 2 , là các điểm phân biệt trong (a, b) Khi đó ta định nghĩa f [0] [x 1 ] := f(x 1 ), f [1] [x 1 , x 2 ] := f(x1)−f(x2) x 1 −x 2 và một cách truy hồi n= 2,3, , f [n] [x 1 , x 2 , , x n+1 ] := f [n−1] [x 1 , x 2 , , x n ]−f [n−1] [x 2 , x 3 , , x n+1 ] x 1 −x n+1
Các hàm số f [1] , f [2] và f [n] tương ứng được gọi là sai phân cấp một, cấp hai, cấp n của f.
Chú ý rằng tính đối xứng của f [n] không rõ ràng từ định nghĩa truy hồi Nếu f là một hàm số thuộc lớp C n , ta có f [n] [x 0 , x 1 , , x n+1 ] Z
S f (n) (t 0 x 0 + t 1 x 1 + +t n x n )dt 1 dt 2 dt n , (3.8) trong đó tích phân được lấy trên tập S := {(t 1 , , tn) ∈ R n : ti ≥
0,P i=1 t i ≤ 1} và t 0 = 1 −P n i=1 t i Tính đối xứng của f [n] trong công thức này được thể hiện rõ ràng và nếu x 0 = x 1 = = x n = x thì f [n] [x 0 , x 1 , , x n ] = f (n) (x) n! Tiếp đến chúng tôi giới thiệu khái niệm đạo hàm Fréchet. Định nghĩa 3.3.1 Cho một ánh xạ F : M m −→M n được xác định trong một lân cận của A ∈ M m Đạo hàm ∂F(A) : M m −→ M n là một ánh xạ tuyến tính sao cho
∥ X ∥ 2 −→ 0 khi X ∈ M m và X −→0, trong đó ∥ ∥ 2 là chuẩn Hilbert - Schmidt Đây là định nghĩa tổng quát của đạo hàm Fréchet của hàm F.
Bây giờ ta xét hàm số f : (a, b) −→ R và A ∈ M sa n (a, b) Khi đó đạo hàm Fréchet của hàm số f là một ánh xạ tuyến tính∂f(A) : M sa n −→M sa n sao cho
∥ X ∥ 2 −→ 0 với X ∈ M sa n và X −→ 0, hoặc tương đương f(A+X) =f(A) +∂f(A)(X) +o(∥ X ∥ 2 ).
Vì tính khả vi Fréchet suy ra tính khả vi Gâtaux, ta có thể đạo hàm f(A+tX) theo tham số t và f(A+tX)−f(A) t −→∂f(A)(X) khi t−→ 0.
Khái niệm tính khả vi Fréchet cho f(A) được mở rộng một cách quy nạp Để làm được điều này, ta kí hiệu B((M sa n ) m ,M sa n ) là tập tất cả các ánh xạ tuyến tính từ (M sa n ) m := M sa n ×M sa n × ×M sa n (m lần) đến M sa n và xét chuẩn Φ ∈ B((M sa n ) m ,M sa n ) bởi
∥Φ∥:= supn∥Φ(X 1 , , Xm)∥ 2 : Xi ∈ M sa n ,∥X i ∥ 2 ≤1,1 ≤i ≤m o (3.9) Định nghĩa 3.3.2 Giả sử m ∈ N với m ≥ 2 và giả sử rằng đạo hàm Fréchet cấp m − 1 là ∂ m−1 f(B) ∈ B((M sa n ) m−1 ,M sa n ) tồn tại với mọi
B ∈ M sa n (a, b) trong lân cận của A ∈ M sa n Ta nói f(B) là khả vi Fréchet cấp m tại A nếu ∂ m−1 f(B) khả vi Fréchet một lần nữa tại A tức là tồn tại
∂ m f(A) ∈ B(M sa n , B((M sa n ) m−1 ,M sa n )) = B((M sa n ) m ,M sa n ) sao cho
∥ X ∥ 2 −→0 khi X ∈ M sa n và X −→ 0,tương ứng với chuẩn (3.9) của B((M) sa n ) m−1 ,
M sa n ) Khi đó ∂ m f(A) được gọi là đạo hàm Fréchet cấp m của f tại A.Chú ý chuẩn của M sa n và B((M sa n ) m ,M sa n ) không ảnh hưởng đến định nghĩa của đạo hàm Fréchet vì các chuẩn trên không gian vectơ hữu hạn chiều là tương đương; do đó ta có thể sử dụng chuẩn Hilbert - Schmidt.
Ví dụ 3.3.3 Xét hàm số f(x) = x k với k ∈ N Khi đó (A+X) k có thể khai triển và ∂f(A)(X) có dạng
A u XA kư1ưu Để tính đạo hàm Fréchet cấp hai của f, ta đặt A+Y thay cho A trong
Ta viết lại một cách thuận tiện hơn
A u X π(1) A v X π(2) A w trong đó u, v, w ≥ 0 và π biểu thị các hoán vị của {1,2} □ Định lý 3.3.4 ([3, Theorem 3.33]) Cho m ∈ N và giả sử f : (a, b) −→ R là một hàm thuộc lớp C m Khi đó các khẳng định sau là đúng:
(1) f(A) là khả vi Fréchet m lần tại mọi A ∈ M sa n (a, b) Nếu phép chéo hoá của A ∈ M sa n (a, b) là A = U Diag(λ 1 , λ 2 , , λ n )U ∗ thì đạo hàm Fréchet cấp m ∂ m f(A) xác định bởi
(2) Ánh xạ A 7→ ∂ m f(A) là một ánh xạ liên tục theo chuẩn từ M sa n (a, b) đến B((M sa n ) m ,M sa n ).
(3) Với mọi A ∈ M sa n (a, b) và mọi X1, Xm ∈ M sa n ,
Ví dụ 3.3.5 Chof là một hàm thuộc lớpC 1 trên(a, b)vàA = Diag(λ1, , λn) là ma trận đường chéo trongM sa n (a, b) Khi đó đạo hàm Fréchet ∂f(A) tại A được tính bằng
∂f(A)(X) =hf [1] (λ i , λ j )i n i,j =1◦X, với ◦ là tích Schur (Xem Định lý 3.2.3).
Nếu f là một hàm thuộc lớp C 2 trên (a, b), đạo hàm Fréchet cấp hai
∂ 2 f(A) tại A = Diag(λ1, , λn) ∈ M sa n (a, b) được tính bằng
Ví dụ 3.3.6 Nếu f là một hàm chỉnh hình thì khai triển Taylor f(A+X) = f(A) +
) có thể được tính bởi f(A+X) = 1
Vì zI −A−X = (zI −A) 1 2 (I −(zI −A) −1 2 X(zI −A) −1 2 )(zI −A) −1 2 , nên ta có khai triển
= f(A) + ∂f(A)(X) + 2! 1 ∂ 2 f(A)(X, X) + Đây là khai triển Taylor □
Luận văn đã tổng hợp, sắp xếp, trình bày lại và làm rõ một số kết quả về hàm ma trận và đạo hàm ma trận Cụ thể luận văn đã đạt được các kết quả sau:
1 Giới thiệu định nghĩa và các kết quả mô tả giá trị ma trận của hàm mũ (Định lý 2.1.5, Định lý 2.1.6, Định lý 2.1.10, Hệ quả 2.1.11, Định lý 2.1.15).
2 Trình bày một số kết quả liên quan đến hàm vết của các hàm ma trận(Định lý 2.2.1, Định lý 2.2.3).
3 Trình bày đạo hàm của hàm mũ và hàm logarit ma trận (Mệnh đề 3.1.1, Mệnh đề 3.1.2).
4 Trình bày một số kết quả về đạo hàm của hàm vết của các hàm ma trận (Định lý 3.2.1, Định lý 3.2.3, Bổ đề 3.2.9); tính lồi ma trận của hàm vết của một hàm lồi (Định lý 3.2.6).
5 Trình bày khái niệm và mô tả đạo hàm Fréchet cấp một và cấp cao của các hàm ma trận (Định lý 3.3.4).