Luận văn thạc sĩ chuyên ngành Xác xuát -thống kê -Chuyên đề :Khảo sát tính phụ thuộc giữa nhiều tập biến
Trang 1Chương 4
Phân tích sự phụ thuộc giữa một
ma tran voi / ma tran
4.1 Khái niệm các bộ thành phần
Cho Y là ma trận dữ liệu thực quy tâm cấp ø x ạ và Xị, , X;¿ là ! ma trận
đữ liệu thực quy tâm với X;¿ cấp n x pj, i=1, ,1
l Dat X = (X1, ,X)), X c6 cap nx p (p= Soni)
i=l
Ta tìm bộ (b,et,e›, ,@;), e¡ € (R”!,MI), ,e; € (RP?',M;) va b € (R4,N)
sao cho hàm số
L(e1,€2, e1,b) = S> Cov?(XiMye;, YNb) = S>(e{M;X{DYNb)”
cực đại với e;M;e; = 1 Vi = 1, ,! và bNb = 1
Gọi một bộ nghiệm ở bước một này là (bŒ),aii,ast, ,a/¡), và Aa) la gid trị max ctia L
Giả sử ta đã có h bộ nghiệm (bY), ayj,agj, ,ayj), f =1, ,h, ca cdc
HUGG Iyse walks
Trang 2CHUONG 4, PHAN TICH SỰ PHỤ THUỘC GIỮA MỘT MA TRẬN VỚI L MA TRAN46
Bây giờ ta tìm bộ (b,ei,e», ,e;) thứ (h + 1) sao cho hàm số
L(e1,€2, ,e1,b) = $> Cov?(X;Mie;, YNb) = )>(e/M,;X;DYNb)”
cực đại như ở các bước trên nhưng thêm ràng buộc e;.LM,(a¿1,3/2, , ain),
Wi=1, ,1 Goi Anes) 1a gid trị max của Ù ở bước (h +1) Ta có Àq) > >
An (È=0,1, )
Đây chính là bài toán 3 chương 2 với A; = X;DY và A =X'DY Do đó,
từ bài toán 3 chương 2 ta tìm được các bộ (bÖ),ai;, aa;, ,ayy) thỏa các điều kiện ở trên
Với A = X'DY, từ tính chất 2.5.5 chương 2 ta có:
với S = (a) al™), T = (bữ) bÉ")) và A = diag(Aq), -,Àqm)); Àa) >
-> Am) > 0, mm là số tối đa các bước của quá trình cực đại hóa trong bài toán
3 Theo §2.5 chương 2, m < rank(A) (đặc biệt m < 4), m < minfjl, ,Ø}, m> ;max rank(A,)
Phân tích giá trị ky di thu gon ctia SS'MX’DY 1a SAT’ vdi SS'M la ma tran chiéu lén M(S) va SS’MX’ 1a hinh chiếu theo cột của X” lên M(S)
4.2 Phan tích sự phụ thuộc của Y theo
(Xi as ee ok)
Để phan tich su phu thudc cla Y theo téng thé (X), X2, ,X)) ta sé phan tích sự phụ thuộc của Y theo hình chiếu XMSS’ cia X = (Xj, Xo, , Xz)
Ở phần này ta sẽ phân tích sự phụ thuộc của Y theo tổng thể (Xị,Xo, ,X¿) bằng cách phân tích hồi quy YNT theo (XMSS”)MS = XMS vì SMS =I
Trang 3CHUONG 4 PHẦN TÍCH SỰPHỤ THUỘC GIỮA MỘT MA TRẬN VỚI L MA TRAN47
Bằng cách phân tích hồi quy YNT theo XMES ta có ảnh tương đồng của
Y theo tổng thể (XỊ,X¿, , X,) là Ÿa Theo §3.3, Ya thu duoc tiv
Y¿ = (XMSS')MSD,T' = XMSD,T” (4.2)
với Dụ = diag(2I, , Ym)
Ta có (XMSS')Ma” = XMaf), vậy
Cov(YNb"), XMa) À
Var(XMaU)) Var(XMa1)) Ảnh không tương đồng toàn phần của Y theo tổng thể (X¡,Xa, ,,X,) là:
Từ (3.15), chuong 3, anh tuong déng Y4 va khong tương đồng toàn phần Y¿ của Y theo XMSS' sẽ thỏa:
0< Tr(Y'DYN) = Tr(YDY4N) + r(Ÿ-DŸzN) (4.5) Lúc này, ta gọi
Tr(Y,DYAN)
0 Š LÀ (ty N.D).( M,.Đ)}-¡, ] = “h(V'ĐYN) <1 (4.6)
Goi Yp = PxmsY — Ya va Yy = Y — PxmsY 1a anh khong tuong déng
va phan nhiéu ctia Y theo téng thé (Xj, Xe, ,X)) vdi
Pxms = (XMS) ((XMS)'/D(XMS))_'(XMS)'D (Ta cé rank(XMSS') < rank(XMS) va rank(XMS) = rank(XMSS’MS) < rank(XMSS), suy ra rank(XMSS') = rank(XMS) Nhung M(XMSS’) c
M(XMS), vậy A1(XMSS') = M(XMS) Suy ra Pxwss = Pxms)
Ta có
Trang 4CHUONG 4, PHAN TICH SU'PHU THUOC GIUA MOT MA TRAN VOIL MA TRAN48
Theo hệ thức (3.24), chương 3, ta có:
Tr(Y'DYN) = Tr(Y¥4,DY4N) + Tr(YpDYpN)+Tr(YyDYyN) (48)
Tr(Y,DYAN) Tr(Y,DYpN) T(YyD¥WN) _ |
Tr(Y'DYN) ” Tr(Y'DYN) T(YDYN) -
Tr(YDYAN) Tr(YDYpN) và Tr(YDYyN)
Tr(YDYN) ` Tr(YDYN) T(YDVN)
chỉ số để đo mức độ tương đồng, không tương đồng và nhiễu của Y theo
tổng thể (X¡,Xa, X)
4.3 Phân tích sự phụ thuộc của (X¡,X¿, , X,) theo Y
Trong phần này, làm ngược lại với §4.2, ta phân tích sự phụ thuộc của XMSS/
theo Y
Vì (XMSS')MS = XMS nên theo chương 3, ta sẽ phân tích hồi quy của XMS theo YNT
Bằng cách phân tích hồi quy đồng thời XMS theo YNT như ở chương 3
ta CÓ:
với Dạ = diag(ỚØi ổm)
X¿ gọi là ảnh tương đồng của tổng thể (X¡,X¿, ,X;) theo Y
Ảnh không tương đồng toàn phần của tổng thể (X¡,X¿, ,X¿) theo Y là:
Trang 5CHUONG 4, PHAN TICH SU'PHU THUOC GIUA MOT MA TRAN VOI L MA TRAN49
Ta có:
Tr(X'DXAM) = Tr(X'DYNTD,SM)
= Tr(S'MX/DYNTD,)
a oo ama ae) me
Var(YNb“)) (từ (4.10)) j=l
= ` 0 Var(XMa))
j=l
7 Cov(XMa"), YNb“))
VA 23 =
V Var KMa\) V Var YNb")
Mặt khác:
‘Tx(X/,DX 4M) = Tr(SD,T/NY'DYNTD,SM)
= Tr(D„T'NY'DYNTD,)
1=]
1m
=À`/jVar(XMa?)) (từ (4.10)
j=l
TU (4.12) va (4.13) suy ra:
Tr(X/)DX 4M) = Tr(X’DX 4M) = Tr(X/,DX 4M) + Te(X!-DX 4M)
Do đó
Tr(X~DX 4M) = r(X¿DẤ¿M) = 0
0 < Tr(X/DXM) = Tr(X',DX 4M) + Tr(X~DX;zM) (4.14)
Lúc này, ta đặt
Tr(X„DXAM)
0 < LÀÍ((X,.M D)),-¡, ,(Y,N,D)] = “RXĐXM) <1 (4.15)
là chỉ số dùng để đo mức độ tương đồng của tổng thể {(X;,M;,D)};—, ; theo (Y,N,D)
Trang 6CHUONG 4 PHAN TICH SU PHU THUỘC GIỮA MỘT MA TRẬN VỚI L MA TRẬN50
Gọi Xp = PyX_— Xu và Xy =X- PyX là ảnh không tương đồng và phần nhiễu của tổng thể (X¡,Xa, ,X,) theo Y với Py = Y(YDY) Y'D là toán tử chiếu lên I(Y)
Ta có
YD(X - PyX) =0 vì X— PyX có các cột Lp.M(Y) hay Y'DXxy = 0 hay
X\DY =0
Suy ra X'yDX4 = Xj DYNTD,S' = 0, và Xy„DẤp = Ä/„D(PyX - %¿) =
X'yD(Y(Y'DY) Y’/DX — X4) =0
Tóm lại, ta được:
X\DY = 0, XyDX,4 = 0, XVDXp =0 (4.17)
Từ (4.14), (4.16) và (4.17) ta có:
Tr(X'DXM) = Tr(XDXAN) + Tr(Xz+DXzM)
(4.18)
= Tr(XDXAM) + tr(X„DX›pM) + Tr(XyDX\M)
2, E(X)DX4M) Tr(XpDXpM) | Tr(XyDXyM)
T(XDXM) ` Tr(XDXM) ` T(XDXM)
Tr(X4DXAM) Tr(X„DXpM) 7 Tr(X/yDXyM)
Tr(X'DXM) ' T:i(XDXM) Tr(X'DXM)
chí số để đo mức độ tương đồng, không tương đồng và nhiễu của tổng thể
(Xi, Xo, ,X)) theo Y
4.4 Phân tích tác động của từng ma trận X, vào phụ thuộc
tổng thể
Dat 8; = (ay aim), Pi = diag(l,‹.- ; Hưm), t=1, :,1
Trang 7CHƯƠNG 4 PHÂN TÍCH SỰ PHỤ THUỘC GIỮA MỘT MA TRẬN VỚI L MA TRẬN51
Khi đó:
SịPi S=(aU a"”)= |: với S/M;S; =I (4.19)
SP;
Ta có X¿M;8; = (X;M;S/S/)M;6; vì S/M;S; =1 (¿ = 1, ,!)
Do đó, khi phân tích hồi quy hình thức X;M;8; theo YNT ta được “ảnh tương đồng” của X;M;8,S/ theo Y là:
vGi Do, = diag(Gi1, , Bim)
Cov(X;Mja;;, YNb”)
Var(YNb8)) Phân tích hồi quy này chỉ là hình thức vì ta không còn có
al,M;X!DYNb”? = 0 voi j' 4 j giống như chương 3, mà chỉ có a/,M;A;Nbữ? = 0 với j > 7 theo tinh chat 2.5.6 chuong 2 (A; = X/DY)
Từ (2.6) và tính chất 2.5.2 ta có:
a; MiA;NbY) _ Cov(X;Miajj, YNb“))
Gg = =
MO \OMANb® — Cov(XMa®), YNbO) Suy ra:
— Cov(X;M¡a¿;, YNbÉ))
Var(YNbĐ))
_ Cov(X;M¡a¡;, YNbÉ)) Cov(XMaU),YNbĐ))
Cov(XMa\), YNbY)) Var(YNb"))
Pij
=8; ,Vj =1, ,m
<=> Da, = DaPi
Do đó, từ (4.20):
X4, = YNTD,,S/ = YNTD,P;S/ (4.22)
Trang 8CHUONG 4 PHAN TÍCH SỰ PHỤ THUỘC GIỮA MỘT MA TRẬN VỚI L MA TRẬN52
Đến đây, ta sẽ chứng minh Xạ = (Say sgt Xan); that vay:
Từ (4.9), (4.19) và (4.22) ta có:
Xa = YNTD,S
= YNTD,(P¡S¡ P;S/)
(4.23)
=(YNTD,P¡S/ YNTD,P,Sj)
a
Vi X4, theo (4.9), là ảnh tương đồng của tổng thể (X¡,X¿, , X¿) theo
Y, cho nén tt X4 = (Xa, Xa,) ta có thể xem như Xa, là đøb ương đồng riêng của X; theo Y trong tổng thể (Xị,X, ,X)
Xa, phản ảnh sự tương đồng của X;, theo Y trong tổng thể (Xị ,XJ) theo Y, điều này khác với phân tích sự tương đồng của X; riêng biệt theo
nếu được làm như trong chương 3
Ảnh không tương đồng toàn phần riêng của X; theo Y là:
Ta có:
Tr(X/DX 4,M,) = Tr(X!DYNTD,,S/M;)
= Tr(S/M;X/DYNTD,,)
m
=: Cov?(X;Myaij, YNbY))
Var(YNb")) (từ (421)) 4.25)
j=l
m
= ` Độ, Var(X;M¿a,;)
j=l
Cov(X;Miai, YNb0))
VVar X;Mijail V Var YNbY) ,
VỚI Ø¡j =
Trang 9CHUNG 4 PHẬÂN TÍCH SỰ PHỤ THUỘC GIỮA MỘT MA TRẬN VỚI L MA TRẬN53
Mặt khác:
Tr(X/,DX¿.M;) = Tr(S;Da,T'NY/DYNTD,,$;M;)
= Tr(D,,T'NY'DYNTD,,) (4.26)
= So pi; Var(XiMiaiy) (từ (421)
j=l
Từ (4.25) và (4.26) suy ra:
Tr(X/y, DX4,M,) = Tr(X!DX4,M,) = Tr(X/y, DX 4,Mi) + Te(X7,DX4,M;)
Do đó
Tr(ÄX;zDX„¿.M;) = Tr(X4.DXzM;) =0
Vậy
0< Tr(X/DX/M,) = n(X¿ DX¿,M;) + tC,DXzM,) (4.27)
Lúc này, ta đặt
Tr(X!,, DX 4,Mi)
0 < LAI ?[(x,.M.,D),(Y,N,D)] = “XÐĐXM) Ế 1 (4.28)
là chỉ số tương đồng riêng của (X;,M¡,D) theo (Y,N,D) trong tổng thể
(Kiger -yeXq) theo "Y
Goi Xp, = PyX; — Xa, va Xy, = Xi — PyX; lần lượt là ảnh không tương
đồng và phần nhiễu riêng của X; theo Y trong tổng thể (Xị,X¿, , X;)
Ta có
Y'D(X; — PyX;) = 0 vì X; - PyX; có các cột Lp.M1(Y) hay Y'DX„,=0
hay X'y,DY = 0
Suy ra Xy, DX4, = Xh, DYNTD,,S} = 0, và X'y,DXp, = Xy,D(PyX -
X4,) = Xy,D(¥Y(Y'DY) Y'DX; — X4,) = 0.
Trang 10CHƯƠNG 4 PHÂN TÍCH SỰ PHỤ THUỘC GIỮA MỘT MA TRẬN VỚI L MA TRẬN54
Tóm lại, ta được:
X\ DY = 0, Xy.DX4, = 0,X\,DXp, = 0 (4.30)
Từ (4.27), (4.29) va (4.30) ta có:
Tr(X/DX;M,) = Tr(X/4,DX4,M;) + Tr(X,DX7,M,)
= Tr(X/, DX 4,M,) + Tr(Xp, DX p,Mi) + Tr(Xy, Dy, Mi)
C31)
Tính chất 4.4.1
Xà =(Xà, Xà), Xp = (Xp, Xp,),Xv = (XM, XM)
Chứng mỉnh Ta đã chứng mình Xà (Xa, ` X4,) ở hệ thức (4.23)
Suy ra
Xp=PyX-X¿
= (PyXị - Xa, PyX: — X4,) (4.32)
= (Xp, -Xp,)
va
Xy=X-—PyX
= (KX; —- PyX, X; - PyX)) (4.33)
= (Ky Xx)
Vay
X=X4+Xp+Xy
(4.34)
Trang 11CHƯƠNG 4 PHÂN TÍCH SỰPHỤ THUỘC GIỮA MỘT MA TRẬN VỚI L MA TRẬN55
Tính chất 4.4.2 7% có guan bệ sau đây giữa chi số tương đồng tổng tbể của (Xì, ,Xị) theo Y tới các cbỉ số tương đồng riêng của titng X; theo
Ye
- > Sa
LAT (x,.M,.D)}.-1, (¥.N.D)] Ti(X/DXM) LÀI?[(x.,M.,D),(Y,N,D)J
Chitng minh Ti tinh chat 2.5.2 ta có:
ỉ
Cov?(XMa), YNb!)) = So Cov?(X;Miajj, YNb”) (= An)
i=l
l
= /j ? Var(XMaU) = So pi; Var(XiMiai;) N) Si mua jửi
i=1
L
<=> Tr(X/,DX4M) = S*1r(X4,,DK4,M;) (tv (4.13), (4.26)
1
Vay
Tr(X!,DX 4M) >? Tr(X!, DX4,M;)
_ Sy Tr(X/y, DX 4, Mi) Tr(X!DX;M,)
TX/DXM,) T(XĐXM)
Hay
1 r(X;DX,M,)
LAI(((X,.M,.Đ)),-¡ ,(Y.N.D) si T(X'DXM) LAIP((X M.,D).(Y,N,Ð))
Tr(XDX.M,) —
4.5 Tinh chất của các thành phần
Gọi YNBP) = thành phần chính (khi ta nhằm vào ma trận dữ liệu Y)
X,M¡a;; = thành phần thứ ¿ kết hợp với thành phần chính YNb0), (7 =1, ,m)( =1, ,!) m là số tối đa các bước trong cực đại hóa
Trang 12CHUONG 4 PHAN TICH SỰ PHỤ THUỘC GIỮA MỘT MA TRẬN VỚI L MA TRẬN56
Tính chất 4.5.1 Ti? tinh chdt al,,MiA;Nb\ = 0 (h > j) ở §2.5 chương 2,
ta co:
Cov(YNbĐ),X;M;aj„) =0 Wh >j,Vi=1, ,L
Tinh chat 4.5.2 Qudn tinh ciia hinh chiéu Xu, Miai (hic Var(X 4, Miaij))
= Độ) Var(X,M¡a,,) (ø¡¡ là bệ số tương quan giữa YNbÔ) vai XiMiaiz)
Chitng minh Ta co:
Var(X 4,Miai;) = Var(YNTD,,S/M;a¡;)
= Var(9;;YNb”)) = đ? Var(YNbU))
_ Cov?(X;Miaij, YNb"))
Var(YNb""))
= ph Var(X;M;a;;)
Tinh chat 4.5.3 Tir tinh chat 2.5.2 ta co:
L
Cov?(YNb!), XMa")) = $> Cov?(YNbY, X;Miaij) (= XZ)
i=1
pe Var(XMa¥)) = 7 Var(X;Mjaij) Vj =1, ,m
i=l
(p; là bệ số tương quan giữa YNb”) va XMa") ), trong do
Var(X4Ma")) = p; Var(XMa8)) (chiing minh titong tut tinh chat 4.5.2)
Đóng góp toàn phần cho sự phụ thuộc giữa Y và XMSS” sẽ là
Š` g7 Var(XMa0)) = Tr(XDXAM)
j=l
Trang 13CGHƯƠNG 4 PHÂN TÍCH SỰ PHỤ THUỘC GIỮA MỘT MA TRẬN VỚI L MA TRANS7
Vậy có phân tích quan trọng sau đây:
mm
So 9; pj Var( (XMa rp, Var(X;Myjaj;)
m
Kết quả quan trọng: lượng max” Độ Var(X;M;a¡;)) cho phép chỉ ra ma
trận X; nào (¡ = 1, ,!) có đóng góp nhiều nhất vào mối phụ thuộc tổng thể
của Y với (Xị, X¿) Ma trận dữ liệu X; đạt được max nói trên chính là
ma trận X; có cấu trúc gần gũi nhất với cấu trúc của ma trận Y Tiêu chuẩn dùng lượng max đó có thể dùng để chọn ra ma trận X; (trong số Xị, X¿)
“có tác động nhiều nhất” đến ma trận Y: đó là bài toán cbọn biến với các biến ma trận
m
Tính chất 4.5.4 7% 4.26, các giá trị Ề `øÿ Var(X;M¡aj) chính là tử số
j=l
Tr(X/, DX 4,Mj) trong chi s6 LAIp riêng
Tr(X!,, DX 4,Mi)
LAT pi¢x,,M.,D),(Y.N.D)] = cost.) (Xi Xai = “TXX'DXM)
Tinh chat 4.5.5 Thanh phdn XMa") Ia trung binh trong luong ctia cdc thanh phdn X;Mijaj;, tic
1 XMav) =), [ij Xi Miaay
i=1
_ Cov(XiMyayj, YNbY)) 084% S4 = _
vig
VOL [ig =
1ˆ Gw(XMaU),YNbU)) a