Một thước đo khác của hiện tượng đa cộng tuyến là nhân tử phóng đại phương sai gắn với biến Xi, ký hiộu là VIF(Xj).
VIF(Xị) được thiết lập trên cơ sở của hệ số xác định R2j trong hồi quy của biến Xj với các biến khác như sau:
VIF(Xj) = — L_. (5.15)
1- R ị
Nhìn vào công thức (5.15) có thổ giải thích VIF(Xi) bằng tỷ số cùa phương sai thực của Pi trong hồi quy gốc của Y đối với các biến X và phương sai cùa ước lượng Pi trong hồi quy mà ở đó Xj trực giao với các biến khác.Ta coi tình huống lý tưởng là tình huống mà trong đó các biến độc lập không tương quan với nhau, và VIF so sánh tình huống thực và tình, huống lý tưởng. Sự so sánh này không có ích nhiều và nó không cung cấp cho ta biết phải làm gì với tình huống đó. Nó chỉ cho biết ràng tình hình là không lý tưởng.
ĐỒ thị của mối liên hộ eủa R2i và VIF như chỉ ra ở hình 5.2
0
Hình 5.2
Như hình vẽ chỉ ra khi R2j tăng từ 0,9 đến 1 thì VIF tãng rất mạnh. Khi R2ị = 1 thì VIF là vô hạn.
Có nhiều chương trình máy tính có thể cho biết VIF đối với các biến độc lập trong hồi quy.
6. Độ đo T heil
Khía cạnh chủ yếu của VIF chỉ xem xét đến tương quan qua lại giữa các biến giải thích. Một độ đo mà xem xét tương quan của biến giải thích với biến được giải thích là độ đo Theil. Độ đo Theil được định nghĩa như sau:
m = R2 - Ề ( R 2 - R Ỉ i ) i=2
Trong đó R2 là hộ số xác định bội trong hồi quy của Y đối với các biến x 2, X}, .... Xk trong mô hình hồi quy:
Yj = Pi + P2X2Ì + P.iXjì + ... + PkXki + ụ
R2.i là hệ số xác định bội trong mô hình hồi qui của biến Y đối với các biến X2,
X3, ... , x i-1, Xj+| ,... ,X|[
Đại lượng R2 - JR2.| được gọi là "đóng góp tăng thồm vào" vào hệ số xác định bội. Nếu X2, Xj... . Xk không tương quan với nhau thì m = 0 vì những đóng góp tăng thêm dó cộng lại bằng R2 . Trong các trường hợp khác m có thể nhận giá trị âm hoặc dương lớn.
Để thấy được độ đo này có ý nghĩa, chúng ta xét trường hợp mô hình có hai biến giải thích Xỉ và x 3. Theo ký hiệu đã sừ dụng ở chương trước ta có:
m = R2 - (R2 - r212) - (R2 - r213) Tỷ số t liên hộ với tương quan riêng r 123 , r 132
Trong phần hồi quy bội ta đã biết:
R 2 = Ĩ2|2 + (1 - Ĩ2|2) r2i3,2 R 2 = Ĩ2J3 + ( 1 - r 2u ) r 2i2,3 Thay 2 công thức này vào biểu thức xác định m ta được:
m - R2 - [r2!2 + (1 - ĩ 2 n) r2|3,2 - r2)2] - [r2|3 + (1 - r2|í) r2i2,3 - r'i3 ]
= R - [(1 - r 12) r213,2 + (1 ■ r2n) r2i2,3 ] (5.17) Công thức (5.17) cho ta biết điều gì? Để thấy được điều đó ta hãy đặt 1 - r2|2 = w2 ; 1 - r2|j = w3 và gọi là các trọng số. Công thức (5.17) được viết lại dưới dạn
m = R2 - [w2 r2|3,2 + w3 r2|2.j]
Như vậy độ đo Theil bằng hiộu giữa hộ số xác định bội và tổng có trọng sô' của các hệ số tương quan riêng.
Thí dụ: Giả sừ các hệ số tương quan giữa các biến Y và Xì, x 3 là như sau:
Y X2 . X,
Y 1,00 0,95 0,95
X2 0,95 1,00 0,97
X, 0,95 0,97 1,00
Để tính được độ đo Theil ta phải tính được R2 và r2|2,Ị , r2ii.2 -Theo công thức đã biết ở chị ương hồi quy bội ta có:
2 _ ( r!3 ~ ri2r23) 2 _ (0,95-0,95 * 0 , 9 7 ) 2 _
V ” ( l - r ,22) ( l - r 223) (1 -0 ,9 52 )(1 - 0 ,9 7 2) r2,3.2 = r2|2,3 ; r2 ,3 = (0,95)2 = 0,9025
R2 = r2,2 + (1 - r2iĩ)r 13,2 = (0,95)2 + (1 - 0,952)0,14
* 0,916
Vậy m = 0,916 - 2[l - 0,9025]*0,14 = 0,888.
Do đó độ đo của Theil về mức độ đa cộng tuyến là 0,888.
Tuy nhiên chúng ta vẫn không thể ưả lời được câu hỏi “tính cộng tuyến có nghiêm trọng không?”.
Như vậy trên đây chúng ta đã thảo luận một số độ đo đa cộng luyến nhưng tất cả đều có ý nghĩa sừ dụng hạn chế. Chúng chỉ cho ta những thông báo rằng sự viộc không phải là lý tưởng.
Còn một sô' dộ đo nữa nhưng liên quan đến giá trị riêng hoặc thống kê Bayes chúng ta không trình bày ở đây.
5.6. BIỆN PHÁP KHẮC PHỤC
Vấn đề đặt ra là nếu đa cộng tuyến là nghiêm trọng thì ta có thể làm gì? cũng như trong trường hợp trên, chúng ta cũng không có những biện pháp hoàn hảo bời vì đa cộng tuyến cơ bản là vấn đề mẫu. Tuy nhiôn những quy tắc ngón tay cái có thể đơợc áp dụng ở đây, còn sự thành công lại phụ thuộc vào tính nghiêm trọng của
1. s ử dung thông tin tiên nghiệm
Một trong các cách tiếp cân để giải quyết vấn đề đa cộng tuyến là phải tận dụng thông tin tiẽn nghiêm hoặc thông tin từ nguồn khác để ước lượng các hệ sổ riêng.
Thí dụ: Ta muốn ước lượng hàm sản xuất cùa một quá trình sản xuất nào đó có dạng:
Q, = ALalKp,eu (5.17)
Trong đó Q, là lượng sản phẩm được sản xuất thời kỳ t; L, lao động thời kỳ t;
K, vốn thời kỳ t; u, là nhiễu; A, a , p là các tham sô' mà chúng ta cần ước lượng.
Lấy ln cả hai vế (5.17) ta được:
lnQ, = lnA + alnL, +PKt ụ Đặt lnQ, = Q*1; lnA = A* ; lnL, = L*,
ta được Q*t = A* + O.L*, + PK*, + u, (5.18)
Giả sử K và L có tương quan rất cao đĩ nhiên điều này sẽ dẫn đến phương sai của các ước luợng của các hệ số co giãn của hàm sản xuất lớn.
Giả sử từ một nguồn thông tin khác nào đó mà ta biết được rằng ngành công nghiệp này thuộc ngành có lợi tức theo quy mô không đổi nghĩa là
a + p = 1. Với thông tin này, cách xử lý cùa chúng ta sẽ là thay p = 1 - a vào (5.18) và thu được:
Q \ = A* + ocL\ + (1 -<x)K\ + u (5.19) Từ đó ta được Q*| - K*ị = A* + a(L*t - K*1) + U
Đặt Q*t - K*, = V , và L*( - K*, = z \ ta được
Yt = A* + az\ + u,
Thổng tin tiên nghiệm đã giúp chúng ta giảm số biến độc lập trong mô hình xuống còn 1 biến z t
Sau khi thu được ước lượng á của a thì p tính được từ điều kiện p = 1 - d