Sự cộng tuyến giữa các biến độc lập multicolinearity Có sự tương quan lớn giữa các biến độc lập Các hệ số đo lường ảnh hưởng phối hợp Dẫn đến các hệ số không ổn định khi chúng ta
Trang 1Sự cộng tuyến giữa các biến độc lập (multicolinearity)
Có sự tương quan lớn giữa các biến độc lập
Các hệ số đo lường ảnh hưởng phối hợp
Dẫn đến các hệ số không ổn định khi chúng ta
thêm các biến vào mô hình hồi qui Dấu của các
hệ số có thể đảo ngược
Luôn tồn tại, nhưng ở các mức độ ít nhiều quan
trọng
Qui tắc kinh nghiệm:
Tính tất cả các sự tương quan giữa các biến độc lập
Nếu không có hệ số tương quan nào giữa các biến
độc lập vượt quá 0.8 và tương quan giữa biến phụ thuộc và các biến độc lập lớn hơn tương quan giữa các biến độc lập, coi như không có đa cộng tuyến
Trang 2Kiểm tra đa cộng tuyến
(Tolerance)
Đối với biến Xj , dung sai bằng 1-Rj2 với Rj là hệ số xác định của biến Xj được hồi qui bởi tất cả các biến độc lập khác
Các giá trị nhỏ của dung sai chỉ ra có hiện tượng đa cộng tuyến Một giá trị dung sai bằng 0.10 tương ứng với một sự tương quan bội 0.95 Đó là giá trị giới hạn mà chúng ta giữ lại mô hình
Để xác định các biến có liên quan, cần phải giữ lại các biến này của mô hình để chú ý đến việc thực hiện các phép
Trang 3Coefficients a
70015,462 5900,669 11,866 ,000 72,500 2,880 ,716 25,172 ,000 ,995 1,005 -1657,031 108,867 -,433 -15,221 ,000 ,995 1,005
(Constant)
surface
age
Model
1
B Std Error
Unstandardized Coefficients
Beta
Standardi zed Coefficien ts
t Sig Tolerance VIF
Collinearity Statistics
Dependent Variable: prix
a
Kiểm tra đa cộng tuyến
(Tolerance)
tiếp
Trang 4ĐA CỘNG TUYẾN
Trang 5ĐA CỘNG TUYẾN
thích
Trang 6Bản chất và hậu quả của đa
cộng tuyến
Một trong giả thiết quan trọng của mô hình hồi qui bội là không tồn tại đa
cộng tuyến.
Vậy, bản chất của đa cộng tuyến là gì?
Nguyên nhân của đa cộng tuyến là gì?
Nếu vi phạm giả thiết này sẽ gây ra
hậu quả như thế nào?
Trang 7Bản chất của Đa cộng tuyến
Đa cộng tuyến có nghĩa là tồn tại mối liên hệ tuyến tính “hoàn hảo” giữa vài hoặc tất cả các biến giải thích trong mô hình hồi quy bội Hoặc, có thể nói trong mô hình hồi quy K biến (X1,
X2 XK) tồn tại đa cộng tuyến nếu điều kiện sau được thỏa mãn
n 1, i
0 X
k
1 j
ji
Trong đó: 1, 2 k là các hằng số và không đồng thời bằng 0
Trong đó: v là sai số ngẫu nhiên
n 1, i
0 v
X i
1 j
ji j
k
Trang 8Ví dụ
a) X1 X2 X3 b) Y X2 X3
X 2
X3i 2i X3i 2X2i vi
Trang 9Nguyên nhân
Phương pháp thu thập số liệu: ví dụ, mẫu vượt qua dãy giới hạn của biến giải thích trong tổng thể
Mối quan hệ ràng buộc trong mô hình hay trong tổng thể: Ví dụ: Thường những gia đình có thu nhập cao
thường có giá trị tài sản lớn
Do chỉ định mô hình: ví dụ, bậc trong đa thức quá lớn trong khi dãy số liệu của X nhỏ
Mô hình không xác định: ví dụ, số biến giải thích trong
mô hình vượt quá số quan sát
Các biến giải thích cùng xu thế biến động: ví dụ, trong dãy số thời gian, khi các biến giải thích cùng có xu thế tăng hay giảm
Trang 10Hậu quả của đa cộng tuyến
Đa cộng tuyến hoàn hảo
Khi có đa cộng tuyến hoàn hảo thì ma trận (X ’ X)
là ma trận suy biến Vì thế, ma trận nghịch đảo của nó (X ’ X) -1 không tồn tại Chính vì vậy, ma trận các hệ số hồi qui và ma trận phương sai và hiệp phương sai không tồn tại
Đa cộng tuyến gần hoàn hảo
Trong tình huống này, ma trận (X T X) -1 tồn tại,
chính vì vậy ta xác định được ma trận các hệ số hồi qui và ma trận phương sai và hiệp phương sai Tuy nhiên, trong trường hợp đa cộng tuyến gần hoàn hảo thì chúng ta có thể gặp một số hậu quả
Trang 11Trường hợp đa cộng tuyến
không hoàn hảo
Các ước lượng bình phương bé nhất có phương sai
và hiệp phương sai lớn
Dấu của các hệ số hồi qui được ước lượng có thể sai
Tỷ số t mất ý nghĩa
Khoảng tin cậy của các tham số hồi qui rộng
Trang 12Phương pháp phát hiện đa cộng tuyến
Có nhiều phương pháp phát hiện đa
cộng tuyến:
Dùng hệ số tương quan cặp giữa các biến giải thích
Hồi qui phụ
Độ đo Theil…
Hệ số xác định và tỷ số t
Trang 13Dùng hệ số tương quan cặp
Thực hiện tính các hệ số tương quan cặp giữa các biến giải thích rXpXj theo công thức sau:
2 j ji
2 p pi
j ji
p pi
) X X
( )
X X
(
) X X
)(
X X
( r
j x p x
Nếu r XjXp >0,8 T → T ồn tại cộng tuyến
Trang 14Dùng nhân tử phóng đại
phương sai
Khi có đa cộng tuyến, Rj2 (hệ số xác định trong hồi qui của biến
X j với các biến giải thích còn lại) sẽ lớn nên nhân tử phóng đại
sẽ lớn Chính vì vậy, các nhà kinh tế lượng thường dùng VIFj
để phát hiện đa cộng tuyến
Chỉ tiêu VIF gắn với biến Xj được tính như sau:
VIF(X j )=1/(1-R j2 )
ở đây R i2 đo lường R 2 của mô hình hồi quy giữa X i với các biến X khác
có hiện tượng đa cộng tuyến nghiêm trọng VIF(Xi)>5
Trang 15Hồi qui phụ
Hồi qui phụ là hồi qui giữa một biến giải thích Xj nào đó
theo các biến giải thích còn lại
n ,1 i v X
X X
X
Xji 1 2 2i j1 (j1 i) j1 (j1i) k ki i
0 R
: H
; 0 R
:
j 1
2 j
) 1 k n ( ) R 1 (
) 2 k (
R
j
2 j j
Cho , tra bảng tìm F[(k-2),(n-k+1)]
Nếu Fj > F[(k-2),(n-k+1)] → Không chấp nhận Ho: tức là có hiện tượng cộng tuyến
Ngược lại, thực hiện hồi qui phụ khác
Trang 16Hệ số tương quan cặp
Công thức tính:
lớn (vượt 0,8) thì có hiện tượng đa cộng tuyến
tương quan giữa 2 biến giải thích đó mà nhỏ thì
không có hiện tượng cộng tuyến
2
) (
) )(
(
p pi
j ji
p pi
j ji
X X
X X
X X
X
X
r x p
j x
Trang 17Biện pháp khắc phục đa cộng tuyến
Ta có rXjXp>0 ,8 Bỏ 1 trong 2 biến này → T
Cách thực hiện
Nếu Rp2 > Rj2 Nên bỏ Xp
Trang 18Biện pháp khắc phục đa cộng tuyến
Yi = 1 + 2X2i + 3X3i + ui i=1…n
Trong đó: Giữa X2 và X3 có cộng tuyến cao
Giả sử có thông tin 3 = 0,12
Cách biến đổi như sau:
Yi = 1 + 2X2i + 0,12X3i + ui = 1 + 2 (X2i + 0,1X3i) + ui Đặt
Xi = X2i +0,1X3i