ĐA CỘNG TUYẾN Multicolinearity Bản chất và hậu quả của Đa cộng tuyến Bản chất và nguyên nhân của Đa cộng tuyến Hậu quả của hiện tượng đa cộng tuyến Phát hiện đa cộng tuyến Hệ số
Trang 1ĐA CỘNG TUYẾN
Trang 2ĐA CỘNG TUYẾN (Multicolinearity)
Bản chất và hậu quả của Đa cộng tuyến
Bản chất và nguyên nhân của Đa cộng tuyến
Hậu quả của hiện tượng đa cộng tuyến
Phát hiện đa cộng tuyến
Hệ số xác định lớn những tỷ số t kém ý
nghĩa
Dùng nhân tử phóng đại phương sai
Dùng hệ số tương quan cặp giữa các biến giải thích
Hồi qui phụ
Biện pháp khắc phục
Trang 3Bản chất và hậu quả của đa
cộng tuyến
Một trong giả thiết quan trọng của mô hình hồi qui bội là không tồn tại đa
cộng tuyến.
Vậy, bản chất của đa cộng tuyến là
gì?
Nguyên nhân của đa cộng tuyến là gì?
Nếu vi phạm giả thiết này sẽ gây ra
hậu quả như thế nào?
Trang 4Bản chất của Đa cộng tuyến
Đa cộng tuyến có nghĩa là tồn tại mối liên hệ tuyến tính “hoàn hảo” giữa vài hoặc tất cả các biến giải thích trong mô hình hồi quy bội Hoặc, có thể nói trong mô hình hồi quy K biến (X1,
X2 XK) tồn tại đa cộng tuyến nếu điều kiện sau được thỏa mãn
n 1, i
0 X
k
1 j
ji
j = ∀ = λ
∑
=
Trong đó: λ1, λ2 λk là các hằng số và không đồng thời bằng 0
Trong đó: v là sai số ngẫu nhiên
n 1, i
0 v
X i
1 j
ji j
k
=
∀
= +
λ
∑
=
Trang 5Ví dụ
0 X
X 2 X
0
X 2 X
i 3 i
2 i
1
i 2 i
3
= +
−
=
0 v
X X
2 X
0
v X
2 X
i i
3 i
2 i
1
i i
2 i
3
= +
+
−
+
=
Trang 6Nguyên nhân
Phương pháp thu thập số liệu: ví dụ, mẫu vượt qua dãy giới hạn của biến giải thích trong tổng thể
Mối quan hệ ràng buộc trong mô hình hay trong tổng thể: Ví dụ: Thường những gia đình có thu nhập cao thường có giá trị tài sản lớn
Do chỉ định mô hình: ví dụ, bậc trong đa thức quá lớn trong khi dãy số liệu của X nhỏ
Mô hình không xác định: ví dụ, số biến giải thích trong
mô hình vượt quá số quan sát
Các biến giải thích cùng xu thế biến động: ví dụ, trong dãy số thời gian, khi các biến giải thích cùng có xu thế tăng hay giảm
Trang 7Hậu quả của đa cộng tuyến
tồn tại Chính vì vậy, ma trận các hệ số hồi qui và ma trận phương sai và hiệp phương sai không tồn tại
vậy ta xác định được ma trận các hệ số hồi qui và ma trận phương sai và hiệp phương sai Tuy nhiên, trong trường hợp đa cộng tuyến gần hoàn hảo thì chúng ta
có thể gặp một số hậu quả khác
Các hệ số không ổn định khi chúng ta thêm các biến
vào mô hình hồi qui Dấu của các hệ số có thể đảo
ngược
Trang 8Trường hợp đa cộng tuyến
không hoàn hảo
Các ước lượng bình phương bé nhất có phương sai và hiệp phương sai lớn
Dấu của các hệ số hồi qui được ước
lượng có thể sai
Tỷ số t mất ý nghĩa
Khoảng tin cậy của các tham số hồi
qui rộng
) b ( Se t
b )
b ( Se t
) k n ( 2
j j
j )
k n ( 2
j
−
α
−
−
Trang 9Phương pháp phát hiện đa cộng tuyến
Có nhiều phương pháp phát hiện đa
cộng tuyến:
Dùng hệ số tương quan cặp giữa các biến giải thích
Hồi qui phụ
Độ đo Theil, VIF …
Hệ số xác định và tỷ số t
Trang 10Dùng hệ số tương quan cặp
Thực hiện tính các hệ số tương quan cặp giữa các biến
∑ ∑ − ∑ −
−
−
=
2 j ji
2 p pi
j ji
p pi
) X X
( )
X X
(
) X X
)(
X X
( r
j x p x
Nếu | rXjXp | >0,8 T → ồn tại cộng tuyến
Nếu không có hệ số tương quan nào giữa các biến độc
lập vượt quá 0.8 và tương quan giữa biến phụ thuộc
và các biến độc lập lớn hơn tương quan giữa các biến độc lập, coi như không có đa cộng tuyến
Chúng ta cần chú ý rằng hiện tượng đa cộng
tuyến vẫn xảy ra khi các hệ số tương quan
Trang 11Dùng nhân tử phóng đại
phương sai
Khi có đa cộng tuyến, Rj2 (hệ số xác định trong hồi qui của biến Xj với các biến giải thích còn lại) sẽ lớn nên nhân tử phóng đại sẽ lớn Chính vì vậy, các nhà kinh
tế lượng thường dùng VIFj để phát hiện đa cộng tuyến
Chỉ tiêu VIF gắn với biến Xj được tính như sau:
VIF(Xj)=1/(1-Rj2)
ở đây Ri2 đo lường R2 của mô hình hồi quy giữa Xi với các biến X khác
⇒có hiện tượng đa cộng tuyến VIF(X)>5
Trang 12Kiểm tra đa cộng tuyến
(Tolerance)
tiếp
Trang 13Kiểm tra đa cộng tuyến
(Tolerance)
Đối với biến Xj , dung sai bằng 1-Rj2 với Rj là hệ số xác định của biến Xj được hồi qui bởi tất cả các biến độc lập khác
Các giá trị nhỏ của dung sai chỉ ra có hiện tượng đa
cộng tuyến Một giá trị dung sai bằng 0.10 tương ứng với một sự tương quan bội 0.95 Đó là giá trị giới hạn mà chúng ta giữ lại mô hình
Để xác định các biến có liên quan, cần phải giữ lại các
biến này của mô hình để chú ý đến việc thực hiện các phép biến đổi các biến
Trang 14Hồi qui phụ
Hồi qui phụ là hồi qui giữa một biến giải thích Xj nào đó
theo các biến giải thích còn lại
n ,1 i v X
X X
X
Xji = λ1 + λ2 2i + + λ j−1 (j−1 i) + λ j+1 (j+1i) + + λk ki + i ∀ =
0 R
: H
; 0 R
:
j 1
2 j
) (
) 1
(
) 2
(
2
2
k n R
k
R F
j
j j
−
−
−
=
Cho α, tra bảng tìm Fα[(k-2),(n-k)]
Nếu Fj > Fα[(k-2),(n-k)] → Không chấp nhận Ho: tức
là có hiện tượng cộng tuyến
Ngược lại, thực hiện hồi qui phụ khác
Trang 15Biện pháp khắc phục đa cộng tuyến
Thu thập thêm số liệu hoặc lấy mẫu mới
Bỏ biến
Ta có |rXjXp|>0 ,8 Bỏ 1 trong 2 biến này.→ Cách thực hiện
• Bỏ Xj, thực hiện hồi qui giữa Y và các biến
giải thích còn lại và tính hệ số xác định Rj2
• Bỏ Xp, thực hiện hồi qui giữa Y và các biến
giải thích còn lại và tính hệ số xác định Rp2
Nếu Rp2 > Rj2 Nên bỏ Xp
Trang 16Biện pháp khắc phục đa cộng tuyến
Chọn biến
Sử dụng thông tin tiên nghiệm
Yi = β1 + β2X2i + β3X3i + ui ∀ i=1…n
Trong đó: Giữa X2 và X3 có cộng tuyến
cao.
Giả sử có thông tin β3 = 0,1 β2
Cách biến đổi như sau:
Yi = β1 + β2X2i + 0,1 β2X3i + ui = β1 + β2 (X2i + 0,1X3i) + ui Đặt
Xi = X2i +0,1X3i Vậy, ta có: