Bài giảng Kinh tế lượng: Chương 5 - Các sai lầm cơ bản trong quá trình xây dựng mô hình hồi quy đa biến - Đa cộng tuyến giới thiệu tới các bạn khái niệm về đa cộng tuyến, nguyên nhân đa cộng tuyến, các hệ số ước lượng trong đa cộng tuyến cùng một số kiến thức khác.
Trang 1Đa cộng tuyến
TS Nguyễn Minh Đức
Đa cộng tuyến
(Multicollinearity)
Khái niệm Đa cộng tuyến:
l Là hiện tượng các biến độc lập có tương quan với nhau
l Mô hình lý tưởng khi các biến độc lập không tương quan
l Có thể có nhiều mức độ tương quan:
l Tương quan hoàn toàn (đa cộng tuyến hoàn hảo) r2
23=1
λ2X2+ λ3X3=0
X2= λX3
l tương quan không hoàn toàn (đa cộng tuyến không hoàn hảo)
λ2X2+ λ3X3+ v =0
v: sai số ngẫu nhiên
X2= λX3 + u
Trang 2Prepared by NMDUC 2009
Nguyên nhân:
đặc trưng
Các hệ số ước lượng:
Yi = β1 + β2 X2i + β3 X3i + ei
từng biến độc lập lên biến phụ
thuộc
l Không thể có giá trị duy nhất của
từng hệ số hồi quy, mặc dù có đáp
số duy nhất cho tổ hợp tuyến tính.
(Multicollinearity)
Trang 3Prepared by NMDUC 2009
l X2 = λX3
l không xác định
2
1 , 3 , 2 1
2 3 1
2 2
1 , 3 , 2 1
, 2 1
2 2 1
, 3
3
ˆ
−
−
=
∑
∑
∑
∑
∑
∑
∑
=
=
=
=
=
=
=
n
i i i n
i i n
i i
n
i i i n
i i i n
i i n
i
i i
x x x
x
x x x y x
x y
β
^ 3 2
1 , ˆ ,
ˆ β β
β
3
^ 3 2
^ 2
^
1 Y β X β X
2
1 , 3 , 2 1
2 3 1
2 2
1 , 3 , 2 1
, 3 1
2 3 1
, 2
2
ˆ
−
−
=
∑
∑
∑
∑
∑
∑
∑
=
=
=
=
=
=
=
n
i i i n
i i n
i i
n
i i i n
i i i n
i i n
i
i i
x x x
x
x x x x
x
β
l Có thể xác định được giá trị của các hệ số
hồi quy
(Multicollinearity)
Trang 4Prepared by NMDUC 2009
Hậu quả của đa cộng tuyến
l Phương sai, hiệp phương sai và sai số chuẩn là
vô hạn
=
) 1 (
23 2 2
2
^
2
r
x i
δ β
=
) 1 (
23 2 3
2
^ 3
r
xi
δ β
−
−
=
2 3 2 2 2
23
2 23
^
^
3 2
) 1 ( ,
cov
i
x r
r δ β
β
∑
−
=
2 2 23
^
) 1 ( ) (
i
i
x r
Hậu quả của đa cộng tuyến
l Khoảng tin cậy rộng hơn
l Xác suất chấp nhận giả thuyết H0-tăng (tăng sai lầm loại
II)
l R2cao, nhưng nhiều giá trị t thấp
l Hệ số ước lượng và sai số chuẩn rất nhạy cảm với
những thay đổi trong số liệu
l Dấu của các hệ số ước lượng có thể sai
l Thêm hay bớt biến cộng tuyến, sẽ có thay đổi về độ lớn
và dấu của các hệ số ước lượng.
(Multicollinearity)
Trang 5Prepared by NMDUC 2009
l Cách phát hiện đa cộng tuyến:
l Do đa cộng tuyến hoàn hảo rất hiếm khi xảy ra, trong
khi đa cộng tuyến không hoàn hảo xảy ra rất thường
xuyên cho nên ta thường xác định mức độ tương quan
chứ không xác định loại cộng tuyến.
l Các cách xác định đa cộng tuyến phổ biến:
1/ Dựa vào R2và t
2/ Xác định hệ số tương quan cặp giữa các biến độc lập
(>0.8)
3/ Hồi quy phụ: hồi quy một biến X theo các biến X còn lại
Cách khắc phục:
l Không có biện pháp hoàn hảo Phụ thuộc vào tính nghiêm trọng của
đa cộng tuyến và bản chất của số liệu mẫu Đôi khi áp dụng biện
pháp khắc phục không phù hợp sẽ dẫn đến sai lầm nghiêm trọng
hơn
1/ Sử dụng thông tin đã biết
2/ Tăng cỡ mẫu, hoặc lấy thêm mẫu mới: có thể mẫu mới có các biến
độc lập ít tương quan
3/ Bỏ bớt biến: dựa vào R2đểquyết định biến nên bỏ Tuy nhiên trong
những trường hợp không thể bỏ biến được thì nên cân nhắc giữa
sai lệch khi bỏ biến và việc tăng phương sai của các hệ số ước
lượng
4/ Sử dụng biến trễ
5/ Giảm tương quan trong hồi quy đa thức: các biến độc lập có bậc lũy
thừa khác nhau
6/ Khác: hồi quy thành phần chính, sử dụng các ước lượng từ bên
ngoài
(Multicollinearity)