Chương 5 đề cập đến hiện tượng đa cộng tuyến. Các nội dung chính được trình bày trong chương này gồm có: Bản chất, nguyên nhân của đa cộng tuyến; ước lượng các tham số; hậu quả; phát hiện đa cộng tuyến; khắc phục đa cộng tuyến. Mời các bạn cùng tham khảo.
Trang 1HIỆN TƯỢNG ĐA CỘNG TUYẾN
(MULTICOLLINEARITY)
CHƯƠNG 5
HIỆN TƯỢNG ĐA CỘ
(MULTICOLLINE
Đa cộng tuyến
Hi ể u b ả n ch ấ
1
MỤC
cộng khắc
hiệ n đa
tuyến phục
và biện pháp
2
NỘI DUNG
Bản chất, nguyên nhân của đa cộng tuyến
1
Ước lượng các tham số
2
3 Hậu quả
Phát hiện đa cộng tuyến
4
Khắc phục đa cộng tuyến
5
3
5.1 Bản chất của đa cộng tuyến
Đa cộng tuyến Trong mô hình hồi quy bội
β ˆ β ˆ2 β ˆ3 3iX β ˆk kiX
Yi 1 X2i
4
Có sự phụ thuộc tuyến tính cao giữa các biến giải thích
5.1 Bản chất của đa cộng tuyến
a Đa cộng tuyến hoàn hảo
Tồn tại λ2, λ3,… λkkhông đồng thời bằng 0
sao cho
λ2X2+ λ3X3+ …+ λkXk= 0
b Đa cộng tuyến không hoàn hảo
λ2X2+λ3X3+ …+λkXk+ vi= 0
với vilà sai số ngẫu nhiên
5
6.1 Bản chất của đa cộng tuyến
VD
V
52 2 75 0 97 7 129 9 152 2
X3i= 5X2i, có cộng tuyến hoàn hảo giữa X2và
X3; r23= 1
6
Trang 26.1 Bản chất của đa cộng tuyến
Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến
7
6.1
cộng
Bản chất của đa cộng tuyến
X3
X3
Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến
8
6.1 Nguyên nhân của đa cộng tuyến
- Chọn các biến độc lập có mối quan có
quan hệ nhân quả hay có tương quan cao
vì đồng phụ thuộc vào một điều kiện khác
- Số quan sát nhỏ hơn số biến độc lập
- Cách thu thập mẫu: mẫu không đặc trưng
cho tổng thể
- Chọn biến Xicó độ biến thiên nhỏ
9
6.2 Ước lượng khi có đa cộng tuyến
1 Trường hợp có đa cộng tuyến hoàn hảo Xét mô hình hồi qui 3 biến dưới dạng sau:
Yi= β2X2i + β3X3i+ ei
được
= λX2i, mô hình
thành:
Yi= (β2+ λβ3)X2i + ei=β0X2i+ ei
∑x2
βˆ = (βˆ + λβˆ ) =o 2 3
2i
ˆ ˆ
β2, β3
� Không thể tìm được lời giải duy nhất cho
10
6.2 Ước lượng khi có đa cộng tuyến
∑ yx2 ∑ x3 −2∑ yx3∑ x2x3
β =2
x x x x2i 3i
λ ∑
λ2
yix3i∑ x32i−λ ∑ yix3i∑ x3ix3i
0 0 ˆ
∑ 3 2i∑ 2 2∑ 3 2i∑ 2
x − λ
x 3i x x3i
� Các hệ số ước lượng không xác định
là vô hạn
11
6.2 Ước lượng khi có đa cộng tuyến
2 Trường hợp có đa cộng tuyến không hoàn hảo
Đa cộng tuyến hoàn hảo thường không xảy ra trong thực tế
Xét mô hình hồi qui 3 biến dưới dạng sau:
�
�
yi= β2x2i + β3x3i+ ei
= λ Giả sử x3i x2i+ vi
Với λ ≠ 0 và vilà sai số ngẫu nhiên
12
Trang 36.2 Ước lượng khi có đa cộng tuyến
( ∑y x i 2i) (λ 2 ∑x2 2i + ∑v2i)−(λ 2 ∑y x + yv i 2i ∑ )(i i λ x2 ∑ ) 2i
ˆ
β =
2
v2)− (λ 2
)2 2
∑x2 2i ∑x2 2i +∑ i ∑x2 2i
� Có thể ước lượng được các hệ số hồi
quy nhưng sai số chuẩn rất lớn
13
6.3 Hậu quả của đa cộng tuyến
Nếu có cộng tuyến gần hoàn hảo
� Phương sai và hiệp phương sai của các ước lượng OLS lớn
� Khoảng tin cậy rộng hơn
� Tỉ số t "không có ý nghĩa"
14
6.3 Hậu quả của đa cộng tuyến
5 Các ước lượng OLS và sai số chuẩn của
chúng trở nên rất nhạy với những thay
đổi
Dấu
qui
nhỏ trong dữ liệu
của các ước lượng của các hệ số hồi
có thể sai
6
7 Thêm vào hay bớt đi các biến cộng tuyến
với các biến khác, mô hình sẽ thay đổi
về dấu hoặc thay đổi về độ lớn của các
ước lượng
15
6.3 Hậu quả của đa cộng tuyến
Đa cộng tuyến là một hiện tượng theo mẫu, nghĩa là cho dù các biến độc lập
tổng thể nhưng quan tuyến tính
quan tuyến tính trong chúng có thể tương trong một mẫu cụ thể nào đó Do đó cỡ mẫu lớn thì hiện tượng đa cộng tuyến ít nghiêm trọng hơn cỡ mẫu nhỏ
16
6.4 Cách phát hiện đa cộng tuyến
1
2
Tương quan cặp giữa các biến giải
thích cao
3
4
Sử dụng
Sử dụng
(VIF)
mô hình hồi qui phụ
yếu tố phóng đại phương sai
17
6.4 Cách phát hiện đa cộng tuyến
lớn nhưng tỷ số t nhỏ 1
2
R2
Tương quan cặp giữa các biến giải thích cao
∑(X i−X)(Z i− )
=
r XZ
∑ Z
(X −X)2(Z −Z)2
i
2
i
thích Trong đó
hình
Trang 46.4 Cách phát hiện đa cộng tuyến
3 Sử dụng mô hình hồi quy phụ
Hồi qui một biến giải thích X theo các biến còn lại
ˆ =β
1+β3X + + β k X
2
(n −
F =
2
(1 − R )(m − 1 )
Nếu F > Fα(m-1,n-k):
Nếu F < Fα(m-1,n-k):
cộng tuyến
19
6.4 Cách phát hiện đa cộng tuyến
4 Sử dụng nhân tử phóng đại phương sai (VIF) Đối với hàm hồi quy 2 biến giải thích
1
VIF =
r2
(1 − 23)
Đối với trường hợp tổng quát, có (k-1)
1
biến giải thích
VIF=
R2
biến giải thích còn lại
�Thông thường khi VIF > 10, thì biến này được coi là
có cộng tuyến cao
20
6.5 Cách khắc phục
1 Dùng thông tin tiên nghiệm
Ví dụ mô hình sản xuất Cobb-Douglas
Ln(Yi)=β1+ β2ln(Ki)+ β3ln(Li) + ui Có
thể xảy ra đa cộng tuyến do K và L cùng tăng
theo quy mô sản xuất Nếu biết hiệu suất
quy mô tức là β2+β3=1 thì
không đổi theo
Ln(Yi)=β1+ β2ln(Ki)+ (1-β2)ln(Li) + ui
= β1+ β2[ln(Ki) - ln(Li)]
+ β2ln(Ki/Li) + ui
Ln(Yi) – Ln(Li)
Ln(Yi/Li) = β1
+ ui
=> mất đa cộng tuyến (vì đây là mô hình hồi
quy đơn)
21
6.5 Cách khắc phục
2 Loại trừ một biến giải thích ra khỏi mô hình
B1: Xem cặp biến giải thích nào có quan hệ chặt chẽ Giả sử X2, X3…Xklà các biến độc lập, Y là biến phụ thuộc và X2, X3có tương quan chặt chẽ với nhau
cả 2 biến; không có mặt một trong 2 biến B3: Loại biến mà giá trị R2tính được khi không có mặt biến đó là lớn hơn
22
6.5 Cách khắc phục
3 Bổ sung thêm dữ liệu hoặc chọn mẫu mới
2
σ
∑ 2
2i
2 (1−
x r )23
23
6.5 Cách khắc phục
4 Dùng sai phân cấp
Có hàm hồi qui: yt= α1
suy ra
1 + β1x1t+β2x2t+ ut
= α1 + β1x1,t-1 β2x2,t-1
Trừ hai vế cho nhau, được:
yt– yt
(ut– ut
Hay:
– –
1)
∆yt= β1∆x1,t+ β2∆ x2,t+ et,
24