Đa cộng tuyến – bản chất và nguyên nhânGiả thiết OLS: Các biến độc lập không có tương quan tuyến tính với nhau.. Giả thiết bị vi phạm khuyết tật Đa cộng tuyến * Nguyên nhân: - Mô hình
Trang 21 Đa cộng tuyến – bản chất và nguyên nhân
2 Hậu quả
3 Phát hiện
4 Khắc phục
Trang 31 Đa cộng tuyến – bản chất và nguyên nhân
Giả thiết OLS: Các biến độc lập không có tương quan tuyến tính với nhau
Giả thiết bị vi phạm khuyết tật Đa cộng tuyến
(*) Nguyên nhân:
- Mô hình có các biến không cần thiết hoặc có thông tin trùng lặp (bài tập 5.4: hồi qui lượng bán của 1 hãng phụ thuộc vào giá và lượng bán của hãng cạnh tranh , …)
- Các biến KT – XH trong cùng 1 lĩnh vực thường có quan hệ chặt chẽ với nhau (hồi qui sản lượng phụ thuộc vào vốn và lao động , GDP phụ thuộc vào IM và EX , …)
i i
k i
Y
Trang 41 Đa cộng tuyến – bản chất và nguyên nhân
(*) Phân loại:
- Đa cộng tuyến hoàn hảo (perfect multicolinearity): quan hệ giữa các biến độc lập là quan hệ hàm số tuyến tính:
- Đa cộng tuyến không hoàn hảo (imperfect multicolinearity) Quan hệ giữa các biến độc lập là quan hệ hồi qui tuyến tính
trong đó Vi là một sai số ngẫu nhiên
0
0
3
2
≠
∃
=
× +
+
× +
×
j
i k
i i
m
Xk m
X m
X m
0
3
2 × X i + m × X i + + m k × Xk i + V i =
m
Trang 51 Đa cộng tuyến – bản chất và nguyên nhân
(*) Ước lượng OLS khi có Đa cộng tuyến:
- Khi có đa cộng tuyến hoàn hảo (perfect multicolinearity): không thể ước lượng được các hệ số hồi qui cũng như không xác định được SRF
- Khi có đa cộng tuyến không hoàn hảo (imperfect multicolinearity): vẫn có thể ước lượng được các hệ số hồi qui và xác định SRF 1 cách duy nhất, tuy nhiên sẽ dẫn đến 1 số hậu quả trong phân tích hồi qui Đặc biệt khi mức độ cộng tuyến của các biến độc lập cao
Trang 62 Hậu quả:
-Các ước lượng vẫn là BLUE, tuy nhiên phương sai và hiệp phương sai của chúng tăng lên các ước lượng kém chính xác
- Khoảng tin cậy của các hệ số hồi qui rộng hơn thực tế
- Các kiểm định T mất ý nghĩa, đặc biệt là T- statistic của các hệ số góc thường mất ý nghĩa thống kê dẫn tới kết luận tồn tại các biến độc lập không cần thiết có mặt trong mô hình
- R2 lại tăng lên đáng kể
- Ước lượng OLS và các sai số chuẩn rất nhạy với sự thay đổi nhỏ trong số liệu
- Dấu của các ước lượng có thể bị sai (ví dụ: bài tập 5.4)
Trang 72 Hậu quả:
- Nguyên nhân phương sai và hiệp phương sai của các ước lượng tăng lên: Với hàm hồi qui 3 biến:
( variance inflating factor ) ( tolerance )
) 1
( 1
3 2
) 1
(
)
ˆ ,
ˆ cov(
) 1
( 3
)
ˆ
var(
) 1
( 2
)
ˆ
var(
2 23
1
2 1
2
2 23
2 23 3
2
1
2 23 2
2 3
1
2 23 2
2 2
r VIF
x x
r
r
r x
r x
n i
i
n i
i
n i
i
n i
i
−
=
−
−
=
−
=
−
=
∑
∑
∑
∑
=
=
=
=
σ β
β
σ β
σ β
j
j
VIF TOL = 1
Trang 82 Hậu quả:
- Ví dụ: Hồi qui chi tiêu hộ theo thu nhập và tài sản của hộ
Y – Chi tiêu hộ
X2 – Thu nhập hộ
X3 – Tài sản của hộ
Y, $ X2, $ X3, $
70
80 810
65 100 1009 90
120 1273
95 140 1425
110 160 1633
115 180 1876
120 200 2052 140
220 2201
155 240 2435
150 260 2686
Trang 9Dependent Variable: Y
Method: Least Squares
Sample: 1 10
Included observations: 10
Variable Coefficient Std Error t-Statistic Prob
R-squared 0.963504 Mean dependent var 111.0000 Adjusted R-squared 0.953077 S.D dependent var 31.42893 Log likelihood -31.58705 F-statistic 92.40196 Durbin-Watson stat 2.890614 Prob(F-statistic) 0.000009
2 Hậu quả:
Trang 103 Phát hiện:
3.1 R2 cao nhưng các tỉ số T không có ý nghĩa
R2 = 0,8 trở lên thường cho kết luận bác bỏ H0 khi kiểm định sự phù hợp của hàm hồi qui Tuy nhiên các tỉ số T lại cho thấy hầu hết các hệ số hồi qui không có ý nghĩa
3.2 Hệ số tương quan giữa các biến độc lập
Trường hợp hồi qui chính chỉ có 2 biến độc lập, ta có thể dùng hệ số tương quan giữa các biến độc lập này để kết luận về hiện tượng đa cộng tuyến ( > 0,8 )
3.3 Nhân tử phóng đại phương sai
VIF > 10 hoặc TOL càng gần với 0 thì mức độ cộng tuyến giữa các biến độc lập càng cao ĐCT nghiêm trọng
Trang 113 Phát hiện:
3.4 Hồi qui phụ (auxiliary regressions):
Hồi qui của 1 biến độc lập theo các biến độc lập còn lại trong mô hình
Hồi qui phụ:
Về kỹ thuật, có thể chọn bất cứ biến độc lập nào để đóng vai trò biến phụ thuộc trong hồi qui phụ, tuy nhiên trên thực tế, vấn đề này khá nhạy cảm và còn phụ thuộc vào kinh nghiệm của người nghiên cứu
) 1 (
3
2
Y = β + β + β + β +
) 2 (
3
2 i m 1 m 2 X i m k 1 Xk i V i
) 3 ( 3
2 i m 1 m 2 X i V i
Trang 123 Phát hiện:
3.4 Hồi qui phụ (auxiliary regressions):
(*) Sử dụng (2) để kiểm tra (1)
H0: (1) không có Đa cộng tuyến
H1: (1) có Đa cộng tuyến
) 2 (
3
2 i m 1 m 2 X i m k 1 Xk i V i
→
≠
=
0 :
0
:
2 2 1
2 2 0
R H
R
H
Tiêu chuẩn kiểm định:
Miền bác bỏ H0:
) 1 (
) 1
(
) 2
(
2 2
2 2
+
−
−
−
=
k n
R
k
R F
{ : > ( − 2 , − + 1 ) }
= F F F k n k
Trang 133 Phát hiện:
3.4 Hồi qui phụ (auxiliary regressions):
(*) Sử dụng (3) để kiểm tra (1)
H0: (1) không có Đa cộng tuyến
H1: (1) có Đa cộng tuyến
) 3 ( 3
2 i m 1 m 2 X i V i
↔
≠
=
0 :
0
:
2 3 1
2 3 0
R
H
R
H
→
≠
=
0 :
0 :
2 1
2 0
m H
m H
) 2 (
) 1
(
) 1 2
(
2 3
2 3
−
−
−
=
n R
R F
{ : > ( 1 , − 2 ) }
= F F F n
) ˆ (
ˆ
2
2
m E S
m
T =
2
: > −
= T T T n
Trang 143 Phát hiện:
3.4 Hồi qui phụ (auxiliary regressions):
Một cách kiểm tra khác từ hồi qui phụ mà không cần sử dụng các kiểm định nói trên:
R2 của hồi qui phụ > R2 của hồi qui chính Khi đó có thể kết luận hồi qui chính có hiện tượng đa cộng tuyến nghiêm trọng (qui tắc Lawrence R Klien – Introduction to Econometrics - 1962)
Trang 154 Khắc phục:
4.1 Sử dụng thông tin tiên nghiệm (a priori information)
Với thông tin cho trước: quá trình sản xuất có hiệu quả không đổi theo qui mô,
Mô hình (1) trở thành:
) 1 ( )
ln(
) ln(
) ln( Y i = β 1 + β 2 K i + β 3 L i + U i
2 3
3
β + = → = −
(*) )
ln(
)
i
i i
L
K L
Y
+ +
4.2 Bỏ bớt biến độc lập là nguyên nhân gây ra đa cộng tuyến
4.3 Thu thập thêm các quan sát mới
Trang 164 Khắc phục:
4.4 Sử dụng sai phân cấp 1
(1) Được biến đổi thành:
) 1 ( 3
2
4.5 Sử dụng hồi qui đa thức
(*) )
3 3
( )
2 2
2
i
(1) Được biến đổi thành:
) 1 ( 3
2