cộng tuyến• Hiện tượng đa cộng tuyến là hiện tượng các biến độc lập trong mô hình phụ thuộc lẫn nhau và có quan hệ gần như tuyến tính... Nguồn gốc hiện tượng 1.Do phương pháp thu thập
Trang 1Nhóm 1
Hiện tượng đa cộng tuyến
Trang 2Khái niệm
hiện tượng
đa cộng tuyến
Phương pháp phát hiện hiện tượng
Biện pháp khắc phục hiện tượng
Trang 3Ví dụ
• NI: tổng thu nhập quốc gia
• GDP: tổng thu nhập quốc dân
• NFIA: Thu nhập ròng từ nước ngoài
Trang 4cộng tuyến
• Hiện tượng đa cộng tuyến là hiện
tượng các biến độc lập trong mô hình phụ thuộc lẫn nhau và có quan hệ gần như tuyến tính.
Trang 5Nguồn gốc hiện tượng
1.Do phương pháp thu
thập dữ liệu
- Các giá trị của các biến độc lập phụ
thuộc lẫn nhau trong mẫu, nhưng
không phụ thuộc lẫn nhau trong
tổng thể.
VD: Người có thu nhập cao hơn
khuynh hướng sẽ có nhiều của cải
hơn.điều này có thể đúng với mẫu
mà không đúng trong tổng thể
Trong tổng thể sẽ có các quan sát
về cá nhân có thu nhập cao nhưng
không có nhiều của cải và ngược
lại.
2.Dạng hàm mô hình
VD các dạng dễ xảy ra hiện tượng đa cộng tuyến:
Hồi quy dạng các biến độc
lập được bình phương sẽ xảy
ra đa cộng tuyến và đặc biệt khi phạm vi giá trị ban đầu của biến độc lập là nhỏ
Các biến độc lập vĩ mô được
quan sát theo dữ liệu chuỗi thời gian
Trang 6hiện tượng
Hệ số xác định bội cao nhưng tỷ số t thấp
Hệ số tương quan cặp giữa các biến giải thích cao
Sử dụng mô hình hồi quy phụ
Sử dụng nhân tử phóng đại phương sai VIF
Trang 92.Hệ số tương quan cặp giữa
các biến giải thích cao
• Công thức tính:
• Nếu các hệ số tương quan cặp giữa các biến | rXjXp| lớn (vượt 0,8) thì có hiện tượng đa cộng tuyến
• Chú ý:
– chúng ta cần chú ý rằng hiện tượng đa cộng tuyến vẫn xảy
ra khi các hệ số tương quan cặp r XjXp nhỏ
– Nếu mô hình chỉ có 2 biến giải thích thì nếu hệ số tương
quan giữa 2 biến giải thích đó mà nhỏ thì không có hiện tượng cộng tuyến.
) )(
(
p pi
j ji
p pi
j ji
X X
X X
X X
X X
r x xj p
Trang 113.Sử dụng mô hình hồi quy phụ
- Hồi quy giữa một biến độc lập với tất cả các biến
độc lập với nhau và quan sát hệ số của các hồi quy phụ
R F
Trang 12phương sai (VIF)
thấy qua nhân tử phóng đại phương sai (variance-inflation factor - VIF) Đối với hàm hồi quy có 2 biến giải thích X2 và X3, VIF được định nghĩa như sau:
như thế nào khi có đa cộng tuyến Khi =1 thì VIF tiến
đến vô hạn Nếu không có cộng tuyến giữa X2 và X3 thì
VIF = 1.
) r 1
) ˆ
i 2
2 2
∑ σ
=
x )
ˆ
i 3
2 3
∑ σ
= β
Trang 131A 1,33A 1,96A 2,78A 5,76A 10,26A 16,92A 50,25A 100A 500A
0 0,67B 1,37B 2,22B 4,73B 9,74B 16,41B 49,75B 99,5B 499,5B
Để có khái niệm về phương sai và hiệp phương sai tăng như thế nào khi r23 tăng Nhìn bảng số liệu dưới đây:
nghiêm trọng đến phương sai và hiệp phương sai ước lượng của các hàm ước lượng OLS Khi =0,5 , bằng 1,33 lần khi =0, nhưng khi
tăng từ 0,95 đến 0,995 đã làm phương sai ước lượng tăng 100 lần so với khi không có cộng tuyến Ảnh hưởng nghiêm trọng này cũng thấy ở
∑ σ
i 2
2
x A
=
2 i 3
2 i 2
2
xx
B
Ghi chú:
)ˆ(Var β2
2
ˆ
β βˆ3
Trang 14tăng rất nhanh.
Khi r23 = 1 thì VIF là vô hạn.
Có nhiều chương trình máy tính cho biết giá trị VIF
đối với các biến độc lập của mô hình hồi quy.
Đối vơi trường hợp tổng quát, có (k-1) biến giải thích
thì:
Với là giá trị trong hàm hồi quy của Xj với
các biến giải thích khác thì sẽ gần 1 và khi đó VIF
sẽ lớn.
Vì vậy một số tác giả dùng VIF như là một dấu hiệu
xác định đa cộng tuyến Giá trị VIF càng lớn thì biến
Xj càng cộng tuyến cao Nhưng VIF là bao nhiêu thì
ta có thể coi là có thể xảy ra hiên tượng đa cộng
tuyến Như một quy tắc kinh nghiệm, nếu VIF 10
(điều này được xảy ra nếu >0,9) thì biến này được
coi là có cộng tuyến cao.
r 23
2 1
≥
2 j R
Trang 15• VIF=1/(1-0.84183)=6.3223
=>có đa cộng tuyến
Trang 16biến còn lại -Thu thập thêm số liệu hoặc lấy mẫu mới
-Sử dụng sai phân cấp một
-Một số biện pháp khác
Trang 171.Sử dụng thông tin tiên nghiệm
Yi = β1 + β2X2i + β3X3i + ui ∀ i=1…n
Trong đó: Giữa X2 và X3 có cộng tuyến cao.
Giả sử có thông tin β3 = 0,1 β2
Cách biến đổi như sau:
Yi = β1 + β2X2i + 0,1 β2X3i + ui = β1 + β2 (X2i + 0,1X3i) + uiĐặt
Xi = X2i +0,1X3iVậy, ta có:
Yi = β1 + β2 Xi + ui
Trang 18tuyến với các biến còn lại
Bỏ biến
Ta có | rXjXp| >0 ,8 → Bỏ 1 trong 2 biến này.
Trang 19Hồi quy giữa NI và GDP -Hồi quy giữa NI và NFIA
=>Bỏ biến NFIA
Trang 20lấy mẫu mới
• Vì vấn đề đa cộng tuyến là một đặc tính của mẫu, có thể
là trong một mẫu khác, các biến cộng tuyến có thể
không nghiêm trọng như trong mẫu đầu tiên Vì vậy, đôi khi ta chỉ cần tăng cỡ mẫu cũng có thể làm giảm bớt vấn
đề cộng tuyến Ví dụ, trong mô hình 3 biến chúng ta
thấy là:
• Khi cỡ mẫu tăng, nói chung sẽ tăng, vì vậy, đối với
bất kỳ r23 nào cho trước, phương sai của sẽ giảm, kéo theo sai số chuẩn giảm, điều này giúp chúng ta ước
ˆ
23
2 i 2
2 2
∑ 2
i 2 x
Trang 214.Sử dụng sai phân cấp 1
Ứng với t-1:
Lấy sai phân các biến theo thời gian:
- Điều này có thể giải quyết vấn đề đa cộng tuyến vì đa cộng tuyến xảy ra từ sai phân các biến này Tuy nhiên có thể vi phạm giả định chuẩn về sai số ngẫu nhiên
t t
t
1 1
3 3 1
2 2 1
Trang 23Bảng hồi quy sai phân cấp1
Trang 25Hồi quy phụ của biến sai phân:
• Với mức ý nghĩa 0.05 > Prob (F-statistic)=0.023 =>mô hình sai phân có đa cộng tuyến
Trang 26• => Bỏ biến NFIA1
Trang 275.Một số biện pháp khác
xây dựng mô hình sử dụng để dự báo chứ không phải kiểm định
• Kết hợp dữ liệu chéo và dữ liệu
chuỗi thời gian