Nói cách khác: Đa cộng tuyến hoàn hảo xảy ra khi một biến giải thích nào đó được biểu diễn dưới dạng một tổ hợp tuyến tính của các biến còn lại... Nếu:Nói cách khác là một biến giải thíc
Trang 2Xeùt MH hoài qui k bieán:
Y i = 1 + 2 X 2i + 3 X 3i +
+ k X ki +U i
Trang 3* Một MH lý tưởng là các biến giải thích X i (i = 2, 3, , k) không có tương quan với nhau Khi đó ta nói không có hiện tượng cộng tuyến.
* Nếu tồn tại các số 2 , 3 , , k
sao cho:
2 X 2i + 3 X 3i + + k X ki = 0
Trang 4Với i (i = 2, 3, , k) không đồng thời bằng 0 thì giữa các biến X i (i = 2, 3, , k) xảy ra hiện tượng
đa cộng tuyến hoàn hảo
Nói cách khác: Đa cộng tuyến hoàn hảo xảy ra khi một biến giải thích nào đó được biểu diễn dưới dạng một tổ hợp tuyến tính của các biến còn lại.
Trang 5Nếu:
Nói cách khác là một biến giải thích nào đó có tương quan chặt chẽ với một số biến giải thích khác.
2 X 2i + 3 X 3i + + k X ki + V i = 0
Với V i là sai số ngẫu nhiên thì ta
có hiện tượng đa cộng tuyến
giải thích.
Trang 6Nguyên nhân gây ra hiện tượng đa
cộng tuyến
Do bản chất các biến ít nhiều
có mối quan hệ tuyến tính với
nhau
Do phương pháp lấy mẫu
Do quá trình tính toán xử lý dữ liệu
Trang 7Xét các dữ liệu có tính g thiết:
X 3i = 5X 2i , vì vậy có cộng tuyến hoàn hảo giữa X 2 và X 3 và r 23 = 1
Nhưng giữa X 2 và X *
3 không có cộng tuyến hoàn hảo, hai biến này có t.quan chặt (cộng tuyến không hoàn hảo), hệ số t.quan giữa chúng là 0,9959
Trang 8 Tr.hợp có cộng tuyến hoàn hảo
Các hệ số hồi qui không xác định và các sai số chuẩn của chúng là vô hạn.
Trang 9II Ước lượng khi có đa cộng tuyến
1.Trường hợp có đa cộng tuyến hoàn hảo
Xét mô hình :Yi = 1+2X2i+3X3i+ Ui (1) Giả sử : X3i = X2i x3i = x2i Theo OLS:
Trang 10Tuy nhiên nếu thay X3i = X2i vào hàm
hồi qui (1), ta được :
Yi = 1+2X2i+3 X2i + UiHay Yi = 1+ (2+ 3) X2i + Ui (2)
Ước lượng (2), ta có :
0
0 λ
) λ
(
) λ
)(
λ ( )
λ
(
ˆ
2 2
2 2i
2 2i
i 2i
2 2i
2 2i i
2i
) x
( x
x
y x
x x
3 2
Trang 11 Trường hợp cộng tuyến không hoàn hảo
Trường hợp này các hệ số hồi qui của mô hình có thể ước lượng được.
Trang 12 Phương sai và hiệp phương sai của các ước lượng OLS lớn.
Khoảng tin cậy rộng hơn
Tỉ số t không có ý nghĩa
R 2 cao nhưng tỉ số t ít có ý
nghĩa
Trang 13 Phương sai của các ước lượng OLS lớn
Khoảng tin cậy rộng hơm
Thống kê t không có ý nghĩa
23
2 2
2 2
2 3
( 2 /
) 3
( 2
Trang 14 Các ước lượng OLS và sai số chuẩn của chúng trở nên rất nhạy với những thay đổi nhỏ trong dữ liệu.
Dấu của các ước lượng của các hệ số hồi qui có thể sai.
Trang 15 Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, MH sẽ thay đổi về dấu hoặc thay đổi về độ lớn của các ước lượng.
Trang 16 Hệ số R 2 lớn nhưng tỉ số
t nhỏ.
Trang 17 Trong tr ờng hợp R 2 cao (R 2 > 0,8) mà giá trị tuyệt đối của tỷ số t thấp có thể chính là dấu hiệu của đa cộng tuyến.
)
ˆ (
Trang 18 Tương quan cặp giữa các biến giải thích cao.
NÕu hƯ sè t ¬ng quan cỈp (rij) gi÷a c¸c biÕn gi¶i thÝch cao (rij > 0,8 ) th× cã kh¶ n¨ng tån t¹i ®a céng tuyÕn Tuy nhiªn, ®iỊu nµy cã thĨ kh«ng hoµn toµn chÝnh
x¸c.
Sử dụng MH hồi qui phụ.
Trang 19Hồi qui phụ là hồi qui của một biến giải thích nào đó theo các biến giải thích còn lại.
Đối với mỗi MH hồi qui phụ ta có thể tiến hành k.đ giả thiết H 0 : R 2 = 0
Trang 20Nếu H 0 được chấp nhận thì không có cộng tuyến.
sử dụng nhân tử phóng đại p.sai (VIF - Variance
inflation factor
inflation factor).
VIF j = 1/(1-R 2
j ) Nếu VIF lớn (VIF > 10) thì có thể xảy ra cộng tuyến
Trang 21V-Các biện pháp khắc phục
1 Sử dụng thông tin tiên nghiệm
2 Loại 1 biến giải thích ra khỏi mô hình
3 Thu thập thêm số liệu hoặc lấy mẫu mới
Trang 22V-Các biện pháp khắc phục
4 Sử dụng sai phân cấp 1
5 Giảm tương quan trong các hàm hồi qui đa thức
6 Các biện pháp khác
Trang 231 Sử dụng thông tin tiên nghiệm
sử dụng thông tin từ nguồn khác để ớc l ợng các hệ số hồi qui riêng.
rằng: ngành công nghiệp này có hiệu suất
không đổi theo qui mô, tức là:
U
e L
K A
Trang 242 Loại 1 biến ra khỏi MH
Giả sử X 2 và X 3 là cặp biến có tương quan
chặt chẽ với nhau trong mô hình
LÇn l ỵt bá tõng biÕn céng tuyÕn, håi qui m«
h×nh vµ chän m« h×nh cã hƯ sè R 2 cao nhÊt.
Trang 25
3 Thu thập thêm số liệu mới
Nếu đa cộng tuyến do đặc tr ng của mẫu thì khi chọn mẫu khác liên quan đến các biến trong
mẫu ban đầu mức độ đa cộng tuyến có thể
không nghiêm trọng nữa Ph ơng án này có thể
sử dụng khi chi phí cho việc lấy mẫu khác ở
mức chấp nhận đ ợc.
Đôi khi chỉ cần thu thập thêm số liệu, tăng cỡ mẫu có thể làm giảm tính nghiêm trọng của đa cộng tuyến.
Trang 264 Sử dụng sai phân cấp 1
Xét mô hình hồi qui theo số liệu chuỗi thời
gian:
(1)
Mô hình trên đúng đối với thời điểm t cũng
đúng đối với thời điểm t-1:
(2)
Trừ (1) cho (2) ta có
Đổi biến ta thu đ ợc mô hình sau:
Mô hình này gọi là mô hình sai phân cấp 1.
t t
t
1 1
3 3
1 2 2
t
1 1
3 3
3 1
2 2
Trang 27Heát chöông 6