Nói cách khác là xảy ra trường hợp một biến giải thích nào đó được biểu diễn dưới dạng một tổ hợp tuyến tính của các biến còn lại... Nói cách khác là một biến giải thích nào đó có[r]
Trang 15/13/2015 3:38 PM 1
Y
Y
Y
Y
X 1
X 1
X 1
X 1
X 2
X 2
X 2
X 2
Hình 2.1 Biểu đồ Venn mô tả hiện tượng cộng tuyến
Đa cộng tuyến cao
Đa cộng tuyến thấp Không có đa cộng tuyến
Đa cộng tuyến vừa
Xét mô hình: Y i = 1 + 2 X 2i + 3 X 3i + … + k X ki + U i
Trang 22.1 TỔNG QUAN VỀ ĐA CỘNG TUYẾN
Đa cộng tuyến là gì ?
Ragnar Frisch: Đa cộng tuyến có nghĩa là sự tồn tại mối quan hệ tuyến tính “hoàn hảo” hoặc chính xác giữa một số hoặc tất cả các biến giải thích trong một mô hình hồi quy
Trang 35/13/2015 3:38 PM 3
Xét hàm hồi quy tuyến tính k-1 biến độc lập:
Yi = 1 + 2X2i + 3X3i + … + kXki + Ui Nếu tồn tại các số thực 2, 3, …… k sao cho:
2X2i + 3X3i + …… + kXki = 0
Với i ( i = 2, 3, k…) không đồng thời bằng không thì giữa các biến Xi (i = 2, 3, …k) xảy ra hiện tượng đa cộng tuyến hoàn hảo Nói cách khác là xảy ra trường hợp một biến giải thích nào đó được biểu diễn dưới dạng một tổ hợp tuyến tính của các biến còn lại
Trang 4Nếu 2X2i + 3X3i + …… + kXki + vi = 0,
Với vi là sai số ngẫu nhiên thì ta có hiện tượng đa cộng tuyến không hoàn hảo giữa các biến giải thích Nói cách khác là một biến giải thích nào đó
có tương quan với một số biến giải thích khác
2.1 TỔNG QUAN VỀ ĐA CỘNG TUYẾN
Trang 55/13/2015 3:38 PM 5
X3i = 5X2i, vì vậy có cộng tuyến hoàn hảo giữa X2 và
X3 ; r23 = 1
X2 và X3* không có cộng tuyến hoàn hảo, nhưng hai biến này có tương quan chặt chẽ
X *
Trang 6Lưu ý
Giả định về sự đa cộng tuyến liên quan đến mối quan hệ tuyến tính giữa các biến Xi, và không đề cập đến các mối quan hệ phi tuyến tính
Xem xét mô hình:
Yi = 0 + 1Xi + 2Xi2 + 3Xi3 + ui,
Rõ ràng Xi2 và Xi3 có mối quan hệ hàm số với Xi nhưng phi tuyến tính nên không vi phạm giả định về đa cộng tuyến
Trang 75/13/2015 3:38 PM 7
1. Phương sai và hiệp phương sai của các ước lượng
OLS lớn
r23 là hệ số tương quan giữa X2 và X3 Khi r23 1, các giá trị trên
Trang 8Hậu quả của đa cộng tuyến
2 Khoảng tin cậy rộng hơn
khoảng tin cậy của 2 và 3 (với độ tin cậy 1 – ) là:
2: t /2 se ( );
3: t /2 se ( );
Trong đó:
^
2
^
2
^ 3
^ 2
^ 3
2
2
23) 1
3
3
2
23) 1
Trang 95/13/2015 3:38 PM 9
3 Tỉ số t "không có ý nghĩa" Khi kiểm định giả thuyết
H0: 2 = 0, chúng ta sử dụng tỷ số t
và so sánh giá trị ước lượng của t với giá trị tra bảng (tới hạn) của t
Trong trường hợp cộng tuyến cao thì sai số chuẩn sẽ rất lớn và do đó làm cho giá trị t sẽ nhỏ đi, kết quả là sẽ làm tăng chấp nhận giả thuyết H0
)
ˆ ( se
ˆ t
2
2
Trang 10Hậu quả của đa cộng tuyến
4. R2 cao nhưng tỉ số t ít có ý nghĩa
Đa cộng tuyến cao: Một hoặc một số tham số tương quan (hệ số góc riêng) không có ý nghĩa về mặt thống kê Trong những trường hợp này, R2 lại rất cao (> 0,9) Kiểm định F thì có thể bác bỏ giả thuyết cho rằng 2 = 3 = … = k = 0