Bản chất hiện tượng đa cộng tuyến:- là sự tương quan lẫn nhau giữa các biến độc lập với nhau.. Có 2 loại đa cộng tuyến: - Đa cộng tuyến hoàn hảo: là hiện tượng các biến độc lập tương qua
Trang 1Bản chất hiện tượng đa cộng tuyến:
- là sự tương quan lẫn nhau giữa các biến độc lập với nhau.
Có 2 loại đa cộng tuyến:
- Đa cộng tuyến hoàn hảo: là hiện tượng các biến độc lập tương quan tuyến tính chặt chẽ với nhau
- Đa cộng tuyến không hoàn hảo: các biến có mối tương quan cao với nhau
Vd : ta có bảng số liệu các biến giải thích như sau:
Nhìn vào bảng ta có thể thấy: X2= 5X1 Như vậy có sự cộng tuyến hoàn hảo giữa X1 và X2 Hệ số tương quan giữa chúng là r=1.
Giữa X1 và X3 cũng có mối quan hệ tương quan mặc dù mức độ không chặt chẽ như X1 và X2 Hệ số tương quan giữa chúng là r=0.9959 Vậy X1 và X3 có cộng tuyến không hoàn hảo
Hậu quả của đa cộng tuyến:
- Phương sai và hiệp phương sai của các ước lượng bình phương nhỏ nhất lớn khoảng tin cậy rộng hơn
- Tỷ số t mất ý nghĩa
- R2 cao nh ưng tỉ số t it ý nghĩa
- Các ước lượng bình phương nhỏ nhất và các sai số tiêu chuẩn của chúng trở nên rất nhạy cảm đối với những thay đổi nhỏ trong số liệu
- Dấu của các ước lượng của hệ số hồi quy có thể sai
- Th êm vào hay bớt đi các biến cộng tuyến với các biến khác, mô hình sẽ thay đổi về dộ lớn của các ước lượng hoặc dấu của chúng
Bài tập: cho bảng số liệu về một số chỉ tiêu kinh tế của Singapore giai đoạn
1995-2010 như sau:
Trang 22002 157694 2223 223901 208312
Trong đó: Y là giá trị GDP thực tế( triệu đô Singapore)
X1 là số lượng lao động có việc làm( triệu người)
X2 là số lượng xuất khẩu(triệu đo singapore)
X3 là số lượng nhập khẩu(triệu đô singapore)
Phát hiện hiện tượng đa cộng tuyến với mức ý nghĩa 5%
Ta có bảng kết quả sau:
Dependent Variable: Y
Method: Least Squares
Date: 03/30/13 Time: 18:01
Sample: 1995 2010
Included observations: 16
Adjusted R-squared 0.971684 S.D dependent var 59691.74
S.E of regression 10044.50 Akaike info criterion 21.47976
Durbin-Watson stat 1.954529 Prob(F-statistic) 0.000000
từ bảng kết quả ước lượng ta thu được hàm hồi quy sau:
Y= -60529,85 + 76,61489X1+0.022602X2+0.253963X3
nhận xét:
- R2 cao nhưng tỷ số t thấp:
Trang 3R2 = 0,977347
T1 =-2,780977
T2=4,635678
T3=0,126442
T4=1,87782
Theo kết quả từ mô hình eviews ta có R2= 0,977347> 0,8 là cao Trong khi đó các
tỷ số t lại thấp Như vậy có thể nghi ngờ mô hình có hiện tượng đa cộng tuyến
- Hồi quy phụ
Ta tiến hành hồi quy X3 theo X1 và X2
Dependent Variable: X3
Method: Least Squares
Date: 03/31/13 Time: 22:58
Sample: 1996 2010
Included observations: 15
Adjusted R-squared 0.978778 S.D dependent var 92817.10
S.E of regression 13521.29 Akaike info criterion 22.03878
Durbin-Watson stat 1.382973 Prob(F-statistic) 0.000000
c ó F3 = 755,65
F(1, 14) =4,6
F3 > F vậy X3 có quan hệ tuyến tính với X1và X2
- Nhân tủ phóng đại phương sai
V IF(X3) = 54,975>10 Như vạy có hiện tượng đa cộng tuyến
- Độ đo theli
x ét mô hinh hồi quy y theo x1 ta được:
Trang 4Dependent Variable: Y
Method: Least Squares
Date: 03/30/13 Time: 18:03
Sample: 1995 2010
Included observations: 16
Adjusted R-squared 0.944295 S.D dependent var 59691.74 S.E of regression 14088.33 Akaike info criterion 22.06055 Sum squared resid 2.78E+09 Schwarz criterion 22.15712
Durbin-Watson stat 1.117280 Prob(F-statistic) 0.000000
xét mô hình hồi quy y theo X2 ta đựơc
Dependent Variable: Y
Method: Least Squares
Date: 03/30/13 Time: 18:05
Sample: 1995 2010
Included observations: 16
Adjusted R-squared 0.925235 S.D dependent var 59691.74 S.E of regression 16321.65 Akaike info criterion 22.35484
Durbin-Watson stat 0.865215 Prob(F-statistic) 0.000000
Xét mô hình hồi quy Y theo X3 ta được:
Dependent Variable: Y
Method: Least Squares
Date: 03/30/13 Time: 18:06
Trang 5Sample: 1995 2010
Included observations: 16
Adjusted R-squared 0.930507 S.D dependent var 59691.74 S.E of regression 15735.61 Akaike info criterion 22.28171
Durbin-Watson stat 1.541594 Prob(F-statistic) 0.000000
M= 0,87
Khắc phục hiện tuợng đa cộng tuyến
Bỏ biến
Khi bỏ biến X3 ta có kết quả:
Dependent Variable: Y
Method: Least Squares
Date: 03/31/13 Time: 11:12
Sample: 1995 2010
Included observations: 16
Adjusted R-squared 0.970789 S.D dependent var 59691.74 S.E of regression 10201.98 Akaike info criterion 21.46591
Durbin-Watson stat 1.314486 Prob(F-statistic) 0.000000
khi bỏ biến X2 ta có kết quả:
Trang 6Dependent Variable: Y
Method: Least Squares
Date: 03/31/13 Time: 11:17
Sample: 1995 2010
Included observations: 16
Adjusted R-squared 0.973828 S.D dependent var 59691.74 S.E of regression 9656.870 Akaike info criterion 21.35609
Durbin-Watson stat 2.018298 Prob(F-statistic) 0.000000
khi bỏ biến X1 ta có kết quả
Dependent Variable: Y
Method: Least Squares
Date: 03/31/13 Time: 11:14
Sample: 1995 2010
Included observations: 16
Adjusted R-squared 0.927055 S.D dependent var 59691.74 S.E of regression 16121.71 Akaike info criterion 22.38108
Durbin-Watson stat 1.313030 Prob(F-statistic) 0.000000
Trang 7Từ 3 bảng kết quả ta thấy R2 khi bỏ đi X2 là lớn nhất vì vậy có thể bỏ biến X2 để làm giảm hiện tượng đa cộng tuyến