Nguyờn nhõn Đa cộng tuyến hoàn hảo gần như khụng bao giờ xảy ra Đa cộng tuyến khụng hoàn hảo thường xuyờn xảy ra, do cỏc nguyờn nhõn: - Bản chất cỏc biến giải thớch cú quan hệ tươngquan
Trang 1Bài 4 ĐA CỘNG tuyến
1 Bản chất của đa cộng tuyến ( Multicolinearity)
1.1 Hiện tượng :
Xột MH: Y i = β1 + β2 X 2i + β3X 3i + … + βk X ki + u i
Gt 10: Cỏc biến giải thớch khụng cú quan hệ cộng tuyến
Nếu giả thiết bị vi phạm → hiện tượng đa cộng tuyến
Cú hai dạng đa cộng tuyến:
i Đa cộng tuyến hoàn hảo( Perfect Multicolinearity) :
∃ λj ≠ 0 (j ≠ 1) sao cho:
λ2 X 2i + … + λk X ki = 0 ∀ i
→ Ma trận X là suy biến, khụng cú lời giải duy nhất
ii Đa cộng tuyến khụng hoàn hảo ( Imperfect Multicolinearity) :
∃λj ≠ 0 (j ≠ 1) sao cho:
λ2 X 2i + … + λk X ki + v i = 0
với v i là SSNN cú phương sai dương → vẫn cú lời giải
1.2 Nguyờn nhõn
Đa cộng tuyến hoàn hảo gần như khụng bao giờ xảy ra
Đa cộng tuyến khụng hoàn hảo thường xuyờn xảy ra, do cỏc nguyờn nhõn:
- Bản chất cỏc biến giải thớch cú quan hệ tươngquan với nhau(Khỏch quan)
- Do số liệu mẫu khụng ngẫu nhiờn
- Do kớch thước mẫu khụng đủ
- Do quỏ trỡnh làm trơn số liệu
2 Hậu quả
2.1 Đa cộng tuyến hoàn hảo : khụng giải được
Vì lúc đó βjˆ=
0
0 ∀j và Var( βjˆ) = ∞ ∀j(Ph-ơng sai)
2.2 Đa cộng tuyến khụng hoàn hảo:
Trang 2- Các ước lượng có phương sai lớn, là ước lượng không hiệu quả
- Khoảng tin cậy rộng không còn ý nghĩa
- Các kiểm định T có thể sai
- Các kiểm định T và kiểm định F có thể cho kết luận mâu thuẫn nhau
- Các ước lượng có thể sai về dấu
- Mô hình trở nên nhậy cảm với mỗi sự thay đổi của số biến giải thích và của tệp số liệu
3 Phát hiện đa cộng tuyến
3.1 Sự mâu thuẫn giữa kiểm định T và F
Có mâu thuẫn: Kiểm định F có ý nghĩa, tất cả các kiểm định T về các hệ số góc không có ý nghĩa
→ có Đa cộng tuyến
→ Điều ngược lại chưa chắc đúng
3.2 Hồi qui phụ
thích khác, hồi qui mô hình hồi qui phụ:
X j = α1 + α2X2 + … + αj-1 X j -1 + αj+1 X j+1 + … + v i (*)
⎩
⎨
⎧
≠
= 0 :
H
0 :
H
2
* 1
2
* 0
R
Mô hình ban đầu có Đa cộng tuyến
→ Fqs =
1
* 2
*
2
*
−
−
×
k n R
R
; Fqs > Fα(k * – 1, n – k *) thì bác bỏ H0
3.3 Độ đo Theil
Dùng để so sánh mức độ đa cộng tuyến không hoàn hảo giữa các mô hình
B-íc 2: Bỏ biến X j ra khỏi mô hình, hồi qui thu được R2– j (j=2,k)
m = R2 – ( 2 ) được gọi là độ đo Theil
2
2
j k
j
R
=
∑ −
Trang 3Ví dụ: Sử dụng tệp số liệu ch5bt4 về Tiêu dùng Y, Thu nhập X2 và Tài sản có khả
tuyến giữa các biến giải thích
Kết quả hồi quy Y theo X2 và X3 như sau:
Dependent Variable: Y
Method: Least Squares
Date: 11/19/08 Time: 10:12
Sample: 1 25
Included observations: 25
Variable Coefficie
C 33.87971 19.11513 1.772403 0.0902
X2
-26.00263
34.95897 -0.743804 0.4649 X3 6.709261 8.740550 0.767602 0.4509
Adjusted
S.E of regression 41.96716 Akaike info
8
-127.2977
2 Durbin-Watson
stat
0
Håi quy phô cña X2 theo X3 cã kÕt qu¶ sau:
Dependent Variable: X2
Method: Least Squares
Date: 11/19/08 Time: 10:17
Sample: 1 25
Included observations: 25
Variable Coefficie
nt
C - 0.111892 -0.938303 0.3578
Trang 40.104988 X3 0.250022 0.000157 1594.459 0.0000
Adjusted
S.E of regression 0.250315 Akaike info
6
Durbin-Watson
Håi quy phô của X3 theo X2 có kết quả sau:
Dependent Variable: X3
Method: Least Squares
Date: 11/19/08 Time: 10:19
Sample: 1 25
Included observations: 25
Variable Coefficie
nt
C 0.425686 0.447288 0.951703 0.3511 X2 3.999613 0.002508 1594.459 0.0000
Adjusted
S.E of regression 1.001168 Akaike info
Trang 5Durbin-Watson
Để tính độ đo Theil ta hồi quy Y lần lượt với X2 và X3 Kết quả như sau:
Dependent Variable: Y
Method: Least Squares
Date: 11/19/08 Time: 10:23
Sample: 1 25
Included observations: 25
Variable Coefficie
C 36.73575 18.58133 1.977025 0.0601
X2 0.831821 0.104206 7.982448 0.0000
var
169.368
0 Adjusted
R-squared
0.723246 S.D dependent var 79.0585
7 S.E of regression 41.59070 Akaike info
6
Durbin-Watson
Dependent Variable: Y
Method: Least Squares
Date: 11/19/08 Time: 10:24
Sample: 1 25
Included observations: 25
Variable Coefficie
C 36.60968 18.57637 1.970766 0.0609
X3 0.208034 0.026033 7.991106 0.0000
Trang 6R-squared 0.735199 Mean dependent
Adjusted
R-squared
0.723686 S.D dependent var 79.0585
7 S.E of regression 41.55758 Akaike info
criterion
10.3686
6
7
Durbin-Watson
Hãy dùng các kết quả trên tính độ đo Theil
.4 Khắc phục đa cộng tuyến
4.1 Dùng thông tin tiên nghiệm
Ví dụ: Xét mô hình TD i = β1 + β2 TN i + β3 SK i + u i
Dễ thấy TD i có cộng tuyến với SK i
Nếu có thể cho rằng β3 = 0,1β2
Thì mô hình trở thành TD i = β1 + β2 ( TN i + 0,1SK i ) + u i
Và đã khắc phục được đa cộng tuyến
4.2 Bỏ bớt biến nếu có thể
Lúc đó việc lựa chọn biến bị loại khỏi mô hình có thể căn cứ vào kết quả của hồi quy phụ
4.3.Tăng kích thước mẫu hoặc lấy mẫu mới nếu có thể
4.4 Đổi dạng của mô hình
VÝ dô thay v× håi quy m« h×nh Y i = β1 + β2 X 2i + β3 X 3i + u i
Trang 7Ng-êi ta håi quy m« h×nh lnY i = β1 + β2 lnX 2i + β3 lnX 3i + u i
4 Dùng sai phân cấp 1
Xét mô hình Y t = β1 + β2 X 2t + β3 X 3t + u t
Tại thời điểm t-1 mô hình có dạng:
β X 2t-1 + β X + u t-1
+ β ( X 3t – X 3t-1 ) + ( u t – u t-1 ) (*)
4.6 Giảm cộng tuyến trong hồi quy đa thức
.5
Y t-1 = β1 + 2 3 3t-1
Lấy sai phân ta có:
Y t - Y t-1 = β2 ( X 2t – X 2t-1 ) 3
Mô hình (*) được gọi là mô hình sai phân cấp 1
Có thể giảm cộng tuyến trong hồi quy đa thức bằng cách lấy sai phân của các biến trong mô hình so với giá trị trung bình của chúng