1
2
3 4 6 5
Vấn đề kì vọng của sai số ngẫu nhiên khác 0
Phương sai sai số thay đổi
Đa cộng tuyến
Tự tương quan Vấn đề phân phối
chuẩn của sai số ngẫu nhiên
Kiểm định và lựa chọn mô hình
Giả thiết OLS
1
• Việc ước lượng dựa trên cơ sở mẫu ngẫu nhiên.
2
• Kì vọng của sai số ngẫu nhiên tại mỗi giá trị (X2i,…, Xki) bằng 0.
3
• Phương sai của sai số ngẫu nhiên tại các giá trị (X2i,…X ki) là bằng nhau.
4
• Giữa các biến độc lập không có hiện tượng đa cộng tuyến hoàn hảo.
5
• Sai số ngẫu nhiên tuân theo quy luật chuẩn: ui ~ N(0, σ2)
BÀI 1: VẤN ĐỂ KÌ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC 0
1. Nguyên nhân
2. Hậu quả 3. Cách phát hiện
4. Cách khắc phục
Mô hình thiếu biến quan trọng:
Biến có tác động đến biến phụ thuộc Y.
Biến có tương quan với ít nhất một trong các biến độc lập sẵn có trong mô hình.
Dạng hàm sai.
Tính tác động đồng thời của số liệu
Sai số đo lường của các biến độc lập
BÀI 1: VẤN ĐỂ KÌ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC 0
1. Nguyên nhân
2. Hậu quả 3. Cách phát hiện
4. Cách khắc phục
Ước lượng OLS sẽ là ước lượng chệch.
Các suy diễn thống kê không còn đáng tin cậy.
BÀI 1: VẤN ĐỂ KÌ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC 0
1. Nguyên nhân
2. Hậu quả 3. Cách phát hiện
4. Cách khắc phục
Phát hiện mô hình bỏ sót biến.
Giả sử mô hình hồi quy:
2 3 1 2 2
( | , ,..., k ) ... k k
E Y X X X X X
Để kiểm định biến Xk+1 có bị bỏ sót trong mô hình không, ta thực hiện hồi quy:
2 3 1 1 2 2 1 1
( | , ,..., k, k ) ... k k k k
E Y X X X X X X X Và thực hiện kiểm định H0 : k1 0
- Nếu bác bỏ H0: mô hình bỏ sót biến Xk+1
- Nếu không bác bỏ H0: mô hình không bỏ sót biến Xk+1
BÀI 1: VẤN ĐỂ KÌ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC 0
1. Nguyên nhân
2. Hậu quả 3. Cách phát hiện
4. Cách khắc phục
Phát hiện mô hình bỏ sót biến.
Dependent Variable: HEALTH Method: Least Squares
Date: 11/17/15 Time: 14:56 Sample: 1 51
Included observations: 51
Variable Coefficient Std. Error t-Statistic Prob.
C 412.3153 703.5960 0.586011 0.5606
POP 3.683083 0.089068 41.35116 0.0000
R-squared 0.972142 Mean dependent var 19929.12 Adjusted R-squared 0.971573 S.D. dependent var 22102.16 S.E. of regression 3726.464 Akaike info criterion 19.32273 Sum squared resid 6.80E+08 Schwarz criterion 19.39849 Log likelihood -490.7297 Hannan-Quinn criter. 19.35168 F-statistic 1709.918 Durbin-Watson stat 2.049285 Prob(F-statistic) 0.000000
? Mô hình có bị thiếu biến income không?
VD9
BÀI 1: VẤN ĐỂ KÌ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC 0
1. Nguyên nhân
2. Hậu quả 3. Cách phát hiện
4. Cách khắc phục
Phát hiện mô hình bỏ sót biến.
Omitted Variables Test Equation: UNTITLED
Specification: HEALTH C POP Omitted Variables: INCOME
Value df Probability
t-statistic 5.192054 48 0.0000
F-statistic 26.95743 (1, 48) 0.0000
Likelihood ratio 22.73168 1 0.0000
VD9
BÀI 1: VẤN ĐỂ KÌ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC 0
1. Nguyên nhân
2. Hậu quả 3. Cách phát hiện
4. Cách khắc phục
Phát hiện dạng hàm sai – kiểm định Ramsey RESET.
Kiểm định Ramsey – Reset giúp kiểm tra xem mô hình có bị sai dạng hàm do thiếu biến là hàm của các biến có trong mô hình.
VD: Kiểm tra xem mô hình có thiếu biến X2X3 , X22 , X32 …
1 2 2 3 3
EY X X
BÀI 1: VẤN ĐỂ KÌ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC 0
1. Nguyên nhân
2. Hậu quả 3. Cách phát hiện
4. Cách khắc phục
Phát hiện dạng hàm sai – kiểm định Ramsey RESET.
Thực hiện kiểm định H0: α1 = α2 = … = αm = 0 - Nếu bác bỏ H0: mô hình gốc có dạng hàm sai - Nếu chưa bác bỏ H0: chưa phát hiện mô hình gốc có dạng hàm sai
^ ^ 1
2
1 2 2 ... 1 ...
m
i i k ki i m i i
Y X X Y Y v Ý tưởng của kiểm định Ramsey – Reset là đưa thêm biến vào mô hình hồi quy.
2 3 1
^ ^ ^
, ,...,
m
Y Y Y
BÀI 1: VẤN ĐỂ KÌ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC 0
1. Nguyên nhân
2. Hậu quả 3. Cách phát hiện
4. Cách khắc phục
Phát hiện dạng hàm sai – kiểm định Ramsey RESET.
Ramsey RESET Test Equation: UNTITLED
Specification: HEALTH C POP
Omitted Variables: Powers of fitted values from 2 to 3
Value df Probability
F-statistic 12.40013 (2, 47) 0.0000
Likelihood ratio 21.61076 2 0.0000
VD9
BÀI 1: VẤN ĐỂ KÌ VỌNG CỦA SAI SỐ NGẪU NHIÊN KHÁC 0
1. Nguyên nhân
2. Hậu quả 3. Cách phát hiện
4. Cách khắc phục
Nếu nguyên nhân là thiếu biến Z (đã biết) được phát hiện từ kiểm định t thì ta thêm biến Z vào mô hình.
Nếu nguyên nhân là do dạng hàm sai được phát hiện từ kiểm định Ramsey thì ta cần xem xét các mô hình thay thế như mô hình dạng logarit hoặc thêm các biến dạng bình phương của các biến đã có trong mô hình.
BÀI 2 : PHƯƠNG SAI SAI SỐ THAY ĐỔI
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
1
• Việc ước lượng dựa trên cơ sở mẫu ngẫu nhiên.
2
• Kì vọng của sai số ngẫu nhiên tại mỗi giá trị bằng 0.
3
• Phương sai của sai số ngẫu nhiên tại các giá trị là bằng nhau.
4
• Giữa các biến không có hiện tượng đa cộng tuyến hoàn hảo
Giả thiết OLS
BÀI 2: PHƯƠNG SAI SAI SỐ THAY ĐỔI
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
Khi giả thiết 3 bị vi phạm tức là mô hình có hiện
tượng phương sai sai số thay đổi (Heteroskedasticity)
BÀI 2: PHƯƠNG SAI SAI SỐ THAY ĐỔI
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
Do bản chất của số liệu.
Do mô hình thiếu biến quan trọng hoặc dạng hàm sai.
BÀI 2: PHƯƠNG SAI SAI SỐ THAY ĐỔI
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
BÀI 2: PHƯƠNG SAI SAI SỐ THAY ĐỔI
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
Phương pháp định tính: dựa vào bản chất của vấn đề nghiên cứu.
Sử dụng đồ thị phần dư.
Dùng kiểm định White
Dùng kiểm định Breusch – Pagan (BP)
BÀI 2: PHƯƠNG SAI SAI SỐ THAY ĐỔI
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
White Giả sử có mô hình Y = β1 + β2X2 + β3X3 + u Nếu u2 có tương quan với một trong các biến X2, X3, X22, X32, X2X3 thì mô hình có hiện tượng phương sai sai số thay đổi.
Xét mô hình hồi quy phụ:
2 2 2
1 2 2 3 3 4 2 5 3 6 2 3
i i i i i i i i
e X X X X X X v H0: α2 = α3 = α4 = α5 = α6 = 0
- Nếu bác bỏ H0: Mô hình có hiện tượng phương sai sai số thay đổi.
- Nếu chưa đủ cơ sở bác bỏ H0: Chưa tìm thấy hiện tượng phương sai sai số thay đổi trong mô hình
BÀI 2: PHƯƠNG SAI SAI SỐ THAY ĐỔI
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
White
1
• Ước lượng mô hình hồi quy tuyến tính, thu được ei
2
• Ước lượng mô hình, thu được hệ số xác định R2
3 • Tính nR
2
4
• Tra bảng phân phối Chi-bình phương, mức ý nghĩa α, bậc tự do k (k là số tham số trong mô hình hồi quy phụ)
5
• Nếu thì bác bỏ giả thiết H0: α2 =…= α6 = 0.
Kết luận có hiện tượng phương sai thay đổi
1 2 2 3 3
Y X X u
2 2 2
1 2 2 3 3 4 2 5 3 6 2 3
i i i i i i i i
e X X X X X X v
2 2
( 1) nR k
BÀI 2: PHƯƠNG SAI SAI SỐ THAY ĐỔI
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
White
Dependent Variable: WAGE Method: Least Squares
Date: 11/03/15 Time: 10:24 Sample: 1 935
Included observations: 935
Variable Coefficient Std. Error t-Statistic Prob.
C 1950.250 152.8226 12.76153 0.0000
AGE 20.91337 3.969099 5.269048 0.0000
EDUC 60.57685 5.615440 10.78755 0.0000
R-squared 0.132832 Mean dependent var 3457.945 Adjusted R-squared 0.130971 S.D. dependent var 404.3608 S.E. of regression 376.9522 Akaike info criterion 14.70532 Sum squared resid 1.32E+08 Schwarz criterion 14.72085 Log likelihood -6871.736 Hannan-Quinn criter. 14.71124 F-statistic 71.38128 Durbin-Watson stat 0.306406 Prob(F-statistic) 0.000000
VD10
BÀI 2: PHƯƠNG SAI SAI SỐ THAY ĐỔI
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
Dependent Variable: RE2 Method: Least Squares Date: 11/03/15 Time: 11:09 Sample: 1 935
Included observations: 935
Variable Coefficient Std. Error t-Statistic Prob.
C 1307447. 1625359. 0.804405 0.4214
AGE -67538.82 86937.34 -0.776868 0.4374 EDUC -34174.72 80724.67 -0.423349 0.6721
AGE^2 604.0252 1275.196 0.473672 0.6358
EDUC^2 -843.7774 2261.094 -0.373172 0.7091 AGE*EDUC 2287.510 1619.774 1.412240 0.1582 R-squared 0.019698 Mean dependent var 141637.0 Adjusted R-squared 0.014422 S.D. dependent var 321734.6 S.E. of regression 319406.1 Akaike info criterion 28.19271 Sum squared resid 9.48E+13 Schwarz criterion 28.22377 Log likelihood -13174.09 Hannan-Quinn criter. 28.20456 F-statistic 3.733449 Durbin-Watson stat 0.478958 Prob(F-statistic) 0.002369
VD10
nR2 = 935*0,019698 > = 11,0705 nên có 0.052 (5)
BÀI 2: PHƯƠNG SAI SAI SỐ THAY ĐỔI
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
Heteroskedasticity Test: White
F-statistic 3.733449 Prob. F(5,929) 0.0024
Obs*R-squared 18.41773 Prob. Chi-Square(5) 0.0025 Scaled explained SS 47.16196 Prob. Chi-Square(5) 0.0000
Test Equation:
Dependent Variable: RESID^2 Method: Least Squares
Date: 11/03/15 Time: 10:48 Sample: 1 935
Included observations: 935
Variable Coefficient Std. Error t-Statistic Prob.
C 1307447. 1625359. 0.804405 0.4214
AGE^2 604.0252 1275.196 0.473672 0.6358
AGE*EDUC 2287.510 1619.774 1.412240 0.1582
AGE -67538.82 86937.34 -0.776868 0.4374
EDUC^2 -843.7774 2261.094 -0.373172 0.7091
EDUC -34174.72 80724.67 -0.423349 0.6721
R-squared 0.019698 Mean dependent var 141637.0 Adjusted R-squared 0.014422 S.D. dependent var 321734.6 S.E. of regression 319406.1 Akaike info criterion 28.19271 Sum squared resid 9.48E+13 Schwarz criterion 28.22377 Log likelihood -13174.09 Hannan-Quinn criter. 28.20456 F-statistic 3.733449 Durbin-Watson stat 0.478958 Prob(F-statistic) 0.002369
BÀI 2: PHƯƠNG SAI SAI SỐ THAY ĐỔI
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
BP Giả sử có mô hình Y = β1 + β2X2 + β3X3 + u Nếu u2 có tương quan với X2, X3 thì mô hình có hiện tượng phương sai sai số thay đổi.
Xét mô hình hồi quy phụ:
2
1 2 2 3 3
i i i i
e X X v H0: α2 = α3 = 0
- Nếu bác bỏ H0: Mô hình có hiện tượng phương sai sai số thay đổi.
- Nếu chưa đủ cơ sở bác bỏ H0: Chưa tìm thấy hiện tượng phương sai sai số thay đổi trong mô hình
BÀI 2: PHƯƠNG SAI SAI SỐ THAY ĐỔI
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
BP
1
• Ước lượng mô hình hồi quy tuyến tính, thu được ei
2
• Ước lượng mô hình, thu được hệ số xác định R2
3 • Tính LM = nR2
4
• Nếu hoặc thì bác bỏ giả thiết
H: β2 = β3 = 0. Kết luận có hiện tượng phương sai thay đổi
1 2 2 3 3
Y X X u
2
1 2 2 3 3
i i i i
e X X w
( 1, )
Fqs f k n k
2 2
/ 1
(1 ) /
qs
R k
F R n k
2( 1)
LM k
BÀI 2: PHƯƠNG SAI SAI SỐ THAY ĐỔI
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
BPDependent Variable: RE2 Method: Least Squares Date: 11/03/15 Time: 22:06 Sample: 1 935
Included observations: 935
Variable Coefficient Std. Error t-Statistic Prob.
C -205605.9 129447.4 -1.588336 0.1125
AGE 2822.912 3361.998 0.839653 0.4013
EDUC 18848.52 4756.520 3.962671 0.0001
R-squared 0.017218 Mean dependent var 141637.0 Adjusted R-squared 0.015109 S.D. dependent var 321734.6 S.E. of regression 319294.7 Akaike info criterion 28.18882 Sum squared resid 9.50E+13 Schwarz criterion 28.20435 Log likelihood -13175.27 Hannan-Quinn criter. 28.19474 F-statistic 8.164342 Durbin-Watson stat 0.469476 Prob(F-statistic) 0.000305
VD10
BÀI 2: PHƯƠNG SAI SAI SỐ THAY ĐỔI
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
Heteroskedasticity Test: Breusch-Pagan-Godfrey
F-statistic 8.164342 Prob. F(2,932) 0.0003
Obs*R-squared 16.09919 Prob. Chi-Square(2) 0.0003 Scaled explained SS 41.22491 Prob. Chi-Square(2) 0.0000
Test Equation:
Dependent Variable: RESID^2 Method: Least Squares
Date: 11/03/15 Time: 22:21 Sample: 1 935
Included observations: 935
Variable Coefficient Std. Error t-Statistic Prob.
C -205605.9 129447.4 -1.588336 0.1125
AGE 2822.912 3361.998 0.839653 0.4013
EDUC 18848.52 4756.520 3.962671 0.0001
R-squared 0.017218 Mean dependent var 141637.0 Adjusted R-squared 0.015109 S.D. dependent var 321734.6 S.E. of regression 319294.7 Akaike info criterion 28.18882 Sum squared resid 9.50E+13 Schwarz criterion 28.20435 Log likelihood -13175.27 Hannan-Quinn criter. 28.19474 F-statistic 8.164342 Durbin-Watson stat 0.469476 Prob(F-statistic) 0.000305
VD10
BÀI 2: PHƯƠNG SAI SAI SỐ THAY ĐỔI
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
Nếu phương sai sai số thay đổi do mô hình thiếu biến hay do dạng hàm sai thì trước khi khắc phục phương sai sai số thay đổi cần xem xét vấn đề thiếu biến hoặc dạng hàm sai như mục trước đây đã đề cập.
BÀI 2: PHƯƠNG SAI SAI SỐ THAY ĐỔI
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
Nếu mô hình không có vấn đề gì về thiếu biến hoặc dạng hàm sai thì ta có thể khắc phục bằng 2 phương pháp:
Phương pháp bình phương bé nhất tổng quát (GLS – Generalized Least Square)
Ước lượng sai số chuẩn: vẫn sử dụng OLS nhưng tính toán lại phương sai của hệ số ước lượng.
BÀI 3: ĐA CỘNG TUYẾN
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
Giả thiết OLS
1
• Việc ước lượng dựa trên cơ sở mẫu ngẫu nhiên.
2
• Kì vọng của sai số ngẫu nhiên tại mỗi giá trị (X2i,…, Xki) bằng 0.
3
• Phương sai của sai số ngẫu nhiên tại các giá trị (X2i,…X ki) là bằng nhau.
4
• Giữa các biến độc lập không có hiện tượng đa cộng tuyến hoàn hảo.
5
• Sai số ngẫu nhiên tuân theo quy luật chuẩn: ui ~ N(0, σ2)
BÀI 3: ĐA CỘNG TUYẾN
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc
phục α
BÀI 3: ĐA CỘNG TUYẾN
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
BÀI 3: ĐA CỘNG TUYẾN
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
BÀI 3: ĐA CỘNG TUYẾN
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
Do bản chất mối quan hệ giữa các biến độc lập.
Dạng hàm mô hình: mô hình có dạng hàm đa thức: biến X và X2, X3 đặc biệt khi X nhận giá trị trong khoảng nhỏ.
- Hồi quy mà số biến độc lập lớn hơn số quan sát.
Mẫu không mang tính đại diện.
Các biến độc lập được quan sát theo chuỗi thời gian có cùng chiều hướng biến động
BÀI 3: ĐA CỘNG TUYẾN
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
Khi gặp đa cộng tuyến hoàn hảo, ta không thể ước lượng được mô hình.
BÀI 3: ĐA CỘNG TUYẾN
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
- Đối với đa cộng tuyến cao, khi dùng phương pháp OLS, các ước lượng thu được vẫn là ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không chệch nhưng:
BÀI 3: ĐA CỘNG TUYẾN
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
- Sai số chuẩn của các hệ số hồi quy sẽ lớn. Do đó:
+ Khoảng tin cậy lớn nghĩa là ước lượng trở nên kém chính xác.
+ Việc kiểm định hệ số ước lượng dễ mất ý nghĩa thống kê.
BÀI 3: ĐA CỘNG TUYẾN
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
- R2 cao nhưng có hệ số không có ý nghĩa thống kê.
- Các ước lượng và sai số chuẩn của ước lượng rất nhạy cảm với sự thay đổi của dữ liệu
- Dấu của hệ số ước lượng có thể ngược với kì vọng.
Tuy nhiên, những dấu hiệu trên có thể do các nguyên nhân khác như mô hình thừa biến hoặc dạng hàm sai. Do đó, khi thấy các dấu hiệu trên, cần xem xét đa cộng tuyến cao có phải là nguyên nhân gây ra không.
BÀI 3: ĐA CỘNG TUYẾN
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
VD15
Dependent Variable: CT Method: Least Squares
Date: 09/01/15 Time: 10:32 Sample: 1 33
Included observations: 33
Variable Coefficient Std. Error t-Statistic Prob.
C 18.86018 8.832144 2.135402 0.0410
TN 0.791224 0.015991 49.48055 0.0000
TS 0.015818 0.003984 3.970277 0.0004
R-squared 0.999545 Mean dependent var 1610.415 Adjusted R-squared 0.999515 S.D. dependent var 557.2878 S.E. of regression 12.27498 Akaike info criterion 7.939512 Sum squared resid 4520.257 Schwarz criterion 8.075558 Log likelihood -128.0019 Hannan-Quinn criter. 7.985287 F-statistic 32963.98 Durbin-Watson stat 1.912696 Prob(F-statistic) 0.000000
BÀI 3: ĐA CỘNG TUYẾN
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
Thực hiện hồi quy phụ: hồi quy giữa một biến độc lập nào đó theo các biến độc lập còn lại và quan sát hệ số xác định của các mô hình hồi quy phụ: nếu R2 quá lớn (ví dụ: >0.9)nghi ngờ
BÀI 3: ĐA CỘNG TUYẾN
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
Dependent Variable: TN Method: Least Squares Date: 11/02/17 Time: 15:12 Sample: 1 33
Included observations: 33
Variable Coefficient Std. Error t-Statistic Prob.
C -288.4380 84.60065 -3.409407 0.0018
TS 0.243711 0.009301 26.20137 0.0000
R-squared 0.956795 Mean dependent var 1837.145 Adjusted R-squared 0.955401 S.D. dependent var 652.8516 S.E. of regression 137.8717 Akaike info criterion 12.74922 Sum squared resid 589266.4 Schwarz criterion 12.83991 Log likelihood -208.3621 Hannan-Quinn criter. 12.77973 F-statistic 686.5116 Durbin-Watson stat 0.741835 Prob(F-statistic) 0.000000
BÀI 3: ĐA CỘNG TUYẾN
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
Tính hệ số tương quan cặp (pair – wise correlation) giữa các biến Xj:
Nếu hệ số tương quan giữa 2 biến nào đó > 0.8 thì có thể xem là mô hình có đa cộng tuyến cao.
(Ngược lại không đúng)
TN TS
TN 1 0.978159046...
TS 0.978159046... 1
BÀI 3: ĐA CỘNG TUYẾN
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
Dùng nhân tử phóng đại phương sai (VIF – variance inflation factor)
trong đó Rj2 là hệ số xác định của mô hình hồi quy phụ Xj theo các biến độc lập khác.
Quy ước: Nếu VIF > 10 thì đó là dấu hiệu đa cộng tuyến cao.
BÀI 3: ĐA CỘNG TUYẾN
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
VD15
Dependent Variable: TN Method: Least Squares Date: 11/02/17 Time: 15:12 Sample: 1 33
Included observations: 33
Variable Coefficient Std. Error t-Statistic Prob.
C -288.4380 84.60065 -3.409407 0.0018
TS 0.243711 0.009301 26.20137 0.0000
R-squared 0.956795 Mean dependent var 1837.145 Adjusted R-squared 0.955401 S.D. dependent var 652.8516 S.E. of regression 137.8717 Akaike info criterion 12.74922 Sum squared resid 589266.4 Schwarz criterion 12.83991 Log likelihood -208.3621 Hannan-Quinn criter. 12.77973 F-statistic 686.5116 Durbin-Watson stat 0.741835 Prob(F-statistic) 0.000000
VIF?
BÀI 3: ĐA CỘNG TUYẾN
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
* Một số trường hợp đa cộng tuyến cao nhưng không gây ra hậu quả nghiêm trọng, không cần biện pháp khắc phục.
BÀI 3: ĐA CỘNG TUYẾN
1. Khái niệm 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 5. Cách khắc phục
Gia tăng kích thước mẫu.
Sử dụng các thông tin từ các nghiên cứu trước.
Bỏ bớt biến gây ra đa cộng tuyến cao.
Tổng hợp các biến bị đa cộng tuyến thành một biến duy nhất rồi đưa vào mô hình.
Thay đổi dạng mô hình.
BÀI 4: TỰ TƯƠNG QUAN
1. Định nghĩa 2.Nguyên
nhân 3. Hậu quả 4. Phát hiện 4. Cách khắc phục
Tự tương quan là hiện tượng có sự tương quan giữa các quan sát trong cùng bảng số liệu.
cov( , u ui j ) 0
Hiện tượng này thường xảy ra với dữ liệu chuỗi thời gian.
BÀI 4: TỰ TƯƠNG QUAN
Giả sử chuỗi thời gian có dạng:
1 2 2 ...
t t k kt t
Y X X u
1. Định nghĩa 2.Nguyên
nhân 3. Hậu quả 4. Phát hiện 4. Cách khắc phục
BÀI 4: TỰ TƯƠNG QUAN
Nếu sai số ut chỉ tương quan với ut-1 thì ta có hiện tượng tự tương quan bậc 1, kí hiệu là AR(1)
1. Định nghĩa 2.Nguyên
nhân 3. Hậu quả 4. Phát hiện 4. Cách khắc phục
1 , 1
t t t
u u
ε(t) thoả mãn tất cả các giả thiết của OLS ρ là hệ số tự tương quan
Nếu sai số ut tương quan với m kì trước đó thì ta có hiện tượng tự tương quan bậc m, kí hiệu là
AR(m)
1 1 2 2 ...
t t t m t m t
u u u u
ρj là hệ số tương quan có độ trễ j.
BÀI 4: TỰ TƯƠNG QUAN
1. Định nghĩa 2.Nguyên
nhân 3. Hậu quả 4. Phát hiện 4. Cách khắc phục
Do bản chất của các hiện tượng kinh tế: các hiện tượng kinh tế có tính chất quán tính, tính chất mạng nhện hoặc tính trễ.
Do lập mô hình (thiếu biến hoặc dạng hàm sai…)
Do việc xử lý số liệu
BÀI 4: TỰ TƯƠNG QUAN
Các ước lượng OLS vẫn là các ước lượng tuyến tính, không chệch, vững nhưng không tốt nhất tức là ước lượng không hiệu quả.
Phương sai của các hệ số ước lượng có thể bé hơn phương sai đúng.
Kết luận từ bài toán xây dựng khoảng tin cậy là không đáng tin cậy và thường bé hơn so với khoảng tin cậy đúng.
Kết luận từ bài toán kiểm định giả thuyết thống kê về các hệ số là không đáng tin cậy.
1. Định nghĩa 2.Nguyên
nhân 3. Hậu quả 4. Phát hiện 4. Cách khắc phục
BÀI 4: TỰ TƯƠNG QUAN
Xem xét đồ thị phần dư
Dùng phương pháp Durbin - Watson Dùng phương pháp
Breusch - Godfrey
1. Định nghĩa 2.Nguyên
nhân 3. Hậu quả 4. Phát hiện 4. Cách khắc phục
BÀI 4: TỰ TƯƠNG QUAN
1. Định nghĩa 2. Nguyên nhân
3. Hậu quả 4. Phát hiện 4.1. Xem xét đồ thị phần dư
4.2. Dùng phương pháp Durbin – Watson
4.3. Dùng phương pháp Breusch - Godfrey
5. Cách khắc phục
Hồi quy mô hình gốc: thu phần dư et.
Vẽ đồ thị phần dư et theo thời gian.
Một số dạng đồ thị có tự tương quan:
ei
t
ei
t
t ei
t ei