Đề 2 alpha = 5% 1 Lập mô hình hồi quy thể hiện mối quan hệ giữa thu nhập với kinh nghiệm và trình độ lao động (MH1) (2 5 đ) Dependent Variable TN Method Least Squares Date 122321 Time 09 24 Sample 1 531 Included observations 531 Variable Coefficient Std Error t Statistic Prob C 76 76535 4 975860 15 42755 0 0000 KN 0 374629 0 085983 4 357016 0 0000 GD 2 709280 0 287793 9 413974 0 0000 R squared 0 159227 Mean dependent var 121 4746 Adjusted R squared 0 156042 S D dependent var 54 77168 S E of re.
Trang 1Đề 2: alpha = 5%
1 Lập mô hình hồi quy thể hiện mối quan hệ giữa thu nhập với kinh nghiệm và trình độ lao động (MH1) (2.5 đ)
Dependent Variable: TN
Method: Least Squares
Date: 12/23/21 Time: 09:24
Sample: 1 531
Included observations: 531
Variable Coefficient Std Error t-Statistic Prob
C 76.76535 4.975860 15.42755 0.0000
KN 0.374629 0.085983 4.357016 0.0000
GD 2.709280 0.287793 9.413974 0.0000
R-squared 0.159227 Mean dependent var 121.4746
Adjusted R-squared 0.156042 S.D dependent var 54.77168
S.E of regression 50.31719 Akaike info criterion 10.68020
Sum squared resid 1336800 Schwarz criterion 10.70436
Log likelihood -2832.594 F-statistic 49.99684
Durbin-Watson stat 1.943331 Prob(F-statistic) 0.000000
TN = 76.76535347 + 0.3746291933*KN + 2.709280402*GD
- Ý nghĩa của các hệ số hồi quy
= 76.76535347 khi số năm kinh nghiệp và trình độ lao động đều bằng 0 thì thu nhập
là 76.77 nghìn đồng
= 0.37 khi kinh nghiệm tăng 1 năm và trình độ LĐ không đổi thì TN tăng 0.37 triệu đồng
= 2.709 khi trình độ lao động tăng 1 năm và số năm kinh nghiệm không đổi thi
Tn tăng 2,709 tr đồng.
- Ý nghĩa của hệ số xác định
= 0.1592 Biến KN và GD giải thích được 15,92% biến TN
- Các hệ số hồi quy có ý nghĩa về mặt thống kê hay không?
Ta thấy prob(b1)= prob(b2)= prob(b2)=0.000 < a=0.05 nên hệ số hồi quy
có ý nghĩa về mặt thống kê
Trang 2- Có thể nói tác động của trình độ lên thu nhập bằng 2 tác động của kinh nghiệm lên thu nhập được không?
Wald Test:
Equation: Untitled
Null Hypothesis: C(3)=2*C(2)
F-statistic 37.72316 Probability 0.000000
Chi-square 37.72316 Probability 0.000000
Kiểm định Wald cho Prob=0.000<a =0.05
Nên kết luận tác động của trình độ thu nhập không bằng tác động của kinh nghiệp lên thu nhập.
2 Sử dụng mô hình 1 để kiểm định một số nhận định sau là đúng hay sai (2 đ).
- Khi kinh nghiệm tăng 5 năm thì thu nhập tăng ít hơn 2 nghìn được không?
H0: b2=2/5
H1: b2< 2/5
Tqs= =-0.291
Tqs> -1,645-> chưa bác bỏ H0
KL: kinh nghiệm tăng 5 năm thì thu nhập tăng không ít hơn 2 nghìn
- Khi số năm đi học tăng 10 năm thì thu nhập tăng nhiều hơn 30 nghìn được không?
H0: b2=3
H1: b2>3
Tqs= = -1.045
Tqs<1.645 nên chưa bác bỏ H0
Khi số năm đi học tăng 10 năm thì thu nhập tăng không nhiều hơn 30 nghìn
Trang 3- Khoảng tin cậy cho β2
< b2<
0.2<b2<0.54
- Khoảng tin cậy cho β1
< b1<
67,02<b1<86,5
3 Lập mô hình hồi quy 2 bằng cách thêm 2 biến giả vào trong mô hình 1 (Yi=β1+β2X2i+β3X3i+β4D2i+β5D3i) (MH2) (2.5 đ).
Dependent Variable: TN
Method: Least Squares
Date: 12/23/21 Time: 09:48
Sample: 1 531
Included observations: 531
Variable Coefficient Std Error t-Statistic Prob
C 67.35798 7.023186 9.590801 0.0000
KN 0.387742 0.085970 4.510231 0.0000
GD 2.534492 0.300453 8.435578 0.0000
KV 10.19386 5.995426 1.700273 0.0897
GT 7.785299 4.663160 1.669533 0.0956
R-squared 0.168223 Mean dependent var 121.4746
Adjusted R-squared 0.161897 S.D dependent var 54.77168
S.E of regression 50.14235 Akaike info criterion 10.67698
Sum squared resid 1322498 Schwarz criterion 10.71723
Log likelihood -2829.738 F-statistic 26.59517
Durbin-Watson stat 1.962005 Prob(F-statistic) 0.000000
- Giải thích ý nghĩa của các hệ số β4 và β5
10.19386: ở giới tính nữ, chênh lệch thu nhập giữa thành thị và nông thôn là 10.19 tr đ 7.785299: ở khu vực nông thôn, chênh lệch thu nhập của nam và nữ là 7.78 tr đ
- Có nên đồng thời bỏ 2 biến đó ra khỏi mô hình cùng một lúc không? Redundant Variables: KV GT
F-statistic 2.844228 Probability 0.059074
Log likelihood ratio 5.711700 Probability 0.057507
Prob> 0,05, không nên bỏ đồng thời 2 biến
- Có thể nói thu nhập của nam lớn hơn của nữ không?
Trang 4H0 b5=0
H1 b5>0
Prob=0.0956 > 0,05 bác bỏ ho nên thu nhập nam lớn hơn nữ
- Có thể nói thu nhập của người dân ở khu vực thành thị lớn hơn nông thôn được không?
H0 b4=0
H1 b4>0
Prob= 0.0897 >a -> bác bỏ ho nên thu nhập thành thị lớn hơn =0
4 Có nên cho thêm biến số lao động vào trong mô hình 2 (mô hình 3) (3 điểm)
Omitted Variables: LD
F-statistic 87.49821 Probability 0.000000
Log likelihood ratio 81.56450 Probability 0.000000
Prob<0.05 nên thêm biến lao động vào mô hình
Test Equation:
Dependent Variable: TN
Method: Least Squares
Date: 12/23/21 Time: 09:53
Sample: 1 531
Included observations: 531
Variable Coefficient Std Error t-Statistic Prob
C 111.7312 5.936917 18.81973 0.0000
KN 0.610386 0.083592 7.301966 0.0000
GD 2.341522 0.269652 8.683498 0.0000
LD -0.427579 0.045711 -9.354048 0.0000
R-squared 0.278945 Mean dependent var 121.4746
Adjusted R-squared 0.274840 S.D dependent var 54.77168
S.E of regression 46.64155 Akaike info criterion 10.53037
Sum squared resid 1146454 Schwarz criterion 10.56257
Log likelihood -2791.812 F-statistic 67.95770
Durbin-Watson stat 1.902105 Prob(F-statistic) 0.000000
- Giải thích ý nghĩa của hệ số βi của biến mới thêm đó
Trang 5Khi các yếu tố khác không đổi, lao động tăng lên 1000 người thì Tn giảm
đi 0,43 tr đ
- Đánh giá mức độ phù hợp của mô hình
Prob(f)<0.05 nên mô hình phù hợp
Kiểm định
- Đa cộng tuyến
Cụ thể:
Dependent Variable: KN
Method: Least Squares
Date: 12/23/21 Time: 10:10
Sample: 1 531
Included observations: 531
Variable Coefficient Std Error t-Statistic Prob
C 6.853183 3.076434 2.227638 0.0263
GD -0.182774 0.140160 -1.304038 0.1928
LD 0.164874 0.022690 7.266301 0.0000
R-squared 0.101252 Mean dependent var 17.33333
Adjusted R-squared 0.097848 S.D dependent var 25.56531
S.E of regression 24.28236 Akaike info criterion 9.223011
Sum squared resid 311326.3 Schwarz criterion 9.247163
Log likelihood -2445.710 F-statistic 29.74197
Durbin-Watson stat 1.985238 Prob(F-statistic) 0.000000
LD có ảnh hưởng đến KN
Dependent Variable: GD
Method: Least Squares
Date: 12/23/21 Time: 10:12
Sample: 1 531
Included observations: 531
Variable Coefficient Std Error t-Statistic Prob
C 16.36743 0.640865 25.53959 0.0000
KN -0.017565 0.013469 -1.304038 0.1928
LD -0.024716 0.007298 -3.386436 0.0008
R-squared 0.032395 Mean dependent var 14.10546
Trang 6Adjusted R-squared 0.028730 S.D dependent var 7.638050 S.E of regression 7.527531 Akaike info criterion 6.880645 Sum squared resid 29918.45 Schwarz criterion 6.904796 Log likelihood -1823.811 F-statistic 8.838528 Durbin-Watson stat 1.974809 Prob(F-statistic) 0.000168
Ld có ảnh hưởng đến gd
Dependent Variable: LD
Method: Least Squares
Date: 12/23/21 Time: 10:12
Sample: 1 531
Included observations: 531
Variable Coefficient Std Error t-Statistic Prob
C 81.77635 4.391283 18.62243 0.0000
KN 0.551377 0.075881 7.266301 0.0000
GD -0.860096 0.253983 -3.386436 0.0008 R-squared 0.117524 Mean dependent var 79.20151 Adjusted R-squared 0.114182 S.D dependent var 47.18101 S.E of regression 44.40579 Akaike info criterion 10.43025 Sum squared resid 1041149 Schwarz criterion 10.45440 Log likelihood -2766.231 F-statistic 35.15844 Durbin-Watson stat 2.039733 Prob(F-statistic) 0.000000 -> KN và ld có đa cộng tuyến
GD và ld có đa cộng tuyến
- Phương sai sai số thay đổi
F-statistic 38.82237 Probability 0.000000 Obs*R-squared 121.0333 Probability 0.000000
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 12/23/21 Time: 10:01
Sample: 1 531
Included observations: 531
Variable Coefficient Std Error t-Statistic Prob
C 701.0480 773.6239 0.906187 0.3653
KN 147.0891 19.45994 7.558561 0.0000 KN^2 -0.269490 0.081272 -3.315896 0.0010
GD -207.3377 125.5863 -1.650959 0.0993 GD^2 9.519221 4.477315 2.126101 0.0340 R-squared 0.227935 Mean dependent var 2517.515 Adjusted R-squared 0.222063 S.D dependent var 4917.155 S.E of regression 4336.966 Akaike info criterion 19.59711 Sum squared resid 9.89E+09 Schwarz criterion 19.63736 Log likelihood -5198.032 F-statistic 38.82237 Durbin-Watson stat 2.028537 Prob(F-statistic) 0.000000 Prob<0,05 nên mô hình có hiện tượng
Trang 7F-statistic 38.82237 Probability 0.000000 Obs*R-squared 121.0333 Probability 0.000000
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 12/23/21 Time: 10:01
Sample: 1 531
Included observations: 531
Variable Coefficient Std Error t-Statistic Prob
C 701.0480 773.6239 0.906187 0.3653
KN 147.0891 19.45994 7.558561 0.0000 KN^2 -0.269490 0.081272 -3.315896 0.0010
GD -207.3377 125.5863 -1.650959 0.0993 GD^2 9.519221 4.477315 2.126101 0.0340 R-squared 0.227935 Mean dependent var 2517.515 Adjusted R-squared 0.222063 S.D dependent var 4917.155 S.E of regression 4336.966 Akaike info criterion 19.59711 Sum squared resid 9.89E+09 Schwarz criterion 19.63736 Log likelihood -5198.032 F-statistic 38.82237 Durbin-Watson stat 2.028537 Prob(F-statistic) 0.000000 Prob<0.05 mô hình có psss thay đổi
- Tự tương quan
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 0.405877 Probability 0.524346 Obs*R-squared 0.408643 Probability 0.522659
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 12/23/21 Time: 10:04
Presample missing value lagged residuals set to zero
Variable Coefficient Std Error t-Statistic Prob
C 0.058975 4.979523 0.011843 0.9906
KN -0.005735 0.086501 -0.066299 0.9472
GD 0.002921 0.287992 0.010141 0.9919 RESID(-1) 0.027905 0.043801 0.637084 0.5243 R-squared 0.000770 Mean dependent var 1.90E-14 Adjusted R-squared -0.004919 S.D dependent var 50.22216 S.E of regression 50.34552 Akaike info criterion 10.68320 Sum squared resid 1335772 Schwarz criterion 10.71540 Log likelihood -2832.390 F-statistic 0.135292 Durbin-Watson stat 1.997607 Prob(F-statistic) 0.938978 Prob>0.05 nên mô hình k có tự tương quan
- Phân phối chuẩn của phần dư
Trang 8Prob=0.000, phần dư không phân phối chuẩn
KV = 1: Thành thị, KV = 0: Nông thôn
GT = 1: Nam, GT = 0: Nữ