Kỳ vọng dương β3: Thành viên trong gia đình càng tăng thì nhu cầu tiêu thụ gạo cũng tăng theo gạo là thực phẩm không thể thiếu đối với người VN.. Kỳ vọng âm β6: Những người ở thành thị s
Trang 1QUANTITATIVE METHODS Part 1 – Econometrics Homework 1 Sketch of Solution
Bài 1
1 Ricexpd = β1 + β2 ln(hhexp) + β3 hhsize + β4 age + β5 edu + β6 urb + β7 sex + β8 sex*ln(hhexpd)
β2 : Khi thu nhập tăng thì nhu cầu tiêu dùng nhìn chung sẽ tăng, kể cả đó là hàng hoá thông
thường như gạo Kỳ vọng dương
β3: Thành viên trong gia đình càng tăng thì nhu cầu tiêu thụ gạo cũng tăng theo (gạo là thực phẩm không thể thiếu đối với người VN) Kỳ vọng dương
β4: Những người càng lớn tuổi thường có nhiều tài sản tích luỹ cũng như thu nhập cao hơn những người trẻ Kỳ vọng dương tương tự như biến hhexp
β5 : Những người có trình độ học vấn cao thì thu nhập cũng cao và họ có nhiều lựa chọn hơn cho bữa ăn thay vì phải nấu cơm tại nhà (ăn nhà hàng, quán xá…) Kỳ vọng âm
β6: Những người ở thành thị sẽ chi tiêu cho gạo ít hơn so với nông thôn (do môi trường sinh sống, lối sống, dịch vụ ăn uống…) Kỳ vọng âm
β7: Phụ nữ thường đảm nhận công việc nội trợ cho gia đình hàng ngày Kỳ vọng dương
2 ls ricexpd c log(hhexp) hhsize age edu urb sex sex*log(hhexp)
- Ước lượng mô hình
Phương trình hồi qui:
RICEXPD = -2012.980572 + 272.3687976*LOG(HHEXP) + 388.3803462*HHSIZE + 1.82460952*AGE -
5.384471274*EDU - 503.7334713*URB + 738.2614866*SEX - 87.31181848*(SEX*LOG(HHEXP))
- Lý giải hệ số ước lượng (các hệ số ước lượng đúng với dấu kỳ vọng)
β2 = 272,4: Khi thu nhập tăng lên 1% thì chi tiêu cho gạo tăng lên 2,72 ngàn
β3 = 388,4: Khi qui mô hộ tăng lên 1 người thì chi tiêu gạo sẽ tăng lên 388 ngàn
β6 = -503,7: Những hộ ở thành thị chi tiêu cho gạo ít hơn 504 ngàn so với những hộ ở nông thôn
Lý giải tương tự cho những biến còn lại
Rsquared = 0,59: Tức 59% sự biến động của chi tiêu cho gạo của hộ gia đình được giải thích bởi các biến được đưa vào mô hình
- Kiểm tra độ tin cậy của các hệ số lượng
Vd: Cho biến thu nhập (hhexp)
Giả thuyết:
H0: β2 = 0
H1: β2 ≠ 0
Ttest = 11,61 > T tra bảng (α = 0,05, df = 5093) = 1,96 Do đó, bác bỏ giả thuyết H0, thực sự thu
nhập có ảnh hưởng lên chi tiêu gạo của hộ gia đình
Trang 2Kiểm định tương tự cho hệ số ước lượng khác
Dependent Variable: RICEXPD
Method: Least Squares
Date: 05/26/12 Time: 09:16
Sample: 499 5599
Included observations: 5101
Variable Coefficient Std Error t-Statistic Prob
C -2012.981 202.4513 -9.943038 0.0000 LOG(HHEXP) 272.3688 23.44680 11.61646 0.0000
HHSIZE 388.3803 6.435483 60.34984 0.0000
AGE 1.824610 0.814323 2.240646 0.0251
EDU -5.384471 2.774986 -1.940360 0.0524
URB -503.7335 26.88729 -18.73501 0.0000
SEX 738.2615 297.2042 2.484021 0.0130
SEX*LOG(HHEXP) -87.31182 31.92949 -2.734519 0.0063
R-squared 0.592341 Mean dependent var 2263.605
Adjusted R-squared 0.591781 S.D dependent var 1126.592
S.E of regression 719.8022 Akaike info criterion 15.99740
Sum squared resid 2.64E+09 Schwarz criterion 16.00765
Log likelihood -40793.36 F-statistic 1057.185
Durbin-Watson stat 1.536767 Prob(F-statistic) 0.000000
Thống kê cơ bản của Ricexpd
Median 2123.000
Maximum 9792.000
Minimum 0.000000
Std Dev 1126.592
Skewness 1.074907
Kurtosis 5.564487
- Hệ số co giãn của chi tiêu gạo theo thu nhập
E = 272.3688/ 2263.605 =0.1203 (gạo là hàng hoà thông thường)
3 Kiểm tra đa cộng tuyến
Dùng ma trận hệ số tương quan: Hệ số tương quan cặp của các biến tương đối nhỏ (<0,7) hơn nữa mô
hình không có dấu hiệu của đa cộng tuyến
(Anh/chị có quyền nghi ngờ có quan hệ giữa nhiều biến với nhau thì lúc này hãy chạy hồi qui phụ để kết
luận vấn đề)
cor log(hhexp) hhsize age edu urb sex sex*log(hhexp)
LOG(HHEXP) 1.000000 0.451279 -0.076122 0.308333 0.394076 -0.120477
HHSIZE 0.451279 1.000000 -0.150834 0.017355 -0.078767 -0.265307
AGE -0.076122 -0.150834 1.000000 -0.384310 0.054789 0.171877
EDU 0.308333 0.017355 -0.384310 1.000000 0.190101 -0.210344
URB 0.394076 -0.078767 0.054789 0.190101 1.000000 0.172900
SEX -0.120477 -0.265307 0.171877 -0.210344 0.172900 1.000000
4 Phương sai không đồng đều
Giả thuyết:
Trang 3H0: Phương sai của sai số là đồng nhất
H1: Phương sai của sai là không đồng nhất
Chỉ số White = 534 > 2 α = 0,05, df=32 hay (Pvalue = 0,0000<0,05) Bác bỏ H0, mô hình bị hiện tượng phương sai không đều
White Heteroskedasticity Test:
F-statistic 19.76417 Probability 0.000000
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/26/12 Time: 09:38
Sample: 499 5599
Included observations: 5101
Variable Coefficient Std Error t-Statistic Prob
C 13555385 4587390 2.954923 0.0031
LOG(HHEXP) -3087975 1042920 -2.960892 0.0031
(LOG(HHEXP))^2 180016.6 62142.76 2.896823 0.0038
(LOG(HHEXP))*HHSI
ZE
15154.81 27505.07 0.550983 0.5817 (LOG(HHEXP))*AGE 1482.394 3369.360 0.439963 0.6600
(LOG(HHEXP))*EDU -5273.701 11666.33 -0.452045 0.6513
(LOG(HHEXP))*URB -493234.8 119540.7 -4.126084 0.0000
(LOG(HHEXP))*SEX 2634134 1584460 1.662480 0.0965
(LOG(HHEXP))*(SEX
*LOG(HHEXP))
-147950.0 91671.85 -1.613908 0.1066 HHSIZE -283599.8 229619.0 -1.235089 0.2169
HHSIZE*AGE 236.5462 983.1586 0.240598 0.8099
HHSIZE*EDU 7379.447 3296.575 2.238519 0.0252
HHSIZE*URB 48344.85 29597.79 1.633394 0.1024
HHSIZE*SEX 134479.5 368593.2 0.364845 0.7152
HHSIZE*(SEX*LOG(
HHEXP))
-11666.91 38585.47 -0.302365 0.7624 AGE -3467.520 29015.00 -0.119508 0.9049
AGE^2 -116.7968 103.7845 -1.125378 0.2605
AGE*EDU -151.8861 409.5961 -0.370819 0.7108
AGE*URB 744.3608 3911.730 0.190289 0.8491
AGE*SEX 7769.317 44071.36 0.176289 0.8601
AGE*(SEX*LOG(HHE
XP))
-854.5527 4770.694 -0.179125 0.8578 EDU 22878.74 97854.09 0.233805 0.8151
EDU^2 -676.2401 1076.452 -0.628212 0.5299
EDU*URB 16989.85 12978.64 1.309063 0.1906
EDU*SEX 63421.54 158637.0 0.399790 0.6893
EDU*(SEX*LOG(HHE
XP))
-5704.621 16866.80 -0.338216 0.7352 URB 4185869 1096367 3.817945 0.0001
URB*SEX -1920294 1610598 -1.192286 0.2332
URB*(SEX*LOG(HHE
XP))
227272.8 170056.1 1.336458 0.1815 SEX -11913631 7136441 -1.669408 0.0951
R-squared 0.104703 Mean dependent var 517302.6
Adjusted R-squared 0.099405 S.D dependent var 1344480
Trang 4S.E of regression 1275907 Akaike info criterion 30.96227
Sum squared resid 8.25E+15 Schwarz criterion 31.00200
Log likelihood -78938.27 F-statistic 19.76417
Durbin-Watson stat 1.939078 Prob(F-statistic) 0.000000
- Khử theo phương pháp WLS
Xác định biến gây ra vấn đề (hãy dựa vào kết xuất khi kiểm tra hiện tượng phương sai không đồng đều - ở đây là hhsize bình phương) Lấy biến đó làm trọng số (lấy căn bậc 2 của nó) để chạy lại
mô hình
Dependent Variable: RICEXPD
Method: Least Squares
Date: 05/26/12 Time: 09:44
Sample: 499 5599
Included observations: 5101
Weighting series: 1/HHSIZE
Variable Coefficient Std Error t-Statistic Prob
C -750.6441 142.4384 -5.269956 0.0000
LOG(HHEXP) 115.9132 16.53206 7.011417 0.0000
HHSIZE 429.0255 5.565651 77.08451 0.0000
AGE 0.140537 0.516158 0.272275 0.7854
EDU -3.591389 1.895768 -1.894424 0.0582
URB -239.6383 17.09628 -14.01699 0.0000
SEX -23.79283 152.4357 -0.156084 0.8760
SEX*LOG(HHEXP) -0.078125 17.20886 -0.004540 0.9964
Weighted Statistics
R-squared 0.051349 Mean dependent var 1830.384
Adjusted R-squared 0.050045 S.D dependent var 571.2774
S.E of regression 556.7991 Akaike info criterion 15.48385
Sum squared resid 1.58E+09 Schwarz criterion 15.49411
Log likelihood -39483.57 F-statistic 2145.724
Durbin-Watson stat 1.477851 Prob(F-statistic) 0.000000
Unweighted Statistics
R-squared 0.581418 Mean dependent var 2263.605
Adjusted R-squared 0.580843 S.D dependent var 1126.592
S.E of regression 729.3820 Sum squared resid 2.71E+09
Durbin-Watson stat 1.534066
Kiểm tra lại hiện tượng tượng phương sai không đồng đều, mô hình
mới có cải thiện chỉ số White giảm đáng kể tuy nhiên vẫn còn hiện
tượng phương sai không đồng đều
White Heteroskedasticity Test:
F-statistic 4.695260 Probability 0.000000
Một cách khác để khử phương sai không đồng đều là tìm trọng số từ ước lượng sai số với các
biến khác Tuy nhiên cách này đòi hỏi thử và sai “trial and error” khá tốn thời gian và rất nhàm
chán…(đọc bài giảng 14 đã gởi cho lớp)
Trang 5Khử theo phương pháp ước lượng ma trận hiệp phương sai nhất quán – HCCM
Dependent Variable: RICEXPD
Method: Least Squares
Date: 05/26/12 Time: 09:48
Sample: 499 5599
Included observations: 5101
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable Coefficient Std Error t-Statistic Prob
C -2012.981 233.2329 -8.630773 0.0000 LOG(HHEXP) 272.3688 27.17161 10.02402 0.0000
HHSIZE 388.3803 8.917945 43.55043 0.0000
AGE 1.824610 0.740202 2.465015 0.0137
EDU -5.384471 2.697966 -1.995752 0.0460
URB -503.7335 28.68316 -17.56199 0.0000
SEX 738.2615 278.6615 2.649313 0.0081
SEX*LOG(HHEXP) -87.31182 30.74082 -2.840257 0.0045
R-squared 0.592341 Mean dependent var 2263.605
Adjusted R-squared 0.591781 S.D dependent var 1126.592
S.E of regression 719.8022 Akaike info criterion 15.99740
Sum squared resid 2.64E+09 Schwarz criterion 16.00765
Log likelihood -40793.36 F-statistic 1057.185
Durbin-Watson stat 1.536767 Prob(F-statistic) 0.000000
5 Ricexpd = β1 + β2 hhexp + β3 hhsize + β4 age + β5 edu + β6 urb + β7 sex + β8 sex*hhexpd
Dependent Variable: RICEXPD
Method: Least Squares
Date: 05/26/12 Time: 09:51
Sample: 499 5599
Included observations: 5101
Variable Coefficient Std Error t-Statistic Prob
C 210.1032 61.47463 3.417722 0.0006 HHEXP 0.005597 0.001233 4.539864 0.0000
HHSIZE 418.2052 6.015992 69.51557 0.0000
AGE 2.420121 0.824416 2.935556 0.0033
EDU 1.418892 2.763513 0.513438 0.6077
URB -408.1615 26.49772 -15.40365 0.0000
SEX -32.87615 36.43396 -0.902349 0.3669
SEX*HHEXP -0.003463 0.001902 -1.820585 0.0687
R-squared 0.582307 Mean dependent var 2263.605
Adjusted R-squared 0.581733 S.D dependent var 1126.592
S.E of regression 728.6070 Akaike info criterion 16.02171
Sum squared resid 2.70E+09 Schwarz criterion 16.03197
Log likelihood -40855.38 F-statistic 1014.310
Durbin-Watson stat 1.549989 Prob(F-statistic) 0.000000
6 Mô hình đầu đại diện tốt hơn cho mô hình thứ hai Mô hình 1 có chất lượng thống kê của các hệ
số ước lượng cao hơn
Trang 6Bài 2:
1 Genr time = @trend
Ls log(greenbean) c time
Mô hình ước lượng LOG(GREENBEAN) = 8.205939659 + 0.009311869673*TIME
Dependent Variable: LOG(GREENBEAN)
Method: Least Squares
Date: 07/09/12 Time: 19:46
Sample: 1990:01 1999:12
Included observations: 120
Variable Coefficient Std Error t-Statistic Prob
C 8.205940 0.030799 266.4314 0.0000 TIME 0.009312 0.000447 20.81569 0.0000
R-squared 0.785958 Mean dependent var 8.759996
Adjusted R-squared 0.784144 S.D dependent var 0.365368
S.E of regression 0.169751 Akaike info criterion -0.692442
Sum squared resid 3.400216 Schwarz criterion -0.645984
Log likelihood 43.54654 F-statistic 433.2929
2 Biểu đồ phân bố rãi giữa εt và εt-1
Dữ liệu cho thấy một loạt âm rồi sau đó là một loạt âm Điều này là dấu hiệu của hiện tượng tự
tương quan
3 Kiểm tra hiện tượng tự tương quan
Giả thuyết:
H0: Không có hiện tượng tự tương quan
H1: Có hiện tượng tự tương quan
Chỉ số Durbin Watson = 0,206
Kết luận mô hình bị tự tương quan dương
Trang 7Khử hiện tượng tự tương quan bậc 1
Dependent Variable: LOG(GREENBEAN)
Method: Least Squares
Date: 07/09/12 Time: 19:49
Sample(adjusted): 1990:02 1999:12
Included observations: 119 after adjusting endpoints
Convergence achieved after 3 iterations
Variable Coefficient Std Error t-Statistic Prob
C 8.336306 0.147330 56.58262 0.0000
TIME 0.007539 0.001919 3.928137 0.0001
AR(1) 0.888345 0.040943 21.69704 0.0000
R-squared 0.956836 Mean dependent var 8.767149
Adjusted R-squared 0.956092 S.D dependent var 0.358375
S.E of regression 0.075095 Akaike info criterion -2.315241
Sum squared resid 0.654152 Schwarz criterion -2.245179
Log likelihood 140.7569 F-statistic 1285.710
Inverted AR Roots 89
Chỉ số Durbin Watson cải thiện đáng kể nhưng mô hình vẫn còn bị tương quan bậc cao hơn
Khử tự tương quan bậc 2
Dependent Variable: LOG(GREENBEAN)
Method: Least Squares
Date: 07/09/12 Time: 19:49
Sample(adjusted): 1990:03 1999:12
Included observations: 118 after adjusting endpoints
Convergence achieved after 3 iterations
Variable Coefficient Std Error t-Statistic Prob
C 8.305089 0.106662 77.86356 0.0000
TIME 0.007996 0.001448 5.521365 0.0000
R-squared 0.957218 Mean dependent var 8.774809
Adjusted R-squared 0.956092 S.D dependent var 0.349983
S.E of regression 0.073336 Akaike info criterion -2.354222
Sum squared resid 0.613110 Schwarz criterion -2.260301
Log likelihood 142.8991 F-statistic 850.2286
Inverted AR Roots 80 27
Kiểm tra xem có bị hiện tượng tự tương quan bậc 3 không
Dependent Variable: LOG(GREENBEAN)
Method: Least Squares
Date: 07/09/12 Time: 19:50
Sample(adjusted): 1990:04 1999:12
Included observations: 117 after adjusting endpoints
Convergence achieved after 3 iterations
Variable Coefficient Std Error t-Statistic Prob
C 8.369394 0.121620 68.81619 0.0000
Trang 8TIME 0.007207 0.001594 4.522669 0.0000
AR(1) 1.086792 0.091797 11.83907 0.0000
AR(2) -0.395980 0.133224 -2.972275 0.0036
R-squared 0.957015 Mean dependent var 8.783281
Adjusted R-squared 0.955480 S.D dependent var 0.339120
S.E of regression 0.071554 Akaike info criterion -2.394936
Sum squared resid 0.573436 Schwarz criterion -2.276894
Log likelihood 145.1037 F-statistic 623.3854
Durbin-Watson stat 2.042319 Prob(F-statistic) 0.000000
Inverted AR Roots 86 11+.43i 11 -.43i
Như vậy mô hình chỉ bị hiện tượng tự tương quan bậc 2
4 Genr dummy = @trend>17
Ls log(greenbean) c time dummy dummy*time
Dependent Variable: LOG(GREENBEAN)
Method: Least Squares
Date: 07/09/12 Time: 19:52
Sample: 1990:01 1999:12
Included observations: 120
Variable Coefficient Std Error t-Statistic Prob
C 7.774730 0.051564 150.7791 0.0000 TIME 0.035511 0.005178 6.857967 0.0000
DUMMY 0.652297 0.058953 11.06464 0.0000
DUMMY*TIME -0.028889 0.005192 -5.563966 0.0000
R-squared 0.905143 Mean dependent var 8.759996
Adjusted R-squared 0.902690 S.D dependent var 0.365368
S.E of regression 0.113975 Akaike info criterion -1.472916
Sum squared resid 1.506866 Schwarz criterion -1.380000
Log likelihood 92.37496 F-statistic 368.9660
Durbin-Watson stat 0.494828 Prob(F-statistic) 0.000000
Trường hợp dummy = 0
LOG(GREENBEAN) = 7.774729855 + 0.03551050598*TIME
Trường hợp dummy = 1
LOG(GREENBEAN) = (7.774729855 + 0.652297293) + (0.03551050598 -0.02888899538)*TIME
= 8.42 + 0.0066*TIME
Khử tương quan bậc 1
Dependent Variable: LOG(GREENBEAN)
Method: Least Squares
Date: 07/09/12 Time: 20:15
Sample(adjusted): 1990:02 1999:12
Included observations: 119 after adjusting endpoints
Convergence achieved after 10 iterations
Variable Coefficient Std Error t-Statistic Prob
C 7.459737 0.234198 31.85228 0.0000 TIME 0.064054 0.015755 4.065670 0.0001
DUMMY 0.941740 0.255305 3.688692 0.0003
DUMMY*TIME -0.057202 0.016028 -3.568962 0.0005
AR(1) 0.774075 0.058762 13.17302 0.0000
Trang 9R-squared 0.959818 Mean dependent var 8.767149
Adjusted R-squared 0.958408 S.D dependent var 0.358375
S.E of regression 0.073087 Akaike info criterion -2.353220
Sum squared resid 0.608957 Schwarz criterion -2.236450
Log likelihood 145.0166 F-statistic 680.7748
Durbin-Watson stat 1.549588 Prob(F-statistic) 0.000000
Inverted AR Roots 77
Khử tương quan bậc 2
Dependent Variable: LOG(GREENBEAN)
Method: Least Squares
Date: 07/09/12 Time: 20:16
Sample(adjusted): 1990:03 1999:12
Included observations: 118 after adjusting endpoints
Convergence achieved after 9 iterations
Variable Coefficient Std Error t-Statistic Prob
C 7.609668 0.151062 50.37452 0.0000
TIME 0.052946 0.011287 4.691014 0.0000
DUMMY 0.799395 0.170704 4.682927 0.0000
DUMMY*TIME -0.046123 0.011509 -4.007487 0.0001
AR(1) 0.999142 0.090708 11.01487 0.0000
AR(2) -0.291538 0.091365 -3.190902 0.0018
R-squared 0.961026 Mean dependent var 8.774809
Adjusted R-squared 0.959287 S.D dependent var 0.349983
S.E of regression 0.070618 Akaike info criterion -2.413553
Sum squared resid 0.558534 Schwarz criterion -2.272671
Log likelihood 148.3996 F-statistic 552.3486
Durbin-Watson stat 1.938195 Prob(F-statistic) 0.000000
Inverted AR Roots 50+.20i 50 -.20i
Mô hình không có tự tương quan bậc 3
Dependent Variable: LOG(GREENBEAN)
Method: Least Squares
Date: 07/09/12 Time: 20:16
Sample(adjusted): 1990:04 1999:12
Included observations: 117 after adjusting endpoints
Convergence achieved after 10 iterations
Variable Coefficient Std Error t-Statistic Prob
C 7.654653 0.199121 38.44212 0.0000
TIME 0.049805 0.013935 3.574166 0.0005
DUMMY 0.752098 0.220551 3.410087 0.0009
DUMMY*TIME -0.042971 0.014193 -3.027528 0.0031
AR(1) 1.025955 0.094943 10.80603 0.0000
AR(2) -0.380911 0.132520 -2.874360 0.0049
AR(3) 0.094626 0.095665 0.989138 0.3248
R-squared 0.958708 Mean dependent var 8.783281
Adjusted R-squared 0.956456 S.D dependent var 0.339120
S.E of regression 0.070765 Akaike info criterion -2.400942
Sum squared resid 0.550844 Schwarz criterion -2.235684
Log likelihood 147.4551 F-statistic 425.6613
Durbin-Watson stat 1.992929 Prob(F-statistic) 0.000000
Inverted AR Roots 67 18+.33i 18 -.33i
Tương tự cho stickyrice, shrimp, seafish