I. Cơ sở lý luận Đề bài: Thu nhập và tiền tích lũy có tác động như thế nào đối với mức sống của các hộ gia đình tại một địa phương Bộ số liệu y: chi phí tiêu dùng(triệu đồng năm) x1: thu nhập(triệu đồngnăm) x2: tiền tích lũy(triệu đồng) obs Y X1 X2 1 70.00000 80.00000 810.0000 2 65.00000 100.0000 1009.000 3 90.00000 120.0000 1273.000 4 95.00000 140.0000 1425.000 5 110.0000 160.0000 1633.000 6 115.0000 180.0000 1876.000 7 120.0000 200.0000 2052.000 8 140.0000 220.0000 2201.000 9 155.0000 240.0000 2435.000 10 150.0000 260.0000 2686.000
Trang 1Báo cáo thực hành
Môn : Kinh Tế Lượng
Giảng viên : Trịnh Thị Huyền Trang
Sinh viên thực hiện : Phạm Thị Vì
: Đỗ Thị Thúy Vui
Lớp : KTAK8.4
Khoa : Kinh Tế
Trang 2I Cơ sở lý luận
Đề bài: Thu nhập và tiền tích lũy có tác động như thế nào đối với
mức sống của các hộ gia đình tại một địa phương
Bộ số liệu
y: chi phí tiêu dùng(triệu đồng/ năm)
x1: thu nhập(triệu đồng/năm)
x2: tiền tích lũy(triệu đồng)
10 150.0000 260.0000 2686.000
II Hồi quy
Ta có mô hình hồi quy tyến tính thể hiện sự phụ thuộc của chi phí tiêu dùng vào thu nhập và tiền tích lũy:
Y i = c 3 +c 1 *x 1 +c 2 *x 2
Từ bảng số liệu, sử dụng phần mềm eviews ta được bảng kết
quả:
Dependent Variable: CHIPHITIEUDNG
Method: Least Squares
Date: 05/11/13 Time: 09:02
Sample: 1 10
Included observations: 10
Variable Coefficient Std Error t-Statistic Prob.
Trang 3THUNHAP 0.941537 0.822898 1.144172 0.2902
TIENTICHLUY -0.042435 0.080664 -0.526062 0.6151
R-squared 0.963504 Mean dependent var 111.0000
Adjusted R-squared 0.953077 S.D dependent var 31.42893
S.E of regression 6.808041 Akaike info criterion 6.917411
Sum squared resid 324.4459 Schwarz criterion 7.008186
Log likelihood -31.58705 F-statistic 92.40196
Durbin-Watson stat 2.890614 Prob(F-statistic) 0.000009
Estimation Command:
=====================
LS CHIPHITIEUDNG THUNHAP TIENTICHLUY C
Estimation Equation:
=====================
CHIPHITIEUDNG = C(1)*THUNHAP + C(2)*TIENTICHLUY + C(3)
Substituted Coefficients:
=====================
CHIPHITIEUDNG = 0.9415373424*THUNHAP - 0.04243452958*TIENTICHLUY + 24.77473327
Giải thích ý nghĩa của hệ số hồi quy riêng:
c 1= 0.9415373424 cho biết khi thu nhập tăng hoăc giảm 1% thì chi chí tiêu dùng sẽ tăng hoặc giảm trung bình khoảng
0.9415373424% giữ tiền tích lũy không đổi
c 2 = -0.0424345958 cho biết khi tiền tích lũy tăng hoặc giảm 1% thì chi phí tiêu dùng thực sẽ tăng hoặc giảm trung bình khoảng -0.04243452958% khi thu nhập không đổi
kiểm tra ý nghĩa thống kê của hệ số hồi quy:
kiểm định C 1 :
giả thiết : h0: c1=0; h1: c1#0
Từ bảng số liệu, sử dụng phần mềm eviews ta được bảng kết
quả:
Trang 4Wald Test:
Equation: Untitled
Null Hypothesis: C(1)=0
F-statistic 1.309130 Probability 0.290165
Chi-square 1.309130 Probability 0.252552
Nhận xét: Ta thấy giá trị p-value của thống kê f =0.290165 lớn
hơn mức ý nghĩa α=0.05 ⇒chưa có cơ sở bác bỏ giả thiết H0 hay
C1 có ý nghĩa thống kê
Kiểm định C 2:
Giả thiết: H0: C2=0; H1: C2#0
Từ bảng số liệu, sử dụng phần mềm eviews ta được bảng kết
quả:
Wald Test:
Equation: Untitled
Null Hypothesis: C(2)=0
F-statistic 0.276741 Probability 0.615095
Chi-square 0.276741 Probability 0.598845
Nhận xét: Ta thấy giá trị p-value của thống kê f =0.615095 lớn
hơn mức ý nghĩa α=0.05 ⇒chưa có cơ sở bác bỏ giả thiết H0 hay
C2 có ý nghĩa thống kê
Ý nghĩa của hệ số xác định R 2: kiểm định sự phù hợp của hàm hồi quy
Giả thiết : H0:R2=0; H1: R2#0
Nhận xét: Ta thấy giá trị p-value của thống kê f =0.000009 nhỏ
hơn mức ý nghĩa α=0.05 ⇒bác bỏ giả thiết H0 hay mô hình có ý nghĩa
III Kiểm tra khuyết tật của mô hình
1 Đa cộng tuyến
Khái niện:
Trang 5Đa cộng tuyến xảy ra khi các biến độc lập trong mô hình có mối quan hệ cộng tuyến với nhau
Hậu quả của đa cộng tuyến:
- Phương sai, độ lệch chuẩn của các ước lượng trung bình nhỏ nhất lớn
- Khoảng tin cậy của hệ số hồi quy
- Tỷ số t mất ý nghĩa
- R2 cao nhưng tỷ số t ít ý nghĩa
- Các ước lượng trung bình bé nhất và các sai số tiêu chuẩn của chúng trở nên rất nhạy đối với những thay đổi nhỏ trong số liệu
- Dấu của các ước lượng của hệ số hồi quy có thể sai
- Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, mô hình sẽ thay đỏi về độ lớn của các ước lượng hoặc dấu của chúng
Phương pháp phát hiện đa cộng tuyến:
- Mô hình có các giá trị R2 cao trong khi các giá trị thống
kê t rất thấp
- Dùng ma trận hệ số tương quan giữa các biến độc lập
Hệ số tương quan từ 0.8 trở lên là cao, từ 0.9 trở lên là rất cao
- Dùng mô hình hồi quy phụ, nếu R2 của mô hình hồi quy phụ cao hơn mô hình hồi quy chính thì mô hình hồi quy chính có xảy ra hiện tượng đa cộng tuyến
- Dùng chỉ sổ phóng đại phương sai, nếu VIF >=10, mô hình xảy ra hiện tượng đa cộng tuyến rất cao Từ 5 trở lên
là có hiện tượng ĐCT cao
Trang 6Cách khắc phục đa cộng tuyến:
- Dựa vào các thông tin tiên nghiệm, các đề tài nghiên cứu trước về vấn đề tương tự về vấn đề nghiên cứu các mô hình KTL trong trong các nghiên cứu này có tính khả thi và có thể khắc phụ được thì tiến hành
- Thu thập thêm số liệu (n=> N) có thể khắc phụ được hiện tượng đa cộng tuyến
- Loại bỏ biến gây ra hiện tượng đa cộng tuyến Chọn biến ít
có ý nghĩa thống kê hơn loại ra trước (điều này chỉ mang tính tương đối)
- Kết hợp giữa số liệu chuổi thời gian và số liệu chéo có thể khắc phục được hiện tượng đa cộng tuyến
- Dùng mô hình sai phân
B1: xây dựng mô hình hồi quy gốc ban đầu
B2: xây dựng mô hình hồi quy thứ hai, trong đó, loại bỏ một quan sát đầu tiên (do mô hình hồi quy đúng với t quan sát thì cũng đúng với t-1 quan sát)
B3: Dùng mô hình ở B1 – B2 ta có mô hình sai phân bậc1
Đặc điểm: Mô hình sai phân B3 có thể giảm hiện tượng đa cộng tuyến của các biến độc lập
Kiểm định khuyết tật của các mô hình bằng mô hình hồi quy phụ
Mô hình hồi quy gốc: Y i = c 3 +c 1 *x 1 +c 2 *x 2 [1]
Trang 7Hồi quy phụ của X1 theo X2 : X1= α1+ α2X2 + v [2]
Kiểm định hiện tượng đa cộng tuyến
Dependent Variable: THUNHAP
Method: Least Squares
Date: 05/11/13 Time: 16:07
Sample: 1 10
Included observations: 10
Variable Coefficient Std Error t-Statistic Prob
TIENTICHLUY 0.097923 0.001578 62.04047 0.0000
C -0.386271 2.897956 -0.133291 0.8973
R-squared 0.997926 Mean dependent var 170.0000
Adjusted R-squared 0.997667 S.D dependent var 60.55301
S.E of regression 2.925035 Akaike info criterion 5.161346
Sum squared resid 68.44662 Schwarz criterion 5.221863
Log likelihood -23.80673 F-statistic 3849.020
Durbin-Watson stat 2.068509 Prob(F-statistic) 0.000000
Giả thiết kiểm định: H0: α2= 0: Mô hình gốc [1] không có đa cộng tuyến
H1: α2 0 : Mô hình gốc [1] có đa cộng tuyến
Wald Test:
Equation: Untitled
Null Hypothesis: C(1)=0
F-statistic 3849.020 Probability 0.000000
Chi-square 3849.020 Probability 0.000000
Nhận xét: Ta thấy giá trị p-value của thống kê f =0.000000 nhỏ
hơn mức ý nghĩa α=0.05 ⇒ bác bỏ giả thiết H0 haymô hình [1] có
đa cộng tuyến
2 Phương sai sai số thay đổi
a Nguyên nhân của phương sai sai số thay đổi
-Do bản chất của các mối quan hệ kinh tế
-Do kĩ thuật thu thập số liệu được cải tiến σ2 dường như giảm
- Do con người học được hành vi trong quá khứ
- Do trong mẫu xuất hiện các quan sát ngoại lai
Trang 8- Do hàm bị định dạng sai
b Hậu quả của phương sai sai số thay đổi
-Các ước lượng bình phương nhỏ nhất vẫn là không lệch nhưng không hiệu quả
- Ước lượng của phương sai sẽ bị chệch như vậy làm mất khi kiểm định
c Phát hiện phương sai sai số thay đổi
2.1 Kiểm định phương sai sai số thay đổi bằng kiểm định White
Kiểm định bằng hồi quy phụ không có tích chéo giữa các biến độc lập
ei2 = α1 + α2 X2i + α3X3i + α4X + α5X + Vi (2)
H0: Mô hình [1] không có phương sai sai số thay đổi( đồng đều)
H1: Mô hình [1] có phương sai sai số thay đổi
White Heteroskedasticity Test:
F-statistic 0.263824 Probability 0.889503
Obs*R-squared 1.742766 Probability 0.782935
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/11/13 Time: 16:24
Sample: 1 10
Included observations: 10
Variable Coefficient Std Error t-Statistic Prob
C 156.0257 146.1699 1.067427 0.3346
THUNHAP 1.740377 23.86962 0.072912 0.9447
THUNHAP^2 -0.002361 0.062563 -0.037743 0.9714
TIENTICHLUY -0.313531 2.249628 -0.139370 0.8946
TIENTICHLUY^2 6.00E-05 0.000574 0.104507 0.9208
R-squared 0.174277 Mean dependent var 32.44459
Adjusted R-squared -0.486302 S.D dependent var 37.13648
S.E of regression 45.27457 Akaike info criterion 10.77022
Sum squared resid 10248.93 Schwarz criterion 10.92151
Log likelihood -48.85110 F-statistic 0.263824
Durbin-Watson stat 2.591078 Prob(F-statistic) 0.889503
Nhận xét: Ta thấy giá trị p-value của thống kê f =0.889503 lớn
hơn mức ý nghĩa α=0.05 ⇒ chưa có cơ sở bác bỏ giả thiết H0 hay
mô hình [1] không có phương sai sai số thay đổi
Trang 92.2 Kiểm định phương sai sai số thay đổi bằng kiểm định park
lnei2 = α1 + α2lnX2 + Vi
Dependent Variable: LE2
Method: Least Squares
Date: 05/12/13 Time: 09:50
Sample: 1 10
Included observations: 10
Variable Coefficient Std Error t-Statistic Prob
LTHUNHAP 9.950438 45.85729 0.216987 0.8344
LTIENTICHLUY -10.78886 45.77831 -0.235676 0.8204
C 31.75925 106.7946 0.297386 0.7748
R-squared 0.032002 Mean dependent var 2.413262
Adjusted R-squared -0.244568 S.D dependent var 2.115582
S.E of regression 2.360148 Akaike info criterion 4.798651
Sum squared resid 38.99210 Schwarz criterion 4.889427
Log likelihood -20.99325 F-statistic 0.115712
Durbin-Watson stat 2.500326 Prob(F-statistic) 0.892401
Nhận xét: Ta thấy giá trị p-value của thống kê f =0.892401 lớn hơn mức ý
nghĩa α=0.05 ⇒ chưa có cơ sở bác bỏ giả thiết H0 haymô hình [1] không có phương sai sai số thay đổi
2.3 Kiểm định phương sai sai số thay đổi bằng kiểm định Glejser
│e i │ = β1 + β2X3 + V
Dependent Variable: TTE
Method: Least Squares
Date: 05/12/13 Time: 10:06
Sample: 1 10
Included observations: 10
Variable Coefficient Std Error t-Statistic Prob
THUNHAP 0.013562 0.445758 0.030425 0.9766
TIENTICHLUY -0.002090 0.043695 -0.047836 0.9632
C 6.098307 3.657783 1.667214 0.1394
R-squared 0.020651 Mean dependent var 4.766925
Adjusted R-squared -0.259163 S.D dependent var 3.286507
S.E of regression 3.687869 Akaike info criterion 5.691300
Sum squared resid 95.20266 Schwarz criterion 5.782075
Log likelihood -25.45650 F-statistic 0.073803
Durbin-Watson stat 2.215308 Prob(F-statistic) 0.929568
Trang 10Nhận xét: Ta thấy giá trị p-value của thống kê f =0.929568 lớn
hơn mức ý nghĩa α=0.05 ⇒ chưa có cơ sở bác bỏ giả thiết H0 hay
mô hình [1] không có phương sai sai số thay đổi
2.4 Kiểm định phương sai sai số thay đổi bằng kiểm định dựa trên biến phụ thuộc
Hàm hồi quy: ei2 = α1 + α2Y^2 + V
Dependent Variable: E2
Method: Least Squares
Date: 05/12/13 Time: 10:14
Sample: 1 10
Included observations: 10
Variable Coefficient Std Error t-Statistic Prob
CHIPHITIEUF -0.257033 0.415783 -0.618190 0.5536
C 60.97523 47.72916 1.277526 0.2372
R-squared 0.045592 Mean dependent var 32.44459
Adjusted R-squared -0.073709 S.D dependent var 37.13648
S.E of regression 38.48080 Akaike info criterion 10.31505
Sum squared resid 11846.17 Schwarz criterion 10.37557
Log likelihood -49.57526 F-statistic 0.382159
Durbin-Watson stat 2.228714 Prob(F-statistic) 0.553638
Nhận xét: Ta thấy giá trị p-value của thống kê f =0.553638 lớn
hơn mức ý nghĩa α=0.05 ⇒ chưa có cơ sở bác bỏ giả thiết H0 hay
mô hình [1] không có phương sai sai số thay đổi
3 Tự tương quan
Khái niệm: Tự tương quan là sự tương quan giữa các thành phần của chuỗi các quan sát được sắp xếp theo thứ tự thời gian hoặc không gian
Nguyên nhân:
- Nguyên nhân khách quan
+ Quán tính
+ Hiện tượng mạng nhện
+ Trễ
- Nguyên nhân chủ quan
+ Xử lí số liệu
+Sai lệch do lập mô hình
Trang 11 Hậu quả của tự tương quan
- Ước lượng bình phương nhỏ nhất thông thường vẫn là ước lượng tuyến tính không chệch nhưng chúng không phải là ước lượng hiệu quả nữa
-Phương sai ước lượng được của các ước lượng bình phương bé nhất thông thường là chệch
- Các kiểm định t và F nói chung không đáng tín cậy
- R2 có thể là độ đo không đáng tin cậy cho R2 thực tế
- Các phương sai và các sai số tiêu chuẩn của dự đoán đã tính được cũng có thể không hiệu quả
Phát hiện tự tương quan
-Phương pháp đồ thị
- Một số phép kiểm định
+Kiểm định các đoạn mạch
+Kiểm định χ2 về tính độc lập về các phần dư
+ Kiểm định d.Durbin – Watson
+Kiểm định Breusch – Godfrey
quan bằng kiểm định Durbin- Watson
Dependent Variable: CHIPHITIEUDNG
Method: Least Squares
Date: 05/12/13 Time: 10:16
Sample: 1 10
Included observations: 10
Variable Coefficient Std Error t-Statistic Prob
THUNHAP 0.941537 0.822898 1.144172 0.2902
Trang 12TIENTICHLUY -0.042435 0.080664 -0.526062 0.6151
C 24.77473 6.752500 3.668972 0.0080
R-squared 0.963504 Mean dependent var 111.0000
Adjusted R-squared 0.953077 S.D dependent var 31.42893
S.E of regression 6.808041 Akaike info criterion 6.917411
Sum squared resid 324.4459 Schwarz criterion 7.008186
Log likelihood -31.58705 F-statistic 92.40196
Durbin-Watson stat 2.890614 Prob(F-statistic) 0.000009
Dqs = 2.890614
N = 10
K = 2
α=0.05
dl = 0.697
Du = 1.641
4 - dl = 3.303
4 – du = 2.359
Ta thấy 4 – du < dqs < 4 - dl không có kết luận về tự tương quan của
mô hình [1]
3.2Kiểm định: Tự tương quan bằng kiểm định Breush- Godfrey
Giả thiết kiểm định: H0: Mô hình [1] không có tự tương quan bậc nhất
H1: Mô hình [1] có tự tương quan bậc nhất
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 2.786000 Probability 0.146132
Obs*R-squared 3.170953 Probability 0.074959
Nhận xét: Ta thấy giá trị p-value của thống kê f =0.146132 lớn
hơn mức ý nghĩa α=0.05 ⇒ chưa có cơ sở bác bỏ giả thiết H0 hay
mô hình [1] không có tự tương quan bậc nhất
Giả thiết kiểm định: H0: Mô hình [1] không có tự tương quan bậc hai
Trang 13H1: Mô hình [1] có tự tương quan bậc hai
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 2.227981 Probability 0.203311
Obs*R-squared 4.712330 Probability 0.094783
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 05/12/13 Time: 10:28
Presample missing value lagged residuals set to zero.
Variable Coefficient Std Error t-Statistic Prob
THUNHAP -0.306820 0.751355 -0.408356 0.6999
TIENTICHLUY 0.031500 0.073743 0.427165 0.6870
C -2.282113 5.909859 -0.386154 0.7153
RESID(-1) -0.858424 0.407799 -2.105019 0.0892
RESID(-2) -0.560145 0.463973 -1.207278 0.2813
Nhận xét: Ta thấy giá trị p-value của thống kê f =0.203311 lớn hơn mức ý
nghĩa α=0.05 ⇒ chưa có cơ sở bác bỏ giả thiết H0 haymô hình [1] không có
tự tương quan bậc hai
4 Xác định Y i ; Y^i; E i vẽ đồ thị
Actual Fitted Residual Residual Plot
70.0000 65.7258 4.27425 | | * |
65.0000 76.1120 -11.1120 |* | |
90.0000 83.7401 6.25994 | | * |
Trang 1495.0000 96.1208 -1.12076 | *| | 110.000 106.125 3.87488 | | * | 115.000 114.644 0.35572 | * | 120.000 126.007 -6.00655 | * | | 140.000 138.515 1.48545 | | * | 155.000 147.416 7.58438 | | * | 150.000 155.595 -5.59530 | * | |
Đồ thị của ^y i
Trang 1580
100
120
140
160
CHIPHITIEUF
Trang 16Đồ thị của Y i
60
80
100
120
140
160
CHIPHITIEUDNG
Trang 17Đồ thị của e i
-12
-8
-4
0
4
8
E
Trang 18-8
-4
0
4
8
60 80 100 120 140 160