Dữ liệu có 9 biến nhưng ta không chắc chắn cả 9 biến sẽđược đưa vào mô hình, bởi vì sẽ có những biến không có ý nghĩa thốngkê.Ta sẽ tiến hành dự đoán các biến có thể được đưa vào mô hình
Trang 1Khoa Kinh Tế Quốc Tế
Bộ môn kinh tế học quốc tế và phương pháp lượng
Trang 2Hà Nội, 11/04/2013
MỤC LỤC
A.LỜI MỞ ĐẦU 3
B NỘI DUNG 4
Bài tập 1: Xây dựng mô hình nghiên cứu về lượng tiền gửi trong sổ tài khoản tiết kiệm ở Mỹ 4
I Cơ sở lý thuyết và xây dựng mô hình 4
II Kiểm định mô hình 7
III Khắc phục các khuyết tật 13
Bài tập 2: Xây dựng mô hình nghiên cứu về lượng tiêu thụ thịt lợn ở Mỹ 17
I Cơ sở lý thuyết và xây dựng mô hình 17
II Kiểm định mô hình 20
III Khắc phục mô hình: 29
C KẾT LUẬN 32
Trang 3A.LỜI MỞ ĐẦU
Hiện nay, hầu hết các nhà nghiên cứu kinh tế, các doanh nghiệp, chính phủcác quốc gia, các tổ chức kinh tế đều sử dụng các công cụ toán học để lượng hóacác vấn đề kinh tế nhằm sáng tỏ chân lý của các lý thuyết kinh tế hiện đại từ đó,các lý thuyết này ứng dụng vào cuộc sống một cách thiết thực Công việc này đượcgọi là kinh tế lượng
Kinh tế lượng được dịch từ chữ “Econometrics” nghĩa là “Đo lường kinh tế”
Kinh tế lượng là một bộ phận của Kinh tế học, được hiểu theo nghĩa rộng là mônkhoa học kinh tế giao thoa với thống kê học và toán kinh tế Kinh tế lượng trướcđây thường dùng công cụ toán học thuần túy để đo lường mối quan hệ kinh tế, côngviệc này rất phức tạp Ngày nay, với xu thế phát triển công nghệ thông tin, các nhànghiên cứu kinh tế lượng đã sử dụng các phần mềm ứng dụng, để giải bài toán kinh
Trang 4còn hạn chế, bài báo cáo này còn tồn tại nhiều sai sót, chúng em mong nhận đượclời nhận xét, phê bình để có thể hoàn thiện hơn nữa.
ở Mỹ và mức độ ảnh hưởng của các yếu tố ấy lên tượng tiền gửi tiết kiệm
2 Xây dựng mô hìnha) Mô tả biến
Biến phụ thuộc: QDPASS - Tổng số tiền gửi trong tài khoản sổ tiết kiệm
của S&L ở MỸ theo quý (triệu đô la)
Các biến độc lập có thể được đưa vào trong mô hình:
QYDUS: thu nhập khả dụng trong một quý (triệu đô la).
QYPERM: thu nhập cố định theo quý (triệu đô la).
QRDPASS: lãi suất của tài khoản tiền gửi.
QRTB3Y: lãi suất của tín phiếu kho bạc thời hạn 3 tháng.
SPREAD = QRDPASS – QRTB3Y.
MMCDUM: biến giả, = 0 trước quý 3 năm 1978, khi mà các chứng chỉ
tiền tệ thị trường được hợp pháp hóa sau quý 3 thì biến giả này có giá trị
Trang 5Việc phân tích tốt dữ liệu tốt không xuất phát từ dữ liệu mà xuấtphát từ lý thuyết Dữ liệu có 9 biến nhưng ta không chắc chắn cả 9 biến sẽđược đưa vào mô hình, bởi vì sẽ có những biến không có ý nghĩa thốngkê.
Ta sẽ tiến hành dự đoán các biến có thể được đưa vào mô hình:
Theo lý thuyết, khi thu nhập tăng lên, thì cả tiết kiệm và chi tiêuđều tăng và ngược lại Do vậy thu nhập khả dụng trong một quý có ảnhhưởng đến tổng số tiền gửi trong tài khoản tiết kiệm.Vì vậy, ta sẽ đưabiến QYDUS vào mô hình
Mối quan hệ giữa lãi suất và tiết kiệm: khi lãi suất tiền gửi tăng,dẫn của việc tổng số tiền gửi tiết kiệm có thể tăng Tuy nhiên, lãi suấttiền gửi chưa thể hiện tất cả sự thay đổi về tổng số tiền trong tài khoảntiết kiệm Ta phải đặt lãi suất tiết kiệm trong mối quan hệ so sánh với mộtloại lãi suất khác đó là lãi suất tín phiếu kho bạc Nên ta sẽ sử dụng biếnQRTB3Y và QRDPASS cho mô hình
Biến MMCDUM là biến giả có giá trị bằng 0 trước quý 3 năm 1978,sau đó khi chứng chỉ tiền tệ thị trường được hợp pháp hóa thì biến nàynhận giá trị bằng 1
Trang 6Tên biến Dấu kìvọng Diễn giải
QYDUS
+ Khi thu nhập tăng lên thì tỉ lệ tiết kiệm trên thu
nhập cũng tăng lên, bởi vì nhu cầu tiêu dùng cho các hàng hóa thiết yếu của họ đã được thỏa mãn, hơn nữa tâm lí tiết kiệm để tái đầu tư khiến cho phần tiết kiệm trong tổng thu nhập ngày càng lớn
QYPERM + Thu nhập tăng, dẫn đến tiết kiệm tăng, tiền gửi vào ngân hàng tangQRDPASS
+ Khi lãi suất tăng thì số tiền gửi tăng người dân sẽ
gửi tiền nhiều hơn
QRTB3Y - Khi lãi suất tín phiếu kho bạc tăng lên, người dâncó xu hướng mua trái phiếuMMCDUM
- Chính phủ hợp pháp hóa chứng chỉ tiền gửi MMC
đã tạo điều kiện cho kênh đầu tư khác phát triển thu
hút tiền của dân
3 Diễn giải mô hình
Sử dụng stata thu được kết quả hồi quy như sau:
QDPASS = 198580.1 + 99.46526* QYDUS - 34137.95 *QRDPASS - 2081 478*
Trang 7Ý nghĩa các hệ số trong hàm hồi quy mẫu
β1 = 198580.1 : Khi các nhân tố khác không ảnh hưởng thì tiền gửi trong tài khỏan
passbook là 198580.1
β2 = 99.46526 : Khi các nhân tố khác không ảnh hưởng , thu nhập tăng lên 1 đơn
vị thì tiền gửi trong tài khoản passbook sẽ tăng thêm 99.46526 đơn vị
β3 = - 34137.95 : Khi các nhân tố khác không ảnh hưởng, lãi suất trong tài khoản
passbook tăng thêm 1phần trăm thì tiền gửi trong đó sẽ giảm đi 34137.95 đơn vị
β4 = - 2081 478: Khi các nhân tố khác không ảnh hưởng , lãi suất tính theo kì 3
tháng của tín phiếu kho bạc tăng thêm 1 phần trăm thì tiền gửi trong tài khoản passbook sẽ giảm đi 2081 478
β5 = - 26458.28 : Chứng chỉ tiền gửi được hợp pháp thì nó sẽ làm tiền gửi trong tài
khoản passbook giảm đi 26458.28
II Kiểm định mô hình
1 Kiểm định ý nghĩa thống kê của các hệ số hồi quy
Trang 8Giá trị R2 là tiêu chí đánh giá sự phù hợp của mô hình
Ta xét cặp giả thiết sau: {H0: R2=0
H1: R2≠ 0 với α = 0.05
Ta có: Fobs= R
2
1−R2×n−k k −1=162.61>F(4,35) nên có cơ sở để bác bỏ H0Vậy mô hình là phù hợp
3 Kiểm định xem có nên bỏ hay thêm biến vào mô hình
Kiểm định thừa biến
Vì tất cả hệ số góc đều có ý nghĩa thống kê và mô hình phù hợp nên
có căn cứ cho rằng mô hình không thừa biến.Tiếp theo, ta ước lượng xem
mô hình có bị thiếu biến không Kiểm tra liệu mô hình có thiếu biến haykhông rất quan trọng bới nó liên quan tới giả định biến đ ộc lập là sai sốkhông có hiện tượng tương quan với nhau.Tự tương quan làm cho hệ sốhồi quy không còn là ước lượng vững
Kiểm định xem mô hình có thiếu biến hay không
Ta sử dụng Ramsey Regression Equation Specification Error Test
(RESET) test
Trong stata, ta dung lệnh: ovtest, ta thu được bảng kết quả
Prob > F = 0.4605 F(3, 32) = 0.88 Ho: model has no omitted variables Ramsey RESET test using powers of the fitted values of qdpass ovtest
Ta kiểm định cặp giả thiết : {H0: mô ì nh kh ô ng b ị thi ế u bi ế n
Trang 9Từ tất cả những kiểm định nói trên, mô hình cuối cùng tổng tiền gửi trongtài khoản sổ tiết kiệm của S&L – Mỹ là:
QYDPASS = β 1 + β 2 QYDUS + β 3 QRTB3Y + β 4.QRDPASS
β 4 MMCDUM + U (1)
4 Kiểm định đa cộng tuyến
Mô hình tốt là mô hình phải đạt được các tính chất BLUE (tuyến tính,không chệch, hiệu quả nhất) Tuy nhiên trên thực tế do xây dựng sai môhình hoặc do bản chất của dữ liệu, dẫn tới mô hình không đạt được đầy đủcác tính chất trên Một trong những vấn đề ảnh hưởng đến mô hình mà tagọi là vi phạm các giả định, đó là Đa cộng tuyến
Bây giờ chúng ta cùng khảo sát xem, mô hình có bị đa cộng tuyến haykhông
Trong stata, ta sử dụng lệnh vif, được kết quả như sau:
Có hệ số Vif của các biến <10 , ta suy ra mô hình không bị hiện tượng
đa cộng tuyến
5 Kiểm định sai số ngẫu nhiên phân phối chuẩn
Ta kiểm định xem mô hình có gặp phải vấn đề phân phối khôngchuẩn)hay không
Kiểm định Skewness-Kurtosis:
Trang 10Cặp giả thiết: { H0: p h ần d ư có p h ân p h ối c h uẩn
H1: p h ần d ư k h ông có p h ân p h ối c h uẩn
Sử dụng Stata để kiểm định:
u 39 0.7020 0.9862 0.15 0.9293 Variable Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2 joint Skewness/Kurtosis tests for Normality
sktest u
Ta thấy p-value = 0.9293> α => chấp nhận H0Vậy, sai số ngẫu nhiên có phân phối chuẩn
6 Kiểm định phương sai sai số thay đổi
Một vấn đề khác mà mô hình cũng có thể gặp phải, đó là phương sai củasai số thay đổi Điều này không ảnh hưởng đến tính không chệch, nhưnglàm cho mô hình kém hiệu quả hơn
Bây giờ ta cùng kiểm định xem có xảy ra hiện tượng phương sai sai sốthay đổi trong mô hình không
Cách 1: Sử dụng đồ thị :
Trang 11Cặp giả thiết: {H0: Ph ương sai sai s ố không đổi
H1: Phương sai sai s ố thay đổi
Chạy lệnh hettest
Giá trị p-value =0.1603 >α = 0,05, do đó ta có thể bác bỏ H0kết luận rằng mô hình hồi quy không có hiện tượng phương sai sai số thay đổi
Trang 127 Kiểm định tự tương quanCách 1: Sử dụng đồ thị
Ta thực hiện lệnh: tsline e (thể hiện sự thay đổi của e theo thời gian)
Trang 138 Mô hình bị định dạng sai
_cons -15149.02 28233.93 -0.54 0.595 -72356.4 42058.35 _hatsq -1.19e-06 2.20e-06 -0.54 0.590 -5.65e-06 3.26e-06 _hat 1.272852 .5038768 2.53 0.016 2519004 2.293803 qdpass Coef Std Err t P>|t| [95% Conf Interval]
Total 1.5453e+10 39 396239615 Root MSE = 4599.8 Adj R-squared = 0.9466 Residual 782860947 37 21158404 R-squared = 0.9493 Model 1.4670e+10 2 7.3352e+09 Prob > F = 0.0000 F( 2, 37) = 346.68 Source SS df MS Number of obs = 40 linktest
mô hình ban đầu :
Mô hình phù hợp
Mô hình có sai số ngẫu nhiên phân phối chuẩn
Mô hình có phương sai sai số không đổi
Mô hình không thiếu biến
Mô hình không gặp đa cộng tuyến
Mô hình định dạng đúng
Mô hình mắc tự tương quan
Trang 14Ta biến đổi mô hình hồi quy ban đầu thành mô hình mới theo phương phápFGLS
Bước 2: Chạy hồi quy mới reg qpassnew qdusnew qrdpassnew trb3ynew mmcdum
Trang 15Tiến hành kiểm định xem mô hình đã khắc phục tự tương quan chưa :
Trang 16Ta thấy p-value= 0.3075 >α nên mô hình đã không cònmawcs tự tương quan
Vậy ta được mô hình hồi quy mới Lần lượt tiên hành kiểm định lại mô hìnhhôi quy mới, thấy đây là mô hình tối ưu :
QDPASS = 92725.81+ 96.84046*QYDUS 26396.55*QRDPASS 2313.01*QRTB3Y -16752.46*MMCDUM + U
Trang 17-Bài tập 2: Xây dựng mô hình nghiên cứu về lượng tiêu thụ thịt lợn ở Mỹ
I Cơ sở lý thuyết và xây dựng mô hình
1 Vấn đề nghiên cứuCác yếu tố ảnh hưởng đến lượng thịt lợn tiêu thụ ở Mỹ và mức độảnh hưởng của các yếu tố ấy đến lượng tiêu thụ thịt lợn
2 Xây dựng mô hìnha) Các biến kinh tế có thể cân nhắc sử dụng
CONPKt: bình quân đầu người của thịt lợn tiêu thụ ở Mỹtrong quý t
PRIPKt: giá 100pounds thịt lợn (USD/100 Pounds) trong quý t
PRIBFt: giá 100pounds thịt bò (USD/ 100 Pounds) trong quý t
YDUSPt : bình quân đầu người thu nhập ở Mỹ trong quý t( USD)
LYDUSPt: log thu nhập bình quân đầu người
PROPKt: số Pounds thịt lợn sản xuất tại Mỹ trong quý t( tỷ)
D1t bằng 1 trong quý đầu tiên của năm và 0 nếu ngược lại
D2t bằng 1 trong quý thứ hai của năm và 0 nếu ngược lại
D3t bằng 1 trong quý thứ ba của năm và 0 nếu ngược lạib) Mô hình lựa chọn
Có nhiều dạng hàm để miêu tả quy luật kinh tế nêu trên nhưng dạng hàm tuyến tính là tốt nhất Chúng ta sẽ xây dựng mô hình kinh tế lượng
về nhu cầu thịt lợn ở Mỹ với biến phụ thuộc là lượng thịt lợn được tiêu thụ trên đầu người mỗi năm (CONPK) ở Mỹ hàng quý từ năm 1975 đến
1984 Trên thực tế có rất nhiều yếu tố có thể tác động đến lượng tiêu thụ thịt lợn như giá thịt lợn, giá thịt bò, sức mua, mùa vụ… Các yếu tố này đều tác động đến lượng tiêu thụ thịt lợn nhưng ở mức độ khác nhau.Sau khi cân nhắc và lựa chọn , ở đây nhóm xin giả định mô hình ban đầu bao gồm các biến giải thích sau:
Trang 18Tên biến Dấu kìvọng Diễn giải
PRIPK t - Giá 100 pounds thịt lợn tăng thì lượng tiêu dùng
thịt lợn sẽ giảm theo luật cầu
PRIBF t
+ Giá của 100 pounds thịt bò tăng thì lương tiêu dùng
thịt bò sẽ giảm, nên lượng tiêu dùng thịt lợn sẽtăng, vì thịt bò là hàng hóa thay thế của thịt lợn
YDUSP t + Thu nhập khả dụng bình quân đầu người tăng thì
lượng tiêu dùng thịt lợn sẽ tăng
LYDUSP t + Logarit của thu nhập khả dụng bình quân đầu người
tăng thì lượng tiêu dùng thịt lợn sẽ tăng
D1 Khó dự đoán được dấu do biến định tính có nhiều
phạm trù
D2 D3
Theo nhóm biến PROPK là biến sản xuất đại diện cho lượng cung thịt lợn, là
yếu tố tuy có quan hệ đến biến phụ thuộc , nhưng không tác động trực tiếp đến
lượng thịt lợn tiêu thụ (tác động gián tiếp thông qua giá thịt lợn - PRIPK) nên không cần thiết cho vào mô hình Chúng tôi sẽ tiến hành kiểm đinh xem việc bỏ qua biến PROPK là đúng hay sai trong phần dưới của bài báo cáo
Như vậy, mô hình kinh tế lượng được xây dựng là:
-Mô hình hồi quy tổng thể được giả định sẽ có dạng:
CONPK = β 1 + β 2 *PRIPK β 3 *PRIBF+β 4 *YDUSP+β 5 *D1+β 6 *D2+β 7 D3+u i
-Mô hình hồi quy mẫu được giả định sẽ có dạng:
CONPK = ^β1+ ^β2*PRIPK+^β3 PRIBF+^β4*YDUSP+^β5*D1+^β6*D2+β 7 D3
3 Diễn giải mô hình:
Hồi quy conpk theo pripk pribf ydusp d1 d2 d3 ta có:
Trang 19Dựa vào phần mềm Stata, ta được kết quả hồi quy sau:
conpk= 16.91917 - 0.0767559pripk 1.62296d2-1.529973d3
+0.0415561pribf+0.2250244ydusp-0.9170877d1- Hệ số chặn ^β1 =16.91917 : khi tất cả các yếu tố tác động bằng 0 thì lượng tiêu thụ thịt lợn bằng 16.91917 Điều này có vẻ không hợp lý
Hệ số góc ^β2 =-0.0767559: khi giá thịt lợn tăng lên một đơn vị, các yếu tố khác không đổi về mặt trung bình thì lượng thịt lợn tiêu thụ quý 4 sẽ giảm 0.0767559 đơn vị
Hệ số góc ^β3 = 0,415561 :khi giá thịt bò tăng lên một đơn vị, các yếu tố khác không đổi về mặt trung bình thì lượng thịt lợn tiêu thụ quý 4 sẽ tăng 0.0415561 đơn vị
Hệ số góc ^β4 = 0.2250244: Khi thu nhập tăng thêm 1 đơn vị, các yếu
tố khác không đổi về mặt trung bình lượng thịt lợn tiêu thụ trong quý 4 tăng 0.2250244 đơn vị
Hệ số góc ^β5 = -0.9170877: Vơi các yếu tố khác không đổi về mặt trung bình, thì lượng tiêu thụ thịt lợn quý 1 ít hơn quý 4 là
0.9170877 đơn vị
Hệ số góc ^β6 = -1.63396: Với các yếu tố khác không đổi về mặt trung bình, thì lượng tiêu thụ thịt lợn quý 2 ít hơn quý 4 là 1.63396 đơn vị
_cons 16.99717 .6276076 27.08 0.000 15.7203 18.27405 d3 -1.529973 .1860527 -8.22 0.000 -1.9085 -1.151446 d2 -1.63396 .1891289 -8.64 0.000 -2.018746 -1.249175 d1 -.9170877 .1866971 -4.91 0.000 -1.296926 -.5372496 ydusp 2250244 .0799022 2.82 0.008 0624621 .3875867 pribf 0415561 .0035486 11.71 0.000 0343365 .0487757 pripk -.0767559 .0057135 -13.43 0.000 -.0883801 -.0651316 conpk Coef Std Err t P>|t| [95% Conf Interval]
Total 96.8320021 39 2.48287185 Root MSE = 41366 Adj R-squared = 0.9311 Residual 5.64669366 33 171111929 R-squared = 0.9417 Model 91.1853085 6 15.1975514 Prob > F = 0.0000 F( 6, 33) = 88.82 Source SS df MS Number of obs = 40 reg conpk pripk pribf ydusp d1 d2 d3
Trang 20 Hệ số góc ^β7 = -1.529973: Với các yếu tố khác không đổi về mặt trung bình, thì lượng tiêu thụ thịt lợn quý 3 ít hơn quý 4 là 1.529973đơn vị
Hệ số phù hợp R2 = 0,9417: 94,17% các thay đổi trong biến phụ thuộc được giải thích bằng sự thay đổi của các độc lập
Trong mô hình hồi quy ta thấy các biến giải thích có dấu phù hợp với dấu dự kiến
I
II Kiểm định mô hình
1 Kiểm định ý nghĩa thống kê của các hệ số hồi quy
Chạy hồi quy reg conpk pripk pribf ydusp d1 d2 d3 ta có:
Total 96.8320021 39 2.48287185 Root MSE = 41366 Adj R-squared = 0.9311 Residual 5.64669366 33 171111929 R-squared = 0.9417 Model 91.1853085 6 15.1975514 Prob > F = 0.0000 F( 6, 33) = 88.82 Source SS df MS Number of obs = 40 reg conpk pripk pribf ydusp d1 d2 d3