bài tập thực hành phân tích số liệu theo chuỗi thời gian, với sự hỗ trợ của phần mềm Eview 6, để xác định tính thời vụ, tính xu thế của chuỗi, nhằm xây dựng mô hình dự báo cho 5 quan sát cuối cùng. Đây cũng là các bước để xây dựng mô hình dự báo trong thực tế.
Trang 1PHẦN I: GIỚI THIỆU
I.Tổng quan về số liệu:
1.1.Số liệu:
+ Doanh thu bán lẻ và dịch vụ thực phẩm của Mỹ từ tháng 01/ 1992 đến tháng
01/2015( không điều chỉnh theo mùa)
+ Tổng số quan sát: 277
+ Đơn vị tính: triệu USD
Trang 21998M01 207853 2001M01 250746 2004M01 281493
Trang 32007M02 323456 2010M02 312513 2013M02 378639
*Định nghĩa biến : Y là Doanh thu bán lẻ và dịch vụ thực phẩm của Mỹ
Trang 4*Link nguồn số liệu: http://www.census.gov/econ/currentdata/dbsearch?
program=MRTS&startYear=1992&endYear=2015&categories=44X72&dataType=S M&geoLevel=US&adjusted=1¬Adjusted=1&errorData=0
1.2.Mô tả số liệu:
a.Dạng đồ thị:
120,000
160,000
200,000
240,000
280,000
320,000
360,000
400,000
440,000
480,000
520,000
Doanh thu ban le va dich vu thuc pham cua My tu 1/1992 den 1/2015
Đồ thị 1: Đồ thị mô tả giá trị doanh thu bán lẻ của Mỹ theo dạng chuỗi
=>Nhận xét: Chuỗi có xu thế rõ rệt Doanh thu bán lẻ của Mỹ có xu hướng tăn lên
Có thể có tính mùa vụ
b.Đồ thị tần suất:
0
2
4
6
8
10
12
14
16
Series: DOANHTHU Sample 1992M01 2015M01 Observations 277
Mean 302026.8 Median 301299.0 Maximum 506636.0 Minimum 146376.0 Std Dev 82720.42 Skewness 0.027211 Kurtosis 2.033798 Jarque-Bera 10.80886 Probability 0.004497
Đồ thị 2: Đồ thị mô tả doanh thu bán lẻ và dịch vụ thực phẩm của Mỹ ở dạng tần suất
Trang 5*Giải thích:
+ Sample 1992M01 2015M01: Mẫu từ tháng 1 năm 1992 đến tháng 1 năm 2015 + Observations( Tổng số quan sát): 277
+Mean (Trung bình giá trị): 302026.8
+Median(Số trung vị): 301299.0
+Maximum(Giá trị lớn nhất): 506636.0
+Minimum(Giá trị nhỏ nhất): 146376.0
+Std.Dev(Độ lệch chuẩn): 82720.42
+Skewness( Độ bất đối xứng): 0.027211: nhỏ, phân phối gần như đối xứng, hơi lệch trái một chút
+Kurtosis: 2.033798 < 3 đuôi nhọn hơn so với phân phối chuẩn
+Probability: 0.004497 < 0.05 chứng tỏ chuỗi không có phân phối chuẩn
PHẦN II: XÂY DỰNG MÔ HÌNH DỰ BÁO TỐT NHẤT
2.1 Tóm tắt quá trình lựa chọn mô hình dự báo tốt nhất:
2.1.1 Xây dựng mô hình xu thế dạng tuyến tính:
* Dạng mô hình: Y= 0+1*TIME + ei
* Kết quả hồi quy:
Dependent Variable: DOANHTHU
Method: Least Squares
Date: 03/28/15 Time: 15:17
Sample: 1992M01 2014M08
Included observations: 272
Variable Coefficient Std Error t-Statistic Prob.
Adjusted R-squared 0.912465 S.D dependent var 81058.97 S.E of regression 23982.39 Akaike info criterion 23.01535 Sum squared resid 1.55E+11 Schwarz criterion 23.04187
Trang 6Log likelihood -3128.088 Hannan-Quinn criter 23.02600
Prob(F-statistic) 0.000000
*Mô hình xu thế tuyến tính:Yi = 165044.521408 + 984.488934958*TIME+ ei
*Kiểm định:
a Hệ số hồi quy:
Ta có:
+ | t-Statistic| của b0 =56.59323> tc = 1.96 => b0 có ý nghĩa thống kê ở mức 5% + | t-Statistic | của b1= 53.15917> tc = 1.96 => b1 có ý nghĩa thống kê ở mức 5%
b Mô hình hồi quy:
- Ta có: Prob(F-statistic) = 0.0000 < 0.05 chứng tỏ mô hình có ý nghĩa thống kê hay
mô hình có năng lực dự báo cho các giá trị của Y
- Với: R-squared 0.912788 tức là biến TIME giải thích được trên 91% cho doanh thu bán lẻ và dịch vụ thực phẩm => Mô hình dự báo khá tốt
- Với:
+ b0 = 165044.5 => nếu biến TIME = 0 => Dự báo tốt nhất cho Y là 165044.5 + b1= 984.4889 => Với điều kiện các yếu tố khác không thay đổi, khi mà biến TIME tăng 1 đơn vị thì doanh thu bán lẻ và dịch vụ thực phẩm tăng 984.4889 triệu USD
*Đồ thị:
Trang 7-40,000
0
40,000
80,000
100,000 200,000 300,000 400,000 500,000
Residual Actual Fitted
Đồ thị 4: Đồ thị xu thế tuyến tính
2.1.2.Mô hình xu thế phi tuyến ( Bậc 2)
* Dạng mô hình: Y= 0+1 TIME + 2*TIME2 + ei
* Kết quả hồi quy:
Dependent Variable: DOANHTHU
Method: Least Squares
Date: 03/28/15 Time: 15:17
Sample: 1992M01 2014M08
Included observations: 272
Variable Coefficient Std Error t-Statistic Prob.
Adjusted R-squared 0.914144 S.D dependent var 81058.97 S.E of regression 23751.30 Akaike info criterion 22.99963 Sum squared resid 1.52E+11 Schwarz criterion 23.03940 Log likelihood -3124.950 Hannan-Quinn criter 23.01560 F-statistic 1443.717 Durbin-Watson stat 1.655926 Prob(F-statistic) 0.000000
*Mô hình xu thế phi tuyến :
Trang 8Yi = 156885.371471 + 1163.15645181*TIME - 0.654459768701*TIME2 + ei
*Kiểm định:
a Hệ số hồi quy:
Ta có:
+ | t-Statistic | của b0 =36.04600 > tc = 1.96 => b0 có ý nghĩa thống kê ở mức 5% + | t-Statistic| của b1= 15.7995 > tc = 1.96 => b1 có ý nghĩa thống kê ở mức 5% + | t-Statistic| của b2= 2.505919 > tc = 1.96 => b2 có ý nghĩa thống kê ở mức 5%
b Mô hình hồi quy:
- Ta có: Prob(F-statistic) = 0.0000 < 0.05 chứng tỏ mô hình có ý nghĩa thống kê hay
mô hình có năng lực dự báo cho các giá trị của Y
- Với: R-squared = 0.914777 tức là biến TIME giải thích được trên 91% cho doanh thu bán lẻ và dịch vụ thực phẩm => Mô hình dự báo khá tốt
- Với:
+ b0 = 36.04600 => nếu biến TIME = 0, TIME2 =0 => Dự báo tốt nhất cho Y là 36.04600
+ b1= 15.7995 => Với điều kiện các yếu tố khác không thay đổi, khi mà biến TIME tăng 1 đơn vị thì doanh thu bán lẻ và dịch vụ thực phẩm tăng 15.7995 triệu USD + b2= -2.505919 => Với điều kiện các yếu tố khác không thay đổi, khi mà biến TIME2 tăng 1 đơn vị thì doanh thu bán lẻ và dịch vụ thực phẩm giảm 2.505919 triệu USD
*Đồ thị:
Trang 9-40,000
0 40,000
80,000
100,000 200,000 300,000 400,000 500,000
Residual Actual Fitted
2.1.3 So sánh, lựa chọn mô hình tốt nhất
a Xét các tiêu chí:
Tiêu chí Mô hình tuyến tính Mô hình bậc 2 Kết luân
b Xét đồ thị:
Trang 10-40,000
0
40,000
80,000
100,000 200,000 300,000 400,000 500,000
Residual Actual Fitted
Đồ thị 1: Mô hình xu thế tuyến tính
-80,000
-40,000
0
40,000
80,000
100,000 200,000 300,000 400,000 500,000
Residual Actual Fitted
Đồ thị 2: Mô hình xu thế phi tuyến
=>Vậy mô hình phi tuyến (bậc 2) là mô hình dự báo tốt nhất cho doanh thu bán lẻ và dịch vụ thực phẩm của Mỹ
Trang 11=> Mô hình có dạng :
Yi =156885.371471 + 1163.15645181*TIME - 0.654459768701*TIME2 + ei 2.1.4 Kiểm định tính thời vụ trong mô hình xu thế bậc 2 :
* Mô hình không ràng buộc:
Yt= 1 TIME + 2TIME2 + iDi +t (1)
*Mô hình ràng buộc:
Y= 0+1*TIME + 2*TIME2 + ei (2)
Kiểm định giả thuyết:
H0: 1=2, 2=3, 3=4, 4=5, 5=6, 6=7, 8=9, 9=10, 10=11, 11=12 ( số ràng buộc m=11)
H1: Ít nhất 2 trong số hệ số trên khác nhau
Bước 1: Dùng OLS hồi quy mô hình (1) ta có kết quả sau:
Dependent Variable: DOANHTHU
Method: Least Squares
Date: 03/28/15 Time: 15:19
Sample: 1992M01 2014M08
Included observations: 272
Variable Coefficient Std Error t-Statistic Prob.
Adjusted R-squared 0.971265 S.D dependent var 81058.97 S.E of regression 13740.63 Akaike info criterion 21.94420 Sum squared resid 4.87E+10 Schwarz criterion 22.12979 Log likelihood -2970.411 Hannan-Quinn criter 22.01871
Trang 12Durbin-Watson stat 0.393186
=> Thu được SSRUR = 4.87E+10
Bước 2: Dùng OLS hồi quy mô hình (2) ta có kết quả sau:
Dependent Variable: DOANHTHU
Method: Least Squares
Date: 03/28/15 Time: 15:17
Sample: 1992M01 2014M08
Included observations: 272
Variable Coefficient Std Error t-Statistic Prob.
Adjusted R-squared 0.914144 S.D dependent var 81058.97 S.E of regression 23751.30 Akaike info criterion 22.99963 Sum squared resid 1.52E+11 Schwarz criterion 23.03940 Log likelihood -3124.950 Hannan-Quinn criter 23.01560 F-statistic 1443.717 Durbin-Watson stat 1.655926 Prob(F-statistic) 0.000000
=> Thu dược SSRR= 1.52E+11
* Tính Fqs= ((SSRR – SSRUR)/m)/( SSRUR/(T-k))
+Với m= 11, T=272, k=14 => Fqs= 49.75060668
+ Với α = 0.05 => Fc = 1.825883803
Ta thấy Fqs > Fc =>Bác bỏ giả thuyết Ho => Hay chuỗi có tính thời vụ
Vì thế ta nên đưa các biến giả thời vụ vào trong mô hình
2.2.4 Lựa chọn mô hình dự báo tốt nhất:
Mô hình bậc 2 là mô hình dự báo tốt nhất cho Doanh thu bán lẻ và dịch vụ thực phẩm của Mỹ
Phương trình ước lượng:
Yi = 1146.72491124*TIME - 0.610686944962*TIME2 128056.992832*D1 + 126751.103944*D2 + 160914.262516*D3 + 155445.425071*D4 +
171181.33074*D5 + 162717.718651*D6 + 162149.588806*D7 +
Trang 13168560.028161*D8 + 145973.038997*D9 + 154277.492066*D10 +
156749.98469*D11 + 205035.335053*D12+ ei
PHẦN III: DỰ BÁO CHO 5 QUAN SÁT CUỐI CÙNG
3.1 Tính toán các giá trị dự báo, khoảng tin cậy và sai số
Ứng dụng mô hình xu thế bậc 2 để dự báo cho 5 quan sát cuối cùng của chuỗi số liệu ta có các kết quả sau:
a.Giá trị dự báo
^
Y T +h= 1146.72491124* TIMET+h - 0.610686944962* TIME2
T+h + 128056.992832*D1 + 126751.103944*D2 + 160914.262516*D3 + 155445.425071*D4 +
171181.33074*D5 + 162717.718651*D6 + 162149.588806*D7 +
168560.028161*D8 + 145973.038997*D9 + 154277.492066*D10 +
156749.98469*D11 + 205035.335053*D12+ ei
^
Y273=
1146.72491124* 273 - 0.610686944962* 273^2+ 145973.038997*1
= 413515.0336
^
Y274=1146.72491124* 274 - 0.610686944962* 274^2+
154277.492066*1=422632.2128
^
Y275= 1146.72491124* 275 - 0.610686944962* 275^2 +156749.98469*1=
425916.1706
^
Y276= 1146.72491124* 276 - 0.610686944962* 276^2+205035.335053*1=
475011.7071
^
Y277= 1146.72491124* 277 - 0.610686944962* 277^2 +128056.992832*1=
398842.4222
b.Khoảng tin cậy :
Tại thời điểm T+h khoản tin cậy p= 1-α của Y^T +h là:
[Y^T +h - Zα/2σ ;Y^T +h+Zα/2σ ]
+ Z là giá trị tới hạn tra ở bẳng tuần hoàn: Z0.05/2= 1.96
+ Sigma mũ: Sai số chuẩn của hồi quy xu thế : σ=
+ h tầm xa của dự báo và Y^T +h là giá trị dự báo tại thời điểm T+h
+α=5%
Ta có bảng giá trị sau:
Trang 14Time Y Y^ Cận trên Cận dưới Sai số
273 425136 413515.03 440446.67 386583.4 11620.966
274 442124 422632.21 449563.85 395700.58 19491.787
275 442221 425916.17 452847.81 398984.54 16304.829
276 506636 475011.71 501943.34 448080.07 31624.293
277 401097 398842.42 425774.06 371910.79 2254.5778
3.2Vẽ đồ thị:
2014M09 2014M10 2014M11 2014M12 2015M01
0
100000
200000
300000
400000
500000
600000
Y Y^
cận trên cận dưới
3.3 Nhận xét:
*Các giá trị dự báo và giá trị thực tế có sai lệch nhưng tính xu thế vẫn được thể hiện
rõ và nằm trong khoảng dự báo.=> thế nên mô hình dự báo khá tốt cho các giá trị ngoài mẫu