Đề bài: Hãy thu thập dữ liệu chuỗi thời gian về một chỉ tiêu kinh tế xã hội ( số quan sát >= 50 quan sát) thực tế của Việt Nam, từ đó áp dụng phương pháp ARIMASARIMA để dự báo cho 5 thời đoạn tương lai Lựa chọn đề tài: Dự bảo chỉ số giá của ngành MAY MẶC 5 tháng đầu năm 2021 bằng mô hình ARIMA thông qua việc sử dụng phần mềm Eviews 10 và SPSS 20 Quy trình dự báo bao gồm: Bước 1: Thu thập số liệu từ các nguồn Bước 2: Kiểm tra tính dừng của chuỗi thời gian bằng kiểm định ADF bằng việc sử dụng Eviews 10 Bước 3: Xác định bậc của p và q thông qua đồ thị ACF và PACF
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI ! HỌC ! KINH ! TẾ ! QUỐC ! DÂN
BÀI TẬP LỚN
MÔN DỰ BÁO KINH TẾ - XÃ HỘI 1
Đề bài: ! Hãy thu thập dữ liệu chuỗi thời gian về một chỉ tiêu kinh tế / xã hội
(số quan sát >= 50 quan sát) thực tế của Việt Nam, từ đó áp dụng phương pháp ARIMA/SARIMA để dự báo cho 5 thời đoạn tương lai
Giảng viên hướng dẫn PGS.TS Lê Huy Đức
Lớp chuyên ngành Kinh tế phát triển 61A
Sinh viên thực hiện Nguyễn Thị Quỳnh Anh
Mã sinh viên 11190402
Trang 2BÀI TẬP LỚN Học phần: Dự báo Kinh tế - Xã hội 1 Học kỳ 1 năm học 2020 – 2021
Đề bài: Hãy thu thập dữ liệu chuỗi thời gian về một chỉ tiêu kinh tế / xã hội ( số
quan sát >= 50 quan sát) thực tế của Việt Nam, từ đó áp dụng phương pháp ARIMA/SARIMA để dự báo cho 5 thời đoạn tương lai
Lựa chọn đề tài: Dự bảo chỉ số giá của ngành MAY MẶC 5 tháng đầu năm
2021 bằng mô hình ARIMA thông qua việc sử dụng phần mềm Eviews 10 và SPSS 20
Quy trình dự báo bao gồm:
Bước 1: Thu thập số liệu từ các nguồn
Bước 2: Kiểm tra tính dừng của chuỗi thời gian bằng kiểm định ADF bằng việc
sử dụng Eviews 10
Bước 3: Xác định bậc của p và q thông qua đồ thị ACF và PACF
Bước 4: Sử dụng SPSS 20 để chạy các mô hình ARIMA, tiến hành ước lượng, kiểm định và dự báo cho từng mô hình
Bước 5: Lựa chọn mô hình phù hợp thông qua phương pháp cực tiểu sai số và đưa ra kết quả dự báo
Trang 3Bước 1: Thu thập số liệu từ các nguồn
Nguồn thu thập số liệu chỉ số giá ngành May mặc giai đoạn 2016 – 2020:
Trang 4Bước 2: Kiểm định tính dừng của chuỗi thời gian bằng kiểm định ADF bằng việc sử dụng Eviews 10
Để nhập số liệu, ta mở EVIEWS 10 ra chọn Creat a new Eview workfile
Trong mục Workfile Structure type chọn Unstructured/Undated (dữ liệu chéo) Ở ô Observation ta điền số quan sát, trong trường hợp này là 60 quan sát
và bấm OK
Trang 5Trên bảng giao diện của EVIEWS 10, ta chọn Quick/Empty Group và nhập số
liệu đã thu thập được vào Đặt tên biến là Y
Trang 6Tiến hành kiểm định tính dừng của Y thông qua kiểm định ADF bằng lệnh
View/ Unit Root Test
Bảng thực đơn sau sẽ xuất hiện:
Trên bảng này, ta sẽ tích vào những lựa chọn phù hợp Do chuỗi có hệ số chặn
và không có xu thế (có thể nhìn thấy qua việc vẽ đồ thị) nên cần tích vào
Intercept Trong trường hợp này, để kiểm định tính dừng của chuỗi ta chọn mục Level, nếu sau khi tiến hành chạy ra kết quả ta thấy chuỗi không dừng, ta
Trang 7phân bậc 1, nếu chuỗi sai phân bậc 1 chưa dừng phải kiểm định tiếp chuỗi sai phân bậc 2 bằng cách chọn 2nd difference Nếu sau khi thực hiện kiểm định
hết đến chuỗi sai phân bậc 2 mà chuỗi chưa dừng thì ta nên đổi số liệu khác để thực hiện dự báo Tuy nhiên, ta cùng nên vẽ đồ thị của chuỗi sai phân để nhận dạng trước Chuỗi là dừng khi giá trị tuyệt đối của thống kê lớn hơn giá trị tuyệt đối của giá trị chuẩn theo các mức ý nghĩa khác nhau đã cho
Bấm OK để thu về kết quả kiểm định, ta được kết quả như hình dưới đây
Trong bảng kết quả, ta nhận thấy giá trị P-value = 0.0000 < 0.05 nên có thể kết luận rằng chuỗi thời gian này là chuỗi dừng Do đó mô hình ARIMA ta xây
dựng về chỉ số giá ngành May mặc sẽ có d = 0
Bước 3: Xác định bậc của p và q thông qua đồ thị ACF và PACF
Tại bảng giá trị Y (Series Y), ta chọn View/ Correlogram
Trang 8
Chọn Level vì chuỗi số liệu ban đầu là chuỗi dừng, nếu chuỗi sai phân bậc 1
hoặc bậc 2 dừng thì ta có thể chọn 1st difference hoặc 2nd difference
Ta thu được bảng kết quả sau:
Trang 9Để tìm ra bậc p và q, so sánh PACF và ACF với giá trị giới hạn ±1.96/√n để tìm
ra bậc của p và q
Ta có trong trường hợp này: ±1.96/√60 = ± 0.253034912
=> Như vậy, quan sát nào có số liệu PACF nằm ngoài khoảng
( - 0.253034912 ; 0.253034912) thì đó là các giá trị của p và cứ số liệu ACF
vào ngoài khoảng trên thì là các giá trị của q
Nhìn bằng đồ thị cũng có thể nhận ra với đường giới hạn của kẻ nét đứt
=> Ta được các giá trị: q = 1, 11, 12, 23, 24, 36 và p = 1, 2, 11
=> Số mô hình thiết lập được thể hiện trong bảng sau:
p=1 ARIMA(1,0,1) ARIMA(1,0,11) ARIMA(1,0,12) ARIMA(1,0,23) ARIMA(1,0,24)
p=2 ARIMA(2,0,1) ARIMA(2,0,11) ARIMA(2,0,12) ARIMA(2,0,23) ARIMA(2,0,24)
p=11 ARIMA(11,0,1) ARIMA(11,0,11) ARIMA(11,0,12) ARIMA(11,0,23) ARIMA(11,0,24)
q=36
p=11 ARIMA(11,0,36)
Bước 4: Sử dụng SPSS 20 để chạy các mô hình ARIMA, tiến hành
ước lượng, kiểm định và dự báo cho từng mô hình
Nhập lại số liệu vào SPSS và đặt tên biến là biến Y
Tại Analyze, chọn Forecasting, chọn Creat Models
Trang 10Ta nhận được kết quả sau:
Đưa biến Y vào mục Dependent Variables
Trang 11mùa vụ) đã xác lập để xem các mô hình dự báo Cứ mỗi mô hình thì điền p, d, q tương ứng vào rồi bấm Continute Sau đó bấm OK để chạy mô hình Phải tiến hành chạy tất cả các mô hình để có thể kiểm định được mô hình nào là phù hợp
và chọn ra mô hình tốt nhất để có thể lựa chọn phục vụ công tác dự báo Mỗi
mô hình chúng ra sẽ có được luôn kết quả dự báo cho các bước tiếp theo nhưng chỉ lấy kết quả dự báo của mô hình tốt nhất (sử dụng phương pháp cực tiểu sai
số để chọn ra mô hình tốt nhất)
Tại thẻ Statistics, ta chọn các mục như sau:
Trang 12Trong thẻ Plots, chọn các mục như sau:
Tại thẻ Options chọn 65 để dự báo cho 5 bước tiếp theo từ 61 đến 65
Trang 13Sau đó bấm OK để chạy mô hình
Ta sẽ chạy lần lượt các mô hình có thể và chọn ra mô hình tốt nhất phục vụ cho công tác dự báo
Chạy lần lượt các mô hình ta được các kết quả như sau, trong đó:
- Tên mô hình được trình bày trong bảng Model Description
- Các chỉ tiêu thống kê như hệ số xác định của mô hình, hệ số xác định điều
chỉnh, các sai số dự báo MSE, MAPE, MAE, BIC được trình bày trong bảng
Model Fit
- Các hệ số ước lượng của mô hình được trình bày trong bảng ARIMA Model
Parameter
- Giá trị dự báo chỉ số giá của ngành May mặc cho 5 tháng tiếp theo của năm
2021 (từ quan sát 61 – 65) được trình bày trong bảng Forecast
- Phần dư của mô hình được thể hiện bởi đồ thị Residual ACF và Residual
PACF
- Đồ thị của mô hình được vẽ cuối cùng sau đồ thị về phần dư
Trang 14KẾT QUẢ CHẠY MÔ HÌNH
1 ARIMA(1, 0, 1)
Model Description
Model Type Model ID Y Model_1 ARIMA(1,0,1)
Model Fit
Fit Statistic Mean SE Minimum Maximum Percentile
5 10 25 50 75 90 95 Stationary R-
squared .202 .202 .202 .202 .202 .202 .202 .202 .202 .202 R-squared 202 202 202 202 202 202 202 202 202 202 RMSE 138 138 138 138 138 138 138 138 138 138 MAPE 093 093 093 093 093 093 093 093 093 093 MaxAPE 417 417 417 417 417 417 417 417 417 417 MAE 093 093 093 093 093 093 093 093 093 093 MaxAE 416 416 416 416 416 416 416 416 416 416
Ljung-Box Q(18) Number of
Outliers Stationary R-
Trang 15Trên đồ thị phần dư của ACF và PACF ta thấy có quan sát vượt ra ngoài giới hạn nên
phần dư này không phải nhiễu trắng Do đó, mô hình này không phù hợp
Trang 162 ARIMA(2, 0, 1)
Model Description
Model Type Model ID Y Model_1 ARIMA(2,0,1)
Model Fit
Fit Statistic Mean SE Minimum Maximum Percentile
5 10 25 50 75 90 95 Stationary R-
squared .244 .244 .244 .244 .244 .244 .244 .244 .244 .244 R-squared 244 244 244 244 244 244 244 244 244 244 RMSE 135 135 135 135 135 135 135 135 135 135 MAPE 095 095 095 095 095 095 095 095 095 095 MaxAPE 397 397 397 397 397 397 397 397 397 397 MAE 095 095 095 095 095 095 095 095 095 095 MaxAE 396 396 396 396 396 396 396 396 396 396 Normalized
Ljung-Box Q(18) Number of
Outliers Stationary R-
Trang 17Trên đồ thị phần dư của ACF và PACF ta thấy có quan sát vượt ra ngoài giới hạn nên
phần dư này không phải nhiễu trắng Do đó, mô hình này không phù hợp
Trang 183 ARIMA( 11, 0, 1)
Model Description
Model Type Model ID Y Model_1 ARIMA(11,0,1)
Model Fit
Fit Statistic Mean SE Minimum Maximum Percentile
5 10 25 50 75 90 95 Stationary R-
squared .447 .447 .447 .447 .447 .447 .447 .447 .447 .447 R-squared 447 447 447 447 447 447 447 447 447 447 RMSE 126 126 126 126 126 126 126 126 126 126 MAPE 083 083 083 083 083 083 083 083 083 083 MaxAPE 398 398 398 398 398 398 398 398 398 398 MAE 083 083 083 083 083 083 083 083 083 083 MaxAE 397 397 397 397 397 397 397 397 397 397 Normalized
Ljung-Box Q(18) Number of
Outliers Stationary R-
Trang 19Trên đồ thị phần dư của ACF và PACF ta thấy toàn bộ các quan sát vượt nằm trong giới hạn
nên phần dư này là nhiễu trắng Do đó, mô hình này là phù hợp
Trang 204 ARIMA(1,0,11)
Model Description
Model Type Model ID Y Model_1 ARIMA(1,0,11)
Model Fit
Fit Statistic Mean SE Minimum Maximum Percentile
5 10 25 50 75 90 95 Stationary R-
squared .419 .419 .419 .419 .419 .419 .419 .419 .419 .419 R-squared 419 419 419 419 419 419 419 419 419 419 RMSE 129 129 129 129 129 129 129 129 129 129 MAPE 080 080 080 080 080 080 080 080 080 080 MaxAPE 404 404 404 404 404 404 404 404 404 404 MAE 080 080 080 080 080 080 080 080 080 080 MaxAE 404 404 404 404 404 404 404 404 404 404 Normalized
Ljung-Box Q(18) Number of
Outliers Stationary R-
Trang 21Trên đồ thị phần dư của ACF và PACF ta thấy có quan sát vượt ra ngoài giới hạn nên
phần dư này không phải nhiễu trắng Do đó, mô hình này không phù hợp
Trang 22
5 ARIMA(2, 0, 11)
Model Description
Model Type Model ID Y Model_1 ARIMA(2,0,11)
Model Fit
Fit Statistic Mean SE Minimum Maximum Percentile
5 10 25 50 75 90 95 Stationary R-
squared .452 .452 .452 .452 .452 .452 .452 .452 .452 .452 R-squared 452 452 452 452 452 452 452 452 452 452 RMSE 127 127 127 127 127 127 127 127 127 127 MAPE 080 080 080 080 080 080 080 080 080 080 MaxAPE 397 397 397 397 397 397 397 397 397 397 MAE 080 080 080 080 080 080 080 080 080 080 MaxAE 396 396 396 396 396 396 396 396 396 396 Normalized
Ljung-Box Q(18) Number of
Outliers Stationary R-
Trang 23Trên đồ thị phần dư của ACF và PACF ta thấy có quan sát vượt ra ngoài giới hạn nên
phần dư này không phải nhiễu trắng Do đó, mô hình này không phù hợp
Trang 246 ARIMA(11, 0, 11)
Model Description
Model Type Model ID Y Model_1 ARIMA(11,0,11)
Model Fit
Fit Statistic Mean SE Minimum Maximum Percentile
5 10 25 50 75 90 95 Stationary
R-squared .517 .517 .517 .517 .517 .517 .517 .517 .517 .517 R-squared 517 517 517 517 517 517 517 517 517 517 RMSE 133 133 133 133 133 133 133 133 133 133 MAPE 075 075 075 075 075 075 075 075 075 075 MaxAPE 391 391 391 391 391 391 391 391 391 391 MAE 076 076 076 076 076 076 076 076 076 076 MaxAE 391 391 391 391 391 391 391 391 391 391 Normalized
Ljung-Box Q(18) Number of
Outliers Stationary R-
Trang 25Trên đồ thị phần dư của ACF và PACF ta thấy toàn bộ quan sát vượt nằm trong giới
hạn nên phần dư này là nhiễu trắng Do đó, mô hình này là phù hợp
Trang 267 ARIMA(1, 0, 12)
Model Description
Model Type Model ID Y Model_1 ARIMA(1,0,12)
Model Fit
Fit Statistic Mean SE Minimum Maximum Percentile
5 10 25 50 75 90 95 Stationary R-
squared .452 .452 .452 .452 .452 .452 .452 .452 .452 .452 R-squared 452 452 452 452 452 452 452 452 452 452 RMSE 127 127 127 127 127 127 127 127 127 127 MAPE 078 078 078 078 078 078 078 078 078 078 MaxAPE 397 397 397 397 397 397 397 397 397 397 MAE 078 078 078 078 078 078 078 078 078 078 MaxAE 396 396 396 396 396 396 396 396 396 396 Normalized
Ljung-Box Q(18) Number of
Outliers Stationary R-
Trang 27Trên đồ thị phần dư của ACF và PACF ta thấy có quán sát vượt ra ngoài giới hạn nên phần
dư này không phải nhiễu trắng Do đó, mô hình này không phù hợp
Trang 288 ARIMA(2, 0, 12)
Model Description
Model Type Model ID Y Model_1 ARIMA(2,0,12)
Model Fit
Fit Statistic Mean SE Minimum Maximum Percentile
5 10 25 50 75 90 95 Stationary R-
squared .462 .462 .462 .462 .462 .462 .462 .462 .462 .462 R-squared 462 462 462 462 462 462 462 462 462 462 RMSE 127 127 127 127 127 127 127 127 127 127 MAPE 077 077 077 077 077 077 077 077 077 077 MaxAPE 401 401 401 401 401 401 401 401 401 401 MAE 077 077 077 077 077 077 077 077 077 077 MaxAE 400 400 400 400 400 400 400 400 400 400 Normalized
Ljung-Box Q(18) Number of
Outliers Stationary R-
Trang 29Trên đồ thị phần dư của ACF và PACF ta thấy có quán sát vượt ra ngoài giới hạn nên phần
dư này không phải nhiễu trắng Do đó, mô hình này không phù hợp
Trang 309 ARIMA(11, 0, 12)
Model Description
Model Type Model ID Y Model_1 ARIMA(11,0,12)
Model Fit
Fit Statistic Mean SE Minimum Maximum Percentile
5 10 25 50 75 90 95 Stationary R-
squared .489 .489 .489 .489 .489 .489 .489 .489 .489 .489 R-squared 489 489 489 489 489 489 489 489 489 489 RMSE 138 138 138 138 138 138 138 138 138 138 MAPE 079 079 079 079 079 079 079 079 079 079 MaxAPE 386 386 386 386 386 386 386 386 386 386 MAE 080 080 080 080 080 080 080 080 080 080 MaxAE 385 385 385 385 385 385 385 385 385 385 Normalized
Ljung-Box Q(18) Number of
Outliers Stationary R-
Trang 31Trên đồ thị phần dư của ACF và PACF ta thấy toàn bộ quan sát vượt nằm trong giới
hạn nên phần dư này là nhiễu trắng Do đó, mô hình này là phù hợp
Trang 3210 ARIMA( 1, 0, 23)
Model Description
Model Type Model ID Y Model_1 ARIMA(1,0,23)
Model Fit
Fit Statistic Mean SE Minimum Maximum Percentile
5 10 25 50 75 90 95 Stationary R-
squared .517 .517 .517 .517 .517 .517 .517 .517 .517 .517 R-squared 517 517 517 517 517 517 517 517 517 517 RMSE 136 136 136 136 136 136 136 136 136 136 MAPE 072 072 072 072 072 072 072 072 072 072 MaxAPE 402 402 402 402 402 402 402 402 402 402 MAE 072 072 072 072 072 072 072 072 072 072 MaxAE 401 401 401 401 401 401 401 401 401 401 Normalized
Ljung-Box Q(18) Number of
Outliers Stationary R-
Trang 33Trên đồ thị phần dư của ACF và PACF ta thấy toàn bộ quan sát vượt nằm trong giới
hạn nên phần dư này là nhiễu trắng Do đó, mô hình này là phù hợp
Trang 3411 ARIMA(2, 0, 23)
Model Description
Model Type Model ID Y Model_1 ARIMA(2,0,23)
Model Fit
Fit Statistic Mean SE Minimum Maximum Percentile
5 10 25 50 75 90 95 Stationary R-
squared .520 .520 .520 .520 .520 .520 .520 .520 .520 .520 R-squared 520 520 520 520 520 520 520 520 520 520 RMSE 138 138 138 138 138 138 138 138 138 138 MAPE 074 074 074 074 074 074 074 074 074 074 MaxAPE 386 386 386 386 386 386 386 386 386 386 MAE 074 074 074 074 074 074 074 074 074 074 MaxAE 385 385 385 385 385 385 385 385 385 385 Normalized
Ljung-Box Q(18) Number of
Outliers Stationary R-