1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tiểu luận: Hãy thu thập dữ liệu chuỗi thời gian về một chỉ tiêu kinh tế xã hội (số quan sát >= 50 quan sát) thực tế của Việt Nam, từ đó áp dụng phương pháp ARIMASARIMA để dự báo cho 5 thời đoạn tương lai

51 39 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 51
Dung lượng 2,66 MB
File đính kèm BÀI TẬP LỚN DỰ BÁO.rar (2 MB)

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Đề bài: Hãy thu thập dữ liệu chuỗi thời gian về một chỉ tiêu kinh tế xã hội ( số quan sát >= 50 quan sát) thực tế của Việt Nam, từ đó áp dụng phương pháp ARIMASARIMA để dự báo cho 5 thời đoạn tương lai Lựa chọn đề tài: Dự bảo chỉ số giá của ngành MAY MẶC 5 tháng đầu năm 2021 bằng mô hình ARIMA thông qua việc sử dụng phần mềm Eviews 10 và SPSS 20 Quy trình dự báo bao gồm: Bước 1: Thu thập số liệu từ các nguồn Bước 2: Kiểm tra tính dừng của chuỗi thời gian bằng kiểm định ADF bằng việc sử dụng Eviews 10 Bước 3: Xác định bậc của p và q thông qua đồ thị ACF và PACF

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI ! HỌC ! KINH ! TẾ ! QUỐC ! DÂN

BÀI TẬP LỚN

MÔN DỰ BÁO KINH TẾ - XÃ HỘI 1

Đề bài: ! Hãy thu thập dữ liệu chuỗi thời gian về một chỉ tiêu kinh tế / xã hội

(số quan sát >= 50 quan sát) thực tế của Việt Nam, từ đó áp dụng phương pháp ARIMA/SARIMA để dự báo cho 5 thời đoạn tương lai

Giảng viên hướng dẫn PGS.TS Lê Huy Đức

Lớp chuyên ngành Kinh tế phát triển 61A

Sinh viên thực hiện Nguyễn Thị Quỳnh Anh

Mã sinh viên 11190402

Trang 2

BÀI TẬP LỚN Học phần: Dự báo Kinh tế - Xã hội 1 Học kỳ 1 năm học 2020 – 2021

Đề bài: Hãy thu thập dữ liệu chuỗi thời gian về một chỉ tiêu kinh tế / xã hội ( số

quan sát >= 50 quan sát) thực tế của Việt Nam, từ đó áp dụng phương pháp ARIMA/SARIMA để dự báo cho 5 thời đoạn tương lai

Lựa chọn đề tài: Dự bảo chỉ số giá của ngành MAY MẶC 5 tháng đầu năm

2021 bằng mô hình ARIMA thông qua việc sử dụng phần mềm Eviews 10 và SPSS 20

Quy trình dự báo bao gồm:

Bước 1: Thu thập số liệu từ các nguồn

Bước 2: Kiểm tra tính dừng của chuỗi thời gian bằng kiểm định ADF bằng việc

sử dụng Eviews 10

Bước 3: Xác định bậc của p và q thông qua đồ thị ACF và PACF

Bước 4: Sử dụng SPSS 20 để chạy các mô hình ARIMA, tiến hành ước lượng, kiểm định và dự báo cho từng mô hình

Bước 5: Lựa chọn mô hình phù hợp thông qua phương pháp cực tiểu sai số và đưa ra kết quả dự báo

Trang 3

Bước 1: Thu thập số liệu từ các nguồn

Nguồn thu thập số liệu chỉ số giá ngành May mặc giai đoạn 2016 – 2020:

Trang 4

Bước 2: Kiểm định tính dừng của chuỗi thời gian bằng kiểm định ADF bằng việc sử dụng Eviews 10

Để nhập số liệu, ta mở EVIEWS 10 ra chọn Creat a new Eview workfile

Trong mục Workfile Structure type chọn Unstructured/Undated (dữ liệu chéo) Ở ô Observation ta điền số quan sát, trong trường hợp này là 60 quan sát

và bấm OK

Trang 5

Trên bảng giao diện của EVIEWS 10, ta chọn Quick/Empty Group và nhập số

liệu đã thu thập được vào Đặt tên biến là Y

Trang 6

Tiến hành kiểm định tính dừng của Y thông qua kiểm định ADF bằng lệnh

View/ Unit Root Test

Bảng thực đơn sau sẽ xuất hiện:

Trên bảng này, ta sẽ tích vào những lựa chọn phù hợp Do chuỗi có hệ số chặn

và không có xu thế (có thể nhìn thấy qua việc vẽ đồ thị) nên cần tích vào

Intercept Trong trường hợp này, để kiểm định tính dừng của chuỗi ta chọn mục Level, nếu sau khi tiến hành chạy ra kết quả ta thấy chuỗi không dừng, ta

Trang 7

phân bậc 1, nếu chuỗi sai phân bậc 1 chưa dừng phải kiểm định tiếp chuỗi sai phân bậc 2 bằng cách chọn 2nd difference Nếu sau khi thực hiện kiểm định

hết đến chuỗi sai phân bậc 2 mà chuỗi chưa dừng thì ta nên đổi số liệu khác để thực hiện dự báo Tuy nhiên, ta cùng nên vẽ đồ thị của chuỗi sai phân để nhận dạng trước Chuỗi là dừng khi giá trị tuyệt đối của thống kê lớn hơn giá trị tuyệt đối của giá trị chuẩn theo các mức ý nghĩa khác nhau đã cho

Bấm OK để thu về kết quả kiểm định, ta được kết quả như hình dưới đây

Trong bảng kết quả, ta nhận thấy giá trị P-value = 0.0000 < 0.05 nên có thể kết luận rằng chuỗi thời gian này là chuỗi dừng Do đó mô hình ARIMA ta xây

dựng về chỉ số giá ngành May mặc sẽ có d = 0

Bước 3: Xác định bậc của p và q thông qua đồ thị ACF và PACF

Tại bảng giá trị Y (Series Y), ta chọn View/ Correlogram

Trang 8

Chọn Level vì chuỗi số liệu ban đầu là chuỗi dừng, nếu chuỗi sai phân bậc 1

hoặc bậc 2 dừng thì ta có thể chọn 1st difference hoặc 2nd difference

Ta thu được bảng kết quả sau:

Trang 9

Để tìm ra bậc p và q, so sánh PACF và ACF với giá trị giới hạn ±1.96/√n để tìm

ra bậc của p và q

Ta có trong trường hợp này: ±1.96/√60 = ± 0.253034912

=> Như vậy, quan sát nào có số liệu PACF nằm ngoài khoảng

( - 0.253034912 ; 0.253034912) thì đó là các giá trị của p và cứ số liệu ACF

vào ngoài khoảng trên thì là các giá trị của q

Nhìn bằng đồ thị cũng có thể nhận ra với đường giới hạn của kẻ nét đứt

=> Ta được các giá trị: q = 1, 11, 12, 23, 24, 36 và p = 1, 2, 11

=> Số mô hình thiết lập được thể hiện trong bảng sau:

p=1 ARIMA(1,0,1) ARIMA(1,0,11) ARIMA(1,0,12) ARIMA(1,0,23) ARIMA(1,0,24)

p=2 ARIMA(2,0,1) ARIMA(2,0,11) ARIMA(2,0,12) ARIMA(2,0,23) ARIMA(2,0,24)

p=11 ARIMA(11,0,1) ARIMA(11,0,11) ARIMA(11,0,12) ARIMA(11,0,23) ARIMA(11,0,24)

q=36

p=11 ARIMA(11,0,36)

Bước 4: Sử dụng SPSS 20 để chạy các mô hình ARIMA, tiến hành

ước lượng, kiểm định và dự báo cho từng mô hình

Nhập lại số liệu vào SPSS và đặt tên biến là biến Y

Tại Analyze, chọn Forecasting, chọn Creat Models

Trang 10

Ta nhận được kết quả sau:

Đưa biến Y vào mục Dependent Variables

Trang 11

mùa vụ) đã xác lập để xem các mô hình dự báo Cứ mỗi mô hình thì điền p, d, q tương ứng vào rồi bấm Continute Sau đó bấm OK để chạy mô hình Phải tiến hành chạy tất cả các mô hình để có thể kiểm định được mô hình nào là phù hợp

và chọn ra mô hình tốt nhất để có thể lựa chọn phục vụ công tác dự báo Mỗi

mô hình chúng ra sẽ có được luôn kết quả dự báo cho các bước tiếp theo nhưng chỉ lấy kết quả dự báo của mô hình tốt nhất (sử dụng phương pháp cực tiểu sai

số để chọn ra mô hình tốt nhất)

Tại thẻ Statistics, ta chọn các mục như sau:

Trang 12

Trong thẻ Plots, chọn các mục như sau:

Tại thẻ Options chọn 65 để dự báo cho 5 bước tiếp theo từ 61 đến 65

Trang 13

Sau đó bấm OK để chạy mô hình

Ta sẽ chạy lần lượt các mô hình có thể và chọn ra mô hình tốt nhất phục vụ cho công tác dự báo

Chạy lần lượt các mô hình ta được các kết quả như sau, trong đó:

- Tên mô hình được trình bày trong bảng Model Description

- Các chỉ tiêu thống kê như hệ số xác định của mô hình, hệ số xác định điều

chỉnh, các sai số dự báo MSE, MAPE, MAE, BIC được trình bày trong bảng

Model Fit

- Các hệ số ước lượng của mô hình được trình bày trong bảng ARIMA Model

Parameter

- Giá trị dự báo chỉ số giá của ngành May mặc cho 5 tháng tiếp theo của năm

2021 (từ quan sát 61 – 65) được trình bày trong bảng Forecast

- Phần dư của mô hình được thể hiện bởi đồ thị Residual ACF và Residual

PACF

- Đồ thị của mô hình được vẽ cuối cùng sau đồ thị về phần dư

Trang 14

KẾT QUẢ CHẠY MÔ HÌNH

1 ARIMA(1, 0, 1)

Model Description

Model Type Model ID Y Model_1 ARIMA(1,0,1)

Model Fit

Fit Statistic Mean SE Minimum Maximum Percentile

5 10 25 50 75 90 95 Stationary R-

squared .202 .202 .202 .202 .202 .202 .202 .202 .202 .202 R-squared 202 202 202 202 202 202 202 202 202 202 RMSE 138 138 138 138 138 138 138 138 138 138 MAPE 093 093 093 093 093 093 093 093 093 093 MaxAPE 417 417 417 417 417 417 417 417 417 417 MAE 093 093 093 093 093 093 093 093 093 093 MaxAE 416 416 416 416 416 416 416 416 416 416

Ljung-Box Q(18) Number of

Outliers Stationary R-

Trang 15

Trên đồ thị phần dư của ACF và PACF ta thấy có quan sát vượt ra ngoài giới hạn nên

phần dư này không phải nhiễu trắng Do đó, mô hình này không phù hợp

Trang 16

2 ARIMA(2, 0, 1)

Model Description

Model Type Model ID Y Model_1 ARIMA(2,0,1)

Model Fit

Fit Statistic Mean SE Minimum Maximum Percentile

5 10 25 50 75 90 95 Stationary R-

squared .244 .244 .244 .244 .244 .244 .244 .244 .244 .244 R-squared 244 244 244 244 244 244 244 244 244 244 RMSE 135 135 135 135 135 135 135 135 135 135 MAPE 095 095 095 095 095 095 095 095 095 095 MaxAPE 397 397 397 397 397 397 397 397 397 397 MAE 095 095 095 095 095 095 095 095 095 095 MaxAE 396 396 396 396 396 396 396 396 396 396 Normalized

Ljung-Box Q(18) Number of

Outliers Stationary R-

Trang 17

Trên đồ thị phần dư của ACF và PACF ta thấy có quan sát vượt ra ngoài giới hạn nên

phần dư này không phải nhiễu trắng Do đó, mô hình này không phù hợp

Trang 18

3 ARIMA( 11, 0, 1)

Model Description

Model Type Model ID Y Model_1 ARIMA(11,0,1)

Model Fit

Fit Statistic Mean SE Minimum Maximum Percentile

5 10 25 50 75 90 95 Stationary R-

squared .447 .447 .447 .447 .447 .447 .447 .447 .447 .447 R-squared 447 447 447 447 447 447 447 447 447 447 RMSE 126 126 126 126 126 126 126 126 126 126 MAPE 083 083 083 083 083 083 083 083 083 083 MaxAPE 398 398 398 398 398 398 398 398 398 398 MAE 083 083 083 083 083 083 083 083 083 083 MaxAE 397 397 397 397 397 397 397 397 397 397 Normalized

Ljung-Box Q(18) Number of

Outliers Stationary R-

Trang 19

Trên đồ thị phần dư của ACF và PACF ta thấy toàn bộ các quan sát vượt nằm trong giới hạn

nên phần dư này là nhiễu trắng Do đó, mô hình này là phù hợp

Trang 20

4 ARIMA(1,0,11)

Model Description

Model Type Model ID Y Model_1 ARIMA(1,0,11)

Model Fit

Fit Statistic Mean SE Minimum Maximum Percentile

5 10 25 50 75 90 95 Stationary R-

squared .419 .419 .419 .419 .419 .419 .419 .419 .419 .419 R-squared 419 419 419 419 419 419 419 419 419 419 RMSE 129 129 129 129 129 129 129 129 129 129 MAPE 080 080 080 080 080 080 080 080 080 080 MaxAPE 404 404 404 404 404 404 404 404 404 404 MAE 080 080 080 080 080 080 080 080 080 080 MaxAE 404 404 404 404 404 404 404 404 404 404 Normalized

Ljung-Box Q(18) Number of

Outliers Stationary R-

Trang 21

Trên đồ thị phần dư của ACF và PACF ta thấy có quan sát vượt ra ngoài giới hạn nên

phần dư này không phải nhiễu trắng Do đó, mô hình này không phù hợp

Trang 22

5 ARIMA(2, 0, 11)

Model Description

Model Type Model ID Y Model_1 ARIMA(2,0,11)

Model Fit

Fit Statistic Mean SE Minimum Maximum Percentile

5 10 25 50 75 90 95 Stationary R-

squared .452 .452 .452 .452 .452 .452 .452 .452 .452 .452 R-squared 452 452 452 452 452 452 452 452 452 452 RMSE 127 127 127 127 127 127 127 127 127 127 MAPE 080 080 080 080 080 080 080 080 080 080 MaxAPE 397 397 397 397 397 397 397 397 397 397 MAE 080 080 080 080 080 080 080 080 080 080 MaxAE 396 396 396 396 396 396 396 396 396 396 Normalized

Ljung-Box Q(18) Number of

Outliers Stationary R-

Trang 23

Trên đồ thị phần dư của ACF và PACF ta thấy có quan sát vượt ra ngoài giới hạn nên

phần dư này không phải nhiễu trắng Do đó, mô hình này không phù hợp

Trang 24

6 ARIMA(11, 0, 11)

Model Description

Model Type Model ID Y Model_1 ARIMA(11,0,11)

Model Fit

Fit Statistic Mean SE Minimum Maximum Percentile

5 10 25 50 75 90 95 Stationary

R-squared .517 .517 .517 .517 .517 .517 .517 .517 .517 .517 R-squared 517 517 517 517 517 517 517 517 517 517 RMSE 133 133 133 133 133 133 133 133 133 133 MAPE 075 075 075 075 075 075 075 075 075 075 MaxAPE 391 391 391 391 391 391 391 391 391 391 MAE 076 076 076 076 076 076 076 076 076 076 MaxAE 391 391 391 391 391 391 391 391 391 391 Normalized

Ljung-Box Q(18) Number of

Outliers Stationary R-

Trang 25

Trên đồ thị phần dư của ACF và PACF ta thấy toàn bộ quan sát vượt nằm trong giới

hạn nên phần dư này là nhiễu trắng Do đó, mô hình này là phù hợp

Trang 26

7 ARIMA(1, 0, 12)

Model Description

Model Type Model ID Y Model_1 ARIMA(1,0,12)

Model Fit

Fit Statistic Mean SE Minimum Maximum Percentile

5 10 25 50 75 90 95 Stationary R-

squared .452 .452 .452 .452 .452 .452 .452 .452 .452 .452 R-squared 452 452 452 452 452 452 452 452 452 452 RMSE 127 127 127 127 127 127 127 127 127 127 MAPE 078 078 078 078 078 078 078 078 078 078 MaxAPE 397 397 397 397 397 397 397 397 397 397 MAE 078 078 078 078 078 078 078 078 078 078 MaxAE 396 396 396 396 396 396 396 396 396 396 Normalized

Ljung-Box Q(18) Number of

Outliers Stationary R-

Trang 27

Trên đồ thị phần dư của ACF và PACF ta thấy có quán sát vượt ra ngoài giới hạn nên phần

dư này không phải nhiễu trắng Do đó, mô hình này không phù hợp

Trang 28

8 ARIMA(2, 0, 12)

Model Description

Model Type Model ID Y Model_1 ARIMA(2,0,12)

Model Fit

Fit Statistic Mean SE Minimum Maximum Percentile

5 10 25 50 75 90 95 Stationary R-

squared .462 .462 .462 .462 .462 .462 .462 .462 .462 .462 R-squared 462 462 462 462 462 462 462 462 462 462 RMSE 127 127 127 127 127 127 127 127 127 127 MAPE 077 077 077 077 077 077 077 077 077 077 MaxAPE 401 401 401 401 401 401 401 401 401 401 MAE 077 077 077 077 077 077 077 077 077 077 MaxAE 400 400 400 400 400 400 400 400 400 400 Normalized

Ljung-Box Q(18) Number of

Outliers Stationary R-

Trang 29

Trên đồ thị phần dư của ACF và PACF ta thấy có quán sát vượt ra ngoài giới hạn nên phần

dư này không phải nhiễu trắng Do đó, mô hình này không phù hợp

Trang 30

9 ARIMA(11, 0, 12)

Model Description

Model Type Model ID Y Model_1 ARIMA(11,0,12)

Model Fit

Fit Statistic Mean SE Minimum Maximum Percentile

5 10 25 50 75 90 95 Stationary R-

squared .489 .489 .489 .489 .489 .489 .489 .489 .489 .489 R-squared 489 489 489 489 489 489 489 489 489 489 RMSE 138 138 138 138 138 138 138 138 138 138 MAPE 079 079 079 079 079 079 079 079 079 079 MaxAPE 386 386 386 386 386 386 386 386 386 386 MAE 080 080 080 080 080 080 080 080 080 080 MaxAE 385 385 385 385 385 385 385 385 385 385 Normalized

Ljung-Box Q(18) Number of

Outliers Stationary R-

Trang 31

Trên đồ thị phần dư của ACF và PACF ta thấy toàn bộ quan sát vượt nằm trong giới

hạn nên phần dư này là nhiễu trắng Do đó, mô hình này là phù hợp

Trang 32

10 ARIMA( 1, 0, 23)

Model Description

Model Type Model ID Y Model_1 ARIMA(1,0,23)

Model Fit

Fit Statistic Mean SE Minimum Maximum Percentile

5 10 25 50 75 90 95 Stationary R-

squared .517 .517 .517 .517 .517 .517 .517 .517 .517 .517 R-squared 517 517 517 517 517 517 517 517 517 517 RMSE 136 136 136 136 136 136 136 136 136 136 MAPE 072 072 072 072 072 072 072 072 072 072 MaxAPE 402 402 402 402 402 402 402 402 402 402 MAE 072 072 072 072 072 072 072 072 072 072 MaxAE 401 401 401 401 401 401 401 401 401 401 Normalized

Ljung-Box Q(18) Number of

Outliers Stationary R-

Trang 33

Trên đồ thị phần dư của ACF và PACF ta thấy toàn bộ quan sát vượt nằm trong giới

hạn nên phần dư này là nhiễu trắng Do đó, mô hình này là phù hợp

Trang 34

11 ARIMA(2, 0, 23)

Model Description

Model Type Model ID Y Model_1 ARIMA(2,0,23)

Model Fit

Fit Statistic Mean SE Minimum Maximum Percentile

5 10 25 50 75 90 95 Stationary R-

squared .520 .520 .520 .520 .520 .520 .520 .520 .520 .520 R-squared 520 520 520 520 520 520 520 520 520 520 RMSE 138 138 138 138 138 138 138 138 138 138 MAPE 074 074 074 074 074 074 074 074 074 074 MaxAPE 386 386 386 386 386 386 386 386 386 386 MAE 074 074 074 074 074 074 074 074 074 074 MaxAE 385 385 385 385 385 385 385 385 385 385 Normalized

Ljung-Box Q(18) Number of

Outliers Stationary R-

Ngày đăng: 02/04/2022, 10:33

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w