Bắt đầu từ năm 1998, những nghiên cứu định lượng bắt đầu phát triển, nhóm tác giả gồm Aidan Meyler, Geoff, Kenny, Terry và Quinn đã đưa ra mô hình chuỗi thời gian ARIMA để dự báo lạm phá
Trang 11 Giới thiệu
Lý do chọn đề tài
Giá cả ra đời khi có sự trao đổi mua bán hàng hóa và là một trong những công cụ điều tiết nền kinh tế thị trường Giá cả luôn biến động lên, xuống, phức tạp kéo theo sự thay đổi mọi mặt của nền kinh tế xã hội Để có cái nhìn tổng quan
về mức tiêu dùng của nền kinh tế cũng như sức mua của nền kinh tế và cho biết liệu nền kinh tế có bị lạm phát hoặc giảm phát ngoài kiểm soát hay không, chỉ số giá tiêu dùng (CPI - Consumer Price Index) là một công cụ không thể thiếu Chỉ
số giá tiêu dùng (CPI) tính theo phần trăm phản ánh mức thay đổi tương đối của giá giỏ hàng tiêu dùng theo thời gian, được tính dựa trên một giỏ hàng hóa cơ sở đại diện cho toàn bộ hàng tiêu dùng Việc dự báo lạm phát có ý nghĩa quan trọng đối với các nhà hoạch định chính sách cũng như các thành phần trong nền kinh
tế Chính vì vậy mà nhóm lựa chọn đề tài: “Dự báo chỉ số giá tiêu dùng của Việt Nam giai đoạn tháng 03 năm 2019 tới tháng 12 năm 2021 bằng mô hình ARIMA
có yếu tố mùa vụ”.
Lịch sử nghiên cứu:
Dự báo lạm phát là một trong những cấu phần quan trọng trong công tác hoạch định chính sách của nhiều quốc gia trên thế giới, trong đó có cả Việt Nam Sau năm
1975, trước những biến động lớn của lạm phát, đã có rất nhiều nghiên cứu về độ chính xác tương đối của các mô hình dự báo lạm phát Bên cạnh đó, cũng có nhiều cách thức kiểm tra và đánh giá đối với các phương pháp dự báo lạm phát Bắt đầu từ năm 1998, những nghiên cứu định lượng bắt đầu phát triển, nhóm tác giả gồm Aidan Meyler, Geoff, Kenny, Terry và Quinn đã đưa ra mô hình chuỗi thời gian ARIMA
để dự báo lạm phát ở Ailen, qua đó cho thấy mô hình này có kết quả dự báo tốt hơn
so với phương pháp định tính Bên cạnh mô hình đơn biến, mô hình đa biến thường được sử dụng với các chuỗi thời gian là VAR và VECM Tại Mỹ, Binner và cộng sự (2006) đã ứng dụng mô hình AR vào dự báo lạm phát, tuy nhiên khẳng định dự báo lạm phát bằng mô hình AR không tốt bằng mô hình tự hồi quy Markov (MS-AR) Tại Bangladesh, Faisal (2012) đã ứng dụng mô hình ARIMA để dự báo lạm phát đồng thời đưa ra những gợi ý chính
Trang 2sách để kiểm soát lạm phát và điều hành kinh tế vĩ mô Ngoài những mô hình chuỗi thời gian tuyến tính, những mô hình phi tuyến cũng được sử dụng để dự báo lạm phát, điển hình là Michael Dotsey và cộng sự (2011) đã nghiên cứu và khẳng định khả năng ứng dụng của đường cong Philip trong dự báo lạm phát, đặc biệt đối với những nền kinh tế yếu
Ở Việt Nam, tình hình nghiên cứu và ứng dụng mô hình trong dự báo lạm phát cũng thu hút sự quan tâm của không chỉ các cơ quan quản lý vĩ mô, các trung tâm nghiên cứu, các chuyên gia nhiều kinh nghiệm và mà còn là niềm say
mê nghiên cứu nhiều sinh viên, học giả, nghiên cứu sinh Trong đó nổi bật như:
Võ Trí Thành (2001) với mô hình tự hồi quy véc-tơ VAR và sai số ECM, cho thấy mối quan hệ giữa tiền tệ, chỉ số giá tiêu dùng, tỷ giá và giá trị sản lượng công nghiệp thực tế; Nguyễn Anh Dương, Đinh Thu Hằng và Trịnh Quang Long (2010) với mô hình chỉ số dẫn báo để dự báo tăng trưởng và lạm phát ở Việt Nam; Nguyễn Trọng Hoài (2010) đã sử dụng luật Taylor để phân tích lạm phát và
đã đưa ra những gợi ý chính sách trong điều hành kinh tế vĩ mô; Nguyễn Thị Liên Hoa và Trần Đặng Dũng (2013) nghiên cứu lạm phát tại Việt Nam theo phương pháp SVAR; Đào Hoàng Dũng (2013) dự báo lạm phát quý I/2013 qua mô hình ARIMA;…
2 Dữ liệu & Phương pháp nghiên cứu
Bài tập áp dụng mô hình ARIMA sau khi loại bỏ yếu tố mùa vụ và SARIMA trên phần mềm Eviews trong phân tích và dự báo chỉ số giá tiêu dùng (CPI) của Việt Nam qua từng tháng trong giai đoạn từ tháng 03/ 2019 đến tháng 12/ 2021
2.1 Mô tả dữ liệu:
Dữ liệu được sử dụng trong nghiên cứu là chỉ số giá tiêu dùng CPI theo
tháng của Việt Nam, dữ liệu này được thu thập từ Tổng Cục Thống Kê từ tháng
1/2002 đến tháng 02/2019, tổng cộng bao gồm 206 quan sát Tất cả các quan sát này được sử dụng vào việc thiết lập mô hình
Trang 3Trước khi tiến hành dự báo, ta cần kiểm tra yếu tố mùa vụ của chuỗi số liệu:
Mở chuỗi cpi → View → Graph → Seasonal Graph, được sơ đồ như sau:
CPI by Season
104
103
102
101
100
99
Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
Means by Season
Từ hình trên, ta thấy chuỗi số liệu này có yếu tố mùa vụ Vì vậy, khi chạy
mô hình để dự báo cho chuỗi nên tính đến yếu tố mùa vụ để có kết quả dự báo chính xác hơn
2.2 Giới thiệu mô hình ARIMA và SARIMA
Mô hình tự hồi quy tích hợp trung bình trượt ARIMA (Autoregressive Integrated Moving Average) là một mô hình dự báo chuỗi thời gian đơn biến được giới thiệu bởi Box & GM Jenkins lần đầu tiên vào năm 1976, dựa trên ý tưởng cho rằng chuỗi thời gian có thể được giải thích bằng cách kết hợp các hành
vi ở hiện tại và trong quá khứ với các yếu tố ngẫu nhiên (gọi là nhiễu) Thực chất ARIMA là tổng hợp các mô hình: Mô hình tự hồi quy (AR), mô hình tích hợp (I)
và mô hình trung bình trượt (MA) Theo đó, ARIMA được kết hợp bởi 3 thành thành phần chính:=
AR = Autogressive (thành phần tự hồi quy)
I = Intergrated (tính dừng của chuỗi thời gian)
MA = Moving Average (thành phần trung bình trượt)
Điểm quan trọng cần lưu ý là để sử dụng phương pháp dự báo bằng mô hình ARIMA thì bắt buộc phải sử dụng chuỗi thời gian có tính dừng hay chuỗi thời gian có tính dừng sau khi đã thực hiện một hay nhiều phép sai phân Một chuỗi
Trang 4thời gian gọi là dừng khi và chỉ khi dữ liệu của chuỗi dao động xung quanh một giá trị trung bình dài hạn, có phương sai xác định không đổi theo thời gian và không có hiện tượng tự tương quan tại các độ trễ khác nhau dù cho chúng được xác định tại mọi thời điểm Mô hình ARIMA(p,d,q) có dạng:
= + ∆∅∆ + ∆∅∆ + + ∆⋯+∅∆ ∅∆ + ∆ + +⋯+∅∆ ∆ +
Bản chất của mô hình ARIMA là dự báo giá trị tương lai của một biến số biểu thị theo chuỗi thời gian dựa trên giá trị quá khứ và các sai số ngẫu nhiên Trong đa số trường hợp, mô hình ARIMA cho kết quả dự báo ngắn hạn đáng tin cậy nhất trong các phương pháp dự báo Hiện nay, mô hình ARIMA được sử dụng rộng rãi ở Việt Nam và trên thế giới cho các biến số kinh tế nói chung và lạm phát nói riêng, do tính dễ sử dụng, kết quả dự báo khá chính xác (trừ trường hợp môi trường kinh tế vĩ mô có biến động lớn) Tuy nhiên, mô hình ARIMA chỉ thích hợp cho việc phân tích dữ liệu chuỗi thời gian không có yếu tố mùa vụ Mà một đặc điểm rất quan trọng của các dữ liệu chuỗi thời gian về kinh tế - xã hội như CPI đó là có yếu tố mùa vụ cao Chẳng hạn thực tiễn nền kinh tế nước ta cho thấy GDP thường tăng cao vào những tháng cuối năm, tăng chậm vào những tháng đầu năm, trong khi CPI thường tăng cao nhất vào tháng 1, tháng 2 dương lịch hàng năm, và thường giảm mạnh vào tháng 3 sau đó… Vì vậy, để có những
dự báo chính xác các chỉ tiêu kinh tế - xã hội như CPI, người ta phải loại bỏ yếu
tố mùa vụ trước khi ứng dụng ARIMA hoặc sử dụng một số phương pháp dự báo
dữ liệu chuỗi thời gian có yếu tố mùa vụ được phát triển tiếp từ mô hình ARIMA, như X11ARIMA, X12ARIMA hoặc SARIMA
Mô hình SARIMA ra đời vào nửa cuối thập niên 1990, được phát triển từ
mô hình ARIMA và giải quyết yếu tố mùa vụ đồng thời cho cả 3 quá trình: tự hồi quy, tích hợp và trung bình trượt Vì thế, mô hình SARIMA phù hợp với bất kỳ
dữ liệu chuỗi thời gian mùa vụ nào
2.3 Quy trình dự báo
Trước tiên, cần kiểm tra xem mô hình thật sự có yếu tố mùa vụ S (Seasonal) hay không Sau đó, việc ứng dụng mô hình ARIMA trong phân tích và dự báo dữ
Trang 5liệu chuỗi thời gian có yếu tố mùa vụ được thực hiện bằng 2 cách theo quy trình các bước sau đây:
Cách 1: Tách yếu tố mùa vụ trước khi dự báo bằng mô hình ARIMA
Cách 2: Sử dụng mô hình SARIMA và không cần tách yếu tố mùa vụ
Bước 1: Kiểm tra tính dừng của chuỗi mới (sử dụng Unit Root Test)
Nếu chuỗi không dừng, biến đổi bằng cách lựa chọn sai phân bậc 1 hoặc sai phân bậc 2 Nếu chuỗi thời gian dừng ở bậc không ta có I(d=0), nếu sai phân bậc 1 của chuỗi dừng ta có I(d=1), nếu sai phân bậc 2 của chuỗi dừng ta có I(d=2)…vv Bước 2: Xác định các giá trị tự hồi quy p và trung bình trượt q
Sau khi kiểm định tính dừng, ta sẽ xác định bậc của thành phần tự hồi quy
AR thông qua giản đồ tương quan ACF (Autocorelation Function) và thành phần trung bình trượt MA thông qua giản đồ tương quan riêng phần PACF (Partial Autocorelation Function) Từ đó ta nhận dạng được đủ 3 thành phần của mô hình Bước 3: Ước lượng mô hình
Nếu chọn cách 2 thì ở bước này phải thêm yếu tố mùa vụ S vào các thành phần AR và MA để ước lượng mô hình: SAR(p); SMA(q)
Bước 4: Kiểm định các giả định của mô hình
Kiểm định tính ổn định và khả nghịch của mô hình
Kiểm định sự tồn tại của nhiễu trắng
Kiểm định chất lượng dự báo
Nếu kiểm định mô hình được lựa chọn không thỏa mãn thì quay lại từ giai đoạn nhận dạng để lựa chọn mô hình khác hợp lý hơn
Bước 5: Dự báo ngoài mẫu cho chuỗi
Dựa trên mô hình được lựa chọn, thực hiện dự báo giá trị tương lai của dữ liệu chuỗi mùa vụ, cũng như đưa ra khoảng tin cậy của dự báo Dự báo sau khi kiểm định sai số, nếu mô hình phù hợp, mô hình sẽ được sử dụng vào việc dự báo Các tiêu chí được sử dụng để so sánh hiệu quả dự báo là RMSE hoặc MAPE
Trang 6Bước 6: Bổ sung yếu tố mùa vụ để có kết quả dự báo cuối cùng
Nếu chọn cách 1, tức là tách yếu tố mùa vụ trước khi áp dụng ARIMA, dựa trên mô hình được lựa chọn, thực hiện cộng hoặc nhân yếu tố mùa vụ vào để có kết quả cho chuỗi cần dự báo
Nếu chọn cách 2, tức sử dụng SARIMA, ta không cần thực hiện bước 6
3 Kết quả dự báo và phân tích
3.1 Cách 1: Tách yếu tố mùa vụ khỏi chuỗi trước khi áp dụng mô hình ARIMA:
Trước tiên, tách yếu tố mùa vụ bằng phương pháp Moving Average: dựa vào biên độ dao động không đều quan sát được trên biểu đồ phần 2.1, ta lựa chọn
mô hình nhân:
Mở chuỗi cpi → Chọn Proc → Seasonal Adjustment→ Chọn Moving Average Methods → ratio to moving Multiplicative; Factors: s => Ta có chuỗi
cpisa Sau đó ta tiến hành dự báo bằng mô hình ARIMA cho chuỗi cpisa
Bước 1: Kiểm tra tính dừng của chuỗi cpisa
Mở chuỗi cpisa → Chọn View → Unit Root Test → Chọn Level → Intercept, được kết quả:
Ta thấy P-value = 0.0000 < 0.05 thỏa mãn điều kiện chuỗi dừng tại level
Bước 2: Xác định các giá trị tự hồi quy p và trung bình trượt q
Mở chuỗi cpisa → Chọn View → Correlogram… → Level & lags to include:
36, được giản đồ tương quan ACF và giản đồ tương quan riêng phần PACF:
Trang 7Từ giản đồ trên, chọn p = 1& p = 30; q =1 & q = 5 để ước lượng mô hình.
Bước 3: Ước lượng và kiểm định mô hình:
Trên cửa sổ Command gõ lệnh:
ls cpisa c ar(1) ar(30) ma(1) ma(5)
Trang 8Bước 4: Kiểm định mô hình:
- Mô hình có ý nghĩa thống kê do P-value của các hệ số ar(1), ar(30), ma(5) nhỏ hơn 0.05
- Kiểm định tính ổn định và khả nghịch của mô hình: Với Inverted AR Roots & Inverted MA Roots < 1 => Mô hình ổn định và khả nghịch
- Kiểm định nhiễu trắng của mô hình:
Chọn View → Residual Diagnostics → Serial Correlation LM Test…., được
bảng kết quả:
Ta có P-value=0.4100 > 0.05 => Mô hình không tự có tự tương quan tại mức ý nghĩa 5%, tức nhiễu trắng
Trang 9- Chất lượng dự báo: Dự báo trong mẫu chuỗi cpisa
Chọn Forecast trong khoảng thời gian 2004M01 – 2004M12, được kết quả:
102.5
102.0
101.5
101.0
100.5
100.0
99.5
99.0
2004
CPISAF ± 2 S.E.
Forecast: CPISAF Actual: CPISA
Forecast sample: 2004M01 2004M12 Adjusted sample: 2004M07 2004M12
Included observations: 6 Root Mean Squared Error 0.226964 Mean Absolute Error 0.186956 Mean Abs Percent Error 0.186250 Theil Inequality Coefficient 0.001128 Bias Proportion 0.582710 Variance Proportion 0.119065 Covariance Proportion 0.298225
Trung bình tuyệt đối phần trăm sai số (Mean Abs Percent Error): MAPE = 0.186250 < 5% nên có thể coi mô hình có chất lượng dự báo tốt
Căn bậc hai của sai số bình phương trung bình: RMSE = 0.226964
Bước 5: Dự báo ngoài mẫu chuỗi cpisa
Chọn Forecast trong khoảng thời gian 2019M03 2021M12, kết quả dự báo:
Bước 6: Dự báo chuỗi cpif
Tạo chuỗi cpif bằng cách gõ lệnh genr cpif = cpisaf *s, ta có kết quả dự báo:
Trang 10Time CPI Time CPI
Tại cửa sổ Command gõ lệnh line cpif cpi được đồ thị chuỗi cpi và cpif:
104
103
102
101
100
99
3.2 Cách 2: Sử dụng mô hình S ARIMA:
Bước 1: Kiểm tra tính dừng của chuỗi cpi
Mở chuỗi cpi → Chọn View → Unit Root Test → Chọn Level →Intercept,
ta có kết quả: P-value = 0.000 < 0.05 thỏa mãn điều kiện chuỗi dừng tại level
Trang 11Bước 2: Xác định các giá trị tự hồi quy p và trung bình trượt q
Mở chuỗi cpi → Chọn View → Correlogram… → Level & lags to include:
36, được giản đồ tương quan ACF và giản đồ tương quan riêng phần PACF:
Trang 12Từ giản đồ trên, chọn p = 1; q = 3 & q = 5 cho thành phần không có tính mùa và P = 12; Q = 12 cho thành phần có tính mùa để ước lượng mô hình Bước 3: Ước lượng mô hình
Trên cửa sổ Command gõ lệnh: ls cpi c ar(1) sar(12) ma(3) ma(5) sma(12)
Bước 4: Kiểm định mô hình:
- Mô hình có ý nghĩa thống kê: P-value của các hệ số hồi quy đều < 0.05
- Kiểm định tính ổn định và khả nghịch của mô hình: Với Inverted AR Roots & Inverted MA Roots < 1 => Mô hình ổn định và khả nghịch
- Kiểm định nhiễu trắng của mô hình:
Cách 1: Chọn View → Residual Diagnostics → Serial Correlation LM Test
Trang 13Ta có P-value=0.7134 > 0.05 => Mô hình không tự có tự tương quan tại mức ý nghĩa 5%, tức nhiễu trắng
Cách 2: Chọn View → Residual Diagnostics → Correlation – Q-statistics…, lags to include: 12, giản đồ cho thấy tồn tại nhiễu trắng:
- Chất lượng dự báo: Dự báo trong mẫu chuỗi cpi
Chọn Forecast trong khoảng thời gian 2004M01 2004M12, ta được kết quả:
105
104
103
102
101
100
99
98
M1 M2 M3 M4 M5 M6 M7 M8 M9 M10 M11 M12
2004
Forecast: CPIF Actual: CPI Forecast sample: 2004M01 2004M12 Included observations: 12
Root Mean Squared Error 0.301981 Mean Absolute Error 0.240951 Mean Abs Percent Error 0.239094 Theil Inequality Coefficient 0.001498 Bias Proportion 0.001210 Variance Proportion 0.000342 Covariance Proportion 0.998448
CPIF ± 2 S.E.
Trung bình tuyệt đối phần trăm sai số (Mean Abs Percent Error): MAPE = 0.239094 < 5% nên có thể coi mô hình có chất lượng dự báo có thể tin tưởng Căn bậc hai của sai số bình phương trung bình: RMSE = 0.301981
Bước 5: Dự báo ngoài mẫu chuỗi cpi
Chọn Forecast trong khoảng thời gian 2019M03 2021M12, được kết quả:
Trang 14(Đơn vị: %)
Tại cửa sổ Command gõ lệnh: line cpif cpi được đồ thị minh hoạ:
104
103
102
101
100
99
2002 2004 2006 2008 2010 2012 2014 2016 2018 2020
Trang 154 Kết luận và kiến nghị
Nhóm đã nghiên cứu khả năng ứng dụng của mô hình ARIMA, SARIMA vào việc dự báo chỉ số giá tiêu dùng CPI nhằm tìm ra mô hình tốt nhất cho việc
dự báo lạm phát tại Việt Nam Qua dự báo CPI bằng 2 cách, ta thấy cách 1 (mô hình ARIMA sau khi đã tách yếu tố mùa vụ) cho dự báo hiệu quả hơn do có RMSE =0.226964, thấp hơn cách 2 (dự báo bằng mô hình SARIMA) với RMSE
= 0.301981 Tuy vậy, kết quả dự báo chỉ số giá tiêu dùng CPI ở cả 2 cách đều cho thấy xu hướng biến động lên xuống không quá đáng kể của chuỗi CPI trong tương lai, từ tháng 03/2019 đến tháng 12/2021, trừ tháng 2 hàng năm khi CPI thường tăng đột biến cao nhất, do đây là tháng Tết cổ truyền, rồi lại giảm vào tháng 3 sau đó Đặc biệt, biểu đồ dự báo của mô hình ARIMA có chu kỳ dao động mạnh hơn và khá đều trong khi đồ thị dự báo của mô hình SARIMA cho thấy CPI có thể biến động mạnh hơn vào giữa và cuối năm 2019 nhưng dao động
ổn định trong năm 2020 và 2021 Tuy nhiên, trong giai đoạn hiện nay nền kinh tế
có rất nhiều biến đổi có thể tác động đến kết quả dự báo, do đó việc dự báo lạm phát trong tương lai sẽ tồn tại những sai số nhất định Dù vậy, kết quả nghiên cứu này cũng phần nào cung cấp thông tin thiết thực cho các nhà đầu tư cũng như các nhà làm chính sách trong việc tìm kiếm những giải pháp thích hợp để phòng ngừa
và tối thiểu hóa thiệt hại do lạm phát gây ra
Để kiểm soát tốt lạm phát, nhóm xin đưa ra một số đề xuất Thứ nhất, công
tác điều hành giá phải bám sát mục tiêu tăng trưởng, tránh tạo ra lạm phát kỳ vọng hay tạo ra “độ trễ” của lạm phát trong những năm sau, cần theo dõi sát diễn giá cả của các mặt hàng thiết yếu, chủ động chuẩn bị các nguồn hàng vào dịp lễ
Tết, có giải pháp bình ổn thị trường phù hợp Thứ hai, tiếp tục hoàn thiện hệ
thống pháp luật về giá, trong đó có việc hoàn thiện các định mức kinh tế - kỹ thuật làm cơ sở xác định giá theo lộ trình, bảo đảm tính đúng, đủ chi phí thực
hiện Thứ ba, về chính sách tiền tệ, cần được điều hành linh hoạt, bám sát các
diễn biến thị trường tài chính tiền tệ trong nước và quốc tế để đạt được mục tiêu kiểm soát lạm phát, ổn định thị trường ngoại tệ, góp phần ổn định kinh tế vĩ mô