+ Dự báo trong mẫuBước 4: Kết hợp yếu tố xu thế và mùa vụ để đưa ra kết quả dự báo cuối cùng + Từ dự báo trong mẫu lấy giá trị cho kết quả phần trăm sai số trung bình MAPE nhỏ nhất ta ti
Trang 1Tổng quan nghiên cứu
Phương pháp của Box and Jenkins (1976) đã được nhiều nhà nghiên cứu sử dụngrộng rãi để dự báo GDP trong tương lai
Wei và cộng sự (2010) sử dụng dữ liệu từ GDP của Thiểm Tây trong giai đoạn1952-2007 để dự báo GDP của quốc gia cho sau 6 năm Áp dụng mô hình ARIMA(1,2,1), họ thấy rằng GDP của Thiểm Tây có xu hướng tăng ấn tượng
Tương tự, Maity và Chatterjee (2012) dự báo tốc độ tăng trưởng GDP của Ấn Độbằng mô hình ARIMA (1,2,2) trong khoảng thời gian 60 năm Kết quả nghiên cứu của họcho thấy rằng các giá trị dự đoán theo xu hướng ngày càng tăng cho những năm sau
Zhang Haonan (2013) sử dụng ba mô hình ARIMA, VAR, AR (1) để mở rộngphương thức dự báo cho GDP bình quân đầu người cho năm khu vực của Thụy Điểntrong những năm 1993 - 2009 Kết quả nghiên cứu cho thấy cả ba mô hình có thể được sửdụng để dự báo trong ngắn hạn Tuy nhiên, mô hình tự hồi quy đầu tiên tự động là tốtnhất để dự báo GDP bình quân đầu người của năm khu vực của Thụy Điển
Giống với Haonan, Shahini và Haderi (2013) dự báo GDP cho Albania bằng cách
sử dụng dữ liệu hàng quý từ quý 1 năm 2003 cho đến quý hai năm 2013 Để dự báo họ đã
sử dụng hai mô hình ARIMA và VAR Kết quả của họ cho thấy nhóm mô hình VAR chokết quả dự báo tốt hơn về GDP so với mô hình ARIMA
Cuối cùng, Zakai (2014) điều tra dự báo Tổng sản phẩm quốc nội (GDP) cho Pakistan
sử dụng dữ liệu hàng quý từ năm 1953 đến năm 2012 Chọn mô hình ARIMA (1,1,0), ông đãtìm ra những giá trị dự báo GDP của Pakistan trong những năm 2013-2025
Từ các nghiên cứu đi trước về dự báo GDP trong tương lai, có thể thấy rằng môhình VAR và mô hình ARIMA được sử dụng nhiều hơn cả Trong bài nghiên cứu này,nhóm tác giả sử dụng phương pháp phân tích để dự báo cho GDP của Hoa Kỳ giai đoạnquý IV năm 2019 đến quý IV năm 2020
7
Trang 2Cơ sở lý thuyết
2.1 Lý thuyết về GDP
Tổng sản phẩm nội địa (viết tắt của Gross Domestic Product) là giá trị tính bằngtiền của tất cả sản phẩm và dịch vụ cuối cùng được sản xuất ra trong phạm vi lãnh thổtrong một khoảng thời gian nhất định, thường là một năm
Việc phân tích, tính toán GDP là cơ sở để thành lập các chiến lược phát triển kinh
tế ngắn hạn và dài hạn Chỉ số GDP là thước đo để đánh giá tốc độ phát triển kinh tế củamột quốc gia
Không chỉ vậy, thông qua GDP bình quân đầu người ta biết được mức thu nhậptương đối cũng như chất lượng sống của người dân ở từng quốc gia
2.2 Dự báo
Dự báo là việc ước lượng một sự kiện, một điều kiện nào đó trong tương lai vốnnằm ngoài tầm kiểm soát của tổ chức nhằm cung cấp cơ sở cho việc ra quyết định Dựbáo tốt có thể giúp tổ chức hình dung ra tương lai của mình sẽ như thế nào để hoạch địnhhướng đi phù hợp
2.3 Các phương pháp dự báo
2.3.1 Phương pháp san mũ Winter
San mũ Winter là phương pháp mở rộng của san mũ Holt với dữ liệu chứa yếu tốmùa vụ Yếu tố mùa vụ trong chuỗi thời gian có thể thuộc dạng phép nhân hoặc phépcộng Mô hình san mũ Winter được ước lượng thông qua các phương trình dưới đây:
* Với mô hình nhân tính:
+ Ước lượng giá trị hiện tại: L t = α*YY t /S t-s + (1-α) *Y (L t-1 + T t-1 )
+ Ước lượng xu thế: T t = β*Y(L t – L t-1 ) + (1-β) *Y T t-1
+ Ước lượng mùa vụ: S t = γ *Y Y t /L t + (1-γ) *Y S t-s
+Dự báo: ̂ + = (Ln + h*YTn) *Y Si
*Với mô hình cộng tính
+ Ước lượng giá trị hiện tại: L t = α*Y(Y t - S t-s ) + (1-α) *Y (L t-1 + T t-1 )
+ Ước lượng xu thế: T t = β*Y(L t – L t-1 ) + (1-β) *Y T t-1
+ Ước lượng mùa vụ: S t = γ *Y (Y t - L t ) + (1-γ) *Y S t-s
Trang 3α: là hệ số san mũ của giá trị tung bình (0 < α <1)
Yt là gias trị quan sats hoặc giá trị thực tại thời điểm t
β: là hệ số san mũ của giá trị xu thế (0 < β < 1)
Tt: là giá trị ước lượng xu thế
γ: là hệ số san mũ của chỉ số mùa
St là giá trị ước lượng của chỉ số mùa
h: là thời đoạn dự báo trong tương lai
i: độ dài yếu tố mùa
Y ̂
n+h: giá trị dự báo cho h giai đoạn trong tương lai 2.3.2 Dự báo bằng phương pháp phân tích
Kiểm tra dữ liệu là mô hình nhân hay mô hình cộng bằng quan sát xu thế biến động của chuỗi
+ Tính giá trị CMA4 nếu số liệu theo quý, và CMA12 nếu số liệu theo tháng
+ Tính tỷ số các quan sát là tỷ số giữa chuỗi gốc và chuỗi trung bình trượt
Chuỗi tỷ số: { } = { ( ) , ( ) , … , ( ) }
( ) ( ) ( )
+Tính tỷ số trung bình cho từng quý/ tháng
+ Hiệu chỉnh chuỗi gốc qua các chỉ số thời vụ: mỗi quý/tháng có một chỉ số mùa vụphản ánh tác động của thời vụ Giá trị chuỗi đã hiệu chỉnh là:
Kiểm định tự tương quan
Kiểm định phương sai sai số thay đổi
Kiểm định phân phối chuẩn của nhiễu
9
Trang 4+ Dự báo trong mẫu
Bước 4: Kết hợp yếu tố xu thế và mùa vụ để đưa ra kết quả dự báo cuối cùng
+ Từ dự báo trong mẫu lấy giá trị cho kết quả phần trăm sai số trung bình MAPE nhỏ nhất ta tiến hành dự báo ngoài mẫu được YSAF
+ Giá trị chuỗi đã hiệu chỉnh là:
Mô hình nhân: Yf = SR
Mô hình cộng: Yf = +SD
2.3.3 Mô hình ARIMA
Bước 1: Kiểm tra tính dừng
Nếu mỗi chuỗi thời gian gọi là dừng thì trung bình, phương sai, (tại các độ trễ khác nhau) sẽ giữ nguyên không đổi dù cho chúng được xác định tại mọi thời điểm
Trung bình: E(Y t ) = μ = const
Phương sai: Var(Y t ) = const
Để xem một chuỗi thời gian có dừng hay không, ta có thể sử dụng mô hình tự hồi
quy Yt = ρ *Y Y t-1 + U t, với giả thiết:
dừng
+ Nếu chuỗi thời gian dừng ở bậc không ta có I(d=0)
+ Nếu sai phân bậc 1 của chuỗi dừng ta có I(d=1)
+ Nếu sai phân bậc 2 của chuỗi dừng ta có I(d=2)
Đối với thành phần AR(p), mối quan hệ giữa giá trị hiện tại và quá khứ được thểhiện qua phương trình sau (2):
Giá trị p được nhận dạng thông qua biểu đồ ACF và PACF Nếu chuỗi có dạngAR(p) thì biểu đồ PACF sẽ có các hệ số tương quan riêng phần có ý nghĩa thống kê từ 1tới p và các giá trị, sau đó sẽ giảm nhanh về không, đồng thời ACF có các hệ số tươngquan sẽ giảm dần về không
Bước 2: Ước lượng các tham số và lựa chọn mô hình của các tham số
Sau khi kiểm định tính dừng, ta sẽ xác định bậc của thành phần AR và MA thôngqua biểu đồ tự tương quan (ACF) và biểu đồ tự tương quan riêng phần (PACF)
+ Nếu chuỗi có dạng AR(p) thì biểu đồ PACF sẽ có các hệ số tương quan riêngphần có ý nghĩa thống kê từ 1 tới p và các giá trị, sau đó sẽ giảm nhanh về không, đồngthời ACF có các hệ số tương quan sẽ giảm dần về không
10
Trang 5+ Nếu chuỗi có dạng MA(q) thì biểu đồ ACF sẽ có các hệ số tương quan có
ý nghĩa thống kê từ 1 tới q và các giá trị sau đó sẽ giảm nhanh về không Còn đối với PACF, các hệ số tương quan riêng phần sẽ giảm dần về không
Bước 3: Kiểm định mô hình.
+ Kiểm định tính ổn định và khả nghịch
+ Kiểm đinh nhiễu trắng
+Kiểm định chất lượng dự báo
Nếu kiểm định mô hình được lựa chọn không thỏa mãn thì quay lại từ giai đoạnnhận dạng để lựa chọn mô hình khác hợp lý hơn
Bước 4: Dự báo ngoài mẫu
Dự báo sau khi kiểm định sai số, nếu mô hình là phù hợp, mô hình sẽ được sửdụng vào việc dự báo Các tiêu chí được sử dụng để so sánh hiệu quả dự báo là RMSE,MAPE và R2
11
Trang 6Khảo sát dữ liệu
3.1 Mô tả dữ liệu
Số liệu được sử dụng trong bài là GDP của Hoa Kỳ theo quý, từ quý I năm 2010 đếnquý III năm 2019 (đơn vị: triệu USD) được IMF công bố trên trang website chính thức
Để mô tả thống kê, ta thực hiện các thao tác trên EVIEWS 8:
Nháy đúp chuỗi gdp/ View/ Descriptive Statistics & Test/ Stats Table (Phụ lục 1).Thu được kết quả được tóm tắt dưới bảng sau:
Giá trị trung bình 4,461,390.87Giá trị lớn nhất 5,401,706Giá trị nhỏ nhất 3,592,249
Độ lệch chuẩn 507,487.58
Bảng 1: Thống kê mô tả dữ liệu
Nguồn: Nhóm tác giả tự tổng hợp từ EVIEWS 8
Trang 7Hình 1: Đồ thị biểu diễn GDP của Hoa Kỳ từ quý I năm 2010 đến quý III năm 2019
Nguồn: Kết quả EVIEWS 8
Từ cửa sổ Series, chọn View/ Graph/ tại Specific, chọn Seasonal graph/ OK (Phụ
lục 2)
Hình 2: Đồ thị mùa vụ của GDP Hoa Kỳ theo quý
Nguồn: Kết quả EVIEWS 8
Từ Hình 1 và Hình 2, ta thấy dữ liệu của chúng ta lần lượt có tính xu thế và tínhmùa vụ
Tiếp theo, nhóm thực hiện kiểm tra tính dừng của chuối GDP qua kiểm định Unit
Root Test: trong cửa sổ Series, chọn View/ Unit Root Test/ tại “Test for unit root in”, lần lượt chọn “level”, “1st difference” và “2rd difference”/ OK (Phụ lục 4, 5, 6).
13
Trang 8Các kết quả được tổng hợp tại bảng sau:
Trang 9Lựa chọn mô hình
4.1 Phương pháp san mũ Winter:
Do chuỗi GDP có yếu tố mùa vụ và xu thế nên chuỗi thích hợp sử dụng phươngpháp Winter để phân tích Kết quả trực quan đồ thị khó xác định chuỗi GDP là mô hìnhcộng tính hay nhân tính Do đó nhóm tác giả quyết định thực hiện dự báo bằng phươngpháp san mũ Winter theo cả hai trường hợp này
-quả như sau:
- Phương trình ước lượng giá trị hiện tại:
Với: + Si = -107,046.4 đối với quý I
+ Si = 11,467.98 đối với quý II
+ Si = 25,671.41 đối với quý III
+ Si = 69,907.05 đối với quý IV
Thực hiện tính toán bằng excel thu được kết quả về các chỉ số sai số dự báo nhưsau:
Chỉ số sai số phần trăm trung bình tuyệt đối MAPE= 0,543637%
Chỉ số căn bậc hai sai số bình phương trung bình: MRSE=30616.26
Thực hiện lệnh “line gdp gdpwa”: vẽ đồ thị của chuỗi GDP và chuỗi dự báo winter
GDPWA thu được kết quả sau:
15
Trang 10Hình 3: Đồ thị miêu tả kết quả dự báo GDP Hoa Kỳ bằng phương pháp san mũ
Winter cộng tính và chuỗi số liệu thực tế
Nguồn: Kết quả EVIEWS 8
-được kết quả như sau:
- Phương trình ước lượng giá trị hiện tại:
Với: + Si = 0.975917 đối với quý I
+ Si = 1.002773 đối với quý II
16
Trang 11+ Si = 1.005706 đối với quý III
+ Si = 1.015604 đối với quý IV
Thực hiện tính toán bằng Excel thu được kết quả về các chỉ số sai số dự báo nhưsau:
- Chỉ số sai số % trung bình tuyệt đối MAPE= 0,467397%
- Chỉ số căn bậc hai sai số bình phương trung bình: MRSE=25,593.94
Thực hiện lệnh “line gdp gdpwm”: vẽ đồ thị của chuỗi GDP và chuỗi dự báo winter
GDPWM thu được kết quả sau:
Hình 4: Đồ thị miêu tả kết quả dự báo GDP Hoa Kỳ bằng phương pháp san mũ
Winter nhân tính và chuỗi giá trị thực tế
Nguồn: Kết quả EVIEWS 8
4.2 Dự báo bằng phương pháp phân tích
4.2.1 Dự báo với chuỗi là mô hình cộng tính
Tách yếu tố mùa vụ ra khỏi chuỗi:
Trên cửa sổ Series GDP vào Proc Seasonal Adjustment Moving Average Method.
Trên cửa sổ Seasonal Adjustment trong phần Adjustment Method chọn Difference from moving average – Additive, đặt tên cho chuỗi đã hiệu chỉnh yếu tố mùa vụ là ADYA và yếu tố mùa vụ là SFA.
Thực hiện các thao tác ta thu về kết quả về chỉ số mùa vụ Scaling Factors như
sau: 17
Trang 12Scaling Factors (SFi) Giá trị
Bảng 3: Chỉ số thời vụ chung (mô hình cộng tính)
Nguồn: Kết quả EVIEWS 8
Kết quả chỉ số mùa vụ Scaling Factors được lưu ở biến SFA với số liệu theo quý
không đổi qua các năm
Tiếp đến, ước lượng chuỗi ADYA theo hàm xu thế
Để có được hàm xu thế, trước hết ta cần tạo biên xu thế T bằng cách: trên cửa sổ
command gõ lệnh genr t = @trend(2009Q4).
Từ đồ thị chuỗi ADYA, dự đoán chuỗi này có quan hệ tuyến tính với biến xu thế,
ta thực hiện hồi quy chuỗi ADYA theo biến xu thế bằng cách thực hiện câu lệnh trên cửa
sổ command ls ady c t thu được kết quả sau:
ADY t = 35,90249 + 43,647.59 *Y T
Từ kết quả EVIEWS 8, mô hình có P-value=0.0000 < α Như vậy mô hình này có
ý nghĩa thống kê tại mức ý nghĩa α=5%
Thực hiện các kiểm định nhiễu trắng thu được kết quả như sau:
Trang 13Tên kiểm định Kết quả P-value Kết luận
tuân theo quy luật phân(Histogram-Nomality 0.512738
phối chuẩn, mô hình khôngTest)
vi phạm giả thuyết
hiện tượng tự tương quan,(Serial Correlation LM 0.0000
mô hình vi phạm giảTest)
thuyết
không có hiện tượng
Bảng 4: Kết quả kiểm định hàm xu thế mô hình cộng tính
Nguồn: Nhóm tác giả tự tổng hợp từ EVIEWS 8
Như vậy, kết quả kiểm định cho thấy mô hình chỉ vi phạm giả thuyết về tự tươngquan, ta có thể khắc phục khuyết tật này bằng phương pháp hồi quy Robust để kiểm soát
Thực hiện hồi quy Robust như sau: Trên cửa sổ ước lượng chọn Estimate Trên cửa sổ Estimate Equation chọn ROBUSTLS – Robust least squared Kết quả thu được
như sau và mô hình đã hoàn toàn loại bỏ khuyết tật:
ADY t = 35,91410 + 43,539.73 *Y T
Cuối cùng, ta tiến hành dự báo
Tại cửa sổ ước lượng của hàm xu thế, ta chọn forecast và lưu tên biến dự báo chochuỗi ADYA là ADYAF Kết quả dự báo bằng chuỗi xu thế được thu lại như dưới đây:
19
Trang 14Hình 5: Kết quả dự báo bằng phương pháp phân tích mô hình cộng tính.
Nguồn: Kết quả EVIEWS 8
Kết quả dự báo cho thấy tín hiệu khả quan với các chỉ số về sai số dự báo như sau:RMSE=49167.10 và MAPE=0.888086% < 5%, đồng thời Số không ngang bằng U
= 0.005475 < 0.55
Kết quả cho thấy có thể sử dụng mô hình để dự báo ngoài mẫu
*YDự báo ngoài mẫu
Sau khi thực hiện dự báo có chuỗi ADYA, ta kết hợp với yếu tố mùa vụ Scaling
Factors SMA để đi đến kết quả dự báo cuối cùng Trên cửa sổ câu lệnh Command gõ lệnh
genr gdpfpa = adya + sfa.
Thực hiện tiếp tục lệnh line gdp gdpfpa thu được kết quả:
Trang 15Hình 6: Đồ thị miêu tả kết quả dự báo GDP Hoa Kỳ bằng phương pháp phân tích
(mô hình cộng tính) và chuỗi giá trị thực tế
Nguồn: Kết quả EVIEWS 8
Từ đồ thị có thể thấy đường GDPFPA trùng khớp với đường GDP Thực hiện tínhtoán trên Excel thu được kết quả dự báo với các chỉ số: MAPE = 0% và RMSE = 0
4.2.2 Dự báo với chuỗi là mô hình nhân tính
Đầu tiên, tách yếu tố mùa vụ ra khỏi chuỗi:
Trên cửa sổ Series GDP vào Proc Seasonal Adjustment Moving Average Method.
Trên cửa sổ Seasonal Adjustment trong phần Adjustment Method chọn Ratio to
moving average-Multiplicative, đặt tên cho chuỗi đã hiệu chỉnh yếu tố mùa vụ là ADYM
và yếu tố mùa vụ là SFM.
Ta thu về kết quả về chỉ số mùa vụ Scaling Factors như sau:
21
Trang 16Scaling Factors (SFi) Giá trị
Bảng 5: Chỉ số thời vụ chung (mô hình nhân tính)
Nguồn: Kết quả EVIEWS 8
Thực hiện tương tự như đối với mô hình cộng, ta hồi quy hàm xu thế bằng cách
trên cửa sổ command gõ lệnh ls adym c t thu được kết quả hồi quy sau:
ADY t = 35,88586 + 43,689.73 *Y T
Từ kết quả EVIEWS 8, mô hình có P-value=0.0000 < α Như vậy mô hình này có
ý nghĩa thống kê tại mức ý nghĩa α=5%
Thực hiện các kiểm định nhiễu trắng thu được kết quả như sau:
Với mức ý nghĩa 5%, nhiễuNhiễu phân phối chuẩn
0.529252 tuân theo quy luật phân(Histogram-Nomality Test) phối chuẩn, mô hình không
vi phạm giả thuyết
(Serial Correlation LM 0.0000 hiện tượng tự tương quan,
số thay đổi
0.0342
hiện tượng phương sai sai(Heteroskedasticity-kiểm số thay đổi, mô hình vi
Bảng 6: Kết quả kiểm định hàm xu thế mô hình nhân tính
Nguồn: Nhóm tác giả tự tổng hợp từ EVIEWS 8
Như vậy không thể sử dụng hàm xu thế tuyến tính cho chuỗi GDP nhân tính.Thực hiện thay đổi hàm xu thế với hai biến độc lập t và t2 Trên cửa sổ câu lệnh
Command, gõ lênh ls adym c t t^2 thu được kết quả như sau:
ADY t = 36,78936 + 30,467.84 *Y T + 330.5474 *Y T 2
Trang 17Từ kết quả EVIEWS 8, mô hình có P-value=0.0000 < α Như vậy mô hình này có
ý nghĩa thống kê tại mức ý nghĩa α=5%
Thực hiện các kiểm định nhiễu trắng thu được kết quả như sau:
Với mức ý nghĩa 5%, nhiễuNhiễu phân phối chuẩn
0.825119 tuân theo quy luật phân phối(Histogram-Nomality Test) chuẩn, mô hình không vi
phạm giả thuyếtHiện tượng tự tương quan Với mức ý nghĩa 5%, có(Serial Correlation LM 0.0006 hiện tượng tự tương quan,
số thay đổi
0.2365
có hiện tượng phương sai(Heteroskedasticity-kiểm sai số thay đổi, mô hình vi
Bảng 7: Kết quả kiểm định hàm xu thế mô hình nhân tính
Nguồn: Nhóm tác giả tự tổng hợp từ EVIEWS 8
Như vậy, kết quả kiểm định cho thấy mô hình chỉ vi phạm giả thuyết về tự tươngquan, ta có thể khắc phục khuyết tật này bằng phương pháp hồi quy Robust để kiểm soát
Thực hiện hồi quy Robust như sau: Trên cửa sổ ước lượng chọn Estimate Trên cửa sổ Estimate Equation chọn ROBUSTLS – Robust least squared Kết quả thu được
như sau và mô hình đã hoàn toàn loại bỏ khuyết tật:
ADY t = 36,74336 + 30,913.82 *Y T + 324.4079 *Y
T 2 Cuối cùng, ta tiến hành dự báo ngoài mẫu.
Từ cửa sổ ước lượng mô hình sau khi đã khắc phục khuyết tật: Chọn Forecast vàlưu tên biến dự báo cho chuỗi ADYM là ADYMF
Kết quả dự báo bằng chuỗi xu thế được thu lại như dưới đây:
23