BÀI LÀM THEO HƯỚNG DẪNMở file US – CPI monthly thức hiện các bước sau: Bước 0: Lý thuyết về chuỗi dừng: Một chuỗi dữ liệu thời gian được xem là dừng nếu như trung bình và phương sai của
Trang 1NGÂN HÀNG NHÀ NƯỚC VIỆT NAM BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NGÂN HÀNG THÀNH PHỒ HỒ CHÍ MINH
TIỂU LUẬN MÔN HỌC: KINH TẾ LƯỢNG ỨNG DỤNG NGÀNH TÀI CHÍNH
BIA-RƯỢU-NƯỚC GIẢI KHÁT SÀI GÒN
Nhóm 8 Nhóm trưởng: Đỗ Thị Thắm STT: 41
SĐT: 0337915113 MSSV: 030135190532 Lớp: D08
GVHD: Đỗ Hoàng Oanh
TP HCM, Tháng 6/2021
Trang 3MỤC LỤC
BÀI LÀM THEO HƯỚNG DẪN 5
Bước 1: Chuỗi thời gian dự báo phải là một chuỗi dừng 5
Bước 2: Lấy sai phân DCPI để CPI từ không dừng thành dừng 9
Bước 3: Xem chuỗi DCPI có dừng hay không 10
Biểu đồ graph 10
Bước 4: Thực hiện bậc mô hình ARIMA(p,d,q) trên chuỗi dừng 14
1 Mô hình Arima là gì? 14
2 Giới thiệu mô hình Arima 14
Bước 5: Ghép mô hình ARIMA(p,d,q) 17
Bước 6: Viết mô hình ARIMA(p,d,q) 17
ARIMA (1,1,1) 18
ARIMA (1,1,1)(2,1,3) 19
ARIMA (1,1,1)(2,1,5) 20
ARIMA (1,1,1)(2,1,6) 20
ARIMA (1,1,1)(5,1,7) 21
ARIMA (1,1,1)(5,1,8) 22
ARIMA (1,1,1)(8,1,9) 23
ARIMA (1,1,1)(8,1,11) 24
ARIMA (1,1,1)(24,1,12) 25
ARIMA (1,1,1)(24,1,20) 26
Bước 7: Lựa chọn và kiểm định chẩn đoán mô hình 27
Bước 8: Kiểm định tính dừng và nghịch đảo của mô hình ARIMA(p,d,q) 29
ARIMA(1,1,1)(2,1,6) 30
ARIMA(1,1,1)(2,1,5) 30
ARIMA(1,1,1)(2,1,3) 31
Bước 9: Lựa chọn mô hình dựa trên tiêu chí độ chính xác của dự báo => chọn 1 mô hình Thực hiện tương tự với 2 mô hình còn lại 32
Trang 4Bước 10: Dự báo mô hình ARIMA 34
Chạy mô hình ARIMA với mã chứng khoán SAB 34
Bước 1: Chuỗi thời gian dự báo phải là một chuỗi dừng (stationarity) 34
Bước 2: Lấy sai phân DSAB từ không dừng thành dừng 38
Bước 3: Xem chuỗi DSAB có dừng hay không 39
Bước 4: Thực hiện bậc mô hình ARIMA(p,d,q) trên chuỗi dừng 43
1 Mô hình Arima là gì? 43
2 Giới thiệu mô hình Arima 43
Bước 5: Ghép mô hình ARIMA(p,d,q) 46
Bước 6: Thực hiện mô hình ARIMA 46
ARIMA (1,1,1) 47
ARIMA (1,1,1) (20,1,11) 48
ARIMA (1,1,1) (20,1,20) 49
ARIMA (1,1,1) (20,1,26) 50
ARIMA (1,1,1) (21,1,11) 50
ARIMA (1,1,1) (21,1,20) 52
ARIMA (1,1,1) (21,1,26) 53
ARIMA (1,1,1) (35,1,11) 54
ARIMA (1,1,1) (35,1,20) 55
ARIMA (1,1,1) (35,1,26) 56
Bước 7: Lựa chọn và chẩn đoán mô hình 57
Bước 8: Kiểm định tính dừng và nghịch đảo của mô hình ARIMA(p,d,q) 58
ARIMA (1,1,1) 59
ARIMA (1,1,1) (20,1,11) 59
ARIMA (1,1,1) (21,1,20) 60
Bước 9: Lựa chọn mô hình dựa trên tiêu chí độ chính xác của dự báo chọn 1 MH 61
Bước 10: Kiểm định Arch trên một mô hình 62
Bước 11: Viết mô hình ARCH 63
Bước 12: Mô hình GARCH(p,q) 66
Bước 13: Dự báo giá chứng khoán 69
Trang 6BÀI LÀM THEO HƯỚNG DẪN
Mở file US – CPI monthly thức hiện các bước sau:
Bước 0: Lý thuyết về chuỗi dừng:
Một chuỗi dữ liệu thời gian được xem là dừng nếu như trung bình và phương sai củaphương trình không thay đổi theo thời gian và giá trị của đồng phương sai giữa haiđoạn chỉ phụ thuộc vào khoảng cách hay độ trể về thời gian giữa hai thời đoạn nàychứ không phụ thuộc vào thời điểm thực tế mà đồng phương sai được tính(Ramanathan, 2002)
Bước 1: Chuỗi thời gian dự báo phải là một chuỗi dừng
- Lý thuyết chuỗi thời gian: Chuỗi các quan sát được thu thập trên cùng một đốitượng tại các mốc thời gian khác nhau được gọi là chuỗi thời gian
- Trong phân tích hồi quy, các biến trong chuỗi dữ liệ thời gian phải dừng thì cáckiểm định thống kê mới đáng tin cậy Một chuỗi dữ liệu thời gian được coi làdừng (tĩnh) khi chuỗi đó hội tụ các đặc tính sau:
+ Giá trị trung bình không đổi hay bằng một hằng số theo thời gian khi chuỗi dữ
liệu đó tạo ra các đoạn trung bình bằng nhau từ đó hình thành một đường trung bìnhthẳng (chuỗi dữ liệu không bị trend)
E(Yt)=µ=const
+ Phương sai không đổi hay bằng một hằng số theo thời gian khi mức độ biến động
của chuỗi dữ liệu quanh đường trung bình ổn định một trong biên độ nhất định
Var(Yt)=σ2=const
+ Hiệp phương sai chỉ mối tương quan giữa các dữ liệu với nhau không thay đổi khi
cả giá trị trung bình và phương sai đều không đổi Nói cách khác, nếu ta ngắt dữ liệuthành các giai đoạn khác nhau, thì giản đồ tự tương quan của các giai đoạn đó là nhưnhau
Trang 7Cov(Yt , Yt-k)=γk=E [(Yt - µ) (Yt-k - µ)]
Cách 1: Dự báo trên biểu đồ Graph
Biểu đồ graph:
Nhìn vào biểu đồ ta thấy:
+ Ở đoạn đầu tiên từ tháng 1/2000 đến khoảng tháng 7/2005
đường trung bình ở khoảng mức 85 Ở giai đoạn thứ 2, bắt đầu từ tháng 8/2005 đến đến khoảng tháng 6/2010 chỉ số tiêu dùng có xu hướng tăng lên liên tục với mức trung bình khoảng 95 Ở giai đoạn thứ ba từ tháng 7/2010 trở về sau, chỉ số tiêu dùng vẫn tăng với mức trung bình 105 Chuỗi dữ liệu này có các đoạn trung bình
không bằng nhau dẫn đến việc hình thành một đoạn trung bình dốc lên ( Chuỗi bị trend lên ) dẫn đến trung bình thay đổi
+ Mức độ biến động của chuỗi dữ liệu quanh đường trung bình rất
ổn định Ở mức trung bình đầu tiên từ tháng 1/2000 đến tháng
7/2005, chuỗi dữ liệu biến động với biên độ giao động từ 80 đến 90
Trang 8Ở giai đoạn trung bình thứ hai từ tháng 8/2005 đến tháng 6/2010, chuỗi dữ liệu biến động với biên độ giao động từ 95 đến 100 Ở giai đoạn trung bình thứ ba từ tháng 7/2010 trở về sau, chuỗi dữ liệu dao động với biên độ từ 100 đến 110 Cả ba giai đoạn này ta thấy các quan sát biến động ổn định trong biên độ Chỉ có một chỗ tháng8/2008 vượt ra ngoài biện độ ,tuy nhiên nó nhỏ hơn 5% tổng số lượng quan sát nên dẫn đến phương sai không thay đổi.
+ Do trung bình thay đổi và phương sai không thay đổi dẫn đến hiệp phương sai thayđổi
Kết luận: Chuỗi dữ liệu CPI không dừng
Cách 2: Dựa trên kiểm định nghiệm đơn vị (unit root test) của Deckey Fuller.
Kiểm định nghiệm đơn vị là một kiểm định được sử dụng khá phổ biến để kiểm định một chuỗi thời gian dừng hay không dừng Giả sử ta có phương trình tự hồi quy như sau:
Auto regressive function:
Nếu ρ < 1: chuỗi dừng
Nếu ρ = 1: chuỗi có nghiệm đơn vị (chuỗi không dừng)
Nếu ρ > 1: chuỗi bị bùng nổ (explosive series)
Trang 9Như vậy, các giả thiết ở trên có thể được viết lại như sau:
H0 : = 0 Yt là chuỗi có nghiệm đơn vị, chuỗi không dừng
H0 : < 0 Yt là chuỗi dừng
suất (= giá trị ước lượng / sai số của hệ số) Kiểm định thống kê còn gọi kiểm định Dickey – Fuler (DF)
Khi là một bước ngẫu nhiên không hằng số (Without Constant and trend)
Y t = t + 2 trend + Y t-1 +αi Yt-i + t (*) i=1
vị, (Y là không dừng) Khi kiểm định DF được áp dụng cho các mô hình như (*) nó được gọi là kiểm định Dickey - Fuller mở rộng (Augmented Dickey-Fuller (ADF) test) Trị thống kê của kiểm định ADF có cùng một phân bổ tiệm cận giống như của trị thống kê DF, do vậy có thể sử dụng cùng các giá trị tới hạn giống nhau (Cao Hào Thi,2011)
Khi đó :
(tồn tại nghiệm đơn vị) => chuỗi dữ liệu không dừng
Trang 10Nếu |a| tính toán < || giá trị ADF (ADF test statistic) suy ra không có cơ sở
Null Hypothesis: CPI has a unit root
Exogenous: Constant, Linear Trend
Lag Length: 2 (Automatic - based on SIC, maxlag=13)
t-Statistic Prob.*
*MacKinnon (1996) one-sided p-values.
H0: CPIt có 1 nghiệm đơn vị (CPIt không dừng)
H1: CPIt không có nghiệm đơn vị (CPIt dừng)
p-value < α: bác bỏ giả thiết H0 với mức ý nghĩa α = 1% hay α = 5% hay α = 10%p-value = 0.1423 > α = 0.1 = 10%: chấp nhận giả thiết H0
Vậy CPIt có 1 nghiệm đơn vị (CPIt không dừng) với mức ý nghĩa α = 10%
Bước 2: Lấy sai phân D CPI để CPI từ không dừng thành dừng
Giải cách lấy sai phân DEIB: tìm sai phân DEIB bằng cách lấy EIB vào năm n trừ
cho EIB vào năm n-1 (năm trước đó) Gõ câu lệnh: DEIB = EIB – EIB(-1)
Cách 1: Dự báo trên biểu đồ Graph
Ta biết rằng nhiều chuỗi thời gian kinh tế không có tính dừng, tức làchúng kết hợp Do vậy, nếu ta phải tính sai phân một chuỗi thời gian d lần để làm cho nó có tính dừng và sau đó áp dụng mô hình ARMA (p, q), ta nói rằng chuỗi thời gian ban đầu là ARIMA (p, d, q), tức là nó là một chuỗi thời gian trung bình trượt kết hợp tự hồi quy
Do chuỗi CPI không dừng nên phải lấy sai phân để thành dừng
Trang 11Bước 3: Xem chuỗi DCPI có dừng hay không
Biểu đồ graph
Trang 12Nhìn vào biểu đồ ta thấy:
+ Từ năm cuối năm 2000 đến cuối năm 2014 đường trung bình dao động quanh trụcxấp xỉ bằng 0,2 Chuỗi dữ liệu này có các đoạn trung bình bằng nhau dẫn đến việchình thành một đường trung bình tương đối thẳng (Chuỗi không bị trend) dẫn đếntrung bình không thay đổi
+ Mức độ biến động của chuỗi dữ liệu quanh đường trung bình tương đối ổn định vớibiên độ dao động từ -0,4 đến 0,8 Hầu hết các quan sát đều biến động trong biên độ Tuy nhiên, có một vài quan sát có biến động vượt ra ngoài biên độ nhưng chỉ chiếm
số lượng rất ít trên tổng số quan sát, sĩ số quan sát xảy ra đột biến (chiếm dưới 5% tổng số quan sát) như vậy rất hiếm nên không đáng kể Vì vậy dẫn đến phương sai không thay đổi
+Do trung bình không thay đổi và phương sai không thay đổi dẫn đến hiệp phương sai không thay đổi
Kết luận: Chuỗi dữ liệu DCPI dừng
Trang 13Cách 2: Dựa trên kiểm định nghiệm đơn vị (unit rỏt test) của Deckey Fuller.
Kiểm định nghiệm đơn vị là một kiểm định được sử dụng khá phổ biến để kiểm định một chuỗi thời gian dừng hay không dừng Giả sử ta có phương trình tự hồi quy như sau:
Auto regressive function:
Nếu ρ < 1: chuỗi dừng
Nếu ρ = 1: chuỗi có nghiệm đơn vị (chuỗi không dừng)
Nếu ρ > 1: chuỗi bị bùng nổ (explosive series)
Như vậy, các giả thiết ở trên có thể được viết lại như sau:
H0 : = 0 Yt là chuỗi có nghiệm đơn vị, chuỗi không dừng
H0 : < 0 Yt là chuỗi dừng
suất (= giá trị ước lượng / sai số của hệ số) Kiểm định thống kê còn gọi kiểm định Dickey – Fuler (DF)
Khi là một bước ngẫu nhiên không hằng số (Without Constant and trend)
Y t = Y t-1 + u t
Khi là một bước ngẫu nhiên có hằng số (Without Constant)
Trang 14Y t = 1 + Y t-1 + u t
Khi Yt là một bước ngẫu nhiên có hằng số xoay quanh một đường xu thế ngẫu nhiên
Y t = t + 2 trend + Y t-1 + u t
Y t = t + 2 trend + Y t-1 +αi Yt-i + t (*) i=1
vị, (Y là không dừng) Khi kiểm định DF được áp dụng cho các mô hình như (*) nó được gọi là kiểm định Dickey - Fuller mở rộng (Augmented Dickey-Fuller (ADF) test) Trị thống kê của kiểm định ADF có cùng một phân bổ tiệm cận giống như của trị thống kê DF, do vậy có thể sử dụng cùng các giá trị tới hạn giống nhau (Cao Hào Thi,2011)
Khi đó :
(tồn tại nghiệm đơn vị) => chuỗi dữ liệu không dừng
Null Hypothesis: DCPI has a unit root
Exogenous: Constant
Lag Length: 1 (Automatic - based on SIC, maxlag=13)
t-Statistic Prob.*
*MacKinnon (1996) one-sided p-values.
H0: DCPIt có 1 nghiệm đơn vị (DCPIt không dừng)
H1: DCPIt không có nghiệm đơn vị (DCPIt dừng)
p-value < α: bác bỏ giả thiết H0 với mức ý nghĩa α = 1% hay α = 5% hay α = 10%
Trang 15p-value = 0 < α = 0.1 = 10%: bác bỏ giả thiết H0.
Vậy DCPIt không có nghiệm đơn vị (DCPIt dừng) với mức ý nghĩa α = 10%
Bước 4: Thực hiện bậc mô hình ARIMA(p,d,q) trên chuỗi dừng.
1 Mô hình Arima là gì?
Mô hình Arima là một loại mô hình được sử dụng phổ biến trong kinh tế lượng Cóthể hiểu, Arima là mô hình được sử dụng để dự đoán và khai phá các dữ liệu trongngành tài chính và chứng khoán Đây là một phương pháp nghiên cứu độc lập thôngqua việc dự đoán theo các chuỗi thời gian Sau đó, các nhà nghiên cứu sẽ sử dụng cácthuật toán dự báo độ trễ để đưa ra mô hình phù hợp
Ví dụ về mô hình Arima có rất nhiều, chúng được dùng thường xuyên trongkinh tế lượng để dự báo sự biến động của tài chính và chứng khoán Chẳng hạn,người ta sẽ dùng Arima để dự liệu về một mã cổ phiếu ngắn hạn
2 Giới thiệu mô hình Arima
Mô hình Arima được nghiên cứu và phát hiện bởi hai nhà nghiên cứu làGeorge Box và Gwilym Jenkins Vì thế, loại mô hình này còn được biết đến với têngọi là phương pháp Box – Jenkins
Phương pháp này gồm 4 bước:
Trang 16hỗn hợp AR và MA Hàm số tuyến tính của chúng sẽ bao gồm những quan sát dừngquá khứ cũng như những sai số được dự báo ở quá khứ và hiện tại.
Vậy còn mô hình Arima (p,d,q) là gì? Mô hình ARIMA (p,d,q) chỉ mô tả chuỗidừng hoặc những chuỗi đã sai phân hóa Do vậy, mô hình ARIMA(p,d,q) sẽ thể hiệnnhững chuỗi dữ liệu không dừng có sai phân là d
Tự tương quan là hiện tượng mà sai số tại thời điểm t có mối quan hệ với sai sốtại thời điểm t-1 hoặc tại bất kỳ thời điểm nào khác trong quá khứ Sai số dược
Hàm tự tương quan từng phần (PACF) đo mức độ phụ thuộc tuyến tính từng phần là biểu đồ có được khi vẽ các hệ số tự tương quan riêng phần tkk, lần lượt tại kk
= 1,2,3…
Do tồn tại tương quan trực tiếp giữa Yt và Yt−s (s ≤ p) và không tồn tại tương quan trực tiếp giữa Yt và Yt−s (s > p), PACF thường có hệ số tự tương quan riêng phần khác 0 đối với các bậc trễ nhỏ hơn hoặc bằng bậc trễ của mô hình (tkk ≠0, kk ≤ p) và có hệ số tương quan riêng phần bằng 0 đối với các bậc trễ lớn hơn bậc trễ của
mô hình (tkk =0, kk>p)
MA (q) tương ứng cột ACF
AR (p) tương ứng cột PACF (partial)
Trang 17*Vì CPI là chuỗi không dừng và DCPI là chuỗi dừng nên ta sẽ thực hiện mô hình ARIMA(p,d,q)
MA(q) tương ứng cột ACF
AR(p) tương ứng cột PACF (partial): (nằm ngoài đường biên gạch chấm)
p = 1, 2, 5, 8, 24
d = 1
q = 1, 3, 5, 6, 7, 8, 9, 11, 12, 20, 24
Bước 5: Ghép mô hình ARIMA(p,d,q)
Lấy 10 mô hình ARIMA (p,d,q) bất kỳ từ Bước 4:
ARIMA (1,1,1)
ARIMA (1,1,1)(2,1,3)
ARIMA (1,1,1)(2,1,5)
Trang 18Bước 6: Viết mô hình ARIMA(p,d,q)
Mô hình chuỗi thời gian đơn biến hay còn được gọi với cái tên mô hình ARIMA được sử dụng khi hành vi của biến số cần giải thích được quyết định bởi những thôngtin về giá trị của chính nó trong quá khứ và/hoặc giá trị hiện tại và quá khứ của hạng nhiễu
Mô hình tự hồi qui là giá trị ước tính tương lai của mô hình phân tích chuỗi thời gian chỉ phụ thuộc vào giá trị trong quá khứ.: Yt-1, Yt-2 , Yt-n và sai số ut Mô hình tự hồi quy bậc 1có dạng:
AR(1): Yt = µ + ϕ Yt-1 + ut
Trong mô hình tự hồi qui quá trình phụ thuộc vào tổng có trọng số của các giá trị quá khứ và số hạng ngẫu nhiên:
AR(p): Yt = µ + ϕ1 Yt-1 + µ + ϕ2 Yt-2 + ϕ3 Yt-3+ + ϕp Yt-p + ut
Mô hình trung bình trượt (MA) là loại mô hình đơn giản nhất trong nhóm các mô hình chuỗi thời gian mà giá trị hiện tại của biến số Yt chỉ phụ thuộc vào sai số ut Mô hình trung bình trượt bậc 1 có dạng:
MA(1): Yt = µ + θ1ut-1+ ut
Trang 19Trong mô hình trung bình trượt quá trình phụ thuộc vào tổng có trọng số của các ngẫu nhiên hiện hành có độ trễ:
MA(q): Yt = µ + θ1ut-1 + θ2ut-2 + θ3ut-3 + …+ θqut-q+ ut
Trong đó: ut là nhiễu trắng
µ (const) là hằng số
t=1,2,3 n
ARIMA (1,1,1)
Dependent Variable: DCPI
Method: Least Squares
Date: 06/07/21 Time: 21:47
Sample (adjusted): 2000M03 2014M12
Included observations: 178 after adjustments
Convergence achieved after 21 iterations
DCPIt = 0.1644 + 0.3128 AR(1) + 0.3040 MA(1) + ȗt
DCPIt = 0.1644 + 0.3128 DCPIt-1 + 0.3040 ȗt-1 + ȗt
CPIt – CPIt-1 = 0.1644 + 0.3128 (CPIt-1 – CPIt-2) + 0.3040 ȗt-1 + ȗt
CPIt = 0.1644 + 1.3128 CPIt-1 – 0.3128 CPIt-2 + 0.3040 ȗt-1 + ȗt
ARIMA (1,1,1)(2,1,3)
Dependent Variable: DCPI
Method: Least Squares
Date: 06/07/21 Time: 22:08
Sample (adjusted): 2000M04 2014M12
Trang 20Included observations: 177 after adjustments
Convergence achieved after 9 iterations
Inverted AR Roots .27 .02
Inverted MA Roots .52 -.43+.51i -.43-.51i
DCPIt = 0.1635 + 0.2894 AR(1) – 0.0048 AR(2) + 0.3488 MA(1) – 0.2353 MA(3) + ȗt
DCPIt = 0.1635 + 0.2894 DCPIt-1 – 0.0048 DCPIt-2 + 0.3488 ȗt-1 – 0.2353 ȗt-3 + ȗtCPIt – CPIt-1 = 0.1635 + 0.2894 (CPIt-1 – CPIt-2) – 0.0048 (CPIt-2 – CPIt-3) + 0.3488 ȗt-1 – 0.2353 ȗt-3 + ȗt
CPIt = 0.1635 + 1.2894 CPIt-1 – 0.2942 CPIt-2 + 0.0048 CPIt-3 + 0.3488 1 – 0.2353
ȗt-3 + ȗt
ARIMA (1,1,1)(2,1,5)
Dependent Variable: DCPI
Method: Least Squares
Date: 06/07/21 Time: 22:10
Sample (adjusted): 2000M04 2014M12
Included observations: 177 after adjustments
Convergence achieved after 13 iterations
Trang 21Log likelihood -48.02122 Hannan-Quinn criter 0.635498
Inverted AR Roots 45+.48i 45-.48i
Inverted MA Roots .76 27+.63i .27-.63i -.50-.39i
CPIt = 0.1685 + 1.9049 CPIt-1 – 1.3356 CPIt-2 + 0.4307 CPIt-3 - 0.3124 ȗt-1 – 0.1454 ȗt-5+ ȗt
ARIMA (1,1,1)(2,1,6)
Dependent Variable: DCPI
Method: Least Squares
Date: 06/07/21 Time: 22:10
Sample (adjusted): 2000M04 2014M12
Included observations: 177 after adjustments
Convergence achieved after 12 iterations
Inverted AR Roots 64+.38i 64-.38i
Inverted MA Roots .85 42+.45i .42-.45i -.22+.50i
-.22-.50i -.52
DCPIt = 0.1716 + 1.2721 AR(1) – 0.5474 AR(2) – 0.7396 MA(1) – 0.0502 MA(6) + ȗt
Trang 22DCPIt = 0.1716 + 1.2721 DCPIt-1 – 0.5474 DCPIt-2 – 0.7396 ȗt-1 – 0.0502 ȗt-6 + ȗtCPIt – CPIt-1 = 0.1716 + 1.2721 (CPIt-1 – CPIt-2) – 0.5474 (CPIt-2 – CPIt-3) – 0.7396 ȗt-1 – 0.0502 ȗt-6 + ȗt
CPIt = 0.1716 + 2.2721 CPIt-1 – 1.8195 CPIt-2 + 0.5474 CPIt-3 – 0.7396 1 – 0.0502
ȗt-6 + ȗt
ARIMA (1,1,1)(5,1,7)
Dependent Variable: DCPI
Method: Least Squares
Date: 06/07/21 Time: 22:11
Sample (adjusted): 2000M07 2014M12
Included observations: 174 after adjustments
Convergence achieved after 30 iterations
Inverted AR Roots 62-.39i 62+.39i -.15-.63i -.15+.63i
-.63 Inverted MA Roots 50-.25i 50+.25i .09+.57i 09-.57i
CPIt = 0.1643 + 1.3050 CPIt-1 – 0.3050 CPIt-2 – 0.1422 CPIt-5 + 0.1422 CPIt-6 + 0.3101ȗt-1 + 0.0254 ȗt-7 + ȗt
Trang 23ARIMA (1,1,1)(5,1,8)
Dependent Variable: DCPI
Method: Least Squares
Date: 06/07/21 Time: 22:11
Sample (adjusted): 2000M07 2014M12
Included observations: 174 after adjustments
Convergence achieved after 21 iterations
Inverted AR Roots 63-.40i 63+.40i -.16-.65i -.16+.65i
-.64 Inverted MA Roots .75 52+.55i .52-.55i -.03+.78i
-.03-.78i -.59+.55i -.59-.55i -.82
DCPIt = 0.1662 + 0.3026 AR(1) – 0.1608 AR(5) + 0.2762 MA(1) – 0.1419 MA(8) + ȗt
DCPIt = 0.1662 + 0.3026 DCPIt-1 – 0.1608 DCPIt-5 + 0.2762 ȗt-1 – 0.1419 ȗt-8 + ȗtCPIt – CPIt-1 = 0.1662 + 0.3026 (CPIt-1 – CPIt-2) – 0.1608 (CPIt-5 – CPIt-6) + 0.2762 ȗt-1 – 0.1419 ȗt-8 + ȗt
CPIt = 0.1662 + 1.3026 CPIt-1 – 0.3026 CPIt-2 - 0.1608 CPIt-5 + 0.1608 CPIt-6 + 0.2762 ȗt-1 – 0.1419 ȗt-8 + ȗt
ARIMA (1,1,1)(8,1,9)
Dependent Variable: DCPI
Method: Least Squares
Date: 06/07/21 Time: 22:11
Sample (adjusted): 2000M10 2014M12
Included observations: 171 after adjustments
Convergence achieved after 25 iterations
MA Backcast: 2000M01 2000M09
Trang 24Inverted AR Roots 77+.30i 77-.30i .34-.72i 34+.72i
-.26-.72i -.26+.72i -.69+.30i -.69-.30i Inverted MA Roots .77 58+.51i .58-.51i 11-.78i
11+.78i -.43-.68i -.43+.68i -.79+.27i -.79-.27i
DCPIt = 0.1651 + 0.3031 AR(1) – 0.1387 AR(8) + 0.2914 MA(1) – 0.1279 MA(9) + ȗt
DCPIt = 0.1651 + 0.3031 DCPIt-1 – 0.1387 DCPIt-8 + 0.2914 ȗt-1 – 0.1279 ȗt-9 + ȗtCPIt – CPIt-1 = 0.1651 + 0.3031 (CPIt-1 – CPIt-2) – 0.1387 (CPIt-8 – CPIt-9) + 0.2914 ȗt-1 – 0.1279 ȗt-9 + ȗt
CPIt = 0.1651 + 1.3031 CPIt-1 – 0.3031 CPIt-2 – 0.1387 CPIt-8 + 0.1387 CPIt-9 + 0.2914ȗt-1 – 0.1279 ȗt-9 + ȗt
ARIMA (1,1,1)(8,1,11)
Dependent Variable: DCPI
Method: Least Squares
Date: 06/07/21 Time: 22:12
Sample (adjusted): 2000M10 2014M12
Included observations: 171 after adjustments
Convergence achieved after 91 iterations
Trang 25Prob(F-statistic) 0.000000
Inverted AR Roots 78-.30i 78+.30i .35+.72i 35-.72i
-.26+.73i -.26-.73i -.70-.30i -.70+.30i Inverted MA Roots 76-.23i 76+.23i .51+.61i 51-.61i
10+.80i 10-.80i -.36+.73i -.36-.73i -.70-.44i -.70+.44i -.83
DCPIt = 0.1633 + 0.3465 AR(1) – 0.1563 AR(8) + 0.2295 MA(1) + 0.0987 MA(11) +ȗt
DCPIt = 0.1633 + 0.3465 DCPIt-1 – 0.1563 DCPIt-8 + 0.2295 ȗt-1 + 0.0987 ȗt-11 + ȗtCPIt – CPIt-1 = 0.1633 + 0.3465 (CPIt-1 – CPIt-2) – 0.1563 (CPIt-8 – CPIt-9) + 0.2295 ȗt-1 + 0.0987 ȗt-11 + ȗt
CPIt = 0.1633 + 1.3465 CPIt-1 – 0.3465 CPIt-2 - 0.1563 CPIt-8 + 0.1563 CPIt-9 + 0.2295 ȗt-1 + 0.0987 ȗt-11 + ȗt
ARIMA (1,1,1)(24,1,12)
Dependent Variable: DCPI
Method: Least Squares
Date: 06/07/21 Time: 22:12
Sample (adjusted): 2002M02 2014M12
Included observations: 155 after adjustments
Convergence achieved after 15 iterations
Inverted AR Roots .96 93+.24i .93-.24i 83-.47i
83+.47i 68-.66i .68+.66i 49-.81i 49+.81i 26-.91i .26+.91i 01+.94i 01-.94i -.23+.91i -.23-.91i -.46+.81i -.46-.81i -.65-.66i -.65+.66i -.80+.47i -.80-.47i -.90-.24i -.90+.24i -.93 Inverted MA Roots 77-.21i 77+.21i .56-.58i 56+.58i
19-.79i 19+.79i -.24+.79i -.24-.79i -.61+.58i -.61-.58i -.82+.21i -.82-.21i
Trang 26DCPIt = 0.1591 + 0.3291 AR(1) + 0.2363 AR(24) + 0.2745 MA(1) + 0.0966 MA(12) + ȗt
DCPIt = 0.1591 + 0.3291 DCPIt-1 + 0.2363 DCPIt-24 + 0.2745 ȗt-1 + 0.0966 ȗt-12 + ȗtCPIt – CPIt-1 = 0.1591 + 0.3291 (CPIt-1 – CPIt-2) + 0.2363 (CPIt-24 – CPIt-25) + 0.2745 ȗt-1 + 0.0966 ȗt-12 + ȗt
CPIt = 0.1591 + 1.3291 CPIt-1 – 0.3291 CPIt-2 + 0.2363 CPIt-24 – 0.2363 CPIt-25 + 0.2745 ȗt-1 + 0.0966 ȗt-12 + ȗt
ARIMA (1,1,1)(24,1,20)
Dependent Variable: DCPI
Method: Least Squares
Date: 06/07/21 Time: 22:13
Sample (adjusted): 2002M02 2014M12
Included observations: 155 after adjustments
Convergence achieved after 17 iterations
Inverted AR Roots .96 93-.24i .93+.24i 83+.47i
83-.47i 68+.67i .68-.67i 49-.82i 49+.82i 26-.91i .26+.91i 01-.94i 01+.94i -.23+.91i -.23-.91i -.46+.82i -.46-.82i -.66+.67i -.66-.67i -.81+.47i -.81-.47i -.90-.24i -.90+.24i -.93 Inverted MA Roots .89 85-.28i .85+.28i 72+.53i
72-.53i 52+.73i .52-.73i 27-.86i 27+.86i -.01+.90i -.01-.90i -.29+.86i -.29-.86i -.55+.73i -.55-.73i -.75-.53i -.75+.53i -.88+.28i -.88-.28i -.92
DCPIt = 0.1614 + 0.3189 AR(1) + 0.2651 AR(24) + 0.2901 MA(1) – 0.1321 MA(20) + ȗt
Trang 27DCPIt = 0.1614 + 0.3189 DCPIt-1 + 0.2651 DCPIt-24 + 0.2901 ȗt-1 – 0.1321 ȗt-20 + ȗt
CPIt – CPIt-1 = 0.1614 + 0.3189 (CPIt-1 – CPIt-2) + 0.2651 (CPIt-24 – CPIt-25) + 0.2901
ȗt-1 – 0.1321 ȗt-20 + ȗt
CPIt = 0.1614 + 1.3189 CPIt-1 – 0.3189 CPIt-2 + 0.2651 CPIt-24 – 0.2651 CPIt-25 +
0.2901 ȗt-1 – 0.1321 ȗt-20 + ȗt
Bước 7: Lựa chọn và kiểm định chẩn đoán mô hình.
Sau khi đã thực hiện mô hình ARIMA cụ thể và ước lượng các tham số của nó, ta tìm
hiểu xem mô hình lựa chọn có phù hợp với dữ liệu ở mức chấp nhận hay không bởi
vì có thể một mô hình ARIMA khác cũng phù hợp với dữ liệu Một kiểm định đơn
giản về mô hình lựa chọn là xem các phần dư ước lượng từ mô hình này có tính ngẫu
nhiên thuần túy hay không (tức là có nhiễu trắng hay không)
Từ 10 mô hình, lựa chọn ra 3 mô hình tốt nhất
Ba tiêu chuẩn cơ bản:
1 Mô hình ARIMA (p,d,q) phải vượt qua tất cả các kiểm định
Trang 282 Adjusted R²) cao
3 Các chuẩn thông tin thấp (AIC, SBIC, HQIC nhỏ)
Hệ số xác định R2 cho biết mức độ phù hợp của mô hình nghiên cứu với ý nghĩa làcác biến.Đồng thời còn giải thich nhân tố phụ thuộc đó đạt bao nhiêu phần trăm trongquá trình nghiên cứu
Hệ số hiệu chỉnh Adjusted R2 được nghiên cứu giúp khắc phục nhược điểm của rbình phương thông thường.Hệ số này cho phép ta đo độ thích hợp khi ta thêm mộttham số nữa Qua đó giúp giảm sự phức tạp của mô hình
Chỉ số Akaike Information Criterion (AIC) là một chỉ số ước lượng của out-of- mẫulỗi dự đoán và chất lượng do đó tương đối của mô hình thống kê cho một tập hợp dữliệu.Đưa ra một tập hợp các mô hình cho dữ liệu, AIC ước tính chất lượng của từng
mô hình,liên quan đến từng mô hình khác.Do đó,AIC cung cấp một phương tiện đểlựa chọn mô hình
Ngược lại với AIC, các tiêu chuẩn SIC( BIC) và HQ là các tiêu chuẩn tin cậy trongviệc lựa chọn mô hình.Chúng ta thực hiện điều chỉnh mạnh hơn so vớiAIC.McQuarrie và Tsai (1998,pp.36-43) còn gợi ý chi tiết khả năng bị over-fitted khi
sử dụng các tiêu chuẩn thông tin trên
Mô hình ARIMA (1,1,1) (2,1,5) có ba chỉ số AIC, SBIC, HQIC đo về chuẩn thông tincủa mô hình là nhỏ nhất và tối ưu hai so với các mô hình khác như vậy thì độ biến động tin tức sẽ thấp nhất khiến cho việc dự báo ít rủi ro hơn
Mô hình ARIMA (1,1,1) (2,1,3) có hau chỉ số AIC , HQIC đo về chuẩn thông tin của
mô hình tối ưu thứ ba so với các mô hình khác như vậy thì độ biến động tin tức sẽ thấp hơn so với các mô hình còn lại Do đó mà việc dự báo ít rủi ro hơn
Trang 29Bước 8: Kiểm định tính dừng và nghịch đảo của mô hình
ARIMA(p,d,q).
Tính dừng của mô hình AR là một thuộc tính thiết yếu đối với dự báo bằng mô hình
AR Nếu mô hình AR không dừng không thể dự báo giá trị của Yt dựa trên các giá trị trong quá khứ do các dữ liệu sai số trong quá khứ vẫn tác động mạnh đến giá trị hiện tại Yt
Tính khả nghịch của mô hình MA cũng là một yếu tố quan trọng đối với mô hình ARIMA Nếu mô hình MA không nghịch đảo, phần dư (là thông tin trong
trường hợp dự báo giá chứng khoán) trong quá khứ vẫn sẽ tác động mạnh lên giá trị hiện tại của biến phụ thuộc Yt theo thời gian Để MA khả nghịch thì nghịch đảo nghiệm đặc trưng của MA phải nằm trong vòng tròn đơn vị
ARIMA(1,1,1)(2,1,6)
Inverse Roots of AR/MA Polynomial(s)
Specification: DCPI C AR(1) AR(2) MA(1) MA(6)
No root lies outside the unit circle.
ARMA model is stationary.
0.422152 ± 0.452551i 0.618881 7.661132
-0.215908 ± 0.496710i 0.541607 3.171989
No root lies outside the unit circle.
ARMA model is invertible.
Trị tuyệt đối tổng tất cả hệ số hồi quy bé hơn 1 chứng tỏ rằng nghịch đảo nghiệm đặc trưng nằm trong vòng tròn đơn vị Bên cạnh đó, tổng tất cả các nghiệm của MA có giá trị tuyệt đối đều bé hơn 1 chứng tỏ rằng nghịch đảo nghiệm đặc trưng nằm trong vòng tròn đơn vị
Vậy AR dừng và MA nghịch đảo Mô hình ARIMA(1,1,1)(2,1,6) là mô hình tốt
Trang 30Inverse Roots of AR/MA Polynomial(s)
Specification: DCPI C AR(1) AR(2) MA(1) MA(5)
No root lies outside the unit circle.
ARMA model is stationary.
0.274209 ± 0.634830i 0.691520 5.402283
-0.496238 ± 0.394674i 0.634050 2.544104
No root lies outside the unit circle.
ARMA model is invertible.
Trị tuyệt đối tổng tất cả hệ số hồi quy bé hơn 1 chứng tỏ rằng nghịch đảo nghiệm đặc trưng nằm trong vòng tròn đơn vị Bên cạnh đó, tổng tất cả các nghiệm của MA có giá trị tuyệt đối đều bé hơn 1 chứng tỏ rằng nghịch đảo nghiệm đặc trưng nằm trong vòng tròn đơn vị
Vậy AR dừng và MA nghịch đảo Mô hình ARIMA(1,1,1)(2,1,5) là mô hình tốt ARIMA(1,1,1)(2,1,3)
Inverse Roots of AR/MA Polynomial(s)
Specification: DCPI C AR(1) AR(2) MA(1) MA(3)
No root lies outside the unit circle.
ARMA model is stationary.
-0.434562 ± 0.513243i 0.672505 2.763819
No root lies outside the unit circle.
ARMA model is invertible.
Trang 31Trị tuyệt đối tổng tất cả hệ số hồi quy bé hơn 1 chứng tỏ rằng nghịch đảo nghiệm đặc trưng nằm trong vòng tròn đơn vị Bên cạnh đó, tổng tất cả các nghiệm của MA có giá trị tuyệt đối đều bé hơn 1 chứng tỏ rằng nghịch đảo nghiệm đặc trưng nằm trong vòng tròn đơn vị.
Vậy AR dừng và MA nghịch đảo Mô hình ARIMA(1,1,1)(2,1,3) là mô hình tốt.
Kết luận: Vậy có 3 mô hình thỏa mãn AR dừng và MA nghịch đảo:
Bước 9: Lựa chọn mô hình dựa trên tiêu chí độ chính xác của dự báo
=> chọn 1 mô hình Thực hiện tương tự với 2 mô hình còn lại.
Một trong số các lý do về tính phổ biến của phương pháp này là ở tính thành công trong mô hình dự báo Có rất nhiều mô hình dự báo, nhưng ưu điểm của kỹ thuật này
là dùng chính chuỗi thời gian này dự báo cho chính nó Hay nói cách khác, nó đã mô hình hóa gần như tất cả dao động của chuỗi thời gian ban đầu Do đó, với những
chuỗi dữ liệu mang tính nhạy cảm như dự báo biến động giá dầu, giá vàng, giá chứngkhoán Mô hình ARIMA được xem là một mô hình phù hợp
Trang 32Ưu điểm của kỹ thuật này là dùng chính chuỗi thời gian này dự báo cho chính
nó Hay nói cách khác, nó đã mô hình hóa gần như tất cả dao động của chuỗi thời gian ban đầu Do đó, với những chuỗi dữ liệu mang tính nhạy cảm như dự báo biến động giá dầu, giá vàng, giá chứng khoán Mô hình ARIMA được xem là một mô hìnhphù hợp
Giá trị sai số bình phương trung bình (RMSE – Root Mean Square Error): là sựkhác biệt giữa các ước lượng và những gì được đánh giá MSE là một hàm rủi
mát bậc hai Sự khác biệt xảy ra do ngẫu nhiên, hoặc vì các ước lượng khôngtính đến thông tin có thể cho ra một ước tính chính xác hơn
Giá trị sai số tuyệt đối trung bình (MAE – Mean Absolute Error): AE đo lườngmức độ trung bình của các lỗi trong một tập hợp các dự đoán, mà không xemxét hướng của chúng Đó là trung bình trên mẫu thử nghiệm về sự khác biếttuyệt đối giữa dự đoán và lượng quan sát thực tế, trong đó tất cả các khác biệtvới trọng số bằng nhau
Giá trị tỷ lệ sai số tuyệt đối (MAPE - Mean Absolute Percent Error): là phầntrăm sai số trung bình tuyệt đối Lỗi phần trăm tuyệt đối trung bình (MAPE) làthước đo thống kê mức độ chính xác của một hệ thống dự báo Nó đo độ chínhxác này theo phần trăm và có thể được tính là sai số phần trăm tuyệt đối trungbình cho mỗi khoảng thời gian trừ đi các giá trị thực chia cho các giá trị thực.Lỗi phần trăm tuyệt đối trung bình (MAPE) là biện pháp phổ biến nhất được sửdụng để dự báo lỗi và hoạt động tốt nhất nếu không có cực trị đối với dữ liệu(không có số không)
Dựa trên các sai số của dự báo gồm MSE, MAE, MAPE ta đánh giá mô hình
ARIMA(1,1,1)(2,1,3) có mức độ chính xác của dự báo là cao nhất vì chỉ số của tiêu chí MAE (sai số trung bình trong sự phù hợp), MAPE (sai số tương đối trung bình) là
bé nhất Và RMSE là căn bậc 2 của tiêu chí MSE nên hai tiêu chí về bản chất là một, điều khác biệt là giá trị của tiêu chí RMSE bé hơn.Ở mô hình ARIMA(1,1,1)(2,1,3) chỉ số tiêu chí MSE cũng là bé nhất
Trang 33Kết luận: Mô hình phù hợp nhất là ARIMA(1,1,1)(2,1,3) vì có 3 chỉ tiêu nhỏ nhất trong 3 mô hình.
Bước 10: Dự báo mô hình ARIMA
Chạy mô hình ARIMA với mã chứng khoán SAB
Bước 1: Chuỗi thời gian dự báo phải là một chuỗi dừng (stationarity)
Lý thuyết chuỗi thời gian: Chuỗi các quan sát được thu thập trên cùng một đối tượngtại các mốc thời gian khác nhau được gọi là chuỗi thời gian
Lý thuyết về chuỗi dừng:
Trong phân tích hồi quy, các biến trong chuỗi dữ liệ thời gian phải dừng thì các kiểmđịnh thống kê mới đáng tin cậy Một chuỗi dữ liệu thời gian được coi là dừng (tĩnh)khi chuỗi đó hội tụ các đặc tính sau:
+ Giá trị trung bình không đổi hay bằng một hằng số theo thời gian khi chuỗi dữ
liệu đó tạo ra các đoạn trung bình bằng nhau từ đó hình thành một đường trung bìnhthẳng (chuỗi dữ liệu không bị trend)
E(Yt)=µ=const
+ Phương sai không đổi hay bằng một hằng số theo thời gian khi mức độ biến động
của chuỗi dữ liệu quanh đường trung bình ổn định một trong biên độ nhất định
Var(Yt)=σ2=const
+ Hiệp phương sai chỉ mối tương quan giữa các dữ liệu với nhau không thay đổi khi
cả giá trị trung bình và phương sai đều không đổi Nói cách khác, nếu ta ngắt dữ liệuthành các giai đoạn khác nhau, thì giản đồ tự tương quan của các giai đoạn đó là nhưnhau
Cov(Yt , Yt-k)=γk=E [(Yt - µ) (Yt-k - µ)]
Cách 1: Dựa vào biểu đồ graph
Trang 34Dựa vào biểu đồ graph:
Nhìn vào biểu đồ ta thấy:
+ Ở giai đoạn đầu tiên từ tháng 12/2016 đến tháng 6/2018 giá chứng khoán có xuhướng tăng, đạt đỉnh vào tháng 12/2017 và sau đó có xu hướng giảm, đường trungbình ở khoảng mức 240 Ở giai đoạn thứ hai, bắt đầu từ tháng 7/2018 cho đến khoảngtháng 1/2020 giá chứng khoán có xu hướng tăng Tuy nhiên so với giai đoạn đầu,đường trung bình thấp hơn chỉ ở mức 220 Ở giai đoạn thứ ba, từ tháng 2/2020 trở vềsau, giá chứng khoán trong những quý đầu năm 2020 giảm sâu so với từ trước đếnnay và dao động quanh đường trung bình mức 160 Chuỗi dữ liệu này có các đoạntrung bình không bằng nhau dẫn đến việc hình thành một đường trung bình dốcxuống (Chuỗi bị trend xuống) dẫn đến trung bình thay đổi
Trang 35+ Mức độ biến động của chuỗi dữ liệu quanh đường trung bình là không ổn định Ởđoạn trung bình đầu tiên từ tháng 12/2016 đến tháng 6/2018, chuỗi dữ liệu biến độngvới biên độ dao động từ 180 đến 280 Ở đoạn trung bình thứ hai từ tháng 7/2018 chođến khoảng tháng 1/2020, chuỗi dữ liệu biến động với biên độ dao động từ 200 đến
270 Ở đoạn trung bình thứ ba từ tháng 2/2020 trở về sau, chuỗi dữ liệu với biên độdao động từ 120 đến 200 Cả ba đoạn trung bình này đều có rất nhiều quan sát biếnđộng vượt ra ngoài biên độ (chiếm hơn 5% tổng số lượng quan sát) dẫn đến phươngsai thay đổi
+ Do trung bình thay đổi và phương sai thay đổi dẫn đến hiệp phương sai thay đổi
Kết luận: Chuỗi dữ liệu SAB không dừng.
Cách 2: Dựa trên kiểm định nghiệm đơn vị (unit root test) của Dickey Fuller
Kiểm định nghiệm đơn vị là một kiểm định được sử dụng khá phổ biến để kiểm định một chuỗi thời gian dừng hay không dừng Giả sử ta có phương trình tự hồi quy như sau:
Auto regressive function:
Nếu ρ < 1: chuỗi dừng
Nếu ρ = 1: chuỗi có nghiệm đơn vị (chuỗi không dừng)
Nếu ρ > 1: chuỗi bị bùng nổ (explosive series)