DANH MỤC KÝ HIỆU ACF: Hàm tự tương quan ADF: Thống kê kiểm định Dickey – Fuller AIC: Tiêu chuẩn thông tin Akaike AR: Quá trình tự hồi quy ARMA: Quá trình trung bình trượt tự hồi quy ARIM
Trang 1TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA TOÁN
*************
NGUYỄN PHƯƠNG THẢO
PHÂN TÍCH CHUỖI THỜI GIAN
VÀ DỰ BÁO
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Toán ứng dụng
HÀ NỘI – 2018
Trang 2TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA TOÁN
*************
NGUYỄN PHƯƠNG THẢO
PHÂN TÍCH CHUỖI THỜI GIAN
Trang 3LỜI CẢM ƠN
Trước tiên, em xin bày tỏ lòng biết ơn sâu sắc tới thầy hướng dẫn PGS
TS Trần Trọng Nguyên, người đã luôn quan tâm, động viên và tận tình giúp
đỡ, truyền đạt lại những kiến thức quý báu cho em trong suốt quá trình thực hiện khóa luận tốt nghiệp
Em cũng xin bày tỏ lòng biết ơn chân thành tới toàn thể các thầy cô trong khoa Toán, Trường Đại học Sư phạm Hà Nội 2 đã dạy bảo em tận tình trong suốt quá trình học tập tại khoa
Nhân dịp này em xin được gửi lời cảm ơn chân thành đến những người thân trong gia đình đã động viên, tạo những điều kiện học tập tốt nhất cho em, động viên em hoàn thành khóa luận này
Hà Nội, tháng 5 năm 2018
Sinh viên
Nguyễn Phương Thảo
Trang 4LỜI CAM ĐOAN
Khóa luận tốt nghiệp này được hoàn thành do sự cố gắng, nỗ lực tìm
hiểu, nghiên cứu của bản thân dưới sự hướng dẫn của PGS TS Trần Trọng Nguyên
Trong quá trình nghiên cứu, em có tham khảo một số tài liệu đã ghi trong phần tài liệu tham khảo
Em xin cam đoan khóa luận này không trùng lặp với kết quả của các tác giả khác
Hà Nội, tháng 5 năm 2018
Sinh viên
Nguyễn Phương Thảo
Trang 5DANH MỤC KÝ HIỆU
ACF: Hàm tự tương quan
ADF: Thống kê kiểm định Dickey – Fuller
AIC: Tiêu chuẩn thông tin Akaike
AR: Quá trình tự hồi quy
ARMA: Quá trình trung bình trượt tự hồi quy
ARIMA: Quá trình ARMA tích hợp
BIC: Tiêu chuẩn thông tin Bayes hoặc tiêu chuẩn Schwartz IID: Độc lập cùng phân bố
MA: Quá trình trung bình trượt
MSE: Sai số dự báo bình phương trung bình
MLE: Ước lượng hợp lý cực đại
PACF: Hàm tự tương quan riêng
SACF: Hàm tự tương quan mẫu
SPACF: Hàm tự tương quan riêng mẫu
Trang 6MỤC LỤC
DANH MỤC KÝ HIỆU
MỤC LỤC
LỜI MỞ ĐẦU 1
1 Lý do chọn đề tài 1
2 Mục đích nghiên cứu 1
3 Đối tượng và phạm vi nghiên cứu 2
4 Phương pháp và công cụ nghiên cứu 2
5 Cấu trúc khóa luận 2
CHƯƠNG 1: MỘT SỐ KIẾN THỨC LIÊN QUAN 3
1.1 Biến ngẫu nhiên và quy luật phân phối xác suất 3
1.1.1 Biến ngẫu nhiên một chiều 3
1.1.2 Biến ngẫu nhiên hai chiều 3
1.1.3 Biến ngẫu nhiên nhiều chiều 4
1.2 Các tham số đặc trưng của biến ngẫu nhiên 5
1.2.1 Kỳ vọng 5
1.2.2 Phương sai và độ lệch tiêu chuẩn 6
1.2.3 Hiệp phương sai 7
1.2.4 Hệ số tương quan 7
1.3 Quy luật phân phối chuẩn 7
1.4 Phân tích và dự báo với chuỗi thời gian 8
1.4.1 Khái niệm về chuỗi thời gian 8
1.4.2 Phân tích chuỗi thời gian 8
1.4.3 Dự báo chuỗi thời gian 9
1.4.4 Đo lường độ chính xác của dự báo 10
1.5 Mô hình hồi quy 11
1.5.1 Mô hình hồi quy tuyến tính 11
Trang 71.5.2 Hàm hồi quy tổng thể 11
1.5.3 Hàm hồi quy mẫu 12
1.5.4 Phương pháp ước lượng OLS 13
1.6 Sai phân của chuỗi thời gian 14
1.7 Toán tử dịch chuyển lùi 14
1.8 Quá trình ngẫu nhiên dừng và không dừng 15
1.9 Hàm tự tương quan 16
1.9.1 Tự tương quan 16
1.9.2 Hàm tự tương quan 16
1.9.3 Hàm tương quan riêng 17
1.10 Nhiễu trắng và bước ngẫu nhiên 17
1.10.1 Nhiễu trắng 17
1.10.2 Bước ngẫu nhiên 18
CHƯƠNG 2: MÔ HÌNH ARIMA VÀ DỰ BÁO 19
2.1 Quá trình trung bình trượt (MA) 19
2.1.1 Quá trình trung bình trượt bậc nhất – MA(1) 19
2.1.2 Quá trình trung bình trượt bậc q – MA(q) 20
2.2 Quá trình tự hồi quy (AR) 22
2.2.1 Quá trình AR(1) không có hệ số chặn 22
2.2.2 Quá trình AR(1) có hệ số chặn 24
2.2.3 Quá trình tự hồi quy bậc p – AR(p) 25
2.3 Quá trình trung bình trượt tự hồi quy (ARMA) 27
2.4 Quá trình trung bình trượt tích hợp tự hồi quy (ARIMA) 29
2.5 Kiểm định nghiệm đơn vị 30
2.6 Phương pháp Box – Jenkins 32
2.6.1 Định dạng mô hình – xác định các tham số p, d, q 32
2.6.2 Ước lượng mô hình 38
2.6.3 Kiểm định tính thích hợp của mô hình 40
Trang 82.6.4 Dự báo và sai số dự báo 43
CHƯƠNG 3: ÁP DỤNG MÔ HÌNH ARIMA DỰ BÁO CHỈ SỐ VNINDEX 48
3.1 Xây dựng mô hình ARIMA cho chuỗi VnIndex 48
3.2 Ước lượng các tham số của mô hình 51
3.3 Kiểm tra sự phù hợp của mô hình 53
3.4 Dự báo giá 54
KẾT LUẬN 56
DANH MỤC TÀI LIỆU THAM KHẢO 57
PHỤ LỤC 58
Trang 9để có được những chính sách kinh tế năng động, hợp lý, có hiệu quả, dự báo kinh tế là một trong những công cụ hữu ích làm cơ sở khoa học có căn cứ để đưa ra các quyết định và xây dựng các chính sách phù hợp
Ngày nay, cùng với sự phát triển khoa học công nghệ, có nhiều phương pháp dự báo định lượng, trong đó có phương pháp sử dụng các quá trình ngẫu nhiên đặc biệt là các mô hình chuỗi thời gian Các dữ liệu về chuỗi thời gian
đã và đang được sử dụng một cách thường xuyên, hiệu quả và đáng tin cậy như một công cụ hữu hiệu để phân tích kinh tế, xã hội cũng như trong nghiên cứu khoa học
Vì vậy, với mong muốn tìm hiểu sâu về vấn đề này trong phạm vi của
một khóa luận tốt nghiệp, em đã lựa chọn nghiên cứu đề tài “Phân tích chuỗi thời gian và dự báo”
2 Mục đích nghiên cứu
- Nghiên cứu một số khái niệm và tính chất cơ bản về chuỗi thời gian
- Tìm hiểu mô hình trung bình trượt tích hợp tự hồi quy ARIMA và phương pháp Box – Jenkins để dự báo
- Áp dụng mô hình ARIMA dự báo chỉ số VnIndex với sự hỗ trợ của phần mềm Eviews
Trang 102
3 Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu: chuỗi thời gian, phân tích và dự báo
- Phạm vi nghiên cứu: Mô hình ARIMA, phương pháp Box – Jenkins, ứng dụng Eviews trong dự báo chỉ số VnIndex
4 Phương pháp và công cụ nghiên cứu
- Phương pháp phân tích, tổng hợp kiến thức
- Phương pháp nghiên cứu thực nghiệm với dữ liệu thực tế
- Sử dụng phần mềm Eviews 4.0
5 Cấu trúc khóa luận
Nội dung khóa luận này bao gồm 3 chương:
Chương 1 Một số kiến thức liên quan
Chương này trình bày một số khái niệm và kết quả cơ bản sẽ được sử dụng trong chương sau
Chương 2 Mô hình ARIMA và dự báo
Chương này trình bày các lớp mô hình ARIMA và phương pháp Box – Jenkins
Chương 3 Áp dụng mô hình ARIMA dự báo chỉ số VnIndex
Chương này vận dụng mô hình đã nêu ở trên để giải quyết bài toán dự báo chỉ
số VnIndex với sự hỗ trợ của phần mềm Eviews
Trang 113
CHƯƠNG 1: MỘT SỐ KIẾN THỨC LIÊN QUAN
Trong chương này giới thiệu một số kiến thức về kỳ vọng; phương sai
và hiệp phương sai; các khái niệm về chuỗi thời gian và dự báo; mô hình hồi quy; sai phân của chuỗi thời gian; toán tử dịch chuyển lùi; hàm tự tương quan; nhiễu trắng và bước ngẫu nhiên Đây là kiến thức cơ bản để nghiên cứu chuỗi thời gian
1.1 Biến ngẫu nhiên và quy luật phân phối xác suất
1.1.1 Biến ngẫu nhiên một chiều
1.1.1.1 Định nghĩa biến ngẫu nhiên
Định nghĩa 1.1 Cho ,F P, là một không gian xác suất Nếu X là
một ánh xạ đo được từ vào thì X được gọi là một biến ngẫu nhiên (hoặc
một đại lượng ngẫu nhiên)
Nói cách khác: X là một hàm số thực, hữu hạn, xác định trên Ω sao cho
với mỗi x thì : X x F
1.1.1.2 Hàm phân phối xác suất
Định nghĩa 1.2 Hàm phân phối xác suất của biến ngẫu nhiên X được
Định nghĩa 1.3 Cho không gian xác suất ,F P, và hai biến ngẫu
nhiên X và Y xác định trên nó Khi đó hệ V X Y, được gọi là biến ngẫu
Trang 124
nhiên 2-chiều, tức là V là một ánh xạ từ vào 2 sao cho với mỗi thì
,
1.1.2.2 Hàm phân phối xác suất
Định nghĩa 1.4 (Hàm phân phối đồng thời) Hàm phân phối xác suất
đồng thời của một biến ngẫu nhiên 2-chiều V X Y, đƣợc định nghĩa nhƣ sau:
, , ,
F x y P X x Y y x y
Định nghĩa 1.5 (Các hàm phân phối biên) Nếu F(x,y) là hàm phân
phối xác suất đồng thời của biến ngẫu nhiên 2-chiều V X Y, thì các hàm:
1 2
1.1.2.3 Sự độc lập của hai biến ngẫu nhiên
Định nghĩa 1.6 Hai biến ngẫu nhiên X và Y đƣợc gọi là độc lập với
X1 , X2 , , X n của không gian Ơ-clit n-chiều
Ánh xạ n lập bởi các biến ngẫu nhiên X1, X2,…,Xn đƣợc gọi là một biến ngẫu nhiên n-chiều hoặc một véc tơ ngẫu nhiên n-chiều
Trang 135
1.1.3.2 Hàm phân phối xác suất
Định nghĩa 1.8 (Hàm phân phối xác suất đồng thời) Hàm phân phối
xác suất đồng thời của biến ngẫu nhiên n-chiều đƣợc định nghĩa nhƣ sau:
1, 2, , n 1 1 2 2 n n
với X i i1,n
Định nghĩa 1.9 (Các hàm phân phối biên)
Hàm phân phối biên của một biến
Hàm phân phối xác suất của biến Xi là
Hàm phân phối biên của một số biến
Hàm phân phối biên của các biến Xi và Xj và Xk là
1.1.3.3 Tính độc lập của nhiều biến ngẫu nhiên
Định nghĩa 1.10 Các biến ngẫu nhiên X1, X2,…, Xn đƣợc gọi là độc lập
nếu tại mọi điểm (x1, x2,…, xn) của n ta đều có:
1, 2, , n 1 1 2 2 n n
1.2 Các tham số đặc trƣng của biến ngẫu nhiên
1.2.1 Kỳ vọng
Định nghĩa 1.11 (Kỳ vọng toán của biến ngẫu nhiên một chiều)
Trên không gian xác suất ,F P, cho biến ngẫu nhiên X có hàm phân phối xác suất F(x) Kỳ vọng toán của X là một số ký hiệu là E(X) và đƣợc định
nghĩa nhƣ sau:
Trang 141.2.2 Phương sai và độ lệch tiêu chuẩn
Định nghĩa 1.13 Phương sai của biến ngẫu nhiên X được ký hiệu là V X
(hoặc var X – viết tắt từ tiếng Anh: variance) và được định nghĩa như sau:
2 2
2 2
Do V X có đơn vị đo lường là bình phương của đơn vị đo lường của
biến ngẫu nhiên X nên trong thực tế để biểu thị độ phân tán của các giá trị của
X quanh E(X) một cách dễ hình dung hơn người ta còn dùng căn bậc hai của
phương sai và gọi tham số này là độ lệch tiêu chuẩn của biến ngẫu nhiên X
với ký hiệu và công thức định nghĩa như sau:
X V X
Trang 157
1.2.3 Hiệp phương sai
Định nghĩa 1.14 Hiệp phương sai của hai biến ngẫu nhiên X và Y được
ký hiệu là cov(X,Y) và được định nghĩa như sau:
Định nghĩa 1.15 Hệ số tương quan tuyến tính giữa hai biến ngẫu nhiên
X và Y được ký hiệu và định nghĩa như sau:
1.3 Quy luật phân phối chuẩn
Một biến ngẫu nhiên X được gọi là tuân theo quy luật chuẩn với kỳ
vọng , phương sai 2, ký hiệu là: 2
Quy luật chuẩn hóa N(0,1): Một trường hợp đặc biệt và hữu dụng trong
tính toán của họ các phân phối chuẩn là phân phối chuẩn hóa N(0,1) (là phân phối chuẩn với kỳ vọng bằng 0 và phương sai bằng 1) Biến ngẫu nhiên tuân theo quy luật chuẩn hóa thường được ký hiệu là U, hàm phân phối của quy luật chuẩn hóa thường được ký hiệu bởi x , hàm mật độ bởi x
Trang 168
1.4 Phân tích và dự báo với chuỗi thời gian
1.4.1 Khái niệm về chuỗi thời gian
Chuỗi thời gian là một tập hợp các quan sát của một hay nhiều biến được sắp xếp theo thứ tự thời gian Chuỗi thời gian có thể có các tần suất khác nhau, ví dụ như theo năm, quý, tháng, tuần, ngày, giờ,… Các ví dụ về chuỗi thời gian phổ biến trong kinh tế - tài chính bao gồm: tổng sản phẩm quốc nội (GDP), chỉ số tiêu dùng (CPI), cung tiền (M2), chỉ số chứng khoán (VN-index), doanh số bán lẻ,…
Chuỗi thời gian thường được ký hiệu với chỉ số dưới t Ví dụ, nếu gọi Y
là GDP của Việt Nam trong giai đoạn 2001-2017 thì chuỗi số này được ký hiệu như sau:
Yt với t = 1, 2, …, 17 Trong đó t = 1 với năm 2001, t = 2 với năm 2002, …, t = 17 với năm 2017
Biến trễ s thời kỳ của Yt được ký hiệu là Yt-s hay Y(-s)
1.4.2 Phân tích chuỗi thời gian
Phân tích số liệu chuỗi thời gian thường phức tạp vì các quan sát kinh
tế hoặc tài chính thường phụ thuộc lẫn nhau theo thời gian Tức là, giá trị quan sát được của một biến tại thời điểm bất kỳ nào đó thường phụ thuộc vào giá trị của chính nó trong quá khứ Ngoài ra, do các chuỗi số liệu theo thời gian thường tuân theo những quy luật mùa vụ hoặc thể hiện xu hướng dài hạn nhất định nên việc xử lý số liệu là điều cần thiết trước khi đưa vào các mô hình ước lượng
Mục tiêu của việc phân tích chuỗi thời gian là phải chỉ ra được các đặc tính của chuỗi số liệu, xác định được những xu hướng nhất định theo thời gian
và những thành phần có thể dự báo
Trang 179
1.4.3 Dự báo chuỗi thời gian
Dự báo là nghệ thuật và khoa học tiên đoán các sự kiện xảy ra trong tương lai Dự báo dựa trên cơ sở của các sự kiện trong quá khứ hoặc sử dụng một số mô hình toán học để dự đoán kết quả trong tương lai
Dự báo chuỗi thời gian là ước lượng các giá trị tương lai Yt+h, h ≥ 1 của
một biến ngẫu nhiên dựa trên các quan sát các giá trị quá khứ của nó Y1, Y2,
Y3,…, Yt Dự báo của Yt+h thường được ký hiệu là ˆ
Chất lượng của dự báo phụ thuộc vào nhiều yếu tố Trước hết nó phụ thuộc vào xu hướng phát triển của chuỗi thời gian Nếu chuỗi thời gian là hàm
“đều đặn” theo thời gian thì càng dễ dự báo Ví dụ nếu tiến trình phát triển kinh tế không có những biến động đặc biệt thì dễ dàng dự báo tổng sản phẩm quốc nội (GDP) cho những năm sau Cho đến nay, các phương pháp dự báo chuỗi thời gian chưa cho phép dự báo được các giá trị đột biến
Chất lượng dự báo chuỗi thời gian còn phụ thuộc xa gần của thời gian
Dự báo các giá trị càng gần hiện tại càng chính xác Như vậy, việc ước lượng GDP cho năm sau sẽ chính xác hơn là việc ước lượng GDP cho 5 năm sau
Trang 1810
1.4.4 Đo lường độ chính xác của dự báo
Đo lường độ chính xác của dự báo nhằm xác định sai số dự báo theo
mô hình định lượng Lưu ý rằng tính chính xác của dự báo khác với tính đúng/ tính phù hợp của kết quả dự báo Tính đúng/ tính phù hợp của kết quả
dự báo là tính đúng với tình hình thực tế Tính chính xác là tính đúng với mô hình dự báo
e là sai số dự báo ở thời điểm t
Khi đó sai số dự báo là e t y t yˆt,
Nếu một mô hình được đánh giá là tốt thì sai số dự báo phải tương đối nhỏ
Người ta thường dùng phương pháp thống kê hoặc phương pháp đồ thị
để đánh giá độ chính xác của dự báo Trong đề tài này, để đo lường độ chính
xác của mô hình dự báo dùng phương pháp thống kê sử dụng thước đo sai số
bình phương trung bình (MSE – Mean Square of Errors)
2 1
ˆS
n
t t t
Trang 1911
1.5 Mô hình hồi quy
1.5.1 Mô hình hồi quy tuyến tính
Giả sử Y và X là hai biến số thể hiện một tổng thể nào đó, mô hình hồi
quy tuyến tính hai biến thể hiện mối quan hệ phụ thuộc giữa biến Y và biến X
có dạng như sau:
Mô hình hồi quy tuyến tính hai biến bao gồm các thành phần sau:
Các biến số: mô hình hồi quy gồm hai loại biến số:
- Biến phụ thuộc: là biến số mà ta đang quan tâm đến giá trị của nó, thường ký hiệu là Y và nằm ở vế trái của phương trình Biến phụ thuộc còn được gọi là
biến được giải thích (explained variable) hay biến phản ứng
- Biến độc lập: là biến số được cho là có tác động đến biến phụ thuộc, thường
ký hiệu là X và nằm ở vế phải của phương trình Biến độc lập còn được gọi là
biến giải thích (explanatory variable) hay biến điều khiển (control variable)
Sai số ngẫu nhiên
Sai số ngẫu nhiên, thường được ký hiệu là u, là yếu tố đại diện cho các yếu tố
có tác động đến biến Y, ngoài X Trong mô hình (1.1) chúng ta không có các
quan sát về nó, vì thế đôi khi u còn được gọi là sai số ngẫu nhiên không quan sát được Do đó, để hàm hồi quy có ý nghĩa, cần đưa ra giả thiết cho thành
phần này Giả thiết được đưa ra là: tại mỗi giá trị của X thì kỳ vọng của u
bằng 0: E u x 0
Các hệ số hồi quy, bao gồm 1 và 2, thể hiện mối quan hệ giữa
biến X và Y khi các yếu tố bao hàm trong u là không đổi
1.5.2 Hàm hồi quy tổng thể
Với giả thiết E u x 0, ta có thể biểu diễn lại mô hình hồi quy (1.1) dưới dạng sau:
Trang 2012
trong đó E Y X là kỳ vọng của biến Y khi biết giá trị của biến X, hay còn
gọi là kỳ vọng của Y với điều kiện X
Phương trình (1.2) biểu diễn kỳ vọng của Y với điều kiện X, như một hàm của biến X và do X và Y thể hiện cho tổng thể nên phương trình (1.2) còn
được gọi là hàm hồi quy tổng thể (PRF – population regression function) Khi
đó các hệ số hồi quy 1 và 2 còn được gọi là các tham số của tổng thể, có ý nghĩa như sau:
Các hệ số hồi quy:
- 1 được gọi là hệ số chặn, nó chính bằng giá trị trung bình của biến
phụ thuộc Y khi biến độc lập X nhận giá trị bằng 0
- 2 được gọi là hệ số góc, thể hiện quan hệ giữa biến độc lập và giá trị
trung bình của biến phụ thuộc: khi biến độc lập X tăng (giảm) một đơn vị thì giá trị trung bình của biến phụ thuộc Y tăng (giảm) 2 đơn vị Hệ số 2 có thể nhận giá trị dương, âm hoặc bằng 0
1.5.3 Hàm hồi quy mẫu
Giả sử có mẫu ngẫu nhiên kích thước n bao gồm các quan sát của biến
Y và biến X: Y X i, i, i = 1, 2, …, n Từ mẫu ngẫu nhiên này chúng ta sẽ xây dựng các ước lượng cho các hệ số hồi quy tổng thể 1 và 2, ký hiệu là ˆ1 và
Trang 211.5.4 Phương pháp ước lượng OLS
Phương pháp ước lượng OLS lần đầu tiên được giới thiệu bởi Gauss vào những năm cuối thế kỷ 18 (Haper (1974-1976)) và được sử dụng rộng rãi trong nhiều lĩnh vực Tuy trong phân tích kinh tế lượng nói chung và phân tích hồi quy nói riêng, người ta đã phát triển thêm các phương pháp ước lượng mới, nhưng OLS vẫn là một phương pháp thông dụng do các ưu việt của nó Ngoài ra, ước lượng thu được từ OLS thường được chọn làm cơ sở khi đánh giá chất lượng của ước lượng thu được từ các phương pháp khác
Để tìm hiểu OLS, xét mô hình hồi quy tổng thể:
Trang 22(1) Tổng các phần dƣ
1
n i i
e
Trong phạm vi khóa luận này chúng ta sẽ sử dụng phần mềm Eviews để
hỗ trợ cho việc xác định các ƣớc lƣợng OLS
1.6 Sai phân của chuỗi thời gian
Sai phân bậc nhất của chuỗi Yt trễ 1 thời kỳ, ký hiệu là D(Yt) hay Y t đƣợc tính nhƣ sau: Y t Y t Y t1
Sai phân bậc 2 của chuỗi Yt trễ 1 thời kỳ, ký hiệu là D2(Yt) hoặc 2 Y t
Sai phân bậc 1 của chuỗi Yt trễ k thời kỳ: Y t Y t Y t k
1.7 Toán tử dịch chuyển lùi
Một cách ký hiệu rất hữu ích khi xem xét sự dịch chuyển lùi (trễ) của
chuỗi thời gian là toán tử L tác động lên chuỗi Yt, viết là: LY t Y t1
Trang 2315
Công thức đó được hiểu là toán tử L làm dữ liệu Yt dịch chuyển lùi về
phía quá khứ một thời kỳ Hai lần L sẽ dịch chuyển Yt lùi về quá khứ hai thời
1.8 Quá trình ngẫu nhiên dừng và không dừng
Xét họ các biến ngẫu nhiên Y1, Y2,…trong đó các chỉ số là các thời điểm kế tiếp nhau Nói chung mỗi biến có một quy luật phân bố xác suất
riêng Y1, Y2,…được gọi là quá trình ngẫu nhiên Giả sử rằng đối với mỗi thời điểm, biến số tương ứng nhận một giá trị cụ thể Khi đó ta có một chuỗi thời gian Mặc dù chuỗi thời gian chỉ là một phép thử của một quá trình ngẫu nhiên, nhưng chúng cũng được gọi chuỗi thời gian là quá trình ngẫu nhiên, ký
hiệu là {Yt với t = 1,2,…}
E(Yt), Var(Yt) là kỳ vọng và phương sai của Yt, có thể Cov Y Y i, j0
Nói chung đối với mỗi Yt thì kỳ vọng, phương sai và hiệp phương sai là không giống nhau
Chuỗi Yt được gọi là dừng nếu kỳ vọng, phương sai và hiệp phương sai không đổi theo thời gian (Engle và Granger, 1987), nghĩa là:
Trang 24 t t k k
t
Cov Y Y ACF k
Điều kiện (1.9) trong định nghĩa chuỗi dừng có nghĩa là hiệp phương
sai, do đó hệ số tương quan giữa Yt và Yt+k chỉ phụ thuộc vào độ dài (k) về thời gian giữa t và t+k, không phụ thuộc vào thời điểm t Chẳng hạn
Một trong những cách đơn giản để kiểm định tính dừng là dùng hàm tự
tương quan (ACF) ACF với độ trễ k, ký hiệu bằng k, được xác định như sau:
Trang 25Đối với quá trình dừng thì k k;k k
1.9.3 Hàm tương quan riêng
Hàm tương quan riêng (PACF) là hệ số tương quan không điều kiện
giữa Yt và Yt-k, nó không tính đến ảnh hưởng của các quan hệ trung gian Yt-1,
Quá trình thỏa mãn (1.10), (1.11) và (1.13) được gọi là nhiễu trắng độc lập Nếu các điều kiện (1.10), (1.11) và (1.13) được thỏa mãn và 2
0,
t
quá trình ngẫu nhiên được gọi là nhiễu trắng Gauss
Chú ý rằng từ (1.13) suy ra (1.12), điều ngược lại sẽ không đúng
Nhiễu trắng là một chuỗi dừng
Trang 2618
1.10.2 Bước ngẫu nhiên
Nếu Y t Y t1 u t , trong đó ut – nhiễu trắng, thì Yt được gọi là bước ngẫu nhiên
t t 1 t t 1
Điều này có nghĩa là kỳ vọng của Yt không đổi
Ta hãy xem phương sai của Yt:
Trang 2719
CHƯƠNG 2: MÔ HÌNH ARIMA VÀ DỰ BÁO
Chương này giới thiệu mô hình trung bình trượt tích hợp tự hồi quy (ARIMA) Đây là mô hình dự báo chuỗi thời gian sử dụng phương pháp hồi quy, trong đó giá trị của chuỗi tại mỗi thời điểm được dự báo theo các giá trị của chính chuỗi đó tại các thời điểm trước đó trong quá khứ, mà không xét đến các nhân tố bên ngoài có ảnh hưởng Mô hình này dùng cho dự báo ngắn hạn
2.1 Quá trình trung bình trượt (MA)
Quá trình trung bình trượt là quá trình mà giá trị của nó được xác định dựa trên sự kết hợp tuyến tính giữa nhiễu không quan sát được ở hiện tại và các nhiễu trong quá khứ
2.1.1 Quá trình trung bình trượt bậc nhất – MA(1)
Quá trình trung bình trượt bậc nhất có dạng:
1
Y u u (2.1) Trong đó ut là nhiễu trắng, θ là hằng số
Trang 28t t k k
Nhƣ vậy MA(1) có k 0 với k > 1 hay bằng 0 từ độ trễ 2 trở đi
2.1.2 Quá trình trung bình trượt bậc q – MA(q)
Quá trình trung bình trƣợt bậc q có dạng:
1 1 , 1,2, ,
Y u u u t n (2.2) Trong đó ut là nhiễu trắng, θ là hằng số
+ Kỳ vọng:
Trang 3022
Như vậy nếu Yt là một quá trình MA(q) thì kỳ vọng, phương sai, hiệp phương sai không phụ thuộc vào thời gian Do vậy, với bất kỳ các giá trị của
1, 2, q thì quá trình MA(q) đều là quá trình dừng
2.2 Quá trình tự hồi quy (AR)
Quá trình tự hồi quy là quá trình trong đó dự báo giá trị dựa trên các giá trị trong quá khứ của nó Mô hình bước ngẫu nhiên (là mô hình mà giá trị sinh ra
từ nó được xác định bằng giá trị của quan sát ngay trước nó cộng thêm nhiễu trắng) là một trường hợp đặc biệt của quá trình tự hồi quy
2.2.1 Quá trình AR(1) không có hệ số chặn
Quá trình tự hồi quy AR(1) có dạng:
Trang 31Từ kết quả trên có thể rút ra các kết luận dưới đây:
i) Trong trường hợp 1 1 thì Yt không thỏa mãn điều kiện dừng, do
t
E Y và Var Y t phụ thuộc vào t Tuy nhiên trường hợp này vẫn được gọi là
dừng (Philip Hans Franses-Dick van Dijk, 2000) Khi t đủ lớn thì (2.5), (2.6),
2 2
Khi 1thì quá trình AR(1) là chuỗi dừng
Khi 1thì quá trình AR(1) là chuỗi không dừng
Khi 1thì quá trình AR(1) là bước ngẫu nhiên
Trang 3325
TH2: Khi 1thì
1 0
t i i
không hội tụ
Khi 1 thì Yt là bước ngẫu nhiên, E Y t Y0 t
Bây giờ ta xét k Cov Y Y t, t k
2.2.3 Quá trình tự hồi quy bậc p – AR(p)
Quá trình tự hồi quy bậc p có dạng:
Trang 3426
Ta có: L Y t 0 u t
Điều kiện để quá trình AR(p) hội tụ là 1 i 1,i1,2, ,p
Phương trình đặc trưng đối với AR(p): 1 1z p z p 0
Có thể viết lại: 11z12z 1 p z0
Với phương trình trên điều kiện dừng tương đương với điều kiện: tất cả các
αi, i = 1,2,…,p đều nằm trong đường tròn đơn vị