Trong những năm trước, công cụ để phân tích chuỗi thời gian là sử dụng các công cụ thống kê như hồi quy, phân tích Furie và một vài công cụ khác.Nhưng hiệu quả nhất là mô hình ARIMA của
Trang 1TRƯỜNG ĐẠI HỌC s ư PHẠM HÀ NỘI 2
Trang 2TRƯỜNG ĐẠI HỌC su ' PHẠM HÀ NỘI 2
Trang 3LỜI CẢM ƠN Trong quá trình nghiên cứu khóa luận "Mô hình ARIMA và ứng dụng" với sự cố gắng của bản thân và sự giúp đỡ nhiệt tình của các thầy cô
trong tổ Toán ứng dụng, các bạn sinh viên khoa Toán em đã hoàn thành khóa luận này
Em xin chân thành cảm ơn sự giúp đỡ quý báu của các thầy cô trong
tổ Toán ứng dụng, trường đại học sư phạm Hà Nội 2 và các bạn sinh viên
đã tạo điều kiện cho em trong suốt thời gian làm khóa luận
Đặc biệt, em xin bày tỏ lòng biết ơn sâu sắc tới thầy hướng dẫn, Tiến
sĩ Trần Trọng Nguyên, người đã hướng dẫn em tận tình và đóng góp ý
kiến quý báu cho em trong quá trình thực hiện và hoàn thành khóa luận này
Hà Nội, ngày 2 tháng 5 năm 2015
Sinh viên
Lương Thị Thoa
Trang 4LỜI CAM ĐOAN
Khóa luận này là kết quả của bản thân em trong quá trình học tập và nghiên cứu Bên cạnh đó em được sự quan tâm của các thầy cô trong khoa
Toán Đặc biệt là sự hướng dẫn của thầy: Trần Trọng Nguyên.
Trong khi nghiên cứu hoàn thành khóa luận này em có tham khảo một
số tài liệu đã ghi trong phần tài liệu tham khảo
Em xin cam đoan kết quả của khóa luận này không có sự trùng lặp với kết quả của tác giả khác
Hà Nội, ngày 2 tháng 5 năm 2015
Sinh viên
Lương Thị Thoa
Trang 5MỤC LỤC
LỜI MỞ Đ Ầ U 1
1 Lí do chọn đề tà i 1
2 Mục đích nghiên cứ u 1
3 Đối tượng và phạm vi nghiên c ú n 2
4 Phương pháp và công cụ nghiên cứu 2
5 Khái quát về nội dung và phạm vi nghiên cứu 2
CHƯƠNG 1 KIẾN THỨC CHUẨN B Ị 3
1.1 Biến ngẫu nhiên và quy luật phân phối xác suất 3
1.1.1 Biến ngẫu nhiên một chiều 3
1.1.1.1 Định nghĩa biến ngẫu nhiên 3
1.1.1.2 Hàm phân phối xác su ất 3
1.1.2 Biến ngẫu nhiên hai chiều 3
1.1.2.1 Định nghĩa 3
1.1.2.2 Hàm phân phối xác su ất 3
1.1.2.3 Sự độc lập của hai biến ngẫu nhiên 4
1.1.3 Biến ngẫu nhiên nhiều chiều 4
1.1.3.1 Định nghĩa 4
1.1.3.2 Hàm phân phối xác su ất 4
1.1.3.3 Tính độc lập của nhiều biến ngẫu nhiên 5
1.1.4 Một số đặc trưng của biến ngẫu nhiên 5
1.1.4.1 Kỳ vọng 5
1.1.4.2 Phương sai 6
1.1.4.3 Hiệp phương s a i 6
1.1.4.4 Hệ số tương q u an 6
1.1.5 Một số quy luật phân phối 7
1.1.5.1 Quy luật phân phối chuẩn 7
Trang 61.1.5.2 Quy luật Khi bình phương 7
1.2 Phân tích hồi qu y 8
1.2.1 Mô hình hồi quy tuyến tính hai b iế n 8
1.2.2 Hàm hồi quy tổng th ể 9
1.2.3 Hàm hồi quy m ẫu 9
1.2.4 Phương pháp ước lượng OLS 10
1.3 Giới thiệu về chuỗi thời gian và toán tử trễ 11
1.3.1 Chuỗi thời gian 11
1.3.2 Toán tử tr ễ 12
1.4 Quá trình ngẫu nhiên dừng và không dừng 12
1.5 Hàm tự tương quan và hàm tự tương quan riêng 14
1.5.1 Hàm tự tương quan 14
1.5.2 Hàm tự tương quan riêng 14
1.6 Nhiễu trắng và bước ngẫu nhiên 15
1.6.1 Nhiễu trắng 15
1.6.2 Bước ngẫu nhiên 15
CHƯƠNG 2 MÔ HÌNH ARIMA VÀ ỨNG DỤNG 17
2.1 Mô hình ARIM A 17
2.1.1 Quá trình trung bình trượt (M A ) 17
2.1.2 Quá trình tự hồi quy (AR - Autoregressive Process) 17
2.1.3 Quá trình trung bình trượt tự hồi quy ARM A 18
2.1.4 Ọuá trình trung bình trượt, tích hợp tự hồi quy ARIMA 19
2.1.5 Dự b á o 19
2.1.5.1 Dự báo quá trình A R (p ) 19
2.1.5.2 Dự báo quá trình MA (q) 20
2.1.5.3 Dự báo quá trình ARMA(p,q) 21
2.1.5.4 Dự báo quá trình ARIMA(p,d,q) 21
Trang 72.1.6 Kiểm định nghiệm đơn v ị 22
2.1.7 Phương pháp Box - Jenkins 24
2.1.7.1 Định dạng mô hình - xác định tham số p, d, q 24
2.1.7.2 Ước lượng mô h ìn h 30
2.1.7.3 Kiểm định tính thích hợp của mô hình 32
2.1.7.4 Dự báo và sai số dự b á o 35
2.2 ứ n g dụng mô hình ARIMA dự báo chỉ số VNINDEX 39
2.2.1 Xây dựng mô hình ARIMA cho chuỗi VNINDEX 39
2.2.2 Ước lượng các tham số của mô hìn h 42
2.2.3 Kiểm tra sự phù họp của mô h ìn h 43
2.2.4 Dự báo g iá 44
KẾT LU Ậ N 47
DANH MỤC TÀI LIỆU THAM K H Ả O 48
Trang 8LỜI MỞ ĐẦU
1 Lí do chọn đề tài
Chuỗi thời gian đang được sử dụng như một công cụ hữu hiệu để phân tích và dự báo trong kinh tế xã hội cũng như trong nghiên cứu khoa học Chính do tầm quan trọng của phân tích chuỗi thời gian, rất nhiều nghiên cún đã đề xuất các công cụ để phân tích và dự báo chuỗi thời gian Trong những năm trước, công cụ để phân tích chuỗi thời gian là sử dụng các công
cụ thống kê như hồi quy, phân tích Furie và một vài công cụ khác.Nhưng hiệu quả nhất là mô hình ARIMA của Box-Jenkins Từ các công trình ban đầu về chuỗi thời gian, hiện nay mô hình này đang được dùng rất nhiều để phân tích và dự báo trong các lĩnh vực: kinh tế,tài chính, chứng khoán, giáo dục, thời tiết, dân số,
Nghiên cứu phân tích và dự báo chuỗi thời gian luôn là một bài toán gây được sự chú ý của các nhà toán học, kinh tế, xã hội học, Các quan sát trong thực tế thường được thu thập dưới dạng chuỗi số liệu Từ những
số liệu này, người ta có thế rút ra được những quy luật của một quá trình được mô tả thông qua chuỗi số liệu
Xuất phát từ thực tế ứng dụng lớn của mô hình ARIMA, em chọn đề tài nghiên cứu về: “MÔ HÌNH ARIMA VÀ ỨNG DỤNG” làm đề tài khóa luận của mình
2 Mục đích nghiên cứu
- Nghiên cún một số khái niệm và tính chất cơ bản về chuỗi thời gian; các quá trình trung bình trượt (MA),quá trình tự hồi quy (AR), quá trình trung bình trượt tự’ hồi quy (ARMA)và quá trình trung bình trượt, tích hợp
tự hồi quy (ARIMA)
-ứng dụng mô hình ARIMA dự báo chuỗi chỉ số VNINDEX với sự
hỗ trợ của phần mềm Eviews
Trang 93 Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu: Mô hình ARIMA
- Phạm vi nghiên cứu: Mô hình ARIMA, phương pháp Box - Jenkins, ứng dụng trong dự báo chỉ số VNINDEX
4.Phương pháp và công cụ nghiên cứu
- Phương pháp so sánh, phân tích, tổng hợp kiến thức
- Phương pháp phân tích thực nghiệm với dữ liệu thực tế
- Sử dụng phần mềm Excel, Eviews
5.Khái quát về nội dung và phạm vi nghiên cứu
Nội dung của khóa luận này bao gồm 2 chương:
- Chương 1 Kiến thức chuẩn bị: Chương này trình bày một số khái niệm và kiến thức cơ bản sẽ được sử dụng trong chương sau
- Chương 2.Mô hình ARIMA và ứng dụng: Chương này trình bày các lớp mô hình ARIMA và thử nghiệm ứng dụng các mô hình này để dự báo chỉ số VNINDEX
Trang 10CHƯƠNG 1 KIẾN THỨC CHUẨN BỊ
1.1 Biến ngẫu nhiên và quỵ luật phân phối xác suất
1.1.1 Biến ngẫu nhiên một chiều
1.1.1.1 Định nghĩa biến ngẫu nhiên
Định nghĩa 1.1: Cho (Q, F, P) là một không gian xác suất Neu X là
một ánh xạ đo được từ Q vào K thì X được gọi là một biến ngẫu nhiên
(hoặc một đại lượng ngẫu nhiên)
Nói cách khác: X là một hàm số thực, hữu hạn, xác định trên Q sao
cho với mỗi i g ! thì ịcoe Q : X (&>)< Jt| e F.
1.1.1.2 Hàm phân phoi xác suất
Định nghĩa 1.2 Hàm phân phối xác suất của biến ngẫu nhiên X được
ký hiệu và xác định như sau: Fx (x) = P j í y : I ( í y ) < i Ị , J í6 M
Như vậy hàm phân bố xác suất là sự thu hẹp của độ đo xác suất p lên lóp các khoảng ( -00,*) của đường thẳng thực M Đẻ cho gọn ta sẽ ký hiệu F(x) = P (X < x ),x e IR
1.1.2 Biến ngẫu nhỉên hai chiều
ỉ 1.2.1 Định nghĩa
Định nghĩa 1.3 Cho không gian xác suất (Q, F, P) và hai biến ngẫu
nhiên X và Y xác định trên nó Khi đó hệ V = (X, Y) được gọi là một biến ngẫu nhiên 2-chiều, tức là V là một ánh xạ từ Q vào IR2 sao cho với mỗi
Ú)GÍÌ thì V(cò) = (X{ũ)\Y{co)).
1.1.2.2 Hàm phân phổi xác suất
Định nghĩa 1.4 (Hàm phân phối đồng thời) Hàm phân phối xác suất đồng thời của một biến ngẫu nhiên 2-chiều V = ( X , Y ) được định nghĩa
như sau:
Trang 11là các hàm phân phối của các biến ngẫu nhiên thành phần tương ứng X và
Y Các hàm này gọi là các hàm phân phối biên của V
ỉ ỉ 2.3 Sự độc lập của hai biến ngẫu nhiên
Định nghĩa 1.6 Hai biến ngẫu nhiên X và Y được gọi là độc lập với nhau nếu:
F (x ,y) = Fỵ(x)F2( y ) ( -00< X, J < +oo)
1.1.3 Biến ngẫu nhiên nhiều chiều
1.13.1 Định nghĩa
Định nghĩa 1.7 Cho X ], X 2, ,Xn là các biến ngẫu nhiên 1-chiều
được xác định trên không gian xác suất (Q, F, P) Nhờ các biến ngẫu nhiên
này, với mỗi ứ ) e Q , ta có thể làm phép tương ứng với một điểm
Ánh xạ Q — lập bởi các biến ngẫu nhiên X ]9X 2, 9X n được gọi là
một biến ngẫu nhiên rc-chiều hoặc một véc-tơ ngẫu nhiên rc-chiều
1.1.3.2 Hàm phân phối xác suất
Định nghĩa 1.8 {Hàm phân phối xác suất đồng thời) Hàm phân phối
xác suất đồng thời của biến ngẫu nhiên rc-chiều được định nghĩa như sau:
F (x ,,x2, ,x J = p [ ( X1 < * ,) ( x2 < *2) (x ;l < * „)] với ( -00< X, < +00),
ỉ = (1,72)
Trang 12Định nghĩa 1.9 (Các hàm phân phối biên)
• Hàm phân phối biên của một biến
Hàm phân phối xác suất của biến Xị là
/• (X,) = p [ ( x , < + x ) ( X 2 < +oo) (Xi < +oo) {x„ < -H»)]
= lim F(x],x2, ,xn) với ( i * j )
• Hàm phân phối biên của một số biến
Hàm phân phối biên của các biến Xị và XJ và X k
Fi.k(xi,xj ,xk)= lim F (x },x2, ,xn)
r * i , j , k
ỉ 1.3.3 Tính độc lập của nhiều biến ngẫu nhiên
Định nghĩa 1.10 Các biến ngẫu nhiên X ị,X2, ,X #ỉ được gọi là độclập nếu tại mọi điểm (x1,x2, ,x/ỉ) của R" ta đều có:
F( x],x2, ,xn) = F](xị)F2(x2) Fn(xn).
1.1.4.Một số đặc trưng ciía biến ngẫu nhiên.
1.1.4.1 Kỳ vọng
Định nghĩa 1.11 (Kỳ vọng toán của biến ngâu nhiên một chiều) Trên
không gian xác suất (Q, F, P) cho biến ngẫu nhiên X có hàm phân phối xác suất F(x) Kỳ vọng toán của X là một số ký hiệu là E(X) và được định nghĩa như sau:
E ( X ) = |x d F (x ) với giả thiết làj*|x|dF(X) tồn tại.
Định nghĩa 1.12 (Kỳ vọng toán của hàm hai biến ngâu nhiên) Neu
R = ọ ( X , Y) trong đó X và Y là hai biến ngẫu nhiên thì:
E(R) = E [ ẹ { X , Y ) \ = x z < / - ( v,.y,
' j
khi X và Y là hai biến ngẫu nhiên rời rạc và
Trang 13E(R) = E\_ọ(X,Y)~\ = J ịọ ( x , y ) f (x,y)clxdy
— 0 0 — 00
khi X và Y là hai biến ngẫu nhiên liên tục với hàm mật độ xác suất đồng
thời là f ( x , y )
ỉ 1.4.2 Phương sai
Định nghĩa 1.13 Phương sai của biến ngẫu nhiên X được ký hiệu là
V(X) (hoặc var(X)- viết tắt từ tiếng Anh: variance) và được định nghĩa nhưsau:
ỉ 1.4.3.Hiệp phương sai
Định nghĩa 1.14 Hiệp phương sai của hai biến ngẫu nhiên X và Y
được ký hiệu là cov(X,Y) và được định nghĩa như sau:
Trang 141.1.5 Một số quy luật phân phối
ỉ 1.5.1 Quy luật phân phối chuấn
Một biến ngẫu nhiên X được gọi là tuân theo quy luật chuẩn với kỳ
vọng //,phương sai ơ 1, ký hiệu là: X ~ N(jU,ơ2) nếu nó là biến ngẫu
nhiên liên tục với hàm mật độ sau đây:
= /7T-CXP( o s ) với
x-ơ v 2 7t 2-(5
Quy luật chuẩn hóa N(0,1): Một trường hợp đặc biệt và hữu dụng
trong tính toán của họ các phân phối chuẩn là phân phối chuẩn hóa
N (0,l)(là phân phối chuẩn với kì vọng bằng 0 và phương sai bằng 1) Biến ngẫu nhiên tuân theo quy luật chuẩn hóa thường được kí hiệu là u , hàm phân phối của quy luật chuẩn hóa thường được kí hiệu bởi O (x ), hàm mật
độ bởi ọ{x)
ỉ 1.5.2 Quy luật Khỉ bình phưong
Quy luật Khi bình phương (với k bậc tự do) ký hiệu là x l có quan hệ
trực tiếp với quy luật chuẩn và được xác định như sau:
X =ƯỈ + U Ỉ + + U I
trong đó Ưi,U2v ,Ưk là các biến ngẫu nhiên độc lập với nhau và cùng tuân theo quy luật chuẩn hóa, khi đó X tuân theo quy luật Khi bình phương với
k bậc tự do
Nếu X ~ x l thì E(X) =k, var(X) = 2k.
Có thể thấy rằng biến ngẫu nhiên tuân theo quy luật Khi bình phương chỉ nhận giá trị không âm và hàm mật độ của nó là không đối xứng
Trang 151.2 Phân tích hồi quy
1.2.1 Mô hình hồi quy tuyến tính hai biến
Giả sử X và Y là hai biến của một tổng thể nào đó, mô hình hồi quy tuyến tính hai biến thể hiện mối quan hệ phụ thuộc giữa biến Y và biến X
có dạng như sau:
Như vậy, mô hình hồi quy tuyến tính hai biến bao gồm các thành phầnsau:
• Các biến so: mô hình hồi quy gồm hai loại biến số:
- Biến phụ thuộc: là biến số mà ta đang quan tâm đến giá trị của nó,
thường được kí hiệu là Y và nằm ở vế trái của phương trình Biến phụ
thuộc còn được gọi là biến được giải thích (explained variable) hay biến
phản ímg.
- Biến độc lập: là biến số được cho là có tác động đến biến phụ thuộc,
thường được kí hiệu là X và nằm ở vế bên phải của phương trình Biến độc
lập còn được gọi là biến giải thích (explanatory variable) hay biến điều
khiển (control variable).
• Sai so ngâu nhiên:
Sai số ngẫu nhiên,thường được ký hiệu là u, là yếu tố đại diện cho các yếu tố có tác động đến biến Y, ngoài X Trong mô hình (1.1) chúng ta không có quan sát về nó, vì thế đôi khi u còn được gọi là sai số ngẫu nhiên không quan sát được Do đó, để hàm hồi quy có ý nghĩa cần đưa ra giả thiết cho thành phần này Giả thiết được đưa ra là: tại mỗi giá trị của X thì kỳ
vọng của u bằng 0: E ( u |jc) = 0.
• Các hệ số hồi quy, bao gồm /?, và /?2, thể hiện mối quan hệ giữa X
và Y khi các yếu tố bao trùm trong u là không đổi
Trang 161.2.2 Hàm hồi quy tổng thể
Với giả thiết £(w |x) = 0,ta có thể biểu diễn lại mô hình hồi quy (1.1) dưới dạng sau:
trong đó E(Y/ X ) là kỳ vọng của bien Y khi biết giá trị của bien X, hay còn
gọi là kỳ vọng của Y với điều kiện X
Phương trình (1.2) biếu diễn kỳ vọng của Y với điều kiện X như một hàm của bien X và do X và Y thể hiện cho tổng thể nên phương trình (1.2) còn được gọi là hàm hồi quy tổng the (PRF - population regression function) Khi đó các hệ số hồi quy /?! và /?2còn được gọi là các tham số của tổng thể, có ý nghĩa như sau:
Các hệ so hồi quy:
- /?, được gọi là hệ số chặn, nó chính bằng giá trị trung bình của biến
phụ thuộc Y khi biến độc lập X nhận giá trị bằng 0
- /?2được gọi là hệ số góc, thế hiện quan hệ giữa biến độc lập và giá trị trung bình của biến phụ thuộc: khi biến độc lập X tăng (giảm) một đơn vị thì giá trị trung bình của biến phụ thuộc Y tăng (giảm) /?2đơn vị Hệ số có thể nhận giá trịdương, âm hoặc bằng 0
1.2.3 Hàm hồi quy mẫu
Giả sử có mẫu ngẫu nhiên kích thước n bao gồm các quan sát của biến
X và biến Y: (Yj, Xi), i=l,2, ,n Từ mẫu ngẫu nhiên này chúng ta xây dựng
các ước lượng cho các hệ số hồi quy tổng thể Д và ß 2, ký hiệu là
ß ] và ß 2 tương ứng Khi đó biếu diễn dưới đây gọi là hàm hồi quy mẫu
cho hàm hồi quy tổng thể (1.1):
Trang 17Ký hiệu mũ trên đầu ngụ ý rằng đây là giá trị ước lượng từ mẫu chứ không phải giá trị của tổng thể Cụ thể hơn:
-yỗp /^ctirợc gọi là hệ số hồi quy mẫu hay hệ số ước lượng, là ước
lượng của các hệ số tổng thể Px, /?2 tương ứng
- Yi được tính như trong (1.3)’ là giá trị ước lượng cho giá trị Y khi
X=Xj
1.2.4.Phương pháp ưóc lượng OLS
Phương pháp ước lượng OLS lần đầu tiên được giới thiệu bởi Gauss vào những năm cuối thế kỷ 18 (Haper (1974-1976)) và được sử dụng rộng rãi trong nhiều lĩnh vực Tuy trong phân tích kinh tế lượng nói chung và phân tích hồi quy nói riêng, người ta đã phát triển thêm các phương pháp ước lượng mới, nhưng OLS vẫn là một phương pháp thông dụng do các iru việt của nó Ngoài ra, ước lượng thu được tù’ OLS thường được chon làm
cơ sở khi đánh giá chất lượng của ước lượng thu được từ các phương pháp khác
Đe tìm hiểu phương pháp OLS, ta xét mô hình hồi quy tổng thể:
Giả sử có mẫu ngẫu nhiên có kích thước n {(Yj, X i) , i=l,2, ,n} thu được từ tổng thể, khi đó tại mỗi quan sát ta có:
Ký hiệu /?,, P 2 là các ước lượng cân tìm của /?ị, P2 với thông tin từ
mẫu trên, khi đó ta có thể viết thành hàm hồi quy mẫu như sau:
(1.4)
Trang 18Gọi sai lệch giữa các giá trị thực tế Yj và giá trị ước lượng tương ứng
từ hàm hồi quy mẫu Ỷi là phần dư (residuals), ký hiệu bởi eji
Chúng ta muốn xác định các giá trị /?,, P 2 sao cho sai lệch tổng họp
giữa các giá trị thực tế Yj và các giá trị ước lượng tương ứng từ hàm hồi quy mẫu (1.4) là nhỏ nhất có thể được Sai lệch này có thể được định nghĩa bởi:
i=1
Trong phạm vi khóa luận này chúng ta sẽ sử dụng phần mem Eviews
để hỗ trợ cho việc xác định các ước lượng OLS
1.3.GỈỚÌ thiệu về chuỗi thòi gian và toán tử trễ
1.3.1 Chuỗi thời gian
Chuỗi thời gian là dãy các quan sát về một biến số nào đó theo thời gian Thường việc thu thập số liệu bắt đầu ở một thời điểm nhất định,
chẳng hạn t=l và kết thúc ở một thời điểm khác t=n:(Y\,Y2, ,Yn)
Có thể tìm được các quan sát ( Y_ 2 ,Y_],Y0) hoặc các quan sát sau thứ
Trang 19Yt = pt là giá một loại /cổ phiếu ở thời điểm t;
Giả sử có chuỗi {X,}!^ bây giờ ta tạo ra chuỗi mới {Yt }* , Yt = X t_x
Ký hiệu Yt = L X t = X t_ị L được gọi là toán tử trễ.
Một biểu diễn khác (aL+bL2) được xem như là đa thức đối với toán từ
L v ề mặt đại số, nó tương tự như đa thức (az+bz2), z là một vô hướng.Nếu như: {X,}!^ ={с}!^ thì:
LXt = X t_x =c; (a + ß L + e ũ ) c = {a + ß + 6)c.
1.4.Quá trình ngẫu nhỉên dừng và không dừng
Xét họ các biến ngẫu nhiên Yi, Y2, trong đó các chỉ số là các thờiđiểm kế tiếp nhau Nói chung mỗi biến có một quy luật phân bố xác suấtriêng Họ Y1 được gọi là quá trình ngẫu nhiên Giả sử rằng đối với
Trang 20mỗi thời điểm, biến số tương ứng nhận một giá trị cụ thể Khi đó ta có một chuỗi thời gian Mặc dù chuỗi thời gian chỉ là một phép thử của một quá trình ngẫu nhiên, nhưng chúng ta cũng gọi chuỗi thời gian là một quá trình ngẫu nhiên, ký hiệu là {Yt với t = 1,2, }
E(Yt), Var(Yt) là kỳ vọng và phương sai của Yt, có thể Cov(Yi, Yj) ^
0 Nói chung đối với mỗi Yt thì kỳ vọng, phương sai và hiệp phương sai là không giống nhau
Chuỗi Yt được gọi là dừng nếu kì vọng, phương sai, hiệp phương sai không đổi theo thời gian (Engle và Granger, 1987), nghĩa là:
Các p k là một hàm phụ thuộc vào độ dài của trễ, hàm này được gọi là
hàm tự tương quan AFC,
AcF(k)=pt =cz (Y::Y'-t)
k Var(Fr)Điều kiện thứ ba trong định nghĩa chuỗi dừng có nghĩa là hiệp phương sai, do đó hệ số tương quan giữa Yt và Yt+k chỉ phụ thuộc vào độ dài (k) vềthời gian giữa t và t+k, không phụ thuộc vào thời điểm t Chẳng hạn:Cov(Yt, Yt+5) không đổi thìCov(Y7, Y12) = Cov(Y15, Y20) = Cov(Y30, Y35)
= = Cov(Y,, Yí+6)không đổi NhungCov(Yt, Yt+5) có thể khác với Cov(Y„ Y,+6)
Trang 211.5 Hàm tự tương quan và hàm tự tương quan riêng
Trong mô hình hồi quy tuyến tính cố điên, ta giả định rằng không có
tương quan giữa các sai số ngẫu nhiên Ujĩighĩa là:
khi đó xảy ra hiện tượng tự tương quan
Hàm tụ’ tương quan (ACF) với độ trễ k, kí hiệu bằng pk, được xác
định như sau:
A C F {k )= P t= £ 2 ^ 1
1.5.2 Hàm tự tương quan riêng
Hàm tự tương quan riêng (PACF) ký hiệu là pkk Trong khi ACF pk,
k = 1,2, , là hệ số tương quan không điều kiện giữa Yt và Y t-k, nó không tính đến ảnh hưởng của các quan hệ trung gian Yt.ị, Yt_2, thì pkk là
hệ số tương quan có điều kiện
p ti =Coư(Y„Y,_k 1 ^ , , ^ , , ^ , ) , k = l,2 ,
Trang 22l.ó.Nhiễu trắng và bước ngẫu nhiên
1.6.1 Nhiễu trắng
Quá trình [ut }T=-oo được gọi là nhiễu trắng nếu thành phần của chuỗi
có kì vọng bằng 0, phương sai không đổi và không tự tương quan, tức là:
Đôi khi điều kiện (1.12) được thay thế bằng điều kiện mạnh hơn:
Quá trình thỏa mãn (1.10), (1.11) và (1.13) được gọi là nhiễu trắng độc lập Neu các điều kiện (1.10), (1.11) và (1.13) được thỏa mãn và
ut ~ N(0, ơ2) thì quá trình ngẫu nhiên được gọi là nhiễu trắng Gauss
Chú ý rằng từ (1.13) suy ra (1.12), điều ngược lại sẽ không đúng Nhiễu trắng là một chuỗi dừng
1.6.2.Bước ngẫu nhiên
Neu Yt = yj_1 + ut , trong đó ut là nhiễu trắng, thì Yt được gọi là bước
ngẫu nhiên
Điều này có nghĩa là kỳ vọng của Yt không đổi
Ta hãy xem phương sai của Yt:
Yx =Y0 + Uị
Yt — Yq + M ị + u2 • ut
Trang 23Do Y0 là hằng số, các ut không tương quan với nhau, có phương sai
không đổi ơ 2, nên:
Sai phân bậc nhất của Yt: AYt =Yt - Y t_ị = ut Trong trường hợp này AYt là chuỗi dừng Dùng toán tử trễ L, ta có AYt = (1 - L)Yt
Neu đưa thêm vào mô hình bước ngẫu nhiên một hằng số, thì Ytđược gọi là bước ngẫu nhiên có bụi (random walk with drift)
Trang 24CHƯƠNG 2 MÔ HÌNH ARIMAVÀ ÚNG DỤNG
2.1 Mô hình ARIMA
2.1.1 Quá trình trung bình trượt (MA)
Yt là quá trình trung bình trượt bậc q, nếu Yt có dạng:
trong đó: utlà nhiễu trắng
Hay (Yt - ị u ) = { \ + 6 xL + + 6qLq)ut
Quá trình MA(q) là khả nghịch khi -1 < 0 < 1, hay tất cả các nghiệm
của phương trình đặc trung:
1 + ỡịZ + 02z} + + 0qz q = 0
đều nằm trong vòng tròn đơn vị Khi đó tồn tại toán tử:
y/(L) = (1 + Ớ,L + + 0qư y l để U' = iỵ(L)(Yt - /LÌ).
2.1.2 Qiiá trình tự hồi quy (AR - Autoregressive Process)
Quá trình tự hồi quy bậc p có dạng:
Trang 25X - <k) + Ộ Ỵ t-1 + ệ ỉ ^ t -2 + • • • + ộ p Y t- p +
Ký hiệu: ^(L) = 1 - ựỉịL - ợJ2L2 - - ệpư
(2.3)
Điều kiện để quá trình AR(p) hội tụ là -1 < ậ < 1, i = 1,2, .p
Phương trình đặc trưng đối với AR(p): 1 - ộxz - Ộ2Z2 - - ộpzp = 0,
có thể viết lại: (1 - a }z)(1 - OínZ) .(1 - ccpz) = 0
Với phương trình trên điều kiện dừng tương đương với điều kiện tất cả các nghiệm«;, i — 1,2, .,p đều nằm trong vòng tròn đơn vị
E(Y,) = M = ^ l ( \ - ệ l - ệ 2 - - ệ p)
AFC(k) = ỵk = E((Y, - ju)(Y,_t - /u))
Y, - ụ = ệị(y,_| - ị ỳ + ệsy,-! - ụ ) + + ệp{Y,_p - ụ ) + u,
Nhân hai vế (Yj - n) với (Y,.k - n), sau đó lấy kì vọng ta được phương trình Yule-Walker:
[ ệ ì ĩ,-1 + ệ i Y , - 2 + • • • + ệ p ĩ , - p + ơ , k=0
2.1.3 Quá trình trung bình trượt tự hồi quy ARMA
Cơ chế sản sinh ra Y không chỉ là AR hoặc MA mà có thể kết họp cả hai yếu tố này Khi kết hợp cả hai yếu tố, mô hình được gọi là mô hình trung bình trượt tích họp tự hồi quy ARMA Yt là quá trình ARMA(1,1) nếu Y có thể biểu diễn dưới dạng:
Trang 262.1.4.Quá trình trung bình trượt, tích họp tự hồi quy ARIMA
Một chuỗi thời gian có thể dừng hoặc không dừng Chuỗi không dừng được gọi là tích hợp bậc 1, được kí hiệu là 1(1), nếu sai phân bậc nhất là chuỗi dừng Chuỗi được gọi là tích họp bậc d, nếu sai phân bậc d là chuỗi dừng, ký hiệu là I(d) Neu d = 0 thì chuỗi xuất phát là chuỗi dừng
Neu chuỗi Yt tích hợp bậc d, áp dụng mô hình ARMA(p,q) cho chuỗi sai phân bậc d thì có quá trình ARIMA(p,d,q) Trong ARIMA(p,d,q), d là
số lần lấy sai phân chuỗi Yt để được một chuỗi dừng, p là bậc tự hồi quy, q
là bậc trung bình trượt, p và q là bậc tương ứng của chuỗi dừng
AR(p) là trường họp đặc biệt của ARIMA(p,d,q) với d = 0, q = 0 MA(q)
là trường hợp đặc biệt của ARIMA(p,d,q) với d = 0 và p =0
ARIMA(2,1,2) - nghĩa là chuỗi Yt có sai phân bậc 1 là chuỗi dừng, chuỗi sai phân dừng này có thể biễu diễn dưới dạng ARMA(2,2):
AYt = 6 + ộịAYt_ị + ^A y,_2 + 0{)ut + ỡ\Ut_ị + 6 2 u t _ 2
trong đó ut là nhiễu trắng
Như vậy nếu biết các tham số p, q, d khi đó ta có thể mô hình hóa
được chuỗi Vấn đề đặt ra là xác định p, q, d và các tham số 8 , ộ
2.1.5 Dự báo
2.1.5.1 Dự báo quá trình AR(p)
Yt là quá trình tự hồi quy bậc p, Yt có dạng:
Trang 27Кн, = f i + f r ’fli-, - и ) + f,(f - и ) + - + - и ) + и„,
là phần tử (i,k) của Fj,
y/j được cho bởi phần tử ( 1,1 ) của FJ: у/j = fị ,0 ).
Khi dự báo, các s ố hạng chứa u t+j được bỏ qua