Bài giảng Dự báo trong kinh doanh - Chương 4.2: Dự báo bằng phương pháp Box-Jenkins. Chương này cung cấp cho học viên những nội dung về: tính tương quan trong dữ liệu chuỗi thời gian; tính dừng của chuỗi thời gian; mô hình Box-Jenkins (ARIMA); mô hình Box-Jenkins cho chuỗi thời gian có tính mùa vụ (SARIMA);... Mời các bạn cùng tham khảo chi tiết!
Trang 1Chương 4
DỰ BÁO BẰNG PHƯƠNG PHÁP
BOX-JENKINS
Trang 2Chương 4 - -
DỰ BẢO BẰNG PHƯƠNG PHÁP
BOX-JENKINS
4.1
4.2
4.3
4.3
Tính tương quan trong dữ liệu
chuỗi thời gian
Tính dừng của chuỗi thời gian
Mô hình Box-Jenkins (ARIMA)
Mô hình Box-Jenkins cho chuỗi thời gian
có tính mùa vụ (SARIMA)
Trang 3Chương 4
§4.1 Tính tương quan trong dữ liệu
chuỗi thời gian
4.1.1 Hệ số tự tương quan
CovŒ,.Y,_.)
Đi EU Var(Y,)
Phương trình trên được gọi là hàm tự tương
quan, ký hiệu là ACF
Trang 4Chương 4
§4.1 Tính tương quan trong dữ liệu
chuỗi thời gian
Trang 5Chương 4
§4.1 Tính tương quan trong dữ liệu
chuỗi thời gian
Do thực tế chỉ có dữ liệu mẫu, nên ta chỉ có thể
ước lượng được hệ số tự tương quan mẫu thay
vì hệ số tự tương quan tổng thể
Trang 6Chương 4
§4.1 Tính tương quan trong dữ liệu
chuỗi thời gian
Trang 7Chương 4
§4.1 Tính tương quan trong dữ liệu
chuỗi thời gian
Yứ,-YWŒ,,~Y) Yự,-y)?
R=
Tương tự, r„ cũng có tính chất:
1 -†<r,<† Vk
2 rạ=1
Trang 8Chương 4
§4.1 Tính tương quan trong dữ liệu
chuỗi thời gian
Trang 9Chương 4
§4.1 Tính tương quan trong dữ liệu
chuỗi thời gian
4.1.2 Kiểm tra tính tương quan
Có 2 cách kiểm tra tự tương quan:
1 Xem xét từng r„ = 0 hay không
2 Xem xét toàn bộ tập các giá trị r, = 0 hay không
Trang 10Chương 4
§4.1 Tính tương quan trong dữ liệu
chuỗi thời gian
Trang 11Chương 4
§4.1 Tính tương quan trong dữ liệu
chuỗi thời gian
TUe/2 ` “z2 ]
Chuỗi thời gian có thể được kết luận không có
hiện tượng tự tương quan nếu tất cả các hệ số
tương quan mẫu tính toán được đều nằm trong
giới hạn này Chuỗi khi đó có tính nhiễu trắng
Trang 12Chương 4
§4.1 Tính tương quan trong dữ liệu
chuỗi thời gian
Trang 13Chương 4
§4.1 Tính tương quan trong dữ liệu
chuỗi thời gian
Trang 14Chương 4 -
§4.2 Tinh dừng của chuỗi thời gian
4.2.1 Khái niệm chuỗi thời gian dừng
Chuỗi thời gian Y,, phải thỏa mãn:
E(Y,) = 4=const
Var(Y,) = 0° =const
CovŒ,,Y,.„) = E|Œ,T— 8)Œ, T— )Ì= 4 = const
Trang 15Col, ¥,.,) = EY, - MY, - =
Giả sử ta dịch Y tlr Y, toi Y,4,, Néu Y, la chudi
dừng thì giá trị trung bình, phương sai và hiệp
phương sai của Y; và Y,„ phải bằng nhau
Trang 16Điều này có nghĩa các đại lượng này không đổi
theo thời gian
Trang 17Chương 4 -
§4.2 Tinh dừng của chuỗi thời gian
Một chuỗi dữ liệu như vậy sẽ có xu hướng trở
vê giá trị trung bình và những dao động xung quanh giá trị trung bình sẽ như nhau
Nếu một chuỗi thời gian không dừng theo cách
định nghĩa trên, ta gọi là chuỗi không dừng
Trang 18Chương 4 -
§4.2 Tinh dừng của chuỗi thời gian
Với một chuỗi thời gian không dừng, ta chỉ
có thê nghiên cứu hành vi của nó chỉ trong khoảng thời gian được xem xét
Do vậy ta không thể khái quát hóa cho các giai
đoạn thời gian khác
Trang 19Chương 4 -
§4.2 Tinh dừng của chuỗi thời gian
4.2.2 Khảo sát tính dừng
Ngoài việc chứng minh một chuỗi dừng theo
định nghĩa, ta còn có thể dựa vào biểu đồ tự
tương quan để xác định một chuỗi thời gian
dừng hay không
Trang 20Chương 4 -
§4.2 Tinh dừng của chuỗi thời gian
Nếu hệ số tự tương quan đầu tiên khác 0
nhưng các hệ số tự tương quan tiếp theo bằng không có ý nghĩa thống kê thì đó là một chuỗi
dừng
Nếu một số hệ số tương tự tương quan khác
không một cách có ý nghĩa thống kê thì đó là một chuỗi không dừng.
Trang 21Chương 4 -
§4.2 Tinh dừng của chuỗi thời gian
4.2.3 Loại bỏ tính không dừng
Điều kiện cơ bản nhất cho việc dự báo một
chuôi thời gian là nó phải có tính dừng
Vậy khi gặp một chuỗi không dừng ta cần loại
bỏ tính không dừng trước khi làm các phân tích
ké tiép
Trang 24Chương 4 -
§4.2 Tinh dừng của chuỗi thời gian
Chuỗi sai phân bậc 1 sẽ dừng nếu xu hướng
của chuôi gốc là tuyên tính và nó chỉ con (n-1)
quan sát
Nếu sau khi lấy sai phân bậc 1 mà các biến
kiêm tra van cho thay dữ liệu chưa dừng thì
phải lây tiêp sai phân bậc 2, ., bậc n
Trang 25Chương 4 -
§4.2 Tinh dừng của chuỗi thời gian
Với một số xu thế phi đa thức, ta áp dụng
phương pháp sai phân biên dạng
Nhờ sự biến thiên của p, phương pháp tính sai phân này có thê áp dụng cho rât nhiêu xu thê khác nhau
Trang 26Chương 4
§4.3 Mô hình Box-Jenkins
Mô hình Box-Jenkins là tên gọi chung của một
họ rất nhiều mô hình khác nhau do sự tồn tại
riêng lẻ hoặc kết hợp đồng thời của quá trình tự hồi quy (AR) và trung bình trượt (MA) và có thể kết hợp cả quá trình lấy sai phân nếu chuỗi là
không dừng (1)
Trang 27Chương 4
§4.3 Mô hình Box-Jenkins
4.3.1 Quá trình tự hồi quy (AR)
Mô hình tự hồi quy bậc 1, AR(1), có dạng
ï,=,+úÚŸ,¡ +,
1 u; sai sô thỏa mãn tính nhiêu trăng
2 -1<¢,<1
Trang 28Chương 4
§4.3 Mô hình Box-Jenkins
Ÿ, =ú; +ÁŸ, ¡ +,
Các MH tự hồi quy chỉ phù hợp với chuỗi dừng,
và hệ số ø; thể hiện mức trung bình của chuỗi
Nếu dữ liệu giao động xung quanh giá trị 0
hoặc dang sai phân thì không cần hệ số ø;
trong mô hình
Trang 29Điều kiện để một chuỗi trong mô hình AR(p) là
dừng nêu thỏa mãn điêu kiện
Pp
S2 <I i=l
Trang 30Chương 4
§4.3 Mô hình Box-Jenkins
Để xác định số độ trễ p, ta sử dụng giản đồ tự
tương quan như sau:
ACF sẽ có xu hướng bằng 0 ngay lập tức
Hệ số tự tương quan riêng PACF co xu hướng khác 0 một cách có ý nghĩa thông kê cho đên
độ trễ p và bằng 0 ngay sau độ trễ p
Trang 31Chương 4
§4.3 Mô hình Box-Jenkins
4.3.2 Quá trình trung bình trượt (MA)
Mô hình trung bình trượt bậc 1, MA(1), có dạng
Trang 32Chương 4
§4.3 Mô hình Box-Jenkins
Mô hình trung bình trượt bậc q, MA(q), có dạng
Ÿ,= +iu,+00u,¡) +Úyn, ; + + ÔN,
Quá trình này dừng nếu -1 < 0, < 1
Thông thường ta hay gặp q < 2
Trang 33Chương 4
§4.3 Mô hình Box-Jenkins
Để xác định số độ trễ q, ta sử dụng giản đồ tự
tương quan như sau:
PACF sé cé xu hướng bằng 0 ngay lập tức
ACF có xu hướng khác 0 một cách có ý nghĩa
thống kê cho đến độ trễ q và bằng 0 ngay sau
độ trễ q
Trang 35Chương 4
§4.3 Mô hình Box-Jenkins
Tương tự, nếu kết hợp mô hình AR(p) và mô
hình MA(q) ta có mô hình ARMA(p,q)
Ÿ =0 +01) +6Ÿ,; + +0,l, „ tụ, TÔM, | TÔM, „ + M, ¿
Trang 36lập tức sau độ trễ thứ q còn PACF bằng 0 ngay
sau độ trễ p
Trang 37Để suy ra chuỗi dừng, ta phải khử yếu tố xu thế
trong dữ liệu gôc bằng phương pháp sai phân
Trang 39Chương 4
§4.3 Mô hình Box-Jenkins
Quy trình lựa chọn mô hình ARIMA
Bước 1 Khảo sát dữ liệu gốc
Tính ACF và PACF của dữ liệu gốc, kiểm tra
chuỗi có dừng hay không, nếu dừng, chuyển
sang bước 3
Trang 40Chương 4
§4.3 Mô hình Box-Jenkins
Bước 2 Lấy sai phân bậc 1 của Y,
Trong trường hợp dữ liệu gốc biến động nhiều
ta cần lấy log rồi mới lấy sai phân.
Trang 42Chương 4
§4.3 Mô hình Box-Jenkins
Bước 5 Phân tích, chuẩn đoán và lựa chọn MH
Kiểm tra hệ số của độ trễ cao nhất nếu không
có ý nghĩa thông kê, giảm bót độ trê p, q
Nếu mô hình đúng thì ACF và PACF không có ý
nghĩa thông kê
So sánh các sai số dự báo, độ phù hợp các MH
Trang 43Chương 4
§4.3 Mô hình Box-Jenkins
Bước 6 Nếu có thay đổi trong mô hình gốc,
quay trở lại bước 4
Chú ý Nên so sánh giữa các mô hình với nhau
chứ không nên phân tích một cách riêng lẻ
Trang 44Ta sẽ xem xét riêng biệt thành phần có tính
mùa vụ và không có tính mùa vụ bằng mô hình
ARIMA
Trang 45Ta cũng sử dụng sai phân để biến một chuỗi
thời gian không dừng có tính mùa thành chuỗi dừng
Trang 47Chương 4
§4.3 Mô hình Box-Jenkins
Bước 3 Xem xét thành phần có tính mùa vụ
Khảo sát trên ACF và PACF tại các trễ là bội số
của độ dài mùa L để kết luận AR hay MA