•Giới thiệu một số khái niệm trong quá trình phân tích chuỗi thời gian •Một số công cụ thống kê ứng dụng trong phân tích chuỗi thời gian •Một số phương pháp để giải quyết mô hình ARIMA •Mô hình hóa và dự báo cho chuỗi thời gian bằng phương pháp Box-Jenkins •Dùng Forecast X để dự báo chuỗi thời gian bằng phương pháp Box-Jenkins
Trang 1PHƯƠNG PHÁP LUẬN JENKINS TRONG MÔ HÌNH
BOX-ARIMA
Trang 2Nội dung
• Giới thiệu một số khái niệm trong quá trình phân tích
chuỗi thời gian
• Một số công cụ thống kê ứng dụng trong phân tích chuỗi thời gian
• Một số phương pháp để giải quyết mô hình ARIMA
• Mô hình hóa và dự báo cho chuỗi thời gian bằng phương pháp Box-Jenkins
• Dùng Forecast X để dự báo chuỗi thời gian bằng phương pháp Box-Jenkins
Trang 31 Kiểm tra tính tương quan
trong dữ liệu chuỗi thời gian
1.1 Hàm tự tương quan ACF
Đo mức độ tương quan giữa 2 biến Yt và
Yt-k
Tập hợp các giá trị tương quan tại điểm k=1,
2, … tạo thành hàm tự tương quan ACF
Trang 41 Kiểm tra tính tương quan
trong dữ liệu chuỗi thời gian
1.2 Hệ số tương quan riêng
• Đo lường mối quan hệ giữa 2 biến Yt và Yt-kkhi tất cả các biến không liên quan được
giữ nguyên
• Hệ số tự tương quan riêng bậc k ( )
được tính bằng cách hồi quy từ Yt ngược trở lại Yt-1 ,… Yt-k
Trang 51 Kiểm tra tính tương quan trong dữ liệu chuỗi thời gian
• Hệ số tự tương quan riêng là hệ số ước lượng của bk từ quá trình hồi quy trên
1.3 Mô hình nhiễu trắng
Trong đó:
- C là hằng số thời kỳ
- et là quá trình Gauss bậc nhất
Trang 61 Kiểm tra tính tương quan trong dữ liệu chuỗi thời gian
1.4 Phân phối mẫu của tự tương quan
Nếu chuỗi thời gian là 1 nhiễu trắng thì hệ số tự tương
quan có phân phối mẫu
Phân phối này có thể xấp xỉ đường cong chuẩn (normal curve) có trung bình bằng 0 và sai số chuẩn là:
Phân phối mẫu và sai số chuẩn giải thích được kết quả từ phân tích tự tương quan, từ đó phân biệt được mẫu trong chuỗi dữ liệu là ngẫu nhiên hay nhiễu trắng
Trang 82 Khảo sát tính dừng của dữ
liệu chuỗi thời gian
Chuỗi thời gian có tính dừng nếu kỳ vọng, phương sai và hiệp phương sai không đổi theo thời gian
Trang 92 Khảo sát tính dừng của dữ
liệu chuỗi thời gian
2.1 Loại bỏ tính không dừng trong chuỗi thời gian bằng phương pháp sai phân
2.2 Mô hình bước đi ngẫu nhiên
Với et là nhiễu trắng
Trang 102 Khảo sát tính dừng của dữ liệu chuỗi thời gian
• 2.3 Kiểm định tính dừng bằng phương pháp kiểm định nghiệm đơn vị
Kiểm định Dickey-Fuller
Với Y’t là chuỗi sai phân của Yt - Yt-1
Trang 112 Khảo sát tính dừng của dữ liệu chuỗi thời gian
• 2.4 Sai phân có tính mùa
Với dữ liệu có mẫu 12 tháng
2.5 Ký hiệu điều chỉnh lùi
Với B là tác động của việc điều chỉnh dữ liệu lùi về trước 1 thời kỳ.
Trang 12Trong các chương trước ta đã biết về mô
3 MÔ HÌNH ARIMA CHO
CHUỖI THỜI GIAN:
Trang 13• Để hồi quy các giá trị này ta sử dụng
mô hình các sai số trong quá khứ như là các biến giải thích :
• Y=b0 + b1 et-1 + b2 et-2 + + bp et-p + et
• Phương trình này được gọi là 1 “mô hình trung bình trượt “ Moving
average (MA) model
• Mô hình tự hồi quy AR có thể kết hợp có hiệu quả với mô hình trung bình trượt
MA để tạo ra mô hình tự hồi quy-trung bình trượt (ARMA)
3 MÔ HÌNH ARIMA CHO
CHUỖI THỜI GIAN:
Trang 14• Mô hình tự hồi quy bậc p có dạng như sau:
– Yt= biến phản ứng (phụ thuộc) tại thời điểm t
– Yt-1, Yt-2, … = biến phản ứng tại các độ trễ t-1, t-2,
1, 2 = tham số tự hồi quy thứ j
– et = phần sai số tại thời điểm t thể hiện ảnh
hưởng của các biến không được giải thích trong
mô hình
– C hằng số thời kỳ
• Ký hiệu: AR(p) hay ARIMA(p,0,0)
3.1 Mô hình tự hồi quy
bậc p (AR)
tp
tp2
t21
t1
-t c φ Y φ Y φ Y e
Trang 16• Mô hình trung bình trượt bậc q có dạng như sau:
– Yt = biến phản ứng (phụ thuộc) tại thời điểm t – c = hằng số thời kỳ
– j…tham số trung bình trượt thứ j
– et-k = sai số thời kỳ tại thời điểm t-k.
• Ký hiệu: MA(q) hay ARIMA(0,0,q)
3.2 Mô hình trung bình trượt
bậc p (MA):
q - t q 2
t 2 1
t 1 t
Trang 18Mô hình kết hợp giữa tự hồi quy với trung bình trượt được gọi là mô
(1 c
B)Y -
B)(1 φ
Trang 20
• Nếu thêm tính không dừng vào mô hình hỗn hợp
ARMA ta sẽ được mô hình tổng quát ARIMA(p,d,q)
• Xét trường hợp đơn giản nhất , ARIMA(1,1,1) ta có phương trình:
AR(1) Sai phân MA(1)
đầu tiên
3.4 Hỗn hợp mô hình ARIMA:
B)e -
(1 c
B)Y -
B)(1 φ
Trang 21
• Phương pháp ARIMA có thể được mở rộng một cách dễ dàng để xử lý xu thế mùa vụ
Trang 22Các bước nhận dạng mô hình Jenkins:
Box-1 Làm cho dãy số dừng
2 Cân nhắc khía cạnh không mùa vụ
3 Cân nhắc khía cạnh mùa vụ
4.NHẬN DẠNG MÔ HÌNH
BOX-JENKINS:
Trang 235 ƯỚC LƯỢNG CÁC THAM SỐ
Sau khi nhận dạng mô hình ướm thử
tham số AR và MA, tính mùa vụ và
không có tính mùa vụ, ta phải tìm
phương cách dự báo khả dĩ nhất.
Ví dụ: giả sử lớp của những mô hình
được xác định là ARIMA(0,1,1) Đây là
họ của các mô hình dự báo hệ số **
Mục tiêu của chúng ta là sẽ ước lượng** sao cho hợp lý nhất vơi dãy số được mô hình hóa
Các chương trình máy tính được dùng
để tìm mô hình ARIMA thích hợp sẽ tự
động tìm ra giá trị của các tham số
Trang 25• Do đó mô hình được ước lượng là:
• Tham số là phương sai của phần dư
et
• Giá trị P-value cho một phương pháp
kiểm định mức ý nghĩa của một tham
số khác nhau.
• Z-value, cho tỷ số của ước lượng trên
sai số của nó
Y Yt t 1 1,151 Y Yt t 2 0, 661 Y Yt t 3 0,341 Y Yt t 4 et
Trang 266 Trở lại bước nhận dạng
• Sau khi ước lượng mô hình ARIMA, điều cần thiết là phải nhận ra mô hình được chộn có thể được cải tiến thêm hay không
• Có ba điểm của nhận dạng mô hình nảy sinh ở thời điểm này:
• 1) một vài tham số cần ước lượng có thể là vô
nghĩa(P-value >0,05) khi đó mô hình được sửa đổi sau khi bỏ các nguyên tố vô nghĩa
• 2) ACFvà PACF cung cấp thông tin để quyết định nên chọn
mô hình AR hay MA sau đó có thể mở rộng mô hình được chon thành ARIMA hỗn hợp
• 3) có thể có nhiều mô hình có vẻ hợp l;ý chúng ta cần một phương pháp để xác định mô hình nào là hựop lý nhất
Trang 277 Kiểm tra chuẩn đoán
Có một phương pháp để xác định tính hợp lý của mô hình
đó là xác định tiêu chuẩn hợp lý AIC như sau:
AIC = -2LogL + 2m
Với L là tính hợp lý,m là số lượng tham số trong mô hình.
Để kiểm tra lại sự chuẩn đóan mô hình thoả đáng ta thực hiện nghiên cứu phần dư Với mô hình dự báo tốt là
phần dư phải bị loại sau khi đơn giản nhiễu trắng Nếu ACF và PACF của phần dư được tìm ra chúng ta hy vọng
sẽ tìm ra sự tự tương quan không có ý nghĩa và tự
tương quan riêng phần không có ỹ nghĩa
Bất kì mô hình nào cũng cần tham số để ước lượng của chúng và giá trị AIC của chúng được tính toán và so
sánh với mô hình khác sao cho AIC của mô hình được chọn là nhỏ nhất Đôi khi ta chọn mô hình không có AIC nhỏ nhất nhưng có phàn dư được giải thích tốt
Trang 288 dự báo mô hình ARIMA.
• Ta có số liệu doanh thu ngành giấy như sau:
Trang 29Thời gian t Doanh thu Yt Sai số et
Trang 30• Ta xem như mô hình ARIMA(0,1,1)(0,1,1)10 được thích hợp hoá với số liệu doanh thu bán giấy trên bảng Mô hình này có thể được dự báo 2 năm đầu, mô hình
Trang 318.2 Dự báo ngoài mẫu
• Trong quá trình làm dự báo:
• Đã sử dụng đến sự ước lượng các tham số
• Hình mẫu dữ liệu thật có thể thay đổi
• Do đó một cách thực tế hơn để đánh giá một mô hình không chắc là dùng tập ngoài mẫu.Tức là vài dữ liệu ở điểm cuối của dãy số sẽ bị bỏ qua trước khi mô hình được ước lượng,sau đó
mô hình được so sánh trên cơ sở mô hình nào tốt hơn giữa mô hình mới và mô hình đã từng được sử dụng
• Ví dụ, nếu chúng ta bỏ ra ngoài 12 tháng của dữ liệu doanh thu bán giấy ở bảng trên và xây dựng lại mô hình với dữ liệu còn lại Sau đó so sánh nhữg mô hình dựa trên khả năng dự báo của chúng Chúng ta có thể so sánh đơn giản MSE trên dữ liệu đã để ngoài, không cần thiết phải cân nhắc tính hợp lý và giá trị AIC
Trang 328.3 Ảnh hưởng của sai phân lên dự báo
Sai phân một dãy số có thể ảnh hưởng lớn lên một dự báo, nhờ đó ta sẽ quyết định bao nhiêu sai phân trong mô
hình,mặc dù bậc của sai phân là giống nhau trên suốt dãy giữ liệu nhưng chúng có thể biến thiên rất lớn
*) với dữ liệu không được sai phân: dự báo từ dữ liệu này sẽ hội tụ ý nghĩa của dữ liệu quá khứ nếu nhân tố hằng số được đề cập đến trong mô hình Ngoài ra dự báo sẽ hội tụ
về 0 trong cả hai trương hợp phương sai của dự báo sẽ hội tụ về phương sai của dữ liệu quá khứ Vì vậy khoảng
dự báo cũng sẽ hội tụ
*) dữ liệu được sai phân một lần ở độ trễ 1: nếu nhân tố hằng số không đoợc đề cập đến dự báo sẽ hội tụ về giá trị quan sát cuối cùng Ngựoc lại dự báo dài hạn sẽ cho phép một khuynh hướng tuyến tính khi hệ số góc của hàm xu thế bằng hằng số Trong cả hai troờng hợp phương sai dự báo sẽ tăng tới biên dự báo vì vậy khoảng dự báo sẽ phân
ki
Trang 33*) dữ liệu được sai phân hai lần ở độ trễ 1.: nếu không có hằng số được thích hợp hoá, dự báo dài hạn sẽ cho phép một khuynh hướng tuyến tính ngoại suy xu thế ở điểm cuối của dữ liệu Ngựoc lại dự oáo dài hạn sẽ cho ppép một
hàm xu thế bậc 2 trong cả hai trường hợp
phoơng sai của dự báo phân kỳ rất nhanh,
khoảng dự báo cũng phân kỳ rất nhanh
*) dũ liệu được sai phân mùa vụ: ảnh hưởng
của sai phân mùa vụ thì giống nhau Nếu dãy
số đoợc sai phân mùa vụ và được tính troớc hết, dự báo sẽ giống như với dữ lệu được tính sai phân hai lần ở độ trễ 1, ngoại trừ dự báo xảy ra tính thờì vụ