4.1 Tính tương quan trong dữ liệuchuỗi thời gian4.2 Tính dừng của chuỗi thời gian 4.3.. Chương 4chuỗi thời gian Hệ số tự tương quan riêng PACFk dùng để đolường mức độ quan hệ giữa Yt và
Trang 1Chương 4B
DỰ BÁO BẰNG PHƯƠNG PHÁP
BOX-JENKINS
Trang 24.1 Tính tương quan trong dữ liệu
chuỗi thời gian4.2 Tính dừng của chuỗi thời gian
4.3 Mô hình Box-Jenkins (ARIMA)
4.3 Mô hình Box-Jenkins cho chuỗi thời gian
có tính mùa vụ (SARIMA)
Chương 4
DỰ BÁO BẰNG PHƯƠNG PHÁP
BOX-JENKINS
Trang 34.1.1 Hệ số tự tương quan
Chương 4
chuỗi thời gian
) (
) ,
(
t
k t
t k
Y Var
Y Y
Trang 4Chương 4
chuỗi thời gian
) (
) ,
(
t
k t
t k
Y Var
Y Y
Trang 5Chương 4
chuỗi thời gian
Do thực tế chỉ có dữ liệu mẫu, nên ta chỉ có thểước lượng được hệ số tự tương quan mẫu thay
vì hệ số tự tương quan tổng thể
Trang 6Chương 4
chuỗi thời gian
k t
t
k
Y Y
Y Y
Y Y
) )(
Trang 7Chương 4
chuỗi thời gian
k t
t
k
Y Y
Y Y
Y Y
) )(
(
Tương tự, rk cũng có tính chất:
1 -1 rk 1 k
2 r0 = 1
Trang 8Chương 4
chuỗi thời gian
Hệ số tự tương quan riêng PACFk dùng để đolường mức độ quan hệ giữa Yt và Yt-k khi cácảnh hưởng của các độ trễ từ 1 đến k-1 đã đượcloại trừ
Trang 94.1.2 Kiểm tra tính tương quan
Chương 4
chuỗi thời gian
Có 2 cách kiểm tra tự tương quan:
1 Xem xét từng rk = 0 hay không
2 Xem xét toàn bộ tập các giá trị rk = 0 hay không
Trang 10Chương 4
chuỗi thời gian
Ta thừa nhận kết luận: Nếu chuỗi thời gian đảm bảo tính độc lập thì rk ~ N (0, 1/n )
Từ đó ta có khoảng tin cậy của rk:
n
u
k
2 / 2
Cách 1 H 0 : r k = 0
Trang 11Chương 4
chuỗi thời gian
Chuỗi thời gian có thể được kết luận không cóhiện tượng tự tương quan nếu tất cả các hệ sốtương quan mẫu tính toán được đều nằm trong
giới hạn này Chuỗi khi đó có tính nhiễu trắng
n
u
k
2 / 2
Trang 12Chương 4
chuỗi thời gian
n n Q
2 (
: số quan sát : độ trễ
: hệ số tương quan bậc k: độ trễ lớn nhất được xem xét
Trang 13Chương 4
chuỗi thời gian
n n Q
2 (
Nếu H0 đúng thì Q * ~ 2(h-m)
Q* : Q * 2( h m )
Trang 144.2.1 Khái niệm chuỗi thời gian dừng
Chương 4
Chuỗi thời gian Yt, phải thỏa mãn:
const Y
E( t )
const Y
Y Cov( t, tk ) ( t )( tk ) k
Trang 15Chương 4
Giả sử ta dịch Y từ Yt tới Yt+m Nếu Yt là chuỗi dừng thì giá trị trung bình, phương sai và hiệp
phương sai của Yt và Yt+m phải bằng nhau
)(Y t E
2
)(Y t
Var
t t k k
k t
Y Cov( , ) ( )( )
Trang 16Chương 4
Tóm lại, nếu là một chuỗi dừng, thì giá trị trung
bình, phương sai và hiệp phương sai (có độ trễkhác nhau) bằng nhau, không cần biết ta đolường chúng tại thời điểm nào
Điều này có nghĩa các đại lượng này không đổitheo thời gian
Trang 17Chương 4
Một chuỗi dữ liệu như vậy sẽ có xu hướng trở
về giá trị trung bình và những dao động xungquanh giá trị trung bình sẽ như nhau
Nếu một chuỗi thời gian không dừng theo cách
định nghĩa trên, ta gọi là chuỗi không dừng
Trang 18Chương 4
Với một chuỗi thời gian không dừng, ta chỉ
có thể nghiên cứu hành vi của nó chỉ trongkhoảng thời gian được xem xét
Do vậy ta không thể khái quát hóa cho các giaiđoạn thời gian khác
Trang 194.2.2 Khảo sát tính dừng
Chương 4
Ngoài việc chứng minh một chuỗi dừng theođịnh nghĩa, ta còn có thể dựa vào biểu đồ tựtương quan để xác định một chuỗi thời giandừng hay không
Trang 20Chương 4
Nếu hệ số tự tương quan đầu tiên khác 0nhưng các hệ số tự tương quan tiếp theo bằngkhông có ý nghĩa thống kê thì đó là một chuỗidừng
Nếu một số hệ số tương tự tương quan kháckhông một cách có ý nghĩa thống kê thì đó làmột chuỗi không dừng
Trang 214.2.3 Loại bỏ tính không dừng
Chương 4
Điều kiện cơ bản nhất cho việc dự báo mộtchuỗi thời gian là nó phải có tính dừng
Vậy khi gặp một chuỗi không dừng ta cần loại
bỏ tính không dừng trước khi làm các phân tích
kế tiếp
Trang 22Chương 4
Ta có thể làm dừng một chuỗi bằng phươngpháp sai phân
Trang 24Chương 4
Chuỗi sai phân bậc 1 sẽ dừng nếu xu hướngcủa chuỗi gốc là tuyến tính và nó chỉ còn (n-1)quan sát
Nếu sau khi lấy sai phân bậc 1 mà các biếnkiểm tra vẫn cho thấy dữ liệu chưa dừng thìphải lấy tiếp sai phân bậc 2, …, bậc n
Trang 25Chương 4
Với một số xu thế phi đa thức, ta áp dụngphương pháp sai phân biến dạng
Nhờ sự biến thiên của ρ, phương pháp tính saiphân này có thể áp dụng cho rất nhiều xu thếkhác nhau
) 1 0
Trang 26Chương 4
§4.3 Mô hình Box-Jenkins
Mô hình Box-Jenkins là tên gọi chung của một
họ rất nhiều mô hình khác nhau do sự tồn tạiriêng lẻ hoặc kết hợp đồng thời của quá trình tựhồi quy (AR) và trung bình trượt (MA) và có thểkết hợp cả quá trình lấy sai phân nếu chuỗi làkhông dừng (I)
Trang 274.3.1 Quá trình tự hồi quy (AR)
Y 0 1 1
Trang 28Chương 4
§4.3 Mô hình Box-Jenkins
Các MH tự hồi quy chỉ phù hợp với chuỗi dừng,
và hệ số 0 thể hiện mức trung bình của chuỗi
t t
Y 0 1 1
Nếu dữ liệu giao động xung quanh giá trị 0hoặc dạng sai phân thì không cần hệ số 0trong mô hình
Trang 29Chương 4
§4.3 Mô hình Box-Jenkins
Mô hình tự hồi quy bậc p, AR(p), có dạng
Điều kiện để một chuỗi trong mô hình AR(p) làdừng nếu thỏa mãn điều kiện
t p
t p t
Trang 30Chương 4
§4.3 Mô hình Box-Jenkins
Để xác định số độ trễ p, ta sử dụng giản đồ tựtương quan như sau:
ACF sẽ có xu hướng bằng 0 ngay lập tức
Hệ số tự tương quan riêng PACF có xu hướngkhác 0 một cách có ý nghĩa thống kê cho đến
độ trễ p và bằng 0 ngay sau độ trễ p
Trang 314.3.2 Quá trình trung bình trượt (MA)
Trang 32Chương 4
§4.3 Mô hình Box-Jenkins
Mô hình trung bình trượt bậc q, MA(q), có dạng
Quá trình này dừng nếu -1 < i < 1
q t q t
t t
Y 1 1 2 2
Thông thường ta hay gặp q < 2
Trang 33Chương 4
§4.3 Mô hình Box-Jenkins
Để xác định số độ trễ q, ta sử dụng giản đồ tựtương quan như sau:
PACF sẽ có xu hướng bằng 0 ngay lập tức
ACF có xu hướng khác 0 một cách có ý nghĩathống kê cho đến độ trễ q và bằng 0 ngay sau
độ trễ q
Trang 344.3.3 Quá trình phối hợp tự hồi quy – trung bình trượt (ARMA)
1 1
0
Trang 35t t
p t p t
t
Y 0 1 1 2 2 1 1 2 2
Trang 36Chương 4
§4.3 Mô hình Box-Jenkins
Mô hình ARMA(p,q) chỉ thích hợp với các chuỗidừng, ta cần xác định độ trễ p và q thích hợptheo cách đã trình bày ở trên: ACF bằng 0 ngaylập tức sau độ trễ thứ q còn PACF bằng 0 ngaysau độ trễ p
Trang 39Chương 4
§4.3 Mô hình Box-Jenkins
Bước 1 Khảo sát dữ liệu gốc
Quy trình lựa chọn mô hình ARIMA
Tính ACF và PACF của dữ liệu gốc, kiểm tra chuỗi có dừng hay không, nếu dừng, chuyển sang bước 3
Trang 40Chương 4
§4.3 Mô hình Box-Jenkins
Bước 2 Lấy sai phân bậc 1 của Yt
Trong trường hợp dữ liệu gốc biến động nhiều
ta cần lấy log rồi mới lấy sai phân
Trang 42Chương 4
§4.3 Mô hình Box-Jenkins
Bước 5 Phân tích, chuẩn đoán và lựa chọn MH
Kiểm tra hệ số của độ trễ cao nhất nếu không
có ý nghĩa thống kê, giảm bớt độ trễ p, q
Nếu mô hình đúng thì ACF và PACF không có ý nghĩa thống kê
So sánh các sai số dự báo, độ phù hợp các MH
Trang 43Chương 4
§4.3 Mô hình Box-Jenkins
Bước 6 Nếu có thay đổi trong mô hình gốc,
quay trở lại bước 4
Chú ý. Nên so sánh giữa các mô hình với nhau chứ không nên phân tích một cách riêng lẻ
Trang 47Chương 4
§4.3 Mô hình Box-Jenkins
Bước 3 Xem xét thành phần có tính mùa vụ
Khảo sát trên ACF và PACF tại các trễ là bội sốcủa độ dài mùa L để kết luận AR hay MA
Trang 48Chương 4
§4.3 Mô hình Box-Jenkins
Mô hình tổng quát
ARIMA(p,d,q)(P,D,Q) L