Hồi qui với sai số ARIMA Xét mô hình: Thông thường mô hình hồi quy cần giả thiết Nt không tự tương quan (Nt nhiễu trắng). Trong phần nay ta xét mô hình hồi quy với Nt có tự tương quan.
Trang 2 Xét mô hình:
Thông thường mô hình hồi quy cần
giả thiết Nt không tự tương quan (Nt
nhiễu trắng).
Trong phần nay ta xét mô hình hồi
quy với Nt có tự tương quan.
Hồi qui với sai số ARIMA
Trang 3 Nếu N t có tự tương quan, dùng mô hình
ARIMA để biểu diễn
Ví dụ: Biểu diễn N t bằng mô hình
Trang 4 Lấy sai phân các biến:
Trang 5Các bước xây dựng mô hình
Bước 1:
Ước lượng hàm hồi quy với mô hình
AR(1) hoặc AR(2) cho sai số Mô hình
này gọi là mô hình đại diện (proxy
model).
Bước 2:
Nếu sai số không dừng, lấy sai phân các biến Sau đó lượng hàm hồi quy với mô hình AR(1) hoặc AR(2) cho sai số.
Trang 6Các bước xây dựng mô hình
Trang 7Ví dụ 1
Sản lượng xe gắn máy hàng năm của Nhật Bản
từ 1964-1989
Trang 9Standardized Residual
Lag Number
16
15 14
13 12
11 10
9 8
7 6
5 4
Standardized Residual
Lag Number
16
15 14
13 12
11 10
9 8
7 6
5 4
3 2 1
Confidence Limits Coefficient
ACF và PACF của sai số cho thấy
AR(1) là phù hợp.
Trang 10Áp dụng AR(1) cho sai số, mô hình cuối
Các tham số ước lượng
Trang 11Ví dụ 2:
Xét số liệu về lượng dầu thô bán ra hàng tháng và các sản phẩm liên quan ở Mỹ từ tháng 1-1979 đến 12-1991
Trang 1372 74 76 78 80 82 84 86 88 90
LOG(VEHICLES)
Trang 14Dầu mỏ
Hóa Chất
Than đá
Xe cộ
Trang 15• Hồi qui theo mô hình:
quan bán ra.
Trang 16Standardized Residual
Lag Number
16
15 14
13 12
11 10
9 8
7 6
5 4
13 12
11 10
9 8
7 6
5 4
3 2 1
Confidence Limits Coefficient
Trang 17• Lấy sai phân
• Do chuỗi dữ liệu có tính mùa vụ, dùng mô
• Chuỗi sai số mới:
• ACF và PACF cho thất mô hình phù hợp là:
Trang 1913 12
11 10
9 8
7 6
5 4
Error for LGPETROL from ARIMA, MOD_7 NOCON
Lag Number
16
15 14
13 12
11 10
9 8
7 6
5 4
3 2 1
Trang 20• Viết lại mô hình (trước khi lấy sai phân nhưng sau khi lấy log)
• Tức ta đang hồi quy với sai số theo mô hình: ARIMA(1,1,0)(1,0,0) 12
• Theo dạng biến ban đầu:
Trang 21• Đôi khi, biến giải thích X t không tác động
mất một khoảng thời gian
• Ví dụ: ảnh hưởng lượng mưa tới mực
nước sông, ảnh hưởng của quảng cáo lên doanh số bán
Mô hình hồi quy động
Trang 22• Mô hình bao gồm nhiều giá trị của biến
Biến trễ
Y a v X v X v X N
Trang 23• Ví dụ: mô hình hồi quy giữa doanh thu và chi phí quảng cáo
Trang 24• Hồi quy doanh thu theo chi phí quảng cáo:
0 đến 4 được gọi là trọng số hàm
chuyển, cho biết sự thay đổi của Yt theo
• Càng về xa thì tác động của quảng cáo
đến doanh thu càng nhỏ và ngẫu nhiên có giá trị âm (4 <0 không có nghĩa Xt-4 có tác
động âm tới Yt).
Y t = 13.7 + 0.13X t + 0.15X t-1 + 0.05X t-2
+ 0.04X t-3 – 0.0007X t-4 + N t
Trang 25• Có thể viết lại mô hình dưới dạng:
• được gọi là hàm chuyển, biểu diễn sự thay đổi của
Trang 26• Giả sử tác động của biến giải thích X gia giảm lũy thừa theo thời gian.
Trang 27k k
k k
k k
Trang 30r r
Trang 31• Mô hình hồi quy động tổng quát:
Với
quy khác (hồi quy bội, hồi quy với sai số ARIMA, mô
hình ARIMA).
, 1
( ) ( )
Trang 32• Để đơn giản, ta giả sử chỉ có 1 biến giải thích trong mô hình.
• Với
• Cần chọn r, s, b và p, d, q trong mô hình ARIMA
( )( )
Trang 33Phương pháp LTF (Linear Tranfer Function) để
lựa chọn r, s, b:
Bước 1:
• Xét mô hình hồi quy bội:
• k đủ lớn để bao gồm ảnh hưởng từ các trể xa nhất.
• Do mô hình của nhiễu ít có ảnh hưởng tới mô hình
ta nên dùng AR cấp thấp để biểu diễn N t
0 1 1
Trang 35Bước 3:
• Xác định r, s, b
– s: xác định số hệ số của hàm chuyển trước khi chúng suy giảm về 0
– r: xác định cách thức suy giảm của các hệ số
hàm chuyển.
Trang 36– Nếu không có suy giảm, thay vào đó là một nhóm những
giá trị theo sau bởi 0: r = 0
– Nếu có suy giảm theo quy luật mũ đơn (có thể sau một
Trang 37Bước 4:
• Tính sai số từ mô hình hồi quy
Bước 5:
• Điều tiết toàn bộ mô hình bằng cách sử dụng
mô hình ARMA mới cho sai số và mô hình hàm chuyển cho X.
0 1 1
N Y a v X v X v X
Trang 38Bước 6:
• Kiểm tra sự phù hợp của mô hình
trắng hay không
• Mô hình hồi quy động thường xảy ra tương quan trong phần dư, nếu ta thấy phần dư không bình thường thì nên xem lại sự thích hợp của hàm
chuyển hoặc mô hình sai số.
Trang 39Ví dụ: doanh số bán và chi phí quảng cáo
Trang 40MSE = 11,47.
AIC = 84,16.
Giả sử N t là quá trình AR(1).
Trang 41– b = 0: do hệ số đầu tiên khác 0 có ý nghĩa
– s = 1: do hệ số suy giảm tại trể 1
– r = 1: do hệ số suy giảm theo hàm mũ
Trang 43sai so hoi quy
Lag Number
16
15 14
13 12
11 10
9 8
7 6
5 4
3 2 1
13 12
11 10
9 8
7 6
5 4
3 2 1
Conf idence Limits Coef f icient
MA(1) hoặc
AR(1) có
thể phù hợp
Trang 45 Viết lại mô hình, thay thế N t bằng dạng toán tử của nó:
Sau đó, ta nhân 2 vế với δ(B) và θ(B) :
Trang 46 Triển khai chi tiết:
1 1
(1 ) 1
e và giá trị tương lai của X, ta sẽ xác định được
giá trị tương lai của Y.
Trang 47Can thiệp bậc thang
• Phân tích sự tác động của một sự kiện nào đó lên
chuỗi dữ liệu.
• Hàm bậc thang: tác động tăng hoặc giảm đột ngột và kéo dài trong các biến dự báo.
Trang 48• Gỉa sử can thiệp xảy ra tại thời điểm u.
• Đặt biến giả
Trang 49Ví dụ:
• Mô tả tác động của luật thắt dây an toàn khi ngồi trong xe bằng cách sử dụng biến giả u tương ứng với tháng 2/1983:
• N t theo mô hình ARIMA
thể hiện mức giảm của tổng số người chết
và bị thương hàng tháng
Trang 50• Chọn mô hình ARIMA (1,0,1) (0,0,1)12 để biểu
Trang 51• Trong một số trường hợp sự can thiệp sẽ
làm tăng hoặc giảm biến dự báo nhưng sau một số kỳ
Trang 52Công thức tổng quát :
( ) ( )
Trang 53• Có hiệu quả tạm thời sau đó chuỗi về trạng thái ban đầu
Can thiệp dang xung
Trang 54Gỉa sử can thiệp xảy ra tại thời điểm u.Ta xác định được :
Xt = 0 : tại mọi điểm
Xt = 1 : tại điểm có sự can thiệp
Trang 55• Hàm can thiệp dạng xung :
• Sự can thiệp có tác động tức thời nhưng sau đó giảm dần, ta dùng mô hình:
Trang 56Mô hình tự hồi đa biến
• Mô hình hồi qui động chỉ cho phép biến giải
thích tác động đến biến dự báo mà không cho phép chiều ngược lại.
• Mô hình tự hồi quy đa biến giải quyết vần đề này.
Trang 57• Gọi: E t là chi tiêu tại thời điểm t
A t là ngân sách tại thời điểm t
Trang 58Ta có:
Y 1,t = log(E t ) – log(E 1,t-1 ) = log( )
Y 2,t = log(A t ) – log(A 1,t-1 ) = log( )
1
t t
E
E
1
t t
A
A
Trang 59Ngân sách Chi tiêu
Trang 60Ngân sách Chi tiêu
Trang 61• Giả sử mỗi chuỗi là một hàm của chuỗi ở quá khứ của chính nó và quá khứ của những chuỗi khác:
Trang 62Những hệ số này biểu diễn:
1: biến nằm bên trái
2: biến tương ứng với hệ số bên phải
3: độ trễ
Tổng quát ta có K chuỗi và mỗi chuỗi có liên quan tới quá khứ của nó và K-1
chuỗi khác.
Trang 64Bậc của mô hình có thể được chọn bằng cách
sử dụng tiêu chuẩn Akaike (AIC):
AIC = -2logL + 2m
L là khả năng xảy ra của mô hình
M là tham số ước lượng
Trang 65Model order(p) 1 2 3 4 5
AIC -911.2 -992.6 -1011.8 -1018.8 -1019.7 Model order(p) 6 7 8 9 10
AIC -1014.5 -1010.8 -1013.1 -1011.4 -1007.7
Giá trị nhỏ nhất p = 4 nên ta chọn AR(4) Mô hình được ước lượng là :
Trang 661, 1, 1
0.260 0.0970.434 0.144
t t
Y Y
t
t
Y Y
t
t
Y Y
t
t
e e
� �
� �
� �
Trang 67Mô hình không gian trạng thái
Biểu diễn Yt bằng hàm tuyến tính của các
biến ngẫu nhiên X1,t,X2,t,… ,Xd,t
Trang 68Xt dựa vào trạng thái trước :
et gồm những thành phần nhiễu trắng.
Ma trận F, G gồm các tham số.
Trang 69Một vài mô hình dự báo ở dạng
không gian trạng thái
Mô hình AR(2) được viết dưới dạng :
Trang 70Đây là dạng không gian trạng thái với :
a
� �
� � zt 0
Trang 71Mô hình bước đi ngẫu nhiên với sai số:
Xt = Xt-1 + et
Yt = Xt +zt
Mô hình này ở dạng không gian trạng thái với F = G= H= 1
Trang 72Mô hình hồi quy với biến số giải thích và sai số AR(1):