1. Trang chủ
  2. » Giáo án - Bài giảng

PHƯƠNG PHÁP LUẬN BOX-JENKINS TRONG MÔ HÌNH ARIMA

33 241 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 33
Dung lượng 793 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Giới thiệu một số khái niệm trong quá trình phân tích chuỗi thời gian Một số công cụ thống kê ứng dụng trong phân tích chuỗi thời gian Một số phương pháp để giải quyết mô hình ARIMA Mô hình hóa và dự báo cho chuỗi thời gian bằng phương pháp Box-Jenkins Dùng Forecast X để dự báo chuỗi thời gian bằng phương pháp Box-Jenkins

Trang 1

PHƯƠNG PHÁP LUẬN JENKINS TRONG MÔ HÌNH

BOX-ARIMA

Trang 2

• Một số phương pháp để giải quyết mô hình ARIMA

• Mô hình hóa và dự báo cho chuỗi thời gian bằng phương pháp Box-Jenkins

• Dùng Forecast X để dự báo chuỗi thời gian bằng phương pháp Box-Jenkins

Trang 3

1 Kiểm tra tính tương quan

trong dữ liệu chuỗi thời gian

1.1 Hàm tự tương quan ACF

Đo mức độ tương quan giữa 2 biến Yt và Yt-k

Tập hợp các giá trị tương quan tại điểm k=1, 2, … tạo thành hàm tự tương quan ACF

Trang 4

1 Kiểm tra tính tương quan

trong dữ liệu chuỗi thời gian

1.2 Hệ số tương quan riêng

• Đo lường mối quan hệ giữa 2 biến Yt và Yt-k khi tất cả các biến không liên quan được giữ

nguyên

• Hệ số tự tương quan riêng bậc k ( ) được

tính bằng cách hồi quy từ Yt ngược trở lại Yt-1 ,…

Yt-k

Trang 5

1 Kiểm tra tính tương quan trong dữ liệu chuỗi thời gian

• Hệ số tự tương quan riêng là hệ số ước lượng của bk từ quá trình hồi quy trên

1.3 Mô hình nhiễu trắng

Trong đó:

- C là hằng số thời kỳ

- et là quá trình Gauss bậc nhất

Trang 6

1 Kiểm tra tính tương quan trong dữ liệu chuỗi thời gian

1.4 Phân phối mẫu của tự tương quan

Nếu chuỗi thời gian là 1 nhiễu trắng thì hệ số tự tương quan có phân phối mẫu

Phân phối này có thể xấp xỉ đường cong chuẩn (normal curve) có trung bình bằng 0 và sai số chuẩn là:

Phân phối mẫu và sai số chuẩn giải thích được kết quả

từ phân tích tự tương quan, từ đó phân biệt được mẫu trong chuỗi dữ liệu là ngẫu nhiên hay nhiễu trắng

Trang 8

2 Khảo sát tính dừng của dữ liệu chuỗi thời gian

Chuỗi thời gian có tính dừng nếu kỳ vọng,

phương sai và hiệp phương sai không đổi theo thời gian

Trang 9

2 Khảo sát tính dừng của dữ liệu chuỗi thời gian

2.1 Loại bỏ tính không dừng trong chuỗi thời gian bằng phương pháp sai phân

2.2 Mô hình bước đi ngẫu nhiên

Với et là nhiễu trắng

Trang 10

2 Khảo sát tính dừng của dữ liệu chuỗi thời gian

Trang 11

2 Khảo sát tính dừng của dữ

liệu chuỗi thời gian

• 2.4 Sai phân có tính mùa

Với dữ liệu có mẫu 12 tháng

2.5 Ký hiệu điều chỉnh lùi

Với B là tác động của việc điều chỉnh dữ liệu lùi

về trước 1 thời kỳ.

Trang 12

Trong các chương trước ta đã biết về mô

3 MÔ HÌNH ARIMA CHO

CHUỖI THỜI GIAN:

Trang 13

• Để hồi quy các giá trị này ta sử dụng

mô hình các sai số trong quá khứ như là các biến giải thích :

• Y=b0 + b1 et-1 + b2 et-2 + + bp et-p + et

• Phương trình này được gọi là 1 “mô hình trung bình trượt “ Moving

average (MA) model

• Mô hình tự hồi quy AR có thể kết hợp có hiệu quả với mô hình trung bình trượt

MA để tạo ra mô hình tự hồi quy-trung bình trượt (ARMA)

3 MÔ HÌNH ARIMA CHO

CHUỖI THỜI GIAN:

Trang 14

• Mô hình tự hồi quy bậc p có dạng như sau:

– Yt= biến phản ứng (phụ thuộc) tại thời điểm t

– Yt-1, Yt-2, … = biến phản ứng tại các độ trễ t-1, t-2,

φ1, φ2 = tham số tự hồi quy thứ j

– et = phần sai số tại thời điểm t thể hiện ảnh

hưởng của các biến không được giải thích trong

mô hình

– C hằng số thời kỳ

• Ký hiệu: AR(p) hay ARIMA(p,0,0)

3.1 Mô hình tự hồi quy

bậc p (AR)

t p

t p 2

t 2 1

t 1

-t c φ Y φ Y φ Y e

Trang 16

• Mô hình trung bình trượt bậc q có dạng như sau:

– Yt = biến phản ứng (phụ thuộc) tại thời điểm t– c = hằng số thời kỳ

– j…tham số trung bình trượt thứ j

– et-k = sai số thời kỳ tại thời điểm t-k

• Ký hiệu: MA(q) hay ARIMA(0,0,q)

3.2 Mô hình trung bình trượt

bậc p (MA):

q - t q 2

t 2 1

t 1 t

Y = + − θ − θ − − θ

Trang 18

Mô hình kết hợp giữa tự hồi quy với trung bình trượt được gọi là mô

(1 c

B)Y -

B)(1 φ

Trang 20

• Nếu thêm tính không dừng vào mô hình hỗn hợp ARMA ta sẽ được mô hình tổng quát ARIMA(p,d,q)

• Xét trường hợp đơn giản nhất , ARIMA(1,1,1) ta có phương trình:

AR(1) Sai phân MA(1)

đầu tiên

3.4 Hỗn hợp mô hình ARIMA:

B)e -

(1 c

B)Y -

B)(1 φ

Trang 21

• Phương pháp ARIMA có thể được mở rộng một cách dễ dàng

Trang 22

Các bước nhận dạng mô hình Jenkins:

Box-1 Làm cho dãy số dừng

2 Cân nhắc khía cạnh không mùa vụ

3 Cân nhắc khía cạnh mùa vụ

4.NHẬN DẠNG MÔ HÌNH

BOX-JENKINS:

Trang 23

5 ƯỚC LƯỢNG CÁC THAM SỐ

Sau khi nhận dạng mô hình ướm thử

tham số AR và MA, tính mùa vụ và

không có tính mùa vụ, ta phải tìm

phương cách dự báo khả dĩ nhất.

Ví dụ: giả sử lớp của những mô hình

được xác định là ARIMA(0,1,1) Đây là

họ của các mô hình dự báo hệ số **

Mục tiêu của chúng ta là sẽ ước lượng** sao cho hợp lý nhất vơi dãy số được mô hình hóa

Các chương trình máy tính được dùng

để tìm mô hình ARIMA thích hợp sẽ tự

động tìm ra giá trị của các tham số

Trang 25

• Do đó mô hình được ước lượng là:

• Tham số là phương sai của phần dư

et

• Giá trị P-value cho một phương pháp

kiểm định mức ý nghĩa của một tham

số khác nhau.

• Z-value, cho tỷ số của ước lượng trên

sai số của nó

( Y Ytt− 1) = 1,151( Y Ytt− 2) − 0, 661( Y Ytt− 3) + 0,341( Y Ytt− 4) +et

Trang 26

6 Trở lại bước nhận dạng

• Sau khi ước lượng mô hình ARIMA, điều cần thiết là phải nhận ra mô hình được chộn có thể được cải tiến thêm hay không

• Có ba điểm của nhận dạng mô hình nảy sinh ở thời điểm này:

• 1) một vài tham số cần ước lượng có thể là vô

nghĩa(P-value >0,05) khi đó mô hình được sửa đổi sau khi bỏ các nguyên tố vô nghĩa.

• 2) ACFvà PACF cung cấp thông tin để quyết định nên chọn

mô hình AR hay MA sau đó có thể mở rộng mô hình được chon thành ARIMA hỗn hợp

• 3) có thể có nhiều mô hình có vẻ hợp l;ý chúng ta cần một phương pháp để xác định mô hình nào là hựop lý nhất

Trang 27

7 Kiểm tra chuẩn đoán

Có một phương pháp để xác định tính hợp lý của mô

hình đó là xác định tiêu chuẩn hợp lý AIC như sau:

AIC = -2LogL + 2m

Với L là tính hợp lý,m là số lượng tham số trong mô hình

Để kiểm tra lại sự chuẩn đóan mô hình thoả đáng ta thực hiện nghiên cứu phần dư Với mô hình dự báo tốt là

phần dư phải bị loại sau khi đơn giản nhiễu trắng Nếu ACF và PACF của phần dư được tìm ra chúng ta hy

vọng sẽ tìm ra sự tự tương quan không có ý nghĩa và

tự tương quan riêng phần không có ỹ nghĩa

Bất kì mô hình nào cũng cần tham số để ước lượng của chúng và giá trị AIC của chúng được tính toán và so

sánh với mô hình khác sao cho AIC của mô hình được chọn là nhỏ nhất Đôi khi ta chọn mô hình không có

AIC nhỏ nhất nhưng có phàn dư được giải thích tốt

Trang 28

8 dự báo mô hình ARIMA.

• Ta có số liệu doanh thu ngành giấy như sau:

Trang 29

Thời gian t Doanh thu Yt Sai số et

Trang 30

• Ta xem như mô hình ARIMA(0,1,1)(0,1,1)10 được thích hợp hoá với số liệu doanh thu bán giấy trên bảng Mô hình này có thể được dự báo 2 năm đầu, mô hình

Trang 31

8.2 Dự báo ngoài mẫu

• Trong quá trình làm dự báo:

• Đã sử dụng đến sự ước lượng các tham số

• Hình mẫu dữ liệu thật có thể thay đổi

• Do đó một cách thực tế hơn để đánh giá một mô hình không chắc là dùng tập ngoài mẫu.Tức là vài dữ liệu ở điểm cuối của dãy số sẽ bị bỏ qua trước khi mô hình được ước lượng,sau đó

mô hình được so sánh trên cơ sở mô hình nào tốt hơn giữa mô hình mới và mô hình đã từng được sử dụng.

• Ví dụ, nếu chúng ta bỏ ra ngoài 12 tháng của dữ liệu doanh thu bán giấy ở bảng trên và xây dựng lại mô hình với dữ liệu còn lại Sau đó so sánh nhữg mô hình dựa trên khả năng dự báo của chúng Chúng ta có thể so sánh đơn giản MSE trên

dữ liệu đã để ngoài, không cần thiết phải cân nhắc tính hợp

lý và giá trị AIC

Trang 32

8.3 Ảnh hưởng của sai phân lên dự

nhờ đó ta sẽ quyết định bao nhiêu sai phân trong mô hình,mặc dù bậc của sai phân là giống nhau trên suốt dãy giữ liệu nhưng chúng có thể biến thiên rất lớn

*) với dữ liệu không được sai phân: dự báo từ dữ liệu này sẽ hội tụ ý nghĩa của dữ liệu quá khứ nếu nhân tố hằng số được đề cập đến trong mô hình Ngoài ra dự báo sẽ hội tụ

về 0 trong cả hai trương hợp phương sai của dự báo sẽ hội tụ về phương sai của dữ liệu quá khứ Vì vậy khoảng

dự báo cũng sẽ hội tụ.

*) dữ liệu được sai phân một lần ở độ trễ 1: nếu nhân tố hằng số không đoợc đề cập đến dự báo sẽ hội tụ về giá trị quan sát cuối cùng Ngựoc lại dự báo dài hạn sẽ cho phép một khuynh hướng tuyến tính khi hệ số góc của hàm xu thế bằng hằng số Trong cả hai troờng hợp phương sai dự báo sẽ tăng tới biên dự báo vì vậy khoảng dự báo sẽ phân

ki

Trang 33

*) dữ liệu được sai phân hai lần ở độ trễ 1.: nếu không có hằng số được thích hợp hoá, dự báo dài hạn sẽ cho phép một khuynh hướng tuyến tính ngoại suy xu thế ở điểm cuối của dữ liệu Ngựoc lại dự oáo dài hạn sẽ cho ppép một

hàm xu thế bậc 2 trong cả hai trường hợp

phoơng sai của dự báo phân kỳ rất nhanh,

khoảng dự báo cũng phân kỳ rất nhanh

*) dũ liệu được sai phân mùa vụ: ảnh hưởng

của sai phân mùa vụ thì giống nhau Nếu dãy

số đoợc sai phân mùa vụ và được tính troớc hết, dự báo sẽ giống như với dữ lệu được tính sai phân hai lần ở độ trễ 1, ngoại trừ dự báo xảy ra tính thờì vụ

Ngày đăng: 25/05/2019, 14:56

TỪ KHÓA LIÊN QUAN

w