Sau khi học xong chương này, người học sẽ ● Phát biểu được chuỗi thời gian là gì ● Phân biệt được các khái niệm và các cách tiếp cận trong dự báo ● Thực hiện được các phương pháp dự báo dựa trên chuỗi thời gian: lượng tăng giảm tuyệt đối, tốc độ phát triển bình quân ● Thực hiện được một số phương pháp dự báo theo mô hình nhân © Nguyễn Tiến Dũng Thống kê ứng dụng 2 CÁC NỘI DUNG CHÍNH 14.1 Chuỗi thời gian 14.2 Các phương pháp dự báo dựa trên chuỗi thời gian 14.3 Dự báo bằng mô hình
Trang 1CHƯƠNG 14
DỰ BÁO DỰA TRÊN
DỮ LIỆU CHUỖI THỜI GIAN
Ths Nguyễn Tiến Dũng Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội
Email: dung.nguyentien3@hust.edu.vn
Trang 2MỤC TIÊU CỦA CHƯƠNG
● Sau khi học xong chương này, người học sẽ
● Phát biểu được chuỗi thời gian là gì
● Phân biệt được các khái niệm và các cách tiếp cận trong dự báo
● Thực hiện được các phương pháp dự báo dựa
trên chuỗi thời gian: lượng tăng giảm tuyệt đối, tốc
độ phát triển bình quân
● Thực hiện được một số phương pháp dự báo theo
mô hình nhân
Trang 3CÁC NỘI DUNG CHÍNH
14.1 Chuỗi thời gian
14.2 Các phương pháp dự báo dựa trên chuỗi thời gian
14.3 Dự báo bằng mô hình nhân
Trang 414.1 CHUỖI THỜI GIAN
● 14.1.1 Khái niệm
● 14.1.2 Các đại lượng mô tả chuỗi thời gian
Trang 514.1.1 Khái niệm
● Time-series data
● Chuỗi các giá trị của một chỉ tiêu NC (đại
lượng) được sắp xếp theo thứ tự thời gian
● Chuỗi số thời điểm
● DL thu thập tại một thời điểm
● Không cộng lại với nhau để đưa ra con số tích luỹ được
● TD
Trang 6Phân biệt DL thời kỳ và DL thời điểm
● Chi tiêu sinh hoạt
● DL thời điểm: không có tính cộng
Trang 714.1.2 Các đại lượng mô tả chuỗi thời gian
● 14.1.2.1 Giá trị TB
● Chuỗi thời kỳ
● Chuỗi thời điểm
các thời điểm bằng nhau
các thời điểm không bằng nhau, nhưng thời gian NC là liên tục
1
1 n
i i
n
i i
Y t Y
Trang 814.1.2.2 Lượng tăng giảm tuyệt đối (so sánh tuyệt đối)
● Lượng tăng giảm tuyệt đối
Trang 9Y t
Y
1
i i
Y T
Y
2 1
n n
2
n
n n
Trang 1114.2 DỰ BÁO DỰA TRÊN CHUỖI THỜI GIAN
● Hoạch định tốt Thành công cao
● Dự báo hoạch định (lập kế hoạch)
● Các cách tiếp cận trong DB
● Cách tiếp cận định tính: phỏng vấn sâu, thảo luận
nhóm đối với chuyên gia và khách hàng
● Cách tiếp cận định lượng:
● Sử dụng X để dự báo Y: PT tương quan và hồi quy
● Sử dụng các GT quá khứ của Y để dự báo các GT tương lai của Y
● Các điều kiện và giả định để DB định lượng
Trang 1214.2.1 Một số vấn đề liên quan đến dự báo
● DB trung hạn: từ 3 tháng đến hơn 1 năm.
● DB dài hạn: từ 2 năm trở lên
Trang 1314.2.1.3 Các chỉ tiêu đánh giá mức độ phù hợp của mô hình dự báo
● Sai số tuyệt đối TB – MAE
(Mean Absolute Error)
● Sai số phần trăm tuyệt đối TB – MAPE
(Mean Absolute Percent Error)
e MAE
n n
Trang 14● Sai số bình phương TB – MSE (Mean Square Error)
và Căn bậc hai của sai số bình phương TB
2 1
n
i i
e MSE
n
1 S
n i i
e RMSE M E
Trang 1514.2.2 Các phương pháp DB đơn giản
● 14.2.2.1 Dự báo dựa vào lượng tăng trưởng tuyệt đối TB
● 14.2.2.2 Dự báo dựa vào tốc độ phát triển TB
● 14.2.2.3 Dự báo bằng phương pháp TB trượt (moving average)
Trang 1614.2.2.1 Dự báo dựa vào lượng tăng trưởng tuyệt đối TB
● L: tầm xa dự báo (L = 1,2,3, )
● Ft+L: giá trị dự báo ở thời gian t+L
● 𝛿: lượng tăng trưởng tuyệt đối TB
Trang 1714.2.2.2 Dự báo dựa vào tốc độ phát triển trung bình
Trang 1814.2.2.3 Dự báo bằng phương pháp trung bình trượt (Moving Average Method)
● Phạm vi áp dụng và ý nghĩa:
● Chuỗi số liệu có thành phần xu hướng (tăng/giảm
tuyến tính) và có thành phần bất thường (nhiễu loạn)
● Số điểm lấy TB:
● m = 2k+1 hoặc m = 2k
● Nếu m lẻ, không phải trung tâm hoá
● Nếu m chẵn, phải trung tâm hoá
Trang 1914.2.2.4 Mô hình ngoại suy xu thế
● Sử dụng các mô hình hồi
quy tuyến tính đơn biến và
đa biến để dự báo
ˆ
Y b b X
Trang 2014.3 DỰ BÁO BẰNG MÔ HÌNH NHÂN
● Mô hình nhân (Multiplication Model)
● Chuỗi số liệu theo thời gian: Y = {Y1, Y2, , Yn}
● Quy trình dự báo theo mô hình nhân
● Nhận diện các thành phần của chuỗi
● Tách riêng các thành phần
Trang 21Quy trình dự báo theo PP Holt-Winter
Bước 10: Nhân trả lại thành phần mùa để có dãy dữ liệu dự báo có thành phần mùa Bước 9: Xác định các giá trị của dãy dữ liệu dự báo chưa có thành phần mùa Bước 8: Sử dụng hồi quy tuyến tính xác định phương trình hồi quy của dãy dữ liệu dự báo
Bước 7: Loại bỏ yếu tố mùa khỏi chuỗi dữ liệu gốc Bước 6: Xác định các chỉ số mùa ở những điểm dữ liệu còn thiếu
Bước 5: Hiệu chỉnh chỉ số mùa (St*) Bước 4: Kiểm tra chỉ số mùa Bước 3: Lọc yếu tố bất thường Et Bước 2: Tính chỉ số mùa St Bước 1: Tính TB di động và trung tâm hoá
Trang 22● B1: Tách thành phần mùa
vụ và bất thường ra khỏi
chuỗi dữ liệu bằng phương
pháp trung bình trượt trung
tâm hoá (Centered
Moving Average)
● Nếu DL theo quý, chọn số
điểm lấy TB trượt là m = 4,
rồi trung tâm hoá
● MA: Moving Average
● CMA: Centered Moving
Trang 23● Nếu dữ liệu thu thập theo tháng, chọn số
điểm lấy TB trượt là 12, rồi trung tâm hoá
Trang 24TD: Tính TB trượt trung tâm hoá CMA 4 điểm
Trang 25-Lọc thành phần mùa vụ St và bất thường Et
● St.Et = Yt/CMAt
Trang 2614.4 DỰ BÁO BẰNG HÀM TĂNG TRƯỞNG MŨ
● Chuỗi thời gian có tốc độ tăng
trưởng hầu như không đổi qua
Trang 2714.5 DỰ BÁO BẰNG SAN BẰNG HÀM SỐ MŨ
● 14.5.1 San bằng hàm mũ đơn giản
● 14.5.2 Phương pháp Holt
● 14.5.3 Phương pháp Holt-Winter
Trang 2814.5.1 Phương pháp san bằng mũ đơn giản
● Exponential Smoothing Method
● Ft+1 là giá trị dự báo ở giai đoạn t+1
● Yt là giá trị thực tế ở giai đoạn t, t = 1,2,3, , n
● α là hệ số làm trơn, 0 < α < 1
● Giá trị dự báo: Fn+1 = αYn + (1- α)Fn
● Tư tưởng: GT dự báo là TB có trọng số của các GT
trước đó, các quan sát càng gần hiện tại có trọng số