+ các giá trị biến chuỗi thời gian được biễu diễn trên trục tung • Mô hình dữ liệu là 1 yếu tố quan trọng →chúng ta có thể sử dụng nó để hướng dẫn chúng ta trong việc lựa chọn 1 phươ
Trang 1PHÂN TÍCH CHUỖI THỜI
GIAN VÀ DỰ BÁO
Trang 26.1)Các chuỗi thời gian
• Một chuỗi thời gian được đo tại các điểm liên tiếp theo thời
gian hoặc trong các khoảng thời gian liên tiếp.
• Các phép đo có thể được thực hiện mỗi giờ, ngày trong
tuần, tháng hoặc năm, hoặc tại bất kì khoảng thời gian thường xuyên khác.
Trang 3• Chuỗi thời gian là gì?
Là một bản trình bày đồ họa về mối quan hệ giữa thời gian và biến chuỗi thời gian:
+ thời gian được biễu diễn trên trục hoành.
+ các giá trị biến chuỗi thời
gian được biễu diễn trên trục tung
• Mô hình dữ liệu là 1 yếu tố
quan trọng
→chúng ta có thể sử dụng nó để hướng dẫn chúng ta trong việc lựa chọn 1 phương pháp dự báo thích hợp.
Trang 4Tính nằm ngang
• Một tính nằm ngang tồn tại khi dữ liệu dao động ngẫu nhiên quanh
một hằng số có nghĩa theo thời gian.
• Để minh họa một chuỗi thời gian với tính nằm ngang, hãy xem xét dữ
liệu 12 tuần trong bảng 6.1 và hình 6.1
Trang 50 5 10 15 20
Trang 6Thuật ngữ chuỗi thời gian tĩnh được sử dụng để biểu thị chuỗi thời gian mà các nguyên tắc thống kê không phụ thuộc vào thời gian.
Đặc biệt điều này có nghĩa:
1 Quá trình tạo dữ liệu có nghĩa là không đổi.
2 Biến thiên chuỗi thời gian là hằng số theo thời gian
Trang 7Một ô thời gian cho 1 chuỗi thời gian cố định sẽ luôn luôn thể hiện mô hình nằm ngang với các dao động ngẫu nhiên
Trang 80 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 0
5 10 15 20 25 30 35 40
Trang 9Tính xu hướng
Mặc dù dữ liệu chuỗi thời gian thường biểu hiện dao động
ngẫu nhiên, 1 chuỗi thời gian cũng có thể hiển thị chuyển động dần dần đến các giá trị tương đối cao hơn hoặc thấp hơn trong
1 khoảng thời gian dài hơn.
Xu hướng thường là kết quả của 1 yếu tố dài hạn như:
+tăng hoặc giảm dân số +cải tiến công nghệ
+thay đổi sở thích người tiêu dùng,…
Trang 10Bảng 6.3
20 22 24 26 28 30 32 34
Trang 12VD: xem xét số lượng ô được bán ra tại 1
cửa hàng bán vải trong 5 năm qua.
20 40 60 80 100 120 140 160 180
Trang 13Xu hướng và mô hình mùa
• Một số chuỗi thời gian bao gồm xu hướng và mẫu theo mùa.
YEAR QUARTER SALES
1 2 3 4 5 6 7 8 9
Trang 14Mô hình tuần hoàn
• Một MHTH tồn tại nếu lô thời gian cho thấy 1 chuỗi các điểm thay đổi thấp và trên đường xu hướng kéo dài hơn 1 năm.
• Thông thường thành phần chu kì của 1 chuỗi thời gian là do chu kì kinh doanh nhiều năm.
• Ví dụ: : “thời kỳ lạm phát vừa phải” theo sau
“thời kỳ lạm phát nhanh” có thể dẫn đến chuỗi thời gian thay thế bên dưới và phía trên đường
xu hướng tăng chung.
→ kết quả là các hiệu ứng theo chu kỳ thg đc kết hợp vs các hiệu ứng xu hướng dài hạn và đc gọi là hiệu ứng chu kỳ xu hướng.
Trang 15Chọn phương
pháp dự báo
• Mô hình cơ bản của 1 chuỗi t/g là yếu tố
quan trọng trong vc chọn dự báo nào sẽ sử dụng
→vì vậy 1 lô thời gian nên là 1 trong những
công cụ phân tích đầu tiên được sử dụng khi
cố gắng xác định phương pháp dự báo.
• Nếu là 1 tính nằm ngang ta cần phải chọn 1
phương thức thích hợp cho kiểu mẫu này
→nếu ta quan sát xu hướng trong dữ liệu thì ta cần phương pháp dự báo có khả năng xử lý xu hướng 1 cách hiệu quả.
Trang 16Độ chính xác
của dự báo
Trang 176.2 ĐỘ CHÍNH XÁC CỦA
DỰ BÁO
• Đánh giá độ chính xác của dự báo để xác định một phương pháp dự báo cụ
thể có khả năng tái tạo các dữ liệu chuỗi thời gian đã có sẵn tốt đến đâu.
• Đánh giá độ chính xác dự báo là yếu tố quan trọng trong việc so sánh các
phương pháp dự báo khác nhau.
• Bằng cách lựa chọn các phương pháp có độ chính xác tốt nhất cho các dữ
liệu đã biết, chúng ta hy vọng sẽ làm tăng khả năng có được những dự báo tốt hơn cho tương lai.
Trang 18Phương pháp dự báo đơn giản (Nạve)
Ft+1 = Giá trị thực tế của kỳ t
Ft+1 = Giá trị thực tế của kỳ t
Phương pháp dự báo đơn giản (Nạve) sử dụng dữ liệu gần đây nhất trong chuỗi thời gian để dự báo trong khoảng thời gian tiếp theo.
Ví dụ: Dùng Phương pháp Nạve để dự báo doanh số bán xăng của các tuần ở bảng 6.1
Trang 19Bảng 6.7
Tuần Giá trị chuỗi
thời gian Dự báo Sai số dự báo tuyệt đối Giá trị
của sai số
dự báo
Bình phương sai số dự báo Phần trăm sai số Giá trị tuyệt đối của
phần trăm sai số
17 21 19 23 18 16 20 18 22 20 15 Tổng
4 -2 4 -5 -2 4 -2 4 -2 -5 7
5
4 2 4 5 2 4 2 4 2 5 7
41
16 4 16 25 4 16 4 16 4 25 4
179
19.05 -10.53 17.39 -27.78 -12.50 20.00 -11.11 18.18 -10.00 -33.33 31.82 1.19
19.05 10.53 17.39 27.78 12.50 20.00 11.11 18.18 10.00 33.33 31.82 211.69
Trang 20Một khái niệm quan trọng liên quan đến đo lường độ
chính xác dự báo là sai số dự báo.
Giả sử chúng ta gọi Yt và Ft lần lượt là giá trị thực và giá trị dự báo
trong chuỗi thời gian của chu kì t, như vậy, giá trị tương ứng của Sai số
dự báo cho chu kì t là:
et = Yt - Ft
Hay: Sai số dự báo = Giá trị thật - Giá trị dự báo
Trang 21Ví dụ: Ở bảng 6.7, số gallons xăng mà nhà phân phối đã bán được trong tuần 2
là 21000, và dự báo của tuần 2-sử dụng doanh số bán hàng trong tuần 1 là
17000 gallons, nên Sai số dự báo của tuần 2 là:
Sai số dự báo trong tuần 2 =e 2 = Y 2 - F 2 =21 - 17= 4
Sai số dự báo dương cho thấy các phương pháp đánh giá thấp hơn giá trị
thực.
Sai số dự báo trong tuần 3 = e 3 = Y 3 - F 3 =19 - 21= -2
Sai số dự báo âm cho thấy các phương pháp đánh giá cao hơn giá trị thực.
Trang 22MFE =
n: số chu kì trong chuỗi thời gian
k: chu kì ban đầu của chuỗi thời gian mà chúng ta không thể tìm
ra bằng phương pháp Naive
Sai số trung bình (MFE)
Một phương pháp đơn giản tính độ chính xác dự báo là tính trung
bình của các sai số dự báo Bởi vì sai số âm và dương có xu hướng bù
trừ cho nhau, sai số trung bình có thể nhỏ Như vậy, sai số trung bình
không phải là một biện pháp rất hữu ích
Ví dụ: Bảng 6.7
Tổng của sai số dự báo = 5
t n
e
n
k t
0 11
5
MFE
Trang 23MAE=
Sai số tuyệt đối trung bình (MAE)
Phương pháp này tránh được vấn đề sai số âm và dương bì trừ cho nhau Đó là giá trị trung bình của các giá trị tuyệt đối của sai số
dự báo
Ví dụ: Ở bảng 6.7, tổng giá trị tuyệt đối của sai số dự báo là 41
k n
en
k t
3 11
41
MAE
Trang 24Sai số bình phương trung bình
(MSE)
Đây là một phương pháp tránh
được vấn đề sai số âm và dương bù
trừ lẫn nhau Đó là trung bình của các
sai số bình phương
27
16 11
e MSE
n
k t
Trang 25• Sai số phần trăm tuyệt đối trung bình (MAPE)
MAE và MSE phụ thuộc vào đơn vị tính của dữ liệu, vì vậy nó rất khó để so sánh các khoảng thời g ian khác nhau Để so sánh như vậy, chúng ta cần phải tính các sai số tương đối hoặc tỉ lệ phần trăm MAPE là sai số phần trăm tuyệt đối trung bình của các dự báo
Ví dụ: Bảng 6.7
Sai số phần trăm tuần 2
k n
Y
e MAPE
19
100 21
4 100
2
Y e
Trang 26Tổng sai số phần trăm sai số = 211.69%
% 24
19 11
69
211
MAPE
Trang 27Trung bình các giá trị trong quá khứ
Dự báo dựa trên các chu kì trong quá khứ.
Dự báo cho các chu kì tương lai.
Sử dụng trung bình của tất cả các dự liệu có sẵn trong quá khứ để dự báo cho chu kì tiếp theo.
Trang 28Ví dụ: Dùng phương pháp Trung bình các giá trị trong quá khứ để dự báo doanh số
19 2
19 21
17
F
Trang 29Bảng 6.8
Tuần Giá trị chuỗi
thời gian Dự báo Sai số dự báo tuyệt đối Giá trị
của sai số
dự báo
Bình phương sai số dự báo Phần trăm sai số Giá trị tuyệt đối của
phần trăm sai số
17.00 19.00 19.00 20.00 19.6 19.00 19.14 19.00 19.33 19.40 19.00 Tổng
4.00 0.00 4.00 -2.00 -3.60 1.00 -1.14 3.00 0.67 -4.40 3.00 4.52
4.00 0.00 4.00 2.00 3.60 1.00 1.14 3.00 0.67 4.4 3.00 2.81
16.00 0.00 16.00 4.00 12.96 1.00 1.31 9.00 0.44 19.36 9.00 89.07
19.05 0.00 17.39 -11.11 -22.50 5.00 -6.35 13.64 3.33 -29.33 13.64 2.75
19.05 0.00 17.39 11.11 22.50 5.00 6.35 13.64 3.33 29.33 13.64 141.34
Trang 30Trung bình các giá trị trong quá khứ
Độ chính xác
MAE=26.81/11=2.44
MSE=89.07/11=8.10
MAPE=141.34/11=12.85%
Trang 31TRUNG BÌNH TRƯỢT VÀ LÀM TRƠN BẰNG HÀM MŨ
Trang 323 PHƯƠNG PHÁP
32
TRUNG BÌNH TRƯỢT TRUNG BÌNH TRƯỢT CÓ TRỌNG
SỐ LÀM TRƠN BẰNG HÀM MŨ
Trang 34Tuần Số lượng bán được ( 1000 gallons)
Trang 35Sai số dự báo
Trang 36Sai
số
dự báo
Giá trị tuyệt đối của sai số
dự báo
Sai số dự báo bình phương
Phần trăm sai số
Giá trị tuyệt đối của phần trăm sai số
MAPE =
Trang 37Tóm lại, để dùng phương pháp trung bình trượt thì điều đầu tiên ta cần làm là chọn số mức độ
để tính trung bình trượt Số mức độ khác nhau
sẽ cho ra kết quả dự báo ở tương lai khác nhau.
Trang 38k : số giá trị dữ liệu dùng để dự báo : trọng số được áp dụng cho giá trị thực tế của chuỗi thời gian ở kì t
Trang 39
Áp dụng
Tuần
Số lượng bán được ( 1000 gallons)
• Đầu tiên chúng ta tính trọng số của quan sát gần nhất . Lần lượt:
• áp dụng công thức:
• Dự báo cho tuần 4 = = =19.33
Trang 40
• Những quan sát gần đây thường được cho
trọng số cao hơn quan sát cũ.
• Tổng các trọng số phải luôn bằng 1.
Trang 41LÀM TRƠN BẰNG HÀM MŨ
Làm trơn bằng hàm mũ dùng trung
bình gia trọng của giá trị chuỗi thời
gian quá khứ để dự báo
Phương pháp này là trường hợp
đặc biệt của phương pháp Trung
bình trượt có trọng số; mà chỉ chọn
trọng số từ quan sát gần đây nhất.
Các trọng số cho các giá trị dữ liệu khác được tính toán tự động và trở nên nhỏ hơn khi các quan sát càng lùi về quá khứ.
Dự báo làm trơn bằng hàm mũ là trung bình cộng có trọng số của tất
cả các quan sát trong chuỗi thời gian.
Trang 42BIG IMAGE
Dự báo làm trơn bằng hàm mũ được tính theo công thức sau đây :
Chú ý trong trường hợp trọng số dùng cho giá trị thực tế là a thì trọng số dùng với giá trị dự báo ở giai đoạn t sẽ là 1-
a Chúng ta có thể chứng minh rằng các giá trị dự báo làm trơn bằng hàm mũ cho bất kì khoảng thời gian nào cũng là
số trung bình trượt của tất cả các giá trị thực tế của chuỗi thời gian với một chuỗi thời gian bao gồm 3 giai đoạn của
dữ liệu: Y 1 ,Y 2 và Y 3.
Trang 43Y 1 ,Y 2 và Y 3 bằng 1
Trang 44Áp dụng
Tuần
Số lượng bán được ( 1000 gallons)
Trang 45Tuần Giá trị chuỗi
thời gian Dự báo
Sai số
dự báo
Sai số dự báo bình phương
Kết quả dự báo bằng phương pháp làm trơn bằng hàm mũ trong chuỗi thời
gian với hệ số làm trơn a= 0.2
Liệu chúng ta có thể
dùng thông tin này để
dự báo cho tuần thứ
13 trước khi giá trị
thực tế của tuần 13
được biết ?
𝑭 𝟏𝟑 = 𝟎.𝟐𝒀 𝟏𝟐 + 𝟎.𝟖𝑭 𝟏𝟐 = 𝟎.𝟐 ( 𝟐𝟐 ) + 𝟎.𝟖 ( 𝟏𝟖.𝟒𝟖 ) = 𝟏𝟗.𝟏𝟖
Trang 46đó chính là a nhân với sai số dự báo .
Trang 48
DỰ PHÓNG XU
HƯỚNG
Trang 49DỰ PHÓNG XU HƯỚNG
Dự báo cho chuỗi thời gian có xu hướng tuyến tính dài hạn, thường có sự gia tăng hoặc giảm nhất định theo thời gian
Vì không ổn định nên không thể áp dụng
phương pháp làm trơn bằng hàm mũ
Trang 50Bảng 6.11 Chuỗi thời gian số xe đạp bán được (1000 chiếc)
0 2 4 6 8 10 12 20
22 24 26 28 30 32 34
Trang 51Hình 6.10: Đường xu hướng tuyến tính cho
Trang 52PHƯƠNG TRÌNH XU HƯỚNG TUYẾN TÍNH
Trang 53TÍNH ĐỘ DỐC (b 1 ) VÀ HỆ SỐ CHẶN (b 0 )
t = thời gian
Y t = giá trị của chuỗi thời gian ở kì t
n = số quan sát
= giá trị trung bình của chuỗi thời gian,
= giá trị trung bình của t
•
v
Trang 54VÍ DỤ VỀ DOANH SỐ BÁN XE ĐẠP TRONG BẢNG 6.11
Trang 55Bảng 6.12: Tính MSE cho dự báo lượng xe đạp bán được
Chuỗi giá trị Dự báo Sai số dự báo
Sai số dự báo bình phương Tuần Y t F t Y t - F t (Y t - F t )^2
Trang 56TÍNH MÙA VỤ
Trang 57• Bắt đầu bằng cách xem xét một chuỗi
thời gian theo mùa không theo xu
hướng và mô hình theo mùa với một xu hướng tuyến tính.
Trang 59TÍNH MÙA VỤ KHÔNG THEO XU HƯỚNG
20 40 60 80 100 120 140 160 180
Period
Trang 60TÍNH MÙA VỤ KHÔNG THEO XU HƯỚNG
Tuy nhiên, khi quan sát kỹ biểu đồ ta có thể thấy kiểu biến động của thành phần mùa:
Quý 1 và quý 3 có doanh số bán vừa phải Quý 2 có doanh số bán cao nhất và
Quý 4 có doanh số bán thấp nhất
Biểu đồ trên không thể hiện tính xu hướng của doanh số.
Trang 61TÍNH MÙA VỤ KHÔNG THEO XU HƯỚNG
• Có thể mô hình hóa chuỗi thời gian có mẫu theo mùa bằng cách xử lý mùa như một biến phân loại.
• Biến phân loại là dữ liệu để phân loại các quan sát của dữ liệu Khi 1 biến phân loại có mức k, các biến giả là k - 1 (biến 0-1)
• Vì vậy, nếu có 4 mùa, chúng ta cần 3 biến giả 3 biến giả có thể được mã hóa như sau:
Qtr1 = 1 nếu là quý 1, = 0 nếu không phải quý 1
Qtr2 = 1 nếu là quý 2, = 0 nếu không phải quý 2
Qtr3 = 1 nếu là quý 3, = 0 nếu không phải quý 3
Dạng tổng quát của phương trình hồi quy được ước lượng là:
=
•
Trang 62Trong chuỗi thời gian bán ô, quý mà mỗi quan sát tương ứng được coi như là 1 mùa, nó là 1 biến phân loại với 4 cấp độ: Quý 1, Quý 2, Quý 3 và Quý 4.
Do đó,để mô hình hóa các hiệu ứng theo mùa trong chuỗi thời gian bán ô, chúng ta cần 3 biến giả.
TÍNH MÙA VỤ KHÔNG THEO XU HƯỚNG
Ví dụ
Trang 64• Dạng tổng quát của phương trình hồi quy được ước lượng là:
=
: Doanh số dự báo trong khoảng thời gian t
Qtr1 = 1 nếu là quý 1, = 0 nếu không phải quý 1
Qtr2 = 1 nếu là quý 2, = 0 nếu không phải quý 2
Qtr3 = 1 nếu là quý 3, = 0 nếu không phải quý 3
t : Khoảng thời gian
•
TÍNH MÙA VỤ THEO XU HƯỚNG
Trang 65ADD A FOOTER 65
• BẢNG 6.15 Chuỗi thời gian số ti vi bán được
TÍNH MÙA VỤ THEO XU HƯỚNG
3.0 4.0 5.0 6.0 7.0 8.0 9.0
Trang 66BẢNG 6.16: Chuỗi thời gian số TV bán được với biến giả
Khoảng t/g Năm Quý Qtr1 Qtr2 Qtr3 Khoảng t/g Số TV (1000s)
Trang 68• Nhiều doanh nghiệp sử dụng dự báo hàng tháng thay vì hàng quý.
• Đối với dữ liệu hàng tháng, mùa là một biến phân loại với 12 cấp độ, do đó các biến giả
là bắt buộc.
Ví dụ: 11 biến giả có thể được mã hóa như sau:
Month1 = 1 nếu là tháng 1, = 0 nếu không phải tháng 1
Month2 = 1 nếu là tháng 2, = 0 nếu không phải tháng 2
Month11 = 1 nếu là tháng 11, = 0 nếu không phải tháng 11
• Khác với những thay đổi này, phương pháp xứ lý thời vụ vẫn giữ nguyên.
•
MÔ HÌNH DỰA TRÊN DỮ LIỆU HÀNG THÁNG
Trang 69ADD A FOOTER 69
THANKS
FOR
WATCHING