Dự báo sử dụng mô hình chuỗi thờigian Time Series Models for Forecasting Dự báo bằng phương pháp làm trơn số liệu Nguyễn Ngọc Anh Trung tâm Nghiên cứu Chính sách và Phát triển Nguyễn Việ
Trang 1Dự báo sử dụng mô hình chuỗi thời
gian
(Time Series Models for Forecasting)
Dự báo bằng phương pháp làm trơn số liệu
Nguyễn Ngọc Anh
Trung tâm Nghiên cứu Chính sách và Phát triển
Nguyễn Việt Cường
Đại học Kinh tế Quốc dân
Trang 2Nội dung
Một số khái niệm và một vài mô hình giản đơn
Làm trơn bằng phương pháp trung bình
Trung bình trượt giản đơn (simple moving averages - SMA)
Phương pháp trung bình trượt kép (Double moving average)
Ứng dụng của phương pháp trung bình trượt trên thị trường chứng khoán
Trung bình trượt có trọng số
Làm trơn số liệu theo qui luật số mũ
Làm trơn theo qui luật số mũ giản đơn (Simple Exponential
Smoothing)
Trang 3Trong chương này chúng ta sẽ xem xét các phương pháp làm trơn số liệu (smoothing) Mặc dù các phương pháp này là những
phương pháp giản đơn, và đã phát triển
tương đối sớm, nhưng giá trị sử dụng thực tiễn của các phương pháp này vẫn còn
Trang 4Một số khái niệm và một vài mô hình giản đơn
Mô hình giản đơn (Naive model):
Mô hình này dự báo rằng giá trị của ngày hôm sau,
hoặc một ngày t+i trong tương lai sẽ bằng giá trị củangày hôm nay
Mô hình này rất có ích và sẽ dự báo tương đối tốt khidãy số liệu là quá ngắn và không có một xu hướng cụthể nào (no systematic pattern), hoặc xu hướng này thayđổi rất chậm
t i
F + =
Trang 5F X F
: the forecast for time period
the value for time period
-We sold 532 pairs of shoes last
week, I predict we’ll sell 532 pairs this week.
We sold 532 pairs of shoes last
week, I predict we’ll sell 532 pairs this week.
Trang 6Một số khái niệm và một vài mô hình giản
đơn
Mô hình dự báo trung bình (Mean Forecast model)
Mô hình này dự báo giá trị của tương lai bằng với trung bình của dãy số
Mô hình dự báo trung bình này sẽ dự báo tốt khi
số liệu của dãy số biến động xung quanh một hằng
số hoặc một giá trị ổn định (fluctuated around a
constant or stationary value).
Y
Ft+i =
Trang 7Simple Average Model
t
The monthly average last
12 months was 56.45, so I predict
56.45 for September.
The monthly average last
12 months was 56.45, so I predict
56.45 for September.
Cents per
Cents per Gallon
Trang 8Một số khái niệm và một vài mô hình giản
đơn
Trang 9Một số khái niệm và một vài mô hình giản
đơn
Trang 10Trung bình trượt giản đơn (simple moving
averages - SMA)
Ý tưởng chính của sử dụng trung bình trượt
là tìm ra xu hướng của dãy số Giả thiết cơ bản của trung bình trượt là giá trị của dãy số trung tương lai sẽ bằng giá trị trung bình
của số liệu trong quá khứ Công thức như
sau
n
Y Y
Y
Y n
SMA
t t
)
( )
=
=
Trang 11Trung bình trượt
Cập nhật (tính toán lại) với mỗi kỳ mới
Có thể gặp khó khăn khi chọn số thời kỳ tối ưu
Có thể không điều chỉnh được cho xu hướng, và tính mùa vụ
Trang 12Ví dụ: Trung bình trượt bậc 4 được
tính bằng công thức
4
) ( −4 + −3 + −2 + −1
=
t t
Y Y
Y Y
SMA F
+
=
t t
Y Y
Y Y
SMA F
+
=
t t
Y Y
Y Y
SMA F
+
=
t t
Y Y
Y Y
SMA F
+
=
= t k t k t k t k
k t k
t
Y Y
Y Y
SMA F
Trang 13Minh họa:
Four-Month Moving Average
00 67
00 1294 1361
00 1294
4
1259 1191
1381 1345
75 15
25 1243 1259
25 1243
4
1191 1381
1345 1056
+
=
Error
F Error
F
June June May
May
Months Shipments
4-Mo Moving Average
Forecast Error January 1056
Trang 14Minh họa:
Four-Month Moving Average
1000 1100 1200 1300 1400 1500
Trang 16Phương pháp trung bình trượt kép (Double
moving average):
Chuỗi số thời gian qua biến đổi trung bình trượt kép (trung bình trượt hai lần) được ký hiệu là MA(pxq), là một trung bình trượt bậc p (sử dụng p thời kỳ/quan sát) của một chuỗi đã được biến đổi trung bình trượt ở bậc q q là bậc (q quan sát) của lần trung
bình trượt thứ nhất, và p la trung bình trượt
ở lần thứ hai.
Trang 17Ví dụ: Giả sử ta thực hiện phép trung bình trượt bậc 4 lần thứnhất với một chuỗi thời gian Y ta sẽ có:
4
) ( −4 + −3 + −2 + −1
t
Y Y
Y Y
t
Y Y Y Y SMA
t
Y Y Y Y SMA
t
Y Y Y Y SMA
Trang 18Ta tiếp tục thực hiện phép biến đổi trung bình trượt bậc 3 với
chuỗi số này, ta sẽ có chuỗi trung bình trượt kép (3-period
double moving average):
SMA SMA
SMA DMA
F
n
SMA SMA
SMA
SMA DMA
t t
)
=
=
Trang 19Ưu điểm: bằng phương pháp này có thể loại bỏ
được những biến thiên ngẫu nhiên quá lớn, và
phương pháp này ít bị tác động của các quan sát
ngoại biên (outlier), đặc biệt là so vớ phương pháp sai phân bậc nhất
Nhược điểm: Phương pháp này không xử lý được
vấn đề mùa vụ (seasonality) của chuỗi thời gian,
và việc xác định số bậc tối ưu (the optimal number
of period) cũng gặp khó khăn.
Trang 20Ứng dụng của phương pháp trung bình trượt trên thị trường chứng khoán
HSPI MA
Thời gian
Giá
Mua
Bán
Trang 22Trung bình trượt có trọng số
Ft = WMA4 = [0.4Yt-1 + 0.3Yt-2 + 0.2Yt-3 + 0.1Yt-4]
Ưu điểm: Trọng số đối với các quan sát trong quá khứ có
thể khác nhau Tuy nhiên việc xác định được trọng số tối
ưu lại có thể rất khó khăn Loại mô hình này rất có ích khi
số liệu có đặc điểm là những thay đổi theo từng thời kỳ có
kich thước gần như nhau (This type of model is most
useful when the historical data are characterized by to-period changes that are approximately the same size.)
period-Hạn chế của mô hình WMA: Mô hình này không xử lý
được vấn đề xu hướng và mùa vụ Rất khó xác định đượcbậc để thực hiện trung bình trượt bởi vì RSE không có giátrị, đồng thời việc xác định trọng số cũng rất khó khăn, nênphương pháp này thường không được sử dụng
Trang 24.
Months Shipments
4-Mo Weighted Moving Average
Forecast Error January 1056
Trang 25Làm trơn theo qui luật số mũ giản
đơn (Simple Exponential Smoothing)
Trung bình trượt giản đơn sử dụng trọng số bằng nhau chotất cả các quan sát, nhưng trên thực tế các quan sát nằm ởđầu và cuối dãy số có trọng số thấp hơn các quan sát khác(tức là được sử dụng ít hơn trong việc tính trung bình)
Trong phương pháp trung bình trượt kép thì vấn đề trọng
số lại trở nên nghiêm trọng hơn Trung bình trượt kép thậmchí dành cho những quan sát nằm giữa dãy số trọng số caohơn cả những quan sát gần kỳ dự báo hơn (những quan sátgần đây hơn) – bởi vì các quan sát nằm giữa dãy số được
sử dụng nhiều hơn trong việc tính toán con số trung bình
Trang 26Làm trơn theo qui luật số mũ giản
đơn (Simple Exponential Smoothing)
Do đó phương pháp trung bình trượt có trọng số
đã được phát triển để sử dụng Trung bình trượt có trọng số giới thiệu ở trên, trọng số giảm dần từ Yt-
1 đến Yt-4 một cách đều đặn (0.4 Æ 0.1)
Tuy nhiên tác động của các quan sát trong quá khứ lại có thể không giảm đều đặn như vậy, mà lại
giảm một cách phi tuyến hơn Để xử lý vấn đề
này, người ta đã phát triển các phương pháp trung bình trượt có trọng số thay đổi theo số mũ
Trang 27Làm trơn theo qui luật số mũ giản
đơn (Simple Exponential Smoothing)
Nhìn nhận ở một góc độ khác, trong phương pháp trung bình trượt giản đơn ở trên, giả sử có bậc
trượt là k, thì chỉ có k quan sát gần nhất được sử dụng, còn tất cả các quan sát trước đó đều không được sử dụng
Đây có thể được coi là một nhược điểm Do đó
người ta tìm cách xây dựng phương pháp làm trơn sao cho các dữ liệu trong quá khứ vẫn được sử
dụng và có trọng số giảm dần thay vì bị loại bỏ
như phương pháp trung bình trượt
Trang 28Làm trơn theo qui luật số mũ giản
đơn (Simple Exponential Smoothing)
Trang 29Làm trơn theo qui luật số mũ giản
đơn (Simple Exponential Smoothing)
Công thức này cho thấy con số dự báo là trung
trình có trọng số giữa giá trị thực tế gần đây nhất (Yt-1) và giá trị dự báo gần đây nhất (Ft-1)
So sánh với mô hình adaptive expectation ở bài
trước!!!
Ở đây α luôn nằm giữa khoảng 0 và 1 (0.1 và 0.9) Giá trị tối ưu của α sẽ là giá trị sao cho sai số dự báo SSE, hoặc RSE là nhỏ nhất.
Trang 30Chứng minh rằng cho ta các trọng
số có dạng mũ
Từ công thức trên ta có viết như sau
đoạn t-3
Từ công thức trên ta có viết như sau
đoạn t-3
∑∞
Trang 31Nguyên tắc lựa chọn α :
(1) Với các chuỗi thời gian biến động ngẫu nhiên, không
có pattern cụ thể, biến động nhiễu loạn, nên chọn α có giátrị lớn
(2) Với các dãy số có dạng bước ngẫu nhiên (randomly and smoothly walks up and down without any repeating patterns), nên chọn α có giá trị nhỏ
(3) Khi cần có độ trơn trượt nhiều, nên sử dụng các trungbình trượt dài, Î sử dụng α có giá trị nhỏ trong trung
Trang 33Ví dụ: α = 0.2 (xem file excel)
807048.2 2746.9
45012.6 212.2
212.2 1453.838
1666 1999
41596.4 204.0
204.0 1413.048
1617 1998
5804.9 76.2
76.2 1397.81
1474 1997
9798.5 99.0
99.0 1378.012
1477 1996
900.9 30.0
-30.0 1384.016
1354 1995
8323.0 91.2
91.2 1365.769
1457 1994
9450.1 97.2
-97.2 1385.212
1288 1993
53599.0 231.5
-231.5 1431.515
1200 1992
272372.6 521.9
-521.9 1535.893
1014 1991
183712.2 428.6
-428.6 1621.617
1193 1990
94261.8 307.0
-307.0 1683.021
1376 1989
59426.7 243.8
-243.8 1731.776
1488 1988
19521.7 139.7
-139.7 1759.72
1620 1987
3203.6 56.6
56.6 1748.4
1805 1986
64.0 8.0
-8.0 1750.0
1742 1985
1750 1984
e 2
|e|
e F
Housing Units (1,000) Year
0.2
α =
Trang 34Làm trơn số liệu mùa vụ theo qui luật số mũ giản đơn (Seasonal Simple Exponential Smoothing)
Phương pháp làm trơn số liệu theo quy luật
số mũ giản đơn có thể được sử dụng với số liệu có tính mùa vụ (với điều kiện là số liệu này không có tính xu hướng (applied to
seasonal data that does not possess a trend)
Trang 35Làm trơn số liệu mùa vụ theo qui luật số mũ giản đơn (Seasonal Simple Exponential Smoothing)
Trang 36Làm trơn số liệu mũ kép của Brown
Đôi khi chúng ta muốn làm trơn thật nhiều
một chuỗi số nhưng lại không muốn dành quá nhiều trọng số cho các quan sát trong quá
Trang 37Làm trơn số liệu mũ kép của Brown
Bằng phương pháp này, thì khi hệ số trơn α
dù có lớn (tức là dành ít trọng số cho số liệu trong quá khứ) thì dãy số vẫn được làm rất trơn.
Tương tự như trung bình trượt kép và như tên gọi của phương pháp này cho thấy,
phương pháp làm trơn này là làm trơn thêm một lần nữa một dãy số đã được làm trơn.
Trang 38Làm trơn số liệu mũ kép của Brown
Gọi S’ là giá trị được làm trơn 1 lần, và S”
là giá trị được làm trơn 2 lần, ta có
' 1
'' 1
'
Trang 39DỰ BÁO VỚI PHƯƠNG PHÁP
PHÂN RÃ CHUỖI SỐ THỜI GIAN
Xem lại đặc điểm của dãy số thời gian
Phương pháp phân rã truyền thống
Trang 40Một số đặc điểm thường gặp trong
số liệu chuỗi thời gian
Ngẫu nhiên (random pattern)
Biến động bất thường, làm ta không nhận ra các xu hướng khác trong dãy số
time Y
Trang 41Một số đặc điểm thường gặp trong
số liệu chuỗi thời gian
Có xu hướng (Trend patterns )
Trang 42Một số đặc điểm thường gặp trong
số liệu chuỗi thời gian
Ít hơn một năm Æ mùa vụ
Y
Time
Trang 43Một số đặc điểm thường gặp trong
số liệu chuỗi thời gian
Tính chu kỳ (Cyclical Patterns )
Dài hơn 1 năm
Y
Time
Trang 44Cấu phần cua chuỗi thời gian
Trang 45Phương pháp phân rã truyền thống
Trang 46Phương pháp phân rã truyền thống
Y = f (trend, cyclical, seasonal, error)
Trang 47Xem đồ thị để biết cộng hay nhân
Multiplicative seasonality
Trang 48Phân rã bằng phương pháp hồi qui
(Decomposition using regression analysis)
t t
t t
Yt = Dãy số thực tế
Trend = giá trị thời gian (ta tự tạo)
Q2, Q3, Q4 = Biến giả (tự tạo)
Trang 50Số giờ lao động trung bình/tuần của
Trang 51Mô hình tuyến tính - Linear Trend
t
i ti i
Y
where
0614
0 416 37 ˆ
period time
i period for
value data
Trang 52Số liệu và đường xu hướng tuyến tính
34.5 35.0 35.5 36.0 36.5 37.0 37.5 38.0
0 5 10 15 20 25 30 35
Time Period
Trang 53Mô hình bậc hai - Quadratic Trend
th
YX
Trang 54Số liệu và đường xu hướng bậc 2
34.5 35.0 35.5 36.0 36.5 37.0 37.5 38.0
0 5 10 15 20 25 30 35
Period
Trang 55Mô hình nhân (Multiplicative)
Biến đổi logarit
Yt = Dãy số thực tế
Trend = giá trị thời gian (ta tự tạo)
Q2, Q3, Q4 = Biến giả (tự tạo)
'
' 4
' 3
' 2
' 1
)