Tuy nhiên, nhiều nghiên cứu chỉ ra rằng đối với dữ liệu có tính xu hướng và tính mùa thì chất lượng dự báo của phương pháp mạng nơ ron nhân tạo không cao.. Tương tự, đối với dữ liệu có t
Trang 1PHA ̣M NGỌC CẢNH
PHÁT TRIỂN MÔ HÌNH DỰ BÁO
DỮ LIỆU CHUỖI THỜI GIAN
NGẮN HẠN LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
TP Hồ Chi ́ Minh, Năm 2019
Trang 2PHA ̣M NGỌC CẢNH
PHÁT TRIỂN MÔ HÌNH DỰ BÁO
DỮ LIỆU CHUỖI THỜI GIAN
NGẮN HẠN
Chuyên nga ̀nh : Khoa ho ̣c máy tính
Ma ̃ số chuyên ngành : 60 48 01 01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa ho ̣c:
TS Pha ̣m Văn Chung
TP Hồ Chi ́ Minh, Năm 2019
Trang 3LỜI CAM ĐOAN
Tôi cam đoan rằng luận văn “PHÁT TRIỂN MÔ HÌNH DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN NGẮN HẠN” là công trình nghiên cứu của chính tôi Ngoại trừ những tài liệu tham khảo được trích dẫn trong luận văn này, tôi cam đoan rằng toàn phần hay những phần nhỏ của luận văn này chưa từng được công bố hoặc được sử dụng để nhận bằng cấp ở những nơi khác
Không có sản phẩm/nghiên cứu nào của người khác được sử dụng trong luận văn này mà không được trích dẫn theo đúng quy định
Luận văn này chưa bao giờ được nộp để nhận bất kỳ bằng cấp nào tại các trường đại học hoặc cơ sở đào tạo khác
Người thực hiện đề tài
Pha ̣m Ngo ̣c Cảnh
Trang 4LỜI CẢM ƠN
quý báu cho tôi trong suốt quá trình nghiên cứu thực hiện luâ ̣n văn này
hôm nay, tôi luôn nhớ đến công lao giảng dạy và hướng dẫn của quí thầy, cô trường Đại học Mở TP HCM, đặc biệt là quí thầy, cô trong khoa Sau đa ̣i ho ̣c và khoa Công nghệ thông tin
Mặc dù đã cố gắng rất nhiều trong quá trình thực hiê ̣n luâ ̣n văn, song với giới hạn thờ i gian và sự ha ̣n chế của khả năng bản thân nên không thể không có những
quí thầy cô giáo và các bạn học viên
Người thực hiện đề tài
Pha ̣m Ngo ̣c Cảnh
Trang 5Tuy nhiên, nhiều nghiên cứu chỉ ra rằng đối với dữ liệu có tính xu hướng và tính mùa thì chất lượng dự báo của phương pháp mạng nơ ron nhân tạo không cao Tương tự, đối với dữ liệu có tính phi tuyến chất lượng dự báo của phương pháp làm trơn hàm mũ không tốt
Trong luận văn này, với ý tưởng tận dụng khả năng xấp xỉ hàm phi tuyến của mạng nơ ron nhân tạo (ANN) và khả năng xấp xỉ tốt thành phần mùa và xu hướng của phương pháp làm trơn hàm mũ bậc 3 (ES3), chúng tôi đề xuất mô hình dự báo
dữ liê ̣u chuỗi thời gian ngắn ha ̣n bằng cách xây dựng và hiện thực mô hình lai ghép giữa mạng nơ ron nhân tạo với kỹ thuật làm trơn hàm mũ bậc 3 (ANN-ES3) Mô hình
đề xuất có khả năng dự báo đa dạng các loại dữ liệu và cho kết quả dự báo tốt hơn Đồng thời, chúng tôi cũng hiện thực ba phương pháp dự báo: ANN, ES3 và lai ghép ANN với kỹ thuật làm trơn hàm mũ bậc 1 (ANN-ES1) để so sánh với phương pháp
đề xuất
Tiến hành thực nghiệm dự báo với dữ liệu ngắn hạn thực tế, mô hình lai ghép ANN-ES3 do chúng tôi đề xuất cho chất lượng dự báo tốt hơn so với ba mô hình còn lại (ANN, ES3, and hybrid ANN-ES1)
Trang 6ABSTRACT
Currently, time series data forecasting gets much attention from the scientists Many forecasting methods have been proposed, however, most of them are applied to specific data and each method has its own advantages and disadvantages Among them, the popular are two forecasting methods: based on exponential smoothing technique because it does not require large input data and based on artificial neuron network because it is able to capture non-linearity of input data
However, many studies show that for trend and seasonal data, the quality of the artificial neuron network is not high Similarly, for non-linear data, the quality of the exponential smoothing technique is not good
In this thesis, with the idea of utilizing the nonlinear approximation capability
of the artificial neural network (ANN) and the ability to approximate the seasonal and trend component of the triple exponential smoothing method (ES3), we proposed a new model to forecast short-term time series data by developing and implementing hybrid model between artificial neural network and triple exponential smoothing method (ANN-ES3) This hybrid model is able to forecast various types of data and gives better forecasting results We also implement three forecasting methods: ANN, ES3 and hybrid model between ANN and single exponential smoothing (ANN-ES1)
to compare with the proposed method
Through the forecast experiment with actual short-term time series data, the proposed hybrid method (ANN-ES3) give better forecasting results than the other three models (ANN, ES3, and hybrid ANN-ES1)
Trang 7MU ̣C LỤC
LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
TÓM TẮT iii
MỤC LỤC v
DANH MỤC HÌNH viii
DANH MỤC BẢNG x
DANH MỤC TỪ VIẾT TẮT xi
CHƯƠNG 1: GIỚI THIỆU 1
1.1 CƠ SỞ HÌNH THÀNH LUẬN VĂN 1
1.1.1 Đi ̣nh nghĩa chuỗi dữ liê ̣u thời gian 1
1.1.2 Các thành phần của dữ liê ̣u chuỗi thời gian 1
1.1.3 Phân tích dữ liê ̣u chuỗi thời gian và ứng dụng 3
1.1.4 Tầm quan tro ̣ng và ứng du ̣ng của dự báo dữ liê ̣u chuỗi thời gian 4
1.1.5 Các phương pháp dự báo dữ liê ̣u chuỗi thời gian 5
1.2 TÍNH CẤP THIẾT CỦA ĐỀ TÀI 5
1.3 MỤC TIÊU NGHIÊN CỨU 8
1.3.1 Mục tiêu nghiên cứu tổng quát 8
1.3.2 Mục tiêu nghiên cứu cu ̣ thể 8
1.4 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU 9
1.5 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI 9
1.6 CẤU TRÚC LUẬN VĂN 10
CHƯƠNG 2: TỔNG THUẬT CÁC CÔNG TRÌNH LIÊN QUAN 11
2.1 CÔNG TRÌNH CỦA BOX VÀ JENKINS 11
2.1.1 Mô hình ARIMA 11
2.1.2 Mô hình Seasonal ARIMA 11
2.1.3 Ưu điểm của mô hình Box-Jenkins 12
2.1.4 Nhược điểm của mô hình Box-Jenkins 12
2.2 CÔNG TRÌNH CỦA HOLT-WINTERS 13
Trang 82.2.1 Giớ i thiê ̣u mô hình 13
2.2.2 Ưu điểm 13
2.2.3 Nhược điểm 14
2.3 MẠNG NƠ RON NHÂN TẠO 14
2.3.1 Ưu điểm 14
2.3.2 Nhược điểm 15
2.4 CÁC CÔNG TRÌNH GẦN ĐÂY 16
2.4.1 Tình hình nghiên cứu dự báo chuỗi dữ liê ̣u thời gian hiê ̣n nay 16
2.4.3 Một số mô hình lai ghép 17
CHƯƠNG 3: CƠ SỞ LÝ THUYẾT 19
3.1 PHƯƠNG PHÁP LÀM TRƠN KIỂU HÀM MŨ 19
3.1.1 Mô hình làm trơn hàm mũ bậc một (ES1) 19
3.1.2 Mô hình làm trơn hàm mũ bâ ̣c hai (ES2) 21
3.1.3 Mô hình làm trơn hàm mũ bâ ̣c ba (ES3) 23
3.1.4 Mô hình cô ̣ng và mô hình nhân 24
3.2 MÔ HÌNH MẠNG NƠ RON NHÂN TẠO 26
3.2.1 Cấu trúc tổng quát của mô ̣t ANN 26
3.2.2 Qui trình xử lý thông tin của một ANN 27
3.2.3 Quá trình ho ̣c của ANN 29
3.2.4 Nguyên tắc hoa ̣t đô ̣ng và các giải thuâ ̣t huấn luyê ̣n ma ̣ng nơ ron 30
3.3 HƯỚNG TIẾP CẬN MÔ HÌNH LAI GHÉP 41
3.3.1 Lý do cho ̣n kỹ thuâ ̣t làm trơn hàm mũ để bổ sung cho ANN trong dự báo dữ liê ̣u chuỗi thời gian ngắn ha ̣n 41
3.3.2 Sử du ̣ng phần mềm R để ước lượng các tham số cho mô hình ES3 41
3.3.3 Thực hiê ̣n mô hình lai ghép ANN-ES3 42
CHƯƠNG 4: HIỆN THỰC VÀ THỬ NGHIỆM 45
4.1 HIỆN THỰC 45
4.1.1 Mô đun ANN 45
4.1.2 Mô đun làm trơn hàm mũ 47
4.1.3 Mô đun lai ghép 49
4.2 DỮ LIỆU THỬ NGHIỆM 50
Trang 94.3 KẾT QUẢ THỬ NGHIỆM VÀ ĐÁNH GIÁ 52
4.3.1 Bộ dữ liệu 1: Sản xuất sắt cơ bản hàng tháng tại Úc 54
4.3.2 Bộ dữ liệu 2: Số liệu tài chính M2 hàng tháng tại Mỹ 56
4.3.3 Bộ dữ liệu 3: Lượng tiêu thụ Chocolate hàng tháng tại Úc 58
4.3.4 Bộ dữ liệu 4: Nhiệt độ cao nhất hàng tháng tại Paris, Pháp 60
4.3.5 Bộ dữ liệu 5: Số liệu đóng cửa của chỉ số công nghiệp Dow-Jones 62
4.3.6 Bộ dữ liệu 6: Số nữ thất nghiệp hàng tháng tại Mỹ 64
4.3.7 Bộ dữ liệu 7: Doanh số xi măng hàng quý tại Úc 66
4.3.8 Bộ dữ liệu 8: Mực nước hàng tháng của hồ Erie 68
4.3.9 Bộ dữ liệu 9: Sản lượng điện hàng quý tại Úc 70
4.3.10 Bộ dữ liệu 10: Số lượng người di cư hàng tháng tại Úc 72
4.4 TỔNG HỢP, ĐÁNH GIÁ VÀ NHẬN XÉT CHUNG 73
CHƯƠNG 5: KẾT LUẬN 77
5.1 Những công việc đã thực hiện được 77
5.2 Kết quả đạt được 78
5.3 Mặt ha ̣n chế 78
5.4 Hướng phát triển của luâ ̣n văn 78
TÀI LIỆU THAM KHẢO 80
PHỤ LỤC 82
PHỤ LỤC A 82
PHỤ LỤC B 84
PHỤ LỤC C 95
PHỤ LỤC D 105
Trang 10DANH MU ̣C HÌNH
Hình 1.1: Hình ảnh một chuỗi thời gian 1
Hình 1.2: Mô ta ̉ thành phần xu hướng tiến lên 2
Hình 1.3: Mô ta ̉ thành phần mùa 2
Hình 1.4: Mô ta ̉ thành phần chu kỳ 3
Hình 1.5: Vi ́ dụ dự báo dữ liệu chuỗi thời gian 4
Hình 1.6: Một chuỗi dữ liệu thời gian tuyến tính 6
Hình 1.7: Một chuỗi dữ liệu thời gian phi tuyến tính 6
Hi ̀nh 3.1: Một chuỗi dữ liê ̣u thời gian không có thời vụ và xu hướng rõ ràng 20 Hi ̀nh 3.2: Một dự báo bằng phương pháp ES1 21
Hi ̀nh 3.3: Một ví dụ về dữ liệu có tính mùa 22
Hi ̀nh 3.4: Một dự báo bằng phương pháp ES2 22
Hi ̀nh 3.5: Một dự báo bằng mô hình cộng và mô hình nhân 25
Hi ̀nh 3.6: Minh họa một ANN 26
Hi ̀nh 3.7: Mô tả kiến trúc ANN 26
Hi ̀nh 3.8: Mô tả qui trình xử lý thông tin của một ANN 27
Hi ̀nh 3.9: Mô tả về hàm truyền 28
Hi ̀nh 3.10: Mô tả các kiểu kiến trúc ANN 29
Hi ̀nh 3.11: Mô tả một perceptron 30
Hi ̀nh 3.12: Mô tả về giải thuật lan truyền ngược 35
Hi ̀nh 3.13: Mã giả cho giải thuật RPROP 39
Hi ̀nh 3.14: Mô hình dự báo lai ghép 42
Hi ̀nh 4.1: Các mô đun của mô hình lai ghép 45
Hi ̀nh 4.2: Giao diện mô đun ANN 46
Hi ̀nh 4.3: Giao diện mô đun làm trơn hàm mũ 48
Hi ̀nh 4.4: Giao diện mô đun lai ghép 49
Hi ̀nh 4.5: Bộ dữ liệu 1 – Sản xuất sắt cơ bản hàng tháng tại Úc 54
Hi ̀nh 4.6: Sai số dự báo của 4 mô hình cho bộ dữ liệu 1 54
Trang 11Hi ̀nh 4.7: Bộ dữ liệu 2 – Số liệu tài chính M2 hàng tháng tại Mỹ 56
Hi ̀nh 4.8: Sai số kết quả dự báo của 4 mô hình cho bộ dữ liệu 2 56
Hi ̀nh 4.9: Bộ dữ liệu 3 – Lượng tiêu thụ Chocolate hàng tháng tại Úc 58
Hi ̀nh 4.10: Sai số dự báo của 4 mô hình cho bộ dữ liệu 3 58
Hi ̀nh 4.11: Bộ dữ liệu 4 – Nhiệt độ cao nhất hàng tháng tại Paris 60
Hi ̀nh 4.12: Sai số dự báo của 4 mô hình cho bộ dữ liệu 4 60
Hi ̀nh 4.13: Bộ dữ liệu 5 – Số liệu đóng cửa chỉ số Dow-Jones 62
Hi ̀nh 4.14: Sai số dự báo của 4 mô hình cho bộ dữ liệu 5 62
Hi ̀nh 4.15: Bộ dữ liệu 6 – Số người nữ thất nghiệp hàng tháng tại Mỹ 64
Hi ̀nh 4.16: Sai số dự báo của 4 mô hình cho bộ dữ liệu 6 64
Hi ̀nh 4.17: Bộ dữ liệu 7 – Doanh số xi măng hàng quý tại Úc 66
Hi ̀nh 4.18: Sai số dự báo của 4 mô hình cho bộ dữ liệu 7 66
Hi ̀nh 4.19: Bộ dữ liệu 8 – Mực nước trung bình hàng tháng của hồ Erie 68
Hi ̀nh 4.20: Sai số dự báo của 4 mô hình cho bộ dữ liệu 8 68
Hi ̀nh 4.21: Bộ dữ liệu 9 – Sản lượng điện hàng quý tại Úc 70
Hi ̀nh 4.22: Sai số dự báo của 4 mô hình cho bộ dữ liệu 9 70
Hi ̀nh 4.23: Bộ dữ liệu 10 – Số lượng người di cư hàng tháng tại Úc 72
Hi ̀nh 4.24: Sai số dự báo của 4 mô hình cho bộ dữ liệu 10 72
Hi ̀nh 4.25: Biểu đồ so sánh độ chính xác dự báo 75
Trang 12DANH MU ̣C BẢNG
Ba ̉ng 4.1: Bảng mô tả 10 bộ dữ liệu thử nghiệm 52
Ba ̉ng 4.2: Cấu hình tốt nhất ứng với các mô hình cho bộ dữ liệu 1 55
Ba ̉ng 4.3: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 2 57
Ba ̉ng 4.4: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 3 59
Ba ̉ng 4.5: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 4 61
Ba ̉ng 4.6: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 5 63
Ba ̉ng 4.7: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 6 65
Ba ̉ng 4.8: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 7 67
Ba ̉ng 4.9: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 8 69
Ba ̉ng 4.10: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 9 71
Ba ̉ng 4.11: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 10 73
Ba ̉ng 4.12: Bảng so sánh sai số dự báo MAPE của 4 mô hình trên 10 bộ dữ liệu thư ̉ nghiê ̣m 74
Ba ̉ng 4.13: Bảng so sánh thời gian chạy và độ chính xác dự báo trung bình cu ̉a bốn mô hình 75
Trang 13DANH MỤC TỪ VIẾT TẮT
ANN Atifical Neural Network Mạng nơron nhân ta ̣o
ANN-ES1 Atifical Neural Network - Simple
Exponential Smoothing
Lai ghép ma ̣ng nơ ron và
làm trơn hàm mũ bâ ̣c I ANN-ES3 Atifical Neural Network - Triple
Exponential Smoothing
Lai ghép ma ̣ng nơ ron và
làm trơn hàm mũ bâ ̣c III
ARMA Autoregressive Moving Average Mô hình tự hồi quy trung
bình trượt ARIMA Autoregression Integrated Moving
Average
Mô hình tự hồi quy tích
hợp trung bình trượt
ES Exponential Smoothing Làm trơn hàm mũ
ES1 Simple Exponential Smoothing Làm trơn hàm mũ bậc 1 ES2 Double Exponential Smoothing Làm trơn hàm mũ bậc 2
ES3 Triple Exponential Smoothing Làm trơn hàm mũ bậc 3,
còn gọi là là Holt-Winter
MA Moving Average Mô hình trung bình trượt
PE Processing Elements Những thành phần xử lý
SARIMA Seasonal Autoregression Integrated
Moving Average
Mô hình tự hồi quy trung bình trượt có tính mùa
Trang 15CHƯƠNG 1: GIỚI THIỆU
1.1 CƠ SỞ HÌNH THÀNH LUẬN VĂN
1.1.1 Đi ̣nh nghi ̃a chuỗi dữ liê ̣u thời gian
Một tâ ̣p hợp các quan sát theo trình tự thời gian được gọi là dữ liê ̣u chuỗi thời gian [19] Ví du ̣ một chuỗi dữ liê ̣u thời gian được minh họa như hình 1.1 [19], trong hình này trục hoành là những khoảng thời gian đều nhau, trục tung là những giá trị
đo được theo thời gian liên tiếp đều nhau đó, gọi chúng là đại lượng X
Hình 1.1: Hình ảnh một chuỗi thời gian
Các mô hình chuỗi thời gian thường dùng trong việc dự báo hiện nay gồm có:
- Các mô hình hồi quy
- Các mô hình xác suất
- Các mô hình tất đi ̣nh
1.1.2 Ca ́ c thành phần của dữ liê ̣u chuỗi thời gian
Trong thực tế, một chuỗi thời gian rất đa dạng Tuy vậy, có thể có các thành phần chính như sau:
- Thành phần xu hướng dài hạn (long – term trend component): để đại diện cho
yếu tố xu hướng, nó thể hiện trong thời gian dài thì đại lượng X có thể có sự giảm hoặc tăng Có thể biểu diễn trên đồ thị thành phần này như là một đường cong trơn hoặc một đường thẳng Đây thường là kết quả của các yếu tố dài ha ̣n, ví dụ như yếu tố thay đổi về nhân khẩu, công nghê ̣, du lịch hay sở thích giải trí và tiêu
Trang 16dùng Hình 1.2 [25] là một ví dụ biểu diễn về một chuỗi thời gian với xu hướng
có tính tiến lên
Hình 1.2: Mô ta ̉ thành phần xu hướng tiến lên
- Thành phần mùa (seasonal component): đặc trưng cho xu hướng giảm hoặc tăng đối với đại lượng X vào một giai đoạn thời gian cụ thể Tính mùa vụ xảy ra khi tồn tại một loạt ảnh hưởng của yếu tố mùa vụ (các quí của năm, các tháng hay các ngày trong tuần) Tính mùa vụ luôn xảy ra trong một khoảng thời gian cố định và mang tính tuần hoàn
Ví dụ:
Lượng điện tiêu thụ thường tăng trong mùa hè và thường giảm ở mùa xuân hoặc lượng nước tiêu dùng thường giảm ở mùa đông và tăng ở mùa hè
Lượng vật liệu xây dựng tiêu thụ thường tăng trong đầu mùa khô
Một ví du ̣ về thành phần mùa (theo các mùa trong năm) có thể được biểu diễn
ở hình 1.3 [25] Tính biến đô ̣ng có thể theo ngày, theo tuần hay theo giờ mà không phải chỉ với các mùa trong năm
Hình 1.3: Mô ta ̉ thành phần mùa
Trang 17- Thành phần chu kỳ (cyclical component): mô tả đại lượng X thay đổi theo chu kỳ nào đó Tính chu kỳ tồn tại khi có sự tăng lên hay giảm xuống, lặp lại trong một giai đoạn Tuy nhiên, giai đoạn này là không cố định Hình 1.4 [25] mô tả một ví du ̣ về thành phần chu kỳ trong chuỗi thời gian cụ thể
Hình 1.4: Mô ta ̉ thành phần chu kỳ
- Thành phần bất thường (irregular component): Trong chuỗi thời gian có những
giá trị biến đổi bất thường, đây là thành phần đại diện cho sự biến đổi của những giá trị đó Tính chu kỳ trong thành phần này không có Các số liệu ở quá khứ
không có khả năng dự đoán sự biến đổi của những giá trị bất thường này
1.1.3 Phân ti ́ch dữ liê ̣u chuỗi thời gian và ứng dụng
Khi phân tích dữ liệu chuỗi thời gian có thể giúp xử lý được khá nhiều lớp bài toán ở thực tế, một số bài toán chính như: tìm kiếm tương tự (similarity search), gom cụm (clustering), phân loại (classification), tìm quy luật của dữ liệu (rule discovery), phát hiện điểm bất thường (anomaly detection), tìm mẫu lặp (finding motif), dự báo
dữ liệu (prediction) trong tương lai Vì thế dữ liệu chuỗi thời gian hiện nay được ứng dụng phổ biến, rộng rãi, đa dạng ở nhiều ngành nghề và lĩnh vực, ví dụ:
- Ứng dụng nhận dạng kiểu tăng trưởng giống nhau của nhiều công ty từ đó có quyết định hoặc định hướng và đầu tư hợp lý
- Ứng dụng nhận dạng chữ viết tay: việc biểu diễn chữ viết, so sánh những đặc điểm tương tự của hai hoặc nhiều chữ viết (ở dạng chuỗi dữ liệu) để tìm ra chữ viết có phải của một người hay không hiện nay được ứng dụng một cách phổ biến và rộng rãi
Trang 18- Ứng dụng vào thị trường chứng khoán với việc xác định sự biến động, thay đổi giá trị cổ phiếu
- Phân tích, dự đoán lạm phát trong một quốc gia
Trong luận văn này, chúng tôi nghiên cứu về bài toán dự báo trên chuỗi thời gian ngắn hạn
1.1.4 Tầm quan tro ̣ng và ứng du ̣ng của dự báo dữ liê ̣u chuỗi thời gian
Dự báo dữ liệu chuỗi thời gian (time series forecasting) là việc dự đoán những
giá trị tương lai sao cho những giá trị dự đoán này đạt được độ chính xác càng cao
càng tốt Cụ thể, bài toán này sử dụng chuỗi giá trị trong quá khứ và hiện tại x t-n ,…
x t-2 , x t-1 , xt để tìm ra các liên kết, các mẫu, các quy luật biến đổi nhằm dự đoán những
giá trị trong tương lai x t+1 , x t+2 Hình 1.5 [11] là một ví dụ về biểu diễn dự báo bằng
đồ thị, với đường màu đỏ là giá trị dự báo
Hình 1.5: Vi ́ dụ dự báo dữ liệu chuỗi thời gian
Việc dự báo dữ liệu chuỗi thời gian có nhiều ứng dụng phổ biến như:
- Ứng dụng dự đoán những sự việc không mong muốn hay không tránh khỏi nhằm hạn chế ảnh hưởng của nó Ví dụ, dự báo sắp có động đất để có định hướng, biện pháp hay quyết định phù hợp hợp nhằm hạn chế hậu quả
- Ứng dụng dự đoán những sự việc không mong muốn nhằm ngăn cản chúng xảy ra bằng cách dự đoán sự kiện rồi có các biện pháp hợp lý Ví dụ, dự báo
Trang 19chỉ số lạm phát của một quốc gia, căn cứ vào đó chính quyền có các quyết sách, giải pháp hợp lý nhằm ngăn cản chỉ số này vượt quá mức cho phép
- Ứng dụng dự báo những biến động của thị trường, dự đoán giá cả cổ phiếu hay giá trị chứng khoán trên thị trường, dựa vào đó nhằm thu được lợi nhuận
1.1.5 Ca ́ c phương pháp dự báo dữ liê ̣u chuỗi thời gian
Căn cứ theo kỹ thuật dự báo, Sallehuddin và cộng sự (2009) [12] chia những phương pháp dự báo thành hai loa ̣i: thống kê và trí tuê ̣ nhân ta ̣o (statistical and artificial intelligence) như sau:
- Thống kê gồm có: mô hình làm trơn hàm mũ (exponential smoothing), mô hình hồi quy đa biến (multivariate regression), đa hồi quy (multiple regression)
và mô hình ARIMA
- Trí tuê ̣ nhân ta ̣o bao gồm: logic mờ (fuzzy logic), giải thuâ ̣t di truyền, ma ̣ng
nơ ron và ho ̣c máy
Khi dự báo dùng phương pháp nào cần căn cứ vào những tính chất cụ thể của từng loại dữ liệu Khi gặp chuỗi dữ liệu thời gian có ít tính chất có thể dùng một trong những phương pháp đơn lẻ như đã trình bày ở phần trên Tuy vậy, thực tế đã chứng minh rằng ngay trong một chuỗi dữ liệu thời gian rất đa dạng và thường tồn tại nhiều tính chất trong mẫu, đặc biệt là tính bất thường, các nhà nghiên cứu hiện nay hướng tới phát triển các biến thể từ mô hình cơ bản hoặc nghiên cứu lai ghép kết hợp giữa nhiều mô hình với nhau nhằm nâng cao hiệu suất dự báo
1.2 TÍNH CẤP THIẾT CỦA ĐỀ TÀI
Dữ liệu chuỗi thời gian hiện diện trong rất nhiều ứng dụng thực tế, từ những
lĩnh vực kinh tế, thị trường cho đến khí tượng, thủy văn… Trong các ứng dụng này, việc ứ ng du ̣ng dữ liê ̣u chuỗi thời gian để dự báo là một công việc rất cần thiết
Dựa trên số lượng, dữ liê ̣u chuỗi thời gian được phân thành hai loa ̣i: ngắn ha ̣n
và dài ha ̣n Việc nghiên cứu căn cứ vào đặc điểm của dữ liê ̣u để dự báo được các nhà nghiên cứu quan tâm trong thời gian gần đây [1,3,7,10,12,14,16] Các công trình này thực sự hữu ích đối với việc khai thác dữ liệu các chuỗi thời gian khác nhau
Trang 20Đối với dữ liệu ngắn hạn, việc tìm và chọn được phương pháp phù hợp là việc cần giải quyết Theo Hyndman [11] là không có câu trả lời dễ dàng, nó phụ thuộc vào
số lượng tham số mô hình cần ước tính và lượng ngẫu nhiên trong dữ liệu Kích thước mẫu được yêu cầu tăng theo số lượng tham số và lượng nhiễu trong dữ liệu
Dựa vào tính chất, chuỗi thờ i gian thường tồn ta ̣i ở hai da ̣ng chính là: có tính tuyến tính và không có tính tuyến tính (phi tuyến) Chuỗi thời gian tuyến tính là chuỗi
có sự biến đổi tuân theo quy luật nhất định Hình 1.6 [19] minh họa một chuỗi dữ liệu thời gian tuyến tính
Hình 1.6: Một chuỗi dữ liệu thời gian tuyến tính
Chuỗi thời gian phi tuyến tính là chuỗi có sự biến đổi bất thường, sự biến đổi không có qui luật Hình 1.7 [19] minh họa một chuỗi dữ liệu thời gian phi tuyến tính
Hình 1.7: Một chuỗi dữ liệu thời gian phi tuyến tính
Trang 21Tuy nhiên trong cù ng mô ̣t chuỗi dữ liê ̣u thời gian có thể xen lẫn cả 2 da ̣ng tuyến tính và phi tuyến Đây là loại dữ liệu cần được nghiên cứu tìm ra phương pháp
dự báo đạt tính chính xác cao
Hiện nay, việc giải quyết bài toán dự báo dữ liệu chuỗi thời gian ngày càng được quan tâm của cộng đồng khoa học [1,3,7,10,12,14,16] Đã có đề xuất với các phương pháp khác nhau, tuy nhiên mỗi phương pháp đều có những nhược điểm và
ưu điểm riêng Riêng với dự báo dữ liê ̣u chuỗi thời gian ngắn ha ̣n, viê ̣c tìm ra phương pháp dự báo thỏa mãn cả về đô ̣ dài dữ liê ̣u dùng trong dự báo, độ phức ta ̣p của thuâ ̣t toán và độ chính xác của kết quả dự báo là mô ̣t bài toán khó Phổ biến nhất trong dự báo trên dữ liệu thời gian ngắn ha ̣n tuyến tính và phi tuyến tính là hai phương pháp:
dự báo dựa trên kỹ thuật làm trơn hàm mũ (ES) và mạng nơ ron (ANN) bở i chúng không bắt buộc phải có dữ liê ̣u mẫu có kích thước lớn, thời gian đáp ứng nhanh, dễ
dàng thực hiê ̣n, nắm bắt được tính bất thường của dữ liệu và ít chi phí Mặc dù vậy, nhiều nghiên cứu đã chứng minh rằng chất lượng dự báo của phương pháp làm trơn hàm mũ với dữ liệu có tính phi tuyến không cao và ANN với dữ liệu tuyến tính hay
xu hướng và mùa chưa tốt [8,9,13,14,16]
Các phương pháp gần đây ứng du ̣ng khá thành công kỹ thuâ ̣t làm trơn hàm
mũ, ARIMA hay SAMIRA đối với chuỗi dữ liê ̣u thời gian tuyến tính hoă ̣c áp dụng phương pháp ANN cho chuỗi dữ liê ̣u thời gian phi tuyến Gần đây, có nhiều công trình ứng du ̣ng một số phương pháp truyền thống cho từng loại dữ liê ̣u cu ̣ thể như [1,3,7,10,12,16] Tuy nhiên dữ liệu trong thế giới thực rất phức ta ̣p, đồng thời tồn ta ̣i
các mẫu phi tuyến và tuyến tính trong cùng mô ̣t chuỗi thời gian Nên chỉ dùng mô
hình phi tuyến hoă ̣c tuyến tính đơn lẻ là không đủ bởi có khả năng bỏ qua đă ̣c điểm phi tuyến hay tuyến tính củ a dữ liê ̣u Bên cạnh đó, đa số những phương pháp hiê ̣n nay đa số để xử lý một loại dữ liê ̣u cu ̣ thể mà chưa áp du ̣ng đa da ̣ng các loa ̣i dữ liê ̣u chuỗi thờ i gian
Với những phân tích như trên, đồng thời theo R.J.Hyndman và cộng sự [11], kết hợp nhiều dự báo dẫn đến tăng hiệu quả dự báo Vì thế, nhằm hạn chế các yếu
Trang 22điểm trên cần có một mô hình mới có thể đồng thời nắm bắt được các đă ̣c điểm tuyến
tính lẫn phi tuyến tính trong cùng một chuỗi dữ liệu Tức là, cần thiết phải lai ghép
mô hình phi tuyến với tuyến tính dựa trên ha ̣n chế của mỗi mô hình
1.3 MỤC TIÊU NGHIÊN CỨU
1.3.1 Mu ̣c tiêu nghiên cứu tổng quát
Chúng tôi xây dựng và hiện thực mô hình mới có khả năng dự báo đa dạng dữ liệu chuỗi thời gian ngắn ha ̣n đồng thời cho chất lượng dự báo tốt hơn
Nghiên cứu lai ghép giữa kỹ thuật ANN và kỹ thuâ ̣t làm trơn hàm mũ, do hai
kỹ thuâ ̣t này bổ sung lẫn nhau Mô ̣t mă ̣t, ANN có thể phát hiê ̣n các đă ̣c trưng phi tuyến tính bị ẩn khó phát hiện trong dữ liê ̣u Mă ̣t khác, mô hình làm trơn hàm mũ cho
kết quả tốt trong các mẫu tuyến tính của chuỗi thời gian [9,11]
Chú ng tôi dùng kỹ thuâ ̣t làm trơn hàm mũ bâ ̣c ba (ES3) [1] có ưu điểm nắm bắt được tính mùa, tính xu hướng, yêu cầu dữ liệu mẫu nhỏ để lai ghép với ANN bằng phương pháp lai “nghi ̣ viê ̣n” [9] bởi cách lai này là đơn giản, thực hiện dễ dàng và ít chi phí
Chúng tôi hiện thực mô hình ANN-ES3 sau đó thử nghiệm trên nhiều bộ dữ liệu ngắn hạn để so sánh, kiểm tra và đánh giá mô hình đề xuất với ba mô hình: ANN, ES3 và mô hình lai ANN-ES1, kiểm tra tính đúng đắn về mặt lý thuyết Mô hình chúng tôi đề xuất cho hiệu suất dự đoán cao hơn so với các mô hình còn lại
1.3.2 Mu ̣c tiêu nghiên cứu cụ thể
Nghiên cứu kỹ thuâ ̣t làm trơn hàm mũ bâ ̣c một
Nghiên cứu kỹ thuâ ̣t làm trơn hàm mũ bâ ̣c hai
Nghiên cứu kỹ thuâ ̣t làm trơn hàm mũ bâ ̣c ba
Nghiên cứu các phương pháp ước lượng giá trị các tham số trong kỹ thuâ ̣t
làm trơn hàm mũ Sử dụng phương pháp phù hợp là phần mềm R
Nghiên cứu cách dự báo bằng ANN
Nghiên cứu phương pháp lai ghép được đề xuất bởi Lai [9] và các cộng sự
Trang 23Thực nghiệm, kiểm tra, so sánh, đánh giá các phương pháp bằng những bô ̣ dữ liệu thời gian ngắn hạn khác nhau ở đa dạng các lĩnh vực theo những tiêu chí:
o Chất lượng dự báo
o Thời gian đáp ứng
o Tính thích nghi với dữ liệu
1.4 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
Đối tượng: dự báo dữ liệu chuỗi thời gian ngắn ha ̣n với kích thước nhỏ áp dụng
kỹ thuâ ̣t lai ghép ANN-ES3 nhằm dự báo đa dạng các loa ̣i dữ liê ̣u
Phạm vi: chúng tôi nghiên cứu, hiện thực việc lai ghép ANN-ES3 để dự báo
dữ liệu chuỗi thời gian ngắn hạn vớ i đa dạng loại dữ liệu thuộc các lĩnh vực như chứng khoán, sản xuất, thời tiết, thủy văn, dân số, lao động, tài chính, … Nguồn dữ liệu có được từ thư viện dữ liệu chuỗi thời gian của giáo sư R.J.Hyndman tại
1.5 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI
Luận văn này tiến hành hiê ̣n thực việc lai ghép ANN và kỹ thuật làm trơn hàm
mũ bâ ̣c 3 để nâng cao chất lượng dự báo dữ liê ̣u chuỗi thời gian ngắn ha ̣n với đa dạng các loại dữ liệu cho chất lượng cao hơn các mô hình đơn thuần
Thực hiện việc chạy thực nghiệm với nhiều bộ dữ liệu trong thực tế có các tính chất khác nhau, đánh giá và kiểm tra tính đúng đắn của cơ sở lý thuyết và quá trình hiện thực
Trang 241.6 CẤU TRÚC LUÂ ̣N VĂN
Phần còn la ̣i được chúng tôi trình bày theo cấu trúc sau:
- Chương 2: trình bày tổng thuật các công trình liên quan như: các mô hình của Box-Jenkins, các mô hình của Holt-Winters và mô hình ANN
- Chương 3: trình bày cơ sở lý thuyết về: kỹ thuật ES, ANN, mô hình lai ES1 và ý tưởng thực hiện mô hình lai ghép ANN-ES3 dự báo chuỗi thời gian ngắn ha ̣n
ANN Chương 4: trình bày cách hiện thực, kết quả thử nghiệm và đánh giá hiệu suất
của mô hình lai ANN-ES3
- Chương 5: đánh giá kết quả đạt được, các mặt hạn chế, đưa ra hướng phát
triển của đề tài
Trang 25CHƯƠNG 2: TỔNG THUẬT CÁC CÔNG TRÌNH
LIÊN QUAN
Chương này sẽ giới thiệu những phương pháp thông du ̣ng thường dùng để dự
báo dữ liê ̣u chuỗi thời gian ngắn ha ̣n cùng ưu, nhược điểm của chúng, bao gồm: phương pháp của Box-Jenkins, phương pháp làm trơn hàm mũ và ma ̣ng nơ ron nhân
t giá trị của biến số được cho là Y t thì Y t = f (Y t-1 , Y t-2 , , Y0, t) Công thức của mô
hình ARIMA [11] như sau:
2.1.2 Mô hình Seasonal ARIMA
Mô hình Seasonal ARIMA gồm hai yếu tố được kết hợp chặt chẽ: có tính mùa, không có tính mùa Công thức 2.2 là tính toán thu gọn củ a SARIMA [11]
ARIMA (p, d, q)×(P, D, Q)S
(2.2)
Trong đó P, D, Q là các biến số giải thích SARIMA với ý tưởng chính là xem
xét các biến số giải thích tốt nhất để mô hình mẫu có tính mùa Phương trình hồi qui
Trang 26chứa biến số giải thích ở bên phải, trong phân tích hồi qui thường có sự thay đổi của một biến độc lập, biến số giải thích này có chức năng giải thích những thay đổi đó
2.1.3 Ưu điểm cu ̉ a mô hình Box-Jenkins
- Các mô hình do Box-Jenkins đề xuất, cụ thể là ARIMA và SARIMA có tính phổ biến bởi sự chính xác của nó trong công tác dự báo
- Hyndman [11] chỉ ra rằng, mô hình Box-Jenkins có thể phù hợp với dữ liệu đào tạo là khá tốt Có kết quả dự báo với độ chính xác cao trên dãy số liệu mẫu khá lớn
- Do có cả tính tự hồi quy và trung bình trượt nên mô hình Box-Jenkins khá linh đô ̣ng
- Theo Ong và cộng sự [2], mô hình Box-Jenkins trong thực tế có khả năng miêu tả rộng những đặc điểm của chuỗi thời gian thường gặp, nó khá mềm dẻo
2.1.4 Nhươ ̣c điểm của mô hình Box-Jenkins
- Nhược điểm lớn nhất là xác đi ̣nh mô hình khó khăn bởi khó ước lượng bậc của trung bình trượt cũng như tự đô ̣ng hồi quy … Khi sử du ̣ng cần phải “thử và sửa sai”
Nếu nhâ ̣n da ̣ng mô hình sai sẽ ta ̣o ra các giai đoa ̣n sai trong mô hình nhâ ̣n da ̣ng và phải nhâ ̣n da ̣ng la ̣i mô hình Theo R.J.Hyndman và cộng sự [11], mô hình Box-Jenkins cập nhâ ̣t các tham số và đưa thêm dữ liê ̣u vào khá khó khăn Do đó, cần có lượng thời gian và tài nguyên khá tốn kém
- Cũng theo R.J.Hyndman và cộng sự [11], mô hình Box-Jenkins phù hợp với
dữ liệu đào tạo tốt nhưng không chắc là sẽ dự báo tốt, mô hình Box-Jenkins không áp du ̣ng cho cấu trúc dữ liê ̣u phi tuyến, đây là mô ̣t trở nga ̣i lớn
- Mô hình Box-Jenkins theo định kỳ bắt buộc phải được xây dựng lại, mô hình mới hoàn thiện hơn phải được chọn lại trong nhiều trường hợp, tức là cần có nhiều kinh nghiệm
- Khi dữ liệu có tính mùa thì ARIMA không hỗ trợ Khi gặp loại dữ liệu này,
nó cần phải biến đổi hoặc dùng SARIMA thay thế
- Cuối cùng, với dữ liệu chuỗi thời gian ngắn hạn thì mô hình Box-Jenkins chưa thực sự phù hợp vì chúng cần nhiều dữ liệu lịch sử
Trang 272.2 CÔNG TRÌNH CỦA HOLT-WINTERS
2.2.1 Giơ ́ i thiê ̣u mô hình
Mô hình làm trơn kiểu hàm mũ (Exponential Smoothing hay ES) [11] là kỹ thuật dự báo rất hữu hiê ̣u trong nhiều tình huống dự báo được công bố bởi C.C.Holt
lần đầu dùng cho chuỗi thời gian không có tính xu hướng và mùa Sau đó C.C.Holt bổ sung cho mô hình này có khả năng làm việc được với dữ liê ̣u có xu hướng Cuối
cù ng, Winter bổ sung để có thể dự báo cho dữ liê ̣u có tính mùa Do đó phương pháp
này có tên là “Holt-Winters”
Trong mô hình làm trơn hàm mũ, những quan sát cũ hơn được gán tro ̣ng số giảm theo cấp số nhân Tức là, các quan sát càng mới thì giá trị tro ̣ng số được gán càng lớ n so với những quan sát càng cũ
Trong trung bình di ̣ch chuyển các tro ̣ng số gán cho quan sát luôn bằng nhau
và (bằng 1/N, với số mẫu là N) Tuy nhiên, trong kỹ thuâ ̣t làm trơn hàm mũ, có mô ̣t
hoặc nhiều tham số được ước lượng và các tham số này sẽ quyết đi ̣nh giá trị tro ̣ng số
gán cho những quan sát
- Một lợi ích cho cả viê ̣c biểu diễn dữ liê ̣u cũng như dự báo là kỹ thuâ ̣t làm trơn
hàm mũ có khả năng hạn chế tác đô ̣ng của sự biến đổi ngẫu nhiên nếu áp du ̣ng đúng,
vì thế giúp dễ thấy các hiê ̣n tượng cơ bản [8] Kỹ thuật này được go ̣i là “làm trơn” vì khi biểu diễn dữ liê ̣u nó loa ̣i bỏ các răng cưa không bằng phẳng gắn liền với sự thay đổi ngẫu nhiên và để la ̣i mô ̣t đường thẳng hoă ̣c đường cong
- Theo Hyndman [11], về bộ thử nghiệm thì mô hình làm trơn hàm mũ dự báo chính xác hơn ARIMA
- So với các phương pháp dự báo khác, phương pháp này là đơn giản, thực hiê ̣n
dễ, chi phí thấp
Trang 282.2.3 Nhươ ̣c điểm
- Với chuỗi dữ liệu thời gian, kỹ thuâ ̣t làm trơn hàm mũ chỉ nắm bắt được các
đă ̣c điểm tuyến tính [9] trong khi ở thực tế chúng thường xen lẫn tính chất phi tuyến
và xuất hiện những điểm bất thường Bởi thế, mô hình này thường chỉ dùng trong lớp
mô hình tuyến tính
- Khi hằng số làm trơn giảm theo hàm mũ thì mô hình này cho ra một mô hình giản di ̣ thái quá mà chỉ dùng vài giá tri ̣ trước đó để dự báo Vì thế không thể tìm được
các mẫu không tuyến tính trong dữ liê ̣u như đề cập của Lai và cộng sự [9]
- Theo Hyndman [11], về mặt dữ liệu đào tạo thì mô hình kỹ thuật làm trơn hàm
mũ tỏ ra khó khăn để phù hợp hơn ARIMA
- Đối với các nhân tố nhân quả bên ngoài, mô hình làm trơn hàm mũ không thể bao gồ m chúng
Do đó, muốn chất lượng dự báo được nâng cao cho mô hình làm trơn hàm mũ thì cần phải nghiên cứu những phương pháp phi tuyến khác để bổ sung
2.3 MA ̣NG NƠ RON NHÂN TẠO
ANN đặc biệt có ưu thế trong việc nắm bắt các ước lượng phi tuyến [17], vì
vậy người ta thường dùng ANN để hạn chế các yếu điểm của những mô hình làm trơn kiểu hàm mũ và Box-Jenkins Lý thuyết về ANN được trình bày chi tiết ở chương Cơ
sở lý thuyết Sau đây chúng tôi trình bày những ưu điểm và hạn chế của ANN
2.3.1 Ưu điểm
Khả năng của ANN là khái quát hoá hay là khả năng học, ngay cả đối với trường hợp trong quá trình huấn luyện mà đầu vào ANN chưa từng gặp thì nó cũng
có thể cho những đầu ra hợp lý Ưu điểm nổi bật của ANN được thể hiện:
- ANN có tính thích nghi Hoạt động bản chất của ANN là dùng các luật học để điều chỉnh theo diễn biến thời gian các trọng số khớp Do vậy, về nguyên tắc, ANN tạo nên một hệ thống có tính thích nghi
- ANN được biết đến là phương pháp có hiê ̣u suất ổn đi ̣nh, chi phí thấp [15] Nguyên nhân là dự báo bằng những phương pháp truyền thống khác gặp ha ̣n chế là không thể dự báo tất cả các đă ̣c trưng của li ̣ch sử và bản chất hê ̣ thống tính toán
Trang 29- Thông thườ ng những phương pháp thống kê thì dữ liê ̣u tuyến tính sẽ có liên quan trong khi ANN lại kết hợp với dữ liê ̣u phi tuyến, vì vâ ̣y theo Sallehuddin và các cộng sự [13], ANN không phải luôn luôn nhất quán, ho ̣ cũng cho rằng do những đă ̣c trưng về nắm bắt dữ liê ̣u hướng thời gian phi tuyến tốt hơn nên ANN thực hiê ̣n tốt hơn Khi mô hình dữ liê ̣u hướng thời gian phi tuyến không có nhiễu, ANN cung cấp
tính hiê ̣u quả và nhất quán Mô ̣t số nghiên cứu đã so sánh ANN với những cách dự
báo truyền thống, kết quả là ANN luôn luôn thực hiê ̣n tốt hơn và rất ma ̣nh mẽ nếu
tầm dự báo tăng
- Với cấu trúc ánh xạ vào - ra nên ANN có thể điều chỉnh đầu ra sao cho có thể đáp ứng sự mong muốn của đầu ra do ANN dùng triệt để thuật toán học có thầy áp
dụng dùng ánh xạ vào - ra, đồng thời ANN cũng có khả năng dùng luật học không có thầy nghĩa là dùng ánh xạ vào - ra để điều chỉnh đầu ra sao cho trọng số khớp đạt được giá trị ổn định (không biết đầu ra mong muốn)
- Hoạt động củ a ANN có tính thích nghi theo các luật học nên về nguyên tắc có thể điều chỉnh dần các sai sót do đó có thể chấp nhận các lỗi, các thiếu sót trong quá trình học Do đó, ANN có tính kháng lỗi
- ANN phù hợp cho dự báo dữ liệu chuỗi thời gian dài ha ̣n
2.3.2 Nhươ ̣c điểm
- ANN gặp khó khăn trong viê ̣c bị bẫy vào điểm cực trị đi ̣a phương và vấn đề quá khớp (overfitting) [5] Đối với ANN thì viê ̣c quá khớp nhiều hơn các mô hình thống kê khác, bởi các mô hình thống kê khác yêu cầu ước lượng tham số nhiều Do
đó ta nên mở rô ̣ng các tham số cần ước lượng nhằm khắc phục hạn chế quá khớp này
- Đồng thời, do quá trình huấn luyê ̣n ma ̣ng phu ̣ thuô ̣c vào cấu trúc, ngưỡng và
dữ liê ̣u huấn luyê ̣n hiê ̣n ta ̣i nên ANN không có các luâ ̣t cho những kích thước mẫu riêng biệt
- Cuối cùng, mô hình ANN có nhược điểm tương tự như của ARIMA đó là yêu
cầu dữ liệu lịch sử lớn [15] Vì thế, ANN cho đô ̣ chính xác thấp khi dự báo chuỗi dữ liệu thời gian ngắn ha ̣n
Trang 302.4 CÁC CÔNG TRÌNH GẦN ĐÂY
2.4.1 Ti ̀nh hình nghiên cứu dự báo chuỗi dữ liê ̣u thời gian hiê ̣n nay
Đối với dự báo dữ liê ̣u chuỗi thời gian nói chung, gần đây có nhiều phương pháp mới hiê ̣n đa ̣i như ANN, SVM (Support Vector Machine), Fuzzy logic, Deep learning, LSTM (Long Short-Term Memory), [24] Chúng có ưu điểm khi đưa ra
dự báo chính xác cao, tỏ ra thực sự hiê ̣u quả Mặc dù vậy, chúng cũng tồn tại những nhược điểm nằm ở chính những đă ̣c điểm của chúng là thuâ ̣t toán phức ta ̣p, mất thời gian nhiều để thực hiện hay đòi hỏi lượng dữ liê ̣u đầu vào lớn vì thế chỉ khi ứng du ̣ng với tập dữ liê ̣u lớn chúng mới thực sự hiê ̣u, tức là phù hợp một cách đặc biệt với dự
báo dữ liê ̣u chuỗi thời gian dài ha ̣n
Đối với dự báo dữ liê ̣u chuỗi thời gian ngắn ha ̣n nói riêng, có đă ̣c điểm là tâ ̣p
dữ liê ̣u đầu vào không lớn, đôi khi là rất nhỏ, trong thực tế hiê ̣n nay đa số thường dùng những phương pháp truyền thống như: Holt Winter [1,7], AMIRA [12], SAMIRA [10], phương pháp tiên tiến ANN [3,15] hoặc nghiên cứu phát triển những phương pháp này nhằm có kết quả dự báo cao hơn với một loa ̣i dữ liê ̣u cu ̣ thể bởi chúng ít chi phí và tỏ ra hiê ̣u quả trong dự báo với kết quả tương đối chính xác Đồng thời, nhiều nhà nghiên cứu thường dựa trên những đă ̣c điểm của loa ̣i dữ liê ̣u như tính
mù a, xu hướng hay bất thường để từ đó cho ̣n được phương pháp dự báo phù hợp Mặt khác, các nhà nghiên cứu còn tiến hành lai ghép những phương pháp hiện đại với truyền thống, cu ̣ thể là thường lai ghép những phương pháp truyền thống với ANN để nắm bắt triê ̣t để các đă ̣c điểm phi tuyến tính trong chuỗi dữ liê ̣u thời gian [14,16]
2.4.2 Mô ̣t số mô hình riêng lẻ
Một số mô hình ứng du ̣ng những kỹ thuật dự báo truyền thống: Điển hình là Jayalalitha [7] dùng mô hình làm trơn hàm mũ bậc 1 dự báo nhiê ̣t đô ̣ ta ̣i Ấn Đô ̣, Asep Rusyana [1] dùng mô hình làm trơn hàm mũ bậc ba dự báo hành khách của mô ̣t hãng
hàng không tại Indonesia, hay Peng Chen và cộng sự [10] dự báo nhiệt độ tại Nanjing dùng SAMIRA
Một số mô hình ứng du ̣ng dự báo bằng ANN: E.Akarslan cùng cộng sự [3] nghiên cứu dự báo nhu cầu điện lưới vi mô sử du ̣ng ma ̣ng nơron nhân ta ̣o, Ronald
Trang 31Wesonga [12] hiện thực cả ANN và AMIRA để so sánh hiệu quả dự báo tốc đô ̣ gió
tại mô ̣t sân bay quốc tế
Ưu điểm: Các công trình trên dự báo đem la ̣i hiệu suất khá cao với một loại
dữ liê ̣u chuỗi thời gian tuyến tính hoă ̣c phi tuyến tính cu ̣ thể
Hạn chế: Mô hình ARIMA và SAMIRA yêu cầu nhiều dữ liệu đồng thời việc
xác định mô hình khá khó khăn Mô hình ES sẽ bỏ qua 1 số đă ̣c điểm phi tuyến [8], tương tự mô hình ANN cũng không khai thác triê ̣t để nhất được đă ̣c điểm tuyến tính
củ a dữ liê ̣u Đă ̣c biê ̣t, chúng chỉ hiê ̣u quả cho mô ̣t loa ̣i dữ liê ̣u cu ̣ thể Hiện nay, hầu hết các nhà nghiên cứu tìm cách cải tiến các phương pháp truyền thống đồng thời nghiên cứu lai ghép với các phương pháp hiện đại như là một giải pháp nhằm nâng cao hiệu suất dự báo
2.4.3 Mô ̣t số mô hình lai ghép
Gần đây có nhiều công trình lai ghép các phương pháp hiê ̣n đa ̣i và mô hình dự
báo truyền thống đã được đề xuất với mục đích nâng cao hiệu suất dự báo nhưng phổ biến và nổi bật nhất vẫn là mô hình lai ghép ARIMA - ANN và mô hình lai ghép kỹ thuật làm trơn hàm mũ – ANN
Santosha Rathod [14] nghiên cứ u mô hình lai ARIMA-ANN để dự báo giá cà phê Robusta ở Ấn Độ cho hiệu suất tương đối cao vớ i dữ liê ̣u giá cà phê Tuy nhiên
mô hình ARIMA như đã phân tích, có ha ̣n chế là ARIMA hay SAMIRA không thể
làm viê ̣c với dữ liê ̣u có tính mùa, chi phí khá cao, viê ̣c xác đi ̣nh mô hình khá khó khăn và quan tro ̣ng nhất là nó đòi hỏi dữ liệu lịch sử lớn nên chưa thực sự phù hợp đối với dự báo dữ liê ̣u ngắn hạn
Winita Sulandaria và cộng sự [16] dự báo nhu cầu tải điện dùng mô hình hàm
mũ lai ANN Công trình này đề xuất phương pháp lai ghép giữa làm trơn hàm mũ theo cấp số nhân và ANN với 2 lần mùa (double season) kết hợp chuyển đổi BoxCox, sửa lỗi ARMA và hàm lượng giác với thời gian thay đổi dựa trên fourier Phân hủy chuỗi tải thành các cấp độ, xu hướng, thành phần theo mùa và bất thường làm đầu vào dựa trên thuâ ̣t toán hàm lượng giác và chuỗi Fourier Phương pháp này là mới với hiệu suất dự báo tốt đối với dữ liê ̣u tải điê ̣n Tuy nhiên, dùng hàm lượng giác và
Trang 32chuỗi fourier khá phức ta ̣p cho dữ liê ̣u chuỗi thời gian, mặt khác dữ liê ̣u tải điê ̣n có
đă ̣c thù riêng để có thể dùng lượng giác và chuỗi fourier phân hủy Trong thực tế tồn tại những dữ liệu khó phân hủy Do vậy, phương pháp này tương đối khó ứng du ̣ng cho những loại dữ liê ̣u đa da ̣ng
Tóm lại, việc lai ghép ARIMA (SARIMA) với ANN, mô hình làm trơn hàm
mũ với với ANN đều đem la ̣i hiệu suất cao hơn khi những mô hình này hoa ̣t đô ̣ng riêng lẻ ARIMA và SARIMA đều có nhiều khó khăn nhất định, đồng thời yêu cầu
dữ liệu mẫu đủ lớn Những nghiên cứ u này thực hiện trên mô ̣t loa ̣i dữ liê ̣u cu ̣ thể mà chưa áp du ̣ng đa da ̣ng các loa ̣i dữ liê ̣u, chúng tương đối khó khăn khi dự báo đa dạng các loại dữ liệu ngắn ha ̣n
Trang 33CHƯƠNG 3: CƠ SỞ LÝ THUYẾT
Trong chương này chúng tôi sẽ trình bày cơ sở lý thuyết của đề tài, bao gồm
lý thuyết về phương pháp làm trơn kiểu hàm mũ, phương pháp ANN và ý tưởng của
mô hình lai ghép giữa ANN-ES3
3.1 PHƯƠNG PHÁP LÀM TRƠN KIỂU HÀM MŨ
Holt Winter đề xuất phương pháp làm trơn hàm mũ [11] hoa ̣t đô ̣ng dựa trên
các giá tri ̣ quá khứ được xem xét liên tu ̣c, dựa vào trung bình có tro ̣ng số của chuỗi
dữ liê ̣u Khi thời điểm cần dự báo ở càng xa thì trọng số tại đó có giá tri ̣ càng nhỏ
Đây là phương pháp làm trơn tuyến tính, thích hợp với dữ liê ̣u có xu hướng lên hay xuố ng không dự đoán được
Có 3 loại mô hình làm trơn hàm mũ thường được dùng trong các loại dữ liê ̣u thờ i gian khác nhau:
- Loại 1: Làm trơn hàm mũ bậc một (simple exponential smoothing)
- Loại 2: Làm trơn hàm mũ bậc hai (double exponential smoothing)
- Loại 3: Làm trơn hàm mũ bậc ba (triple exponential smoothing)
3.1.1 Mô hi ̀nh làm trơn hàm mũ bậc một (ES1)
Ban đầu, mô hình này [11] được C.C.Holt giới thiệu và áp du ̣ng vào những chuỗi dữ liệu thờ i gian không có tính xu hướng và không có tính mùa Nó liên tu ̣c
sử a la ̣i mô ̣t dự báo dựa vào các kinh nghiê ̣m gần nhất Trung bình (làm trơn) các giá trị quá khứ của chuỗi bằng cách giảm theo cấp số mũ Các quan sát cũ hơn được gán trọng số nhỏ hơn so với các quan sát gần hơn
A t = αY t-1 + (1 – α) A t-1
(3.1)
Dự báo mới = α (quan sát cũ) + (1- α) dự báo cũ
(3.2)
Với: Y t-1: giá tri ̣ thực ở thời điểm t-1
α: là hằng số làm trơn
A t: giá tri ̣ của dự báo ở thời điểm t
A t-1: giá tri ̣ của dự báo trước t mô ̣t thời điểm
Trang 34Phương trình trên có thể viết lại theo một cách khác:
A t = A t-1 + α(Y t-1 – A t-1)
(3.3) Trong công thứ c 3.3, giá tri ̣ dự báo mới được tính bằng giá tri ̣ dự báo cũ cô ̣ng
vớ i α lần đô ̣ sai biê ̣t (error) giữa giá tri ̣ dự báo và giá tri ̣ thực Với giá tri ̣ thực có thể
tính bằng cách lấy giá tri ̣ thực đầu tiên hoă ̣c lấy trung bình n quan sát đầu tiên làm
giá tri ̣ dự báo đầu tiên
Trọng số α, còn go ̣i là hằng số làm trơn, nó biểu diễn tỉ lê ̣ phần trăm của lỗi
dự báo Khi α gần với 0 tức là giá tri ̣ dự báo mới gần bằng với giá tri ̣ dự báo cũ Còn khi α gần với 1 thì giá tri ̣ dự báo mới bằng giá tri ̣ dự báo cũ cô ̣ng với đa ̣i lượng hiê ̣u chỉnh, lúc này đa ̣i lượng hiê ̣u chỉnh Y t-1 –A t-1 mang tính quyết định
Hằng số làm trơn α thường được cho ̣n nhỏ khi ta muốn sự dự báo ổn đi ̣nh và
làm trơn các biến đô ̣ng ngẫu nhiên Ngược la ̣i, dùng α lớn nếu muốn các biến động
ngẫu nhiên mang tính quyết định
Phương pháp này phù hợp để dự báo dữ liệu không có xu hướng rõ ràng hoặc
mô hình theo mùa Hình 3.1 [11] là một ví dụ về dữ liệu không hiển thị xu hướng hoặc thời vụ rõ ràng Hình 3.2 [11] là một dự báo đối với dữ liệu không có thời vụ và
xu hướng rõ ràng bằng phương pháp ES1 với đường màu đỏ là kết quả dự báo
Hi ̀nh 3.1: Một chuỗi dữ liê ̣u thời gian không có thời vụ và xu hướng rõ ràng
Trang 35Hi ̀nh 3.2: Một dự báo bằng phương pháp ES1
3.1.2 Mô hi ̀nh làm trơn hàm mũ bâ ̣c hai (ES2)
Khi dữ liê ̣u có xu hướng và chứa thông tin tham gia vào di ̣ch chuyển hướng lên cao trong tương lai Với loại dữ liê ̣u này thì cần mô ̣t hàm dự báo xu hướng (trend) tuyến tính
Năm 1958, C.C.Holt [8] tiếp tu ̣c đưa ra mô hình go ̣i là phương pháp làm trơn
hàm mũ bâ ̣c hai có khả năng dự báo dữ liê ̣u có xu hướng, tức là cần phải ước lượng
đô ̣ dốc hiê ̣n ta ̣i và biên đô ̣ hiê ̣n ta ̣i bằng cách dùng hai hê ̣ số:
- α: hằng số làm trơn cho biên đô ̣
- β: hằng số làm trơn cho xu hướng
Phương pháp này có ưu điểm ở sự linh hoa ̣t khi cho ̣n tỉ lê ̣ theo dõi biên đô ̣ và
xu hướng Với giả thiết xu hướng là đường thẳng đi lên hoă ̣c đi xuống, có ba phương trình trong phương pháp này:
- Phương trình thứ nhất ước lượng biên đô ̣ của hiê ̣n ta ̣i:
Trang 36Vớ i: là hằng số làm trơn cho biên đô ̣
là hằng số làm trơn để ước lượng xu hướng
A t là giá tri ̣ làm trơn mới (ước lượng của mức hiê ̣n ta ̣i)
Y t là giá tri ̣ thực tế mới ta ̣i thời điểm t
T t là ước lượng xu hướng
Y’ t+p: là dự báo cho p điểm trong tương lai
Khi thực hiê ̣n, cần khởi ta ̣o giá tri ̣ cho A1 = Y1, T1 = 0 hoặc lấy trung bình vài giá tri ̣ thực đầu tiên (thường là 6) làm giá tri ̣ khởi ta ̣o cho A1 và lấy xấp xỉ bằng đô ̣
dốc của đường thẳng xấp xỉ vài quan sát để làm giá tri ̣ khởi ta ̣o cho T1
Phương pháp ES2 phù hợp với dự báo dữ liệu có xu hướng rõ ràng Hình 3.3 [11] là một ví dụ về dữ liệu có tính xu hướng và hình 3.4 [11] là một dự báo đối với
dữ liệu có tính xu hướng bằng phương pháp ES2
Hi ̀nh 3.3: Một ví dụ về dữ liệu có tính xu hướng
Hi ̀nh 3.4: Một dự báo bằng phương pháp ES2
Trang 373.1.3 Mô hi ̀nh làm trơn hàm mũ bâ ̣c ba (ES3)
Phương pháp ES3 còn có tên là “Holt-Winters Method” vì vào năm 1965, Winter mở rô ̣ng phương pháp của Holt nhằm ước lượng được tính mùa [8] Khi dữ liệu có tính mùa và tính xu hướng, phương pháp ES3 được ứng du ̣ng Trong phương pháp ES3 (mô hình nhân) dùng bốn phương trình chính:
- Phương trình 1 dùng ước lượng biên đô ̣ (level):
Yt: giá tri ̣ thực tế ta ̣i thời điểm t
Tt: ước lượng xu hướng
St: ước lượng tính mùa
Y’ t+p: là giá tri ̣ dự báo cho p chu kỳ trong tương lai
α: là hằng số làm trơn biên đô ̣
β: hằng số làm trơn xu hướng
γ: hằng số làm trơn cho tính mùa
p: số bước muốn dự báo trong tương lai
s: chiều dài của tính mùa
Trong công thứ c này, sự dự báo được điều chỉnh bằng cách nhân với chỉ số
mù a Đây là mô ̣t kỹ thuâ ̣t giúp loa ̣i bỏ ảnh hưởng của tính mùa
Trang 38Ba tham số α, β, γ đóng vai trò điều khiển viê ̣c làm trơn, α, β, γ tương ứng với
ước lượng biên đô ̣, đô ̣ dốc của thành phần xu hướng và thành phần mùa ta ̣i thời điểm
xét Các tham số α, β, γ có giá tri ̣ nằm từ khoảng 0 đến 1, khi giá tri ̣ càng gần 0 có
nghĩa là càng có ít tro ̣ng số được đă ̣t trên các quan sát gần nhất khi đưa ra dự báo các giá tri ̣ tương lai Nếu hệ số γ bằng 0, tức là thành phần mùa không còn tồn tại trong
dữ liệu, lú c này phương pháp trên trở thành kĩ thuật làm trơn theo hàm mũ bâ ̣c hai
Nếu hệ số β cũng bằng 0, phương pháp này trở thành kĩ thuật làm trơn theo hàm mũ
bậc một Như vậy, đây chính là kĩ thuật tổng quát nhất của các kĩ thuật làm trơn hàm
mũ
Khi dữ liê ̣u có tính mùa, phương pháp ES3 có thể biểu diễn dữ liê ̣u tốt hơn và giảm lỗi dự báo xuống thấp hơn mô hình ES1 và ES2 Do đó, trong luận văn này chú ng tôi dùng mô hình ES3 để dự báo dữ liê ̣u chuỗi thời gian ngắn ha ̣n
3.1.4 Mô hi ̀nh cô ̣ng và mô hình nhân
bản chuỗi thời gian có các giá tri ̣ nằm trong mô ̣t dải giá tri ̣ có đô ̣ rô ̣ng là mô ̣t hằng số
và đường xu thế nằm ở trung tâm của dải này
Trang 39Tính mùa được thể hiê ̣n như tỷ lê ̣ phần trăm của số ước lượng trung bình (hay
xu hướng) Sau đó nó được dùng để nhân giá tri ̣ của chuỗi để hợp nhất tính mùa Mô
hình nhân hoa ̣t đô ̣ng tốt nhất khi chuỗi thời gian có sự biến thiên tăng cùng với biên
đô ̣ Có nghĩa rằng những giá tri ̣ của chuỗi trải rô ̣ng ra khi xu thế tăng dần và tâ ̣p hợp
các quan sát có da ̣ng hình cái loa hay hình phễu Nói một cách khác, là khi xu hướng tăng thì chuỗi sẽ có giá tri ̣ lớn hơn Một dự báo dùng đồng thời mô hình cô ̣ng và mô
hình nhân cùng có xu hướng tuyến tính như ví dụ trong hình 3.5 [11] với đường màu
đỏ là dự báo của mô hình cộng và đường màu xanh là dự báo của mô hình nhân
Hi ̀nh 3.5: Một dự báo bằng mô hình cộng và mô hình nhân
Do mô hình nhân có khuynh hướng đa ̣i diê ̣n cho kinh nghiê ̣m thực tế nên mô
hình nhân thường được ứng dụng phổ biến hơn mô hình cô ̣ng trong thực tế
Trang 403.2 MÔ HÌNH MẠNG NƠ RON NHÂN TẠO
Mạng nơ ron nhân ta ̣o (Artificial Neural Network - ANN) là một tập hợp có tổ chức những nơ ron (phần tử xử lý đơn giản) Đây là hệ thống rất lớn và phức ta ̣p, thực hiện viê ̣c xử lí thông tin, mô phỏng chức năng, cách thức hoạt động và sự nối kết giữa các nơron sinh học Viê ̣c trao đổi thông tin, thực hiện tính toán và xuất kết quả dựa
vào sự kết nối giữa cá nơ ron với nhau Mô ̣t ANN được mô tả trong hình 3.6 [17]
Mạng nơ ron có thể giải quyết và thực hiện những bài toán có độ phức tạp và yêu cầu có độ chính xác cao như nhận dạng, điều khiển tự động, khai phá dữ liệu, … mạng nơ ron hiện nay được ứ ng du ̣ng rất rộng rãi trên nhiều lĩnh vực như quân sự, kinh tế, điện tử, công nghiệp, …
Hi ̀nh 3.6: Minh họa một ANN
3.2.1 Cấu tru ́ c tổng quát của mô ̣t ANN
- Nốt (nơron, unit, node): Mỗi nố t có tính chất vào – ra, có chức năng thực hiê ̣n mô ̣t tính toán cu ̣c bô ̣ (mô ̣t hàm cu ̣c bô ̣) Nốt thành phần cơ bản của mạng nơron
- Tầng (layer, lớp): một tập hợp nhiều nơ ron tạo thành một tầng ANN có kiến trúc chung
gồm ba thành phần là tầng ra (output layer), tầng ẩn (hidden layer) và tầng vào (input layer) Hình 3.7 [17] mô tả kiến trúc cụ thể của mô ̣t ANN
Hi ̀nh 3.7: Mô tả kiến trúc ANN