1. Trang chủ
  2. » Luận Văn - Báo Cáo

phát triển mô hình dự báo dữ liệu chuỗi thời gian ngắn hạn

153 22 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 153
Dung lượng 6,25 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Tuy nhiên, nhiều nghiên cứu chỉ ra rằng đối với dữ liệu có tính xu hướng và tính mùa thì chất lượng dự báo của phương pháp mạng nơ ron nhân tạo không cao.. Tương tự, đối với dữ liệu có t

Trang 1

PHA ̣M NGỌC CẢNH

PHÁT TRIỂN MÔ HÌNH DỰ BÁO

DỮ LIỆU CHUỖI THỜI GIAN

NGẮN HẠN LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

TP Hồ Chi ́ Minh, Năm 2019

Trang 2

PHA ̣M NGỌC CẢNH

PHÁT TRIỂN MÔ HÌNH DỰ BÁO

DỮ LIỆU CHUỖI THỜI GIAN

NGẮN HẠN

Chuyên nga ̀nh : Khoa ho ̣c máy tính

Ma ̃ số chuyên ngành : 60 48 01 01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Người hướng dẫn khoa ho ̣c:

TS Pha ̣m Văn Chung

TP Hồ Chi ́ Minh, Năm 2019

Trang 3

LỜI CAM ĐOAN

Tôi cam đoan rằng luận văn “PHÁT TRIỂN MÔ HÌNH DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN NGẮN HẠN” là công trình nghiên cứu của chính tôi Ngoại trừ những tài liệu tham khảo được trích dẫn trong luận văn này, tôi cam đoan rằng toàn phần hay những phần nhỏ của luận văn này chưa từng được công bố hoặc được sử dụng để nhận bằng cấp ở những nơi khác

Không có sản phẩm/nghiên cứu nào của người khác được sử dụng trong luận văn này mà không được trích dẫn theo đúng quy định

Luận văn này chưa bao giờ được nộp để nhận bất kỳ bằng cấp nào tại các trường đại học hoặc cơ sở đào tạo khác

Người thực hiện đề tài

Pha ̣m Ngo ̣c Cảnh

Trang 4

LỜI CẢM ƠN

quý báu cho tôi trong suốt quá trình nghiên cứu thực hiện luâ ̣n văn này

hôm nay, tôi luôn nhớ đến công lao giảng dạy và hướng dẫn của quí thầy, cô trường Đại học Mở TP HCM, đặc biệt là quí thầy, cô trong khoa Sau đa ̣i ho ̣c và khoa Công nghệ thông tin

Mặc dù đã cố gắng rất nhiều trong quá trình thực hiê ̣n luâ ̣n văn, song với giới hạn thờ i gian và sự ha ̣n chế của khả năng bản thân nên không thể không có những

quí thầy cô giáo và các bạn học viên

Người thực hiện đề tài

Pha ̣m Ngo ̣c Cảnh

Trang 5

Tuy nhiên, nhiều nghiên cứu chỉ ra rằng đối với dữ liệu có tính xu hướng và tính mùa thì chất lượng dự báo của phương pháp mạng nơ ron nhân tạo không cao Tương tự, đối với dữ liệu có tính phi tuyến chất lượng dự báo của phương pháp làm trơn hàm mũ không tốt

Trong luận văn này, với ý tưởng tận dụng khả năng xấp xỉ hàm phi tuyến của mạng nơ ron nhân tạo (ANN) và khả năng xấp xỉ tốt thành phần mùa và xu hướng của phương pháp làm trơn hàm mũ bậc 3 (ES3), chúng tôi đề xuất mô hình dự báo

dữ liê ̣u chuỗi thời gian ngắn ha ̣n bằng cách xây dựng và hiện thực mô hình lai ghép giữa mạng nơ ron nhân tạo với kỹ thuật làm trơn hàm mũ bậc 3 (ANN-ES3) Mô hình

đề xuất có khả năng dự báo đa dạng các loại dữ liệu và cho kết quả dự báo tốt hơn Đồng thời, chúng tôi cũng hiện thực ba phương pháp dự báo: ANN, ES3 và lai ghép ANN với kỹ thuật làm trơn hàm mũ bậc 1 (ANN-ES1) để so sánh với phương pháp

đề xuất

Tiến hành thực nghiệm dự báo với dữ liệu ngắn hạn thực tế, mô hình lai ghép ANN-ES3 do chúng tôi đề xuất cho chất lượng dự báo tốt hơn so với ba mô hình còn lại (ANN, ES3, and hybrid ANN-ES1)

Trang 6

ABSTRACT

Currently, time series data forecasting gets much attention from the scientists Many forecasting methods have been proposed, however, most of them are applied to specific data and each method has its own advantages and disadvantages Among them, the popular are two forecasting methods: based on exponential smoothing technique because it does not require large input data and based on artificial neuron network because it is able to capture non-linearity of input data

However, many studies show that for trend and seasonal data, the quality of the artificial neuron network is not high Similarly, for non-linear data, the quality of the exponential smoothing technique is not good

In this thesis, with the idea of utilizing the nonlinear approximation capability

of the artificial neural network (ANN) and the ability to approximate the seasonal and trend component of the triple exponential smoothing method (ES3), we proposed a new model to forecast short-term time series data by developing and implementing hybrid model between artificial neural network and triple exponential smoothing method (ANN-ES3) This hybrid model is able to forecast various types of data and gives better forecasting results We also implement three forecasting methods: ANN, ES3 and hybrid model between ANN and single exponential smoothing (ANN-ES1)

to compare with the proposed method

Through the forecast experiment with actual short-term time series data, the proposed hybrid method (ANN-ES3) give better forecasting results than the other three models (ANN, ES3, and hybrid ANN-ES1)

Trang 7

MU ̣C LỤC

LỜI CAM ĐOAN i

LỜI CẢM ƠN ii

TÓM TẮT iii

MỤC LỤC v

DANH MỤC HÌNH viii

DANH MỤC BẢNG x

DANH MỤC TỪ VIẾT TẮT xi

CHƯƠNG 1: GIỚI THIỆU 1

1.1 CƠ SỞ HÌNH THÀNH LUẬN VĂN 1

1.1.1 Đi ̣nh nghĩa chuỗi dữ liê ̣u thời gian 1

1.1.2 Các thành phần của dữ liê ̣u chuỗi thời gian 1

1.1.3 Phân tích dữ liê ̣u chuỗi thời gian và ứng dụng 3

1.1.4 Tầm quan tro ̣ng và ứng du ̣ng của dự báo dữ liê ̣u chuỗi thời gian 4

1.1.5 Các phương pháp dự báo dữ liê ̣u chuỗi thời gian 5

1.2 TÍNH CẤP THIẾT CỦA ĐỀ TÀI 5

1.3 MỤC TIÊU NGHIÊN CỨU 8

1.3.1 Mục tiêu nghiên cứu tổng quát 8

1.3.2 Mục tiêu nghiên cứu cu ̣ thể 8

1.4 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU 9

1.5 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI 9

1.6 CẤU TRÚC LUẬN VĂN 10

CHƯƠNG 2: TỔNG THUẬT CÁC CÔNG TRÌNH LIÊN QUAN 11

2.1 CÔNG TRÌNH CỦA BOX VÀ JENKINS 11

2.1.1 Mô hình ARIMA 11

2.1.2 Mô hình Seasonal ARIMA 11

2.1.3 Ưu điểm của mô hình Box-Jenkins 12

2.1.4 Nhược điểm của mô hình Box-Jenkins 12

2.2 CÔNG TRÌNH CỦA HOLT-WINTERS 13

Trang 8

2.2.1 Giớ i thiê ̣u mô hình 13

2.2.2 Ưu điểm 13

2.2.3 Nhược điểm 14

2.3 MẠNG NƠ RON NHÂN TẠO 14

2.3.1 Ưu điểm 14

2.3.2 Nhược điểm 15

2.4 CÁC CÔNG TRÌNH GẦN ĐÂY 16

2.4.1 Tình hình nghiên cứu dự báo chuỗi dữ liê ̣u thời gian hiê ̣n nay 16

2.4.3 Một số mô hình lai ghép 17

CHƯƠNG 3: CƠ SỞ LÝ THUYẾT 19

3.1 PHƯƠNG PHÁP LÀM TRƠN KIỂU HÀM MŨ 19

3.1.1 Mô hình làm trơn hàm mũ bậc một (ES1) 19

3.1.2 Mô hình làm trơn hàm mũ bâ ̣c hai (ES2) 21

3.1.3 Mô hình làm trơn hàm mũ bâ ̣c ba (ES3) 23

3.1.4 Mô hình cô ̣ng và mô hình nhân 24

3.2 MÔ HÌNH MẠNG NƠ RON NHÂN TẠO 26

3.2.1 Cấu trúc tổng quát của mô ̣t ANN 26

3.2.2 Qui trình xử lý thông tin của một ANN 27

3.2.3 Quá trình ho ̣c của ANN 29

3.2.4 Nguyên tắc hoa ̣t đô ̣ng và các giải thuâ ̣t huấn luyê ̣n ma ̣ng nơ ron 30

3.3 HƯỚNG TIẾP CẬN MÔ HÌNH LAI GHÉP 41

3.3.1 Lý do cho ̣n kỹ thuâ ̣t làm trơn hàm mũ để bổ sung cho ANN trong dự báo dữ liê ̣u chuỗi thời gian ngắn ha ̣n 41

3.3.2 Sử du ̣ng phần mềm R để ước lượng các tham số cho mô hình ES3 41

3.3.3 Thực hiê ̣n mô hình lai ghép ANN-ES3 42

CHƯƠNG 4: HIỆN THỰC VÀ THỬ NGHIỆM 45

4.1 HIỆN THỰC 45

4.1.1 Mô đun ANN 45

4.1.2 Mô đun làm trơn hàm mũ 47

4.1.3 Mô đun lai ghép 49

4.2 DỮ LIỆU THỬ NGHIỆM 50

Trang 9

4.3 KẾT QUẢ THỬ NGHIỆM VÀ ĐÁNH GIÁ 52

4.3.1 Bộ dữ liệu 1: Sản xuất sắt cơ bản hàng tháng tại Úc 54

4.3.2 Bộ dữ liệu 2: Số liệu tài chính M2 hàng tháng tại Mỹ 56

4.3.3 Bộ dữ liệu 3: Lượng tiêu thụ Chocolate hàng tháng tại Úc 58

4.3.4 Bộ dữ liệu 4: Nhiệt độ cao nhất hàng tháng tại Paris, Pháp 60

4.3.5 Bộ dữ liệu 5: Số liệu đóng cửa của chỉ số công nghiệp Dow-Jones 62

4.3.6 Bộ dữ liệu 6: Số nữ thất nghiệp hàng tháng tại Mỹ 64

4.3.7 Bộ dữ liệu 7: Doanh số xi măng hàng quý tại Úc 66

4.3.8 Bộ dữ liệu 8: Mực nước hàng tháng của hồ Erie 68

4.3.9 Bộ dữ liệu 9: Sản lượng điện hàng quý tại Úc 70

4.3.10 Bộ dữ liệu 10: Số lượng người di cư hàng tháng tại Úc 72

4.4 TỔNG HỢP, ĐÁNH GIÁ VÀ NHẬN XÉT CHUNG 73

CHƯƠNG 5: KẾT LUẬN 77

5.1 Những công việc đã thực hiện được 77

5.2 Kết quả đạt được 78

5.3 Mặt ha ̣n chế 78

5.4 Hướng phát triển của luâ ̣n văn 78

TÀI LIỆU THAM KHẢO 80

PHỤ LỤC 82

PHỤ LỤC A 82

PHỤ LỤC B 84

PHỤ LỤC C 95

PHỤ LỤC D 105

Trang 10

DANH MU ̣C HÌNH

Hình 1.1: Hình ảnh một chuỗi thời gian 1

Hình 1.2: Mô ta ̉ thành phần xu hướng tiến lên 2

Hình 1.3: Mô ta ̉ thành phần mùa 2

Hình 1.4: Mô ta ̉ thành phần chu kỳ 3

Hình 1.5: Vi ́ dụ dự báo dữ liệu chuỗi thời gian 4

Hình 1.6: Một chuỗi dữ liệu thời gian tuyến tính 6

Hình 1.7: Một chuỗi dữ liệu thời gian phi tuyến tính 6

Hi ̀nh 3.1: Một chuỗi dữ liê ̣u thời gian không có thời vụ và xu hướng rõ ràng 20 Hi ̀nh 3.2: Một dự báo bằng phương pháp ES1 21

Hi ̀nh 3.3: Một ví dụ về dữ liệu có tính mùa 22

Hi ̀nh 3.4: Một dự báo bằng phương pháp ES2 22

Hi ̀nh 3.5: Một dự báo bằng mô hình cộng và mô hình nhân 25

Hi ̀nh 3.6: Minh họa một ANN 26

Hi ̀nh 3.7: Mô tả kiến trúc ANN 26

Hi ̀nh 3.8: Mô tả qui trình xử lý thông tin của một ANN 27

Hi ̀nh 3.9: Mô tả về hàm truyền 28

Hi ̀nh 3.10: Mô tả các kiểu kiến trúc ANN 29

Hi ̀nh 3.11: Mô tả một perceptron 30

Hi ̀nh 3.12: Mô tả về giải thuật lan truyền ngược 35

Hi ̀nh 3.13: Mã giả cho giải thuật RPROP 39

Hi ̀nh 3.14: Mô hình dự báo lai ghép 42

Hi ̀nh 4.1: Các mô đun của mô hình lai ghép 45

Hi ̀nh 4.2: Giao diện mô đun ANN 46

Hi ̀nh 4.3: Giao diện mô đun làm trơn hàm mũ 48

Hi ̀nh 4.4: Giao diện mô đun lai ghép 49

Hi ̀nh 4.5: Bộ dữ liệu 1 – Sản xuất sắt cơ bản hàng tháng tại Úc 54

Hi ̀nh 4.6: Sai số dự báo của 4 mô hình cho bộ dữ liệu 1 54

Trang 11

Hi ̀nh 4.7: Bộ dữ liệu 2 – Số liệu tài chính M2 hàng tháng tại Mỹ 56

Hi ̀nh 4.8: Sai số kết quả dự báo của 4 mô hình cho bộ dữ liệu 2 56

Hi ̀nh 4.9: Bộ dữ liệu 3 – Lượng tiêu thụ Chocolate hàng tháng tại Úc 58

Hi ̀nh 4.10: Sai số dự báo của 4 mô hình cho bộ dữ liệu 3 58

Hi ̀nh 4.11: Bộ dữ liệu 4 – Nhiệt độ cao nhất hàng tháng tại Paris 60

Hi ̀nh 4.12: Sai số dự báo của 4 mô hình cho bộ dữ liệu 4 60

Hi ̀nh 4.13: Bộ dữ liệu 5 – Số liệu đóng cửa chỉ số Dow-Jones 62

Hi ̀nh 4.14: Sai số dự báo của 4 mô hình cho bộ dữ liệu 5 62

Hi ̀nh 4.15: Bộ dữ liệu 6 – Số người nữ thất nghiệp hàng tháng tại Mỹ 64

Hi ̀nh 4.16: Sai số dự báo của 4 mô hình cho bộ dữ liệu 6 64

Hi ̀nh 4.17: Bộ dữ liệu 7 – Doanh số xi măng hàng quý tại Úc 66

Hi ̀nh 4.18: Sai số dự báo của 4 mô hình cho bộ dữ liệu 7 66

Hi ̀nh 4.19: Bộ dữ liệu 8 – Mực nước trung bình hàng tháng của hồ Erie 68

Hi ̀nh 4.20: Sai số dự báo của 4 mô hình cho bộ dữ liệu 8 68

Hi ̀nh 4.21: Bộ dữ liệu 9 – Sản lượng điện hàng quý tại Úc 70

Hi ̀nh 4.22: Sai số dự báo của 4 mô hình cho bộ dữ liệu 9 70

Hi ̀nh 4.23: Bộ dữ liệu 10 – Số lượng người di cư hàng tháng tại Úc 72

Hi ̀nh 4.24: Sai số dự báo của 4 mô hình cho bộ dữ liệu 10 72

Hi ̀nh 4.25: Biểu đồ so sánh độ chính xác dự báo 75

Trang 12

DANH MU ̣C BẢNG

Ba ̉ng 4.1: Bảng mô tả 10 bộ dữ liệu thử nghiệm 52

Ba ̉ng 4.2: Cấu hình tốt nhất ứng với các mô hình cho bộ dữ liệu 1 55

Ba ̉ng 4.3: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 2 57

Ba ̉ng 4.4: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 3 59

Ba ̉ng 4.5: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 4 61

Ba ̉ng 4.6: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 5 63

Ba ̉ng 4.7: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 6 65

Ba ̉ng 4.8: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 7 67

Ba ̉ng 4.9: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 8 69

Ba ̉ng 4.10: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 9 71

Ba ̉ng 4.11: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 10 73

Ba ̉ng 4.12: Bảng so sánh sai số dự báo MAPE của 4 mô hình trên 10 bộ dữ liệu thư ̉ nghiê ̣m 74

Ba ̉ng 4.13: Bảng so sánh thời gian chạy và độ chính xác dự báo trung bình cu ̉a bốn mô hình 75

Trang 13

DANH MỤC TỪ VIẾT TẮT

ANN Atifical Neural Network Mạng nơron nhân ta ̣o

ANN-ES1 Atifical Neural Network - Simple

Exponential Smoothing

Lai ghép ma ̣ng nơ ron và

làm trơn hàm mũ bâ ̣c I ANN-ES3 Atifical Neural Network - Triple

Exponential Smoothing

Lai ghép ma ̣ng nơ ron và

làm trơn hàm mũ bâ ̣c III

ARMA Autoregressive Moving Average Mô hình tự hồi quy trung

bình trượt ARIMA Autoregression Integrated Moving

Average

Mô hình tự hồi quy tích

hợp trung bình trượt

ES Exponential Smoothing Làm trơn hàm mũ

ES1 Simple Exponential Smoothing Làm trơn hàm mũ bậc 1 ES2 Double Exponential Smoothing Làm trơn hàm mũ bậc 2

ES3 Triple Exponential Smoothing Làm trơn hàm mũ bậc 3,

còn gọi là là Holt-Winter

MA Moving Average Mô hình trung bình trượt

PE Processing Elements Những thành phần xử lý

SARIMA Seasonal Autoregression Integrated

Moving Average

Mô hình tự hồi quy trung bình trượt có tính mùa

Trang 15

CHƯƠNG 1: GIỚI THIỆU

1.1 CƠ SỞ HÌNH THÀNH LUẬN VĂN

1.1.1 Đi ̣nh nghi ̃a chuỗi dữ liê ̣u thời gian

Một tâ ̣p hợp các quan sát theo trình tự thời gian được gọi là dữ liê ̣u chuỗi thời gian [19] Ví du ̣ một chuỗi dữ liê ̣u thời gian được minh họa như hình 1.1 [19], trong hình này trục hoành là những khoảng thời gian đều nhau, trục tung là những giá trị

đo được theo thời gian liên tiếp đều nhau đó, gọi chúng là đại lượng X

Hình 1.1: Hình ảnh một chuỗi thời gian

Các mô hình chuỗi thời gian thường dùng trong việc dự báo hiện nay gồm có:

- Các mô hình hồi quy

- Các mô hình xác suất

- Các mô hình tất đi ̣nh

1.1.2 Ca ́ c thành phần của dữ liê ̣u chuỗi thời gian

Trong thực tế, một chuỗi thời gian rất đa dạng Tuy vậy, có thể có các thành phần chính như sau:

- Thành phần xu hướng dài hạn (long – term trend component): để đại diện cho

yếu tố xu hướng, nó thể hiện trong thời gian dài thì đại lượng X có thể có sự giảm hoặc tăng Có thể biểu diễn trên đồ thị thành phần này như là một đường cong trơn hoặc một đường thẳng Đây thường là kết quả của các yếu tố dài ha ̣n, ví dụ như yếu tố thay đổi về nhân khẩu, công nghê ̣, du lịch hay sở thích giải trí và tiêu

Trang 16

dùng Hình 1.2 [25] là một ví dụ biểu diễn về một chuỗi thời gian với xu hướng

có tính tiến lên

Hình 1.2: Mô ta ̉ thành phần xu hướng tiến lên

- Thành phần mùa (seasonal component): đặc trưng cho xu hướng giảm hoặc tăng đối với đại lượng X vào một giai đoạn thời gian cụ thể Tính mùa vụ xảy ra khi tồn tại một loạt ảnh hưởng của yếu tố mùa vụ (các quí của năm, các tháng hay các ngày trong tuần) Tính mùa vụ luôn xảy ra trong một khoảng thời gian cố định và mang tính tuần hoàn

Ví dụ:

 Lượng điện tiêu thụ thường tăng trong mùa hè và thường giảm ở mùa xuân hoặc lượng nước tiêu dùng thường giảm ở mùa đông và tăng ở mùa hè

 Lượng vật liệu xây dựng tiêu thụ thường tăng trong đầu mùa khô

Một ví du ̣ về thành phần mùa (theo các mùa trong năm) có thể được biểu diễn

ở hình 1.3 [25] Tính biến đô ̣ng có thể theo ngày, theo tuần hay theo giờ mà không phải chỉ với các mùa trong năm

Hình 1.3: Mô ta ̉ thành phần mùa

Trang 17

- Thành phần chu kỳ (cyclical component): mô tả đại lượng X thay đổi theo chu kỳ nào đó Tính chu kỳ tồn tại khi có sự tăng lên hay giảm xuống, lặp lại trong một giai đoạn Tuy nhiên, giai đoạn này là không cố định Hình 1.4 [25] mô tả một ví du ̣ về thành phần chu kỳ trong chuỗi thời gian cụ thể

Hình 1.4: Mô ta ̉ thành phần chu kỳ

- Thành phần bất thường (irregular component): Trong chuỗi thời gian có những

giá trị biến đổi bất thường, đây là thành phần đại diện cho sự biến đổi của những giá trị đó Tính chu kỳ trong thành phần này không có Các số liệu ở quá khứ

không có khả năng dự đoán sự biến đổi của những giá trị bất thường này

1.1.3 Phân ti ́ch dữ liê ̣u chuỗi thời gian và ứng dụng

Khi phân tích dữ liệu chuỗi thời gian có thể giúp xử lý được khá nhiều lớp bài toán ở thực tế, một số bài toán chính như: tìm kiếm tương tự (similarity search), gom cụm (clustering), phân loại (classification), tìm quy luật của dữ liệu (rule discovery), phát hiện điểm bất thường (anomaly detection), tìm mẫu lặp (finding motif), dự báo

dữ liệu (prediction) trong tương lai Vì thế dữ liệu chuỗi thời gian hiện nay được ứng dụng phổ biến, rộng rãi, đa dạng ở nhiều ngành nghề và lĩnh vực, ví dụ:

- Ứng dụng nhận dạng kiểu tăng trưởng giống nhau của nhiều công ty từ đó có quyết định hoặc định hướng và đầu tư hợp lý

- Ứng dụng nhận dạng chữ viết tay: việc biểu diễn chữ viết, so sánh những đặc điểm tương tự của hai hoặc nhiều chữ viết (ở dạng chuỗi dữ liệu) để tìm ra chữ viết có phải của một người hay không hiện nay được ứng dụng một cách phổ biến và rộng rãi

Trang 18

- Ứng dụng vào thị trường chứng khoán với việc xác định sự biến động, thay đổi giá trị cổ phiếu

- Phân tích, dự đoán lạm phát trong một quốc gia

Trong luận văn này, chúng tôi nghiên cứu về bài toán dự báo trên chuỗi thời gian ngắn hạn

1.1.4 Tầm quan tro ̣ng và ứng du ̣ng của dự báo dữ liê ̣u chuỗi thời gian

Dự báo dữ liệu chuỗi thời gian (time series forecasting) là việc dự đoán những

giá trị tương lai sao cho những giá trị dự đoán này đạt được độ chính xác càng cao

càng tốt Cụ thể, bài toán này sử dụng chuỗi giá trị trong quá khứ và hiện tại x t-n ,…

x t-2 , x t-1 , xt để tìm ra các liên kết, các mẫu, các quy luật biến đổi nhằm dự đoán những

giá trị trong tương lai x t+1 , x t+2 Hình 1.5 [11] là một ví dụ về biểu diễn dự báo bằng

đồ thị, với đường màu đỏ là giá trị dự báo

Hình 1.5: Vi ́ dụ dự báo dữ liệu chuỗi thời gian

Việc dự báo dữ liệu chuỗi thời gian có nhiều ứng dụng phổ biến như:

- Ứng dụng dự đoán những sự việc không mong muốn hay không tránh khỏi nhằm hạn chế ảnh hưởng của nó Ví dụ, dự báo sắp có động đất để có định hướng, biện pháp hay quyết định phù hợp hợp nhằm hạn chế hậu quả

- Ứng dụng dự đoán những sự việc không mong muốn nhằm ngăn cản chúng xảy ra bằng cách dự đoán sự kiện rồi có các biện pháp hợp lý Ví dụ, dự báo

Trang 19

chỉ số lạm phát của một quốc gia, căn cứ vào đó chính quyền có các quyết sách, giải pháp hợp lý nhằm ngăn cản chỉ số này vượt quá mức cho phép

- Ứng dụng dự báo những biến động của thị trường, dự đoán giá cả cổ phiếu hay giá trị chứng khoán trên thị trường, dựa vào đó nhằm thu được lợi nhuận

1.1.5 Ca ́ c phương pháp dự báo dữ liê ̣u chuỗi thời gian

Căn cứ theo kỹ thuật dự báo, Sallehuddin và cộng sự (2009) [12] chia những phương pháp dự báo thành hai loa ̣i: thống kê và trí tuê ̣ nhân ta ̣o (statistical and artificial intelligence) như sau:

- Thống kê gồm có: mô hình làm trơn hàm mũ (exponential smoothing), mô hình hồi quy đa biến (multivariate regression), đa hồi quy (multiple regression)

và mô hình ARIMA

- Trí tuê ̣ nhân ta ̣o bao gồm: logic mờ (fuzzy logic), giải thuâ ̣t di truyền, ma ̣ng

nơ ron và ho ̣c máy

Khi dự báo dùng phương pháp nào cần căn cứ vào những tính chất cụ thể của từng loại dữ liệu Khi gặp chuỗi dữ liệu thời gian có ít tính chất có thể dùng một trong những phương pháp đơn lẻ như đã trình bày ở phần trên Tuy vậy, thực tế đã chứng minh rằng ngay trong một chuỗi dữ liệu thời gian rất đa dạng và thường tồn tại nhiều tính chất trong mẫu, đặc biệt là tính bất thường, các nhà nghiên cứu hiện nay hướng tới phát triển các biến thể từ mô hình cơ bản hoặc nghiên cứu lai ghép kết hợp giữa nhiều mô hình với nhau nhằm nâng cao hiệu suất dự báo

1.2 TÍNH CẤP THIẾT CỦA ĐỀ TÀI

Dữ liệu chuỗi thời gian hiện diện trong rất nhiều ứng dụng thực tế, từ những

lĩnh vực kinh tế, thị trường cho đến khí tượng, thủy văn… Trong các ứng dụng này, việc ứ ng du ̣ng dữ liê ̣u chuỗi thời gian để dự báo là một công việc rất cần thiết

Dựa trên số lượng, dữ liê ̣u chuỗi thời gian được phân thành hai loa ̣i: ngắn ha ̣n

và dài ha ̣n Việc nghiên cứu căn cứ vào đặc điểm của dữ liê ̣u để dự báo được các nhà nghiên cứu quan tâm trong thời gian gần đây [1,3,7,10,12,14,16] Các công trình này thực sự hữu ích đối với việc khai thác dữ liệu các chuỗi thời gian khác nhau

Trang 20

Đối với dữ liệu ngắn hạn, việc tìm và chọn được phương pháp phù hợp là việc cần giải quyết Theo Hyndman [11] là không có câu trả lời dễ dàng, nó phụ thuộc vào

số lượng tham số mô hình cần ước tính và lượng ngẫu nhiên trong dữ liệu Kích thước mẫu được yêu cầu tăng theo số lượng tham số và lượng nhiễu trong dữ liệu

Dựa vào tính chất, chuỗi thờ i gian thường tồn ta ̣i ở hai da ̣ng chính là: có tính tuyến tính và không có tính tuyến tính (phi tuyến) Chuỗi thời gian tuyến tính là chuỗi

có sự biến đổi tuân theo quy luật nhất định Hình 1.6 [19] minh họa một chuỗi dữ liệu thời gian tuyến tính

Hình 1.6: Một chuỗi dữ liệu thời gian tuyến tính

Chuỗi thời gian phi tuyến tính là chuỗi có sự biến đổi bất thường, sự biến đổi không có qui luật Hình 1.7 [19] minh họa một chuỗi dữ liệu thời gian phi tuyến tính

Hình 1.7: Một chuỗi dữ liệu thời gian phi tuyến tính

Trang 21

Tuy nhiên trong cù ng mô ̣t chuỗi dữ liê ̣u thời gian có thể xen lẫn cả 2 da ̣ng tuyến tính và phi tuyến Đây là loại dữ liệu cần được nghiên cứu tìm ra phương pháp

dự báo đạt tính chính xác cao

Hiện nay, việc giải quyết bài toán dự báo dữ liệu chuỗi thời gian ngày càng được quan tâm của cộng đồng khoa học [1,3,7,10,12,14,16] Đã có đề xuất với các phương pháp khác nhau, tuy nhiên mỗi phương pháp đều có những nhược điểm và

ưu điểm riêng Riêng với dự báo dữ liê ̣u chuỗi thời gian ngắn ha ̣n, viê ̣c tìm ra phương pháp dự báo thỏa mãn cả về đô ̣ dài dữ liê ̣u dùng trong dự báo, độ phức ta ̣p của thuâ ̣t toán và độ chính xác của kết quả dự báo là mô ̣t bài toán khó Phổ biến nhất trong dự báo trên dữ liệu thời gian ngắn ha ̣n tuyến tính và phi tuyến tính là hai phương pháp:

dự báo dựa trên kỹ thuật làm trơn hàm mũ (ES) và mạng nơ ron (ANN) bở i chúng không bắt buộc phải có dữ liê ̣u mẫu có kích thước lớn, thời gian đáp ứng nhanh, dễ

dàng thực hiê ̣n, nắm bắt được tính bất thường của dữ liệu và ít chi phí Mặc dù vậy, nhiều nghiên cứu đã chứng minh rằng chất lượng dự báo của phương pháp làm trơn hàm mũ với dữ liệu có tính phi tuyến không cao và ANN với dữ liệu tuyến tính hay

xu hướng và mùa chưa tốt [8,9,13,14,16]

Các phương pháp gần đây ứng du ̣ng khá thành công kỹ thuâ ̣t làm trơn hàm

mũ, ARIMA hay SAMIRA đối với chuỗi dữ liê ̣u thời gian tuyến tính hoă ̣c áp dụng phương pháp ANN cho chuỗi dữ liê ̣u thời gian phi tuyến Gần đây, có nhiều công trình ứng du ̣ng một số phương pháp truyền thống cho từng loại dữ liê ̣u cu ̣ thể như [1,3,7,10,12,16] Tuy nhiên dữ liệu trong thế giới thực rất phức ta ̣p, đồng thời tồn ta ̣i

các mẫu phi tuyến và tuyến tính trong cùng mô ̣t chuỗi thời gian Nên chỉ dùng mô

hình phi tuyến hoă ̣c tuyến tính đơn lẻ là không đủ bởi có khả năng bỏ qua đă ̣c điểm phi tuyến hay tuyến tính củ a dữ liê ̣u Bên cạnh đó, đa số những phương pháp hiê ̣n nay đa số để xử lý một loại dữ liê ̣u cu ̣ thể mà chưa áp du ̣ng đa da ̣ng các loa ̣i dữ liê ̣u chuỗi thờ i gian

Với những phân tích như trên, đồng thời theo R.J.Hyndman và cộng sự [11], kết hợp nhiều dự báo dẫn đến tăng hiệu quả dự báo Vì thế, nhằm hạn chế các yếu

Trang 22

điểm trên cần có một mô hình mới có thể đồng thời nắm bắt được các đă ̣c điểm tuyến

tính lẫn phi tuyến tính trong cùng một chuỗi dữ liệu Tức là, cần thiết phải lai ghép

mô hình phi tuyến với tuyến tính dựa trên ha ̣n chế của mỗi mô hình

1.3 MỤC TIÊU NGHIÊN CỨU

1.3.1 Mu ̣c tiêu nghiên cứu tổng quát

Chúng tôi xây dựng và hiện thực mô hình mới có khả năng dự báo đa dạng dữ liệu chuỗi thời gian ngắn ha ̣n đồng thời cho chất lượng dự báo tốt hơn

Nghiên cứu lai ghép giữa kỹ thuật ANN và kỹ thuâ ̣t làm trơn hàm mũ, do hai

kỹ thuâ ̣t này bổ sung lẫn nhau Mô ̣t mă ̣t, ANN có thể phát hiê ̣n các đă ̣c trưng phi tuyến tính bị ẩn khó phát hiện trong dữ liê ̣u Mă ̣t khác, mô hình làm trơn hàm mũ cho

kết quả tốt trong các mẫu tuyến tính của chuỗi thời gian [9,11]

Chú ng tôi dùng kỹ thuâ ̣t làm trơn hàm mũ bâ ̣c ba (ES3) [1] có ưu điểm nắm bắt được tính mùa, tính xu hướng, yêu cầu dữ liệu mẫu nhỏ để lai ghép với ANN bằng phương pháp lai “nghi ̣ viê ̣n” [9] bởi cách lai này là đơn giản, thực hiện dễ dàng và ít chi phí

Chúng tôi hiện thực mô hình ANN-ES3 sau đó thử nghiệm trên nhiều bộ dữ liệu ngắn hạn để so sánh, kiểm tra và đánh giá mô hình đề xuất với ba mô hình: ANN, ES3 và mô hình lai ANN-ES1, kiểm tra tính đúng đắn về mặt lý thuyết Mô hình chúng tôi đề xuất cho hiệu suất dự đoán cao hơn so với các mô hình còn lại

1.3.2 Mu ̣c tiêu nghiên cứu cụ thể

 Nghiên cứu kỹ thuâ ̣t làm trơn hàm mũ bâ ̣c một

 Nghiên cứu kỹ thuâ ̣t làm trơn hàm mũ bâ ̣c hai

 Nghiên cứu kỹ thuâ ̣t làm trơn hàm mũ bâ ̣c ba

 Nghiên cứu các phương pháp ước lượng giá trị các tham số trong kỹ thuâ ̣t

làm trơn hàm mũ Sử dụng phương pháp phù hợp là phần mềm R

 Nghiên cứu cách dự báo bằng ANN

 Nghiên cứu phương pháp lai ghép được đề xuất bởi Lai [9] và các cộng sự

Trang 23

Thực nghiệm, kiểm tra, so sánh, đánh giá các phương pháp bằng những bô ̣ dữ liệu thời gian ngắn hạn khác nhau ở đa dạng các lĩnh vực theo những tiêu chí:

o Chất lượng dự báo

o Thời gian đáp ứng

o Tính thích nghi với dữ liệu

1.4 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU

Đối tượng: dự báo dữ liệu chuỗi thời gian ngắn ha ̣n với kích thước nhỏ áp dụng

kỹ thuâ ̣t lai ghép ANN-ES3 nhằm dự báo đa dạng các loa ̣i dữ liê ̣u

Phạm vi: chúng tôi nghiên cứu, hiện thực việc lai ghép ANN-ES3 để dự báo

dữ liệu chuỗi thời gian ngắn hạn vớ i đa dạng loại dữ liệu thuộc các lĩnh vực như chứng khoán, sản xuất, thời tiết, thủy văn, dân số, lao động, tài chính, … Nguồn dữ liệu có được từ thư viện dữ liệu chuỗi thời gian của giáo sư R.J.Hyndman tại

1.5 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI

Luận văn này tiến hành hiê ̣n thực việc lai ghép ANN và kỹ thuật làm trơn hàm

mũ bâ ̣c 3 để nâng cao chất lượng dự báo dữ liê ̣u chuỗi thời gian ngắn ha ̣n với đa dạng các loại dữ liệu cho chất lượng cao hơn các mô hình đơn thuần

Thực hiện việc chạy thực nghiệm với nhiều bộ dữ liệu trong thực tế có các tính chất khác nhau, đánh giá và kiểm tra tính đúng đắn của cơ sở lý thuyết và quá trình hiện thực

Trang 24

1.6 CẤU TRÚC LUÂ ̣N VĂN

Phần còn la ̣i được chúng tôi trình bày theo cấu trúc sau:

- Chương 2: trình bày tổng thuật các công trình liên quan như: các mô hình của Box-Jenkins, các mô hình của Holt-Winters và mô hình ANN

- Chương 3: trình bày cơ sở lý thuyết về: kỹ thuật ES, ANN, mô hình lai ES1 và ý tưởng thực hiện mô hình lai ghép ANN-ES3 dự báo chuỗi thời gian ngắn ha ̣n

ANN Chương 4: trình bày cách hiện thực, kết quả thử nghiệm và đánh giá hiệu suất

của mô hình lai ANN-ES3

- Chương 5: đánh giá kết quả đạt được, các mặt hạn chế, đưa ra hướng phát

triển của đề tài

Trang 25

CHƯƠNG 2: TỔNG THUẬT CÁC CÔNG TRÌNH

LIÊN QUAN

Chương này sẽ giới thiệu những phương pháp thông du ̣ng thường dùng để dự

báo dữ liê ̣u chuỗi thời gian ngắn ha ̣n cùng ưu, nhược điểm của chúng, bao gồm: phương pháp của Box-Jenkins, phương pháp làm trơn hàm mũ và ma ̣ng nơ ron nhân

t giá trị của biến số được cho là Y t thì Y t = f (Y t-1 , Y t-2 , , Y0, t) Công thức của mô

hình ARIMA [11] như sau:

2.1.2 Mô hình Seasonal ARIMA

Mô hình Seasonal ARIMA gồm hai yếu tố được kết hợp chặt chẽ: có tính mùa, không có tính mùa Công thức 2.2 là tính toán thu gọn củ a SARIMA [11]

ARIMA (p, d, q)×(P, D, Q)S

(2.2)

Trong đó P, D, Q là các biến số giải thích SARIMA với ý tưởng chính là xem

xét các biến số giải thích tốt nhất để mô hình mẫu có tính mùa Phương trình hồi qui

Trang 26

chứa biến số giải thích ở bên phải, trong phân tích hồi qui thường có sự thay đổi của một biến độc lập, biến số giải thích này có chức năng giải thích những thay đổi đó

2.1.3 Ưu điểm cu ̉ a mô hình Box-Jenkins

- Các mô hình do Box-Jenkins đề xuất, cụ thể là ARIMA và SARIMA có tính phổ biến bởi sự chính xác của nó trong công tác dự báo

- Hyndman [11] chỉ ra rằng, mô hình Box-Jenkins có thể phù hợp với dữ liệu đào tạo là khá tốt Có kết quả dự báo với độ chính xác cao trên dãy số liệu mẫu khá lớn

- Do có cả tính tự hồi quy và trung bình trượt nên mô hình Box-Jenkins khá linh đô ̣ng

- Theo Ong và cộng sự [2], mô hình Box-Jenkins trong thực tế có khả năng miêu tả rộng những đặc điểm của chuỗi thời gian thường gặp, nó khá mềm dẻo

2.1.4 Nhươ ̣c điểm của mô hình Box-Jenkins

- Nhược điểm lớn nhất là xác đi ̣nh mô hình khó khăn bởi khó ước lượng bậc của trung bình trượt cũng như tự đô ̣ng hồi quy … Khi sử du ̣ng cần phải “thử và sửa sai”

Nếu nhâ ̣n da ̣ng mô hình sai sẽ ta ̣o ra các giai đoa ̣n sai trong mô hình nhâ ̣n da ̣ng và phải nhâ ̣n da ̣ng la ̣i mô hình Theo R.J.Hyndman và cộng sự [11], mô hình Box-Jenkins cập nhâ ̣t các tham số và đưa thêm dữ liê ̣u vào khá khó khăn Do đó, cần có lượng thời gian và tài nguyên khá tốn kém

- Cũng theo R.J.Hyndman và cộng sự [11], mô hình Box-Jenkins phù hợp với

dữ liệu đào tạo tốt nhưng không chắc là sẽ dự báo tốt, mô hình Box-Jenkins không áp du ̣ng cho cấu trúc dữ liê ̣u phi tuyến, đây là mô ̣t trở nga ̣i lớn

- Mô hình Box-Jenkins theo định kỳ bắt buộc phải được xây dựng lại, mô hình mới hoàn thiện hơn phải được chọn lại trong nhiều trường hợp, tức là cần có nhiều kinh nghiệm

- Khi dữ liệu có tính mùa thì ARIMA không hỗ trợ Khi gặp loại dữ liệu này,

nó cần phải biến đổi hoặc dùng SARIMA thay thế

- Cuối cùng, với dữ liệu chuỗi thời gian ngắn hạn thì mô hình Box-Jenkins chưa thực sự phù hợp vì chúng cần nhiều dữ liệu lịch sử

Trang 27

2.2 CÔNG TRÌNH CỦA HOLT-WINTERS

2.2.1 Giơ ́ i thiê ̣u mô hình

Mô hình làm trơn kiểu hàm mũ (Exponential Smoothing hay ES) [11] là kỹ thuật dự báo rất hữu hiê ̣u trong nhiều tình huống dự báo được công bố bởi C.C.Holt

lần đầu dùng cho chuỗi thời gian không có tính xu hướng và mùa Sau đó C.C.Holt bổ sung cho mô hình này có khả năng làm việc được với dữ liê ̣u có xu hướng Cuối

cù ng, Winter bổ sung để có thể dự báo cho dữ liê ̣u có tính mùa Do đó phương pháp

này có tên là “Holt-Winters”

Trong mô hình làm trơn hàm mũ, những quan sát cũ hơn được gán tro ̣ng số giảm theo cấp số nhân Tức là, các quan sát càng mới thì giá trị tro ̣ng số được gán càng lớ n so với những quan sát càng cũ

Trong trung bình di ̣ch chuyển các tro ̣ng số gán cho quan sát luôn bằng nhau

và (bằng 1/N, với số mẫu là N) Tuy nhiên, trong kỹ thuâ ̣t làm trơn hàm mũ, có mô ̣t

hoặc nhiều tham số được ước lượng và các tham số này sẽ quyết đi ̣nh giá trị tro ̣ng số

gán cho những quan sát

- Một lợi ích cho cả viê ̣c biểu diễn dữ liê ̣u cũng như dự báo là kỹ thuâ ̣t làm trơn

hàm mũ có khả năng hạn chế tác đô ̣ng của sự biến đổi ngẫu nhiên nếu áp du ̣ng đúng,

vì thế giúp dễ thấy các hiê ̣n tượng cơ bản [8] Kỹ thuật này được go ̣i là “làm trơn” vì khi biểu diễn dữ liê ̣u nó loa ̣i bỏ các răng cưa không bằng phẳng gắn liền với sự thay đổi ngẫu nhiên và để la ̣i mô ̣t đường thẳng hoă ̣c đường cong

- Theo Hyndman [11], về bộ thử nghiệm thì mô hình làm trơn hàm mũ dự báo chính xác hơn ARIMA

- So với các phương pháp dự báo khác, phương pháp này là đơn giản, thực hiê ̣n

dễ, chi phí thấp

Trang 28

2.2.3 Nhươ ̣c điểm

- Với chuỗi dữ liệu thời gian, kỹ thuâ ̣t làm trơn hàm mũ chỉ nắm bắt được các

đă ̣c điểm tuyến tính [9] trong khi ở thực tế chúng thường xen lẫn tính chất phi tuyến

và xuất hiện những điểm bất thường Bởi thế, mô hình này thường chỉ dùng trong lớp

mô hình tuyến tính

- Khi hằng số làm trơn giảm theo hàm mũ thì mô hình này cho ra một mô hình giản di ̣ thái quá mà chỉ dùng vài giá tri ̣ trước đó để dự báo Vì thế không thể tìm được

các mẫu không tuyến tính trong dữ liê ̣u như đề cập của Lai và cộng sự [9]

- Theo Hyndman [11], về mặt dữ liệu đào tạo thì mô hình kỹ thuật làm trơn hàm

mũ tỏ ra khó khăn để phù hợp hơn ARIMA

- Đối với các nhân tố nhân quả bên ngoài, mô hình làm trơn hàm mũ không thể bao gồ m chúng

Do đó, muốn chất lượng dự báo được nâng cao cho mô hình làm trơn hàm mũ thì cần phải nghiên cứu những phương pháp phi tuyến khác để bổ sung

2.3 MA ̣NG NƠ RON NHÂN TẠO

ANN đặc biệt có ưu thế trong việc nắm bắt các ước lượng phi tuyến [17], vì

vậy người ta thường dùng ANN để hạn chế các yếu điểm của những mô hình làm trơn kiểu hàm mũ và Box-Jenkins Lý thuyết về ANN được trình bày chi tiết ở chương Cơ

sở lý thuyết Sau đây chúng tôi trình bày những ưu điểm và hạn chế của ANN

2.3.1 Ưu điểm

Khả năng của ANN là khái quát hoá hay là khả năng học, ngay cả đối với trường hợp trong quá trình huấn luyện mà đầu vào ANN chưa từng gặp thì nó cũng

có thể cho những đầu ra hợp lý Ưu điểm nổi bật của ANN được thể hiện:

- ANN có tính thích nghi Hoạt động bản chất của ANN là dùng các luật học để điều chỉnh theo diễn biến thời gian các trọng số khớp Do vậy, về nguyên tắc, ANN tạo nên một hệ thống có tính thích nghi

- ANN được biết đến là phương pháp có hiê ̣u suất ổn đi ̣nh, chi phí thấp [15] Nguyên nhân là dự báo bằng những phương pháp truyền thống khác gặp ha ̣n chế là không thể dự báo tất cả các đă ̣c trưng của li ̣ch sử và bản chất hê ̣ thống tính toán

Trang 29

- Thông thườ ng những phương pháp thống kê thì dữ liê ̣u tuyến tính sẽ có liên quan trong khi ANN lại kết hợp với dữ liê ̣u phi tuyến, vì vâ ̣y theo Sallehuddin và các cộng sự [13], ANN không phải luôn luôn nhất quán, ho ̣ cũng cho rằng do những đă ̣c trưng về nắm bắt dữ liê ̣u hướng thời gian phi tuyến tốt hơn nên ANN thực hiê ̣n tốt hơn Khi mô hình dữ liê ̣u hướng thời gian phi tuyến không có nhiễu, ANN cung cấp

tính hiê ̣u quả và nhất quán Mô ̣t số nghiên cứu đã so sánh ANN với những cách dự

báo truyền thống, kết quả là ANN luôn luôn thực hiê ̣n tốt hơn và rất ma ̣nh mẽ nếu

tầm dự báo tăng

- Với cấu trúc ánh xạ vào - ra nên ANN có thể điều chỉnh đầu ra sao cho có thể đáp ứng sự mong muốn của đầu ra do ANN dùng triệt để thuật toán học có thầy áp

dụng dùng ánh xạ vào - ra, đồng thời ANN cũng có khả năng dùng luật học không có thầy nghĩa là dùng ánh xạ vào - ra để điều chỉnh đầu ra sao cho trọng số khớp đạt được giá trị ổn định (không biết đầu ra mong muốn)

- Hoạt động củ a ANN có tính thích nghi theo các luật học nên về nguyên tắc có thể điều chỉnh dần các sai sót do đó có thể chấp nhận các lỗi, các thiếu sót trong quá trình học Do đó, ANN có tính kháng lỗi

- ANN phù hợp cho dự báo dữ liệu chuỗi thời gian dài ha ̣n

2.3.2 Nhươ ̣c điểm

- ANN gặp khó khăn trong viê ̣c bị bẫy vào điểm cực trị đi ̣a phương và vấn đề quá khớp (overfitting) [5] Đối với ANN thì viê ̣c quá khớp nhiều hơn các mô hình thống kê khác, bởi các mô hình thống kê khác yêu cầu ước lượng tham số nhiều Do

đó ta nên mở rô ̣ng các tham số cần ước lượng nhằm khắc phục hạn chế quá khớp này

- Đồng thời, do quá trình huấn luyê ̣n ma ̣ng phu ̣ thuô ̣c vào cấu trúc, ngưỡng và

dữ liê ̣u huấn luyê ̣n hiê ̣n ta ̣i nên ANN không có các luâ ̣t cho những kích thước mẫu riêng biệt

- Cuối cùng, mô hình ANN có nhược điểm tương tự như của ARIMA đó là yêu

cầu dữ liệu lịch sử lớn [15] Vì thế, ANN cho đô ̣ chính xác thấp khi dự báo chuỗi dữ liệu thời gian ngắn ha ̣n

Trang 30

2.4 CÁC CÔNG TRÌNH GẦN ĐÂY

2.4.1 Ti ̀nh hình nghiên cứu dự báo chuỗi dữ liê ̣u thời gian hiê ̣n nay

Đối với dự báo dữ liê ̣u chuỗi thời gian nói chung, gần đây có nhiều phương pháp mới hiê ̣n đa ̣i như ANN, SVM (Support Vector Machine), Fuzzy logic, Deep learning, LSTM (Long Short-Term Memory), [24] Chúng có ưu điểm khi đưa ra

dự báo chính xác cao, tỏ ra thực sự hiê ̣u quả Mặc dù vậy, chúng cũng tồn tại những nhược điểm nằm ở chính những đă ̣c điểm của chúng là thuâ ̣t toán phức ta ̣p, mất thời gian nhiều để thực hiện hay đòi hỏi lượng dữ liê ̣u đầu vào lớn vì thế chỉ khi ứng du ̣ng với tập dữ liê ̣u lớn chúng mới thực sự hiê ̣u, tức là phù hợp một cách đặc biệt với dự

báo dữ liê ̣u chuỗi thời gian dài ha ̣n

Đối với dự báo dữ liê ̣u chuỗi thời gian ngắn ha ̣n nói riêng, có đă ̣c điểm là tâ ̣p

dữ liê ̣u đầu vào không lớn, đôi khi là rất nhỏ, trong thực tế hiê ̣n nay đa số thường dùng những phương pháp truyền thống như: Holt Winter [1,7], AMIRA [12], SAMIRA [10], phương pháp tiên tiến ANN [3,15] hoặc nghiên cứu phát triển những phương pháp này nhằm có kết quả dự báo cao hơn với một loa ̣i dữ liê ̣u cu ̣ thể bởi chúng ít chi phí và tỏ ra hiê ̣u quả trong dự báo với kết quả tương đối chính xác Đồng thời, nhiều nhà nghiên cứu thường dựa trên những đă ̣c điểm của loa ̣i dữ liê ̣u như tính

mù a, xu hướng hay bất thường để từ đó cho ̣n được phương pháp dự báo phù hợp Mặt khác, các nhà nghiên cứu còn tiến hành lai ghép những phương pháp hiện đại với truyền thống, cu ̣ thể là thường lai ghép những phương pháp truyền thống với ANN để nắm bắt triê ̣t để các đă ̣c điểm phi tuyến tính trong chuỗi dữ liê ̣u thời gian [14,16]

2.4.2 Mô ̣t số mô hình riêng lẻ

Một số mô hình ứng du ̣ng những kỹ thuật dự báo truyền thống: Điển hình là Jayalalitha [7] dùng mô hình làm trơn hàm mũ bậc 1 dự báo nhiê ̣t đô ̣ ta ̣i Ấn Đô ̣, Asep Rusyana [1] dùng mô hình làm trơn hàm mũ bậc ba dự báo hành khách của mô ̣t hãng

hàng không tại Indonesia, hay Peng Chen và cộng sự [10] dự báo nhiệt độ tại Nanjing dùng SAMIRA

Một số mô hình ứng du ̣ng dự báo bằng ANN: E.Akarslan cùng cộng sự [3] nghiên cứu dự báo nhu cầu điện lưới vi mô sử du ̣ng ma ̣ng nơron nhân ta ̣o, Ronald

Trang 31

Wesonga [12] hiện thực cả ANN và AMIRA để so sánh hiệu quả dự báo tốc đô ̣ gió

tại mô ̣t sân bay quốc tế

 Ưu điểm: Các công trình trên dự báo đem la ̣i hiệu suất khá cao với một loại

dữ liê ̣u chuỗi thời gian tuyến tính hoă ̣c phi tuyến tính cu ̣ thể

 Hạn chế: Mô hình ARIMA và SAMIRA yêu cầu nhiều dữ liệu đồng thời việc

xác định mô hình khá khó khăn Mô hình ES sẽ bỏ qua 1 số đă ̣c điểm phi tuyến [8], tương tự mô hình ANN cũng không khai thác triê ̣t để nhất được đă ̣c điểm tuyến tính

củ a dữ liê ̣u Đă ̣c biê ̣t, chúng chỉ hiê ̣u quả cho mô ̣t loa ̣i dữ liê ̣u cu ̣ thể Hiện nay, hầu hết các nhà nghiên cứu tìm cách cải tiến các phương pháp truyền thống đồng thời nghiên cứu lai ghép với các phương pháp hiện đại như là một giải pháp nhằm nâng cao hiệu suất dự báo

2.4.3 Mô ̣t số mô hình lai ghép

Gần đây có nhiều công trình lai ghép các phương pháp hiê ̣n đa ̣i và mô hình dự

báo truyền thống đã được đề xuất với mục đích nâng cao hiệu suất dự báo nhưng phổ biến và nổi bật nhất vẫn là mô hình lai ghép ARIMA - ANN và mô hình lai ghép kỹ thuật làm trơn hàm mũ – ANN

Santosha Rathod [14] nghiên cứ u mô hình lai ARIMA-ANN để dự báo giá cà phê Robusta ở Ấn Độ cho hiệu suất tương đối cao vớ i dữ liê ̣u giá cà phê Tuy nhiên

mô hình ARIMA như đã phân tích, có ha ̣n chế là ARIMA hay SAMIRA không thể

làm viê ̣c với dữ liê ̣u có tính mùa, chi phí khá cao, viê ̣c xác đi ̣nh mô hình khá khó khăn và quan tro ̣ng nhất là nó đòi hỏi dữ liệu lịch sử lớn nên chưa thực sự phù hợp đối với dự báo dữ liê ̣u ngắn hạn

Winita Sulandaria và cộng sự [16] dự báo nhu cầu tải điện dùng mô hình hàm

mũ lai ANN Công trình này đề xuất phương pháp lai ghép giữa làm trơn hàm mũ theo cấp số nhân và ANN với 2 lần mùa (double season) kết hợp chuyển đổi BoxCox, sửa lỗi ARMA và hàm lượng giác với thời gian thay đổi dựa trên fourier Phân hủy chuỗi tải thành các cấp độ, xu hướng, thành phần theo mùa và bất thường làm đầu vào dựa trên thuâ ̣t toán hàm lượng giác và chuỗi Fourier Phương pháp này là mới với hiệu suất dự báo tốt đối với dữ liê ̣u tải điê ̣n Tuy nhiên, dùng hàm lượng giác và

Trang 32

chuỗi fourier khá phức ta ̣p cho dữ liê ̣u chuỗi thời gian, mặt khác dữ liê ̣u tải điê ̣n có

đă ̣c thù riêng để có thể dùng lượng giác và chuỗi fourier phân hủy Trong thực tế tồn tại những dữ liệu khó phân hủy Do vậy, phương pháp này tương đối khó ứng du ̣ng cho những loại dữ liê ̣u đa da ̣ng

Tóm lại, việc lai ghép ARIMA (SARIMA) với ANN, mô hình làm trơn hàm

mũ với với ANN đều đem la ̣i hiệu suất cao hơn khi những mô hình này hoa ̣t đô ̣ng riêng lẻ ARIMA và SARIMA đều có nhiều khó khăn nhất định, đồng thời yêu cầu

dữ liệu mẫu đủ lớn Những nghiên cứ u này thực hiện trên mô ̣t loa ̣i dữ liê ̣u cu ̣ thể mà chưa áp du ̣ng đa da ̣ng các loa ̣i dữ liê ̣u, chúng tương đối khó khăn khi dự báo đa dạng các loại dữ liệu ngắn ha ̣n

Trang 33

CHƯƠNG 3: CƠ SỞ LÝ THUYẾT

Trong chương này chúng tôi sẽ trình bày cơ sở lý thuyết của đề tài, bao gồm

lý thuyết về phương pháp làm trơn kiểu hàm mũ, phương pháp ANN và ý tưởng của

mô hình lai ghép giữa ANN-ES3

3.1 PHƯƠNG PHÁP LÀM TRƠN KIỂU HÀM MŨ

Holt Winter đề xuất phương pháp làm trơn hàm mũ [11] hoa ̣t đô ̣ng dựa trên

các giá tri ̣ quá khứ được xem xét liên tu ̣c, dựa vào trung bình có tro ̣ng số của chuỗi

dữ liê ̣u Khi thời điểm cần dự báo ở càng xa thì trọng số tại đó có giá tri ̣ càng nhỏ

Đây là phương pháp làm trơn tuyến tính, thích hợp với dữ liê ̣u có xu hướng lên hay xuố ng không dự đoán được

Có 3 loại mô hình làm trơn hàm mũ thường được dùng trong các loại dữ liê ̣u thờ i gian khác nhau:

- Loại 1: Làm trơn hàm mũ bậc một (simple exponential smoothing)

- Loại 2: Làm trơn hàm mũ bậc hai (double exponential smoothing)

- Loại 3: Làm trơn hàm mũ bậc ba (triple exponential smoothing)

3.1.1 Mô hi ̀nh làm trơn hàm mũ bậc một (ES1)

Ban đầu, mô hình này [11] được C.C.Holt giới thiệu và áp du ̣ng vào những chuỗi dữ liệu thờ i gian không có tính xu hướng và không có tính mùa Nó liên tu ̣c

sử a la ̣i mô ̣t dự báo dựa vào các kinh nghiê ̣m gần nhất Trung bình (làm trơn) các giá trị quá khứ của chuỗi bằng cách giảm theo cấp số mũ Các quan sát cũ hơn được gán trọng số nhỏ hơn so với các quan sát gần hơn

A t = αY t-1 + (1 – α) A t-1

(3.1)

̣ báo mới = α (quan sát cũ) + (1- α)  dự báo cũ

(3.2)

Với: Y t-1: giá tri ̣ thực ở thời điểm t-1

α: là hằng số làm trơn

A t: giá tri ̣ của dự báo ở thời điểm t

A t-1: giá tri ̣ của dự báo trước t mô ̣t thời điểm

Trang 34

Phương trình trên có thể viết lại theo một cách khác:

A t = A t-1 + α(Y t-1 – A t-1)

(3.3) Trong công thứ c 3.3, giá tri ̣ dự báo mới được tính bằng giá tri ̣ dự báo cũ cô ̣ng

́ i α lần đô ̣ sai biê ̣t (error) giữa giá tri ̣ dự báo và giá tri ̣ thực Với giá tri ̣ thực có thể

tính bằng cách lấy giá tri ̣ thực đầu tiên hoă ̣c lấy trung bình n quan sát đầu tiên làm

giá tri ̣ dự báo đầu tiên

Trọng số α, còn go ̣i là hằng số làm trơn, nó biểu diễn tỉ lê ̣ phần trăm của lỗi

̣ báo Khi α gần với 0 tức là giá tri ̣ dự báo mới gần bằng với giá tri ̣ dự báo cũ Còn khi α gần với 1 thì giá tri ̣ dự báo mới bằng giá tri ̣ dự báo cũ cô ̣ng với đa ̣i lượng hiê ̣u chỉnh, lúc này đa ̣i lượng hiê ̣u chỉnh Y t-1 –A t-1 mang tính quyết định

̀ng số làm trơn α thường được cho ̣n nhỏ khi ta muốn sự dự báo ổn đi ̣nh và

làm trơn các biến đô ̣ng ngẫu nhiên Ngược la ̣i, dùng α lớn nếu muốn các biến động

ngẫu nhiên mang tính quyết định

Phương pháp này phù hợp để dự báo dữ liệu không có xu hướng rõ ràng hoặc

mô hình theo mùa Hình 3.1 [11] là một ví dụ về dữ liệu không hiển thị xu hướng hoặc thời vụ rõ ràng Hình 3.2 [11] là một dự báo đối với dữ liệu không có thời vụ và

xu hướng rõ ràng bằng phương pháp ES1 với đường màu đỏ là kết quả dự báo

Hi ̀nh 3.1: Một chuỗi dữ liê ̣u thời gian không có thời vụ và xu hướng rõ ràng

Trang 35

Hi ̀nh 3.2: Một dự báo bằng phương pháp ES1

3.1.2 Mô hi ̀nh làm trơn hàm mũ bâ ̣c hai (ES2)

Khi dữ liê ̣u có xu hướng và chứa thông tin tham gia vào di ̣ch chuyển hướng lên cao trong tương lai Với loại dữ liê ̣u này thì cần mô ̣t hàm dự báo xu hướng (trend) tuyến tính

Năm 1958, C.C.Holt [8] tiếp tu ̣c đưa ra mô hình go ̣i là phương pháp làm trơn

hàm mũ bâ ̣c hai có khả năng dự báo dữ liê ̣u có xu hướng, tức là cần phải ước lượng

đô ̣ dốc hiê ̣n ta ̣i và biên đô ̣ hiê ̣n ta ̣i bằng cách dùng hai hê ̣ số:

- α: hằng số làm trơn cho biên đô ̣

- β: hằng số làm trơn cho xu hướng

Phương pháp này có ưu điểm ở sự linh hoa ̣t khi cho ̣n tỉ lê ̣ theo dõi biên đô ̣ và

xu hướng Với giả thiết xu hướng là đường thẳng đi lên hoă ̣c đi xuống, có ba phương trình trong phương pháp này:

- Phương trình thứ nhất ước lượng biên đô ̣ của hiê ̣n ta ̣i:

Trang 36

Vớ i:  là hằng số làm trơn cho biên đô ̣

 là hằng số làm trơn để ước lượng xu hướng

A t là giá tri ̣ làm trơn mới (ước lượng của mức hiê ̣n ta ̣i)

Y t là giá tri ̣ thực tế mới ta ̣i thời điểm t

T t là ước lượng xu hướng

Y’ t+p: là dự báo cho p điểm trong tương lai

Khi thực hiê ̣n, cần khởi ta ̣o giá tri ̣ cho A1 = Y1, T1 = 0 hoặc lấy trung bình vài giá tri ̣ thực đầu tiên (thường là 6) làm giá tri ̣ khởi ta ̣o cho A1 và lấy xấp xỉ bằng đô ̣

́c của đường thẳng xấp xỉ vài quan sát để làm giá tri ̣ khởi ta ̣o cho T1

Phương pháp ES2 phù hợp với dự báo dữ liệu có xu hướng rõ ràng Hình 3.3 [11] là một ví dụ về dữ liệu có tính xu hướng và hình 3.4 [11] là một dự báo đối với

dữ liệu có tính xu hướng bằng phương pháp ES2

Hi ̀nh 3.3: Một ví dụ về dữ liệu có tính xu hướng

Hi ̀nh 3.4: Một dự báo bằng phương pháp ES2

Trang 37

3.1.3 Mô hi ̀nh làm trơn hàm mũ bâ ̣c ba (ES3)

Phương pháp ES3 còn có tên là “Holt-Winters Method” vì vào năm 1965, Winter mở rô ̣ng phương pháp của Holt nhằm ước lượng được tính mùa [8] Khi dữ liệu có tính mùa và tính xu hướng, phương pháp ES3 được ứng du ̣ng Trong phương pháp ES3 (mô hình nhân) dùng bốn phương trình chính:

- Phương trình 1 dùng ước lượng biên đô ̣ (level):

Yt: giá tri ̣ thực tế ta ̣i thời điểm t

Tt: ước lượng xu hướng

St: ước lượng tính mùa

Y’ t+p: là giá tri ̣ dự báo cho p chu kỳ trong tương lai

α: là hằng số làm trơn biên đô ̣

β: hằng số làm trơn xu hướng

γ: hằng số làm trơn cho tính mùa

p: số bước muốn dự báo trong tương lai

s: chiều dài của tính mùa

Trong công thứ c này, sự dự báo được điều chỉnh bằng cách nhân với chỉ số

mù a Đây là mô ̣t kỹ thuâ ̣t giúp loa ̣i bỏ ảnh hưởng của tính mùa

Trang 38

Ba tham số α, β, γ đóng vai trò điều khiển viê ̣c làm trơn, α, β, γ tương ứng với

ước lượng biên đô ̣, đô ̣ dốc của thành phần xu hướng và thành phần mùa ta ̣i thời điểm

xét Các tham số α, β, γ có giá tri ̣ nằm từ khoảng 0 đến 1, khi giá tri ̣ càng gần 0 có

nghĩa là càng có ít tro ̣ng số được đă ̣t trên các quan sát gần nhất khi đưa ra dự báo các giá tri ̣ tương lai Nếu hệ số γ bằng 0, tức là thành phần mùa không còn tồn tại trong

dữ liệu, lú c này phương pháp trên trở thành kĩ thuật làm trơn theo hàm mũ bâ ̣c hai

Nếu hệ số β cũng bằng 0, phương pháp này trở thành kĩ thuật làm trơn theo hàm mũ

bậc một Như vậy, đây chính là kĩ thuật tổng quát nhất của các kĩ thuật làm trơn hàm

Khi dữ liê ̣u có tính mùa, phương pháp ES3 có thể biểu diễn dữ liê ̣u tốt hơn và giảm lỗi dự báo xuống thấp hơn mô hình ES1 và ES2 Do đó, trong luận văn này chú ng tôi dùng mô hình ES3 để dự báo dữ liê ̣u chuỗi thời gian ngắn ha ̣n

3.1.4 Mô hi ̀nh cô ̣ng và mô hình nhân

bản chuỗi thời gian có các giá tri ̣ nằm trong mô ̣t dải giá tri ̣ có đô ̣ rô ̣ng là mô ̣t hằng số

và đường xu thế nằm ở trung tâm của dải này

Trang 39

Tính mùa được thể hiê ̣n như tỷ lê ̣ phần trăm của số ước lượng trung bình (hay

xu hướng) Sau đó nó được dùng để nhân giá tri ̣ của chuỗi để hợp nhất tính mùa Mô

hình nhân hoa ̣t đô ̣ng tốt nhất khi chuỗi thời gian có sự biến thiên tăng cùng với biên

đô ̣ Có nghĩa rằng những giá tri ̣ của chuỗi trải rô ̣ng ra khi xu thế tăng dần và tâ ̣p hợp

các quan sát có da ̣ng hình cái loa hay hình phễu Nói một cách khác, là khi xu hướng tăng thì chuỗi sẽ có giá tri ̣ lớn hơn Một dự báo dùng đồng thời mô hình cô ̣ng và mô

hình nhân cùng có xu hướng tuyến tính như ví dụ trong hình 3.5 [11] với đường màu

đỏ là dự báo của mô hình cộng và đường màu xanh là dự báo của mô hình nhân

Hi ̀nh 3.5: Một dự báo bằng mô hình cộng và mô hình nhân

Do mô hình nhân có khuynh hướng đa ̣i diê ̣n cho kinh nghiê ̣m thực tế nên mô

hình nhân thường được ứng dụng phổ biến hơn mô hình cô ̣ng trong thực tế

Trang 40

3.2 MÔ HÌNH MẠNG NƠ RON NHÂN TẠO

Mạng nơ ron nhân ta ̣o (Artificial Neural Network - ANN) là một tập hợp có tổ chức những nơ ron (phần tử xử lý đơn giản) Đây là hệ thống rất lớn và phức ta ̣p, thực hiện viê ̣c xử lí thông tin, mô phỏng chức năng, cách thức hoạt động và sự nối kết giữa các nơron sinh học Viê ̣c trao đổi thông tin, thực hiện tính toán và xuất kết quả dựa

vào sự kết nối giữa cá nơ ron với nhau Mô ̣t ANN được mô tả trong hình 3.6 [17]

Mạng nơ ron có thể giải quyết và thực hiện những bài toán có độ phức tạp và yêu cầu có độ chính xác cao như nhận dạng, điều khiển tự động, khai phá dữ liệu, … mạng nơ ron hiện nay được ứ ng du ̣ng rất rộng rãi trên nhiều lĩnh vực như quân sự, kinh tế, điện tử, công nghiệp, …

Hi ̀nh 3.6: Minh họa một ANN

3.2.1 Cấu tru ́ c tổng quát của mô ̣t ANN

- Nốt (nơron, unit, node): Mỗi nố t có tính chất vào – ra, có chức năng thực hiê ̣n mô ̣t tính toán cu ̣c bô ̣ (mô ̣t hàm cu ̣c bô ̣) Nốt thành phần cơ bản của mạng nơron

- Tầng (layer, lớp): một tập hợp nhiều nơ ron tạo thành một tầng ANN có kiến trúc chung

gồm ba thành phần là tầng ra (output layer), tầng ẩn (hidden layer) và tầng vào (input layer) Hình 3.7 [17] mô tả kiến trúc cụ thể của mô ̣t ANN

Hi ̀nh 3.7: Mô tả kiến trúc ANN

Ngày đăng: 17/11/2020, 23:22

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm