phát triển mô hình dự báo dữ liệu chuỗi thời gian ngắn hạn

Tuy nhiên, nhiều nghiên cứu chỉ ra rằng đối với dữ liệu có tính xu hướng và tính mùa thì chất lượng dự báo của phương pháp mạng nơ ron nhân tạo không cao.. Tương tự, đối với dữ liệu có t

Trang 1

PHA ̣M NGỌC CẢNH

PHÁT TRIỂN MÔ HÌNH DỰ BÁO

DỮ LIỆU CHUỖI THỜI GIAN

NGẮN HẠN LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

TP Hồ Chi ́ Minh, Năm 2019

Trang 2

PHA ̣M NGỌC CẢNH

PHÁT TRIỂN MÔ HÌNH DỰ BÁO

DỮ LIỆU CHUỖI THỜI GIAN

NGẮN HẠN

Chuyên nga ̀nh : Khoa ho ̣c máy tính

Ma ̃ số chuyên ngành : 60 48 01 01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Người hướng dẫn khoa ho ̣c:

TS Pha ̣m Văn Chung

TP Hồ Chi ́ Minh, Năm 2019

Trang 3

LỜI CAM ĐOAN

Tôi cam đoan rằng luận văn “PHÁT TRIỂN MÔ HÌNH DỰ BÁO DỮ LIỆU CHUỖI THỜI GIAN NGẮN HẠN” là công trình nghiên cứu của chính tôi Ngoại trừ những tài liệu tham khảo được trích dẫn trong luận văn này, tôi cam đoan rằng toàn phần hay những phần nhỏ của luận văn này chưa từng được công bố hoặc được sử dụng để nhận bằng cấp ở những nơi khác

Không có sản phẩm/nghiên cứu nào của người khác được sử dụng trong luận văn này mà không được trích dẫn theo đúng quy định

Luận văn này chưa bao giờ được nộp để nhận bất kỳ bằng cấp nào tại các trường đại học hoặc cơ sở đào tạo khác

Người thực hiện đề tài

Pha ̣m Ngo ̣c Cảnh

Trang 4

LỜI CẢM ƠN

quý báu cho tôi trong suốt quá trình nghiên cứu thực hiện luâ ̣n văn này

hôm nay, tôi luôn nhớ đến công lao giảng dạy và hướng dẫn của quí thầy, cô trường Đại học Mở TP HCM, đặc biệt là quí thầy, cô trong khoa Sau đa ̣i ho ̣c và khoa Công nghệ thông tin

Mặc dù đã cố gắng rất nhiều trong quá trình thực hiê ̣n luâ ̣n văn, song với giới hạn thờ i gian và sự ha ̣n chế của khả năng bản thân nên không thể không có những

quí thầy cô giáo và các bạn học viên

Người thực hiện đề tài

Pha ̣m Ngo ̣c Cảnh

Trang 5

Tuy nhiên, nhiều nghiên cứu chỉ ra rằng đối với dữ liệu có tính xu hướng và tính mùa thì chất lượng dự báo của phương pháp mạng nơ ron nhân tạo không cao Tương tự, đối với dữ liệu có tính phi tuyến chất lượng dự báo của phương pháp làm trơn hàm mũ không tốt

Trong luận văn này, với ý tưởng tận dụng khả năng xấp xỉ hàm phi tuyến của mạng nơ ron nhân tạo (ANN) và khả năng xấp xỉ tốt thành phần mùa và xu hướng của phương pháp làm trơn hàm mũ bậc 3 (ES3), chúng tôi đề xuất mô hình dự báo

dữ liê ̣u chuỗi thời gian ngắn ha ̣n bằng cách xây dựng và hiện thực mô hình lai ghép giữa mạng nơ ron nhân tạo với kỹ thuật làm trơn hàm mũ bậc 3 (ANN-ES3) Mô hình

đề xuất có khả năng dự báo đa dạng các loại dữ liệu và cho kết quả dự báo tốt hơn Đồng thời, chúng tôi cũng hiện thực ba phương pháp dự báo: ANN, ES3 và lai ghép ANN với kỹ thuật làm trơn hàm mũ bậc 1 (ANN-ES1) để so sánh với phương pháp

đề xuất

Tiến hành thực nghiệm dự báo với dữ liệu ngắn hạn thực tế, mô hình lai ghép ANN-ES3 do chúng tôi đề xuất cho chất lượng dự báo tốt hơn so với ba mô hình còn lại (ANN, ES3, and hybrid ANN-ES1)

Trang 6

ABSTRACT

Currently, time series data forecasting gets much attention from the scientists Many forecasting methods have been proposed, however, most of them are applied to specific data and each method has its own advantages and disadvantages Among them, the popular are two forecasting methods: based on exponential smoothing technique because it does not require large input data and based on artificial neuron network because it is able to capture non-linearity of input data

However, many studies show that for trend and seasonal data, the quality of the artificial neuron network is not high Similarly, for non-linear data, the quality of the exponential smoothing technique is not good

In this thesis, with the idea of utilizing the nonlinear approximation capability

of the artificial neural network (ANN) and the ability to approximate the seasonal and trend component of the triple exponential smoothing method (ES3), we proposed a new model to forecast short-term time series data by developing and implementing hybrid model between artificial neural network and triple exponential smoothing method (ANN-ES3) This hybrid model is able to forecast various types of data and gives better forecasting results We also implement three forecasting methods: ANN, ES3 and hybrid model between ANN and single exponential smoothing (ANN-ES1)

to compare with the proposed method

Through the forecast experiment with actual short-term time series data, the proposed hybrid method (ANN-ES3) give better forecasting results than the other three models (ANN, ES3, and hybrid ANN-ES1)

Trang 7

MU ̣C LỤC

LỜI CAM ĐOAN i

LỜI CẢM ƠN ii

TÓM TẮT iii

MỤC LỤC v

DANH MỤC HÌNH viii

DANH MỤC BẢNG x

DANH MỤC TỪ VIẾT TẮT xi

CHƯƠNG 1: GIỚI THIỆU 1

1.1 CƠ SỞ HÌNH THÀNH LUẬN VĂN 1

1.1.1 Đi ̣nh nghĩa chuỗi dữ liê ̣u thời gian 1

1.1.2 Các thành phần của dữ liê ̣u chuỗi thời gian 1

1.1.3 Phân tích dữ liê ̣u chuỗi thời gian và ứng dụng 3

1.1.4 Tầm quan tro ̣ng và ứng du ̣ng của dự báo dữ liê ̣u chuỗi thời gian 4

1.1.5 Các phương pháp dự báo dữ liê ̣u chuỗi thời gian 5

1.2 TÍNH CẤP THIẾT CỦA ĐỀ TÀI 5

1.3 MỤC TIÊU NGHIÊN CỨU 8

1.3.1 Mục tiêu nghiên cứu tổng quát 8

1.3.2 Mục tiêu nghiên cứu cu ̣ thể 8

1.4 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU 9

1.5 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI 9

1.6 CẤU TRÚC LUẬN VĂN 10

CHƯƠNG 2: TỔNG THUẬT CÁC CÔNG TRÌNH LIÊN QUAN 11

2.1 CÔNG TRÌNH CỦA BOX VÀ JENKINS 11

2.1.1 Mô hình ARIMA 11

2.1.2 Mô hình Seasonal ARIMA 11

2.1.3 Ưu điểm của mô hình Box-Jenkins 12

2.1.4 Nhược điểm của mô hình Box-Jenkins 12

2.2 CÔNG TRÌNH CỦA HOLT-WINTERS 13

Trang 8

2.2.1 Giớ i thiê ̣u mô hình 13

2.2.2 Ưu điểm 13

2.2.3 Nhược điểm 14

2.3 MẠNG NƠ RON NHÂN TẠO 14

2.3.1 Ưu điểm 14

2.3.2 Nhược điểm 15

2.4 CÁC CÔNG TRÌNH GẦN ĐÂY 16

2.4.1 Tình hình nghiên cứu dự báo chuỗi dữ liê ̣u thời gian hiê ̣n nay 16

2.4.3 Một số mô hình lai ghép 17

CHƯƠNG 3: CƠ SỞ LÝ THUYẾT 19

3.1 PHƯƠNG PHÁP LÀM TRƠN KIỂU HÀM MŨ 19

3.1.1 Mô hình làm trơn hàm mũ bậc một (ES1) 19

3.1.2 Mô hình làm trơn hàm mũ bâ ̣c hai (ES2) 21

3.1.3 Mô hình làm trơn hàm mũ bâ ̣c ba (ES3) 23

3.1.4 Mô hình cô ̣ng và mô hình nhân 24

3.2 MÔ HÌNH MẠNG NƠ RON NHÂN TẠO 26

3.2.1 Cấu trúc tổng quát của mô ̣t ANN 26

3.2.2 Qui trình xử lý thông tin của một ANN 27

3.2.3 Quá trình ho ̣c của ANN 29

3.2.4 Nguyên tắc hoa ̣t đô ̣ng và các giải thuâ ̣t huấn luyê ̣n ma ̣ng nơ ron 30

3.3 HƯỚNG TIẾP CẬN MÔ HÌNH LAI GHÉP 41

3.3.1 Lý do cho ̣n kỹ thuâ ̣t làm trơn hàm mũ để bổ sung cho ANN trong dự báo dữ liê ̣u chuỗi thời gian ngắn ha ̣n 41

3.3.2 Sử du ̣ng phần mềm R để ước lượng các tham số cho mô hình ES3 41

3.3.3 Thực hiê ̣n mô hình lai ghép ANN-ES3 42

CHƯƠNG 4: HIỆN THỰC VÀ THỬ NGHIỆM 45

4.1 HIỆN THỰC 45

4.1.1 Mô đun ANN 45

4.1.2 Mô đun làm trơn hàm mũ 47

4.1.3 Mô đun lai ghép 49

4.2 DỮ LIỆU THỬ NGHIỆM 50

Trang 9

4.3 KẾT QUẢ THỬ NGHIỆM VÀ ĐÁNH GIÁ 52

4.3.1 Bộ dữ liệu 1: Sản xuất sắt cơ bản hàng tháng tại Úc 54

4.3.2 Bộ dữ liệu 2: Số liệu tài chính M2 hàng tháng tại Mỹ 56

4.3.3 Bộ dữ liệu 3: Lượng tiêu thụ Chocolate hàng tháng tại Úc 58

4.3.4 Bộ dữ liệu 4: Nhiệt độ cao nhất hàng tháng tại Paris, Pháp 60

4.3.5 Bộ dữ liệu 5: Số liệu đóng cửa của chỉ số công nghiệp Dow-Jones 62

4.3.6 Bộ dữ liệu 6: Số nữ thất nghiệp hàng tháng tại Mỹ 64

4.3.7 Bộ dữ liệu 7: Doanh số xi măng hàng quý tại Úc 66

4.3.8 Bộ dữ liệu 8: Mực nước hàng tháng của hồ Erie 68

4.3.9 Bộ dữ liệu 9: Sản lượng điện hàng quý tại Úc 70

4.3.10 Bộ dữ liệu 10: Số lượng người di cư hàng tháng tại Úc 72

4.4 TỔNG HỢP, ĐÁNH GIÁ VÀ NHẬN XÉT CHUNG 73

CHƯƠNG 5: KẾT LUẬN 77

5.1 Những công việc đã thực hiện được 77

5.2 Kết quả đạt được 78

5.3 Mặt ha ̣n chế 78

5.4 Hướng phát triển của luâ ̣n văn 78

TÀI LIỆU THAM KHẢO 80

PHỤ LỤC 82

PHỤ LỤC A 82

PHỤ LỤC B 84

PHỤ LỤC C 95

PHỤ LỤC D 105

Trang 10

DANH MU ̣C HÌNH

Hình 1.1: Hình ảnh một chuỗi thời gian 1

Hình 1.2: Mô ta ̉ thành phần xu hướng tiến lên 2

Hình 1.3: Mô ta ̉ thành phần mùa 2

Hình 1.4: Mô ta ̉ thành phần chu kỳ 3

Hình 1.5: Vi ́ dụ dự báo dữ liệu chuỗi thời gian 4

Hình 1.6: Một chuỗi dữ liệu thời gian tuyến tính 6

Hình 1.7: Một chuỗi dữ liệu thời gian phi tuyến tính 6

Hi ̀nh 3.1: Một chuỗi dữ liê ̣u thời gian không có thời vụ và xu hướng rõ ràng 20 Hi ̀nh 3.2: Một dự báo bằng phương pháp ES1 21

Hi ̀nh 3.3: Một ví dụ về dữ liệu có tính mùa 22

Hi ̀nh 3.4: Một dự báo bằng phương pháp ES2 22

Hi ̀nh 3.5: Một dự báo bằng mô hình cộng và mô hình nhân 25

Hi ̀nh 3.6: Minh họa một ANN 26

Hi ̀nh 3.7: Mô tả kiến trúc ANN 26

Hi ̀nh 3.8: Mô tả qui trình xử lý thông tin của một ANN 27

Hi ̀nh 3.9: Mô tả về hàm truyền 28

Hi ̀nh 3.10: Mô tả các kiểu kiến trúc ANN 29

Hi ̀nh 3.11: Mô tả một perceptron 30

Hi ̀nh 3.12: Mô tả về giải thuật lan truyền ngược 35

Hi ̀nh 3.13: Mã giả cho giải thuật RPROP 39

Hi ̀nh 3.14: Mô hình dự báo lai ghép 42

Hi ̀nh 4.1: Các mô đun của mô hình lai ghép 45

Hi ̀nh 4.2: Giao diện mô đun ANN 46

Hi ̀nh 4.3: Giao diện mô đun làm trơn hàm mũ 48

Hi ̀nh 4.4: Giao diện mô đun lai ghép 49

Hi ̀nh 4.5: Bộ dữ liệu 1 – Sản xuất sắt cơ bản hàng tháng tại Úc 54

Hi ̀nh 4.6: Sai số dự báo của 4 mô hình cho bộ dữ liệu 1 54

Trang 11

Hi ̀nh 4.7: Bộ dữ liệu 2 – Số liệu tài chính M2 hàng tháng tại Mỹ 56

Hi ̀nh 4.8: Sai số kết quả dự báo của 4 mô hình cho bộ dữ liệu 2 56

Hi ̀nh 4.9: Bộ dữ liệu 3 – Lượng tiêu thụ Chocolate hàng tháng tại Úc 58

Hi ̀nh 4.11: Bộ dữ liệu 4 – Nhiệt độ cao nhất hàng tháng tại Paris 60

Hi ̀nh 4.13: Bộ dữ liệu 5 – Số liệu đóng cửa chỉ số Dow-Jones 62

Hi ̀nh 4.15: Bộ dữ liệu 6 – Số người nữ thất nghiệp hàng tháng tại Mỹ 64

Hi ̀nh 4.17: Bộ dữ liệu 7 – Doanh số xi măng hàng quý tại Úc 66

Hi ̀nh 4.19: Bộ dữ liệu 8 – Mực nước trung bình hàng tháng của hồ Erie 68

Hi ̀nh 4.21: Bộ dữ liệu 9 – Sản lượng điện hàng quý tại Úc 70

Hi ̀nh 4.23: Bộ dữ liệu 10 – Số lượng người di cư hàng tháng tại Úc 72

Hi ̀nh 4.25: Biểu đồ so sánh độ chính xác dự báo 75

Trang 12

DANH MU ̣C BẢNG

Ba ̉ng 4.1: Bảng mô tả 10 bộ dữ liệu thử nghiệm 52

Ba ̉ng 4.2: Cấu hình tốt nhất ứng với các mô hình cho bộ dữ liệu 1 55

Ba ̉ng 4.3: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 2 57

Ba ̉ng 4.10: Cấu hình tốt nhất cho các mô hình ứng với bộ dữ liệu 9 71

Ba ̉ng 4.12: Bảng so sánh sai số dự báo MAPE của 4 mô hình trên 10 bộ dữ liệu thư ̉ nghiê ̣m 74

Ba ̉ng 4.13: Bảng so sánh thời gian chạy và độ chính xác dự báo trung bình cu ̉a bốn mô hình 75

Trang 13

DANH MỤC TỪ VIẾT TẮT

ANN Atifical Neural Network Mạng nơron nhân ta ̣o

ANN-ES1 Atifical Neural Network - Simple

Exponential Smoothing

Lai ghép ma ̣ng nơ ron và

làm trơn hàm mũ bâ ̣c I ANN-ES3 Atifical Neural Network - Triple

Exponential Smoothing

Lai ghép ma ̣ng nơ ron và

làm trơn hàm mũ bâ ̣c III

ARMA Autoregressive Moving Average Mô hình tự hồi quy trung

bình trượt ARIMA Autoregression Integrated Moving

Average

Mô hình tự hồi quy tích

hợp trung bình trượt

ES Exponential Smoothing Làm trơn hàm mũ

ES1 Simple Exponential Smoothing Làm trơn hàm mũ bậc 1 ES2 Double Exponential Smoothing Làm trơn hàm mũ bậc 2

ES3 Triple Exponential Smoothing Làm trơn hàm mũ bậc 3,

còn gọi là là Holt-Winter

MA Moving Average Mô hình trung bình trượt

PE Processing Elements Những thành phần xử lý

SARIMA Seasonal Autoregression Integrated

Moving Average

Mô hình tự hồi quy trung bình trượt có tính mùa

Trang 15

CHƯƠNG 1: GIỚI THIỆU

1.1 CƠ SỞ HÌNH THÀNH LUẬN VĂN

1.1.1 Đi ̣nh nghi ̃a chuỗi dữ liê ̣u thời gian

Một tâ ̣p hợp các quan sát theo trình tự thời gian được gọi là dữ liê ̣u chuỗi thời gian [19] Ví du ̣ một chuỗi dữ liê ̣u thời gian được minh họa như hình 1.1 [19], trong hình này trục hoành là những khoảng thời gian đều nhau, trục tung là những giá trị

đo được theo thời gian liên tiếp đều nhau đó, gọi chúng là đại lượng X

Hình 1.1: Hình ảnh một chuỗi thời gian

Các mô hình chuỗi thời gian thường dùng trong việc dự báo hiện nay gồm có:

- Các mô hình hồi quy

- Các mô hình xác suất

- Các mô hình tất đi ̣nh

1.1.2 Ca ́ c thành phần của dữ liê ̣u chuỗi thời gian

Trong thực tế, một chuỗi thời gian rất đa dạng Tuy vậy, có thể có các thành phần chính như sau:

- Thành phần xu hướng dài hạn (long – term trend component): để đại diện cho

yếu tố xu hướng, nó thể hiện trong thời gian dài thì đại lượng X có thể có sự giảm hoặc tăng Có thể biểu diễn trên đồ thị thành phần này như là một đường cong trơn hoặc một đường thẳng Đây thường là kết quả của các yếu tố dài ha ̣n, ví dụ như yếu tố thay đổi về nhân khẩu, công nghê ̣, du lịch hay sở thích giải trí và tiêu

Trang 16

dùng Hình 1.2 [25] là một ví dụ biểu diễn về một chuỗi thời gian với xu hướng

có tính tiến lên

Hình 1.2: Mô ta ̉ thành phần xu hướng tiến lên

- Thành phần mùa (seasonal component): đặc trưng cho xu hướng giảm hoặc tăng đối với đại lượng X vào một giai đoạn thời gian cụ thể Tính mùa vụ xảy ra khi tồn tại một loạt ảnh hưởng của yếu tố mùa vụ (các quí của năm, các tháng hay các ngày trong tuần) Tính mùa vụ luôn xảy ra trong một khoảng thời gian cố định và mang tính tuần hoàn

Ví dụ:

 Lượng điện tiêu thụ thường tăng trong mùa hè và thường giảm ở mùa xuân hoặc lượng nước tiêu dùng thường giảm ở mùa đông và tăng ở mùa hè

 Lượng vật liệu xây dựng tiêu thụ thường tăng trong đầu mùa khô

Một ví du ̣ về thành phần mùa (theo các mùa trong năm) có thể được biểu diễn

ở hình 1.3 [25] Tính biến đô ̣ng có thể theo ngày, theo tuần hay theo giờ mà không phải chỉ với các mùa trong năm

Hình 1.3: Mô ta ̉ thành phần mùa

Trang 17

- Thành phần chu kỳ (cyclical component): mô tả đại lượng X thay đổi theo chu kỳ nào đó Tính chu kỳ tồn tại khi có sự tăng lên hay giảm xuống, lặp lại trong một giai đoạn Tuy nhiên, giai đoạn này là không cố định Hình 1.4 [25] mô tả một ví du ̣ về thành phần chu kỳ trong chuỗi thời gian cụ thể

Hình 1.4: Mô ta ̉ thành phần chu kỳ

- Thành phần bất thường (irregular component): Trong chuỗi thời gian có những

giá trị biến đổi bất thường, đây là thành phần đại diện cho sự biến đổi của những giá trị đó Tính chu kỳ trong thành phần này không có Các số liệu ở quá khứ

không có khả năng dự đoán sự biến đổi của những giá trị bất thường này

1.1.3 Phân ti ́ch dữ liê ̣u chuỗi thời gian và ứng dụng

Khi phân tích dữ liệu chuỗi thời gian có thể giúp xử lý được khá nhiều lớp bài toán ở thực tế, một số bài toán chính như: tìm kiếm tương tự (similarity search), gom cụm (clustering), phân loại (classification), tìm quy luật của dữ liệu (rule discovery), phát hiện điểm bất thường (anomaly detection), tìm mẫu lặp (finding motif), dự báo

dữ liệu (prediction) trong tương lai Vì thế dữ liệu chuỗi thời gian hiện nay được ứng dụng phổ biến, rộng rãi, đa dạng ở nhiều ngành nghề và lĩnh vực, ví dụ:

- Ứng dụng nhận dạng kiểu tăng trưởng giống nhau của nhiều công ty từ đó có quyết định hoặc định hướng và đầu tư hợp lý

- Ứng dụng nhận dạng chữ viết tay: việc biểu diễn chữ viết, so sánh những đặc điểm tương tự của hai hoặc nhiều chữ viết (ở dạng chuỗi dữ liệu) để tìm ra chữ viết có phải của một người hay không hiện nay được ứng dụng một cách phổ biến và rộng rãi

Trang 18

- Ứng dụng vào thị trường chứng khoán với việc xác định sự biến động, thay đổi giá trị cổ phiếu

- Phân tích, dự đoán lạm phát trong một quốc gia

Trong luận văn này, chúng tôi nghiên cứu về bài toán dự báo trên chuỗi thời gian ngắn hạn

1.1.4 Tầm quan tro ̣ng và ứng du ̣ng của dự báo dữ liê ̣u chuỗi thời gian

Dự báo dữ liệu chuỗi thời gian (time series forecasting) là việc dự đoán những

giá trị tương lai sao cho những giá trị dự đoán này đạt được độ chính xác càng cao

càng tốt Cụ thể, bài toán này sử dụng chuỗi giá trị trong quá khứ và hiện tại x t-n ,…

x t-2 , x t-1 , xt để tìm ra các liên kết, các mẫu, các quy luật biến đổi nhằm dự đoán những

giá trị trong tương lai x t+1 , x t+2 Hình 1.5 [11] là một ví dụ về biểu diễn dự báo bằng

đồ thị, với đường màu đỏ là giá trị dự báo

Hình 1.5: Vi ́ dụ dự báo dữ liệu chuỗi thời gian

Việc dự báo dữ liệu chuỗi thời gian có nhiều ứng dụng phổ biến như:

- Ứng dụng dự đoán những sự việc không mong muốn hay không tránh khỏi nhằm hạn chế ảnh hưởng của nó Ví dụ, dự báo sắp có động đất để có định hướng, biện pháp hay quyết định phù hợp hợp nhằm hạn chế hậu quả

- Ứng dụng dự đoán những sự việc không mong muốn nhằm ngăn cản chúng xảy ra bằng cách dự đoán sự kiện rồi có các biện pháp hợp lý Ví dụ, dự báo

Trang 19

chỉ số lạm phát của một quốc gia, căn cứ vào đó chính quyền có các quyết sách, giải pháp hợp lý nhằm ngăn cản chỉ số này vượt quá mức cho phép

- Ứng dụng dự báo những biến động của thị trường, dự đoán giá cả cổ phiếu hay giá trị chứng khoán trên thị trường, dựa vào đó nhằm thu được lợi nhuận

1.1.5 Ca ́ c phương pháp dự báo dữ liê ̣u chuỗi thời gian

Căn cứ theo kỹ thuật dự báo, Sallehuddin và cộng sự (2009) [12] chia những phương pháp dự báo thành hai loa ̣i: thống kê và trí tuê ̣ nhân ta ̣o (statistical and artificial intelligence) như sau:

- Thống kê gồm có: mô hình làm trơn hàm mũ (exponential smoothing), mô hình hồi quy đa biến (multivariate regression), đa hồi quy (multiple regression)

và mô hình ARIMA

- Trí tuê ̣ nhân ta ̣o bao gồm: logic mờ (fuzzy logic), giải thuâ ̣t di truyền, ma ̣ng

nơ ron và ho ̣c máy

Khi dự báo dùng phương pháp nào cần căn cứ vào những tính chất cụ thể của từng loại dữ liệu Khi gặp chuỗi dữ liệu thời gian có ít tính chất có thể dùng một trong những phương pháp đơn lẻ như đã trình bày ở phần trên Tuy vậy, thực tế đã chứng minh rằng ngay trong một chuỗi dữ liệu thời gian rất đa dạng và thường tồn tại nhiều tính chất trong mẫu, đặc biệt là tính bất thường, các nhà nghiên cứu hiện nay hướng tới phát triển các biến thể từ mô hình cơ bản hoặc nghiên cứu lai ghép kết hợp giữa nhiều mô hình với nhau nhằm nâng cao hiệu suất dự báo

1.2 TÍNH CẤP THIẾT CỦA ĐỀ TÀI

Dữ liệu chuỗi thời gian hiện diện trong rất nhiều ứng dụng thực tế, từ những

lĩnh vực kinh tế, thị trường cho đến khí tượng, thủy văn… Trong các ứng dụng này, việc ứ ng du ̣ng dữ liê ̣u chuỗi thời gian để dự báo là một công việc rất cần thiết

Dựa trên số lượng, dữ liê ̣u chuỗi thời gian được phân thành hai loa ̣i: ngắn ha ̣n

và dài ha ̣n Việc nghiên cứu căn cứ vào đặc điểm của dữ liê ̣u để dự báo được các nhà nghiên cứu quan tâm trong thời gian gần đây [1,3,7,10,12,14,16] Các công trình này thực sự hữu ích đối với việc khai thác dữ liệu các chuỗi thời gian khác nhau

Trang 20

Đối với dữ liệu ngắn hạn, việc tìm và chọn được phương pháp phù hợp là việc cần giải quyết Theo Hyndman [11] là không có câu trả lời dễ dàng, nó phụ thuộc vào

số lượng tham số mô hình cần ước tính và lượng ngẫu nhiên trong dữ liệu Kích thước mẫu được yêu cầu tăng theo số lượng tham số và lượng nhiễu trong dữ liệu

Dựa vào tính chất, chuỗi thờ i gian thường tồn ta ̣i ở hai da ̣ng chính là: có tính tuyến tính và không có tính tuyến tính (phi tuyến) Chuỗi thời gian tuyến tính là chuỗi

có sự biến đổi tuân theo quy luật nhất định Hình 1.6 [19] minh họa một chuỗi dữ liệu thời gian tuyến tính

Hình 1.6: Một chuỗi dữ liệu thời gian tuyến tính

Chuỗi thời gian phi tuyến tính là chuỗi có sự biến đổi bất thường, sự biến đổi không có qui luật Hình 1.7 [19] minh họa một chuỗi dữ liệu thời gian phi tuyến tính

Hình 1.7: Một chuỗi dữ liệu thời gian phi tuyến tính

Trang 21

Tuy nhiên trong cù ng mô ̣t chuỗi dữ liê ̣u thời gian có thể xen lẫn cả 2 da ̣ng tuyến tính và phi tuyến Đây là loại dữ liệu cần được nghiên cứu tìm ra phương pháp

dự báo đạt tính chính xác cao

Hiện nay, việc giải quyết bài toán dự báo dữ liệu chuỗi thời gian ngày càng được quan tâm của cộng đồng khoa học [1,3,7,10,12,14,16] Đã có đề xuất với các phương pháp khác nhau, tuy nhiên mỗi phương pháp đều có những nhược điểm và

ưu điểm riêng Riêng với dự báo dữ liê ̣u chuỗi thời gian ngắn ha ̣n, viê ̣c tìm ra phương pháp dự báo thỏa mãn cả về đô ̣ dài dữ liê ̣u dùng trong dự báo, độ phức ta ̣p của thuâ ̣t toán và độ chính xác của kết quả dự báo là mô ̣t bài toán khó Phổ biến nhất trong dự báo trên dữ liệu thời gian ngắn ha ̣n tuyến tính và phi tuyến tính là hai phương pháp:

dự báo dựa trên kỹ thuật làm trơn hàm mũ (ES) và mạng nơ ron (ANN) bở i chúng không bắt buộc phải có dữ liê ̣u mẫu có kích thước lớn, thời gian đáp ứng nhanh, dễ

dàng thực hiê ̣n, nắm bắt được tính bất thường của dữ liệu và ít chi phí Mặc dù vậy, nhiều nghiên cứu đã chứng minh rằng chất lượng dự báo của phương pháp làm trơn hàm mũ với dữ liệu có tính phi tuyến không cao và ANN với dữ liệu tuyến tính hay

xu hướng và mùa chưa tốt [8,9,13,14,16]

Các phương pháp gần đây ứng du ̣ng khá thành công kỹ thuâ ̣t làm trơn hàm

mũ, ARIMA hay SAMIRA đối với chuỗi dữ liê ̣u thời gian tuyến tính hoă ̣c áp dụng phương pháp ANN cho chuỗi dữ liê ̣u thời gian phi tuyến Gần đây, có nhiều công trình ứng du ̣ng một số phương pháp truyền thống cho từng loại dữ liê ̣u cu ̣ thể như [1,3,7,10,12,16] Tuy nhiên dữ liệu trong thế giới thực rất phức ta ̣p, đồng thời tồn ta ̣i

các mẫu phi tuyến và tuyến tính trong cùng mô ̣t chuỗi thời gian Nên chỉ dùng mô

hình phi tuyến hoă ̣c tuyến tính đơn lẻ là không đủ bởi có khả năng bỏ qua đă ̣c điểm phi tuyến hay tuyến tính củ a dữ liê ̣u Bên cạnh đó, đa số những phương pháp hiê ̣n nay đa số để xử lý một loại dữ liê ̣u cu ̣ thể mà chưa áp du ̣ng đa da ̣ng các loa ̣i dữ liê ̣u chuỗi thờ i gian

Với những phân tích như trên, đồng thời theo R.J.Hyndman và cộng sự [11], kết hợp nhiều dự báo dẫn đến tăng hiệu quả dự báo Vì thế, nhằm hạn chế các yếu

Trang 22

điểm trên cần có một mô hình mới có thể đồng thời nắm bắt được các đă ̣c điểm tuyến

tính lẫn phi tuyến tính trong cùng một chuỗi dữ liệu Tức là, cần thiết phải lai ghép

mô hình phi tuyến với tuyến tính dựa trên ha ̣n chế của mỗi mô hình

1.3 MỤC TIÊU NGHIÊN CỨU

1.3.1 Mu ̣c tiêu nghiên cứu tổng quát

Chúng tôi xây dựng và hiện thực mô hình mới có khả năng dự báo đa dạng dữ liệu chuỗi thời gian ngắn ha ̣n đồng thời cho chất lượng dự báo tốt hơn

Nghiên cứu lai ghép giữa kỹ thuật ANN và kỹ thuâ ̣t làm trơn hàm mũ, do hai

kỹ thuâ ̣t này bổ sung lẫn nhau Mô ̣t mă ̣t, ANN có thể phát hiê ̣n các đă ̣c trưng phi tuyến tính bị ẩn khó phát hiện trong dữ liê ̣u Mă ̣t khác, mô hình làm trơn hàm mũ cho

kết quả tốt trong các mẫu tuyến tính của chuỗi thời gian [9,11]

Chú ng tôi dùng kỹ thuâ ̣t làm trơn hàm mũ bâ ̣c ba (ES3) [1] có ưu điểm nắm bắt được tính mùa, tính xu hướng, yêu cầu dữ liệu mẫu nhỏ để lai ghép với ANN bằng phương pháp lai “nghi ̣ viê ̣n” [9] bởi cách lai này là đơn giản, thực hiện dễ dàng và ít chi phí

Chúng tôi hiện thực mô hình ANN-ES3 sau đó thử nghiệm trên nhiều bộ dữ liệu ngắn hạn để so sánh, kiểm tra và đánh giá mô hình đề xuất với ba mô hình: ANN, ES3 và mô hình lai ANN-ES1, kiểm tra tính đúng đắn về mặt lý thuyết Mô hình chúng tôi đề xuất cho hiệu suất dự đoán cao hơn so với các mô hình còn lại

1.3.2 Mu ̣c tiêu nghiên cứu cụ thể

 Nghiên cứu kỹ thuâ ̣t làm trơn hàm mũ bâ ̣c một

 Nghiên cứu kỹ thuâ ̣t làm trơn hàm mũ bâ ̣c hai

 Nghiên cứu kỹ thuâ ̣t làm trơn hàm mũ bâ ̣c ba

 Nghiên cứu các phương pháp ước lượng giá trị các tham số trong kỹ thuâ ̣t

làm trơn hàm mũ Sử dụng phương pháp phù hợp là phần mềm R

 Nghiên cứu cách dự báo bằng ANN

 Nghiên cứu phương pháp lai ghép được đề xuất bởi Lai [9] và các cộng sự

Trang 23

Thực nghiệm, kiểm tra, so sánh, đánh giá các phương pháp bằng những bô ̣ dữ liệu thời gian ngắn hạn khác nhau ở đa dạng các lĩnh vực theo những tiêu chí:

o Chất lượng dự báo

o Thời gian đáp ứng

o Tính thích nghi với dữ liệu

1.4 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU

Đối tượng: dự báo dữ liệu chuỗi thời gian ngắn ha ̣n với kích thước nhỏ áp dụng

kỹ thuâ ̣t lai ghép ANN-ES3 nhằm dự báo đa dạng các loa ̣i dữ liê ̣u

Phạm vi: chúng tôi nghiên cứu, hiện thực việc lai ghép ANN-ES3 để dự báo

dữ liệu chuỗi thời gian ngắn hạn vớ i đa dạng loại dữ liệu thuộc các lĩnh vực như chứng khoán, sản xuất, thời tiết, thủy văn, dân số, lao động, tài chính, … Nguồn dữ liệu có được từ thư viện dữ liệu chuỗi thời gian của giáo sư R.J.Hyndman tại

1.5 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI

Luận văn này tiến hành hiê ̣n thực việc lai ghép ANN và kỹ thuật làm trơn hàm

mũ bâ ̣c 3 để nâng cao chất lượng dự báo dữ liê ̣u chuỗi thời gian ngắn ha ̣n với đa dạng các loại dữ liệu cho chất lượng cao hơn các mô hình đơn thuần

Thực hiện việc chạy thực nghiệm với nhiều bộ dữ liệu trong thực tế có các tính chất khác nhau, đánh giá và kiểm tra tính đúng đắn của cơ sở lý thuyết và quá trình hiện thực

Trang 24

1.6 CẤU TRÚC LUÂ ̣N VĂN

Phần còn la ̣i được chúng tôi trình bày theo cấu trúc sau:

- Chương 2: trình bày tổng thuật các công trình liên quan như: các mô hình của Box-Jenkins, các mô hình của Holt-Winters và mô hình ANN

- Chương 3: trình bày cơ sở lý thuyết về: kỹ thuật ES, ANN, mô hình lai ES1 và ý tưởng thực hiện mô hình lai ghép ANN-ES3 dự báo chuỗi thời gian ngắn ha ̣n

ANN Chương 4: trình bày cách hiện thực, kết quả thử nghiệm và đánh giá hiệu suất

của mô hình lai ANN-ES3

- Chương 5: đánh giá kết quả đạt được, các mặt hạn chế, đưa ra hướng phát

triển của đề tài

Trang 25

CHƯƠNG 2: TỔNG THUẬT CÁC CÔNG TRÌNH

LIÊN QUAN

Chương này sẽ giới thiệu những phương pháp thông du ̣ng thường dùng để dự

báo dữ liê ̣u chuỗi thời gian ngắn ha ̣n cùng ưu, nhược điểm của chúng, bao gồm: phương pháp của Box-Jenkins, phương pháp làm trơn hàm mũ và ma ̣ng nơ ron nhân

t giá trị của biến số được cho là Y t thì Y t = f (Y t-1 , Y t-2 , , Y0, t) Công thức của mô

hình ARIMA [11] như sau:

2.1.2 Mô hình Seasonal ARIMA

Mô hình Seasonal ARIMA gồm hai yếu tố được kết hợp chặt chẽ: có tính mùa, không có tính mùa Công thức 2.2 là tính toán thu gọn củ a SARIMA [11]

ARIMA (p, d, q)×(P, D, Q)S

(2.2)

Trong đó P, D, Q là các biến số giải thích SARIMA với ý tưởng chính là xem

xét các biến số giải thích tốt nhất để mô hình mẫu có tính mùa Phương trình hồi qui

Trang 26

chứa biến số giải thích ở bên phải, trong phân tích hồi qui thường có sự thay đổi của một biến độc lập, biến số giải thích này có chức năng giải thích những thay đổi đó

2.1.3 Ưu điểm cu ̉ a mô hình Box-Jenkins

- Các mô hình do Box-Jenkins đề xuất, cụ thể là ARIMA và SARIMA có tính phổ biến bởi sự chính xác của nó trong công tác dự báo

- Hyndman [11] chỉ ra rằng, mô hình Box-Jenkins có thể phù hợp với dữ liệu đào tạo là khá tốt Có kết quả dự báo với độ chính xác cao trên dãy số liệu mẫu khá lớn

- Do có cả tính tự hồi quy và trung bình trượt nên mô hình Box-Jenkins khá linh đô ̣ng

- Theo Ong và cộng sự [2], mô hình Box-Jenkins trong thực tế có khả năng miêu tả rộng những đặc điểm của chuỗi thời gian thường gặp, nó khá mềm dẻo

2.1.4 Nhươ ̣c điểm của mô hình Box-Jenkins

- Nhược điểm lớn nhất là xác đi ̣nh mô hình khó khăn bởi khó ước lượng bậc của trung bình trượt cũng như tự đô ̣ng hồi quy … Khi sử du ̣ng cần phải “thử và sửa sai”

Nếu nhâ ̣n da ̣ng mô hình sai sẽ ta ̣o ra các giai đoa ̣n sai trong mô hình nhâ ̣n da ̣ng và phải nhâ ̣n da ̣ng la ̣i mô hình Theo R.J.Hyndman và cộng sự [11], mô hình Box-Jenkins cập nhâ ̣t các tham số và đưa thêm dữ liê ̣u vào khá khó khăn Do đó, cần có lượng thời gian và tài nguyên khá tốn kém

- Cũng theo R.J.Hyndman và cộng sự [11], mô hình Box-Jenkins phù hợp với

dữ liệu đào tạo tốt nhưng không chắc là sẽ dự báo tốt, mô hình Box-Jenkins không áp du ̣ng cho cấu trúc dữ liê ̣u phi tuyến, đây là mô ̣t trở nga ̣i lớn

- Mô hình Box-Jenkins theo định kỳ bắt buộc phải được xây dựng lại, mô hình mới hoàn thiện hơn phải được chọn lại trong nhiều trường hợp, tức là cần có nhiều kinh nghiệm

- Khi dữ liệu có tính mùa thì ARIMA không hỗ trợ Khi gặp loại dữ liệu này,

nó cần phải biến đổi hoặc dùng SARIMA thay thế

- Cuối cùng, với dữ liệu chuỗi thời gian ngắn hạn thì mô hình Box-Jenkins chưa thực sự phù hợp vì chúng cần nhiều dữ liệu lịch sử

Trang 27

2.2 CÔNG TRÌNH CỦA HOLT-WINTERS

2.2.1 Giơ ́ i thiê ̣u mô hình

Mô hình làm trơn kiểu hàm mũ (Exponential Smoothing hay ES) [11] là kỹ thuật dự báo rất hữu hiê ̣u trong nhiều tình huống dự báo được công bố bởi C.C.Holt

lần đầu dùng cho chuỗi thời gian không có tính xu hướng và mùa Sau đó C.C.Holt bổ sung cho mô hình này có khả năng làm việc được với dữ liê ̣u có xu hướng Cuối

cù ng, Winter bổ sung để có thể dự báo cho dữ liê ̣u có tính mùa Do đó phương pháp

này có tên là “Holt-Winters”

Trong mô hình làm trơn hàm mũ, những quan sát cũ hơn được gán tro ̣ng số giảm theo cấp số nhân Tức là, các quan sát càng mới thì giá trị tro ̣ng số được gán càng lớ n so với những quan sát càng cũ

Trong trung bình di ̣ch chuyển các tro ̣ng số gán cho quan sát luôn bằng nhau

và (bằng 1/N, với số mẫu là N) Tuy nhiên, trong kỹ thuâ ̣t làm trơn hàm mũ, có mô ̣t

hoặc nhiều tham số được ước lượng và các tham số này sẽ quyết đi ̣nh giá trị tro ̣ng số

gán cho những quan sát

- Một lợi ích cho cả viê ̣c biểu diễn dữ liê ̣u cũng như dự báo là kỹ thuâ ̣t làm trơn

hàm mũ có khả năng hạn chế tác đô ̣ng của sự biến đổi ngẫu nhiên nếu áp du ̣ng đúng,

vì thế giúp dễ thấy các hiê ̣n tượng cơ bản [8] Kỹ thuật này được go ̣i là “làm trơn” vì khi biểu diễn dữ liê ̣u nó loa ̣i bỏ các răng cưa không bằng phẳng gắn liền với sự thay đổi ngẫu nhiên và để la ̣i mô ̣t đường thẳng hoă ̣c đường cong

- Theo Hyndman [11], về bộ thử nghiệm thì mô hình làm trơn hàm mũ dự báo chính xác hơn ARIMA

- So với các phương pháp dự báo khác, phương pháp này là đơn giản, thực hiê ̣n

dễ, chi phí thấp

Trang 28

2.2.3 Nhươ ̣c điểm

- Với chuỗi dữ liệu thời gian, kỹ thuâ ̣t làm trơn hàm mũ chỉ nắm bắt được các

đă ̣c điểm tuyến tính [9] trong khi ở thực tế chúng thường xen lẫn tính chất phi tuyến

và xuất hiện những điểm bất thường Bởi thế, mô hình này thường chỉ dùng trong lớp

mô hình tuyến tính

- Khi hằng số làm trơn giảm theo hàm mũ thì mô hình này cho ra một mô hình giản di ̣ thái quá mà chỉ dùng vài giá tri ̣ trước đó để dự báo Vì thế không thể tìm được

các mẫu không tuyến tính trong dữ liê ̣u như đề cập của Lai và cộng sự [9]

- Theo Hyndman [11], về mặt dữ liệu đào tạo thì mô hình kỹ thuật làm trơn hàm

mũ tỏ ra khó khăn để phù hợp hơn ARIMA

- Đối với các nhân tố nhân quả bên ngoài, mô hình làm trơn hàm mũ không thể bao gồ m chúng

Do đó, muốn chất lượng dự báo được nâng cao cho mô hình làm trơn hàm mũ thì cần phải nghiên cứu những phương pháp phi tuyến khác để bổ sung

2.3 MA ̣NG NƠ RON NHÂN TẠO

ANN đặc biệt có ưu thế trong việc nắm bắt các ước lượng phi tuyến [17], vì

vậy người ta thường dùng ANN để hạn chế các yếu điểm của những mô hình làm trơn kiểu hàm mũ và Box-Jenkins Lý thuyết về ANN được trình bày chi tiết ở chương Cơ

sở lý thuyết Sau đây chúng tôi trình bày những ưu điểm và hạn chế của ANN

2.3.1 Ưu điểm

Khả năng của ANN là khái quát hoá hay là khả năng học, ngay cả đối với trường hợp trong quá trình huấn luyện mà đầu vào ANN chưa từng gặp thì nó cũng

có thể cho những đầu ra hợp lý Ưu điểm nổi bật của ANN được thể hiện:

- ANN có tính thích nghi Hoạt động bản chất của ANN là dùng các luật học để điều chỉnh theo diễn biến thời gian các trọng số khớp Do vậy, về nguyên tắc, ANN tạo nên một hệ thống có tính thích nghi

- ANN được biết đến là phương pháp có hiê ̣u suất ổn đi ̣nh, chi phí thấp [15] Nguyên nhân là dự báo bằng những phương pháp truyền thống khác gặp ha ̣n chế là không thể dự báo tất cả các đă ̣c trưng của li ̣ch sử và bản chất hê ̣ thống tính toán

Trang 29

- Thông thườ ng những phương pháp thống kê thì dữ liê ̣u tuyến tính sẽ có liên quan trong khi ANN lại kết hợp với dữ liê ̣u phi tuyến, vì vâ ̣y theo Sallehuddin và các cộng sự [13], ANN không phải luôn luôn nhất quán, ho ̣ cũng cho rằng do những đă ̣c trưng về nắm bắt dữ liê ̣u hướng thời gian phi tuyến tốt hơn nên ANN thực hiê ̣n tốt hơn Khi mô hình dữ liê ̣u hướng thời gian phi tuyến không có nhiễu, ANN cung cấp

tính hiê ̣u quả và nhất quán Mô ̣t số nghiên cứu đã so sánh ANN với những cách dự

báo truyền thống, kết quả là ANN luôn luôn thực hiê ̣n tốt hơn và rất ma ̣nh mẽ nếu

tầm dự báo tăng

- Với cấu trúc ánh xạ vào - ra nên ANN có thể điều chỉnh đầu ra sao cho có thể đáp ứng sự mong muốn của đầu ra do ANN dùng triệt để thuật toán học có thầy áp

dụng dùng ánh xạ vào - ra, đồng thời ANN cũng có khả năng dùng luật học không có thầy nghĩa là dùng ánh xạ vào - ra để điều chỉnh đầu ra sao cho trọng số khớp đạt được giá trị ổn định (không biết đầu ra mong muốn)

- Hoạt động củ a ANN có tính thích nghi theo các luật học nên về nguyên tắc có thể điều chỉnh dần các sai sót do đó có thể chấp nhận các lỗi, các thiếu sót trong quá trình học Do đó, ANN có tính kháng lỗi

- ANN phù hợp cho dự báo dữ liệu chuỗi thời gian dài ha ̣n

2.3.2 Nhươ ̣c điểm

- ANN gặp khó khăn trong viê ̣c bị bẫy vào điểm cực trị đi ̣a phương và vấn đề quá khớp (overfitting) [5] Đối với ANN thì viê ̣c quá khớp nhiều hơn các mô hình thống kê khác, bởi các mô hình thống kê khác yêu cầu ước lượng tham số nhiều Do

đó ta nên mở rô ̣ng các tham số cần ước lượng nhằm khắc phục hạn chế quá khớp này

- Đồng thời, do quá trình huấn luyê ̣n ma ̣ng phu ̣ thuô ̣c vào cấu trúc, ngưỡng và

dữ liê ̣u huấn luyê ̣n hiê ̣n ta ̣i nên ANN không có các luâ ̣t cho những kích thước mẫu riêng biệt

- Cuối cùng, mô hình ANN có nhược điểm tương tự như của ARIMA đó là yêu

cầu dữ liệu lịch sử lớn [15] Vì thế, ANN cho đô ̣ chính xác thấp khi dự báo chuỗi dữ liệu thời gian ngắn ha ̣n

Trang 30

2.4 CÁC CÔNG TRÌNH GẦN ĐÂY

2.4.1 Ti ̀nh hình nghiên cứu dự báo chuỗi dữ liê ̣u thời gian hiê ̣n nay

Đối với dự báo dữ liê ̣u chuỗi thời gian nói chung, gần đây có nhiều phương pháp mới hiê ̣n đa ̣i như ANN, SVM (Support Vector Machine), Fuzzy logic, Deep learning, LSTM (Long Short-Term Memory), [24] Chúng có ưu điểm khi đưa ra

dự báo chính xác cao, tỏ ra thực sự hiê ̣u quả Mặc dù vậy, chúng cũng tồn tại những nhược điểm nằm ở chính những đă ̣c điểm của chúng là thuâ ̣t toán phức ta ̣p, mất thời gian nhiều để thực hiện hay đòi hỏi lượng dữ liê ̣u đầu vào lớn vì thế chỉ khi ứng du ̣ng với tập dữ liê ̣u lớn chúng mới thực sự hiê ̣u, tức là phù hợp một cách đặc biệt với dự

báo dữ liê ̣u chuỗi thời gian dài ha ̣n

Đối với dự báo dữ liê ̣u chuỗi thời gian ngắn ha ̣n nói riêng, có đă ̣c điểm là tâ ̣p

dữ liê ̣u đầu vào không lớn, đôi khi là rất nhỏ, trong thực tế hiê ̣n nay đa số thường dùng những phương pháp truyền thống như: Holt Winter [1,7], AMIRA [12], SAMIRA [10], phương pháp tiên tiến ANN [3,15] hoặc nghiên cứu phát triển những phương pháp này nhằm có kết quả dự báo cao hơn với một loa ̣i dữ liê ̣u cu ̣ thể bởi chúng ít chi phí và tỏ ra hiê ̣u quả trong dự báo với kết quả tương đối chính xác Đồng thời, nhiều nhà nghiên cứu thường dựa trên những đă ̣c điểm của loa ̣i dữ liê ̣u như tính

mù a, xu hướng hay bất thường để từ đó cho ̣n được phương pháp dự báo phù hợp Mặt khác, các nhà nghiên cứu còn tiến hành lai ghép những phương pháp hiện đại với truyền thống, cu ̣ thể là thường lai ghép những phương pháp truyền thống với ANN để nắm bắt triê ̣t để các đă ̣c điểm phi tuyến tính trong chuỗi dữ liê ̣u thời gian [14,16]

2.4.2 Mô ̣t số mô hình riêng lẻ

Một số mô hình ứng du ̣ng những kỹ thuật dự báo truyền thống: Điển hình là Jayalalitha [7] dùng mô hình làm trơn hàm mũ bậc 1 dự báo nhiê ̣t đô ̣ ta ̣i Ấn Đô ̣, Asep Rusyana [1] dùng mô hình làm trơn hàm mũ bậc ba dự báo hành khách của mô ̣t hãng

hàng không tại Indonesia, hay Peng Chen và cộng sự [10] dự báo nhiệt độ tại Nanjing dùng SAMIRA

Một số mô hình ứng du ̣ng dự báo bằng ANN: E.Akarslan cùng cộng sự [3] nghiên cứu dự báo nhu cầu điện lưới vi mô sử du ̣ng ma ̣ng nơron nhân ta ̣o, Ronald

Trang 31

Wesonga [12] hiện thực cả ANN và AMIRA để so sánh hiệu quả dự báo tốc đô ̣ gió

tại mô ̣t sân bay quốc tế

 Ưu điểm: Các công trình trên dự báo đem la ̣i hiệu suất khá cao với một loại

dữ liê ̣u chuỗi thời gian tuyến tính hoă ̣c phi tuyến tính cu ̣ thể

 Hạn chế: Mô hình ARIMA và SAMIRA yêu cầu nhiều dữ liệu đồng thời việc

xác định mô hình khá khó khăn Mô hình ES sẽ bỏ qua 1 số đă ̣c điểm phi tuyến [8], tương tự mô hình ANN cũng không khai thác triê ̣t để nhất được đă ̣c điểm tuyến tính

củ a dữ liê ̣u Đă ̣c biê ̣t, chúng chỉ hiê ̣u quả cho mô ̣t loa ̣i dữ liê ̣u cu ̣ thể Hiện nay, hầu hết các nhà nghiên cứu tìm cách cải tiến các phương pháp truyền thống đồng thời nghiên cứu lai ghép với các phương pháp hiện đại như là một giải pháp nhằm nâng cao hiệu suất dự báo

2.4.3 Mô ̣t số mô hình lai ghép

Gần đây có nhiều công trình lai ghép các phương pháp hiê ̣n đa ̣i và mô hình dự

báo truyền thống đã được đề xuất với mục đích nâng cao hiệu suất dự báo nhưng phổ biến và nổi bật nhất vẫn là mô hình lai ghép ARIMA - ANN và mô hình lai ghép kỹ thuật làm trơn hàm mũ – ANN

Santosha Rathod [14] nghiên cứ u mô hình lai ARIMA-ANN để dự báo giá cà phê Robusta ở Ấn Độ cho hiệu suất tương đối cao vớ i dữ liê ̣u giá cà phê Tuy nhiên

mô hình ARIMA như đã phân tích, có ha ̣n chế là ARIMA hay SAMIRA không thể

làm viê ̣c với dữ liê ̣u có tính mùa, chi phí khá cao, viê ̣c xác đi ̣nh mô hình khá khó khăn và quan tro ̣ng nhất là nó đòi hỏi dữ liệu lịch sử lớn nên chưa thực sự phù hợp đối với dự báo dữ liê ̣u ngắn hạn

Winita Sulandaria và cộng sự [16] dự báo nhu cầu tải điện dùng mô hình hàm

mũ lai ANN Công trình này đề xuất phương pháp lai ghép giữa làm trơn hàm mũ theo cấp số nhân và ANN với 2 lần mùa (double season) kết hợp chuyển đổi BoxCox, sửa lỗi ARMA và hàm lượng giác với thời gian thay đổi dựa trên fourier Phân hủy chuỗi tải thành các cấp độ, xu hướng, thành phần theo mùa và bất thường làm đầu vào dựa trên thuâ ̣t toán hàm lượng giác và chuỗi Fourier Phương pháp này là mới với hiệu suất dự báo tốt đối với dữ liê ̣u tải điê ̣n Tuy nhiên, dùng hàm lượng giác và

Trang 32

chuỗi fourier khá phức ta ̣p cho dữ liê ̣u chuỗi thời gian, mặt khác dữ liê ̣u tải điê ̣n có

đă ̣c thù riêng để có thể dùng lượng giác và chuỗi fourier phân hủy Trong thực tế tồn tại những dữ liệu khó phân hủy Do vậy, phương pháp này tương đối khó ứng du ̣ng cho những loại dữ liê ̣u đa da ̣ng

Tóm lại, việc lai ghép ARIMA (SARIMA) với ANN, mô hình làm trơn hàm

mũ với với ANN đều đem la ̣i hiệu suất cao hơn khi những mô hình này hoa ̣t đô ̣ng riêng lẻ ARIMA và SARIMA đều có nhiều khó khăn nhất định, đồng thời yêu cầu

dữ liệu mẫu đủ lớn Những nghiên cứ u này thực hiện trên mô ̣t loa ̣i dữ liê ̣u cu ̣ thể mà chưa áp du ̣ng đa da ̣ng các loa ̣i dữ liê ̣u, chúng tương đối khó khăn khi dự báo đa dạng các loại dữ liệu ngắn ha ̣n

Trang 33

CHƯƠNG 3: CƠ SỞ LÝ THUYẾT

Trong chương này chúng tôi sẽ trình bày cơ sở lý thuyết của đề tài, bao gồm

lý thuyết về phương pháp làm trơn kiểu hàm mũ, phương pháp ANN và ý tưởng của

mô hình lai ghép giữa ANN-ES3

3.1 PHƯƠNG PHÁP LÀM TRƠN KIỂU HÀM MŨ

Holt Winter đề xuất phương pháp làm trơn hàm mũ [11] hoa ̣t đô ̣ng dựa trên

các giá tri ̣ quá khứ được xem xét liên tu ̣c, dựa vào trung bình có tro ̣ng số của chuỗi

dữ liê ̣u Khi thời điểm cần dự báo ở càng xa thì trọng số tại đó có giá tri ̣ càng nhỏ

Đây là phương pháp làm trơn tuyến tính, thích hợp với dữ liê ̣u có xu hướng lên hay xuố ng không dự đoán được

Có 3 loại mô hình làm trơn hàm mũ thường được dùng trong các loại dữ liê ̣u thờ i gian khác nhau:

- Loại 1: Làm trơn hàm mũ bậc một (simple exponential smoothing)

- Loại 2: Làm trơn hàm mũ bậc hai (double exponential smoothing)

- Loại 3: Làm trơn hàm mũ bậc ba (triple exponential smoothing)

3.1.1 Mô hi ̀nh làm trơn hàm mũ bậc một (ES1)

Ban đầu, mô hình này [11] được C.C.Holt giới thiệu và áp du ̣ng vào những chuỗi dữ liệu thờ i gian không có tính xu hướng và không có tính mùa Nó liên tu ̣c

sử a la ̣i mô ̣t dự báo dựa vào các kinh nghiê ̣m gần nhất Trung bình (làm trơn) các giá trị quá khứ của chuỗi bằng cách giảm theo cấp số mũ Các quan sát cũ hơn được gán trọng số nhỏ hơn so với các quan sát gần hơn

A t = αY t-1 + (1 – α) A t-1

(3.1)

Dự báo mới = α (quan sát cũ) + (1- α)  dự báo cũ

(3.2)

Với: Y t-1: giá tri ̣ thực ở thời điểm t-1

α: là hằng số làm trơn

A t: giá tri ̣ của dự báo ở thời điểm t

A t-1: giá tri ̣ của dự báo trước t mô ̣t thời điểm

Trang 34

Phương trình trên có thể viết lại theo một cách khác:

A t = A t-1 + α(Y t-1 – A t-1)

(3.3) Trong công thứ c 3.3, giá tri ̣ dự báo mới được tính bằng giá tri ̣ dự báo cũ cô ̣ng

vớ i α lần đô ̣ sai biê ̣t (error) giữa giá tri ̣ dự báo và giá tri ̣ thực Với giá tri ̣ thực có thể

tính bằng cách lấy giá tri ̣ thực đầu tiên hoă ̣c lấy trung bình n quan sát đầu tiên làm

giá tri ̣ dự báo đầu tiên

Trọng số α, còn go ̣i là hằng số làm trơn, nó biểu diễn tỉ lê ̣ phần trăm của lỗi

dự báo Khi α gần với 0 tức là giá tri ̣ dự báo mới gần bằng với giá tri ̣ dự báo cũ Còn khi α gần với 1 thì giá tri ̣ dự báo mới bằng giá tri ̣ dự báo cũ cô ̣ng với đa ̣i lượng hiê ̣u chỉnh, lúc này đa ̣i lượng hiê ̣u chỉnh Y t-1 –A t-1 mang tính quyết định

Hằng số làm trơn α thường được cho ̣n nhỏ khi ta muốn sự dự báo ổn đi ̣nh và

làm trơn các biến đô ̣ng ngẫu nhiên Ngược la ̣i, dùng α lớn nếu muốn các biến động

ngẫu nhiên mang tính quyết định

Phương pháp này phù hợp để dự báo dữ liệu không có xu hướng rõ ràng hoặc

mô hình theo mùa Hình 3.1 [11] là một ví dụ về dữ liệu không hiển thị xu hướng hoặc thời vụ rõ ràng Hình 3.2 [11] là một dự báo đối với dữ liệu không có thời vụ và

xu hướng rõ ràng bằng phương pháp ES1 với đường màu đỏ là kết quả dự báo

Hi ̀nh 3.1: Một chuỗi dữ liê ̣u thời gian không có thời vụ và xu hướng rõ ràng

Trang 35

Hi ̀nh 3.2: Một dự báo bằng phương pháp ES1

3.1.2 Mô hi ̀nh làm trơn hàm mũ bâ ̣c hai (ES2)

Khi dữ liê ̣u có xu hướng và chứa thông tin tham gia vào di ̣ch chuyển hướng lên cao trong tương lai Với loại dữ liê ̣u này thì cần mô ̣t hàm dự báo xu hướng (trend) tuyến tính

Năm 1958, C.C.Holt [8] tiếp tu ̣c đưa ra mô hình go ̣i là phương pháp làm trơn

hàm mũ bâ ̣c hai có khả năng dự báo dữ liê ̣u có xu hướng, tức là cần phải ước lượng

đô ̣ dốc hiê ̣n ta ̣i và biên đô ̣ hiê ̣n ta ̣i bằng cách dùng hai hê ̣ số:

- α: hằng số làm trơn cho biên đô ̣

- β: hằng số làm trơn cho xu hướng

Phương pháp này có ưu điểm ở sự linh hoa ̣t khi cho ̣n tỉ lê ̣ theo dõi biên đô ̣ và

xu hướng Với giả thiết xu hướng là đường thẳng đi lên hoă ̣c đi xuống, có ba phương trình trong phương pháp này:

- Phương trình thứ nhất ước lượng biên đô ̣ của hiê ̣n ta ̣i:

Trang 36

Vớ i:  là hằng số làm trơn cho biên đô ̣

 là hằng số làm trơn để ước lượng xu hướng

A t là giá tri ̣ làm trơn mới (ước lượng của mức hiê ̣n ta ̣i)

Y t là giá tri ̣ thực tế mới ta ̣i thời điểm t

T t là ước lượng xu hướng

Y’ t+p: là dự báo cho p điểm trong tương lai

Khi thực hiê ̣n, cần khởi ta ̣o giá tri ̣ cho A1 = Y1, T1 = 0 hoặc lấy trung bình vài giá tri ̣ thực đầu tiên (thường là 6) làm giá tri ̣ khởi ta ̣o cho A1 và lấy xấp xỉ bằng đô ̣

dốc của đường thẳng xấp xỉ vài quan sát để làm giá tri ̣ khởi ta ̣o cho T1

Phương pháp ES2 phù hợp với dự báo dữ liệu có xu hướng rõ ràng Hình 3.3 [11] là một ví dụ về dữ liệu có tính xu hướng và hình 3.4 [11] là một dự báo đối với

dữ liệu có tính xu hướng bằng phương pháp ES2

Hi ̀nh 3.3: Một ví dụ về dữ liệu có tính xu hướng

Hi ̀nh 3.4: Một dự báo bằng phương pháp ES2

Trang 37

3.1.3 Mô hi ̀nh làm trơn hàm mũ bâ ̣c ba (ES3)

Phương pháp ES3 còn có tên là “Holt-Winters Method” vì vào năm 1965, Winter mở rô ̣ng phương pháp của Holt nhằm ước lượng được tính mùa [8] Khi dữ liệu có tính mùa và tính xu hướng, phương pháp ES3 được ứng du ̣ng Trong phương pháp ES3 (mô hình nhân) dùng bốn phương trình chính:

- Phương trình 1 dùng ước lượng biên đô ̣ (level):

Yt: giá tri ̣ thực tế ta ̣i thời điểm t

Tt: ước lượng xu hướng

St: ước lượng tính mùa

Y’ t+p: là giá tri ̣ dự báo cho p chu kỳ trong tương lai

α: là hằng số làm trơn biên đô ̣

β: hằng số làm trơn xu hướng

γ: hằng số làm trơn cho tính mùa

p: số bước muốn dự báo trong tương lai

s: chiều dài của tính mùa

Trong công thứ c này, sự dự báo được điều chỉnh bằng cách nhân với chỉ số

mù a Đây là mô ̣t kỹ thuâ ̣t giúp loa ̣i bỏ ảnh hưởng của tính mùa

Trang 38

Ba tham số α, β, γ đóng vai trò điều khiển viê ̣c làm trơn, α, β, γ tương ứng với

ước lượng biên đô ̣, đô ̣ dốc của thành phần xu hướng và thành phần mùa ta ̣i thời điểm

xét Các tham số α, β, γ có giá tri ̣ nằm từ khoảng 0 đến 1, khi giá tri ̣ càng gần 0 có

nghĩa là càng có ít tro ̣ng số được đă ̣t trên các quan sát gần nhất khi đưa ra dự báo các giá tri ̣ tương lai Nếu hệ số γ bằng 0, tức là thành phần mùa không còn tồn tại trong

dữ liệu, lú c này phương pháp trên trở thành kĩ thuật làm trơn theo hàm mũ bâ ̣c hai

Nếu hệ số β cũng bằng 0, phương pháp này trở thành kĩ thuật làm trơn theo hàm mũ

bậc một Như vậy, đây chính là kĩ thuật tổng quát nhất của các kĩ thuật làm trơn hàm

mũ

Khi dữ liê ̣u có tính mùa, phương pháp ES3 có thể biểu diễn dữ liê ̣u tốt hơn và giảm lỗi dự báo xuống thấp hơn mô hình ES1 và ES2 Do đó, trong luận văn này chú ng tôi dùng mô hình ES3 để dự báo dữ liê ̣u chuỗi thời gian ngắn ha ̣n

3.1.4 Mô hi ̀nh cô ̣ng và mô hình nhân

bản chuỗi thời gian có các giá tri ̣ nằm trong mô ̣t dải giá tri ̣ có đô ̣ rô ̣ng là mô ̣t hằng số

và đường xu thế nằm ở trung tâm của dải này

Trang 39

Tính mùa được thể hiê ̣n như tỷ lê ̣ phần trăm của số ước lượng trung bình (hay

xu hướng) Sau đó nó được dùng để nhân giá tri ̣ của chuỗi để hợp nhất tính mùa Mô

hình nhân hoa ̣t đô ̣ng tốt nhất khi chuỗi thời gian có sự biến thiên tăng cùng với biên

đô ̣ Có nghĩa rằng những giá tri ̣ của chuỗi trải rô ̣ng ra khi xu thế tăng dần và tâ ̣p hợp

các quan sát có da ̣ng hình cái loa hay hình phễu Nói một cách khác, là khi xu hướng tăng thì chuỗi sẽ có giá tri ̣ lớn hơn Một dự báo dùng đồng thời mô hình cô ̣ng và mô

hình nhân cùng có xu hướng tuyến tính như ví dụ trong hình 3.5 [11] với đường màu

đỏ là dự báo của mô hình cộng và đường màu xanh là dự báo của mô hình nhân

Hi ̀nh 3.5: Một dự báo bằng mô hình cộng và mô hình nhân

Do mô hình nhân có khuynh hướng đa ̣i diê ̣n cho kinh nghiê ̣m thực tế nên mô

hình nhân thường được ứng dụng phổ biến hơn mô hình cô ̣ng trong thực tế

Trang 40

3.2 MÔ HÌNH MẠNG NƠ RON NHÂN TẠO

Mạng nơ ron nhân ta ̣o (Artificial Neural Network - ANN) là một tập hợp có tổ chức những nơ ron (phần tử xử lý đơn giản) Đây là hệ thống rất lớn và phức ta ̣p, thực hiện viê ̣c xử lí thông tin, mô phỏng chức năng, cách thức hoạt động và sự nối kết giữa các nơron sinh học Viê ̣c trao đổi thông tin, thực hiện tính toán và xuất kết quả dựa

vào sự kết nối giữa cá nơ ron với nhau Mô ̣t ANN được mô tả trong hình 3.6 [17]

Mạng nơ ron có thể giải quyết và thực hiện những bài toán có độ phức tạp và yêu cầu có độ chính xác cao như nhận dạng, điều khiển tự động, khai phá dữ liệu, … mạng nơ ron hiện nay được ứ ng du ̣ng rất rộng rãi trên nhiều lĩnh vực như quân sự, kinh tế, điện tử, công nghiệp, …

Hi ̀nh 3.6: Minh họa một ANN

3.2.1 Cấu tru ́ c tổng quát của mô ̣t ANN

- Nốt (nơron, unit, node): Mỗi nố t có tính chất vào – ra, có chức năng thực hiê ̣n mô ̣t tính toán cu ̣c bô ̣ (mô ̣t hàm cu ̣c bô ̣) Nốt thành phần cơ bản của mạng nơron

- Tầng (layer, lớp): một tập hợp nhiều nơ ron tạo thành một tầng ANN có kiến trúc chung

gồm ba thành phần là tầng ra (output layer), tầng ẩn (hidden layer) và tầng vào (input layer) Hình 3.7 [17] mô tả kiến trúc cụ thể của mô ̣t ANN

Hi ̀nh 3.7: Mô tả kiến trúc ANN

Định dạng
Số trang	153
Dung lượng	6,25 MB