Bài viết Ứng dụng mạng nơ-ron LSTM (Long Short-Term Memory Neural Networks) dự báo mực nước tại cống - âu thuyền Cầu Cất trong hệ thống Bắc Hưng Hải trình bày việc xây dựng một mô hình toán dựa trên mạng nơ-ron hồi quy (Recurrent Neural Network - RNN) để dự báo mực nước sông vùng triều và ứng dụng nó phục vụ việc dự báo mực nước ở thượng lưu cống – âu thuyền Cầu Cất trong hệ thống thủy lợi Bắc Hưng Hải.
Trang 1ỨNG DỤNG MẠNG NƠ-RON LSTM (LONG SHORT-TERM MEMORY NEURAL NETWORKS)
DỰ BÁO MỰC NƯỚC TẠI CỐNG - ÂU THUYỀN CẦU CẤT
TRONG HỆ THỐNG BẮC HƯNG HẢI
Hồ Việt Hùng
Trường Đại học Thủy lợi, email: hohung.thuyluc@tlu.edu.vn
1 GIỚI THIỆU CHUNG
Trí tuệ nhân tạo (Artificial Intelligence) và
học máy (Machine Learning - ML) ngày càng
được ứng dụng rộng rãi trong nhiều lĩnh vực
khác nhau của đời sống ML có thể được áp
dụng trong ngành Thủy lợi để dự báo mực
nước, lưu lượng dòng chảy trong sông nhằm
cảnh báo lũ lụt, hoặc dự báo mực nước ở các
cống tưới tiêu kết hợp nhằm giúp cho quy
trình vận hành cống an toàn và hiệu quả [3]
Trên thế giới cũng như ở Việt Nam, các
mô hình mạng nơ-ron nhân tạo ngày càng thu
hút sự chú ý của các nhà khoa học và đang
được ứng dụng trong nhiều nghiên cứu khác
nhau vì không yêu cầu nhiều số liệu đầu vào
mà độ chính xác rất cao [1], [4]
Bài báo này trình bày việc xây dựng một
mô hình toán dựa trên mạng nơ-ron hồi quy
(Recurrent Neural Network - RNN) để dự
báo mực nước sông vùng triều và ứng dụng
nó phục vụ việc dự báo mực nước ở thượng
lưu cống – âu thuyền Cầu Cất trong hệ thống
thủy lợi Bắc Hưng Hải Mô hình này chỉ sử
dụng dữ liệu đầu vào là mực nước sông Kim
Sơn đo tại các trạm ở thượng lưu trạm cần dự
báo (âu thuyền Cầu Cất)
2 PHƯƠNG PHÁP NGHIÊN CỨU
Các mô hình RNN dựa trên mối quan hệ
giữa các dữ liệu đầu vào và đầu ra để học các
quy luật trong quá khứ từ đó đưa ra các dự
báo trong tương lai Trong nghiên cứu này,
thư viện phần mềm mã nguồn mở, các thư
viện Numpy, Pandas, Keras cùng với ngôn ngữ lập trình Python 3.6 đã được sử dụng để thiết lập một mô hình mạng nơ-ron LSTM (Long Short-Term Memory Neural Networks), một dạng đặc biệt của RNN [2]
2.1 Mạng nơ-ron LSTM và các dữ liệu
Mạng nơ-ron LSTM có thể giải quyết các bài toán có sự phụ thuộc dài hạn (long-term dependency) Các mô hình LSTM xuất hiện lần đầu tiên vào năm 1997, sau đó đã được cải tiến và phổ biến rộng rãi [2], [3] Tác giả bài báo này đã thiết kế một mô hình LSTM
để dự báo mực nước sông tại các cống ngăn mặn, chịu ảnh hưởng của thủy triều
Dữ liệu được thu thập phục vụ cho việc dự báo là mực nước thực đo 6 giờ một lần ở thượng lưu các cống: Tranh, Bá Thủy, Cầu Cất trong thời gian 19 năm, từ ngày 1/1/2000 đến ngày 30/11/2018 Số liệu đo đạc được xử
lý và đánh giá bằng hệ số tương quan r, khi
đối chiếu mực nước tại các trạm đo với mực nước thượng lưu cống Cầu Cất (xem Bảng 1) Hệ số tương quan của mực nước hạ lưu cống Cầu Cất không cao nên chuỗi số liệu này không được sử dụng cho dự báo
Bảng 1 Hệ số tương quan (r) của dữ liệu
TT Tên trạm đo Hệ số r
1 Thượng lưu cống Cầu Cất 1
2 Hạ lưu cống Cầu Cất 0,41
3 Thượng lưu cống Tranh 0,96
4 Thượng lưu cống Bá Thủy 0,98
Trang 2Tác giả sử dụng chuỗi dữ liệu mực nước
thực đo trong 8 bước thời gian gần nhất (48
giờ) để dự báo mực nước ở thượng lưu cống
Cầu Cất cho 6 giờ, 12 giờ, 18 giờ và 24 giờ
trong tương lai, vì 48 giờ gần nhất tác động tới
kết quả dự báo nhiều nhất Các số liệu trước
đó chỉ bổ sung thêm thông tin Tập dữ liệu đầu
vào được chia thành 3 phần với các mục đích
khác nhau Phần thứ nhất là chuỗi 26056 số
liệu được đo đạc trong 18 năm (từ 01/1/2000
đến 31/10/2017), dùng để hiệu chỉnh mô hình
nhằm chọn ra các thông số tốt nhất Phần thứ
hai là chuỗi số liệu đo trong 1 năm, từ ngày
01/11/2017 đến ngày 31/10/2018 được dùng
để kiểm định mô hình Phần thứ ba là chuỗi số
liệu từ ngày 01/11/2018 đến ngày 4/11/2018
được sử dụng làm dữ liệu đầu vào để chạy thử
mô hình nhằm kiểm tra một lần nữa
2.2 Thiết kế mô hình dự báo
Tác giả đã cho mô hình chạy với nhiều bộ
thông số khác nhau cho đến khi đạt kết quả
tốt nhất, từ đó lựa chọn các thông số của mô
hình dự báo, tóm tắt như sau:
- Số lượng unit trong mỗi mô đun: 30; 35
- Hệ số học (Learning rate): 0,001
- Bộ tối ưu hóa (Optimizer): Adam
- Số lần lặp tối đa (Epoch): 5000
- Các kỹ thuật: Early Stopping, Regularizer
2.3 Phương pháp đánh giá kết quả
Tác giả bài báo này đã sử dụng hai trị số:
NSE (Nash Sutcliffe Efficiency – hệ số Nash)
và MAE (Mean Absolut Error – sai số tuyệt
đối trung bình) để đánh giá mức độ chính xác
của kết quả dự báo
3 KẾT QUẢ NGHIÊN CỨU
3.1 Kết quả kiểm định mô hình
Mô hình được kiểm định bằng phần dữ
liệu thứ hai Tổng hợp số liệu của 4 trường
hợp dự báo có kết quả kiểm định tốt nhất
được thể hiện trong Bảng 2, Hình 1 và Hình
2 Bảng 2 cho thấy rằng, Hệ số Nash dao
động từ 94,9% (dự báo 6h) đến 82,2% (dự
báo 24h); Sai số tuyệt đối trung bình dưới 8,6
cm cho tất cả các trường hợp dự báo, khi dự báo 6h sai số nhỏ hơn 5 cm Thời gian xuất hiện đỉnh lũ dự báo trùng với thực đo Kết quả kiểm định mô hình là tương đối tốt Mô hình đã sẵn sàng cho việc dự báo mực nước
Bảng 2 Kết quả kiểm định mô hình
dự báo mực nước (MN)
Thời gian
dự báo
Số trạm
đo MN
Số lượng unit
Số lần lặp
MAE (m)
NSE (%)
6 giờ 3 30 322 0,045 94,9
12 giờ 3 35 344 0,065 89,5
18 giờ 3 35 302 0,076 85,9
24 giờ 3 35 293 0,086 82,2
Hình 1 So sánh mực nước thực đo
trong năm 2018 với kết quả dự báo 6 giờ
Hình 2 Kết quả kiểm định mô hình:
dự báo 12 giờ (trái) và 24 giờ (phải)
Trang 3Bảng 3 Kết quả dự báo mực nước khi kiểm nghiệm mô hình
Ngày, Tháng,
Năm đo MN Giờ đo MN
Thời gian
dự báo
Số liệu đầu vào (số)
MN thực đo (m)
MN dự báo (m)
Sai số (m)
3.2 Kết quả dự báo kiểm nghiệm
Nhằm mục đích chạy thử mô hình, tác giả
sử dụng 8 số liệu mực nước của các ngày
01/11/2018 và 02/11/2018 để dự báo mực
nước thượng lưu cống Cầu Cất lúc 1h, 7h,
13h và 19h ngày 03/11/2018 Kết quả dự báo
được so sánh với số liệu thực đo nhằm kiểm
nghiệm mô hình một lần nữa Bảng 3 cho
thấy: sai số tuyệt đối dao động từ 3 cm đến 7
cm, khá nhỏ; sai số lớn nhất xảy ra khi xuất
hiện chân triều, lúc 7h Mực nước dự báo có
xu thế lớn hơn thực đo
4 KẾT LUẬN
Trong bài báo này, tác giả đã trình bày việc
xây dựng một mô hình LSTM và ứng dụng nó
để dự báo mực nước ở thượng lưu cống Cầu
Cất với dữ liệu đầu vào là mực nước sông
Kim Sơn trong hệ thống Bắc Hưng Hải Sản
phẩm của nghiên cứu này là 4 files, người sử
dụng có thể chạy các file này để dự báo mực
nước thượng lưu cống Cầu Cất cho 6 giờ, 12
giờ, 18 giờ và 24 giờ, sau khi nhập các số liệu
mực nước của 48 giờ trước đó Mô hình mà
tác giả đề xuất cho kết quả có độ chính xác
cao và ổn định, nó có thể dự báo mực nước tại
các cống bị ảnh hưởng của thủy triều, giúp
cho việc vận hành cống hiệu quả, an toàn
5 TÀI LIỆU THAM KHẢO
[1] Hồ Việt Hùng, Lê Xuân Hiền, Giha Lee
(2018) “Ứng dụng mạng thần kinh nhân tạo dự báo lưu lượng dòng chảy sông Hồng tại Sơn Tây dựa trên dữ liệu ở thượng lưu”
Tuyển tập công trình Hội nghị Khoa học
Cơ học Thủy khí toàn quốc lần thứ 21, trang 292-301
[2] Hồ Việt Hùng, Lê Xuân Hiền, Giha Lee
(2018) “Xây dựng mô hình mạng nơ-ron hồi quy dựa trên phần mềm mã nguồn mở
để dự báo lưu lượng dòng chảy” Tuyển tập
Hội nghị Khoa học thường niên năm 2018, Đại học Thủy lợi, trang 560-562
[3] Hồ Việt Tuấn, Hồ Việt Hùng (2019) “Sử dụng mạng nơ-ron nhân tạo dự báo mực nước sông chịu ảnh hưởng của thủy triều”
Tạp chí Khoa học và công nghệ Thủy lợi, Viện Khoa học Thủy lợi Việt Nam, số 52, trang 108-116
[4] Xuan-Hien Le, Hung Viet Ho, Giha Lee,
Sungho Jung (2019) “Application of Long Short-Term Memory (LSTM) Neural Network for Flood Forecasting” Water,
MDPI, 11, 1387; doi:10.3390/w11071387 https://doi.org/10.3390/w11071387