1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào mô hình mạng nơ ron long short term memory (lstm)

65 4 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào mô hình mạng nơ-ron Long Short Term Memory (LSTM)
Người hướng dẫn PGS.TS
Trường học Trường Đại học Lạc Hồng
Chuyên ngành Công nghệ thông tin
Thể loại Luận văn thạc sĩ
Năm xuất bản 2023
Thành phố Đồng Nai
Định dạng
Số trang 65
Dung lượng 3,07 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG * * * XÂY DỰNG HỆ THỐNG DỰ BÁO MỰC NƯỚC BIỂN TRUNG BÌNH DỰA VÀO MÔ HÌNH MẠNG NƠ-RON LONG SHORT TERM MEMORY LSTM LUẬN VĂN THẠC SĨ CÔNG NG

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC LẠC HỒNG

* * *

XÂY DỰNG HỆ THỐNG DỰ BÁO MỰC NƯỚC BIỂN TRUNG BÌNH DỰA VÀO MÔ HÌNH MẠNG NƠ-RON

LONG SHORT TERM MEMORY (LSTM)

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

Đồng Nai, Năm 2023

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC LẠC HỒNG

* * *

XÂY DỰNG HỆ THỐNG DỰ BÁO MỰC NƯỚC BIỂN TRUNG BÌNH DỰA VÀO MÔ HÌNH MẠNG NƠ-RON

LONG SHORT TERM MEMORY (LSTM)

Chuyên ngành: Công nghệ thông tin

Mã số: 8480201

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

Đồng Nai - Năm 2023

Trang 3

LỜI CẢM ƠN

Sau cùng, em xin tỏ lòng biết ơn đến người thân, bạn bè và đồng nghiệp

đã luôn bên cạnh ủng hộ, động viên em trong cuộc sống cũng như trong thời gian học tập, hoàn thành luận văn Thạc sĩ

Xin chân thành cảm ơn tất cả mọi người!

Đầu tiên, em xin bày tỏ sự cảm ơn sâu sắc đến quý Thầy Cô hiện đang công tác tại Trường Đại học nói chung và Khoa Sau đại học nói riêng đã tổ chức khóa học, tạo điều kiện cho em được học tập và lĩnh hội nhiều kiến thức mới, có được kỹ năng cần thiết để hoàn thành được khóa đào tạo Thạc sĩ chuyên ngành Công nghệ thông tin tại Nhà trường

Em cũng xin gửi lời cảm ơn chân thành đến PGS.TS , người trực tiếp truyền đạt những kiến thức về học máy và ứng dụng cho em, đồng thời cảm ơn Thầy đã tỉ mỉ, tận tình hướng dẫn, giúp đỡ em hoàn thành luận văn này

Trang 4

LỜI CAM ĐOAN

Tôi xin hoàn toàn chịu trách nhiệm về luận văn của mình

Tôi xin cam đoan đề tài là công trình nghiên cứu độc lập của cá nhân dưới sự hướng dẫn của PGS.TS Những số liệu và kết quả nghiên cứu là trung thực, các nguồn tài liệu tham khảo được trích dẫn nguồn và chú thích rõ ràng Không có bất kỳ sự sao chép hay vi phạm gì trong luật sở hữu trí tuệ và pháp luật Việt Nam

Trang 5

TRƯỜNG ĐẠI HỌC LẠC HỒNG

KHOA SAU ĐẠI HỌC

TÓM TẮT LUẬN VĂN

(Dùng cho học viên và người hướng dẫn)

Đề tài: Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào mô hình mạng Nơ-ron Long Short Term Memory (LSTM)

- Thu thập thông tin, dữ liệu, các nghiên cứu liên quan

- Tiền xử lý dữ liệu Phân tích dữ liệu

- Lựa chọn mô hình, giải thuật đề xuất và công nghệ sử dụng

- Xây dựng hệ thống

- Thử nghiệm và đánh giá kết quả

- Hoàn thiện hệ thống, viết báo cáo luận văn

Trang 6

- Tiến hành triển khai mô hình LSTM trên dữ liệu thu thập được Dùng ngôn ngữ lập trình Python xây dựng hệ thống

- Kết hợp các biện pháp để đánh giá tính chính xác của hệ thống

- Dựa trên kết quả kiểm thử, các đánh giá tham khảo thu được để chỉnh sửa hoàn thiện hệ thống

3 Đánh giá về mặt khoa học của kết quả

- Luận văn đã hệ thống hóa các lý thuyết liên quan tới bài toán dự báo, đặc biệt là trình bày chi tiết sử dụng mô hình mạng LSTM

- Luận văn xây dựng được hệ thống dự báo mực nước biển trung bình với

dữ liệu thực tế cho kết quả nhanh, độ chính xác tốt và giao diện hỗ trợ trực quan

4 Những vấn đề còn tồn tại so với nội dung được giao (nếu có)

Ngày 03 tháng 3 năm 2023

NGƯỜI HƯỚNG DẪN HỌC VIÊN

Trang 7

MỤC LỤC

LỜI CẢM ƠN

LỜI CAM ĐOAN

MỤC LỤC

DANH MỤC BẢNG VÀ BIỂU ĐỒ

DANH MỤC HÌNH

MỞ ĐẦU

Chương 1 TỔNG QUAN 1

1.1 Tổng quan tình hình nghiên cứu trong và ngoài nước 1

1.2 Ý nghĩa khoa học và thực tiễn của đề tài 7

1.2.1 Tính khoa học 7

1.2.2 Tính ứng dụng 8

1.3 Mục tiêu luận văn 8

1.4 Đối tượng và phạm vi nghiên cứu 8

1.5 Đóng góp của luận văn 8

1.6 Nội dung và bố cục luận văn 9

Chương 2 CƠ SỞ LÝ THUYẾT XÂY DỰNG BÀI TOÁN DỰ BÁO MỰC NƯỚC BIỂN 10

2.1 Một số cơ sở lý thuyết 10

2.1.1 Tổng quan Machine Learning, Deep Learning 10

2.1.2 Mạng Nơ – ron nhân tạo 13

2.1.3 Mạng Nơ – ron hồi quy 15

2.2 Bài toán dự báo 18

2.2.1 Mực nước biển trung bình và hệ lụy 18

Trang 8

2.2.2 Mô hình dự báo chuỗi thời gian 24

Chương 3 ỨNG DỤNG MẠNG HỌC SÂU LSTM XÂY DỰNG HỆ THỐNG DỰ BÁO MỰC NƯỚC BIỂN 27

3.1 Mô hình mạng LSTM và các lớp mạng 27

3.1.1 Tổng quan về mô hình LSTM 27

3.1.2 Kiến trúc mạng LSTM 27

3.1.3 Trình tự các bước của LSTM 30

3.2 Các bước xây dựng phần mềm 32

3.2.1 Thu thập dữ liệu 32

3.2.2 Tiền xử lý dữ liệu 34

3.2.3 Phân tích dữ liệu 36

3.2.4 Lựa chọn mô hình, giải thuật đề xuất, công nghệ sử dụng 37

Chương 4 THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ 38

4.1 Phương pháp đánh giá mô hình 38

4.2 Một số kết quả thực nghiệm 39

4.2.1 Huấn luyện mô hình LSTM 42

4.2.2 Huấn luyện mô hình GRU 43

4.2.3 Huấn luyện mô hình SimpleRNN 44

4.3 Đánh giá mô hình 45

4.4 Xây dựng ứng dụng trực quan hóa kết quả 45

4.5 Kết quả đạt được 48

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 50

TÀI LIỆU THAM KHẢO

Trang 9

DANH MỤC CÁC CHỮ VIẾT TẮT

Trang 11

DANH MỤC HÌNH

Hình 2.2 Cấu trúc và cách thức hoạt động của mạng ANN 13

Hình 2.3 Kiến trúc của một mạng nơ-ron hồi quy 15

Hình 2.4 Mô hình mạng nơ-ron hồi quy 16

Hình 2.5 Quá trình xử lý thông tin trong RNNs 17

Hình 2.6 Hoạt động của một ô RNN cơ bản 17

Hình 2.7 Mô hình cơ bản của RNN 18

Hình 2.9 Hình ảnh mô tả mực nước biển tăng theo mùa (3 tháng) 20

Hình 2.10 Nước biển dâng cao ở hầu hết các đại dương (màu xanh lam) từ năm 1993 đến năm 2021 20

Hình 2.11 Mực nước biển dự đoán trong tương lai ở miền Nam nước ta 22

Hình 2.12 Nước biển dâng nhấn chìm miền Nam Việt Nam vào năm 2050 23

Hình 2.13 So sánh cấu trúc của VanillaRNN, LSTM, GRU 25

Hình 2.14 Nhiều mạng RNN kết hợp tạo thành một Multi-layer RNN network 26

Hình 3.1 So sánh kiến trúc Module trong mạng RNN 1 tầng ẩn (hình trên) và mạng LSTM 4 tầng ẩn (3 sigmoid và 1 tanh – hình dưới) 28

Hình 3.2 Đường đi của ô trạng thái (cell state) trong mạng LSTM 29

Hình 3.3 Một cổng của hàm sigmoid trong LSTM 29

Hình 3.4 Sơ đồ biểu diễn kiến trúc bên trong của một tế bào LSTM 30

Hình 3.5 Tầng cổng quên (forget gate layer) 31

Hình 3.6 Cập nhật giá trị cho ô trạng thái bằng cách kết hợp 2 kết quả từ tầng cổng vào và tầng ẩn hàm tanh 31

Hình 3.7 Ô trạng thái mới 32

Hình 3.8 Hàm tanh điều chỉnh thông tin đầu ra 32

Hình 3.9 Bộ dữ liệu được tải từ Website Ourwordindata 34

Hình 3.10 Thay đổi của mực nước biển từ 1880 đến 2020 34

Trang 12

Hình 3.11 Dữ liệu ban đầu được tải về chưa xử lý 35

Hình 3.12 Dữ liệu sau khi đã xử lý 36

Hình 4.1 Giao diện chính của hệ thống dự báo mực nước biển trung bình 46

Hình 4.2 Giao diện dự báo mực nước biển 1 năm tiếp theo 47

Hình 4.3 Giao diện dự báo mực nước biển 2 năm tiếp theo 47

Hình 4.4 Giao diện tra cứu dữ liệu mực nước biển theo năm 48

Trang 13

MỞ ĐẦU

Nước biển dâng cao là hệ lụy nghiêm trọng của biến đổi khí hậu toàn cầu Đây

là thách thức lớn đặt ra cho nhân loại, nó ảnh hưởng trực tiếp đến hệ sinh thái, tài nguyên môi trường và cuộc sống của con người Nước biển dâng cao kéo theo vô vàn thiên tai như: giảm lượng đất canh tác màu mỡ, ảnh hưởng nghiêm trọng đến hệ động thực vật biển, vùng đất nước ngập mặn tăng cao…Để quản lý vấn đề này một cách hiệu quả, chúng ta cần ước tính được chính xác mực nước biển trong tương lai, từ đó đưa ra kế hoạch phòng ngừa và ứng phó

Dự báo và phát hiện bất thường của dữ liệu chuỗi thời gian là bài toán quan trọng Ngày nay các thiết bị IoT được ứng dụng trong tất cả các lĩnh vực, nhiều thiết

bị thuộc loại data logger, những thiết bị này cung cấp cho người dùng các thông số

dữ liệu theo thời gian thực Dựa trên các dữ liệu này, người dùng giám sát hệ thống

Dự báo chính xác mực nước biển trung bình trong tương lai là yêu cầu chủ yếu trong việc xây dựng thành công một hệ thống quản lý và giảm nhẹ ảnh hưởng do nước biển dâng đến sự phát triển của nhân loại, đặc biệt là các quốc gia ven biển, trong đó có Việt Nam Những năm gần đây, công nghệ học sâu trên nền tảng mạng nơ ron nhân tạo đang trên đà phát triển nhanh, thu hút sự quan tâm của giới khoa học tham gia

nghiên cứu Xuất phát từ thực trạng trên học viên đề xuất đề tài: “Xây dựng hệ thống

dự báo mực nước biển trung bình dựa vào mô hình mạng Nơ-ron Long Short Term Memory (LSTM)”

Trang 14

Chương 1 TỔNG QUAN

1.1 Tổng quan tình hình nghiên cứu trong và ngoài nước

Từ vài thập kỉ qua, người ta nhận thấy rằng hiệu ứng nhà kính và ô nhiễm môi trường đang làm ảnh hưởng nghiêm trọng đến biến đổi khí hậu toàn cầu Kéo theo đó

là vô vàn hệ lụy mà nhân loại trong tương lai phải gánh chịu, đáng lo lắng phải kể đến vấn đề mực nước biển đang ngày càng dâng cao Đây là thách thức lớn đặt ra cho nhân loại, nó ảnh hưởng trực tiếp đến hệ sinh thái, tài nguyên môi trường và cuộc sống của con người Nước biển dâng cao kéo theo vô vàn thiên tai như: vùng đất bị ngập mặn tăng cao, bão lũ thường xảy ra tại các khu vực ven biển, tính đa dạng của

hệ động thực vật biển bị ảnh hưởng nghiêm trọng, …Vì vậy, việc ước tính chính xác, hợp lý mực nước biển trong tương lai là vấn đề cần thiết; Từ đó đề xuất kế hoạch, phương án phòng tránh, ứng phó ngay từ bây giờ Xuất phát từ thực trạng trên, luận văn được xây dựng để đưa ra dự báo mực nước biển trung bình ứng dụng công nghệ

học sâu LSTM với tên đề tài là: “Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào mô hình mạng Nơ-ron Long Short Term Memory (LSTM)”

Bài toán dự đoán mực nước biển dâng cao là một trong những bài toán được nghiên cứu nhiều tại Việt Nam và trên thế giới Hiện nay đã có nhiều ứng dụng thực tiễn trong lĩnh vực dự báo này Đa phần các công trình nghiên cứu đạt được kết quả rất tốt, tuy nhiên với các bài báo nước ngoài họ chủ yếu nghiên cứu tổng quan tất cả các hệ lụy do biến đổi khí hậu mang tới chưa thực sự đi sâu vào vấn đề nước biển dâng cao Xét về các bài báo trong nước có đề cập đến mực nước biển nhưng thời gian công bố khá lâu hoặc chỉ tập trung nghiên cứu tại một khu vực nhỏ như dự báo mực nước ở hạ lưu sông, mực nước đến hồ chứa hay các trạm thủy văn

Hiện nay, các mô hình mạng nơ-ron nhân tạo ngày càng thu hút sự chú ý của các nhà khoa học và đang được ứng dụng trong nhiều nghiên cứu khác nhau vì độ chính xác rất cao của mô hình Đặc biệt, đối với các bài toán liên quan dữ liệu chuỗi thời gian (Time-series data) người ta thường sử dụng mô hình mạng thần kinh hồi quy (Recurrent neural network – RNN) để dự báo giá trị trong tương lai dựa trên những dữ liệu quá khứ Sau khi một mô hình dự báo được xây dựng và xác nhận hợp

Trang 15

lệ, nó được coi là thể tổng quát hóa kiến thức đã học được từ dữ liệu lịch sử làm cơ

sở để dự báo tương lai Các công trình đã được thử nghiệm thực tế trên nhiều bộ dữ liệu khác nhau

Một số công trình nghiên cứu liên quan trong nước và quốc tế

[1] Ứng dụng mạng Long Short-Term Memory (LSTM) để dự báo mực nước tại trạm Quang Phục và Cửa Cấm, Hải Phòng, Việt Nam

Bài báo của tác giả Lê Xuân Hiền và Hồ Việt Hùng đăng trên tạp chí Khoa học

Kỹ thuật Thủy lợi và Môi trường, công bố tháng 9 năm 2018 Trong bài báo mô hình LSTM sử dụng dữ liệu là mực nước theo giờ tại các trạm thủy văn ở thành phố Hải Phòng Trong bài báo mô hình được tác giả xây dựng nhằm đưa ra dự báo mực nước sông cho trạm Cửa Cấm và trạm Quang Phục Dự báo theo thời gian từ 1 giờ đến 5 giờ Bài báo đánh giá hiệu quả mô hình sử dụng bằng cách sử dụng hai trị số: NSE (Nash Sutcliffe Efficiency – Hệ số Nash) và RMSE (Root Mean Square Error – Sai

số căn quân phương) Mô hình dự báo bỏ qua các yếu tố về địa hình và lượng mưa

Mô hình trên được đầu tư và phát triển hơn có thể dùng cảnh báo lũ lụt xảy ra tại các sông suối nước ta

[2] Kịch bản biến đổi khí hậu và nước biển dâng cao cho Việt Nam

Do GS.TS Trần Thục, PGS.TS Nguyễn Văn Thắng, PGS.TS Huỳnh Thị Lan Hương nghiên cứu đăng trên tạp chí bộ Tài nguyên và Môi trường công bố năm 2016 Phương pháp sử dụng để xây dựng kịch bản nước biển dâng: xây dựng theo phương pháp của IPCC trong báo cáo AR5, các nghiên cứu của Church (2013) và Slagen (2014), các kịch bản nước biển dâng của các quốc gia như Úc, Hà Lan, Singapore Kịch bản nước biển dâng được tính từ các thành phần đóng góp, bao gồm: Tan băng của các sông băng, núi băng trên lục địa; Cân bằng khối lượng bề mặt băng ở Greenland; Giãn nở nhiệt và động lực; Tan băng của các sông băng, núi băng trên lục địa; Động lực băng ở Greenland; Cân bằng khối lượng bề mặt băng ở Nam cực; Thay đổi lượng trữ nước trên lục địa; Động lực băng ở Nam Cực; và điều chỉnh đẳng tĩnh băng Từ 21 mô hình khí quyển – đại dương (AOGCMs) sẽ tính thành phần giãn nở nhiệt và động lực Những thành phần khác được xác định theo kết quả tính toán toàn

Trang 16

cầu (IPCC, 2013) So với dự đoán, mực nước biển sẽ dâng cao hơn so với các khu vực khác do vị trí nước ta là giữa biển đông

Ấn phẩm có nhiều biểu đồ, sơ đồ, dữ liệu mô phỏng chính xác và trực quan Số liệu phong phú Trình bày rõ vấn đế biến đổi khí hậu, nước biển dâng cao tại Việt Nam, đồng thời đưa ra kịch bản dự báo Tuy nhiên kịch bản CRP4.5, RCP8.5 chỉ áp dụng cho các công trình mang tính ngắn hạn Đồng thời khi tham khảo kịch bản để

áp dụng cho từng địa phương cần có sự linh hoạt thay đổi cho phù hợp với từng địa hình, tình hình phát triển kinh tế xã hội, lĩnh vực ngành nghề

[3] Xây dựng hệ thống thử nghiệm dự báo mực nước trên nền tảng Webgis bằng mô hình mạng Nơron nhân tạo hồi tiếp

Đề tài nghiên cứu của TS Nguyễn Chính Kiên (chủ nhiệm đề tài) cùng nhóm tác giả biên soạn đăng trên tạp chí của Viện hàn lâm Khoa học và Công nghệ Việt Nam công bố năm 2019 Đề tài giới thiệu về mạng thần kinh nhân tạo hồi tiếp, xây dựng cơ sở dữ liệu lớn, kết hợp giữa ứng dụng công nghệ WebGIS với mạng Nơron nhân tạo hồi tiếp ứng dụng vào bài toán dự báo thủy lực, thủy văn, môi trường Tác giả sử dụng hệ quản trị CSDL Microsoft SQL Server 2017 Dữ liệu đầu vào gồm: hệ thống lực vực sông Việt Nam, hệ thống trạm khí tượng thủy văn, hệ thống đường giao thông quốc lộ, mạng lưới sông ngòi Việt Nam, dữ liệu mặt cắt sông, dữ liệu mực nước, dữ liệu mưa, dữ liệu lưu lượng Kết quả đạt được là hệ thống dự báo trực tuyến trên trình duyệt web tại địa chỉ: http://dubao.imech.info Độ chính xác của hệ thống thử nghiệm đối với mực nước tại đồng bằng châu thổ Sông Hồng đạt được là NSE > 0.9

Với kết quả tính toán bắt được khá tốt, mô hình huấn luyện đã được kiểm định

Hệ thống dự báo được bài toán với các chuỗi dữ liệu có đầu vào liên kết với đầu ra theo thời gian ở mức khá, sai số chấp nhận được Tuy nhiên đề tài có thể tiến hành song song sử dụng mô hình thủy văn truyền thống và hệ thống thủy lực nhằm đưa ra

dự báo để đưa ra kết quả tổng hợp và chính xác hơn Ngoài yếu tố mực nước hệ thống

có thể mở rộng để dự báo các yếu tố khác như mưa hay lưu lượng

[4] Phương pháp dự báo nước biển dâng do bão dựa trên lập trình di truyền

Trang 17

Nhóm tác giả Nguyễn Thị Hiền, Trương Tiến Phúc, Ngô Văn Mạnh, Nguyễn Thị Quyên, Hoàng Hải Vân nghiên cứu và công bố năm 2020 đăng trên Tạp chí Khí tượng thủy văn Bài báo sử dụng lập trình di truyền (Genetic Programming - GP) là một kỹ thuật học máy có thể giúp ta tìm được mô hình ở dạng công thức toán học Thực nghiệm trên dữ liệu nước biển dâng do bão tại trạm Hòn Dáu của Việt Nam cho kết quả khá chính xác Trong bài báo cũng đưa ra sự so sánh GP với 5 kỹ thuật học máy khác khi giải quyết bài toán dự báo giữa các biến đầu vào và đầu ra mà không cần xem xét trực tiếp các quy luật vật lý của cơ chế nước biển dâng do bão đó là: máy vec-tơ hỗ trợ (Support Vector Machine), cây quyết định (Decision Tree - DCT), k-láng giềng gần nhất (k Nearest Neighbor - kNN), mạng Perceptron nhiều lớp (Multi-layer Perceptron - MLP), rừng ngẫu nhiên (Random Forest - RF)

Bài báo so sánh giữa GP với các phương pháp dự báo khác để thấy được sự nổi trội để thu được kết quả tốt hơn Tuy nhiên, nên sử dụng GP để áp dụng cho dữ liệu tại nhiều trạm khác, với các cơn bão và thời gian dự báo trước ngắn hơn (12h, 5h) để đạt được kết quả thực tế tốt nhất

[5] Global sea-level budget 1993-present

Đề tài do tác giả Anny Cazenave nghiên cứu đăng trên Earth System Science Data công bố năm 2018 Đề tài đề cập đến nguồn nước biển trung bình toàn cầu, điểm mới ở đây là các thành phần khác nhau của mực nước biển dựa trên nhiều tập dữ liệu khác nhau, bắt nguồn từ các không gian khác nhau cùng các hệ thống quan sát Đề tài cung cấp thêm hiểu biết về quá trình gây ra mực nước biển dâng cao như: nóng lên của đại dương, băng tan trên đất liền, lưu trữ nước trên cạn, tình hình phá rừng và trồng rừng, suy thoái đất ngập mặn Cung cấp một cái nhìn tích hợp về phản ứng của trái đất trước tác động tự nhiên và nhân tạo Một số dự án quốc tế đang triển khai liên quan đến mực nước biển trong tương lai gần sẽ cung cấp các ước tính được cải thiện về các thành phần của nguồn cung cấp nước biển Các kết quả trong báo cáo này được thu thập và chuẩn bị từ 09 nhóm nghiên cứu khác nhau: mực nước biển dựa trên đo độ cao, máy đo thủy triều, nhiệt mở rộng, sông băng, Greenland, Nam Cực, trữ nước trên cạn, điều chỉnh đẳng tĩnh băng, khối lượng đại dương từ Grace

Trang 18

Đề tài cung cấp cái nhìn tổng quát về tổng thành phần ảnh hưởng đến nguồn cấp nước biển Loại bỏ đi những yếu tố nhỏ, ít ảnh hưởng Tuy nhiên đề tài được thảo luận chủ yếu dựa trên ước tính xu hướng

[6] Predicting regional coastal sea level changes with machine learning

Nghiên cứu của tác giả Veronica Nieves, Cristina Radin, Gustau Camps-Valls công bố năm 2021 đăng trên Báo cáo khoa học từ nature.com/scientificreports Bài báo sử dụng kỹ thuật ML đã cung cấp những tiến bộ đáng kể trong việc mô hình hóa các biến vật lý tại cả quy mô toàn cầu và địa phương Các kỹ thuật này có thể giúp xác định các mối quan hệ phức tạp giữa các biến, đồng thời thiết lập “số liệu về mức

độ liên quan” (tức là xếp hạng mức độ quan trọng của từng biến đổi) Nghiên cứu đánh giá toàn diện về sự giãn nở nhiệt ở các vùng biển, sự thay đổi của mực nước biển ven bờ để mô hình hóa và xác định “xu hướng” tăng/giảm mực nước biển đối với những năm tiếp theo Thay vì sử dụng các phương trình dựa trên vật lý để mô tả những thay đổi, mô hình ML được thông báo bằng cách ước tính proxy nhiệt độ trên đại dương GP (mô hình hồi quy quy trình Gaussian) và RNN (mạng nơ-ron tuần hoàn) đều là những kỹ thuật ML đầy hứa hẹn để tự động lập mô hình và dự báo diễn biến mực nước biển ven bờ khu vực trong thời gian ngắn Bài báo nghiên cứu những thay đổi biến thiên của mực nước biển ở vùng ven biển xung quanh Thái Bình Dương,

Ấn Độ Dương và Đại tây Dương, bằng cách thiết lập các mối quan hệ vật lý giữa các biến nhiệt độ đầu vào từ các lớp trên của khu vực đại dương và ước tính mực nước biển tại các vị trí ven biển khu vực này Dữ liệu sử dụng cho bài báo: sự bất thường của nước biển (SLA) qua vệ tinh hàng ngày từ 1993 đến năm 2018 và nhiệt độ trung bình theo mùa

Bài báo cung cấp một cách dự đoán hợp lý theo từng khu vực cụ thể về xu hướng mực nước biển trong một đến hai hoặc ba năm Tuy nhiên, phương pháp này có thể được khắc phục bằng những thuật toán hay hơn và hiệu quả hơn trong tương lai vì nó

sử dụng một phần dữ liệu đầy đủ cho cả bộ huấn luyện và dự đoán

[7] Sea level anomaly prediction using recurrent neural networks

Trang 19

Đề tài do nhóm tác giả Anne Braakmann-Folgmann, Ribana Roscher, Susanne Wenzel, Bernd Uebbing và Jurgen Kusche công bố năm 2017 đăng trên Viện đo đạc

và thông tin địa lý, đại học Bonn Đề tài sử dụng phương pháp kết hợp của mạng ron phức hợp (CNN) và mạng nơ-ron lặp lại (RNN) để đề xuất phương pháp dự báo độc lập, chính xác mực nước biển nhiều năm tới (SLA) Đề tài sử dụng chuỗi thời gian SLA từ ESA (Không gian Châu Âu) CCI (Sáng kiến Biến đổi Khí hậu), dữ liệu

nơ-sử dụng để nghiên cứu ở phía bắc và xích đạo Thái Bình Dương, nơ-sử dụng lưới dữ liệu SLA lấy từ máy đo độ cao Thời gian khảo sát bao 23 năm kể từ tháng 1 năm 1993 đến tháng 12 năm 2015 Để xác nhận dự đoán tác giả đã chia dữ liệu thành đào tạo-(16 năm), xác thực-(4 năm) và dữ liệu thử nghiệm (3 năm)

Đề tài kết hợp được giữa CNN và RNN để dự đoán mực nước biển tương lai cho kết quả khả quan, dựa trên đề tài có thể phức hợp thêm một mạng nơ-ron khác

để cải thiện độ chính xác Nên áp dụng phương pháp dự báo trên cho phạm vi rộng toàn cầu

[8] Time - Series prediction of Sea level change in the East Coast of Peninsular Malaysia from the Supervised learning Approach

Nghiên cứu của tác giả Vivien Mei Yen Lai, Samsuri Abdullah, Marlinda Abdul Malek, Sarmad Dashti Latif đăng trên International Journal of Design & Nature and Ecodynamics công bố năm 2020 Bài báo sử dụng thuật toán máy học Viz.vector hỗ trợ hồi quy (RSVM) trong dự đoán thay đổi mực nước biển ở bờ biển phía đông bán đảo Malaysia Các dữ liệu đầu vào được đề xuất gồm mực nước biển trung bình hàng tháng (MMSL), nhiệt độ bề mặt biển hàng tháng (SST), lượng mưa và độ che phủ trung bình của mây (MCC) Các thông số khí tượng được chọn làm đầu vào của mô hình có ảnh hưởng sâu sắc đến độ chính xác của mô hình được đề xuất Mô hình được đánh giá cao khi xem xét tại ba đảo: Kerteh, Tioman và Tanjung Sedili Trong tương lai có thể khẳng định tính chính xác của mô hình khi đề xuất sử dụng trên phạm phi quốc gia và vùng lãnh thổ

Kết quả hiển thị dựa trên hệ số tương quan mà mô hình dự đoán mực nước biển dâng với độ chính xác (R=0.861, 0.825 và 0.857) và dự đoán so sánh với số liệu đo

Trang 20

thủy triều lịch sử với sai số rất thấp Điều này chứng tỏ mô hình RSVM được đề xuất

là công cụ đáng tin cậy trong dự đoán mực nước biển dâng trung bình hàng tháng tại Malaysia Tuy nhiên mô hình chỉ đang được áp dụng đánh giá mực nước biển tại ba đảo của Malaysia Nên mở rộng phạm vi dự đoán của mô hình

[9] Sea-level rise caused by climate change and its implications for society

Bài báo do tác giả Nobuo Mimura nghiên cứu đăng trên The Japan Academy công bố năm 2013 Theo quan sát dữ liệu thủy triều nước biển và vệ tinh để đánh giá mực nước biển toàn cầu dâng trung bình với tốc độ 1,7 ± 0,2 mm/năm trong khoảng thời gian từ năm 1900 đến 2009 Bài báo trình bày về những tác động làm thay đổi mực nước biển: giãn nở nhiệt của nước biển, sự tan rã của các sông băng và băng trên đất liền, sự tích trữ nước trên cạn tại các hồ, áp suất khí quyển, Trọng tâm của bài báo là xem xét sự thay đổi giá trị trung bình mực nước biển diễn ra từ 100 năm trước đến cuối thế kỷ 21 do các nhân tố gây ra So sánh mực nước biển dâng cao, quan sát được đồng thời đưa ra dự toán của nó được gọi là ngân sách cấp biển Giảm khoảng cách giữa các giá trị này là thức thức lâu dài trong khoa học khí hậu Bài báo đưa ra

dự báo cho mực nước biển dâng cho thế kỷ 21 và những tác động do nó gây ra: Ngập lụt trầm trọng và lũ lụt diễn ra thường xuyền ở vùng ven biển; Gia tăng xói mòn bờ biển; Ảnh hưởng đến hệ sinh thái ven biển như đầm lầy muối, rừng ngập mặn và san hô; Thay đổi trong lắng đọng trầm tích dọc sông; Quan trọng hơn là ảnh hưởng nghiêm trọng đến khí hậu và đời sống xã hội của con người

Bài báo đưa ra cái nhìn tổng quát nhất xoay quanh nước biển dâng Từ các yếu

tố, tình hình, ảnh hưởng và dự toán dựa trên số liệu sát thực Tuy nhiên đề tài chưa nêu bật được giải pháp để khắc phục và phòng tránh việc mực nước biển dâng cao

1.2 Ý nghĩa khoa học và thực tiễn của đề tài

1.2.1 Tính khoa học

Đề tài được xây dựng trên cơ sở mô hình LSTM có thể giải quyết các bài toán với sự phụ thuộc dài hạn Đây là cơ sở để xây dựng một hệ thống dự báo mực nước biển trung bình Nước biển dâng cao đã, đang là thách thức lớn, có ảnh hưởng sâu rộng đến nhiều mặt của đời sống xã hội con người Việc dự đoán chính xác mực nước

Trang 21

biển tương lai là yêu cầu cần thiết làm cơ sở đưa ra các biện pháp phòng chống từ bây giờ

vụ cho công tác tham mưu chỉ huy Từ kết quả dự báo, chỉ huy có thể đưa ra quyết định tốt nhất cho công tác chiến đấu

1.3 Mục tiêu luận văn

Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào dữ liệu mực nước biển quá khứ, sử dụng mô hình LSTM

1.4 Đối tượng và phạm vi nghiên cứu

Đề tài sử dụng dữ liệu mực nước biển trung bình được đo bởi tổ chức OWID (Our World In Data), đo vào ngày 15 các tháng 01, tháng 4, tháng 7, tháng 10 hàng năm từ năm 1880 đến năm 2020

1.5 Đóng góp của luận văn

Luận văn nghiên cứu phương pháp dự báo liên quan đến dữ liệu Time series, phác họa bài toán dự báo mực nước biển trung bình thông qua hiện trạng, xu hướng nước biển hiện nay Giới thiệu khái quát mô hình chuỗi thời gian Tóm tắt các nghiên cứu khoa học liên quan

Trang 22

Thu thập dữ liệu mực nước biển trung bình thể hiện qua 4 mùa trong năm từ năm 1880 đến năm 2020 Bộ dữ liệu này dùng để thử nghiệm, đánh giá độ chính xác của hệ thống, đưa ra dự báo mực nước biển tương lai

Để chứng tỏ hiệu quả của mô hình LSTM, luận văn thực hiện huấn luyện thành công 3 mô hình: LSTM, GRU và SimpleRNN trên cùng một nguồn dữ liệu mực nước biển thế giới từ năm 1880 đến 2020, từ đó đưa ra nhận xét đánh giá về khả năng dự báo dài hạn của LSTM so với các mô hình thông dụng khác

Xây dựng giao diện phần mềm dự báo mực nước biển trung bình bằng ngôn ngữ python

1.6 Nội dung và bố cục luận văn

Luận văn được thực hiện với những nội dung chính sau:

- Thu thập thông tin, dữ liệu, các nghiên cứu liên quan

- Tiền xử lý dữ liệu Phân tích dữ liệu

- Lựa chọn mô hình, giải thuật đề xuất và công nghệ sử dụng

- Xây dựng hệ thống

- Thử nghiệm và đánh giá kết quả

- Hoàn thiện hệ thống, viết báo cáo luận văn

Luận văn được xây dựng gồm 4 chương cụ thể như sau:

Chương 1 Tổng quan

Chương 2 Cơ sở lý thuyết xây dựng bài toán dự báo mực nước biển

Chương 3 Ứng dụng công nghệ LSTM xây dựng hệ thống dự báo mực nước biển

Chương 4 Thử nghiệm và đánh giá kết quả

Kết luận và hướng phát triển

Trang 23

Chương 2 CƠ SỞ LÝ THUYẾT XÂY DỰNG BÀI TOÁN

DỰ BÁO MỰC NƯỚC BIỂN

Machine learning (ML) - học máy là một thành phần của khoa học dữ liệu đang phát triển từ lĩnh vực trí tuệ nhân tạo Học máy đòi hỏi con người tìm hiểu về cơ sở

dữ liệu và chọn lựa kỹ thuật cho phù hợp phân tích dữ liệu Hiểu cách khác, hệ thống máy sẽ “học” tự động từ dữ liệu, sau đó giải quyết bài toán đặt ra Bài toán của machine learning thường được chia làm hai loại là dự đoán (prediction) và phân loại (classification)

Trên thực tế, ML đã góp mặt ở rất nhiều lĩnh vực phổ biển như:

- Xử lý ảnh: bài toán xử lý ảnh (image processing) giải quyết các vấn đề phân tích thông tin từ hình ảnh hay thực hiện một số phép biến đổi Các ứng dụng cụ thể như: gắn thẻ hình ảnh (image tagging), nhận dạng kí tự (optical character recognition), Ô tô tự lái (self – driving cars)

- Phân tích văn bản (text analysis) là công việc phân loại thông tin hoặc trích xuất thông tin như: tài liệu, thư điện tử, nội dung chat, facebook post,… Các ứng dụng như: lọc thư rác (spam filtering), phân tích ngữ nghĩa (sentiment analysis), khai thác thông tin (information extraction)

- Khai phá dữ liệu (data mining) là từ dữ liệu được cung cấp, khám phá ra các giá trị hoặc đưa ra các dự báo Ứng dụng cụ thể như: phát hiện bất thường (anomaly detection), phát hiện các quy luật (association rules), gom nhóm (grouping), dự đoán (predictions)

Trang 24

- Ngoài ra học máy đóng góp rất lớn trong công nghệ Robot (robotics) bao gồm robot công nghiệp và robot hợp tác với hệ thống mạng lưới thần kinh, cảm nhận 3D

❖ Deep Learning

Deep Learning - Học sâu là một phần của học máy Khi khả năng tính toán của máy tính được nâng cấp cùng với lượng lớn dữ liệu khổng lồ được thu thập từ các hãng công nghệ lớn đã đưa học sâu đi thêm bước tiến dài Học sâu được lấy cảm hứng

từ cấu trúc và chức năng của não bộ con người, được xây dựng dựa trên các khái niệm phức tạp hơn rất nhiều, chủ yếu hoạt động với các mạng nơ-ron nhân tạo để bắt chước khả năng tư duy và suy nghĩ

Thông thường, hệ thống của học sâu yêu cầu phần cứng rất mạnh để có thể xử

lý được lượng dữ liệu khổng lồ đồng thời thực hiện được các phép tính phức tạp Nhiều mô hình học sâu phải mất nhiều thời gian, có khi mất khoảng vài tuần hoặc vài tháng để triển khai trên những phần cứng tiên tiến nhất hiện nay

Nhắc đến học sâu phải kể đến mạng nơ-ron tích chập CNN (Convolutional Neural Networks) được sử dụng nhiều nhất trong lĩnh vực thị giác máy tính (Computer vision) là một lĩnh vực nổi bật của khoa học máy tính và nghiên cứu trí tuệ nhân tạo, mạng nơ-ron hồi quy RNN (Recurrent Neural Network) thường được ứng dụng trong lĩnh vực xử lý ngôn ngữ tự nhiên (Natural Language Processing) và ghi nhận tiếng nói

Mạng nơ-ron trong học sâu được ứng dụng rộng rãi đối với công việc yêu cầu tính toán độ chính xác cao, lượng dữ liệu lớn và độ phức tạp nhiều Nổi bật là các ứng dụng của học sâu sau:

- Khả năng phân tích cảm xúc của con người thông qua việc xử lý ngôn ngữ tự nhiên, phân tích văn bản và thống kê Doanh nghiệp có thể thu thập những bình luận

và đánh giá của người dùng sau đó ứng dụng học sâu để hiểu và phán đoán cảm xúc khách hàng từ đó đưa ra những chiến lược kinh doanh và marketing phù hợp với từng nhóm đối tượng

- Chế tạo xe tự lái dựa trên các mạng nơ-ron cấp cao Các mô hình học sâu sẽ nhận diện những đối tượng xung quanh xe, tính toán khoảng cách giữa xe mình và

Trang 25

các phương tiện khác, xác định vị trí làn đường, biển báo giao thông hay tín hiệu đèn,… từ đó đưa ra được các quyết định tốt và nhanh chóng nhất Tesla là một trong

số những hãng xe tiên phong sản xuất chế tạo xe tự lái

- Cải thiện dịch vụ mạng xã hội: bao gồm các nền tảng mạng xã hội lớn như Twitter, Instagram hay Facebook cũng phải nhờ đến các thuật toán mạng nơ-ron của học sâu Nhờ có học sâu mà các ông lớn mạng xã hội chặn các bình luận tiêu cực và

vi phạm, nắm bắt kịp thời như cầu người sử dụng

- Xây dựng trợ lý ảo với những thuật toán xử lý ngôn ngữ, nhận diện văn bản hay giọng nói Trợ lý ảo có thể nghe nhận biết và xử lý với nhiều ngôn ngữ khác nhau Nổi bật phải kể đến: siri, chatbot, cortana, google assistant,…

- Dịch vụ chăm sóc sức khỏe: học sâu đóng góp trong lĩnh vực y tế cũng rất đáng kể như xây dựng mô hình dự đoán tình trạng bệnh, phân tích MRI, chuẩn đoán ung thư, X-ray,… giúp đội ngũ y khoa đưa ra chuẩn đoán y học chính xác

Có thể nói quan hệ giữa trí tuệ nhân tạo, học máy và học sâu là không thể tách rời như hình 2.1 Nhờ có học sâu mà trí tuệ nhân tạo có tương lai phát triển tươi sáng hơn

Hình 2.1 Mối quan hệ giữa trí tuệ nhân tạo, học máy và học sâu

[Nguồn: ai-machine-learning-and-deep-learning/ truy cập 04/2022]

Trang 26

https://forum.huawei.com/enterprise/en/the-difference-between-2.1.2 Mạng Nơ – ron nhân tạo (ANN)

Artificial Neural Network (ANN) – Mạng nơ ron nhân tạo là mô hình xử lý thông tin mô phỏng dựa trên hoạt động của hệ thần kinh sinh vật, gồm số lượng lớn các Nơ-ron gắn kết để xử lý thông tin Mạng nơ ron nhân tạo được trình bày lần đầu năm 1943 bởi nhà logic học Walter Pits và nhà thần kinh học Warren McCulloch Mạng nơ ron nhân tạo hoạt động giống như bộ não của con người, nó học thuộc kinh nghiệm (nhờ vào việc huấn luyện), nó có khả năng lưu giữ nhiều tri thức và sử dụng các tri thức đó trong việc dự đoán các dữ liệu tương lai chưa biết

Mạng nơ ron nhân tạo có kiến trúc là nhóm các nút nối với nhau, mô phỏng bộ não nơ ron thần kinh của người Mạng nơ ron nhân tạo thể hiện thông qua ba thành phần chính: mô hình nơ ron, cấu trúc và sự liên kết giữa các nơ ron Trong một số trường hợp, mạng nơ ron nhân tạo có thể dựa vào thông tin bên trong hay bên ngoài chạy qua mạng trong quá trình học để tự thay đổi cấu trúc, nói cách khác đây là mạng

có hệ thống tự thích ứng

Mục đích mạng nơ ron nhân tạo cũng như các mô hình mạng truyền thống, nó xác định quan hệ của tham số vào và tham số kết quả ra của mô hình Tuy nhiên, mạng nơ ron nhân tạo không cần xác định mối quan hệ giữa các tham số mà sử dụng các tập dữ liệu Do vậy, mạng nơ ron nhân tạo đã khắc phục được nhược điểm của các mô hình truyền thống Một mạng nơ ron nhân tạo có cấu trúc hoạt động như hình 2.2 sau:

Hình 2.2 Cấu trúc và cách thức hoạt động của một mạng nơ ron nhân tạo

Trang 27

Trong quá trình tập học mạng nơ ron nhân tạo bắt đầu từ dữ liệu đầu vào (vector thông số đầu vào được nhập vào các nơ-ron ở lớp đầu vào) Tại nơi nơ ron lớp ẩn thứ j, giá trị tín hiệu nhận từ lớp đầu vào sẽ được hợp thành một giá trị tổng đầu vào theo công thức (1):

𝐼𝑗 = 𝜃𝑗 + ∑𝑛𝑖=1𝑤𝑗𝑖𝑥𝑖 (1)

Trong đó: xi : là thông số đầu vào

wji : là trọng số

𝜃𝑗 ∶ là biến hiệu chỉnh bias

Tiếp theo, hàm truyền sẽ được sử dụng để tính giá trị đầu ra theo công thức số (2) sau:

𝑦𝑖 = 𝑓(𝐼𝑖) (2)

Tại giá trị đầu ra lần này sẽ là đầu vào cho nơ-ron lớp sau Cứ tiếp tục vậy giá trị truyền cho đến khi nơ ron ở lớp đầu ra Đối với mạng một lớp ẩn, sau bước này sẽ đến bước lan truyền ngược

Tính khác biệt của giá trị đầu ra (yj) và giá trị thực tế (tj) được gọi là tín hiệu lỗi (Cost function), tính như công thức số (3) sau:

𝐽 = 𝑡𝑗 − 𝑦𝑗 (3)

Sau khi có được tín hiệu lỗi tính đạo hàm trọng số lớp nhập và lớp ẩn Từ đó hiệu chỉnh các trọng số và biến bias làm cho giá trị dự đoán đầu ra của mạng nơ rôn gần đúng hơn so với dự kiến

Trang 28

θj(old): là giá trị bias cũ

η : là tần số học hay tốc độ học (learning rate)

Thông số quan trọng cần được tối ưu (gradient descent) là tốc độ học tập của mạng nơ ron Nếu , nếu tham số này lớn, thuật toán sẽ cần ít vòng lặp hơn, ngược lại nếu tham số này nhỏ, sẽ cần nhiều bước lặp để hàm số có thể đạt tới điểm cực tiểu Tuy nhiên khi tham số này lớn quá hàm số có thể sẽ qua điểm cực tiểu và không thể hội tụ được

2.1.3 Mạng Nơ – ron hồi quy (RNN)

Con người suy nghĩ, học tập từ những kiến thức và kinh nghiệm được trau dồi trước đó Tức là tư duy đã có một bộ nhớ để lưu lại Tuy nhiên các mô hình mạng nơ-ron truyền thống thì không thể làm được việc đó, đó có thể coi là một khuyết điểm chính của mạng nơ-ron truyền thống Mạng nơ-ron hồi quy sinh ra để giải quyết vấn

đề đó Mạng này chứa các vòng lặp bên trong cho phép thông tin có thể lưu lại được

Hình 2.3 Kiến trúc của một mạng nơ-ron hồi quy

Với kiến trúc này mạng nơ ron hồi quy A với đầu vào là một véc tơ xt và giá trị đầu ra là một giá trị ẩn ht Một vòng lặp cho phép thông tin có thể được truyền từ bước này qua bước này qua bước khác của mạng nơ-ron

Trang 29

Mạng nơ ron hồi quy được thiết kế sao cho nó có khả năng xử lý thông tin dưới dạng chuỗi như hình 2.4:

Hình 2.4 Mô hình mạng nơ-ron hồi quy

Ở hình trên, mô hình mạng nơ ron hồi quy được thể hiện là thực hiện lặp lại nhiều lần cùng một tác vụ cho mỗi thành phần bên trong chuỗi Trong đó, kết quả tính toán của các thành phần ở những thời điểm trước sẽ quyết định kết quả đầu ra tại thời điểm hiện tại

Có thể hiểu, mạng nơ ron hồi quy là một mô hình có khả năng ghi nhớ, nó có thể nhớ được những thông tin được tính toán trước đó Khác với các mô hình mạng nơ-ron truyền thống trước đây, thông tin đầu vào tách biệt hẳn với thông tin kết quả đầu

ra Về lý thuyết, mạng nơ ron hồi quy có thể nhớ được thông tin của chuỗi dữ liệu với chiều dài bất kì, tuy nhiên thực tế mô hình này bị giới hạn chỉ nhớ được thông tin ở vài bước trước đó

Hiện nay, mạng nơ ron hồi quy được khai thác khá tốt trong các tác vụ của học sâu như: chú thích hình ảnh (image captioning), nhận biết giọng nói (speech recognition), mô hình dịch, các mô hình ngôn ngữ,…

Về lý tưởng, mạng nơ ron hồi quy có thể giải quyết được bài toán phụ thuộc dài hạn Nhưng kết quả thực tế lại cho thấy khả năng học dài hạn không như mong đợi Giải thích cho vấn đề này là do sự triệt tiêu đạo hàm của hàm cost function sẽ diễn ra khi trải quả chuỗi dài các tính toán hồi quy Đây cũng là nguyên nhân ra đời của mạng LSTM (Long Short Term Memory) nhằm khắc phục hiện trạng này với cơ chế riêng biệt

❖ Quá trình xử lý thông tin trong mạng nơ ron hồi quy

Quá trình xử lý thông tin trong mạng hồi qui được mô tả theo hình 2.5

Trang 30

Hình 2.5 Quá trình xử lý thông tin trong RNNs

Trong đó:

xt : đầu vào tại thời điểm thứ t

ot : đầu ra tại thời điểm thứ t

St : trạng thái ẩn tại thời điểm thứ t (bộ nhớ của mạng)

St được tính dựa trên các trạng thái ẩn trước kết hợp với đầu vào tại thời điểm t Mạng nơ rơn hồi quy lặp lại có thể được coi như sự lặp lại của một ô đơn lẻ Sau đây là mô tả hoạt động của một ô đơn lẻ như hình 2.6:

Hình 2.6 Hoạt động của một ô mạng nơ ron hồi quy cơ bản

Có thể xem RNN là sự lặp lại của các ô đơn lẻ Nếu chuỗi dữ liệu vào được thực hiện qua 10 bước thời gian thì ô RNN sẽ được sao chép 10 lần Mỗi ô sẽ nhận trạng thái đầu vào của thời gian hiện tại và dữ liệu từ ô thời gian trước đó như mô tả hình dưới 2.7

Trang 31

Hình 2.7 Mô hình cơ bản của RNN

Có thể nói mạng nơ ron hồi quy là mạng nơ ron có “trí nhớ” vì nó có thể lưu trữ

và xử lý những thông tin trước đó Nhưng trên kết quả thực tế cho thấy mạng nơ ron hồi quy phát huy hiệu quả với những chuỗi dữ liệu có độ dài không quá lớn (long term dependency problem hay còn được gọi short term memory) Vấn đề này là do

“gradient” được sử dụng để cập nhật giá trị của weight matrix trong mạng nơ ron hồi quy và nó có giá trị nhỏ dần theo từng layer khi thực hiện back propagation (vanishing gradient problem) Khi gradient có giá trị gần bằng 0 thì giá trị của weight matrix không được cập nhật thêm và do đó mạng nơ-ron sẽ dừng học lại tại layer này Đây cũng chính là lý do khiến cho mạng nơ ron hồi quy không thể lưu trữ thông tin của các steps thuộc đoạn đầu trong một chuỗi dữ liệu có độ dài quá lớn

2.2 Bài toán dự báo

2.2.1 Mực nước biển trung bình và hệ lụy

❖ Vai trò của mực nước biển:

Hình thành từ hàng triệu năm trước, biển và đại dương đóng vai trò quan trọng trong cuộc sống của con người Biển tạo ra hơn một nửa nguồn oxy mà chúng ta thở hằng ngày, cung cấp một nguồn hải sản đa dạng, giúp vận chuyển 3/4 hàng hoá tiêu dùng, và chứa đựng trong lòng nó các nguồn tài nguyên thiết yếu như dầu mỏ

Mặt khác, ở các khu vực ven biển có mật độ dân số tương đối cao, nơi đây khi mực nước biển dâng cao có khả năng gây ra lũ lụt, xói mòn bờ biển và bão Trong bối

Trang 32

cảnh đô thị dọc theo các bờ biển trên khắp thế giới, nước biển dâng cao đe dọa cơ sở

hạ tầng và các ngành công nghiệp

Nước biển dâng đồng nghĩa với các đợt triều cường gây chết người và có tính hủy diệt khi cơn bão đẩy sâu vào đất liền Nước biển dâng cao tạo ra áp lực đối với các hệ sinh thái ven biển, ngập mặn làm ô nhiễm các tầng nước ngọt, mà nhiều trong

số đó duy trì nguồn nước cung cấp cho thành thị, nông nghiệp cũng như hệ sinh thái

tự nhiên

❖ Thực trạng nước biển dâng cao:

Xem xét dữ liệu được tải về từ OWID, mực nước biển trung bình toàn cầu đã tăng khoảng 8-9 inch (21-24 cm) kể từ năm 1880 Mực nước tăng chủ yếu là do sự tan chảy từ các sông băng và sự giãn nở nhiệt của nước biển khi ấm lên Năm 2020, mực nước biển trung bình toàn cầu cao hơn năm 1993 là 3,6 inch (91,3 mm), đây là mức trung bình hàng năm cao nhất trong kỷ lục vệ tinh

Ở một số đại dương, mực nước biển đã tăng lên tới 6-8 inch (15-20 cm) kể từ khi

vệ tinh ghi nhận Sự khác biệt giữa các khu vực là do ảnh hưởng thay đổi từ sức gió

và dòng hải lưu [Nguồn: Climate Change: Global Sea level NOAA Climate.gov] Cụ

thể, mực nước biển tăng rõ rệt theo mùa chù kỳ 3 tháng được biểu diễn như hình 2.8 Đây cũng là lí do giải thích tại sao mực nước ở hầu hết các đại dương trên thế giới chuyển từ màu cam (mực nước thấp) sang màu xanh lam (mực nước cao) từ năm 1993 đến năm 2021 như ở hình 2.9:

Ngày đăng: 13/05/2023, 10:34

HÌNH ẢNH LIÊN QUAN

Hình 2.1. Mối quan hệ giữa trí tuệ nhân tạo, học máy và học sâu. - Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào mô hình mạng nơ ron long short term memory (lstm)
Hình 2.1. Mối quan hệ giữa trí tuệ nhân tạo, học máy và học sâu (Trang 25)
Hình 2.2. Cấu trúc và cách thức hoạt động của một mạng nơ ron nhân tạo - Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào mô hình mạng nơ ron long short term memory (lstm)
Hình 2.2. Cấu trúc và cách thức hoạt động của một mạng nơ ron nhân tạo (Trang 26)
Hình 2.7. Mô hình cơ bản của RNN - Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào mô hình mạng nơ ron long short term memory (lstm)
Hình 2.7. Mô hình cơ bản của RNN (Trang 31)
Hình 2.8. Hình ảnh mô tả mực nước biển tăng theo mùa (3 tháng) - Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào mô hình mạng nơ ron long short term memory (lstm)
Hình 2.8. Hình ảnh mô tả mực nước biển tăng theo mùa (3 tháng) (Trang 33)
Hình 2.9. Nước biển dâng cao ở hầu hết các đại dương (màu xanh lam) từ năm - Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào mô hình mạng nơ ron long short term memory (lstm)
Hình 2.9. Nước biển dâng cao ở hầu hết các đại dương (màu xanh lam) từ năm (Trang 33)
Hình 2.12. So sánh cấu trúc của VanillaRNN, LSTM và GRU - Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào mô hình mạng nơ ron long short term memory (lstm)
Hình 2.12. So sánh cấu trúc của VanillaRNN, LSTM và GRU (Trang 38)
Hình 2.13. Nhiều mạng RNN kết hợp tạo thành một Multi-layer RNN network - Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào mô hình mạng nơ ron long short term memory (lstm)
Hình 2.13. Nhiều mạng RNN kết hợp tạo thành một Multi-layer RNN network (Trang 39)
Hình 3.1. So sánh kiến trúc Module giữa mạng nơ ron hồi quy 1 tầng ẩn (hình bên - Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào mô hình mạng nơ ron long short term memory (lstm)
Hình 3.1. So sánh kiến trúc Module giữa mạng nơ ron hồi quy 1 tầng ẩn (hình bên (Trang 41)
Hình 3.2. Đường đi của ô trạng thái (cell state) bên trong mạng LSTM - Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào mô hình mạng nơ ron long short term memory (lstm)
Hình 3.2. Đường đi của ô trạng thái (cell state) bên trong mạng LSTM (Trang 42)
Hình 3.4. Sơ đồ biểu diễn kiến trúc bên trong của một tế bào LSTM - Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào mô hình mạng nơ ron long short term memory (lstm)
Hình 3.4. Sơ đồ biểu diễn kiến trúc bên trong của một tế bào LSTM (Trang 43)
Hình 3.9. Bộ dữ liệu được tải từ Website Ourwordindata - Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào mô hình mạng nơ ron long short term memory (lstm)
Hình 3.9. Bộ dữ liệu được tải từ Website Ourwordindata (Trang 47)
Hình 3.11. Dữ liệu ban đầu được tải về chưa xử lý - Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào mô hình mạng nơ ron long short term memory (lstm)
Hình 3.11. Dữ liệu ban đầu được tải về chưa xử lý (Trang 48)
Hình 4.1. Giao diện chính của hệ thống dự báo mực nước biển. - Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào mô hình mạng nơ ron long short term memory (lstm)
Hình 4.1. Giao diện chính của hệ thống dự báo mực nước biển (Trang 59)
Hình 4.2. Giao diện dự báo mực nước biển 1 năm tiếp theo. - Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào mô hình mạng nơ ron long short term memory (lstm)
Hình 4.2. Giao diện dự báo mực nước biển 1 năm tiếp theo (Trang 60)
Hình 4.4. Giao diện tra cứu dữ liệu mực nước biển theo năm. - Xây dựng hệ thống dự báo mực nước biển trung bình dựa vào mô hình mạng nơ ron long short term memory (lstm)
Hình 4.4. Giao diện tra cứu dữ liệu mực nước biển theo năm (Trang 61)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w