TRƯỜNG ĐẠI HỌC AN GIANG KHOA SƯ PHẠM ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP KHOA ĐÁNH GIÁ VÀ ĐỀ XUẤT CÁC GIẢI PHÁP NÂNG CAO KẾT QUẢ NỘI SUY ĐỐI VỚI MIỀN TÍNH TOÁN CÓ DỮ LIỆU THƯA TS.. Trong đ
Trang 1TRƯỜNG ĐẠI HỌC AN GIANG
KHOA SƯ PHẠM
ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP KHOA
ĐÁNH GIÁ VÀ ĐỀ XUẤT CÁC GIẢI PHÁP NÂNG CAO KẾT QUẢ NỘI SUY ĐỐI VỚI MIỀN TÍNH TOÁN CÓ DỮ LIỆU THƯA
TS PHẠM THỊ THU HOA THS PHẠM MỸ HẠNH
Trang 2TRƯỜNG ĐẠI HỌC AN GIANG
KHOA SƯ PHẠM
ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP KHOA
ĐÁNH GIÁ VÀ ĐỀ XUẤT CÁC GIẢI PHÁP NÂNG CAO KẾT QUẢ NỘI SUY ĐỐI VỚI MIỀN TÍNH TOÁN CÓ DỮ LIỆU THƯA
TS PHẠM THỊ THU HOA THS PHẠM MỸ HẠNH
Trang 3Đề tài nghiên cứu khoa học “Đánh giá và đề xuất các giải pháp nâng cao kết quả nội suy đối với miền tính toán có dữ liệu thưa”, do TS Phạm Thị Thu Hoa và ThS Phạm Mỹ Hạnh công tác tại Bộ môn Toán, Khoa Sư phạm thực hiện Tác giả đã báo cáo kết quả nghiên cứu và được hội đồng khoa học và đào tạo khoa Sư phạm trường Đại học An Giang thông qua ngày 07/01/2020
Trang 4LỜI CẢM TẠ
Chúng tôi xin gửi lời cám ơn chân thành đến quý thầy cô trong bộ môn Toán đã nhiệt tình giúp đỡ và hỗ trợ chúng tôi trong suốt quá trình nghiên cứu đề tài Chúng tôi xin gửi lời cảm ơn đến cô Châu Ngân Khánh, Khoa Công nghệ Thông tin Trường Đại học An Giang đã hỗ trợ chúng tôi những kiến thức về phần mềm Telemac Chúng tôi xin chân thành cảm ơn Sở Tài nguyên và Môi trường An Giang, Đề tài cấp tỉnh “Áp dụng Telemac 3D để mô phỏng dòng chảy và vận chuyển trầm tích tại khu vực ngã ba sông Hậu và sông Vàm Nao khu vực sạt lở xã Mỹ Hội Đông” và anh Mai Anh Vũ, Công ty Tư vấn và Dịch vụ Xây dựng TSC đã cung cấp dữ liệu sông Sài Gòn
An Giang, ngày 07 tháng 01 năm 2020
Người thực hiện
Phạm Thị Thu Hoa
Trang 5TÓM TẮT
Các phương pháp nội suy không gian được sử dụng trong nhiều lĩnh vực như khí tượng, thủy văn, môi trường và xử lí ảnh Các phương pháp này dùng để nội suy giá trị tại các điểm chưa được đo đạc dựa trên dữ liệu đã được đo đạc Thông thường nếu
dữ liệu đo đạc mịn, kết quả nội suy từ các phương pháp nội suy thường giống nhau
và rất tốt Tuy nhiên, đối với dữ liệu thưa và địa hình thay đổi, kết quả từ các phương pháp nội suy khác nhau là rất khác nhau Đề tài này giới thiệu tổng quan về các phương pháp nội suy và đề xuất các phương pháp nội suy không gian phù hợp với dữ liệu thưa và địa hình thay đổi Bằng cách tạo ra dữ liệu thưa từ dữ liệu thực đo trên sông Sài Gòn, kết quả nội suy từ các phương pháp nội suy không gian được so sánh
và kiểm định Động cơ chính của đề tài là để tìm ra phương pháp nội suy thích hợp cho những dữ liệu bình đồ thưa của sông, cụ thể là dữ liệu bình đồ của sông Vàm Nao, tỉnh An Giang
Từ khóa: Phương pháp nội suy không gian, nội suy tuyến tính, nội suy trọng số, nội
suy spline, nội suy Kriging, dữ liệu thưa
Trang 6ABSTRACT
Spatial interpolation methods are used to predict values of spatial phenomena in unsampled locations These methods have been applied in many applications related
to fluid dynamics, natural resources, environmental sciences and image prosessing
In this paper, data with significant noise and discontinuities is considered Finding appropriate interpolation methods for these types of data poses several challenges The main aims of this prọect are to present spatial interpolation methods and to select
an adequate interpolation method for the particular data The results of diferent interpolation methods are implemented and tested in a case study of Sai Gon river The main motivation is to apply the result of the paper to Vam Nao river data which has serious noise
Key words: Spatial interpolation methods, linear interpolation, Inverse distance
weighted interpolation, Spline interpolation, Kriging interpolation, data with noise and discontinuities
Trang 7LỜI CAM KẾT
Chúng tôi xin cam đoan đây là công trình nghiên cứu của riêng chúng tôi Các
số liệu trong công trình nghiên cứu này có xuất xứ rõ ràng Những kết luận mới về khoa học của công trình nghiên cứu này chưa được công bố trong bất kỳ công trình nào khác
An Giang, ngày 07 tháng 01 năm 2020
Người thực hiện
Phạm Thị Thu Hoa
Trang 8MỤC LỤC
CHƯƠNG 1 GIỚI THIỆU 1
1.1 GIỚI THIỆU VẤN ĐỀ NGHIÊN CỨU 1
1.2 TÍNH CẦN THIẾT CỦA ĐỀ TÀI 2
1.3 MỤC TIÊU NGHIÊN CỨU 3
1.4 ĐỐI TƯỢNG NGHIÊN CỨU 3
1.5 NỘI DUNG NGHIÊN CỨU 3
1.6 CÂU HỎI NGHIÊN CỨU 4
1.7 PHƯƠNG PHÁP NGHIÊN CỨU 4
1.8 NHỮNG ĐÓNG GÓP CỦA ĐỀ TÀI 4
CHƯƠNG 2 NỘI DUNG NGHIÊN CỨU 5
2.1 PHƯƠNG PHÁP NỘI SUY TUYẾN TÍNH 5
2.2 PHƯƠNG PHÁP NỘI SUY TRỌNG SỐ 6
2.3 PHƯƠNG PHÁP NỘI SUY ĐIỂM LÂN CẬN GẦN NHẤT 6
2.4 PHƯƠNG PHÁP NỘI SUY HÀM SỐ SPLINE 7
2.5 PHƯƠNG PHÁP NỘI SUY KRIGING 8
2.6 PHƯƠNG PHÁP PHÂN TÍCH TÍNH ĐỐI XỨNG CỦA DỮ LIỆU 9
CHƯƠNG 3 KẾT QUẢ CỦA ĐỀ TÀI 10
3.1 LOẠI BỎ DỮ LIỆU TỪ DỮ LIỆU CHI TIẾT 10
3.2 PHƯƠNG PHÁP THỰC HIỆN 12
3.3 KẾT QUẢ CỦA CÁC PHƯƠNG PHÁP NỘI SUY 13
CHƯƠNG 4 KẾT LUẬN VÀ KHUYẾN NGHỊ 15
TÀI LIỆU THAM KHẢO 16
Trang 9DANH SÁCH BẢNG
Bảng 3.1 Kết quả của các phương pháp nội suy trên dữ liệu sông Sài Gòn với dữ liệu
có biên và dữ liệu được cắt biên 13 Bảng 3.2 Kết quả kiểm định so sánh trung bình sai số của các phương pháp nội suy
so với dữ liệu thực đo 14
Trang 10DANH SÁCH HÌNH
Hình 3.1 Hình sông Sài Gòn (bên trên) và phần dữ liệu được cắt ra để xử lí (bên
dưới) 11 Hình 3.2 Dữ liệu sông Sài Gòn được loại bỏ với biên (bên trên) và không có biên
(bên dưới) 12
Trang 11CHƯƠNG 1
GIỚI THIỆU TỔNG QUAN VẤN ĐỀ NGHIÊN CỨU
1.1 GIỚI THIỆU VẤN ĐỀ NGHIÊN CỨU
Nội suy số liệu là phương pháp số để xác định những điểm số liệu mới nằm trong miền của tập dữ liệu cho trước (Epperson, 2013) Phương pháp nội suy không gian hiện nay được áp dụng nhiều trong các lĩnh vực như xây dựng bản đồ khí tượng thủy văn, thủy lực và khí tượng nông nghiệp và khảo sát sự phân bố tầng đất, nước
và không khí Các phương pháp nội suy không gian là không mới (Dumitru, Plopeanu & Badea, 2013), nhưng hiện nay các tài liệu tiếng việt tổng hợp các kiến thức này chưa được rõ ràng và cụ thể (Trần Thị Băng Tâm, 2006) Các tài liệu này giới thiệu về nội suy trong không gian với mục đích sử dụng các hàm nội suy trong phần mềm Arcgis, không nhấn mạnh vào thuật toán của các phương pháp nội suy Trong đề tài này, nội suy trong không gian được giới thiệu với mục đích tìm cách khắc phục các khuyết điểm trong các phương pháp nội suy của phần mềm Telemac 2D Các cách khắc phục dựa trên các hàm nội suy trong R với các thông số đầu vào
có thể thay đổi được
Đối với dữ liệu chi tiết, thông thường các phương pháp nội suy cho kết quả là giống nhau Tuy nhiên đối với dữ liệu thưa, việc lựa chọn phương pháp nội suy là hết sức thận trọng, để có được kết quả nội suy với sai số thấp Hiện nay, có nhiều đề suất
về phương pháp nội suy cho những dữ liệu thưa (Châu Ngân Khánh và cs., 2018) Trong đề tài này, chúng tôi tiến hành so sánh các phương pháp nội suy trong phần mềm Telemac 2D (Mattle, 2017), phương pháp nội suy trong hội nghị thủy khí (Châu Ngân Khánh và cs., 2018) và phương pháp nội suy với các thông số được điều chỉnh trong R (Dorman, 2014; Rossiter, 2013) Từ đó rút ra kết luận phương pháp nội suy nào nên sử dụng nếu dữ liệu đầu vào là thưa, đặc biệt dữ liệu tại bờ còn thiếu nhiều
Hiện nay, trên thị trường có nhiều phần mềm bản quyền có những tính năng tốt đảm bảo cho kết quả nội suy như phần mềm Argis, Qgis, Blue kennue, Telemac, R
và Mathlab Tuy nhiên, phần mềm Argis và Mathlab là phần mềm thương mại có bản quyền, trong khi đó phần mềm Telemac, phần mềm R và phần mềm Qgis là các phần mềm có mã nguồn mở phù hợp cho các đối tượng nghiên cứu Vì thế, việc nghiên cứu các phần mềm mã nguồn mở hỗ trợ cho việc tính toán, đem lại kết quả tốt cũng như các phần mềm thương mại là có ý nghĩa quan trọng
Công trình nghiên cứu này trình bày tóm tắt các phương pháp nội suy trong không gian và tiến hành so sánh các phương pháp nội suy này dựa trên dữ liệu thưa được cắt từ dữ liệu sông Sài Gòn với các mục đích sau:
Trang 12Thứ nhất giới thiệu về các phương pháp nội suy trong không gian trong phần mềm Telemac 2D và phần mềm R (Ata, 2017; Akima và cs., 2016; Rossiter, 2013; Trần Thị Băng Tâm, 2006) Theo như sự tìm hiểu của chúng tôi, các phương pháp nội suy trong không gian được trình bày bằng tiếng việt hiện rất ít và không chi tiết Thứ hai là tìm cách khắc phục các khuyết điểm của các phương pháp nội suy trong mô hình Telemac 2D đối với dữ liệu thưa, dựa trên các phương pháp nội suy trên phần mềm R Nội suy các dữ liệu đầu vào đóng vai trò quan trọng trong kết quả của phần mềm Telemac Tuy nhiên, các thông số đầu vào của các phương pháp nội suy trong không gian trong phần mềm Telemac 2D ít thay đổi được Trong khi đó các hàm nội suy trong phần mềm R thì linh hoạt hơn với các thông số đầu vào có thể thay đổi được (Ata, 2017; Pebesma & Graeler, 2014) Đối với các dữ liệu thưa, chúng ta sẽ thay đổi các thông số đầu vào trên phần mềm R sao cho sai số của việc nội suy là nhỏ kết hợp với thời gian tính toán không quá lâu
Độ chính xác của các phương pháp nội suy này sẽ được kiểm tra bằng cách áp dụng cho một phần dữ liệu được cắt ra từ dữ liệu của sông Sài Gòn Dữ liệu về độ sâu trên sông Sài Gòn là dữ liệu rất chi tiết Từ dữ liệu chi tiết này, chúng tôi tiến hành cắt bỏ dữ liệu và bờ, để có được bộ dữ liệu thưa Các phương pháp nội suy khác nhau được áp dụng để nội suy lại các điểm được cắt bỏ Sau đó so sánh các kết quả nội suy khác nhau với giá trị thực đo, để biết được phương pháp nội suy nào thích hợp với các dữ liệu thưa
Thứ ba là để chọn phương pháp nội suy tối ưu cho dữ liệu khu vực ngã ba sông Hậu và sông Vàm Nao (Châu Ngân Khánh và cs., 2018) để phục vụ cho dự án “Áp dụng Telemac 3D để mô phỏng dòng chảy và vận chuyển trầm tích tại khu vực ngã
ba sông Hậu và sông Vàm Nao khu vực sạt lở xã Mỹ Hội Đông” của tỉnh An Giang
kết hợp với trường Đại học An Giang (3782/QD-UBND tỉnh An Giang)
1.2 TÍNH CẦN THIẾT CỦA ĐỀ TÀI
Nội suy số liệu là phương pháp số để xác định những điểm số liệu mới nằm trong miền của tập dữ liệu cho trước (Epperson, 2013; Nguyễn Trúc Nhân, 2016) Trong đề tài này chúng tôi tập trung trình bày các phương pháp nội suy trong không gian (Ngô Văn Thanh, 2009; Pav, 2005) Phương pháp nội suy không gian hiện nay được áp dụng nhiều trong các lĩnh vực như xây dựng bản đồ khí tượng thủy văn, thủy lực và khí tượng nông nghiệp và khảo sát sự phân bố tầng đất, nước và không khí
Dữ liệu đầu vào bao gồm tọa độ trong không gian của các điểm và giá trị tại các điểm tọa độ đó Các giá trị đó có thể là độ sâu mực nước, lượng mưa hoặc màu sắc của những điểm trên ảnh Các phương pháp nội suy trong không gian được áp dụng
Trang 13tại các bờ Đối với các dữ liệu thưa như vậy việc chọn lựa các phương pháp nội suy tốt là có ý nghĩa để nội suy ra các giá trị với sai số nhỏ hơn
Ngoài ra, trong các mô hình thủy lực để khảo sát dòng chảy của một khúc sông thì việc dữ liệu nội suy có độ chính xác cao sẽ góp phần quan trọng cho mức độ thành công của mô hình Kết quả mô hình từ đó sẽ phản ánh đúng với thực tế của dòng chảy và có độ tin cậy cao Tuy nhiên, quá trình đo đạc trong thực tế thường gặp nhiều khó khăn do địa hình khu vực nghiên cứu phức tạp, muốn có dữ liệu đo đạc chính xác tốn nhiều thời gian đo, phải lựa chọn kỹ thuật, thiết bị đo đạc phù hợp và thường tốn kém nhiều chi phí Vì thế đa số dữ liệu địa hình trong các mô hình nghiên cứu thủy lực trong thực tế đều là dữ liệu thưa
Trong quá trình chúng tôi tham gia Dự án Telemac, dữ liệu bình đồ khu vực sông Vàm Nao năm 2009 và 2017 do Sở Tài nguyên và Môi trường An Giang cung cấp là
dữ liệu thưa Khoảng cách mỗi đường đo là khoảng 400m Vì thế các kết quả của đề tài sẽ đóng góp thiết thực cho việc chọn lựa các phương pháp nội suy phù hợp đối với địa hình có dữ liệu thưa, từ đó góp phần nâng cao kết quả nội suy cho dữ liệu khu vực sông Vàm Nao
1.3 MỤC TIÊU NGHIÊN CỨU
Giới thiệu về các phương pháp nội suy trong không gian trong phần mềm BlueKenue; Telemac 2D và phần mềm R
Tìm cách khắc phục các khuyết điểm của các phương pháp nội suy trong mô hình Telemac 2D đối với dữ liệu thưa bằng các phương pháp nội suy trên phần mềm
R Chúng tôi tiến hành so sánh các kết quả nội suy từ các phương pháp nội suy khác nhau trên dữ liệu thưa được cắt từ dữ liệu sông Sài Gòn Trên cơ sở đó chọn ra được phương pháp nội suy phù hợp với những dữ liệu thưa
Đề xuất phương pháp nội suy tối ưu cho dữ liệu khu vực ngã ba sông Hậu và sông Vàm Nao để phục vụ cho dự án “Áp dụng Telemac 3D để mô phỏng dòng chảy
và vận chuyển trầm tích tại khu vực ngã ba sông Hậu và sông Vàm Nao khu vực sạt
lở xã Mỹ Hội Đông” của tỉnh An Giang kết hợp với trường Đại học An Giang 1.4 ĐỐI TƯỢNG NGHIÊN CỨU
Các phương pháp nội suy không gian cho dữ liệu bình đồ của sông
Áp dụng các phương pháp nội suy không gian trên dữ liệu bình đồ một đoạn sông Sài Gòn
1.5 NỘI DUNG NGHIÊN CỨU
Trình bày các phương pháp nội suy phổ biến trong các phần mềm của các mô hình thủy lực như: Phương pháp nội suy tuyến tính; phương pháp nội suy có trọng số; phương pháp nội suy điểm lân cận gần nhất; phương pháp nội suy hàm số Spline
Trang 14và phương pháp nội suy Krige Đánh giá ưu và nhược điểm của từng phương pháp với những ưu nhược cho từng phương pháp
Từ dữ liệu của một đoạn sông Sài Gòn, chúng tôi trích xuất được một dữ liệu thưa Các phương pháp nội suy khác nhau được áp dụng trên dữ liệu thưa này Kết quả của từng phương pháp nội suy được so sánh với dữ liệu thực đo và được so sánh với nhau Trên cơ sở đó, đề xuất phương pháp nội suy tối ưu cho dữ liệu thưa Kết quả của đề tài được dùng đề xuất việc chọn lựa phương pháp nội suy thích hợp cho
dữ liệu bình đồ thưa, cụ thể là dự án nghiên cứu sự dịch chuyển hố xói tại sông Vàm Nao
1.6 CÂU HỎI NGHIÊN CỨU
Trong các phương pháp nội suy trong phần mềm Telemac 2D, trong phần mềm
R và phương pháp nội suy được báo cáo tại hội nghị cơ học thủy khí 2018, phương
pháp nào cho kết quả tốt nhất đối với dữ liệu thưa?
1.7 PHƯƠNG PHÁP NGHIÊN CỨU
Sử dụng các phần mềm chuyên dụng như: Phần mềm R, phần mềm BlueKenue, phần mềm Arcgisvà phần mềm QGis để nội suy dữ liệu thưa từ dữ liệu Sông Sài Gòn
Tham khảo ý kiến của các chuyên gia và thành viên nhóm nghiên cứu thuộc Dự
án Telemac
Viết mã code trên phần mềm R để cắt dữ liệu sông Sài Gòn (dữ liệu chi tiết), để
có được dữ liệu gần giống với dữ liệu sông Vàm Nao
Sử dụng phần mềm gstat và akima trên R để chỉnh sửa các thông số từ các hàm nội suy
Tiến hành kiểm định các kết quả từ các phương pháp nội suy khác nhau với các giả thuyết thông kê là sự khác biệt của các kết quả nội suy khác nhau với dữ liệu thực
Trang 15Kết quả của đề tài được sử dụng để đưa ra đề xuất trong việc chọn phương pháp nội suy tối ưu cho dữ liệu khu vực ngã ba sông Hậu và sông Vàm Nao để phục vụ cho dự án “Áp dụng mô hình Telemac 2D và 3D để mô phỏng dòng chảy và vận chuyển trầm tích tại khu vực ngã ba sông Hậu và sông Vàm Nao” của tỉnh An Giang kết hợp với trường Đại học An Giang
CHƯƠNG 2
NỘI DUNG NGHIÊN CỨU
Dựa trên quá trình nghiên cứu các tài liệu về phương pháp nội suy, đề tài nghiên cứu trình bày các phương pháp nội suy trong phần mềm Telemac 2D và R (Ata, 2017; Dorman, 2014; Dumitru và cs., 2013; Garnero & Godone, 2013; Pebesma & Graeler, 2014)
2.1 PHƯƠNG PHÁP NỘI SUY TUYẾN TÍNH (LINEAR)
Phương pháp nội suy tuyến tính xác định các giá trị nội suy bằng cách chia miền tính toán ra thành các tam giác Thuật toán của phép chia tam giác này được lập lại bắt đầu bằng việc chọn điểm đầu tiên Sau đó chúng ta đi tìm khoảng cách gần nhất
từ điểm được chọn đến các điểm dữ liệu và liên kết với các điểm gần kề bằng các đường thẳng
Sau khi miền tính toán được chia ra thành các tam giác, các giá trị nội suy được xác định thông qua mặt phẳng được tạo bởi tam giác chứa giá trị cần nội suy đó Phương trình mặt phẳng đi qua ba đỉnh của tam giác có dạng:
zax by c (2.1)
Trong đó z là giá trị cần được nội suy tại tọa độ (x, y) Các hệ số a, b và c của
(2.1) được xác định bằng cách thay tọa độ và giá trị của ba đỉnh tam giác lần lược là
Lưu ý: phương pháp nội suy tuyến tính không có các thông số đầu vào, ngoại
trừ dữ liệu đầu vào và dữ liệu các điểm cần được nội suy Vì vậy chúng ta không thể