Bài viết Đánh giá một số phương pháp nội suy không gian cho bài toán mưa năm ở Việt Nam trình bày đánh giá một số các phương pháp nội suy thường dùng ở Việt Nam, từ đó đề xuất các phương pháp phù hợp với điều kiện Việt Nam.
Trang 1ĐÁNH GIÁ MỘT SỐ PHƯƠNG PHÁP NỘI SUY KHÔNG GIAN
CHO BÀI TOÁN MƯA NĂM Ở VIỆT NAM
Ngô Lê An1, Nguyễn Thị Thu Hà1, Hoàng Thanh Tùng1
1 Trường Đại học Thuỷ lợi, email: nlan@tlu.edu.vn
1 GIỚI THIỆU CHUNG
Mưa dạng lưới có vai trò quan trọng trong
việc mô tả trạng thái thay đổi của mưa theo
không gian, giúp cho việc đánh giá mô hình
mô phỏng khí hậu hay mô phỏng dòng chảy
trên bề mặt đất được tốt hơn Để xây dựng
được dữ liệu mưa dạng lưới, nhiều nghiên
cứu tập trung sử dụng các phương pháp nội
suy nhằm nâng cao độ chi tiết của mạng lưới
quan trắc mưa thực đo Ở Việt Nam, mạng
lưới các trạm quan trắc đo mưa khá thưa với
mật độ trung bình khoảng một trạm đo trên
600 km2 diện tích, mật độ trạm cao tập trung
ở vùng đồng bằng sông Hồng, các vùng núi
cao lại có mật độ trạm thấp Trong những
năm gần đây, mặc dù đã có nhiều trạm đo
mưa tự động được xây dựng, nhưng thời gian
quan trắc còn ngắn, thường chỉ vài năm nên
việc ứng dụng, khai thác trong các bài toán
liên quan đến tài nguyên nước còn hạn chế
Do vậy, việc nghiên cứu sử dụng các phương
pháp nội suy đặc trưng mưa theo không gian
ở Việt Nam là rất cần thiết
Bài báo này đánh giá một số các phương
pháp nội suy thường dùng ở Việt Nam, từ đó
đề xuất các phương pháp phù hợp với điều
kiện Việt Nam
2 PHƯƠNG PHÁP NGHIÊN CỨU
2.1 Phương pháp nội suy
Các phương pháp nội suy sử dụng trong
nghiên cứu này bao gồm:
- Phương pháp Lân cận gần nhất (NN): trị
số nội suy tại vị trí nghiên cứu được lấy bằng
trị số tại trạm đo gần nhất
- Phương pháp Lân cận Tự nhiên (NNI)[1]: được phát triển dựa trên phương pháp đa giác Thiessen, giả thiết mức độ đóng góp mưa của các trạm xung quanh tỷ lệ với diện tích đóng góp của từng trạm cho đa giác của vị trí nghiên cứu (đối với đa giác Thiessen được tạo bởi toàn bộ các trạm bao gồm cả vị trí xem xét), được xác định khi loại
bỏ vị trí cần tính toán
- Phương pháp nghịch đảo khoảng cách (IDW)[2]: Được tính toán dựa trên các trị số
đo mưa tại các trạm đo lân cận với trị số được xác định theo nghịch đảo khoảng cách
- Phương pháp nghịch đảo khoảng cách và
độ cao (IDEW)[3]: Tương tự với IDW nhưng
có bổ sung thêm biến trị số độ cao với trọng
số là nghịch đảo của chênh lệch độ cao giữa điểm tính toán và trạm đo lân cận
- Phương pháp tương quan tuyến tính (MLR): Giả thiết lượng mưa tại một điểm phụ thuộc vào các yếu tố địa hình như toạ độ của điểm, độ cao, độ dốc và hướng
2.2 Dữ liệu
Trong nghiên cứu này, số liệu mưa tháng của 392 trạm đo mưa trên toàn lãnh thổ Việt Nam được sử dụng (Hình 1) Do điều kiện thu thập dữ liệu thực đo, thời đoạn đánh giá được lấy từ năm 1980 đến 2006
Các đặc trưng địa hình như độ cao, độ dốc
và hướng được xác định dựa trên bản đồ số độ cao có độ phân giải 90m của SRTM (http://srtm.csi.cgiar.org/srtmdata/) Nhằm hạn chế sai số do vị trí trạm đo không chính xác, các trị số độ cao, độ dốc và hướng được xác
Trang 2định bằng cách tính trung bình cho một vùng
nhỏ xung quanh vị trí trạm đo
2.3 Phương pháp đánh giá
Để đánh giá mức độ chính xác của từng
phương pháp nội suy, bài báo sử dụng kỹ
thuật kiểm tra chéo (cross-validation) đánh
giá sai số nội suy cho từng trạm đo Đầu tiên,
dữ liệu của một trạm bất kỳ được loại bỏ khỏi
tập dữ liệu, sau đó sử dụng các phương pháp
nội suy kể trên để tính toán ra lượng mưa tại
trạm đã bị loại bỏ đó Lặp lại quá trình này
cho toàn bộ số trạm đo có trong bộ dữ liệu
Sự sai khác giữa kết quả tính toán và thực
đo được mô tả bằng chỉ số MAE (Mean
Absolute Error):
1
n tt td
i i
i X X MAE
n
trong đó, Xtt và Xtd tương ứng là giá trị mưa
năm tính toán và mưa năm thực đo (được tính
từ lượng mưa tháng), n là số năm tính toán
MAE sẽ không bao gồm những năm bị thiếu
số liệu thực đo Giá trị MAE trung bình tại
từng trạm sẽ được sử dụng để đánh giá sự
phù hợp của từng phương pháp nội suy với
mức độ tốt nhất nếu giá trị trung bình MAE
nhỏ nhất và ngược lại là kém nhất nếu có giá
trị trung bình MAE cao nhất
3 KẾT QUẢ NGHIÊN CỨU
Giá trị MAE trung bình của từng trạm ứng
với từng phương pháp được sử dụng làm căn
cứ xếp hạng chất lượng nội suy Kết quả tổng
hợp xếp hạng cho 392 trạm được trình bày ở
Bảng 1 với hạng 1 (H1) là tốt nhất và hạng 5
(H5) là kém nhất
Bảng 1 Xếp hạng các phương pháp
IDEW 122 126 82 49 13
Nếu lấy hạng 1 tương ứng là 1 điểm cho đến hạng 5 tương ứng là 5 điểm thì phương pháp IDEW được coi là phù hợp nhất khi tổng điểm nhỏ nhất Phương pháp IDW kém hơn một chút nhưng có tổng điểm chênh lệch không đáng kể với IDEW Phương pháp MLR cho tổng điểm cao nhất thể hiện mức độ phù hợp kém nhất trong 5 phương pháp nội suy được nghiên cứu Phương pháp IDEW cũng
có số lượng trạm đo có mức độ phù hợp cao nhất với 122 trạm, tuy nhiên số lượng trạm cho kết quả nội suy IDEW kém nhất cũng nhiều hơn so với phương pháp IDW Số lượng trạm phù hợp với phương pháp MLR nhất nhiều xấp xỉ với hai phương pháp NN và NNI, tuy nhiên phương pháp MLR lại có số lượng trạm ít phù hợp nhất nhiều nhất (chiếm hơn một nửa số trạm nghiên cứu)
Hình 1 Kết quả đánh giá mức độ
phù hợp nhất của từng phương pháp nội suy tại từng trạm nghiên cứu
Trang 3Phương pháp tốt nhất cho từng trạm được
thống kê và thể hiện trên Hình 1 Nhìn chung,
kết quả cho thấy không có xu thế rõ rệt nào
cho từng phương pháp từ phương pháp ít tốt
nhất (MLR) cho đến phương pháp tốt nhất
(IDEW, IDW) Sự phân bố của các trạm ứng
với từng phương pháp đều trải dải trên toàn
bộ lãnh thổ Việt Nam, từ vùng đồng bằng
cho đến núi cao, ngoại trừ các trạm đo nằm
bên sườn phía tây dãy núi Trường Sơn dường
như phù hợp với các phương pháp IDEW,
IDW hơn Phương pháp MLR cho kết quả
kém phù hợp ở vùng đồng bằng như đồng
bằng sông Hồng và sông Cửu Long Điều này
cũng phù hợp với điều kiện số liệu địa hình ở
vùng đồng bằng khi sai số tương đối về độ
cao (dẫn đến sai số về độ dốc, hướng dốc)
của nó thường sẽ kém hơn nhưng khu vực
núi cao
Hình 2 và 3 là các biểu đồ hộp trình bày về
phân bố độ cao tương ứng với từng phương
pháp cho kết quả tốt nhất và kém nhất tại
từng trạm
Hình 2 Phân bố cao độ (m) ứng với từng
phương pháp nội suy cho kết quả tốt nhất
Hình 3 Phân bố cao độ (m) ứng với từng
phương pháp nội suy cho kết quả kém nhất
Qua hai hình vẽ này, có thể nhận thấy,
phương pháp IDW thích hợp với các vị trí có
cao độ trung bình hoặc thấp Phương pháp IDEW có thể cải thiện được chất lượng nội suy ở những vị trí có cao độ lớn (> 500m)
Ba phương pháp còn lại có sự phân bố khá đồng đều khi ở sự chính xác hoặc không chính xác trong nội suy đều phân bố ở các vị trí có cao độ từ thấp đến cao
4 KẾT LUẬN
Kết quả nghiên cứu đánh giá mức độ phù hợp của 5 phương pháp nội suy mưa năm cho
392 trạm đo mưa trong lãnh thổ Việt Nam cho thấy nhóm các phương pháp trọng số khoảng cách và độ cao (IDEW, IDW) là tốt nhất Phương pháp tương quan đa biến tuyến tính với các đặc trưng vị trí, địa hình cho kết quả kém nhất.Sai số trong việc xác định vị trí cũng như các trị số đặc trưng mô tả địa hình (độ cao, độ dốc, hướng dốc…) cũng có thể là nguyên nhân dẫn đến sự sai lệch này.Báo cáo cũng chỉ ra rằng, không có nhiều khác biệt rõ rệt về sự phân bố theo không gian của các phương pháp phù hợp nhất cho từng trạm Điều này thể hiện rằng để xây dựng được bản
đồ đẳng trị mưa hay bộ dữ liệu mưa lưới cho toàn bộ lãnh thổ Việt Nam thì việc chỉ sử dụng một số ít phương pháp nội suy sẽ không phù hợp
5 TÀI LIỆU THAM KHẢO
[1] R Sibson, “A brief description of natural
neighbor interpolation,” in Interpolating
Multivariate Data, John Wiley., V Barnett,
Ed Chichester: John Wiley, 1981, pp 21-36
Interpolation Function for
Irregularly-Spaced Data,” in ACM National
Conference, 1968, pp 517-524
[3] I Masih, S Maskey, S Uhlenbrook, and V Smakhtin, “Assessing the Impact of Areal Precipitation Input on Streamflow Simulations Using the SWAT Model,”
JAWRA J Am Water Resour Assoc., vol
47, no 1, pp 179-195, Feb 2011