Trong nghiên cứu này các mô hình hồi quy tuyến tính đa biến với các hệ số được xác định qua phương pháp bình phương tối thiểu (MLR), phương pháp độ lệch tuyệt đối nhỏ nhất (LAD), phương pháp minimax (LMV) và mô hình mạng thần kinh nhân tạo (ANN) được ứng dụng để thử nghiệm dự báo hạn 6 tháng số lượng xoáy thuận nhiệt đới hoạt động trên khu vực Biển Đông.
Trang 1THỬ NGHIỆM DỰ BÁO HẠN MÙA SỐ LƯỢNG XOÁY THUẬN NHIỆT ĐỚI
HOẠT ĐỘNG TRÊN KHU VỰC BIỂN ĐÔNG BẰNG PHƯƠNG PHÁP THỐNG KÊ
Đinh Bá Duy 1 , Ngô Đức Thành 2 , Phan Văn Tân 3*
1 Trung tâm Nhiệt đới Việt Nga, Bộ Quốc phòng, Email: duydb.vrtc@gmail.com
2 Trường Đại học Khoa học và Công nghệ Hà Nội (USTH), Viện Hàn lâm Khoa học và Công nghệ
Việt Nam (VAST)
3 Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội
TÓM TẮT
Trong nghiên cứu này các mô hình hồi quy tuyến tính đa biến với các hệ số được xác định qua
phương pháp bình phương tối thiểu (MLR), phương pháp độ lệch tuyệt đối nhỏ nhất (LAD), phương
pháp minimax (LMV) và mô hình mạng thần kinh nhân tạo (ANN) được ứng dụng để thử nghiệm dự
báo hạn 6 tháng số lượng xoáy thuận nhiệt đới hoạt động trên khu vực Biển Đông Qua khảo sát 24
chỉ số khí hậu nghiên cứu đã lựa chọn được 10 chỉ số làm nhân tố dự báo Kết quả đánh giá sai số dự
báo cho thấy trên bộ số liệu phụ thuộc, mô hình ANN cho kết quả tốt nhất, tiếp đến là mô hình MLR,
LAD và kém nhất ở mô hình LMV Mặc dù vậy, việc kiểm nghiệm dự báo trên bộ số liệu độc lập
(2011-2017) lại chỉ ra mô hình LAD cho kết quả phù hợp nhất, tiếp theo là MLR và LMV Sai số dự
báo của mô hình ANN quá khác nhau giữa các tập số liệu phụ thuộc và độc lập có thể liên quan đến
sự khác biệt về tính chất biến động theo thời gian của hai chuỗi số liệu và cần được khảo sát sâu hơn
Từ khoá: Dự báo mùa, xoáy thuận nhiệt đới, Biển Đông, dự báo thống kê
1 GIỚI THIỆU
Hiện nay, với những biểu hiện bất thường của hệ thống thời tiết khí hậu đặc biệt là các hiện
tượng thời tiết cực đoan như bão, tố lốc… thì bài toán dự báo hạn mùa bão, áp thấp nhiệt đới
(XTNĐ) đang là vấn đề được nhiều nhà khoa học, nhà quản lý trong và ngoài nước quan tâm bởi
các kết quả của nó có ý nghĩa ứng dụng hết sức thiết thực đối với các hoạt động kinh tế xã hội và an
ninh quốc phòng Cơ sở vật lý để đưa ra những thông tin ước tính trong tương lai xa xuất phát từ
tính có thể dự báo được các tín hiệu/yếu tố trong đại dương ở qui mô thời gian mùa đến những qui
mô nhỏ hơn trên bề mặt lục địa và trong khí quyển [1] Điểm mấu chốt trong bài toán dự báo mùa là
các hiện tượng tương tác giữa đại dương - khí quyển như hiện tượng El Niño là một ví dụ xảy ra ở
vùng Thái Bình Dương nhiệt đới và có thể dự báo trước đến 6 tháng hoặc xa hơn nữa [2], [3] Thời
hạn trong các dự báo hạn mùa thường từ qui mô tháng cho đến một năm tùy thuộc yếu tố dự báo,
trong đó các hạn dự báo phổ biến là 1, 3, 6 và 9 tháng Nhiều nghiên cứu đã chỉ ra, sự tương tác
giữa khí quyển và đại dương đóng một vai trò cực kỳ quan trọng trong việc điều khiển và chi phối
hoàn lưu khí quyển [4] Do vậy, yếu tố nhiệt độ mặt nước biển (SST) và các quá trình vật lý khác
trên bề mặt trái đất ảnh hưởng nhiều hơn tới kết quả dự báo hạn mùa so với các điều kiện ban đầu
của khí quyển Trên qui mô toàn cầu, sự thay đổi của yếu tố SST là nguyên nhân chính dẫn đễn
những thay đổi của khí hậu từ năm này sang năm khác Đáng chú ý, ở vùng nhiệt đới, dị thường
SST liên quan đến hoạt động của đối lưu sâu điều khiển phần lớn hoàn lưu khí quyển toàn cầu do
đó yếu tố này là thành phần quan trọng trong bài toán dự báo hạn mùa [5] Như vậy, xuất phát từ
bản chất trên việc giải quyết các bài toán dự báo mùa thường được tiếp cận theo phương pháp thống
kê [6], [7], [8], [9], [10], [11] Nghiên cứu này tiếp cận phương pháp thống kê để xây dựng các
phương trình dự báo hạn mùa số lượng XTNĐ hoạt động trên khu vực Biển Đông (BĐ)
Trang 22 SỐ LIỆU VÀ PHƯƠNG PHÁP
Nghiên cứu khảo sát để lựa chọn nhân tố dự báo từ bộ 24 chỉ số khí hậu giai đoạn 1981-2017, được cập nhật tại website của NOAA và JMA (Bảng 1) Yếu dự báo là số lượng XTNĐ hoạt động trong 6 tháng tiếp sau trên khu vực BĐ được tính toán từ số liệu XTNĐ của JMA Tất cả các bộ số liệu này được chuẩn bị cho giai đoạn dự báo phụ thuộc 1981-2010 và cho giai đoạn dự báo độc lập 2011-2017
Bảng 1 Các chỉ số khí hậu được khảo sát lựa chọn nhân tố dự báo
1 Niño 3 SST vùng nhiệt đới Đông Thái Bình Dương (5N-5S, 150W-90W)
3 CPC_SOI Chỉ số dao động Nam
4 Niño 4 Chỉ số SST vùng nhiệt đới trung tâm Thái Bình Dương (5N-5S, 160E-150W)
5 REQSOI Dị thường chuẩn hóa dao động Nam vùng xích đạo
6 WPAC850 Gió tín phong mực 850 mb khu vực Tây Thái Bình Dương (5N-5S, 135E-180W)
7 DMI Chỉ số dao động lưỡng cực (Dipole Mode Index)
8 U200_IN Gió vĩ hướng mực 200mb khu vực 5ºN-5ºS; 80-100ºE
9 NP Áp suất mực biển khu vực Bắc Thái Bình Dương (30N-65N, 160E-140W)
LA Dị thường chuẩn hóa khí áp mực biển vùng xích đạo gần khu vực Indonesia
11 WP Chỉ số Tây Thái Bình Dương (Western Pacific Index)
12 SOLAR Chỉ số dòng năng lượng mặt trời (Solar Flux - 10.7cm)
13 AMM Chỉ số Mod kinh hướng Đại Tây Dương (Atlantic Meridional Mode)
14 MEI V2 Chỉ số ENSO đa biến phiên bản 2 (Multivariate ENSO Index, V2)
15 AMO Dao động đa thập kỷ Đại Tây Dương (Atlantic multidecadal Oscillation)
16 OLR-MC Chỉ số phát xạ sóng dài khu vực 5N-5S, 110-135ºE
17 NAO Dao động Bắc Đại Tây Dương (North Atlantic Oscillation)
18 ONI Chỉ số Niño Đại Dương
19 OLR-PH Chỉ số phát xạ sóng dài khu vực 5N-5S, 110-140ºE (theo JMA)
20 Niño 1+2 Chỉ số SST Đông Thái Bình Dương (vùng Niño 1+2; 0-10S, 90W-80W)
21 TNI Chỉ số khuynh hướng Niño hay chỉ số Niño-chuyển dịch (Trans-Niño Index)
22 Niño 3.4 Chỉ số SST trung tâm Thái Bình Dương vùng Niño 3.4 (5N-5S, 170E-120W)
23 PNA Chỉ số Bắc Mỹ Thái Bình Dương (Pacific North American Index)
24 TSA Chỉ số Nam Đại Tây Dương nhiệt đới (Tropical Southern Atlantic Index)
Phương pháp thống kê được sử dụng trong nghiên cứu này, theo đó số lượng XTNĐ độ hoạt động trên khu vực BĐ được xây dựng từ mô hình hồi quy tuyến tính nhiều biến có dạng:
∑ (1)
Trang 3Trong đó y là yếu tố dự báo (số lượng XTNĐ 6 tháng tới), là các nhân tố dự báo, các hệ số hồi quy được xác định theo ba phương pháp khác nhau:
1) Phương pháp bình phương tối thiểu (MLR):
∑ ( ∑ ) (2) 2) Phương pháp độ lệch tuyệt đối nhỏ nhất (LAD):
∑ | ∑ | (3) 3) Phương pháp minimax (LMV):
( | ∑ | ) (4) Trong các công thức từ (2) đến (4) ở trên, , tương ứng là giá trị quan trắc thứ i (i=1, 2, ,
n) của yếu tố dự báo y và các nhân tố dự báo (j=1, 2, ,m) Ứng với mỗi phương pháp xác định
bộ hệ số hồi quy ở trên, để giản tiện và thống nhất các nghiên cứu và kết quả dưới đây quy ước tên gọi tương ứng là mô hình MLR, mô hình LAD và mô hình LMV
Bên cạnh 3 mô hình truyền thống kể trên, nghiên cứu này còn thử nghiệm với mô hình mạng thần kinh nhân tạo (mô hình ANN) với cấu trúc gồm một lớp đầu vào, một lớp ẩn và một lớp đầu
ra Các neuron ở hai lớp kề nhau có liên kết với nhau thông qua các trọng số, các neuron cùng một lớp hoặc ở hai lớp không kề nhau không có liên kết với nhau
Kết quả dự báo được đánh giá qua các sai số trung bình (ME), sai số tuyệt đối trung bình (MAE), sai số bình phương trung bình (RMSE) và hệ số tương quan (Corr) giữa giá trị dự báo và quan trắc
3 KẾT QUẢ VÀ THẢO LUẬN
Hình 1 mô tả mức độ tương quan trễ từ 0 cho tới 12 tháng của 24 chỉ số khí hậu với số lượng XTNĐ hoạt động trên khu vực Biển Đông Kết quả tại hình 1 cho thấy các chỉ số có mức độ tương quan tốt là Niño 3, QBO, Niño 4, WPC850, DMI, NP, AMM, AMO, Niño 1+2, Niño 3.4
Với 10 chỉ số khí hậu có tương quan tốt nhất trong bộ 24 chỉ số khảo sát, nghiên cứu đã tiến hành xây dựng các phương trình dự báo số lượng XTNĐ của 6 tháng tiếp sau theo 4 phương pháp thống kê (mục 2) Kết quả đánh gía sai số của các phương trình dự báo trên bộ số liệu phụ thuộc (1981-2010) và trên bộ số liệu độc lập (2011-2017) lần lượt được trình bày trong các bảng 2 và 3 Bảng 2 cho thấy các mô hình đã mô phỏng khá tốt số lượng XTNĐ trên khu vực BĐ Sai số trung bình (ME) khá nhỏ, phổ biến ở 0.3 cơn, tương quan giữa kết quả dự báo và quan trắc dao động trong khoảng 0.5 - 0.7, còn sai số tuyệt đối trung bình chỉ trên dưới 1.0 cơn trong đó mô hình ANN gần như đạt mức lý tưởng (sai số gần bằng 0)
Hình 1 Hệ số tương quan giữa số lượng TCs và các chỉ số khí hậu
Chỉ số đánh giá sai số dự báo trên bộ số liệu độc lập (bảng 3) cho thấy cả 4 mô hình đều có xu
Trang 4nằm trong khoảng từ 1 đến 4 cơn, sai số tuyệt đối trung bình khoảng trên 2.0 cơn Mô hình ANN cho sai số lớn nhất
Bảng 2 Chỉ số đánh giá sai số dự báo của các mô hình trên bộ số liệu phụ thuộc
(giai đoạn 1981-2010)
Tháng
dự
báo
ME MAE RMSE Corr ME MAE RMSE Corr ME MAE RMSE Corr ME MAE RMSE Corr
5 0,0 1,1 1,6 0,7 -0,1 1,0 1,7 0,6 -0,1 1,9 2,2 0,4 0,0 0,0 0,0 1,0
6 0,0 1,1 1,4 0,7 -0,1 1,0 1,5 0,6 -0,1 1,5 1,8 0,6 0,0 0,0 0,1 1,0
12 0,0 0,8 0,9 0,6 -0,1 0,7 1,1 0,4 0,0 0,9 1,0 0,5 0,0 0,0 0,0 1,0
Bảng 3 Chỉ số đánh giá sai số dự báo của các mô hình trên bộ số liệu độc lập
(giai đoạn 2011-2017)
Tháng
dự báo
ME MAE RMSE ME MAE RMSE ME MAE RMSE ME MAE RMSE
Trang 54 KẾT LUẬN
Các kết quả nghiên cứu bước đầu đã chỉ ra khả năng dự báo hạn mùa số lượng XTNĐ hoạt động trên khu vực BĐ bằng việc sử dụng các mô hình thống kê MLR, LAD, LMV và ANN với nhân tố dự báo là các chỉ số khí hậu
Đánh giá các sai số dự báo cho thấy trên bộ số liệu luyện mô hình ANN cho kết quả tốt nhất, tiếp đến là mô hình MLR, LAD và kém nhất ở mô hình LMV, tuy vậy kiểm nghiệm trên dự báo độc lập (2011-2017) mô hình ANN cho kết quả kém nhất, các kết quả tốt hơn theo thứ tự được thống kê tại mô hình LAD, MLR và LMV
TÀI LIỆU THAM KHẢO
[1] Palmer T N., Anderson D L T (1994), The prospects for seasonal forecasting -A review paper,
Quarterly Journal of the Royal Meteorological Society, 120(518), pp 755–793
[2] Jin E K., Kinter J L., Wang B., Park C.-K., Kang I.-S., Kirtman B P., Kug J.-S., Kumar A., Luo J.-J., Schemm J., Shukla J., Yamagata T (2008), Current status of ENSO prediction skill in coupled
ocean-atmosphere models, Clim Dyn., 31(6), pp 647–664
[3] Weisheimer A., Doblas‐ Reyes F J., Palmer T N., Alessandri A., Arribas A., Déqué M., Keenlyside N., MacVean M., Navarra A., Rogel P (2009), ENSEMBLES: A new multi-model ensemble for seasonal-to-annual predictions - Skill and progress beyond DEMETER in forecasting tropical Pacific
SSTs, Geophys Res Lett., 36(21), pp 1–6
[4] Wang S W., Zhu J H (2001), A review on seasonal climate prediction, Advances in Atmospheric Sciences, 18(2), pp 197–208
[5] Stockdale T N (2000), An overview of techniques for seasonal forecasting, Stochastic Environmental Research and Risk Assessment, 14(4), pp 0305–0318
[6] Landsea C W., Bell G D., Gray W M., Goldenberg S B (2002), The Extremely Active 1995 Atlantic
Hurricane Season: Environmental Conditions and Verification of Seasonal Forecasts, Mon Weather Rev., 126(5), pp 1174–1193
[7] Landsea C W., Gray W M., Mielke P W., Berry K J (1994), Seasonal forecasting of Atlantic hurricane
activity, Weather, 49(8), pp 273–284
[8] Gray W M., Landsea W C., Mielke Jr P W., Berry K J (1993), Predicting Atlantic Basin Seasonal
Tropical Cyclone Activity by 1 June, Wea Forecast., vol 9, pp 103–115
[9] Nicholls N., Landsea C., Gill J (1998), Recent trends in Australian region tropical cyclone activity,
Meteorol Atmos Phys., 65(3–4), pp 197–205
[10] Elsner J B., Liu K., Kocher B (2000), Spatial variations in major U.S hurricane activity: Statistics and
a physical mechanism, J Clim., 13(13), pp 2293–2305
[11].Chan J C L., Shi J., Lam C (1998), Seasonal Forecasting of Tropical Cyclone Activity over
theWestern North Pacific and the East Sea, Weather Forecast, 13(4), pp 997–1004