Việc đánh giá chất lượng dự báo KTTV là một trong các chỉ tiêu cơ bản để đánh giá công việc của các Cơ quan KTTV quốc gia, đồng thời, thông qua chất lượng dự báo KTTV, có thể định hướng
Trang 1CỤC KHÍ TƯỢNG THỦY VĂN VÀ BIẾN ĐỔI KHÍ HẬU
ĐƠN VỊ CHỦ TRÌ: CỤC KHÍ TƯỢNG THỦY VĂN VÀ BIẾN ĐỔI KHÍ HẬU
-******** -
BÁO CÁO TỔNG KẾT ĐỀ TÀI NGHIÊN CỨU KHOA HỌC VÀ CÔNG NGHỆ CẤP BỘ
ĐỀ TÀI:
NGHIÊN CỨU XÂY DỰNG VÀ PHÁT TRIỂN HỆ THỐNG ĐÁNH GIÁ KHÁCH QUAN CÁC SẢN PHẨM CỦA MÔ HÌNH DỰ BÁO
SỐ CHO KHU VỰC VIỆT NAM
Chủ nhiệm: ThS Nguyễn Thị Bình Minh
9092
HÀ NỘI, 01-2012
Trang 2ĐƠN VỊ CHỦ TRÌ: CỤC KHÍ TƯỢNG THỦY VĂN VÀ BIẾN ĐỔI KHÍ HẬU
-******** -
BÁO CÁO TỔNG KẾT ĐỀ TÀI NGHIÊN CỨU KHOA HỌC VÀ CÔNG NGHỆ CẤP BỘ
TS Lê Đức ThS Đỗ Thị Lệ Thủy TS Phan Văn Tân
NCS Võ Văn Hòa CN Trần Anh Đức TS Hoàng Đức Cường
ThS Dư Đức Tiến CN Nguyễn Thu Hằng
CN Nguyễn Thanh Tùng CN Nguyễn Mạnh Linh
Hà Nội, ngày tháng 01 năm 2012 Hà Nội, ngày tháng 01 năm 2012
Trang 3DANH SÁCH CÁC CHỮ VIẾT TẮT
(Bologna Limited Area Model)
BRoKen
(Brier Score)
(Brier Skill Score)
(Contiguous Rain Areas)
CRPS Chỉ số đánh giá xác suất hạng liên tục
(Continous Ranked Probability Score)
(Ensemble Forecast)
(Ensemble Prediction System)
(Equitable Threat Score)
(Frequency Bias) FAR Tỷ lệ cảnh báo khống
Trang 4(False Alarm Ratio)
(Global Data Assimilation System)
GFS Mô hình toàn cầu của NCEP
(Global Forecasting System)
(Global Spectral Model)
(Gridded Analysis and Display System)
(Gridded Binary)
(Graphical User Interface)
(Heidke Skill Score)
(High Resolution Model)
(IGNorance Score) JRA-25 Số liệu tái phân tích chu kỳ 25 năm của Nhật Bản
(Japanese ReAnalysis - 25 years)
(Mean Absolute Error)
(Mean Error)
Trang 5MM5 Mô hình dự báo số trị khu vực MM5
(Fifth generation Mesoscale Model)
(Network Common Data Form)
(National Centers for Environmental Prediction)
NWP Dự báo thời tiết số trị
(Numerical Weather Prediction)
(Probability Of Detection)
(Root Mean Square Error)
(Ranked Probability Score)
(Threat Score)
TTDBTƯ Trung tâm Dự báo Khí tượng Thủy văn Trung ương
(World Meteorological Organization)
(Weather and Research Forecasting System)
Trang 6DANH SÁCH CÁC BẢNG
1 1.2.1 Bảng phân loại tần xuất cho biến dự báo dạng nhị phân 10
2 2.2.1 Các trường trong bảng quan hệ synop_stn của CSDL quan trắc bề mặt 20
3 2.2.2 Tương tự bảng 2.2.1 nhưng cho bảng quan hệ synop_rain_obs 21
4 2.2.3 Tương tự bảng 2.2.1 nhưng cho bảng quan hệ synop_t_obs 21
5 2.2.4 Tương tự bảng 2.2.1 nhưng cho bảng quan hệ synop_obs 21
6 2.2.5 Các trường trong bảng quan hệ temp_stn của CSDL quan trắc trên cao 22
7 2.2.6 Tương tự như bảng 2.2.5 nhưng cho bảng quan hệ temp_obs 22
8 2.2.7 Các trường trong bảng quan hệ ANA của CSDL tái phân tích 24
9 2.2.8 Tương tự bảng 2.2.7 nhưng cho bảng quan hệ ANA 25
10 2.2.9 Tương tự bảng 2.2.7 nhưng cho bảng quan hệ ANA_Level 25
11 2.2.10 Tương tự bảng 2.2.7 nhưng cho bảng quan hệ ANA_Time 25
12 2.2.11 Các trường trong bảng quan hệ NWP_HAN của CSDL dự báo số trị 26
13 2.2.12 Các trường trong bảng quan hệ Season của CSDL mùa đánh giá 27
14 2.2.13 Các trường trong bảng quan hệ Case_Study của CSDL trường hợp
15 2.2.14 Các trường trong bảng quan hệ Storage của CSDL sao lưu kết quả đánh
giá
29
16 3.1.1 Cấu hình số liệu tái phân tích JRA-25 của JMA được thu thập và lưu
vào CSDL tái phân tích của phần mềm đánh giá NWP_Verif
46
17 3.1.2 Cấu hình số liệu tái phân tích GDAS của NOAA được thu thập và lưu
vào CSDL tái phân tích của phần mềm đánh giá NWP_Verif
47
18 3.1.3 Cấu hình số liệu GFS được thu thập và sử dụng làm đầu vào cho các mô
hình dự báo số trị khu vực tham gia đánh giá
48
19 3.2.1 Cấu hình động lực, vật lý và phương pháp số của các mô hình HRM,
ETA và BoLAM tại TTDBTƯ tham gia đánh giá
53
20 3.2.2 Cấu hình động lực, vật lý và phương pháp số của mô hình MM5 tại
Viện Khoa học Khí tượng Thủy văn và Môi trường tham gia đánh giá 55
21 3.2.3 Cấu hình động lực, vật lý và phương pháp số của mô hình WRF tại
Khoa Khí tượng Thủy văn và hải dương học, Trường đại học khoa học
tự nhiên
57
22 4.1.1 Giá trị BIAS, POD, FAR và ETS của mưa tích lũy dự báo từ ba mô hình
HRM, BoLAM và ETA cho toàn Việt Nam cho ngày thứ nhất (00-24h), ngày thứ hai (24-48h) và ngày thứ ba (48-72h)
75
23 4.1.2 Sai số ME, MAE, RMSE độ cao địa thế vị các mực 850, 700 và 500mb 80
Trang 7dự báo từ ba mô hình HRM, BoLAM và ETA cho trạm Láng
24 4.1.3 Như bảng 4.1.2, nhưng cho trạm Vinh 80
25 4.1.4 Như bảng 4.1.2, nhưng cho trạm Tân Sơn Hòa 80
26 4.1.5 Sai số ME, MAE, RMSE nhiệt độ không khí mực 850, 700 và 500mb
dự báo từ ba mô hình HRM, BoLAM và ETA cho trạm Láng
81
27 4.1.6 Như bảng 4.1.5, nhưng cho trạm Vinh 81
28 4.1.7 Như bảng 4.1.5, nhưng cho trạm Tân Sơn Hòa 82
29 4.1.8 Giá trị BIAS, POD, FAR và ETS của mưa dự báo từ ba mô hình HRM,
BoLAM và ETA cho chín khu vực cho ngày thứ nhất (00-24h) 82
30 4.1.9 Như bảng 4.1.8, nhưng cho ngày thứ hai (24-48h) 83
31 4.1.10 Như bảng 4.1.8, nhưng cho ngày thứ ba (48-72h) 83
32 4.1.11 Giá trị ME, MAE và RMSE của nhiệt độ không khí tại độ cao 2m dự
báo từ ba mô hình HRM, BoLAM và ETA cho chín khu vực tại hạn dự báo 24h
84
33 4.1.12 Như bảng 4.1.11, nhưng cho hạn dự báo 48h 84
34 4.1.13 Như bảng 4.1.11, nhưng cho hạn dự báo 72h 84
35 4.1.14 Giá trị ME, MAE và RMSE của nhiệt độ điểm sương dự báo từ ba mô
hình HRM, BoLAM và ETA cho chín khu vực tại hạn dự báo 24h
85
36 4.1.15 Như bảng 4.1.14, nhưng cho hạn dự báo 48h 85
37 4.1.16 Như bảng 4.1.14, nhưng cho hạn dự báo 72h 85
38 4.1.17 Giá trị ME, MAE và RMSE của nhiệt độ tối cao dự báo từ ba mô hình
HRM, BoLAM và ETA cho chín khu vực tại hạn dự báo 06h
86
39 4.1.18 Như bảng 4.1.17, nhưng cho hạn dự báo 30h 86
40 4.1.19 Như bảng 4.1.17, nhưng cho hạn dự báo 54h 86
41 4.1.20 Giá trị ME, MAE và RMSE của nhiệt độ tối thấp dự báo từ ba mô hình
HRM, BoLAM và ETA cho chín khu vực tại hạn dự báo 18h
87
42 4.1.21 Như bảng 4.1.20, nhưng cho hạn dự báo 42h 87
43 4.1.22 Như bảng 4.1.20, nhưng cho hạn dự báo 66h 87
44 4.1.23 Giá trị ME, MAE và RMSE của lượng mưa dự báo từ ba mô hình
HRM, BoLAM và ETA cho Hà Nội (trong 3 ngày 30/10/2008 đến 02/11/2008 cho ngày thứ nhất (00-24h), ngày thứ hai (24-48h) và ngày thứ ba (48-72h))
88
45 4.1.24 Giá trị ME, MAE và RMSE của nhiệt độ tối thấp dự báo từ ba mô hình
HRM, BoLAM và ETA cho khu vực Tây Bắc (từ ngày 21/01/2008 đến 20/02/2008)
89
46 4.1.25 Tương tự như bảng 4.1.24, nhưng cho khu vực Việt Bắc 89
47 4.1.26 Tương tự như bảng 4.1.24, nhưng cho khu vực Đông Bắc 89
48 4.1.27 Tương tự như bảng 4.1.24, nhưng cho khu vực Đồng bằng Bắc Bộ 89
49 4.1.28 Giá trị ME, MAE và RMSE của nhiệt độ tối cao dự báo từ ba mô hình 90
Trang 8HRM, BoLAM và ETA cho khu vực Bắc Trung Bộ (từ ngày 21/06/2008 đến 30/06/2008)
50 4.1.29 Tương tự như bảng 4.1.28, nhưng cho khu vực Trung Trung Bộ 90
51 4.1.30 Tương tự như bảng 4.1.28, nhưng cho khu vực Nam Trung Bộ 90
52 4.1.31 Giá trị BIAS, POD, FAR và ETS của mưa tích lũy dự báo từ ba mô hình
HRM, BoLAM và ETA cho toàn Việt Nam cho mùa Xuân, ngày thứ nhất (00-24h), ngày thứ hai (24-48h) và ngày thứ ba (48-72h)
91
53 4.1.32 Như bảng 4.1.31, nhưng cho mùa Hạ 91
54 4.1.33 Như bảng 4.1.31, nhưng cho mùa Thu 91
55 4.1.34 Như bảng 4.1.31, nhưng cho mùa Đông 91
56 4.2.1 Giá trị BIAS, POD, FAR và ETS của mưa tích lũy dự báo từ mô hình
MM5 cho toàn Việt Nam cho ngày thứ nhất (00-24h), ngày thứ hai 48h) và ngày thứ ba (48-72h)
(24-98
57 4.2.2 Sai số ME, MAE, RMSE độ cao địa thế vị các mực 850, 700 và 500mb
dự báo từ mô hình MM5 cho các trạm Láng, Vinh và Tân Sơn Hòa
101
58 4.2.3 Như bảng 4.2.2, nhưng cho nhiệt độ tại các mực 850, 700 và 500mb 102
59 4.2.4 Giá trị BIAS, POD, FAR và ETS của mưa dự báo từ mô hình MM5 cho
chín khu vực cho ngày thứ nhất (00-24h), ngày thứ hai (24-48h) và ngày thứ ba (48-72h)
103
60 4.2.5 Giá trị ME, MAE và RMSE của lượng mưa dự báo từ mô hình MM5
cho khu vực Đồng bằng Bắc Bộ, Đông Bắc và hai trạm Hà Nội, Hà Đông (trong 3 ngày 30/10/2008 đến 02/11/2008) cho ngày thứ nhất (00-24h), ngày thứ hai (24-48h) và ngày thứ ba (48-72h))
106
61 4.2.6 Giá trị ME, MAE, RMSE của nhiệt độ tối thấp trong hình thế có không
khí lạnh dự báo từ mô hình MM5 cho một số trạm điển hình tại hạn dự báo 18h, 42h và 66h
108
62 4.2.7 Giá trị ME, MAE, RMSE của nhiệt độ tối cao trong hình thế có nắng
nóng dự báo từ mô hình MM5 cho một số trạm điển hình tại hạn dự báo 06h, 30h và 54h
109
63 4.2.8 Giá trị BIAS, POD, FAR và ETS của mưa tích lũy dự báo từ mô hình
MM5 cho toàn Việt Nam cho 4 mùa Xuân, Hạ, Thu Đông: ngày thứ nhất (00-24h), ngày thứ hai (24-48h) và ngày thứ ba (48-72h)
109
64 4.3.1 Giá trị BIAS, POD, FAR và ETS của mưa tích lũy dự báo từ mô hình
WRF cho toàn Việt Nam cho ngày thứ nhất (00-24h), ngày thứ hai 48h) và ngày thứ ba (48-72h)
(24-112
65 4.3.2 Giá trị sai số độ cao địa thế vị tại các mực 850mb, 700mb và 500mb dự
báo từ mô hình WRF cho ba trạm Hà Nội, Vinh và Tân Sơn Hòa 115
66 4.3.3 Giá trị sai số nhiệt độ không khí tại các mực 850mb, 700mb và 500mb
dự báo từ mô hình WRF cho ba trạm Hà Nội, Vinh và Tân Sơn Hòa 116
67 4.3.4 Giá trị sai số của lượng mưa tích lũy 24h một cho các khu vực Việt
Nam
117
68 4.3.5 Giá trị sai số của lượng mưa tích lũy 24h một trong hình thế có mưa lớn 121
Trang 969 4.3.6 Giá trị sai số của lượng mưa tích lũy 24h một trong hình thế có mưa lớn
70 4.3.7 Giá trị ME, MAE, RMSE của nhiệt độ tối thấp trong hình thế có không
khí lạnh dự báo từ mô hình WRF cho một số trạm điển hình tại hạn dự báo 18h, 42h, 66h
122
71 4.3.8 Giá trị ME, MAE, RMSE của nhiệt độ tối cao trong hình thế có nắng
nóng dự báo từ mô hình WRF cho một số trạm điển hình tại hạn dự báo 06h, 30h, 54h
124
72 4.3.9 Giá trị BIAS, POD, FAR và ETS của mưa tích lũy dự báo từ mô hình
WRF cho toàn Việt Nam cho 4 mùa Xuân, Hạ, Thu Đông: ngày thứ nhất (00-24h), ngày thứ hai (24-48h) và ngày thứ ba (48-72h)
124
73 4.4.1 Giá trị BIAS, POD, FAR và ETS của mưa tích lũy dự báo từ mô hình
HRM, BoLAM, ETA, MM5 và WRF trên toàn Việt Nam cho ngày thứ
127
74 4.4.2 Sai số ME, MAE, RMSE độ cao địa thế vị các mực 850, 700 và 500mb
dự báo từ năm mô hình HRM, BoLAM, ETA, MM5 và WRF cho ba trạm Láng (HN), Vinh (V) và TP Hồ Chí Minh (TSH)
131
75 4.4.3 Sai số ME, MAE, RMSE nhiệt độ không khí các mực 850, 700 và
500mb dự báo từ năm mô hình HRM, BoLAM, ETA, MM5 và WRF cho ba trạm Láng (HN), Vinh (V) và TP Hồ Chí Minh (TSH)
132
Trang 10DANH SÁCH CÁC HÌNH VẼ VÀ BIỂU ĐỒ
2 2.2.1 Sơ đồ quan hệ giữa các bảng thuộc tính của CSDL quan trắc bề mặt 20
3 2.2.2 Sơ đồ quan hệ giữa các bảng thuộc tính của CSDL quan trắc trên cao 22
4 2.2.3 Sơ đồ quan hệ giữa các bảng thuộc tính của CSDL tái phân tích 24
5 2.2.4 Sơ đồ quan hệ giữa các bảng thuộc tính của CSDL dự báo số trị 26
6 2.4.1 Giao diện chính của phần mềm NWP_verif 32
7 2.4.2 Sơ đồ khối tổng quát của phần mềm NWP_verif 32
8 2.4.3 Giao diện đồ họa quản trị CSDL quan trắc bề mặt 34
9 2.4.4 Giao diện nhập thêm trạm quan trắc vào CSDL quan trắc bề mặt 34
10 2.4.5 Giao diện chỉnh sửa siêu dữ liệu của nguồn số liệu tái phân tích 35
11 2.4.6 Giao diện thêm mới nguồn số liệu tái phân tích 35
12 2.4.7 Giao diện quản trị các nguồn số liệu dự báo của các mô hình NWP 35
14 2.4.9 Giao diện quản trị CSDL cấu hình đánh giá 36
15 2.4.10 Giao diện cho phép người sử dụng truy xuất số liệu quan trắc bề mặt
và trên cao theo một số định dạng cho trước
37
16 2.4.11 Giao diện cho phép người sử dụng hiển thị số liệu tái phân tích hoặc
17 2.4.12 Giao diện thực hiện đánh giá mô hình NWP 39
18 2.4.13 Giao diện lựa chọn khoảng thời gian cần đánh giá 39
19 2.4.14 Giao diện lựa chọn biến cần đánh giá 40
20 2.4.15 Giao diện lựa chọn không gian đánh giá tại điểm trạm 40
21 2.4.16 Giao diện lựa chọn hạn dự báo và thực hiện đánh giá 41
22 2.4.17 Giao diện hiển thị biểu đồ đánh giá 42
23 2.4.18 Giao diện hiển thị trị số đánh giá 43
24 2.4.19 Giao diện hiển thị thống kê số liệu trong quá trình đánh giá 43
26 3.1.1 Lượng mưa quan trắc tích lũy 12h và 24h từ thời điểm 12UTC ngày
30/X/2008 đến 12UTC ngày 02/XI/2008
50
27 3.2.1 Miền tích phân dự báo của các mô hình HRM, ETA và BoLAM tại
Trung tâm Dự báo khí tượng thủy văn Trung ương
54
28 3.2.2 Miền tích phân dự báo của mô hình MM5 tại Viện Khoa học Khí 56
Trang 11tượng Thủy văn và Môi trường
29 3.2.3 Miền tích phân dự báo của mô hình WRF tại Khoa Khí tượng Thủy
văn và hải dương học, Trường đại học khoa học tự nhiên 58
30 3.3.1 Minh họa tính khoảng cách giữa hai điểm bằng công thưc Haversine 60
31 3.3.2 Minh họa phương pháp nội suy song tuyến tính 61
32 3.3.3 Một ví dụ cho phương pháp nội suy song tuyến tính 61
33 3.3.4 Nội suy bằng phương pháp thứ nhất: điểm lưới gần nhất, các giá trị
được cho tại các điểm chấm tròn đen
37 3.3.8 Lưới mô hình (độ phân giải cao hơn bên trong, màu đen) và lưới số
liệu tái phân tích (độ phân giải thô hơn bên ngoài, màu xan 67
38 3.3.9 Minh họa vùng lưới dùng để đánh gía 68
39 3.3.10 Minh họa nội suy giá trị mô hình về điểm lưới mới 68
40 3.3.11 Minh họa ba vùng số liệu JRA25, Mô hình BoLam và lưới mới để
41 3.3.12 Số liệu toàn vùng của Lưới quy chuẩn JRA25 độ phân giải 1.25° 69
42 3.3.13 Số liệu toàn vùng của mô hình BoLam độ phân giải 0.15° 70
43 3.3.14 Vùng lưới mới dùng để đánh giá cho mô hình BoLam dựa trên số
liệu JRA25
70
44 3.3.15 Minh họa hệ lưới cần nội suy từ các điểm trạm phân tán Điểm xanh
là điểm lưới cần xác định giá trị Vòng tròn xanh là vòng tròn ảnh hưởng của quan trắc đến trị số điểm lưới
71
45 3.3.16 Nhiệt độ tại các trạm quan trắc Synop của Việt Nam được nội suy về
lưới với độ phân giải lưới = 0.125o
72
46 3.3.17 Minh họa phương pháp Cressman với hai bán kính ảnh hưởng khác
nhau
74
47 4.1.1 Giá trị ME, MAE và RMSE của nhiệt độ không khí tại độ cao 2m dự
báo từ ba mô hình HRM, BoLAM và ETA cho toàn Việt Nam tại hạn dự báo 24h (trên, trái), 48h (trên, phải) và 72h (dưới, trái)
76
48 4.1.2 Như hình 4.1.1, nhưng cho nhiệt độ điểm sương tại độ cao 2m 77
49 4.1.3(a,b) Giá trị ME, MAE và RMSE của gió kinh hướng tại độ cao 10m
(U10m) dự báo từ ba mô hình HRM, BoLAM và ETA cho toàn Việt Nam tại hạn dự báo 24h (trên), 48h (giữa) và 72h (dưới) (a), gió vĩ hướng V10m (b)
78
50 4.1.4 Giá trị ME, MAE và RMSE của nhiệt độ tối cao (Tmax) dự báo từ
ba mô hình HRM, BoLAM và ETA cho toàn Việt Nam tại hạn dự
79
Trang 12báo 06h (trên, trái), 30h (trên, phải) và 54h (dưới, trái)
51 4.1.5 Giá trị ME, MAE và RMSE của nhiệt độ tối thấp (Tmin) dự báo từ
ba mô hình HRM, BoLAM và ETA cho toàn Việt Nam tại hạn dự báo 18h (trên, trái), 42h (trên, phải) và 66h (dưới, trái)
79
52 4.1.6 Giá trị ME, MAE và RMSE của nhiệt độ không khí tại độ cao 2 mét
(T2m) dự báo từ ba mô hình HRM, BoLAM và ETA cho toàn Việt Nam tại hạn dự báo 24h (trên, trái), 48h (trên, phải) và 72h (dưới, trái) cho Mùa Xuân
92
53 4.1.7 Tương tự hình 4.1.6 nhưng cho Mùa Hạ 92
54 4.1.8 Như hình 4.1.6, nhưng cho Mùa Thu 93
55 4.1.9 Như hình 4.1.6, nhưng cho Mùa Đông 93
56 4.1.10 Giá trị ME, MAE và RMSE của nhiệt độ tối cao (Tmax) dự báo từ
ba mô hình HRM, BoLAM và ETA cho toàn Việt Nam tại hạn dự báo 06h (trên, trái), 30h (trên, phải) và 54h (dưới, trái) cho Mùa Xuân
94
57 4.1.11 Như hình 4.1.10, nhưng cho Mùa Hạ 94
58 4.1.12 Như hình 4.1.10, nhưng cho Mùa Thu 95
59 4.1.13 Như hình 4.1.10, nhưng cho Mùa Đông 95
60 4.1.14 Giá trị ME, MAE và RMSE của nhiệt độ tối thấp (Tmin) dự báo từ
ba mô hình HRM, BoLAM và ETA cho toàn Việt Nam tại hạn dự báo 18h (trên, trái), 42h (trên, phải) và 66h (dưới, trái) cho Mùa Xuân
96
61 4.1.15 Như hình 4.1.14, nhưng cho Mùa Hạ 96
62 4.1.16 Như hình 4.1.14, nhưng cho Mùa Thu 97
63 4.1.17 Như hình 4.1.14, nhưng cho Mùa Đông 97
64 4.2.1 Giá trị ME, MAE và RMSE của nhiệt độ không khí tại độ cao 2m dự
báo từ mô hình MM5 cho toàn Việt Nam tại các hạn dự báo 24h, 48h
và 72h
98
65 4.2.2 Như hình 4.2.1, nhưng cho nhiệt độ điểm sương 99
66 4.2.3 Giá trị ME, MAE và RMSE của gió kinh hướng (trái) và gió vĩ
hướng (phải) tại độ cao 10m dự báo từ mô hình MM5 trên toàn miền cho toàn Việt Nam tại các hạn dự báo 24h, 48h và 72h
99
67 4.2.4 Giá trị ME, MAE và RMSE của nhiệt độ tối cao tại độ cao 2m dự
báo từ mô hình MM5 cho toàn Việt Nam tại các hạn dự báo 06h, 30h
và 54h
100
68 4.2.5 Giá trị ME, MAE và RMSE của nhiệt độ tối thấp tại độ cao 2m dự
báo từ mô hình MM5 cho toàn Việt Nam tại các hạn dự báo 18h, 42h
và 66h
100
69 4.2.6 Giá trị ME, MAE và RMSE của nhiệt độ không khí tại độ cao 2m dự
báo từ mô hình MM5 cho 9 khu vực tại hạn dự báo 24h (trên, trái), 48h (trên, phải) và 72h (dưới, trái)
104
70 4.2.7 Như hình 4.2.6, nhưng cho nhiệt độ điểm sương 104
Trang 1371 4.2.8 Giá trị ME, MAE và RMSE của nhiệt độ không khí tối cao dự báo từ
mô hình MM5 cho 9 khu vực tại hạn dự báo 06h (trên, trái), 30h (trên, phải) và 54h (dưới, trái)
105
72 4.2.9 Giá trị ME, MAE và RMSE của nhiệt độ không khí tối thấp dự báo
từ mô hình MM5 cho 9 khu vực tại hạn dự báo 18h (trên, trái), 42h (trên, phải) và 66h (dưới, trái)
106
73 4.2.10 Giá trị ME, MAE và RMSE của nhiệt độ tối thấp trong hình thế có
không khí lạnh dự báo từ mô hình MM5 cho các khu vực Tây Bắc, Việt Bắc, Đông Bắc và Đông bằng Bắc Bộ tại hạn dự báo 18h (trên, trái), 42h (trên, phải) và 66h (dưới, trái)
107
74 4.2.11 Giá trị ME, MAE và RMSE của nhiệt độ tối cao trong hình thế có
nắng nóng dự báo từ mô hình MM5 cho các khu vực Bắc Trung Bộ, Trung Trung Bộ và Nam Trung Bộ tại hạn dự báo 06h (trên, trái), 30h (trên, phải) và 54h (dưới, trái)
108
75 4.2.12 Giá trị ME, MAE và RMSE của nhiệt độ tại độ cao 2m dự báo từ mô
hình MM5 cho toàn Việt Nam theo 4 mùa Xuân, Hạ, Thu và Đông tại hạn dự báo 24h (trên, trái), 48h (trên, phải)và 72h (dưới, trái)
110
76 4.2.13 Giá trị ME, MAE và RMSE của nhiệt độ tối cao (Tmax) dự báo từ
mô hình MM5 cho toàn Việt Nam theo 4 mùa Xuân, Hạ, Thu và Đông tại hạn dự báo 06h (trên, trái), 30h (trên, phải) và 54h (dưới, trái)
111
77 4.2.14 Giá trị ME, MAE và RMSE của nhiệt độ tối thấp (Tmin) dự báo cho
toàn Việt Nam theo 4 mùa Xuân, Hạ, Thu và Đông tại hạn dự báo 18h (trên, trái), 42h (trên, phải) và 66h (dưới, trái)
112
78 4.3.1 Giá trị ME, MAE và RMSE của nhiệt độ không khí tại độ cao 2m dự
báo từ mô hình WRF cho toàn Việt Nam tại các hạn dự báo 24h, 48h
và 72h
113
79 4.3.2 Như hình 4.3.1, nhưng cho nhiệt độ điểm sương 113
80 4.3.3 Giá trị ME, MAE và RMSE của gió kinh hướng (trái) và gió vĩ
hướng (phải) tại độ cao 10m dự báo từ mô hình WRF cho toàn Việt Nam tại các hạn dự báo 24h, 48h và 72h
114
81 4.3.4 Giá trị ME, MAE và RMSE của nhiệt độ tối cao tại độ cao 2m dự
báo từ mô hình WRF cho toàn Việt Nam tại các hạn dự báo 6h, 30h
và 54h
114
82 4.3.5 Giá trị ME, MAE và RMSE của nhiệt độ tối thấp tại độ cao 2m dự
báo từ mô hình WRF cho toàn Việt Nam tại các hạn dự báo 18h, 42h
và 66h
115
83 4.3.6 Giá trị ME, MAE và RMSE của nhiệt độ không khí tại độ cao 2m dự
báo từ mô hình WRF cho 9 khu vực tại hạn dự báo 24h (trên, trái), 48h (trên, phải) và 72h (dưới, trái)
118
84 4.3.7 Như hình 4.3.6, nhưng cho nhiệt độ điểm sương 119
85 4.3.8 Giá trị ME, MAE và RMSE của nhiệt độ không khí tối cao dự báo từ
mô hình WRF cho 9 khu vực tại hạn dự báo 06h (trên, trái), 30h (trên, phải) và 54h (dưới, trái)
119
Trang 1486 4.3.9 Giá trị ME, MAE và RMSE của nhiệt độ không khí tối thấp dự báo
từ mô hình WRF cho 9 khu vực tại hạn dự báo 18h (trên, trái), 42h (trên, phải) và 66h (dưới, trái)
120
87 4.3.10 Giá trị ME, MAE và RMSE của nhiệt độ tối thấp trong hình thế có
không khí lạnh dự báo từ mô hình WRF cho các khu vực: Tây Bắc, Việt Bắc, Đông Bắc và Đông bằng Bắc Bộ tại hạn dự báo 18h (trên, trái), 42h (trên, phải) và 66h (dưới, trái)
122
88 4.3.11 Giá trị ME, MAE và RMSE của nhiệt độ tối cao trong hình thế có
nắng nóng dự báo từ mô hình WRF cho các khu vực: Bắc Trung Bộ, Trung Trung Bộ và Nam Trung Bộ tại hạn dự báo 06h (trên, trái), 30h (trên, phải) và 54h (dưới, trái)
123
89 4.3.12 Giá trị ME, MAE và RMSE của nhiệt độ tại độ cao 2m dự báo từ mô
hình WRF cho toàn Việt Nam theo 4 mùa Xuân, Hạ, Thu và Đông tại hạn dự báo 24h (trên, trái), 48h )trên, phải)và 72h (dưới, trái)
125
90 4.3.13 Giá trị ME, MAE và RMSE của nhiệt độ tối cao dự báo từ mô hình
WRF cho toàn Việt Nam theo 4 mùa Xuân, Hạ, Thu và Đông tại hạn
dự báo 06h (trên, trái), 30h (trên, phải) và 54h (dưới, trái)
126
91 4.3.14 Giá trị ME, MAE và RMSE của nhiệt độ tối thấp dự báo từ mô hình
WRF cho toàn Việt Nam theo 4 mùa Xuân, Hạ, Thu và Đông tại hạn
dự báo 18h (trên, trái), 42h (trên, phải) và 66h (dưới, trái)
126
92 4.4.1 Giá trị ME, MAE và RMSE của nhiệt độ không khí tại độ cao 2m
(bên trái) và nhiệt độ điểm sương (bên phải) dự báo từ năm mô hình HRM, BoLAM, ETA, MM5 và WRF cho toàn Việt Nam tại hạn dự báo +24h (trên), +48h (giữa) và +72h (dưới)
129
94 4.4.3 Giá trị ME, MAE và RMSE của nhiệt độ không khí tối cao dự báo từ
năm mô hình HRM, BoLAM, ETA, MM5 và WRF cho toàn Việt Nam tại hạn dự báo +06h (trên), +30h (giữa) và +54h (dưới)
130
95 4.4.4 Giá trị ME, MAE và RMSE của nhiệt độ không khí tối thấp dự báo
từ năm mô hình HRM, BoLAM, ETA, MM5 và WRF cho toàn Việt Nam tại hạn dự báo +18h (trên), +42h (giữa) và +66h (dưới)
130
Trang 15MỤC LỤC
Trang
MỞ ĐẦU 1 CHƯƠNG I KHÁI QUÁT VỀ CÁC PHƯƠNG PHÁP ĐÁNH GIÁ
SẢN PHẨM DỰ BÁO TỪ MÔ HÌNH DỰ BÁO SỐ TRỊ
4
1.1 Khái quát tình hình nghiên cứu trong và ngoài nước 4
1.2 Các phương pháp đánh giá sản phẩm dự báo từ mô hình dự báo số
trị tất định
7
1.2.2 Đánh giá cho biến dự báo theo cấp 10
1.2.3.1 Phương pháp xác định sai số 141.2.3.2 Phương pháp tách sai số 15
CHƯƠNG II XÂY DỰNG PHẦN MỀM ĐÁNH GIÁ KHÁCH QUAN
CÁC SẢN PHẨM CỦA MÔ HÌNH DỰ BÁO SỐ TRỊ
17
2.1 Phân tích và thiết kế cấu trúc phần mềm 17 2.2 Phân tích và thiết kế cơ sở dữ liệu phục vụ đánh giá 19
2.2.1 Cơ sở dữ liệu quan trắc bề mặt và trên cao 19
2.2.3 Cơ sở dữ liệu dự báo số trị 25
2.2.5 Cơ sở dữ liệu trường hợp nghiên cứu và hình thế thời tiết 272.2.6 Cơ sở dữ liệu sao lưu kết quả đánh giá 28
2.3 Kiểm tra chất lượng số liệu quan trắc 29 2.4 Giới thiệu một số giao diện của phần mềm đánh giá 32
CHƯƠNG III MÔ TẢ TẬP SỐ LIỆU NGHIÊN CỨU, CẤU HÌNH
CÁC MÔ HÌNH DỰ BÁO KHU VỰC VÀ PHƯƠNG PHÁP ĐÁNH
GIÁ
45
Trang 163.1 Mô tả tập số liệu nghiên cứu 45
3.1.1 Số liệu quan trắc 45
3.1.3 Số liệu dự báo toàn cầu 47
3.2 Mô tả cấu hình các mô hình dự báo khu vực được đánh giá 50
3.2.1 Mô hình của Trung tâm Dự báo khí tượng thủy văn Trung ương 503.2.2 Mô hình của Viện Khoa học Khí tượng thủy văn và môi trường 543.2.3 Mô hình của Khoa Khí tượng thủy văn và Hải dương học 56
3.3 Phương pháp đánh giá và xử lý số liệu mô hình dự báo số trị 58
3.3.1 Lựa chọn nhóm biến dự báo để đánh giá 58
3.3.2.1 Đánh giá tại điểm trạm 593.3.2.2 Đánh giá trên lưới 653.3.2.3 Nội suy từ trạm quan trắc về lưới mô hình 70
CHƯƠNG IV MỘT SỐ KẾT QUẢ THỬ NGHIỆM PHẦN MỀM
4.1 Kết quả đánh giá chất lượng dự báo các mô hình số trị khu vực
của Trung tâm Dự báo khí tượng thủy văn Trung ương
500 hPa (T85, T70, T50) theo 3 hạn dự báo chính (+24h,+48h,+72h)
81
4.1.2.1 Đánh giá yếu tố mưa dự báo (Rain) theo 3 hạn dự báo chính (00-24h,
24-48h, 48-72h)
82
Trang 174.1.2.2 Đánh giá yếu tố nhiệt độ không khí tại độ cao 2 mét dự báo (T2m) theo
4.1.4.1 Đánh giá yếu tố mưa dự báo (Rain) theo 3 hạn dự báo chính (00-24h,
4.2 Kết quả đánh giá chất lượng dự báo mô hình MM5 của Viện khoa
học khí tượng thủy văn và môi trường 98
4.2.1.8 Đánh giá yếu tố nhiệt độ không khí dự báo tại các mực 850, 700 và
500 hPa (T85, T70, T50) theo 3 hạn dự báo chính (+24h,+48h,+72h)
101
Trang 184.2.2.1 Đánh giá yếu tố mưa dự báo (Rain) theo 3 hạn dự báo chính (00-24h,
4.2.4.1 Đánh giá yếu tố mưa dự báo (Rain) theo 3 hạn dự báo chính (00-24h,
24-48h, 48-72h)
109
4.2.4.2 Đánh giá yếu tố nhiệt độ không khí tại độ cao 2 mét dự báo (T2m) theo
3 hạn dự báo chính (24h, 48h, 72h) 1104.2.4.3 Đánh giá yếu tố nhiệt độ tối cao dự báo (Tmax) theo 3 hạn dự báo
chính (+06h, +30h,+54h)
111
4.2.4.4 Đánh giá yếu tố nhiệt độ tối thấp dự báo (Tmin) theo 3 hạn dự báo
4.3 Kết quả đánh giá chất lượng dự báo mô hình WRF của Khoa Khí
tượng thủy văn và Hải dương học
Trang 19500 hPa (T85, T70, T50) theo 3 hạn dự báo chính (+24h,+48h,+72h)
4.3.2.1 Đánh giá yếu tố mưa dự báo (Rain) theo 3 hạn dự báo chính (00-24h,
4.3.4.1 Đánh giá yếu tố mưa dự báo (Rain) theo 3 hạn dự báo chính (00-24h,
24-48h, 48-72h)
124
4.3.4.2 Đánh giá yếu tố nhiệt độ không khí tại độ cao 2 mét dự báo (T2m) theo
3 hạn dự báo chính (24h, 48h, 72h) 1244.3.4.3 Đánh giá yếu tố nhiệt độ tối cao dự báo (Tmax) theo 3 hạn dự báo
nhiệt độ không khí tối thấp (Tmin) dự báo (Td2m) theo 3 hạn: 18h,
Trang 20PHỤ LỤC I: Danh sách các trạm quan trắc khí tượng bề mặt và thám
không vô tuyến được thu thập và đưa vào CSDL đánh giá
139
Trang 21MỞ ĐẦU
Từ lâu, người ta đã nhận thấy tầm quan trọng của công tác dự báo khí tượng thuỷ văn (KTTV) đối với sự nghiệp phát triển kinh tế xã hội, an ninh quốc phòng và đặc biệt trong công tác chủ động phòng chống và giảm nhẹ thiệt hại do thiên tai gây
ra Trong điều kiện xã hội ngày càng phát triển, nhu cầu đòi hỏi thông tin về dự báo KTTV ngày càng cao, không chỉ phong phú về mặt nội dung mà cả về độ chính xác của sản phẩm dự báo Vì vậy, việc đánh giá chất lượng sản phẩm dự báo KTTV là một việc rất cần thiết và ngày càng được các Cơ quan KTTV Quốc gia trên thế giới quan tâm chú ý hơn Việc đánh giá chất lượng dự báo KTTV là một trong các chỉ tiêu cơ bản để đánh giá công việc của các Cơ quan KTTV quốc gia, đồng thời, thông qua chất lượng dự báo KTTV, có thể định hướng được công tác nghiên cứu
và nâng cao chất lượng dự báo một khi biết được chi tiết chỗ mạnh yếu của các sản phẩm dự báo (Dương Liên Châu và cộng sự, 2007) Theo Tổ chức Khí tượng Thế giới (WMO), có 3 lý do quan trọng nhất cần phải đánh giá chất lượng dự báo KTTV là:
1 Để theo dõi chất lượng dự báo: xem các sản phẩm dự báo chính xác đến
mức nào và mức chính xác có ngày càng tốt hơn không?
2 Để nâng cao chất lượng dự báo: vì trước hết phải tìm ra dự báo sai cái gì,
sai như thế nào thì mới có thể cải tiến công nghệ dự báo
3 Để so sánh chất lượng dự báo của các hệ thống dự báo khác nhau
Theo kết quả điều tra trên quy mô toàn cầu vào năm 1997 của WMO, 57% các Cơ quan KTTV quốc gia có hệ thống đánh giá dự báo được chính thức dùng trong nghiệp vụ trong đó bao gồm cả đánh giá mô hình dự báo thời tiết số trị (NWP) Tuy nhiên, có sự khác biệt rất lớn về phương thức và bản chất của cách đánh giá giữa quốc gia này với quốc gia khác Sở dĩ có sự khác biệt đó là do các phương pháp đánh giá được sử dụng hoàn toàn phụ thuộc vào đặc trưng riêng của từng loại sản phẩm dự báo, yếu tố dự báo, cách xây dựng phương pháp dự báo, và đôi khi còn do yếu tố chủ quan của người xây dựng phương pháp đánh giá dự báo Trong nhiều năm qua, WMO đã có những cố gắng để đưa ra những chuẩn mực thống nhất về đánh giá chất lượng dự báo (bao gồm cả dự báo NWP) cho các cơ quan KTTV Quốc gia nhưng vẫn chưa đạt được kết quả mong muốn Bởi vì mỗi quốc gia đều có những quy định, quy tắc riêng trong đánh giá chất lượng dự báo KTTV cho riêng quốc gia mình
Trang 22Tại Việt Nam, NWP đã được nghiên cứu ứng dụng từ những năm 90 của thế
kỷ trước và chính thức sử dụng các sản phẩm NWP trong dự báo nghiệp vụ từ năm
1997 Cho đến nay, đã có rất nhiều sản phẩm NWP toàn cầu và từ các hệ thống mô hình NWP khu vực được nghiên cứu và triển khai nghiệp vụ tại Trung tâm Dự báo khí tượng thủy văn Trung ương (TTDBTƯ), các Đài KTTV khu vực, Viện Khoa học Khí tượng thủy văn và Môi trường (Viện KTTV), Khoa KTTV và Hải dương học thuộc Trường Đại học Khoa học Tự nhiên, …Tuy nhiên, cho đến nay chưa có một nghiên cứu đánh giá toàn diện nào cho từng mô hình NWP cũng như các nghiên cứu so sánh kỹ năng dự báo giữa các mô hình NWP đang có để chỉ ra mô hình NWP tốt nhất cho điều kiện Việt Nam Chính vì lý do này, nghiên cứu xây dựng và phát triển hệ thống đánh giá khách quan hoàn chỉnh cho các sản phẩm dự báo từ các mô hình NWP hiện tại ở Việt Nam là hết sức cần thiết và cấp bách
Theo đăng ký trong thuyết minh đề cương, mục tiêu của Đề tài là xây dựng được một hệ thống đánh giá khách quan các sản phẩm dự báo số trị, qua đó tổ chức đánh giá và so sánh chất lượng dự báo của các mô hình dự báo thời tiết số trị hiện
có tại Việt Nam Dựa trên mục tiêu và nội dung công việc đã đăng ký trong bản thuyết minh đề tài, nội dung của báo cáo tổng kết đề tài được bố cục thành các phần như sau:
Trang 23đạo Cục Khí tượng thủy văn và Biến đổi khí hậu Nhóm thực hiện đề tài hy vọng những kết quả nghiên cứu mà đề tài đạt được sẽ có những đóng góp cho công tác đánh giá chất lượng NWP tại Việt Nam, qua đó góp phần nâng cao chất lượng dự báo nghiệp vụ, cũng như nghiên cứu phát triển các hệ thống đánh giá chất lượng dự báo sau này tại Cục Khí tượng thủy văn và Biến đổi khí hậu nói riêng và Ngành KTTV nói chung Nhân dịp này, chủ nhiệm đề tài và các cộng tác viên xin gửi lời cảm ơn chân thành đến Lãnh đạo Bộ Tài nguyên và Môi trường và Lãnh đạo Cục Khí tượng thủy văn và Biến đổi khí hậu đã tạo mọi điều kiện cho chúng tôi hoàn thành đề tài Một lần nữa, xin trân trọng cảm ơn
Trang 24CHƯƠNG I KHÁI QUÁT VỀ CÁC PHƯƠNG PHÁP ĐÁNH GIÁ SẢN PHẨM
DỰ BÁO TỪ MÔ HÌNH DỰ BÁO SỐ TRỊ
1.1 KHÁI QUÁT TÌNH HÌNH NGHIÊN CỨU TRONG VÀ NGOÀI NƯỚC
1.1.1 Trên thế giới
Như đã biết, tại hầu hết các trung tâm dự báo khí tượng, trước khi đưa ra bản tin dự báo cuối cùng, các dự báo viên phải tham khảo rất nhiều nguồn thông tin trong đó các sản phẩm từ các mô hình dự báo thời tiết số (NWP) có vai trò rất quan trọng Trong khi các nguồn số liệu quan trắc truyền thống và phi truyền thống cho
dự báo viên biết được về trạng thái khí quyển hiện tại, thì các sản phẩm dự báo từ
mô hình cho biết xu thế biến đổi của khí quyển trong tương lai Do đó, nếu các sản phẩm NWP có độ chính xác cao, có thể đem lại các dự báo chủ quan từ dự báo viên
có chất lượng tốt hoặc thậm chí cao hơn dự báo trực tiếp từ mô hình Ngày nay, sự phát triển của công nghệ máy tính, đặc biệt là các siêu máy tính và sự hiểu biết sâu hơn về các quá trình vật lý khí quyển đã đưa ra được những mô hình số “hoàn hảo” hơn và do vậy, chất lượng các sản phẩm dự báo từ các mô hình này cũng ngày càng được nâng cao Cùng với sự tiến bộ của các mô hình NWP, các kỹ thuật để đánh giá
kỹ năng của các sản phẩm này cũng không ngừng phát triển Tuy nhiên, cho đến nay, chưa có một phương pháp đơn lẻ nào là thích hợp để áp dụng chung cho việc đánh giá các sản phẩm dự báo khách quan từ mô hình Theo Stanski và đồng nghiệp (1989), cần phải có một vài cách khác nhau để đánh giá mô hình và bất kỳ một sự đánh giá nào về kỹ năng của mô hình khí quyển đều phụ thuộc vào quy mô về thời gian và không gian được sử dụng để đánh giá, và điều này lại phụ thuộc vào mối quan tâm của người sử dụng Ví dụ, dự báo viên chủ yếu chỉ quan tâm đến kỹ năng của mô hình trong việc dự báo hệ thống khí áp cho vùng mà họ có trách nhiệm dự báo và thường trong khoảng thời gian 3 ngày, trong khi đó các nhà khoa học lại quan tâm đến kỹ năng dự báo của mô hình đối với tất cả quy mô về không gian và
thời gian
Philippe B (2003) đưa ra kết quả điều tra về các phương pháp đánh giá mô hình cũng như các yếu tố dự báo thường được đánh giá tại một số nước trên thế giới Tại Cơ quan khí tượng Australia (BoM), dự báo mưa từ mô hình NWP được đánh giá so với lượng mưa quan trắc 24 giờ trên toàn lãnh thổ; độ phân giải của trường phân tích là 0.25°, và trường phân tích được quy về độ phân giải của mô hình Các chỉ số đánh giá cơ bản là BIAS, RMSE và một số chỉ số khác áp dụng cho
dự báo nhị phân (có/không) Tại Cơ quan khí tượng Canada (CMC), người ta sử
Trang 25dụng các chỉ số BIAS và RMSE đối với các yếu tố như gió, nhiệt độ, điểm sương, khí áp mặt đất và độ cao địa thế vị; các chỉ số BIAS và TS cho các ngưỡng khác nhau được sử dụng để đánh giá mưa Tại Tổng cục khí tượng Trung Quốc (CMA),
400 trạm quan trắc đã được lựa chọn kỹ càng để dùng vào việc đánh giá mưa từ mô hình NWP Các sản phẩm dự báo số và dự báo khách quan được nội suy về vị trí các trạm này Các chỉ số được sử dụng là BIAS và TS cho 1 số ngưỡng (0,1; 10; 25;
50 và 100 mm/24 giờ)
Tại Cơ quan khí tượng Pháp (Meteo France), người ta đánh giá các yếu tố mưa, lượng mây, nhiệt độ và độ ẩm tại 2m, tốc độ gió, hướng gió, và cường độ gió giật Điểm lưới gần điểm quan trắc nhất được sử dụng để đánh giá với các chỉ số BIAS, RMSE và các chỉ số đánh giá cho dự báo nhị phân Tại Cơ quan khí tượng Nhật Bản (JMA) chỉ đánh giá mưa và nhiệt độ Số liệu quan trắc được biến đổi thành một lưới số liệu đồng nhất độ phân giải 80 km, và số liệu dự báo được so sánh với số liệu quan trắc này sử dụng các chỉ số BIAS, TS và ETS
Tại Cơ quan khí tượng Anh (UKMet), MSE được sử dụng để đánh giá nhiệt
độ và gió, trong khi đó ETS lại được dùng để đánh giá mưa, lượng mây và tầm nhìn
xa với các ngưỡng khác nhau Tại Cơ quan khí tượng Mỹ (NWS), chỉ có các yếu tố như nhiệt độ, gió, độ ẩm, lượng mưa, trường khí áp, độ cao địa thế vị được đánh giá Các chỉ số được sử dụng là BIAS, ETS, POD, FAR và OR Như vậy, tại mỗi quốc gia, việc lựa chọn phương pháp đánh giá mô hình cũng như các yếu tố dự báo cần được đánh giá là hoàn toàn phụ thuộc vào mục đích, yêu cầu, thực trạng công tác quan trắc đo đạc, công tác dự báo và trình độ khoa học công nghệ dự báo của quốc gia đó Nói chung, người ta thường sử dụng các phương pháp khác nhau để đánh giá các yếu tố khí tượng khác nhau Thông thường, các yếu tố này được phân loại thành các yếu tố liên tục như gió, nhiệt độ, độ cao địa thế vị …và các yếu tố rời rạc được dự báo theo ngưỡng hoặc theo xác suất như lượng mưa, dạng mưa,
…(Murphy, 1987; Denial, 1995; Jolliffe, 2003)
1.1.2 Tại Việt Nam
Tại Việt Nam, từ năm 1997 trở lại đây, trên cơ sở hợp tác song phương, Trung Tâm Quốc gia dự báo KTTV, Tổng cục KTTV (nay là Trung Tâm dự báo KTTV Trung ương (TTDBTƯ), Trung Tâm KTTV Quốc gia) đã thu được một số sản phẩm dự báo của các mô hình số từ JMA (dạng số từ cuối năm 1997), BoM (dạng bản đồ từ năm 1999, dạng số đầu năm 2001); và một vài Trung tâm khí tượng khác (dạng bản đồ) Đến năm 2002, tại TTDBTƯ bắt đầu chạy nghiệp vụ mô hình
số phân giải cao HRM với phiên bản 28km và 14km Hai phiên bản này sử dụng
Trang 26trường phân tích và dự báo từ mô hình toàn cầu GME như là điều kiện ban đầu và điều kiện biên phụ thuộc vào thời gian
Từ năm 2005 trở lại đây, trên cơ sở hợp tác với NWS của Mỹ và CMC của Canađa, TTDBTƯ đã bắt đầu truy cập và lấy các sản phẩm dự báo từ các mô hình toàn cầu GFS và NOGAPS của Mỹ, GEM của Canađa cũng như các sản phẩm tổ hợp toàn cầu của hai cơ quan nói trên Như vậy, số lượng các mô hình toàn cầu có thể đáp ứng được nguồn số liệu đầu vào cho các mô hình khu vực tại TTDBTƯ đã tăng từ 3 lên thành 25 (5 mô hình toàn cầu gồm GSM, GME, GFS, NOGAPS, GEM
và 20 thành phần tổ hợp của mô hình GFS) Cũng trong những năm này, thông qua hợp tác với Học viện nghiên cứu khí tượng METRI của KMA, Viện khoa học khí quyển và khí hậu (ISAC) của Cơ quan nghiên cứu quốc gia Italia và JMA, các mô hình khu vực quy mô vừa dự báo thời tiết như ETA, WRF, BoLAM, MOLOCH, JMANHM đã được truyển giao, nghiên cứu và thử nghiệm thành công tại TTDBTƯ Hiện tại, hệ thống dự báo khu vực nghiệp vụ tất định của TTDBTƯ bao gồm mô hình HRM với đầu vào GME và mô hình ETA với đầu vào của GFS Ngoài ra, mô hình BoLAM và các hệ thống dự báo tổ hợp từ hạn ngắn cho đến hạn vừa cũng đã bắt đầu được triển khai bán nghiệp vụ tại TTDBTƯ từ đầu năm 2008 Bên cạnh các hệ thống mô hình NWP tại TTDBTƯ, Viện Khoa học KTTV và Môi trường cùng với Khoa KTTV và Hải dương học thuộc Trường đại học khoa học tự nhiên cũng là hai đơn vị nghiên cứu đang sở hữu các mô hình NWP khu vực riêng
Cụ thể, Viện Khoa học KTTV và Môi trường đang chạy mô hình khu vực MM5 và WRF, trong khi Khoa KTTV và Hải dương học đang chạy các mô hình RAMS và WRF với cùng đầu vào từ mô hình GFS
Nhờ những thành qủa hợp tác khoa học nói trên, các sản phẩm NWP có thể được tham khảo tại TTDBTƯ đã tăng lên đáng kể trong thời gian gần đây cả về chất lượng và số lượng, qua đó cung cấp thêm nhiều thông tin tham khảo hữu ích cho các dự báo viên Tuy nhiên, chính sự phong phú về nguồn thông tin tham khảo này đôi khi lại gây ra nhiều khó khăn cho các dự báo viên trong việc quyết định xem nên tham khảo kết qủa dự báo từ mô hình dự báo nào khi mà sự khác biệt giữa các sản phẩm là rất lớn Để giải quyết bài toán này, có hai cách tiếp cận có thể được thực hiện là tiến hành đánh giá kỹ năng dự báo của từng sản phẩm NWP hoặc xây dựng một hệ thống dự báo tổ hợp để tổng hợp tất cả các nguồn thông tin sẵn có Cách tiếp cận thứ hai liên quan đến dự báo xác suất và sẽ không được đề cập ở đây Đối với cách tiếp cận thứ nhất, cho đến nay đã có một vài nghiên cứu về đánh giá
kỹ năng dự báo từ mô hình như của Nguyễn Thị Thanh Bình (2002), Nguyễn Văn Bảy (2004), Vũ Anh Tuấn (2004), Đỗ Lệ Thủy (2006), Hoàng Đức Cường (2008),
Trang 27Võ Văn Hòa (2008), Trần Quang Năng (2009), … Tuy nhiên, các nghiên cứu này mới chỉ dừng lại ở việc đánh giá kỹ năng dự báo cho một số yếu tố khí tượng bề mặt như lượng mưa, khí áp và nhiệt độ đối của hai mô hình HRM và MM5 cho một
số điểm trạm hoặc khu vực nghiên cứu Ngoài ra, các phần mềm đánh giá được phát triển trong các nghiên cứu này không có giao diện tương tác với người sử dụng, có tính khả mở kém (việc thêm các chỉ số đánh giá, trạm đánh giá, chức năng đánh giá đòi hỏi mất rất nhiều công sức), không có chức năng hiển thị đồ họa và rất khó để chuyển giao cho các cá nhân hoặc đơn vị có nhu cầu sử dụng
Dương Liên Châu và cộng sự (2007) đã xây dựng một hệ thống các chi tiêu đánh giá KTTV trong đó có phát triển một phần mềm đánh giá tương đối hoàn chỉnh Có thể nói cho đến nay nghiên cứu của Dương Liên Châu và cộng sự (2007)
là nghiên cứu toàn khá diện về lĩnh vực đánh giá KTTV Tuy nhiên, đề tài nghiên cứu này thiên về xây dựng các chỉ tiêu và thực hiện đánh giá các bản tin dự báo KTTV nghiệp vụ hơn là đánh giá NWP Trong nghiên cứu này, một số sản phẩm dự báo bề mặt như nhiệt độ và lượng mưa từ mô hình HRM đã được đánh giá dựa trên một số chỉ số đánh giá cho biến liên tục và biến nhị phân Hạn chế lớn nhất của phần mềm này trong việc đánh giá NWP là có tính khả mở thấp, không có khả năng
hỗ trợ các định dạng đầu ra trực tiếp từ các mô hình NWP như Grib, NetCDF, … và rất mất nhiều công sức gia công phần mềm khi bổ sung thêm chức năng và áp dụng cho một mô hình NWP khác Đặc biệt, tại mỗi lần đánh giá, phần mềm này chỉ có khả năng thực hiện cho một mô hình NWP và chưa có khả năng đánh giá trên lưới
Nói chung, các nghiên cứu đánh giá trong nước mới chỉ áp dụng cho từng biến dự báo, mùa dự báo và khu vực dự báo riêng lẻ mà chưa thực hiện được một đánh giá tổng thể theo cả không gian, thời gian và hình thế thời tiết Có thể nói, cho đến nay chưa có một nghiên cứu đánh giá toàn diện nào cho từng mô hình NWP cũng như các nghiên cứu so sánh kỹ năng dự báo giữa các mô hình NWP đang có
để chỉ ra mô hình NWP tốt nhất cho điều kiện Việt Nam
1.2 CÁC PHƯƠNG PHÁP ĐÁNH GIÁ SẢN PHẨM DỰ BÁO TỪ MÔ HÌNH DỰ BÁO SỐ TRỊ TẤT ĐỊNH
1.2.1 Đánh giá cho biến dự báo liên tục
Việc đánh giá chất lượng dự báo thời tiết là một trong các chỉ tiêu cơ bản để đánh giá khả năng mô phỏng của mô hình thời tiết, đồng thời, thông qua chất lượng
dự báo thời tiết, có thể định hướng được công tác nghiên cứu và nâng cao chất lượng dự báo của mô hình thời tiết đó một khi biết được chi tiết chỗ mạnh yếu của các sản phẩm dự báo Tuy nhiên, vấn đề đánh giá chất lượng dự báo thời tiết là một
Trang 28vấn đề hết sức phức tạp vì trên thực tế, không có một phương pháp hay quy phạm đánh giá nào bao quát được mọi mục đích của việc đánh giá dự báo Nhiều chuyên gia thời tiết cho rằng việc đánh giá chất lượng dự báo cũng khó khăn phức tạp chẳng kém gì việc làm ra các bản tin dự báo
Nếu coi yếu tố thời tiết cực đoan được dự báo là một biến liên tục, thì các chỉ
số đánh giá sau có thể được sử dụng:
- Sai số trung bình (Mean Error - ME):
từ -∞ đến + , với 0 là giá trị “hoàn hảo” Tuy nhiên, đôi khi một dự báo sai lại nhận được giá trị ME = 0 khi trong đó có những sai số triệt tiêu nhau, do vậy, không bao giờ người ta sử dụng chỉ số ME một mình
∞
- Chỉ số BIAS: chỉ số này có giá trị biến thiên từ -∞ đến + , trong đó giá trị bằng 1 là “hoàn hảo” Chỉ số này cho biết độ lớn của dự báo trung bình so với độ lớn của quan trắc trung bình Tuy nhiên, BIAS không cho biết độ lớn của sai số cũng như mức độ tương quan giữa quan trắc và dự báo
i iON1
FN
1
- Sai số tuyệt đối trung bình (Mean Absolute Error - MAE):
|OF
|N
số MAE được sử dụng cùng với chỉ số ME (Bias) để đưa ra ước lượng về độ tin cậy khi hiệu chỉnh sản phẩm bằng chỉ số Bias Ví dụ như khi giá trị MAE và ME tương đối gần nhau, chúng ta có thể tin tưởng để hiệu chỉnh sản phẩm bằng độ lệch, còn khi hai giá trị này khác xa nhau thì nên cẩn thận khi hiệu chỉnh bằng độ lệch
- Sai số bình phương trung bình (Mean Square Error - MSE) là một trong
những công cụ cơ bản nhất và hay sử dụng nhất để đánh giá các sản phẩm mô hình MSE được tính như sau:
Trang 292 i N
1 i
i O )F(N
1
=
(1.2.4) Chỉ số này cho biết sai số bình phương trung bình giữa dự báo và quan trắc
Giá trị 0 là dự báo “hoàn hảo”
- Căn bậc hai của sai số bình phương trung bình (Root Mean Square Error
- RMSE): là căn bậc hai của MSE và là thước đo của biên độ sai số
N 1
i i i
OFN
- Hệ số tương quan (r): chỉ số này dao động trong khoảng từ -1 đến 1 với giá
trị hoàn hảo là 1 Chỉ số r cho biết mức độ tương quan giữa các giá trị dự báo và quan trắc Hệ số r dương phản ánh mối quan hệ cùng chiều (đồng biến), ngược lại,
hệ số tương quan âm biểu thị mối quan hệ ngược chiều (nghịch biến) giữa dự báo
1
i i
N 1
OON
1FFN1
)OO)(
FF(r
- Hệ số tương quan dị thường - AC (Anomaly Correlation): công thức tính
chỉ số AC tương tự như chỉ số r nhưng khác biệt ở chỗ là thay vì sử dụng các giá trị trung bình mẫu thì công thức tính AC sử dụng giá trị trung bình khí hậu (C) Trong NWP, chỉ số AC thường được sử dụng nhiều hơn chỉ số r AC dao động trong khoảng từ -1 đến 1 với giá trị hoàn hảo là 1 Chỉ số AC cho biết mức độ tương quan giữa các dị thường dự báo với dị thường quan trắc AC không bị ảnh hưởng bởi sai
1
i i
N 1
CON
1CFN1
)CO)(
CF(AC
- Chỉ số kỹ năng - SS (Skill Score): Chỉ số này cho biết mức độ cải thiện của
dự báo hiện tại so với một dự báo đối chứng (thường là dự báo khí hậu hoặc thống
kê đơn giản) Chỉ số SS có giá trị dao động từ -∞ đến 1 và giá trị 1 được coi là
Trang 30hoàn hảo Nếu SS = 0 thì dự báo được đánh giá được coi là không đem lại bất kỳ sự cải thiện nào Trong công thức (1.2.8), SS có thể là chỉ số MSE, RMSE hoặc các chỉ
số đánh giá khác SSreference là chỉ số đánh giá của dự báo đối chứng và SSperfect forecast
là chỉ số đánh giá của dự báo hoàn hảo Chẳng hạn, nếu sử dụng chỉ số MSE hoặc RMSE thì SSperfect forecast = 0
reference forecast
perfect
reference forecast
SSSS
SSSS
SS
−
−
1.2.2 Đánh giá cho biến dự báo theo cấp
Như đã biết, việc áp dụng các chỉ số đánh giá cho biến dự báo liên tục ở mục trên để đánh giá kỹ năng dự báo mưa là không phản ánh hết khả năng của mô hình Bởi vì, bản chất của các dự báo mưa bao gồm cả dự báo pha, tức là xảy ra hay không xảy ra, do đó bộ số liệu mưa dự báo và quan trắc sẽ tuân theo quy luật phân
bố nhị phân thay vì phân bố chuẩn cho biến liên tục Do vậy, để đánh giá dự báo mưa, việc đầu tiên là phải thiết lập được một bảng phân loại (Contigency table) để biết tần suất xảy ra của hiện tượng dự báo Bảng 1.2.1 minh họa cách thức tính các tần xuất quan trắc cho biến dự báo nhị phân (hoặc 2 pha) Trong bảng 1.2.1, đại lượng A là tổng số lần dự báo thành công (dự báo đúng hiện tượng có xảy ra), B là tổng số lần dự báo sót (dự báo không xảy ra hiện tượng có xảy ra), C là tổng số lần
dự báo khống (dự báo xảy ra hiện tượng không xảy ra) và D là tổng số lần dự báo đúng của hiện tượng không xảy ra
Bảng 1.2.1: Bảng phân loại tần xuất cho biến dự báo dạng nhị phân
kỹ năng dự báo của các mô hình dự báo cho yếu tố dự báo nhị phân bao gồm:
- Chỉ số FC/PC (Fraction Correct/Percent Correct): là tỷ lệ dự báo đúng cho
cả hiện xảy ra và không xảy ra và được tính theo công thức (1.2.9) Giá trị của FC biến đổi trong khoảng từ 0 đến 1 Nếu mô hình dự báo hoàn hảo, thì tất cả các dự báo đều chính xác và chỉ số FC bằng 1, ngược lại, FC sẽ bằng 0 nếu tất cả các dự báo đều sai
Trang 31DA
FC= +
(1.2.9)
- Chỉ số BIAS/FB (Frequency Bias): là tỷ lệ giữa tần xuất dự báo có xảy ra
hiện tượng so với tần suất quan trắc có xảy ra hiện tượng và được tính theo công thức (1.2.10) Giá trị của BIAS biến đổi trong khoảng từ 0 đến dương vô cực Đại lượng BIAS cho biết khuynh hướng sai số hệ thống của mô hình dự báo và càng gần 0 thì càng tốt Nếu BIAS bằng 0 có nghĩa là mô hình không có sai số hệ thống
CA
BABIAS
+
+
= (1.2.10)
- Chỉ số POD (Probability of Detection): là xác suất phát hiện hiện tượng và
được tính theo công thức (1.2.11) Chỉ số POD chính là tỉ số giữa số lần dự báo thành công trên tổng số quan trắc có xảy ra hiện tượng POD cho biết khả năng dự báo thành công của mô hình POD có giá trị nằm trong khoảng từ 0 đến 1 POD có giá trị bằng 0 cho biết mô hình không dự báo được khi hiện tượng xảy ra Như vậy, chất lượng dự báo của mô hình là bằng không Nếu chỉ số POD mà bằng 1 có nghĩa
là mô hình dự báo là hoàn hảo Trên thực tế thì giá trị của POD không thể có giá trị bằng 1 mà chỉ có giá trị gần tiến tới một, POD càng gần 1 thì tỉ lệ dự báo đúng càng cao nghĩa là chất lượng dự báo tốt ngược lại chỉ số POD càng gần 0 thì chất lượng
dự báo là thấp
CA
APOD
+
= (1.2.11)
- Chỉ số FAR (False Alarm Ratio): là tỉ lệ dự báo khống của mô hình (dự báo
có xảy ra trong khi quan trắc không xảy ra) FAR được tính theo công thức (1.2.12)
và cho biết tỉ số giữa số lần cảnh báo khống trên tổng số lần dự báo có xảy ra hiện tượng Chỉ số FAR cho biết sự hạn chế của mô hình trong việc cảnh báo hiện tượng không xảy ra với trường hợp này Giá trị của FAR biến đổi từ 0 cho đến 1 Nếu giá trị của FAR bằng 0 thì ta hiểu rằng C bằng 0, nghĩa là tỷ lệ dự báo khống của mô hình là rất thấp, do đó có thể nói rằng mô hình tốt Nói chung giá trị của FAR mà càng gần 0 thì mô hình càng tốt Ngược lại, mà chỉ số FAR bằng 1 hoặc tiến gần tới một thì A phải bằng không hoặc tiến gần tới không, khi đó có thể coi mô hình dự báo khống nhiều hơn dự báo đúng, và chất lượng mô hình là không cao
BA
BFAR
+
= (1.2.12)
- Chỉ số TS/CSI (Threat Score/Critical Success Index): là chỉ số cho biết
mức độ chính xác trong việc dự báo hiện tượng có xảy ra TS được tính theo công thức (1.2.13) và có giá trị nằm trong khoảng từ 0 đến 1 với giá trị bằng 1 được coi là
dự báo hoàn hảo Chỉ số TS có thể được coi là chỉ số đánh giá độ chính xác khi hiện
Trang 32tượng không xảy ra không được đưa vào tính toán Tuy nhiên, chỉ số TS không phân biệt được nguồn sai số dự báo và phụ thuộc vào tần suất khí hậu của hiện tượng quan tâm Do đó, chỉ số TS ít khi được sử dụng để đánh giá sự kiện hiếm
CBA
ATS
++
= (1.2.13)
- Chỉ số ETS (Equitable Threat Score/Gilbert Skill Score): là chỉ số cho biết
mức độ chính xác trong việc dự báo hiện tượng có xảy ra nhưng có tính đến yếu tố may rủi ngẫu nhiên (ví dự dự báo mưa trong vùng khí hậu ẩm dễ hơn vùng khí hậu khô) ETS được tính theo công thức (1.2.14) và có giá trị nằm trong khoảng từ -1/3 đến 1 với giá trị bằng 1 được coi là dự báo hoàn hảo Chỉ số ETS thường được sử dụng trong đánh giá mưa từ mô hình NWP bởi vì chỉ số này cho phép so sánh công bằng giữa các hình thế hoặc khu vực đánh giá khác nhau Tương tự chỉ số TS, chỉ số ETS không phân biệt được nguồn sai số dự báo
random
randomACBA
AAETS
−++
CA(
DB
BCA
AHK
+
−+
= (1.2.15)
- Chỉ số HSS (Heidke Skill Score): là chỉ số cho biết độ chính xác của dự
báo so với các thay đổi ngẫu nhiên HK được tính theo công thức (1.2.16) và có giá trị nằm trong khoảng từ - đến 1 với giá trị bằng 1 được coi là dự báo hoàn hảo và bằng 0 được cho là không có kỹ năng Chỉ số HK cho biết tỷ lệ dự báo chính xác sau khi đã loại bỏ các dự báo chính xác có được bởi sự may mắn ngẫu nhiên
∞
random
randomECN
ECDAHK
−
−+
= (1.2.16)
Trang 33trong đó [(A C)(A B) (D C)(D B)]
N
1
ECrandom = + + + + +
- Chỉ số OR (Odds ratio): cho biết tỷ lệ giữa dự báo có xảy ra và hiện tượng
thực sự có xảy ra so với dự báo có xảy ra nhưng hiện tượng không xảy ra Chỉ số
OR được tính theo công thức (1.2.17) và có giá trị nằm trong khoảng từ 0 đến ∞với giá trị bằng được coi là dự báo hoàn hảo và bằng 1 được cho là không có kỹ năng Chỉ số OR thường được hiển thị dưới dạng biểu đồ hơn là sử dụng các giá trị tính toán đơn lẻ và chỉ số này rất hữu ích để đánh giá cho dự báo sự kiện hiếm
∞
C
*B
D
*A
OR = (1.2.17)
1.2.3 Đánh giá theo diện
Khác với các trường khí tượng khác, mưa có hai thành phần là pha mưa (có hay không có mưa) và lượng mưa Vì vậy nghiên cứu khả năng dự báo mưa của mô hình NWP bao gồm việc đánh giá có xảy ra mưa hay không và nếu có thì dự báo lượng mưa là bao nhiêu Nhìn chung, sai số của dự báo trong mô hình NWP sinh ra
do sai số phân tích hay là sai số trong các trường ban đầu, sai số sinh ra do biểu diễn gần đúng nhiệt động lực mô hình, sai số vật lý sinh ra do mô tả vật lý chưa thích hợp trong mô hình và sai số do làm trơn địa hình bề mặt trong mô hình Tất cả những sai số này dẫn đến sai số trong dự báo trường gió, trường nhiệt, trường ẩm và
do đó cuối cùng gây sai số trong dự báo mưa Sai số dự báo mưa thể hiện chủ yếu dưới 3 dạng: sai số về vị trí hệ thống mưa, sai số về hình dạng vùng mưa, sai số về giá trị và cường độ mưa (Ebert, 1997) Nếu những sai số là hệ thống thì có khả năng xác định nguyên nhân gây sai số và tìm ra biện pháp cải tiến mô hình tương ứng hoặc hiệu chỉnh thống kê sản phẩm mô hình để đưa ra kết quả dự báo mưa tốt hơn
Để tách ra và đánh giá được mưa trong một hệ thống thời tiết cụ thể thì phải phân biệt được mưa xảy ra ở đâu trong khu vực mô hình NWP Ebert và CS (1997)
đã đề xuất khái niệm “vùng mưa liên kết-CRA” Đó là vùng của mưa quan trắc hay mưa dự báo được khép kín bởi một đường đẳng trị theo ngưỡng Nếu các vùng mưa
dự báo và quan trắc tưởng như là những thực thể tách rời thì CRA là đơn vị của những thực thể mưa dự báo hay mưa quan trắc, trong giới hạn mỗi thực thể mưa được coi là liên tục Theo phương pháp CRA, một dự báo mưa có chất lượng phải
dự báo đúng:
- Vị trí của vùng mưa (position): Sai số tương ứng được gọi là sai số vị trí
Đó chính là khoảng cách giữa hai tâm mưa của vùng mưa dự báo và vùng mưa quan
Trang 34trắc, qua đó xác định được đoạn đường cần dịch chuyển sao cho vùng mưa dự báo tiến đến gần nhất với vùng mưa quan trắc sau khi hiệu chỉnh
- Cường độ mưa (volume): Sai số tương ứng được gọi là sai số thể tích
- Hình dạng vùng mưa (pattern) : Sai số tương ứng về hình dáng vùng mưa được gọi là sai số kiểu dáng
Theo phương pháp thống kê đánh giá truyền thống thì ta khó có thể xác định được nguồn gốc sai số xảy ra trong tất cả các đại lượng trên cả miền mô hình Phương pháp CRA đã góp phần khắc phục những nhược điểm này Mục đích của thẩm định CRA là đánh giá xem mưa dự báo khác với mưa quan trắc về vị trí, hình dạng và cường độ đến mức nào Phương pháp CRA cho ta xác định độ dịch chuyển ngang của vùng dự báo so với vùng quan trắc, sai số về lượng mưa, tốc độ mưa trung bình và giá trị cực đại, diện tích vùng mưa và tương quan kiểu mưa quan trắc trước và sau khi hiệu chỉnh Phương pháp này cũng tính những chỉ số đánh giá cho
dự báo có hay không có xảy ra hiện tượng như các chỉ số: TS, FBI, FAR, ETS Tuy nhiên, ý nghĩa của những chỉ số đánh giá này sẽ rất khác khi áp dụng vào CRA
Trong mỗi mô hình để có thể áp dụng nghiệp vụ thông thường thực thể mưa
dự báo và thực thể mưa quan trắc có phần chồng lên nhau, đặc biệt là đối với những
hệ thống mưa lớn Tuy nhiên, cả trong trường hợp thực thể mưa dự báo hoàn toàn không trùng với mưa quan trắc vẫn có thể tính được sai số dịch chuyển và sai số cường độ nếu như trường dự báo ở không quá xa trường quan trắc Trong trường hợp có mưa quan trắc nhưng không có mưa dự báo hay ngược lại gần đúng CRA vẫn có giá trị
1.2.3.1 Phương pháp xác định sai số
Sai số dịch chuyển được xác định bởi quãng đường cần chuyển dịch trường
dự báo về phía trường quan trắc cho đến khi đạt tiêu chí “đúng nhất” (“best fit”) là tối ưu Đoạn đường dịch chuyển là vectơ hiệu giữa vị trí cuối cùng và vị trí gốc của
dự báo Giá trị dương của dịch chuyển x và y chỉ rằng trường dự báo nằm ở phía đông và phía bắc của kiểu mưa quan trắc Hoffman (1995) đã thử nghiệm hai tiêu chí đúng nhất và tìm được kết quả tương tự với sử dụng cực tiểu hóa sai số RMSE
và cực đại hóa hệ số tương quan trên vùng đánh giá vuông góc Trong phương pháp CRA, vùng đánh giá là một tập hợp những điểm chứa trong CRA xuất phát cũng như trong CRA sau khi trôi vùng dự báo đến vùng được hiệu chỉnh, tức là liên kết của thực thể quan trắc gốc và thực thể dự báo với thực thể dự báo đã được trôi Hoffman (1995) chủ định loại trừ những điểm ngoài CRA để chỉ tập trung vào hệ thống mưa cần quan tâm Vì số những điểm trong vùng đánh giá N phụ thuộc vào vị
Trang 35trí của dự báo đã được trôi nên Hoffman (1995) đã chọn để tối thiểu hóa sai số bình phương trung bình tổng (MSE) chứ không chọn sai số RMSE để xác định sự đúng nhất của dự báo với quan trắc
Hoffman (1995) coi tương quan kiểu cực đại như một tiêu chí để xác định độ dịch chuyển ngang Tác giả đã sử dụng tương quan để đối chiếu gradien mưa dự báo và mưa quan trắc trong khi sử dụng cực tiểu hóa sai số bình phương trung bình tổng để đối chứng cực đại mưa Đối với những CRA lớn hơn thì cả hai gần đúng này nói chung cho ta độ dịch chuyển như nhau trong khi đối với những CRA không điều hòa nhỏ hơn thì cực tiểu hóa sai số bình phương tổng cho kết quả nhạy hơn
Vùng nghiên cứu là một hộp hình chữ nhật có tâm trong CRA Kích thước của vùng này được xác định bằng mở rộng về hai phía bắc-nam (đông-tây) với cùng một số cho trước những nút lưới Mặc dù vùng nghiên cứu là chữ nhật nhưng vùng đánh giá thực là những điểm chung với CRA gốc và kiểu mưa dự báo đã được trôi
1.2.3.2 Phương pháp tách sai số
Việc cực tiểu hóa sai số bình phương tổng cho phép ta tách sai số dự báo định lượng mưa thành các sai số thành phần là sai số dịch chuyển (displacement error), sai số thể tích mưa (volume error) và sai số kiểu dáng vùng mưa (pattern error) Trước tiên, ta khảo sát một trường hợp lý tưởng trong đó thực thể mưa dự báo và thực thể mưa quan trắc liền kề với nhau trong mô hình Sai số MSE có thể viết như sau:
MSEtotal = MSEdisplacement + MSEvolume + MSEpattern (1.2.18)
trong đó MSEtotal tương ứng với MSE của dự báo gốc: ∑ (
=
−
1 i
2 i
i OFN
1
và Oi là mưa dự báo và mưa quan trắc tương ứng trên điểm lưới i , N là số điểm lưới
trong vùng đánh giá Sau khi tính được độ dịch chuyển thì mưa dự báo được trôi (shifted) đến vị trí có độ dịch chuyển bằng không MSE khi đó được tính lại bằng:
2 i
l i shift F ON
1
với là dự báo đã được trôi trên điểm lưới i Hiệu số giữa MSE trước và sau trôi
là phần đóng góp vào sai số tổng sinh ra do dịch chuyển:
MSEpattern = MSEshift – MSEvolume (1.2.22)
Trang 36trong đó dấu ngang trên chỉ trung bình trên toàn miền đánh giá Sai số thể tích mưa
là hiệu số giữa tốc độ mưa dự báo và tốc độ mưa quan trắc trung bình trên toàn
miền đánh giá và do đó khi nhân với N sẽ cho ta lượng mưa Sai số kiểu dáng là sự
khác nhau về hình dạng và cấu trúc giữa trường mưa dự báo và trường mưa quan trắc Qua nghiên cứu về lý thuyết của thẩm định CRA, ta thấy phương pháp này có một số ưu điểm sau:
- Xác định trực giác và định lượng những tính chất mà ta nhìn thấy được;
- Tính được sai số vị trí trong dự báo;
- Sai số tổng có thể tách thành sai số vị trí, sai số thể tích và sai số kiểu dáng Hiện tượng dự báo có thể được phân loại thành dự báo đúng, dự báo sót, dự báo khống Những chỉ số này rất hữu ích đối với quản lý quá trình dự báo cũng như đối với việc nghiên cứu cải tiến mô hình
Ngoài ra, phương pháp CRA cũng bộc lộ một số nhược điểm như sau:
- Phương pháp này phụ thuộc vào sự đối chứng kiểu dáng nên phải liên kết được các thực thể dự báo với các thực thể quan trắc, nghĩa là dự báo phải đúng một nửa Kết quả đánh giá đối với số CRA lớn sẽ có xu hướng về dự báo “đúng”, tức là những dự báo có sai số vị trí và sai số thể tích có thể được xác định với độ chắc chắn (tin cậy);
- Người sử dụng phải chọn phương pháp đối chứng cũng như ngưỡng mưa dùng để xác định thực thể Kết quả đánh giá phần nào phụ thuộc vào việc chọn này;
- Khi thực thể dự báo hay quan trắc mở rộng qua biên vùng đánh giá thì không thể nói chắc chắn rằng kiểu đối chứng là tối ưu Nếu CRA có vùng khá lớn
và vẫn nằm trong miền này thì xác suất của đối chứng tốt là lớn
Trang 37CHƯƠNG II XÂY DỰNG PHẦN MỀM ĐÁNH GIÁ KHÁCH QUAN CÁC SẢN
PHẨM CỦA MÔ HÌNH DỰ BÁO SỐ TRỊ
2.1 PHÂN TÍCH VÀ THIẾT KẾ CẤU TRÚC PHẦN MỀM
Như đã phân tích trong phần hiện trạng, cho đến nay đã có rất nhiều nghiên cứu trong nước liên quan đến bài toán đánh giá chất lượng dự báo từ các mô hình NWP Điểm hạn chế lớn nhất của các nghiên cứu này đó là các phần mềm được phát triển thường tập trung cho mục đích riêng của nghiên cứu mà không tính đến khả năng mở rộng hay áp dụng cho các nghiên cứu khác Do đó, tính ứng dụng của các phần mềm đánh giá NWP trong các nghiên cứu này cho các nghiên cứu khác thường không cao, đòi hỏi mất nhiều công sức và thời gian khi áp dụng sang một bài toán đánh giá khác đòi hỏi bổ sung thêm nhiều chức năng đánh giá hoặc có nhiều thay đổi liên quan đến mô hình NWP và nguồn số liệu đánh giá Do vậy, nghiên cứu và phát triển được một phần mềm đánh giá NWP mang tính toàn diện là hết sức cần thiết và cấp bách Phần mềm này về cơ bản phải đáp ứng được các tiêu chí kỹ thuật như sau:
- Có giao diện thân thiện với người sử dụng, dễ dàng cài đặt, sử dụng và cấu hình phần mềm;
- Có đầy đủ các chức năng đánh giá cần thiết cho bài toán đánh giá chất lượng NWP, dễ dàng mở rộng chức năng đánh giá khi có nhu cầu với chi phí thời gian và công sức thấp nhất;
- Có khả năng đánh giá đồng thời nhiều mô hình NWP trong đó hỗ trợ khả năng đọc dữ liệu NWP với nhiều định dạng đầu vào khác nhau;
- Cung cấp nhiều không gian đánh giá từ điểm trạm, theo vùng nghiên cứu, theo mùa, theo trường hợp nghiên cứu cho đến đánh giá trên lưới mô hình;
- Dễ dàng cấu hình đánh giá từ việc lựa chọn nguồn số liệu cần đánh giá, lựa chọn nguồn số liệu quan trắc, lựa chọn không gian đánh giá, lựa chọn chỉ số đánh giá, lựa chọn biến đánh giá, …;
- Cung cấp nhiều lựa chọn hiển thị kết quả đánh giá cho người sử dụng từ dạng số, dạng đồ thị, …
- Có các chức năng sao lưu kết quả đánh giá cho người sử dụng để phục vụ công tác nghiên cứu và truy vấn kết quả;
- Quản lý các nguồn số liệu quan trắc và dự báo từ các mô hình NWP theo các định dạng chuẩn được WMO khuyến cáo sử dụng;
- Hỗ trợ truy xuất và hiển thị các nguồn số liệu quan trắc và dự báo NWP
Trang 38Với những yêu cầu kỹ thuật đề ra ở trên, chúng tôi đã tiến hành phân tích và
thiết kế “Phần mềm đánh giá khách quan các sản phẩm của mô hình dự báo số cho khu vực Việt Nam” (phần mềm này được đặt tên là NWP_Verif) có cấu trúc
như được thấy trong hình 2.1.1 Từ hình 2.1.1 có thể thấy phần mềm NWP_Verif bao gồm 6 thành phần cơ bản như sau:
1) Giao diện tương tác với người sử dụng: thành phần này cung cấp các
giao diện tương tác với người sử dụng (GUIs) như giao diện quản trị cơ sở dữ liệu, giao diện xem số liệu quan trắc và dự báo, giao diện thực hiện đánh giá, giao diện xem kết quả đánh giá và giao diện hướng dẫn sử dụng phần mềm Toàn bộ các GUIs được phát triển dựa trên ngôn ngữ lập trình C# và có thể chạy trên nền điện toán 32bits và 64bits;
2) Hệ cơ sở dữ liệu (CSDL) phục vụ đánh giá: hệ CSDL phục vụ đánh giá
được thiết kế dựa trên hệ quản trị CSDL MicroSoft SQL Server phiên bản 2008 (sử dụng bản miễn phí Express Edition) Hệ CSDL của phần mềm NWP_Verif bao gồm các bảng quan hệ cho CSDL số liệu quan trắc bề mặt, số liệu quan trắc trên cao, số liệu tái phân tích, số liệu dự báo của các mô hình NWP, cấu hình mùa đánh giá, cấu hình trường hợp đánh giá (case-study), … Trong đó, các CSDL số liệu quan trắc bao gồm cả siêu dữ liệu (metadata) và dữ liệu Các CSDL còn lại chỉ có phần siêu
dữ liệu được quản lý và lưu trong hệ quản trị CSDL MicroSoft SQL Server, còn phần dữ liệu sẽ được lưu trong các tệp tin có định dạng riêng (ví dụ như mã NetCDF cho số liệu NWP) và tuân theo cấu trúc cây thư mục định sẵn;
3) Thư viện giải mã và mã hóa số liệu: thành phần này cung cấp khả năng
giãi mã các nguồn số liệu đầu vào trên lưới có định dạng mã GRIB1 và NetCDF Ngoài ra, một số module chiết xuất kết quả dưới dạng text, dạng csv và dạng xls, dạng pdf và dạng xml cũng được cung cấp trong thư viện này Ngôn ngữ lập trình được sử dụng để phát triển hoặc kết nối tới các thư viện này dựa trên ngôn ngữ C và C# (ngoại trừ các thư viện sẵn có là GRIB1 và NetCDF)
4) Thư viện đánh giá: thư viện này cung cấp các module thực hiện việc tính
toán các chỉ số đánh giá theo yêu cầu của người sử dụng Hiện tại, thư viện này mới
có khả năng tính toán các chỉ số đánh giá cho các biến liên tục (ME, MAE, MSE,
…) và biến phân cấp (POD, FAR, ETS,….) Toàn bộ thư viện này được phát triển dựa trên các ngôn ngữ C và Fortran 90;
5) Thư viện hiển thị đồ họa: thư viện này cho phép hiển thị các kết quả đánh
giá dưới dạng đồ thị cũng như xem các trường dự báo từ các mô hình NWP dưới dạng bản đồ trường Để hiển thị các bản đồ trường, thư viện đồ họa GrADS được tích hợp vào trong phần mềm NWP_Verif, trong khi để hiển thị các biểu đồ đánh
Trang 39giá chúng tôi sử dụng thư viện đồ họa TELERIK phiên bản 2011 (một dạng thư viện mở do hãng phần mềm thứ 3 cung cấp cho nền tảng Microsoft);
6) Thư viện hỗ trợ tính toán: thư viện này bao gồm các module tính toán
thống kê, nội suy từ lưới về trạm, làm trơn trường, kiểm tra chất lượng thám sát, … Các module này được phát triển dựa trên các ngôn ngữ C và Fortran 90
Phần mềm NWP_Verif được phát triển trên nền hệ điều hành Windows thay
vì hệ điều hành Linux (môi trường làm việc quen thuộc đối với các mô hình NWP)
do đối tượng sử dụng của phần mềm này không chỉ dừng lại ở những người làm mô hình NWP mà còn phục vụ cho các cơ quan quản lý chất lượng dự báo hoặc đơn vị nghiên cứu không có khả năng hoặc kinh nghiệm vận hành các hệ thống trên môi trường Linux Các phần tiếp theo sẽ trình bày chi tiết về từng thành phần của phần mềm NWP_Verif
Hình 2.1.1: Cấu trúc phần mềm NWP_Verif
2.2 PHÂN TÍCH VÀ THIẾT KẾ CƠ SỞ DỮ LIỆU PHỤC VỤ ĐÁNH GIÁ
2.2.1 Cơ sở dữ liệu quan trắc bề mặt và trên cao
Cơ sở dữ liệu này có nhiệm vụ quản lý và lưu các giá trị quan trắc của các yếu tố khí tượng bề mặt và trên cao tại các trạm quan trắc Hình 2.2.1 đưa ra thiết kế của CSDL quan trắc bề mặt (synop) trong đó bao gồm 4 bảng quan hệ liên kết một chiều với nhau (trong mối quan hệ này thì một biến trong 1 bảng không thể liên kết với hơn 1 biến ở bảng khác và ngược lại) Bốn bảng quan hệ của CSDL quan trắc bề
mặt bao gồm các bảng được đặt tên như sau: synop_obs, synop_stn, synop_t_obs
và synop_rain_obs Bảng synop_stn bao gồm 9 biến như được mô tả trong bảng
2.2.1 có chức năng chính là lưu các thông tin về trạm quan trắc bề mặt từ mã trạm,
Trang 40tỉnh, khu vực và nước trực thuộc, cuối cùng là kinh độ, vĩ độ và độ cao của trạm Toàn bộ các thông tin về số liệu quan trắc của lượng mưa và thời điểm quan trắc
được lưu trong bảng synop_rain_obs (xem bảng 2.2.2) Tương tự, bảng synop_t_obs lưu thông tin quan trắc về hai đại lượng nhiệt độ tối cao và tối thấp tại
trạm (xem bảng 2.2.3) Các biến quan trắc còn lại như áp suất trung bình mực biển, tốc độ và hướng gió tại độ cao 10 mét, nhiệt độ không khí và nhiệt độ điểm sương
tại độ cao 2 mét, được lưu trong bảng synop_obs (xem bảng 2.2.4)
Hình 2.2.1: Sơ đồ quan hệ giữa các bảng thuộc tính của CSDL quan trắc bề mặt
Bảng 2.2.1: Các trường trong bảng quan hệ synop_stn của CSDL quan trắc bề mặt
STT Tên trường Kiểu dữ liệu Mô tả trường
1 Sid Ký tự-khóa chính Mã trạm
2 Lon Số nguyên Kinh độ của trạm
3 Lon Số nguyên Vĩ độ của trạm
4 Height Số nguyên Độ cao của trạm đã quy về mực nước biển
5 Hls Số nguyên Độ cao của trạm chưa quy về mực nước biển
6 Name Ký tự Tên trạm
7 District Ký tự Tên tỉnh hay thành phố
8 Area Ký tự Tên khu vực
9 Country Ký tự Tên nước