Hiện tại có hai phương pháp cho phép hệ phương trình dự báo tự cập nhật: • Phương pháp thứ nhất: Sử dụng lọc Kalman, thay vì cố định các hệ số hồi quy trong phương trình hồi quy, các hệ
Trang 1BỘ TÀI NGUYÊN VÀ MÔI TRƯỜNG TRUNG TÂM KHÍ TƯỢNG THỦY VĂN QUỐC GIA
Số 4 Đặng Thái Thân – Quận Hoàn Kiếm – Hà Nội
-******** -
BÁO CÁO TỔNG KẾT ĐỀ TÀI NGHIÊN CỨU KHOA HỌC VÀ CÔNG NGHỆ CẤP BỘ
Trang 2Số 4 Đặng Thái Thân – Quận Hoàn Kiếm – Hà Nội
-******** -
BÁO CÁO TỔNG KẾT ĐỀ TÀI NGHIÊN CỨU KHOA HỌC VÀ CÔNG NGHỆ CẤP BỘ
CN Vũ Duy Tiến CN Nguyễn Mạnh Linh
Hà Nội, ngày tháng 12 năm 2009 Hà Nội, ngày tháng 12 năm 2009
TS Nguyễn Lê Tâm
CƠ QUAN QUẢN LÝ ĐỀ TÀI
Trang 3(Brier Skill Score)
BoM Cơ quan khí tượng Ôxtrâylia
(Bureau of Meteorology, Australia)
(CleaR)
CRF Chỉ số đánh giá
Cumulative Relative Frequency
CSI Chỉ số đánh giá CSI
(Critical Success Index)
DMO Dự báo trực tiếp từ mô hình
(Direct Model Output)
DWD Tổng cục thời tiết Cộng hoà Liên bang Đức
(Deutscher WetterDienst)
EMOS Thống kê sau mô hình tổ hợp
(Ensemble Model Ouput Statistics)
ETS Chỉ số đánh giá ETS
(Equitable Threat Score)
FB Chỉ số đánh giá FB
(Frequency Bias) FAR Tỷ lệ cảnh báo khống
(False Alarm Ratio)
GME Mô hình toàn cầu của CHLB Đức
(Global Model for Europe)
Trang 4GMOS Thống kê sau mô hình trên lưới
(Gridded Model Ouput Statistics)
GSM Mô hình phổ toàn cầu của JMA
(Global Spectral Model)
JMA Cơ quan khí tượng Nhật bản
(Japan Meteorological Agency)
HSS Chỉ số kỹ năng Heidke
(Heidke Skill Score)
KF Phương pháp lọc Kalman
Kalman Filter
MAE Sai số tuyệt đối trung bình
(Mean Absolute Error)
ME Sai số trung bình
(Mean Error)
MLR Hồi quy tuyến tính đa biến
(Multiple Linear Regression)
MOS Thống kê sau mô hình
(Model Ouput Statistics)
NCEP Trung tâm dự báo môi trường quốc gia Mỹ
(National Centers for Environmental Prediction)
NWS Cơ quan khí tượng quốc gia Mỹ
(US National Meteorological Service)
NWP Dự báo thời tiết số trị
(Numerical Weather Prediction)
OVC Loại mây (đầy mây)
Trang 5PP Phương pháp dự báo hoàn hảo
(Perfect Prognosis)
RMSE Sai số quân phương
(Root Mean Square Error)
RV Chỉ số RV
(Reduction of Variance)
SCT Loại mây (ít mây)
SCaTtered
SSCP Ma trận phương sai hiệp biến
Sum of Squares and Cross Products
TS Chỉ số đánh giá TS
(Threat Score)
TTDBTƯ Trung tâm Dự báo Khí tượng Thủy văn Trung ương
UMOS Thống kê sau mô hình có cập nhật hệ số
(Updatable Model Ouput Statistics)
VCE Sự thay đổi theo độ cao
(Vertical Change Elevation)
Trang 6DANH SÁCH CÁC BẢNG
TT Số thứ
1 2.4.1 Số liệu (quan trắc) và mô hình (HRM, GSM) được thử nghiệm trong
phát triển hệ thống diễn giải 31
2 2.4.2 Số lượng các trạm quan trắc khí tượng bề mặt của 9 Đài KTTV khu
vực được thử nghiệm trong phát triển hệ thống diễn giải
32
3 3.1.1 Biến đổi của phương trình dự báo tmax và RV, hạn 54 giờ tại trạm
Láng theo dung lượng tập dữ liệu mới với mô hình GSM vào mùa
hè
54
4 3.1.2 Như bảng 3.1.1, nhưng cho trạm Tân Sơn Hòa 55
5 3.1.3 Tần xuất tuyển chọn và tần xuất tuyển chọn đầu tiên các nhân tố của
phương trình dự báo tmax, hạn 54 giờ theo dung lượng tập dữ liệu mới với mô hình GSM vào mùa hè
56
6 3.1.4 Biến đổi của phương trình dự báo tmin và RV, hạn 66 giờ tại trạm
Láng theo dung lượng tập dữ liệu mới với mô hình HRM vào mùa đông
57
7 3.1.5 Như bảng 3.1.4, nhưng cho trạm Tân Sơn Hòa 58
8 3.1.6 Tần xuất tuyển chọn và tần xuất tuyển chọn đầu tiên các nhân tố của
phương trình dự báo tmin, hạn 66 giờ theo dung lượng tập dữ liệu mới với mô hình HRM vào mùa đông
60
9 3.1.7 Biến đổi của phương trình dự báo t, td và RV, hạn 48 giờ tại trạm
Trường Sa theo dung lượng tập dữ liệu mới với mô hình GSM vào mùa hè
60
10 3.1.8 Tần xuất tuyển chọn và tần xuất tuyển chọn đầu tiên các nhân tố của
phương trình dự báo t và td, hạn 48 giờ theo dung lượng tập dữ liệu mới với mô hình GSM vào mùa hè
62
11 3.1.9 Biến đổi của phương trình dự báo gió và RV, hạn 24 giờ tại trạm
Côn Đảo theo dung lượng tập dữ liệu mới với mô hình HRM vào mùa đông
64
12 3.1.10 Như bảng 3.1.9, nhưng với mô hình GSM 65
13 3.1.11 Tần xuất tuyển chọn và tần xuất tuyển chọn đầu tiên các nhân tố của
phương trình dự báo gió hạn 24 giờ theo dung lượng tập dữ liệu mới với mô hình HRM vào mùa đông
66
14 3.1.12 Như bảng 3.1.11, nhưng với mô hình GSM 67
15 3.1.13 Biến đổi của phương trình dự báo mây và RV, hạn 06 giờ tại trạm
Sìn Hồ theo dung lượng tập dữ liệu mới với mô hình GSM vào mùa
hè
67
16 3.1.14 Tần xuất tuyển chọn và tần xuất tuyển chọn đầu tiên các nhân tố của
phương trình dự báo mây, hạn 06 giờ theo dung lượng tập dữ liệu mới với mô hình GSM vào mùa hè
69
17 3.1.15 Các nhân tố có tần xuất tuyển chọn lớn hơn 20% trong các phương
trình MLR cho tmax với bộ nhân tố đầu vào từ mô hình HRM và
GSM
70
18 3.1.16 Tương tự bảng 3.1.15 nhưng cho yếu tố dự báo tmin 71
19 3.1.17 Tương tự bảng 3.1.15 nhưng cho yếu tố dự báo t 71
20 3.1.18 Tương tự bảng 3.1.15 nhưng cho yếu tố dự báo td 72
21 3.1.19 Tương tự bảng 3.1.15 nhưng cho yếu tố dự báo u và có tần xuất > 73
Trang 8DANH SÁCH CÁC HÌNH VẼ VÀ BIỂU ĐỒ
TT Số thứ tự
1 1.2.1 Đồ thị hai chiều và ba chiều của hàm trọng số cho ma trận SSCP
mới và SSCP cũ theo dung lượng mẫu (theo Wilson và Vallee, 2002)
10
2 1.2.2 Sơ đồ mô tả bước dự báo và hiệu chỉnh của lọc Kalman 14
3 2.3.1 Chỉ số RV trung bình trên khu vực Việt Nam theo phương pháp hồi
quy từng bước từ mô hình HRM dự báo cho tmax (trái) và tmin
(phải), hạn dự báo 72 giờ
30
4 2.4.1 Sự biến thiên trung bình (%) của sai số quân phương (RMSE) dự
báo từ lọc Kalman theo các giá trị dung lượng mẫu khác nhau cho
tmax hạn 6h (bên trái) và tmin hạn 18h (bên phải)
35
5 2.4.2 Tương tự hình 2.4.1 nhưng cho t hạn 24h (bên trái) và wind hạn
24h (bên phải)
36
6 2.5.1 Thuật toán dự báo hiện tượng từ dự báo xác suất 41
7 2.7.1 Meteogram dự báo cho Cam Ranh 46
8 2.7.2 Bản đồ dự báo nhiệt độ 2m (t 2m , trái), nhiệt độ tối thấp 2m (tmin 2m,
giữa) và nhiệt độ tối cao 2m (tmax 2m, phải) theo GMOS
47
9 2.7.3 Bản đồ dự báo nhiệt độ 2m (t 2m,trái), nhiệt độ điểm sương 2m
(td 2m ,giữa) và độ ẩm tương đối 2m (rh 2m , phải) theo GMOS
47
10 2.7.4 Bản đồ dự báo độ ẩm tương đối 2m (rh 2m, trái), lượng mây (giữa)
và gió 10m (w 10m, phải) theo GMOS 48
11 2.7.5 Bản đồ dự báo xác suất mưa 24 giờ ngưỡng 01mm (trái), 05mm
(giữa) và 20mm (phải) theo GMOS
48
12 3.1.1 Biến đổi của RV theo dung lượng mẫu tập số liệu mới sau khi mô
hình GSM (trên) và HRM (dưới) thay đổi vào mùa đông (trái) và
mùa hè (phải) cho tmax
50
13 3.1.2 Như hình 3.1.1, nhưng cho yếu tố tmin 51
14 3.1.3 Biến đổi của RV theo dung lượng mẫu tập số liệu mới sau khi mô
hình GSM (trên) và HRM (dưới) thay đổi vào mùa đông (trái) và
mùa hè (phải) cho t và td với hạn dự báo 12, …, 72 giờ
51
15 3.1.4 Toán đồ tụ điểm dự báo t (trên) và td (dưới) hạn 72 giờ, mùa hè từ
mô hình GSM so sánh với quan trắc trong năm 2007 (trái), 2008
(giữa) và 2009 (phải)
52
16 3.1.5 Toán đồ tụ điểm dự báo t (trên) và td (dưới) hạn 72 giờ, mùa đông
từ mô hình GSM so sánh với quan trắc trong năm 2006 (trái), 2007
(giữa) và 2008 (phải)
53
17 3.1.6 Biến đổi của RV theo dung lượng mẫu tập số liệu mới sau khi mô
hình GSM (trên) và HRM (dưới) thay đổi vào mùa đông (trái) và
mùa hè (phải) cho u, v và ff
63
18 3.1.7 Như hình 3.1.16, nhưng cho bốn loại mây CLR, SCT, BRK và
19 3.1.8 Hình 3.1.8 Sự biến thiên của các hệ số hồi quy trong phương trình
dự báo tmax hạn 30h và sai số hệ thống (BIAS) của DMO và KF
tại trạm Láng đối với chu kỳ dự báo 21/11/2007-21/01/2008 với số
liệu đầu vào từ mô hình GSM
77
20 3.1.9 Tương tự như hình 3.1.8 nhưng cho phương trình dự báo t hạn 24h 78
Trang 921 3.1.10 Tương tự như hình 3.1.8 nhưng cho chu kỳ dự báo
25/10/2007-25/12/2007 với số liệu đầu vào từ mô hình HRM
78
22 3.1.11 Tương tự như hình 3.1.10 nhưng cho phương trình dự báo t hạn 24h 78
23 3.2.1 Bias dự báo của tmax vào mùa hè 2007 (trái), 2008 (giữa) và 2009
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương pháp DMO, KF và UMOS
81
24 3.2.2 Bias dự báo của tmax vào mùa đông 2006 (trái), 2007 (giữa) và
2008 (phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương pháp DMO, KF và UMOS
82
25 3.2.3 Như hình 3.2.1, nhưng với chỉ số RMSE 83
26 3.2.4 Như hình 3.2.2, nhưng với chỉ số RMSE 84
27 3.2.5 Bias dự báo của tmin vào mùa hè 2007 (trái), 2008 (giữa) và 2009
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương pháp DMO, KF và UMOS
85
28 3.2.6 Bias dự báo của tmin vào mùa đông 2006 (trái), 2007 (giữa) và
2008 (phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương pháp DMO, KF và UMOS
86
29 3.2.7 Như hình 3.2.5, nhưng với chỉ số RMSE 87
30 3.2.8 Như hình 3.2.6, nhưng với chỉ số RMSE 88
31 3.2.9 Bias dự báo của t vào mùa hè 2007 (trái), 2008 (giữa) và 2009
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương pháp DMO, KF và UMOS
90
32 3.2.10 Bias dự báo của t vào mùa đông 2006 (trái), 2007 (giữa) và 2008
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương pháp DMO, KF và UMOS
91
33 3.2.11 Như hình 3.2.9, nhưng với chỉ số RMSE 92
34 3.2.12 Như hình 3.2.10, nhưng với chỉ số RMSE 93
35 3.2.13 Bias dự báo của td vào mùa hè 2007 (trái), 2008 (giữa) và 2009
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương pháp DMO, KF và UMOS
94
36 3.2.14 Bias dự báo của td vào mùa đông 2006 (trái), 2007 (giữa) và 2008
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương pháp DMO, KF và UMOS
95
37 3.2.15 Như hình 3.2.13, nhưng với chỉ số RMSE 96
38 3.2.16 Như hình 3.2.14, nhưng với chỉ số RMSE 97
39 3.2.17 Bias dự báo của t theo mô hình GSM vào mùa hè 2007, 2008, 2009
(trên) và mùa đông 2006, 2007, 2008 (dưới) với ba phương pháp
DMO, UMOSreg và UMOS
99
40 3.2.18 Hình 3.2.18: Như hình 3.2.17, nhưng với chỉ số RMSE 100
41 3.2.19 Dự báo tmax ngày thứ hai (hạn dự báo 48 giờ) theo GMOS với các
mô hình GSM, HRM theo hai phương pháp UMOS và KF Quan
trắc cũng được hiển thị với mục đích so sánh
101
42 3.2.20 Như hình 3.2.19, nhưng cho tmin 102
43 3.2.21 Như hình 3.2.19, nhưng cho t 103
44 3.2.22 Như hình 3.2.19, nhưng cho td 104
45 3.2.23 Dự báo rh hạn 54 giờ theo GMOS với các mô hình GSM, HRM
theo hai phương pháp UMOS và KF Quan trắc cũng được hiển thị
với mục đích so sánh
105
46 3.2.24 Bias dự báo của dd vào mùa hè 2007 (trái), 2008 (giữa) và 2009
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương pháp DMO, KF và UMOS
107
Trang 1047 3.2.25 Bias dự báo của dd vào mùa đông 2006 (trái), 2007 (giữa) và 2008
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương pháp DMO, KF và UMOS
108
48 3.2.26 Như hình 3.2.24, nhưng với chỉ số RMSE 109
49 3.2.27 Như hình 3.2.25, nhưng với chỉ số RMSE 110
50 3.2.28 Như hình 3.2.24, nhưng với chỉ số CRF 111
51 3.2.29 Như hình 3.2.25, nhưng với chỉ số CRF 112
52 3.2.30 Bias dự báo của ff vào mùa hè 2007 (trái), 2008 (giữa) và 2009
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương pháp DMO, KF và UMOS
113
53 3.2.31 Bias dự báo của ff vào mùa đông 2006 (trái), 2007 (giữa) và 2008
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương pháp DMO, KF và UMOS
114
54 3.2.32 Như hình 3.2.30, nhưng với chỉ số RMSE 115
55 3.2.33 Như hình 3.2.31, nhưng với chỉ số RMSE 116
56 3.2.34 Như hình 3.2.30, nhưng với chỉ số HSS 117
57 3.2.35 Như hình 3.2.31, nhưng với chỉ số HSS 118
58 3.2.36 Như hình 3.2.30, nhưng với chỉ số TS 119
59 3.2.37 Như hình 3.2.31, nhưng với chỉ số TS 120
60 3.2.38 Chỉ số CRF dự báo của dd theo mô hình GSM vào mùa hè 2007,
2008, 2009 (trên) và mùa đông 2006, 2007, 2008 (dưới) với ba phương pháp DMO, UMOSreg và UMOS
122
61 3.2.39 Như hình 3.2.38, nhưng với chỉ số HSS cho ff 123
62 3.2.40 Dự báo gió hạn 30 giờ theo GMOS với các mô hình GSM, HRM
theo hai phương pháp UMOS và KF Quan trắc cũng được hiển thị
với mục đích so sánh
124
63 3.2.41 HSS dự báo của n vào mùa hè 2007 (trái), 2008 (giữa) và 2009
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương pháp DMO, KF và UMOS
126
64 3.2.42 HSS dự báo của n vào mùa đông 2006 (trái), 2007 (giữa) và 2008
(phải) theo hai mô hình GSM (trên) và HRM (dưới) với ba phương pháp DMO, KF và UMOS
127
65 3.2.43 HSS dự báo của n theo mô hình GSM vào mùa hè 2007, 2008,
2009 (trên) và mùa đông 2006, 2007, 2008 (dưới) với ba phương pháp DMO, UMOSreg và UMOS
129
66 3.2.44 Dự báo lượng mây hạn 12 giờ theo GMOS với các mô hình GSM,
HRM theo hai phương pháp UMOS và KF Quan trắc cũng được
hiển thị với mục đích so sánh
130
67 3.2.45 Dự báo lượng mây hạn 12 giờ theo GMOS với các mô hình GSM,
HRM theo hai phương pháp UMOS và UMOSreg Quan trắc cũng
được hiển thị với mục đích so sánh
131
Trang 111.2 Cơ sở lý thuyết các phương pháp UMOS, KF và GMOS 7
1.2.2 Lọc Kalman 121.2.3 GMOS (Gridded MOS) 15
CHƯƠNG II THIẾT KẾ CÁC HỆ THỐNG DỰ BÁO
2.2.1 Các yếu tố dự báo 202.2.2 Kiểm tra chất lượng thám sát 22
Trang 12CHƯƠNG III KẾT QUẢ VÀ ĐÁNH GIÁ 49 3.1 Khảo sát kết quả thực hiện 49
3.1.1 Khảo sát các phương trình dự báo theo UMOS 49
3.1.1.1 Phương trình dự báo các yếu tố nhiệt độ: tmax, tmin, t và td 49
3.1.1.2 Phương trình dự báo gió và lượng mây 623.1.2 Khảo sát các phương trình dự báo theo lọc Kalman 69
3.2.1 Đánh giá dự báo nhiệt độ 803.2.2 Đánh giá dự báo gió 1053.2.3 Đánh giá dự báo lượng mây 124
KẾT LUẬN VÀ KIẾN NGHỊ 133 TÀI LIỆU THAM KHẢO 135 PHỤ LỤC
Danh sách 132 trạm quan trắc synốp thuộc 9 khu vực được sử
dụng trong nghiên cứu dự báo các yếu tố nhiệt độ, gió và lượng
mây
139
Bảng
I.2
Danh sách các nhân tố dự báo cơ bản từ mô hình HRM và GSM
được sử dụng để đưa vào các sơ đồ tuyển chọn nhân tố cho các
phương pháp UMOS và KF
141
Trang 13MỞ ĐẦU
Kể từ năm 2000, khi mô hình số dự báo thời tiết đầu tiên HRM bắt đầu được đưa vào chạy dự báo tại Việt Nam, cho đến nay có nhiều mô hình khác nhau đang được chạy nghiên cứu hay dự báo thử nghiệm tại một số Trung tâm tính toán của Việt Nam như HRM, Eta tại Trung Tâm Dự báo Khí tượng Thủy văn Trung ương, RAMS, HRM tại Khoa Khí tượng Thủy văn Hải dương học, Đại học Khoa học Tự nhiên, MM5, WRF tại Viện Khoa học Khí tượng Thủy văn và Môi trường Trước
đó, kết quả dự báo dưới dạng số từ Cơ quan khí tượng Nhật Bản (JMA) và Cơ quan khí tượng Úc (BoM) cũng đã nhận được tại Trung Tâm Khí tượng Thủy văn Quốc
gia vào các năm 1997 và 2001 Tuy nhiên, một hệ thống diễn giải dự báo cho các
sản phẩm dự báo từ mô hình vẫn chưa được triển khai tại Việt Nam Tại những trung tâm có sử dụng mô hình dự báo, sản phẩm dự báo cuối cùng vẫn là sản phẩm
dự báo trực tiếp từ mô hình, chưa có bất kỳ hiệu chỉnh nào
Cho đến nay, tập số liệu bề mặt (địa hình, thảm phủ thực vật, sử dụng đất) sử dụng trong tất cả các mô hình hiện có tại Việt Nam đều được lấy từ tập số liệu toàn cầu của Mỹ Tập số liệu này được xác định từ vệ tinh trong những năm 90 Tới thời điểm hiện nay, với tốc độ phát triển kinh tế xã hội của Việt Nam, tập số liệu này đã không còn mô tả tốt một số khu vực trên lãnh thổ Việt Nam khi có những biến động lớn trong khu dân cư tại các đô thị, hay vấn đề sử dụng đất Ngoài ra, các mô hình
sử dụng đều có nguồn gốc từ các nước ngoại nhiệt đới nên khả năng mô phỏng chính xác các quá trình nhiệt đới trên khu vực Việt Nam cũng cần được đặt ra Do
đó, sai số hệ thống tồn tại trong sản phẩm dự báo của mô hình là không thể tránh khỏi Bởi vậy một dự báo thống kê như MOS trở nên rất cần thiết nhằm tăng cường chất lượng dự báo, loại bỏ các sai số hệ thống từ mô hình cũng như điều kiện ban đầu Bên cạnh đó, đòi hỏi ngày càng cao của xã hội trong chất lượng dự báo hạn ngắn cũng thúc đẩy xây dựng dự báo sau mô hình
Trong nỗ lực tăng cường chất lượng dự báo, đã có một nghiên cứu đầu tiên trong nước thử nghiệm lọc Kalman vào hiệu chỉnh dự báo từ mô hình (Võ Văn Hòa
và nnk, 2007) Mặc dù phương trình thống kê mà nhóm tác giả này sử dụng còn đơn giản, kết quả hiệu chỉnh đã cho thấy những cải tiến đáng kể và chỉ ra khả năng phát triển dự báo thống kê sau mô hình ở Việt Nam Tiếp tục theo hướng nghiên cứu của nhóm tác giả trên cũng như hướng nghiên cứu của đề tài cấp Bộ dự báo mưa bằng MOS và ANN vừa hoàn thành (Bùi Minh Tăng và nnk, 2009), đề tài này tiếp cận
bài toán thống kê sau mô hình theo hai hướng: UMOS và lọc Kalman Kết quả dự
báo theo hai phương pháp này sau đó sẽ được chuyển lên lưới nhờ một phương
Trang 14pháp phân tích thích hợp, tạo khả năng dự báo cho một điểm bất kỳ ngoài điểm trạm
(GMOS)
Theo đăng ký trong thuyết minh đề cương, đề tài chỉ sử dụng dự báo từ mô
hình HRM chạy nghiệp vụ tại TTDBTƯ làm nhân tố dự báo Tuy nhiên, chúng tôi
nhận thấy trong hệ thống MOS dự báo mưa định lượng hiện có tại TTDBTƯ (Bùi
Minh Tăng và nnk, 2009), mọi dự báo MOS từ mô hình HRM luôn có sai số lớn hơn dự báo tương ứng từ mô hình GSM Để hướng tới một dự báo tốt hơn, đề tài đã
sử dụng thêm mô hình GSM bên cạnh mô hình HRM Hệ thống đã được xây
dựng độc lập với mô hình dự báo để có thể sử dụng cho bất kỳ mô hình dự báo nào, không phụ thuộc riêng cho từng mô hình
Dựa trên mục tiêu và nội dung công việc đã đăng ký trong bản thuyết minh đề
tài, nội dung của báo cáo tổng kết đề tài được bố cục thành các phần như sau:
Mở đầu
Chương I Tổng quan về các phương pháp UMOS, lọc Kalman và GMOS Chương II Thiết kế các hệ thống dự báo UMOS, lọc Kalman và GMOS Chương III Kết quả và đánh giá
Trang 15CHƯƠNG I TỔNG QUAN VỀ CÁC PHƯƠNG PHÁP UMOS, LỌC KALMAN
VÀ GMOS
1.1 LƯỢC SỬ PHÁT TRIỂN CÁC PHƯƠNG PHÁP THỐNG KÊ SAU MÔ HÌNH
1.1.1 Trên thế giới
Ngay sau khi có sự xuất hiện của dự báo số, các phương pháp thống kê sau
mô hình đã bắt đầu được áp dụng với phương pháp dự báo hoàn hảo PP (Perfect
Prog) do Klein và nnk (1959) đề xuất Sau đó một thập niên, Glahn và Lowry
(1972) đề xuất phương pháp thứ hai MOS (Model Output Statistics) chủ yếu dựa
vào kỹ thuật hồi quy tuyến tính đa biến Ngày nay, MOS được hiểu theo nghĩa rộng hơn với bất kỳ kỹ thuật thống kê nào có thể áp dụng từ hồi quy logistic, phân tích riêng biệt cho đến mạng tế bào thần kinh nhân tạo, giải thuật di truyền MOS theo như Glahn và Lowry (1972) đề xuất được xem là dự báo MOS truyền thống
Hai phương pháp này đều có mục đích làm chính xác hơn các kết quả dự báo
từ mô hình và cùng dựa trên phương pháp hồi quy tuyến tính đa biến Lựa chọn nhân tố dự báo là khác biệt duy nhất giữa hai phương pháp này Trong khi PP sử dụng quan trắc làm nhân tố dự báo thì MOS sử dụng dự báo từ mô hình làm nhân tố
dự báo trong pha traning Khi áp dụng dự báo, PP xem dự báo từ mô hình như quan trắc và đưa vào phương trình dự báo Cho tiết về hai phương pháp này có thể xem trong Wilks (2006) hoặc Bùi Minh Tăng và nnk (2009)
Khi dự báo số bắt đầu cung cấp những trường dự báo có chất lượng hơn
trong thập kỷ 80, một số các trung tâm dự báo lớn trên thế giới đã xây dựng hệ
thống diễn giải dự báo dựa trên phương pháp MOS, cung cấp dự báo tại các điểm
trạm quan trắc khí tượng như Mỹ (Carter và nnk, 1989), Canada (Brunet và nnk, 1988), Hà Lan (Lemcke và Kruizinga, 1988), Úc (Woodcock, 1984), Anh (Francis
và nnk, 1982) Tuy nhiên, vào những năm 90, người ta bắt đầu nhận thấy những hạn chế của MOS, dẫn đến giảm dần sử dụng MOS trong diễn giải dự báo Vấn đề nằm
ở chỗ: khi xây dựng các phương trình hồi quy, tập số liệu mô hình dùng làm nhân tố
dự báo phải đồng nhất Theo đánh giá của Jacks và nnk (1990) để có được một quan
hệ thống kê ổn định, cần ít nhất hai năm số liệu dự báo từ mô hình và thám sát Sau
đó khi sử dụng MOS, các đặc trưng của mô hình dự báo như các sơ đồ tham số hóa,
độ phân giải, cần được giữ nguyên như khi sử dụng mô hình để thiết lập quan hệ thống kê Điều này rõ ràng là một hạn chế lớn của MOS, bởi ta biết rằng từ thập kỷ
90 với sự phát triển nhanh của tốc độ tính toán cũng như các hệ thống quan trắc, các
Trang 16mô hình thường xuyên được cập nhật với độ phân giải ngày càng cao hơn, các sơ đồ tham số hóa tinh tế hơn, trường phân tích chính xác hơn Erikson và nnk (2002) cho
ta thấy sai số hệ thống sẽ xuất hiện khi sử dụng MOS với mô hình được cải tiến Do
đó, khi mô hình có sự thay đổi ta phải đợi ít nhất hai năm mới có thể bắt đầu sử dụng MOS trong dự báo hoặc dự báo lại với mô hình đã thay đổi cho hai năm trước
đó nhằm xác định lại các hệ số hồi quy Với số phương trình hồi quy rất lớn (tại mỗi trạm, cho mỗi biến và mỗi hạn dự báo có một phương trình hồi quy riêng biệt), chi phí cho tái xây dựng hệ thống MOS khi mô hình thay đổi là khá lớn
Có thể lấy thí dụ thông qua hệ thống MOS của Mỹ: Hệ thống MOS đầu tiên được xây dựng cho mô hình LFM vào năm 1976 Đến năm 1990, hệ thống này được thay thế bởi hệ thống MOS cho mô hình NGM (Jacks và nnk, 1990) Từ năm 1993,
mô hình Eta bắt đầu được đưa vào chạy nghiệp vụ tại NCEP thay thế cho mô hình LFM Do mô hình Eta thường xuyên được cải tiến, không có hệ thống MOS nào được xây dựng cho mô hình này trong suốt những năm 90 (Mao và nnk, 1999) Phải đến năm 2002, khi hệ thống dự báo với mô hình Eta đã trở nên ổn định, hệ thống MOS cho Eta mới bắt đầu được thực hiện (Dallavalle và nnk, 2004) Với hệ thống mới này, các tác giả đã tính đến khả năng mô hình thay đổi trong quá trình sử dụng MOS bằng cách lựa chọn một lưới tính cố định cho MOS thường có độ phân giải thô hơn so với độ phân giải mô hình hay làm trơn các nhân tố dự báo (Erikson và nnk, 2002)
Để giải quyết hạn chế này của phương pháp MOS truyền thống khi mô hình liên tục có sự thay đổi, người ta sử dụng các phương pháp thống kê có khả năng tự cập nhật Thông tin sẽ được truyền vào phương trình dự báo ngay khi có những thay đổi trong mô hình dự báo Hiện tại có hai phương pháp cho phép hệ phương trình
dự báo tự cập nhật:
• Phương pháp thứ nhất: Sử dụng lọc Kalman, thay vì cố định các hệ số
hồi quy trong phương trình hồi quy, các hệ số này sẽ được cập nhật hàng ngày theo thời gian (Simonsen 1991, Homleid 1995) Cần chú ý rằng tên gọi lọc Kalman có thể gây hiểu lầm về một phương pháp lọc nhiễu Thực
tế, lọc Kalman là một phương pháp đánh giá tối ưu trạng thái của một hệ thống thể hiện qua các biến trạng thái từ các quan trắc gián tiếp (Grewal
và Andrews, 2001)
• Phương pháp thứ hai: Về cơ bản vẫn sử dụng phương pháp MOS
truyền thống nhưng đưa thêm khả năng tự cập nhật cho MOS thông qua một phương pháp lấy trọng số giữa hai tập dữ liệu cũ và mới khi có thay
đổi trong mô hình (Wilson và Vallée, 2002) với tên gọi UMOS Nếu mô
Trang 17hình không có cải tiến nào đáng kể, UMOS sẽ trở thành phương pháp
MOS thông thường
Ngoài ra, có một số tác giả đề xuất một số phương pháp mới thay thế cho MOS với tập số liệu mẫu ngắn hơn (Mao và CS, 1999) hoặc phương pháp phi tuyến thông qua mạng tế bào thần kinh có khả năng tự cập nhật (Yuval và Hsieh, 2003) Cần chú ý rằng khi sử dụng các phương pháp phi tuyến thay thế cho phương pháp hồi quy tuyến tính, vấn đề thay đổi của mô hình khi sử dụng MOS vẫn không được giải quyết
Cả hai phương pháp này cùng xuất hiện những năm đầu thập kỷ 90 và nhanh chóng được các trung tâm dự báo trên thế giới triển khai ứng dụng, đặc biệt
là lọc Kalman Được đề xuất bởi các tác giả Bắc Âu, lọc Kalman nhanh chóng được triển khai thực hiện trước tiên tại các nước này như Đan Mạch (Simonsen, 1991), Nauy (Homleid, 2004) hay Iceland (Crochet, 2004) Sau đó phương pháp này dần được các nước khác tại châu Âu sử dụng như Pháp (Météo France, 2002), Đức (Haalman, 2003), Rumani (Diaconu, 2002), Hy Lạp (Golanis và Anadranistokis, 2002), Tại các nước Đông Á, lọc Kalman được ứng dụng rất nhiều trong hệ thống diễn giải dự báo hạn ngắn tại Cơ quan khí tượng Nhật Bản (JMA) và Cơ quan khí tượng Hàn quốc (KMA) Từ năm 1996, JMA chủ yếu sử dụng lọc Kalman trong diễn giải kết quả dự báo từ mô hình cho mọi yếu tố khí tượng cơ bản: mưa, gió, nhiệt độ (JMA, 2006) Tại Hàn Quốc, KMA dự báo cho nhiệt độ cho 40 điểm trạm tại Hàn Quốc cùng 32 điểm khác tại CHDC ND Triều Tiên, Trung Quốc và Nhật Bản theo phương pháp lọc Kalman và một biến thể của nó là DLM (Joo, 2006)
Riêng với phương pháp UMOS, dù được phát triển tại Mỹ nhưng lại được ứng dụng
tại Canada (Wilson và Vallée, 2002, 2003) Hiện tại, Mỹ vẫn chủ yếu sử dụng
phương pháp MOS truyền thống nhưng đã bắt đầu triển khai theo hai hướng GMOS
và EMOS
Hiện tại, MOS đang được tiếp tục phát triển theo hai hướng mới là GMOS (dự báo thống kê sau mô hình trên lưới) và EMOS (dự báo thống kê sau mô hình tổ
hợp) Nếu như theo phương pháp MOS, thông thường ta chỉ xây dựng phương trình
dự báo tại trạm, sau đó cũng đưa ra dự báo tại điểm trạm thì GMOS hướng đến sử
dụng MOS dự báo trên lưới (Dallavalle và Glahn, 2005) Nếu như thám sát được cho trên lưới thì GMOS chính là phương pháp MOS thông thường Nếu các thám sát phân bố không đều, sau khi có dự báo MOS tại trạm, sử dụng các kỹ thuật phân tích hai chiều như Cressman hay Barnes người ta sẽ chuyển các dự báo này về lưới
Như vậy, GMOS có thể cho ta dự báo từ MOS tại bất kỳ điểm nào, không cố định tại các điểm trạm như MOS, đây chính là lợi thế của phương pháp này Với
Trang 18EMOS, thay vì sử dụng MOS cho một mô hình, người ta sử dụng các phương pháp
thống kê dựa trên dự báo từ nhiều mô hình (Wilks và Hamill, 2007) So với MOS,
EMOS không cần sử dụng một tập số liệu mẫu dài lại có khả năng đưa ra được
phân bố xác suất của biến dự báo Hơn nữa, phương trình dự báo sử dụng chỉ cần lấy trung bình đơn giản đã có thể đem lại kết quả dự báo tốt tương đương với MOS
Có thể nói EMOS sẽ là hướng phát triển mạnh trong tương lai
1.1.2 Tại Việt Nam
Việt Nam hiện mới chỉ có khả năng áp dụng các phương pháp thống kê sau
mô hình đã được nghiên cứu trên thế giới vào bài toán cụ thể của mình, chưa có khả năng đóng góp nghiên cứu về mặt phương pháp luận Trước năm 1997, trong nghiệp vụ dự báo hàng ngày, chủ yếu sử dụng phương pháp synop để dự báo hình thế thời tiết Một số các công cụ trên cơ sở phương pháp thống kê truyền thống cũng được xây dựng, nhưng phần lớn là những phương trình hồi qui đơn giản áp dụng cho một vài điểm, chỉ để dự báo một số nhân tố truyền thống như mưa, nhiệt
độ, vận tốc gió, và phần lớn là áp dụng cho những dự báo hạn vừa và dài (Nguyễn Văn Tuyên, 1988, 1999)
Từ năm 1997 trở lại đây, trên cơ sở hợp tác song phương, Trung Tâm dự báo KTTV Trung ương đã thu được một số sản phẩm dự báo của các mô hình số từ JMA, cơ quan khí tượng Úc (BoM) và một vài Trung tâm khí tượng khác chủ yếu dưới dạng bản đồ Đến năm 2002, tại TTDDBTƯ bắt đầu chạy nghiệp vụ mô hình
số phân giải cao HRM Trong các năm từ 2001 đến 2002 tại TTDBTƯ đã tiến hành
thực hiện đề tài “Nghiên cứu ứng dụng phương pháp dự báo lượng mưa dựa trên
sản phẩm mô hình dự báo số trị của Nhật” Tuy nhiên, đây không phải là phương
pháp thống kê mà chỉ đơn thuần là một mô hình tính toán lượng mưa dẫn xuất dựa trên các biến dự báo từ mô hình thông qua một vài phương trình vật lý (Đỗ Lệ Thủy
và nnk, 2002)
Sau những năm đặt trọng tâm phát triển mô hình dự báo từ năm 2000, những năm gần đây, các nghiên cứu về dự báo thống kê sau mô hình mới bắt đầu được triển khai với công trình đầu tiên của Bùi Minh Tăng và nnk (2009) Các tác giả này đã áp dụng một số kỹ thuật thống kê theo nghĩa MOS mở rộng (không đơn thuần là hồi quy tuyến tính) vào dự báo yếu tố lượng mưa 24 giờ đầu từ mô hình số trị Các kết quả thu được là rất đáng khích lệ dù nghiên cứu có nhược điểm xem như
mô hình dự báo không thay đổi theo thời gian Nhược điểm này có thể không nghiêm trọng với các trung tâm dự báo lớn khi có thể chạy lại mô hình sau khi thay đổi nhưng với Việt Nam sẽ là một vấn đề lớn do Việt Nam phụ thuộc vào dự báo từ
mô hình toàn cầu của các trung tâm khác Các phương pháp dự báo sau mô hình có
Trang 19khả năng tự cập nhật như UMOS, lọc Kalman hay tổ hợp như EMOS hứa hẹn sẽ
đem lại những giải pháp cho vấn đề này và Việt Nam nên đi theo các hướng nghiên cứu này nếu muốn xây dựng hệ thống diễn giải dự báo Trên thực tế trước đó, Võ Văn Hòa và nnk (2007) đã có một nghiên cứu nhỏ thử nghiệm lọc Kalman hiệu chỉnh dự báo nhiệt từ mô hình
1.2 CƠ SỞ LÝ THUYẾT CÁC PHƯƠNG PHÁP UMOS, KF VÀ GMOS
1.2.1 UMOS
Theo như cách tiếp cận truyền thống của MOS (hồi quy tuyến tính đa biến) không dễ để có thể đưa ý tưởng cập nhật vào phương pháp, nếu chỉ nhìn MOS ở khía cạnh toán học quen thuộc của nó Bài toán hồi quy tuyến tính đa biến MOS sử dụng có dạng như sau: xác định tập p+1 các hệ số tự do ai của phương trình dự báo yếu tố Y theo tập p các nhân tố dự báo Xi:
Y= a0 + a1X1+ … + apXp (1.2.1)
từ tập số liệu quá khứ và áp dụng dự báo tương lai Các hệ số ai sẽ được xác định theo phương pháp bình phương tối thiểu dựa trên tập số liệu training dung lượng mẫu n Viết dưới dạng ma trận, công thức tính vector hệ số ai có dạng sau:
a = (XTX)-1XTy (1.2.2) trong đó y là vector yếu tố dự báo kích thước n, X là ma trận nhân tố dự báo kích thước (p+1)×n, với mỗi vector cột, tương ứng vector nhân tố dự báo kích thước n MOS không cố định trước tập p các nhân tố mà thực hiện hồi quy từng bước với p tăng dần từ 1 cho đến một giá trị nào đó thỏa mãn tiêu chuẩn dừng Tại mỗi bước, bài toán hồi quy mà MOS thực hiện hoàn toàn đồng nhất với mô tả toán học ở trên
Nếu thực hiện như đã mô tả ở trên, khi muốn cập nhật phương trình dự báo 1.2.1 với tập số liệu training đã được mở rộng thêm từ n lên n+m (m là số ngày mới tích lũy thêm dữ liệu), toàn bộ quá trình phải được thực hiện lại từ đầu với hồi quy từng bước và tại mỗi bước phải giải các hệ phương trình tuyến tính 1.2.2 Với tập các nhân tố có thể vào khoảng 200, tại mỗi bước ta phải giải 200 hệ phương trình tuyến tính 1.2.1 Thông thường, mỗi phương trình dự báo sau khi thỏa mãn điều kiện dừng có khoảng 10 nhân tố, số lần giải phương trình sẽ là 2000 lần Nhân lên với số trạm cần cập nhật, chi phí tính toán cho mỗi lần cập nhật sẽ rất lớn Với tốc
độ máy tính hiện nay, khối lượng tính toán như trên có thể giảm thiểu nếu thực hiện tính toán song song cho nhiều trạm tại cùng một thời điểm Khó khăn thực sự nằm ở phương thức thiết kế, lưu trữ và sử dụng số liệu cho bài toán cập nhật
Với những vấn đề cố hữu như trên, các trung tâm thường không thực hiện cập nhật phương trình dự báo theo ngày hay theo tháng mà thực hiện một lần duy nhất rồi áp dụng cho các năm kế tiếp hoặc cập nhật theo từng năm Với dung lượng
Trang 20tập training đủ dài, cách thực hiện như vậy vẫn đảm bảo một kết quả tốt do phương trình dự báo sẽ ổn định trên một tập dữ liệu đủ dài Tất nhiên, nếu tận dụng được tập
số liệu mới để tăng dung lượng tập training, phương trình dự báo thu được sẽ có chất lượng tốt hơn
Với các nghiên cứu của mình, Ross (1987, 1989, 1992) và sau đó là Wilson
và Vallee (2002) đã chỉ ra rằng vẫn có thể thực hiện cập nhật cho MOS mà chi phí tính toán không lớn nếu thực hiện theo cách thông thường Ý tưởng cập nhật được hình thành dựa trên biểu diễn lại dạng toán học của phương pháp hồi quy tuyến tính
đa biến Từ công thức (1.2.2) dễ thấy vector a được xác định thông qua ma trận
XTX kích thước (p+1)×(p+1) và vector XTy kích thước p+1 Mỗi phần tử Mij của
ma trận XTX chỉ đơn giản là tích vô hướng giữa hai vector nhân tố dự báo kích thước n thứ i và j, trong khi mỗi phần tử Vi của vector XTy là tích vô hướng giữa vector nhân tố dự báo kích thước n thứ i với vector yếu tố dự báo kích thước n
Mij=∑
=
n 1 k
k ik k
Y
X (1.2.4) Các phần tử này có đặc tính cộng, nghĩa là khi dung lượng mẫu tăng lên n+1, các phần tử Mij hay Vi có thể xác định rất đơn giản bằng cách cộng thêm số hạng X(i,n+1)X(j,n+1) và X(i,n+1)Y(n+1) vào giá trị trước đó mà không cần phải tính lại toàn bộ cho n+1 số hạng Khả năng cập nhật rõ ràng đã thể hiện ngay trong phân tích trên Nếu muốn cập nhật, thay vì phải lưu chuỗi dữ liệu Xi hay Y với kích thước n tăng lên từng ngày, bài toán sẽ đơn giản hơn, nếu ta chỉ cần lưu các phần tử
Mij và Vi và thay đổi giá trị của chúng từng ngày bằng cách cộng thêm một số hạng
mới vào như trên Cách thực hiện này sẽ tiết kiệm dung lượng lưu trữ với một ma
trận và một vector kích thước không thay đổi (p+1)×(p+1) và p+1 so với ma trận nhân tố dự báo và vector yếu tố dự báo có dung lượng n tăng dần Các hệ số ai cuối cùng vẫn hoàn toàn được xác định theo công thức (1.2.2) của bài toán hồi quy tuyến tính đa biến
Tuy nhiên, bằng cách thay đổi điểm nhìn như vậy, phương pháp mới đòi hỏi tập các nhân tố p phải được xác định trước Đây là chi phí phải trả cho việc đưa ý tưởng cập nhật vào MOS Điều này cũng đồng nghĩa quá trình hồi quy từng bước sẽ không được thực hiện và các nhân tố dự báo phải cố định giống như trong phương pháp lọc Kalman Một quá trình sơ tuyển cần được thực hiện tuyển chọn trước các nhân tố này Thông thường p vào khoảng 10 và dung lượng lưu trữ được sử dụng cập nhật phương trình dự báo cho một trạm sẽ rất nhỏ với 132 số thực (11×11+11)
Trang 21Cách thức thực hiện này chính là UMOS dưới dạng đơn giản nhất và nếu so với MOS truyền thống thì khối lượng tính toán của nó là không đáng kể
Trong thực tế, khối lượng tính toán còn giảm hơn nữa do không cần thiết phải giải hệ phương trình (1.2.2) từng ngày, do các phương trình dự báo MOS có tính ổn định cao Một thay đổi nhỏ trên thang thời gian ngày của ma trận XTX sẽ
không có tác động tới giá trị của tập hệ số a Phương trình (1.2.2) chỉ cần giải trên
quy mô tuần hoặc quy mô tháng và công việc hàng ngày chỉ liên quan đến cập nhật
ma trận XTX và vector XTY bằng cách cộng thêm một số hạng thích hợp vào mỗi phần từ Khối lượng tính toán chỉ tăng lên khi ta giải hệ phương (1.2.2) vào thời gian đã định trước theo tháng hay tuần
Hai ma trận XTX và vector XTY có tầm quan trọng đặc biệt trong phương
pháp UMOS Nếu coi vector yếu tố dự báo Y tương đương như các vector nhân tố
dự báo khác thì rõ ràng với cùng bản chất tích vô hướng, phần tử Vi của XTY không
có gì khác so với phần tử Mij của XTX Do đó, để đơn giản, thay vì phải tách biệt và lưu trữ hai ma trận và vector, người ta ghép vector XTY vào cột cuối ma trận XTX
và gọi chung là ma trận SSCP (Sums of Squares and Cross Products) với kích thước
(p+2)×(p+1) Như tên gọi, SSCP thể hiện rõ bản chất tích vô hướng của nó Tóm
lại, thay vì cách tiếp cận hồi quy tuyến tính đa biến, UMOS đặt trọng tâm vào ma
trận SSCP và thực hiện giải hệ phương trình tuyến tính trên ma trận này để xác định tập hệ số ai
Cách tiếp cận này hoàn toàn trùng với phương pháp MOS truyền thống (tất nhiên trong trường hợp tập p nhân tố dự báo đã được cố định trước) và chỉ trở nên khác biệt nếu mô hình dự báo thay đổi Nếu vẫn thực hiện theo MOS truyền thống, khi mô hình thay đổi ta phải đợi một khoảng thời gian đủ dài để có thể phát triển một phương trình dự báo mới trong khi không thể sử dụng phương trình dự báo cũ
Dự báo sau mô hình sẽ không thể thực hiện trong khoảng thời gian đợi này và cách giải quyết duy nhất có thể là chạy lại mô hình mới với thời gian trước đây nhằm xây dựng lại MOS Tuy nhiên, khi thay đổi điểm nhìn sang ma trận SSCP, vấn đề sẽ được giải quyết đơn giản hơn nếu xác định ma trận SSCP trong thời gian chuyển đổi giả định một quan hệ tuyến tính chuyển dần từ ma trận SSCP cũ sang ma trận SSCP mới và kết thúc khi mô hình mới đã có được một chuỗi dự báo đủ dài Giả thiết này không có cơ sở toán học (không tương đương với hồi quy tuyến tính đa biến) nhưng có thể chấp nhận về mặt ứng dụng và hiệu quả có thể có được trong giai đoạn chuyển đổi mô hình
Như vậy, khi mô hình thay đổi, ma trận SSCP sẽ được tính thông qua một phương pháp lấy trọng số giữa ma trận SSCP cũ và mới
Trang 22SSCP = woSSCPo + wnSSCPn (1.2.5) Wilson và Vallee (2002) đưa ra một công thức thực nghiệm cho trọng số này dưới dạng
( ) ( ( ) )2
max min
2 max max
N N
N N w
w = − n n
với Nn ≤ Nmax (1.2.6)
wn=1, w0=0 với Nn > Nmax trong đó wn là trọng số cho ma trận SSCP mới, wo: trọng số cho ma trận SSCP cũ,
Nn: dung lượng mẫu từ tập số liệu mới, No: dung lượng mẫu từ tập số liệu cũ, Nmin: dung lượng mẫu tối thiểu mà khi vượt quá mô hình mới bắt đầu tác động tới ma trận SSCP, Nmax: dung lượng mẫu tối đa mà khi vượt quá mô hình cũ được xem như không còn tác động tới ma trận SSCP, wmax: tham số điều khiển Dạng hàm này được hai tác giả lựa chọn trên nguyên tắc:
• Kết quả từ mô hình cũ không ảnh hưởng đến phương trình dự báo mới sau một khoảng thời gian đủ dài
• Mô hình ngay sau khi thay đổi sẽ không tác động tới giá trị của ma trận SSCP cho tới khi tích lũy được một dung lượng tối thiểu
Dạng hàm trọng số này được cho trên hình 1.2.1
Hình 1.2.1: Đồ thị hai chiều và ba chiều của hàm trọng số cho ma trận SSCP mới và SSCP
cũ theo dung lượng mẫu (theo Wilson và Vallee, 2002)
So với lọc Kalman, MOS truyền thống có điểm mạnh nằm ở khả năng phân mùa dự báo do chất lượng dự báo của mô hình cũng có đặc tính phân mùa Phân
mùa dự báo cũng có thể thực hiện dễ dàng cho UMOS thông qua hai tập p nhân tố
dự báo khác nhau cho hai mùa Để làm trơn quá trình chuyển mùa, UMOS giống
như MOS có thể cập nhật thêm một số ngày của mùa còn lại trong thời đoạn chuyển mùa Nếu tập nhân tố dự báo như nhau cho cả hai mùa, Wilson và Vallee (2002) sử
Trang 23dụng thêm một sơ đồ trọng số chuyển mùa cho ma trận SSCP giữa hai mùa đông và
hè với trọng số có dạng hàm bậc thang (2/3,1/3), (1/2,1/2) cho tới (1/3,2/3) Các trọng số này còn được điều chỉnh bởi dung lượng mẫu ma trận SSCP mỗi mùa nhằm loại bỏ khả năng SSCP chịu tác động nhiều hơn bởi ma trận SSCP tương ứng với mùa có dung lượng lớn hơn
( ns ns s s)
b a
b a
s w SSCP w SSCP N
N N w
SSCP=∑ min( , ) + 0 0
=
(1.2.7) với chỉ số s chạy từ a đến b tương ứng với hai mùa, ws là trọng số mùa cho mùa s,
wos và wns: trọng số như trong (1.2.6), Ns mà cụ thể hơn Na và Nb là dung lượng mẫu của mùa tương ứng
Như mô tả ở trên, nếu UMOS thực hiện phân mùa với hai tập nhân tố khác nhau, quá trình cập nhật của UMOS sẽ tách thành hai quá trình độc lập riêng cho
mùa đông và mùa hè Phương pháp thực hiện như vậy so với nguyên tắc liên tục tự cập nhật sẽ bị gián đoạn tại hai thời điểm chuyển mùa Nếu thực hiện nguyên tắc
này, UMOS phải cố định tập nhân tố dự báo cho cả hai mùa và quá trình phân mùa
theo nhân tố dự báo không được thực hiện theo phương thức phân mùa của MOS truyền thống Ngoài ra, tập nhân tố cố định thích hợp cho mô hình cũ, nhưng có thể không thích hợp cho mô hình mới cũng có thể dẫn đến chất lượng dự báo giảm Để
giải quyết vấn đề, UMOS sẽ được thực hiện phức tạp hơn tương tự như quá trình
hồi quy từng bước của MOS truyền thống
Tư tưởng của phương pháp có thể hiểu được nếu quan sát công thức 1.2.2 khi ta có thể rút ra từ ma trận XTX một ma trận con tương ứng vector XTY một vector con chỉ chứa p’ biến mà ta quan tâm từ p biến tổng thể, sau đó giải hệ phương trình có dạng tương tự như 1.2.2 nhưng cho ma trận con và vector con này
để tìm các hệ số ai cho tập p’ biến này Có thể rút ra nhiều tập p’ biến khác nhau từ tập p và đây là cơ sở để thực hiện hồi quy từng bước Ta sẽ bắt đầu từ p’ bằng 1 và giải hệ phương trình dạng 1.2.2 trên mỗi tập con với một phần tử có thể để lựa chọn nhân tố đầu tiên, sau đó tiếp tục tăng p’ và dừng cho đến khi đạt được một tiêu chuẩn dừng nào đó Theo phương pháp này, tập p các nhân tố dự báo ban đầu sẽ không cần cố định và sử dụng trong phương trình dự báo giống như lọc Kalman Ta chỉ cần chọn ra một bộ p nhân tố đủ lớn các nhân tố có khả năng trở thành nhân tố
dự báo nhưng cũng không quá lớn để duy trì một ma trận SSCP có dung lượng nhỏ Tập con các nhân tố được tuyển chọn cho phương trình dự báo sẽ thay đổi khi chuyển từ tuần sang tuần, tháng sang tháng, mùa sang mùa hoặc từ mô hình cũ sang
mô hình mới Phương trình dự báo do đó sẽ biến đổi liên tục, “trơn” khi chuyển mùa hay chuyển đổi mô hình
Trang 24Tuy nhiên, do thực hiện tuyển chọn nhân tố, cách thực hiện này đòi hỏi phải
có một tập dữ liệu training Như vậy, để làm trơn quá trình chuyển mùa hay chuyển đổi mô hình, bên cạnh khối lượng tính toán tăng thêm, dung lượng lưu trữ cũng tăng thêm Tất nhiên, nếu so với MOS truyền thống thì chi phí này vẫn nhỏ hơn Với tập
dữ liệu training cần chú ý trong thời gian chuyển đổi mô hình, UMOS sẽ không
thực hiện lưu tập training với độ dài n tăng dần từng ngày như MOS truyền thống
mà cố định độ dài tập traning bằng Nmax trong công thức 1.2.6 Đây là dung lượng mẫu tối đa để một phương trình dự báo khi xây dựng theo MOS truyền thống ổn định
1.2.2 Lọc Kalman
Phương pháp lọc Kalman (gọi tắt là KF - Kalman Filter), được đặt theo tên tác
giả của bộ lọc, ra đời năm 1960 trong công trình của R E Kalman mô tả một bộ lọc
đệ quy cho phép đánh giá trạng thái của một hệ động lực tuyến tính Từ đó đến nay,
cùng với sự phát triển của tính toán số, KF đã trở thành một chủ đề nghiên cứu phát
triển rất nhanh với nhiều ứng dụng trong các ngành kỹ thuật công nghệ như tự động
hóa, định vị, viễn thông và nhiều lĩnh vực khác Từ phương pháp KF tuyến tính ban
đầu, ngày nay người ta đã nghiên cứu và áp dụng nhiều phương pháp phái sinh như
KF phi tuyến hay còn gọi là KF mở rộng (EKF-Extended KF), UKF (Unscented
KF), PKF (Particle KF), EnKF (Ensemble KF), FKF (Fuzzy KF), BKF (Bayesian
KF)
Một cách khái quát, KF là một tập hợp các phương trình toán học mô tả một
phương pháp đệ quy cho phép đánh giá trạng thái ẩn của một hệ động lực với sai số thấp nhất từ số liệu đo gián tiếp về hệ này, thừa nhận quan trắc và các quy luật mô
tả hoạt động của hệ tồn tại một độ bất định nào đó Từ hệ động lực ở đây có thể áp dụng rất đa dạng trong thực tế như quá trình chuyển động của một vệ tinh, sự phát triển của một nền kinh tế hay chuyển động của khí quyển Hai ví dụ sau đặc trưng
cho các hệ động lực phi tuyến và KF có những gần đúng để thực hiện đánh giá
trạng thái của các hệ động lực này Tuy nhiên, phần trình bày ở đây sẽ chỉ giới hạn
ở các hệ động lực tuyến tính
Một hệ động lực tuyến tính được đặc trưng bởi vector trạng thái x kích thước
N, cung cấp thông tin cần thiết để có thể mô tả hệ Vector này biến đổi theo thời gian theo quy luật tuyến tính và thể hiện mặt động lực của hệ thống:
1 1
Trang 25A chỉ là gần đúng Ma trận A kích thước N×N có tên gọi ma trận chuyển dịch trạng thái mang thông tin về quy luật hoạt động của hệ thống Ma trận B được đưa vào phương trình trên đặc trưng cho các quá trình bên ngoài điều khiển hệ thống đang xét tác động thông qua vector điều khiển uk-1 Các bài toán KF thông thường không
Để bài toán xác định, ta cần giả định một số thông tin cho hai vector sai số
wk và vk Lọc Kalman xem đây là hai vector ngẫu nhiên, độc lập và tuân theo phân
bố Gauss với trung bình bằng 0 và ma trận hiệp biến (covariance) lần lượt là Q và R:
) , 0 (
~
) , 0 (
~
R N v
Q N w
k
k (1.2.10) Ngoài ra, để đơn giản hóa các ma trận Q, R, A, H đã được bỏ qua chỉ số dưới nhưng thực tế có thể biến đổi theo thời gian Để đánh giá tối ưu trạng thái xk với zk
đo được, lọc Kalman sẽ cực tiểu hóa hiệp phương sai của sai số đánh giá
Như vậy, ở bước thứ k, sử dụng phương trình (1.2.8) ta dễ dàng thu được đánh giá tiên nghiệm (đánh giá sơ bộ) −
k
xˆ của vector trạng thái x từ các thông số của bước trước đó Sau đó, khi có quan trắc zk, ta cần điều chỉnh lại đánh giá tiên nghiệm sao cho đánh giá hiệu chỉnh thu được phù hợp với quan trắc hiện có Đánh giá này có tên gọi đánh giá hậu nghiệm và được ký hiệu bởi xˆk Đánh giá tiên nghiệm và hậu nghiệm sẽ có sai số:
k k k
k k k
xˆ x e
xˆ x e
) e e ( E P
T k k k
T k k k
=
= − −
−
(1.2.12) với E là toán tử trung bình
Kalman giả định xˆk là một hàm tuyến tính của −
k
xˆ và zk và thu được công thức sau dưới dạng ma trận:
Trang 26k k
Cuối cùng, để có thể thực hiện quá trình đệ quy của KF, ta cần thêm giá trị
ban đầu của ˆx0 và P0 Như vậy, khi thực hiện lọc Kalman sẽ bao gồm hai bước sau:
1 Dự báo (Predict): bước này đòi hỏi phải biết giá trị tại bước trước đó của
1
k
xˆ − và Pk-1 Dựa trên hai giá trị này, −
−1 k
xˆ và −
−1 k
P sẽ được xác định
2 Hiệu chỉnh: −
−1 k
xˆ và −
−1 k
P sẽ được hiệu chỉnh dựa trên quan trắc zk Cụ thể, Kk
sẽ được tính theo (1.2.14), dựa vào đó xác định xˆk và Pk
Quá trình này được minh họa trên hình 1.2.2
Hình 1.2.2: Sơ đồ mô tả bước dự báo và hiệu chỉnh của lọc Kalman
Lọc Kalman bắt đầu được áp dụng vào dự báo sau mô hình tại ECMWF từ các công trình nghiên cứu của Simonsen (1991) và Persson (1991) Các nghiên cứu sau
Trang 27đó nói chung không có gì khác so với ý tưởng ban đầu của hai tác giả này Hệ động lực tuyến tính trong trường hợp này được mô tả thông qua bộ các hệ số ai của phương trình dự báo (1.2.1) Đây chính là vector trạng thái của hệ thống Theo cách nhìn này, hệ động lực mà ta quan tâm có thể hiểu như một dự báo viên với các tham
số đặc trưng ai Ma trận A của hệ này được xác định đơn giản bằng ma trận đơn vị I Điều khiển bên ngoài bởi B không được xét đến ở đây Vector quan trắc zk do đó sẽ
là quan trắc y của bài toán hồi quy (1.2.1) Theo ngôn ngữ của KF, ta cần xác định
các hệ số ai trong khi chỉ có các quan trắc y, trong đó, quan trắc y quan hệ với các
hệ số ai theo công thức (1.2.1) Điều này có nghĩa các nhân tố dự báo sẽ đóng vai trò các phần tử của ma trận H Bây giờ, vấn đề còn lại là xác định dạng của ma trận
Q và R của hai sai số ngẫu nhiên w và v Chất lượng dự báo của KF hoàn toàn được
quyết định bởi hai ma trận này Hai ma trận này thường được giả định có dạng đường chéo với các phần tử trên đường chéo có giá trị như nhau
1.2.3 GMOS (Gridded MOS)
MOS mặc dù có thể đưa ra dự báo chất lượng tốt, sai số nhỏ nhưng như nhận xét của nhiều dự báo viên những dự báo này chỉ có thể sử dụng tại điểm trạm Vấn
đề dự báo viên quan tâm hơn chính là trường dự báo trên lưới, qua đó có thể quan sát các hình thế thời tiết một cách trực quan MOS truyền thống đưa ra hai giải pháp cho vấn đề này: i) nếu trường quan trắc được cho trên lưới, hiển nhiên dự báo MOS tại trạm đồng nghĩa với dự báo MOS trên lưới, ii) xây dựng các phương trình dự báo khu vực, sau đó áp dụng các phương trình khu vực cho các điểm lưới thuộc khu vực đang xét
Theo cách thứ nhất, vấn đề nằm ở chỗ không nhiều trường quan trắc có thể cung cấp số liệu trên lưới Có thể kể ra đây một số trường như trường mây từ ảnh mây vệ tinh, trường mưa từ radar có thể thỏa mãn điều kiện này Tuy nhiên, giá trị quan trắc viễn thám thường không có độ chính xác cao như quan trắc tại các trạm synop Với các biến còn lại, mạng lưới quan trắc rõ ràng không thể đáp ứng do vị trí đặt trạm phụ thuộc vào nhiều nhân tố khác ngoài khí tượng Tất nhiên, ta vẫn có thể cung cấp trường quan trắc trên lưới bằng cách phân tích quan trắc tại trạm về lưới nhưng chất lượng thực sự của trường phân tích, đặc biệt tại các vùng có mật độ trạm thưa, không thể khẳng định chắc chắn và điều này có thể làm giảm chất lượng dự báo của MOS trên lưới
Phương án thứ hai có hai nhược điểm Thứ nhất, so với dự báo MOS trên trạm, dự báo MOS khu vực có chất lượng dự báo thấp hơn Thứ hai, tại biên của hai khu vực khác nhau, sẽ có gián đoạn trong trường dự báo do hai phía sử dụng hai phương trình khu vực khác nhau
Trang 28Trong phương án thứ nhất đã nêu trên, phương án thực hiện phân tích quan trắc trên lưới trước khi xây dựng các phương trình MOS đã được đề xuất Nếu so với MOS tại trạm, phương án này có một chi phí tính toán lớn hơn rất nhiều bởi số
lượng rất lớn các điểm lưới GMOS sử dụng ý tưởng theo phương pháp này nhưng
đảo ngược vấn đề Thay vì phân tích quan trắc rồi xây dựng phương trình trên lưới,
GMOS thực hiện ngược lại xây dựng phương trình tại trạm, dự báo rồi phân tích
trên lưới So với các phương pháp phân tích thông thường thì GMOS chỉ khác biệt
ở chỗ sử dụng số liệu dự báo tại trạm để phân tích thay vì số liệu quan trắc như các
hệ thống phân tích thông thường
Như vậy nói một cách chính xác, GMOS thực chất là một phương pháp phân tích hơn là một phương pháp dự báo sau mô hình Liên hệ với MOS của GMOS
thông qua các giá trị dự báo tại trạm bởi MOS Tất nhiên các giá trị này cũng có thể
lấy từ UMOS hay KF Có nhiều phương pháp phân tích khác nhau từ đơn giản như
hiệu chỉnh liên tiếp tới phức tạp như 3DVAR Trong phần này, đề tài giới thiệu một biến thể của phương pháp hiệu chỉnh liên tiếp có tên gọi BCDG được NCEP áp dụng (Glahn và nnk, 2009) Đề tài cũng sẽ áp dụng phương pháp này cho khu vực Việt Nam
Phương pháp hiệu chỉnh liên tiếp trong phân tích khách quan được Bergthorssen và Doos (1955) đề xuất đầu tiên và Cressman (1959) phát triển thêm sau đó Trên cơ sở này, Glahn và nnk (2009) đã thực hiện một số thay đổi khi áp dụng cho dự báo sau mô hình và đặt tên phương pháp là BCDG với ký tự G được thêm vào phía sau nhằm phân biệt với phương pháp cũ BCD Bốn chứ cái này là bốn ký tự đầu tiên của các tác giả chính Về mặt toán học, phương pháp hiệu chỉnh liên tiếp BCD có dạng:
[ ]
j
N 1 j
j 1 i j 1
i i
w
o ) f H w f
= (1.2.15) trong đó fi là giá trị phân tích tại một điểm lưới nào đó ở bước thứ i, wj là trọng số cho quan trắc thứ j xung quanh điểm lưới đang xét và H là toán tử nội suy từ trường phân tích về điểm quan trắc Với các yếu tố bề mặt cơ bản đang xét, toán tử H được lấy bằng toán tử nội suy tuyến tính hoặc đơn giản hơn bằng cách lấy điểm gần nhất Trọng số w được xác định từ công thức sau:
d R
d R w
+
−
= (1.2.16) với R là bán kính ảnh hưởng, mà vượt quá khoảng cách này quan trắc không còn ảnh hưởng đến điểm lưới đang xét (trọng số bằng 0), d là khoảng cách thực từ quan trắc đến điểm lưới
Trang 29Theo như (1.2.15), để thực hiện BCD, ta cần có giá trị phán đoán ban đầu f0 Giá trị này có thể xác định từ các dự báo khu vực như đã nói ở trên hay đơn giản lấy trung bình của các điểm trạm Hai tham số khác cần được cung cấp gồm: số lần quét
và bán kính ảnh hưởng trong mỗi lần quét Thông thường, bán kính ảnh hưởng sẽ được giảm dần theo số lần quét để sau mỗi bước hiệu chỉnh liên tiếp các quá trình quy mô nhỏ hơn có thể được đưa vào trường phân tích Liên quan tới quy mô, độ phân giải lưới phân tích cũng cần được xác định thích hợp cho phân bố của điểm trạm đang xét Độ phân giải lưới và bán kính quét có một quan hệ nhất định với nhau
So với BCD, Glahn và nnk (2009) trong BCDG đưa thêm hai nhân tố mới:
• Phân biệt giữa các điểm đất, biển và nước Điều này có nghĩa BCDG thực hiện trên ba hệ thống phân tích khác nhau trên cùng một lưới phân tích
• Hiệu chỉnh biến đổi của trường phân tích theo độ cao Hiệu chỉnh này chủ yếu được thực hiện cho trường nhiệt độ với biến thiên theo độ cao được xác định trực tiếp từ số liệu trên trạm cho mỗi điểm trạm
Để thực hiện hai nhân tố mới này, BCDG cần sử dụng thêm trường mặt nạ đất, biển, nước và trường địa hình trên lưới phân tích BCDG thực hiện nhân tố đầu tiên tương tự như thực hiện đồng thời ba hệ thống phân tích BCD đã nói ở trên Phân tích cho một loại điểm chỉ sử dụng quan trắc với cùng loại điểm tương ứng Thực hiện nhân tố thứ hai, BCDG sử dụng khái niệm biến đổi theo địa hình VCE
(Vertical Change of Elevation)
VCE tại một điểm trạm A với quan trắc OA (thực tế là dự báo từ MOS) và độ cao địa hình EA có thể xác định từ điểm trạm bên cạnh B tương ứng với OB và EB
theo công thức
A B
A B
E E
O O VCE
−
−
= (1.2.17) Trong trường hợp xung quanh A có nhiều trạm hơn một trạm Bi, công thức trên được hiệu chỉnh lại như sau:
A B
) E E (
) O O ( VCE
Trang 30đang xét và không giả định trước một giá trị như 6.5°/1km ví dụ với biến nhiệt độ Đây là một nét đặc sắc của phương pháp BCDG
Khi thực hiện toán tử nội suy H từ lưới về điểm trạm A như trong công thức (1.2.15) trước tiên, giá trị tại mỗi điểm lưới xung quanh điểm trạm đang xét sẽ được hiệu chỉnh về cùng độ cao với điểm trạm Sau khi cả bốn điểm lưới đã được hiệu chỉnh, quá trình nội suy tuyến tính thông thường mới bắt đầu được thực hiện
Trang 31CHƯƠNG II THIẾT KẾ CÁC HỆ THỐNG DỰ BÁO UMOS, KF và GMOS
dự báo không được đảm bảo) và ta phải chờ một thời gian đủ dài trước khi có thể phát triển một hệ thống MOS mới (nếu chạy mô hình toàn cầu, điều này có thể thực
hiện dễ dàng bằng cách chạy lại mô hình phiên bản mới) Do đó, tính năng tự
chuyển đổi của hệ thống mới được chú trọng đặc biệt khi xây dựng hệ thống
Hướng đến khả năng tự chuyển đổi, hai phương pháp UMOS và KF sẽ
được sử dụng khi xây dựng hệ thống Hai phương pháp này đã được trình bày về lý thuyết trong chương I Theo đánh giá của Kalnay (2003), dự báo theo MOS truyền
thống có sai số thấp hơn so với dự báo theo KF UMOS sẽ trở thành MOS khi mô hình không có thay đổi, do đó, UMOS có thể có chất lượng dự báo cao hơn KF
Tuy nhiên, điều này cần được kiểm chứng trong thực tế và đề tài lựa chọn cả hai phương pháp này khi xây dựng hệ thống với mục đích so sánh, lựa chọn phương án tối ưu Ngoài ra, do có dung lượng mẫu khi xây dựng phương trình dự báo nhỏ hơn
rất nhiều so với UMOS, KF vẫn có một lợi thế nhất định khi một trạm quan trắc mới được đưa vào sử dụng và KF có thể áp dụng ngay trong thời gian ngắn trong khi UMOS cần ít nhất hai năm trước khi có thể triển khai cho trạm này
Ngoài khả năng tự chuyển đổi, khả năng đưa ra dự báo tại một điểm bất
kỳ cũng được đưa vào hệ thống mới Với phương pháp MOS truyền thống, hệ
thống diễn giải sau khi xây dựng chỉ có thể áp dụng dự báo tại các điểm trạm Rõ ràng đây là một hạn chế lớn của MOS truyền thống Hệ thống mới được thiết kế cần
có khả năng dự báo cho bất kỳ tọa độ nào trên lãnh thổ Việt Nam thông qua các
phương trình dự báo vùng và dự báo trên lưới GMOS Thực hiện được tính năng
Trang 32này, hệ thống sẽ có thể đưa ra bản tin dự báo tự động cho toàn bộ lãnh thổ Việt Nam với các điểm bất kỳ
Ngoại trừ yếu tố lượng mưa, hệ thống hướng tới dự báo các yếu tố khí
tượng cơ bản: nhiệt độ, độ ẩm, gió và mây Dự báo yếu tố lượng mưa vẫn sử dụng
hệ thống diễn giải MOS theo kết quả nghiên cứu của Bùi Minh Tăng và nnk (2009) nhưng trong tương lai gần hệ thống này sẽ được nâng cấp theo hướng tự chuyển đổi với mô hình, thống nhất với hệ thống mới
Thám sát được sử dụng cho hệ thống có khoảng 130 trạm khí tượng trên lãnh thổ Việt Nam Danh sách các trạm này có thể xem ở Phụ lục Trong tương lai,
hệ thống có thể sử dụng thêm một số trạm khí tượng của Trung Quốc, Lào và
Campuchia gần khu vực Việt Nam với mục đích chủ yếu cho GMOS Các trạm này
có thể được nhóm lại theo khu vực khi phát triển các phương trình dự báo vùng
Theo đăng ký trong thuyết minh đề cương, đề tài sẽ sử dụng dự báo từ mô hình HRM chạy nghiệp vụ tại TTDBTƯ làm nhân tố dự báo Tuy nhiên, mô hình HRM, do chưa có hệ thống đồng hóa số liệu, lại sử dụng phân tích từ mô hình toàn cầu GME làm điều kiện ban đầu, vì vậy có những vấn đề nhất định trong chất lượng
dự báo Điều này được bộc lộ rõ trong hệ thống MOS dự báo mưa định lượng hiện
có tại TTDBTƯ khi mọi dự báo MOS từ mô hình HRM luôn có sai số lớn hơn dự báo tương ứng từ mô hình GSM (Bùi Minh Tăng và nnk, 2009) Để hướng tới một
dự báo tốt hơn, đề tài sẽ sử dụng thêm mô hình GSM bên cạnh mô hình HRM Tất
nhiên, hệ thống cần được xây dựng độc lập với mô hình dự báo để có thể sử dụng cho bất kỳ mô hình dự báo nào, không phụ thuộc riêng cho từng mô hình
2.2 YẾU TỐ DỰ BÁO
2.2.1 Các yếu tố dự báo
Hệ thống dự báo bốn yếu tố thời tiết cơ bản nhiệt độ, độ ẩm, gió và mây
Những yếu tố khác như mưa, tầm nhìn xa, độ cao chân mây, … có thể được đưa vào sau trong tương lai gần Các yếu tố này cần được định lượng để có thể đưa vào xây dựng các phương dự báo Quá trình định lượng này dựa vào các biến thực đo tại trạm synop Với nhiệt độ, các yếu tố dự báo có thể lấy trực tiếp từ các đại lượng
được đo gồm có nhiệt độ t, nhiệt độ tối thấp tmin (nhiệt độ thấp nhất từ 19 giờ ngày hôm trước đến 07 giờ sáng ngày hôm sau), nhiệt độ tối cao tmax (nhiệt độ cao nhất
từ 07 giờ sáng đến 19 giờ tối trong ngày) Độ ẩm được xác định tương tự thông qua
nhiệt độ điểm sương td Mặc dù yếu tố dự báo cho độ ẩm được thể hiện thông qua
td (do các trạm synop đo td), để dự báo độ ẩm tương đối ta cần sử dụng thêm dự
báo nhiệt độ t
Trang 33Với yếu tố gió, các yếu tố dự báo được xác định không trực quan như nhiệt
độ và độ ẩm Các trạm synop đo gió thông qua hai đại lượng hướng gió dd và tốc
độ gió ff, trong đó dd với giá trị 0 có nghĩa lặng gió Dự báo từ mô hình thông thường được đưa ra dưới dạng hai thành phần kinh hướng và vĩ hướng u, v Do đó,
ta cần xác định sẽ dự báo gió thông qua dd, ff hay u, v dù có thể chuyển đổi dễ dàng qua lại giữa dd, ff và u, v Theo cách tiếp cận trước đó với nhiệt độ và độ ẩm,
dd và ff cần được lựa chọn thay vì u, v Tuy nhiên, do dd có tính tuần hoàn 360° và
một giá trị đặc biệt 0 với nghĩa lặng gió, nên người ta không sử dụng dd làm yếu tố
dự báo và thay bởi u, v (Glahn và Lowry, 1972) Nghĩa là các giá trị đo dd, ff cần được chuyển đổi thành u, v trước khi sử dụng xây dựng phương trình dự báo Từ giá trị dự báo của u, v sau đó, có thể dễ dàng xác định dd, ff Nhưng vẫn theo Glahn
và Lowry (1972), cách tiếp cận này không đảm bảo một đánh giá tối ưu cho ff khi xác định dựa theo u,v Vì thế các phương trình dự báo cho u,v chỉ được sử dụng trong xác định dd Tốc độ gió ff vẫn sử dụng một phương trình dự báo riêng Tóm
lại với yếu tố gió, thay vì có hai yếu tố dự báo theo như suy nghĩ thông thường với
dd, ff hoặc u, v, đề tài sử dụng ba yếu tố dự báo u, v và ff
Lựa chọn yếu tố dự báo cho lượng mây phức tạp hơn Lượng mây các trạm synop báo về không phải biến liên tục mà là các biến rời rạc theo phần tám (octa) của lượng mây bao phủ bầu trời, có giá trị từ 0 đến 8 Ngoài ra, giá trị 9 còn cho biết không quan sát được bầu trời do có hiện tượng khác như sương mù hay bão cát Như vậy, rõ ràng không thể sử dụng trực tiếp các giá trị này để đưa vào phương trình dự báo Trong trường hợp này, người ta không dự báo một biến mây liên tục giống như các biến ở trên mà chuyển thành dự báo xác suất hiện tượng có không thông qua một phân loại mây (Weiss, 2001) Mây sẽ được phân thành bốn loại: không mây CLR (0,1 octa), ít mây SCT (2,3,4 octa), nhiều mây BRK (5,6,7 octa) và đầy mây OVR (8,9 octa) Với mỗi loại mây, yếu tố dự báo sẽ là xác suất xuất hiện của loại mây tương ứng thể hiện qua giá trị 0/1 khi sử dụng xây dựng phương trình
dự báo Thay vì một phương trình dự báo lượng mây, ta sẽ xây dựng bốn phương trình dự báo khác nhau cho bốn loại mây
Tổng kết lại, đề tài cần xây dựng các phương trình dự báo cho mười một (11) yếu tố dự báo sau: t, tmin, tmax, td, u, v, ff, clr, sct, bkr và ovr Bảy (07) yếu
tố đầu được dự báo theo biến liên tục, bốn (04) yếu tố sau được dự báo theo biến hiện tượng thông qua xác suất Các yếu tố khác có thể đưa vào sau này như độ cao chân mây, tầm nhìn xa hay lượng mưa cũng được xử lý dưới dạng biến hiện tượng thông qua một số ngưỡng phân loại
Trang 342.2.2 Kiểm tra chất lượng thám sát
Khi sử dụng quan trắc từ các yếu tố trên xây dựng phương trình dự báo, chất lượng các quan trắc này đóng vai trò quyết định quan trọng tới chất lượng của hệ thống bên cạnh chất lượng dự báo từ mô hình Những giá trị quan trắc bất hợp lý như t=70°C hay ff=40m/s nếu không được kiểm soát sẽ tác động đến những phương trình dự báo cuối cùng, có thể dẫn đến những dự báo vô nghĩa Bởi vậy, quá trình kiểm tra chất lượng thám sát cần được chú ý đặc biệt với một hệ thống diễn giải dự báo trong pha xây dựng cũng như ứng dụng (nếu quan trắc còn được sử dụng làm nhân tố dự báo) Phần dưới đây sẽ trình bày hệ thống kiểm tra chất lượng thám sát được đề tài xây dựng
Kiểm tra chất lượng dựa trên so sánh giữa giá trị quan trắc với một số giá trị
từ các nguồn thông tin khác như giá trị khí hậu, giá trị trung bình từ các trạm xung quanh, giá trị dự báo từ mô hình… Nếu độ lệch lớn (so sánh với độ lệch chuẩn sai
số tại trạm), quan trắc sẽ được coi nhiều khả năng là sai Chỉ tiêu xác định một độ lệch bao nhiêu là lớn phụ thuộc vào từng thuật toán kiểm tra, từng trung tâm dự báo khác nhau Dựa theo hệ thống kiểm tra chất lượng của Meteo-France (1997), hệ thống kiểm tra chất lượng sẽ bao gồm ba công đoạn kiểm tra như sau:
- Kiểm tra khí hậu so sánh quan trắc với giá trị khí hậu Kiểm tra này cũng thực hiện phần việc của kiểm tra vật lý do các giá trị ngưỡng được xác định dựa theo giá trị khí hậu riêng cho từng trạm
- Kiểm tra phù hợp xác định tương thích về mặt vật lý giữa hai hay nhiều đại lượng
- Kiểm tra không gian so sánh giá trị quan trắc với giá trị quan trắc từ các trạm xung quanh
Phần trên đã bỏ qua hai kiểm tra quan trọng khác là kiểm tra mã điện và kiểm tra với dự báo từ mô hình Kiểm tra mã điện đã được tích hợp với các chương trình giải mã và nhập liệu hàng ngày vào cơ sở dữ liệu quan trắc tại phòng Nghiên cứu Ứng dụng, TTDBTƯ Đây là một kiểm tra cấp thấp, mang tính kỹ thuật nhiều hơn là khoa học do đó sẽ không được trình bày ở đây (tuy nhiên các kiểm tra này khá phức tạp về mặt thực hiện) Về kiểm tra mô hình, do chưa thực sự vận hành một
hệ thống phân tích - dự báo khu vực tại TTDBTƯ nên kiểm tra này chưa được thực hiện Tuy nhiên, kiểm tra này cũng thực sự không cần thiết bởi hai lý do: i) Chất lượng dự báo của các mô hình khu vực tại Việt Nam chưa cao (như dự báo mưa) và ii) Kiểm tra không gian là một kiểm tra mạnh có khả năng loại bỏ phần lớn các quan trắc bất hợp lý
Trang 35Kiểm tra khí hậu dựa trên đặc điểm khí hậu tại một khu vực xác định thông tin quan trắc có hợp lý hay không Ví dụ nếu trong tháng bảy, ta nhận được một quan trắc nhiệt độ tối cao 20°C tại Hà Nội thì nhiều khả năng đây là một quan trắc sai bởi vào mùa hè, nhiệt độ tối cao thông thường tại Hà Nội vào khoảng 35°C với sai số 4°-5°C Kiểm tra này có độ tin cậy cao với các biến số như nhiệt độ hay độ
ẩm nhưng cần thận trọng khi sử dụng cho gió hay mưa bởi một quan trắc gió lớn hơn rất nhiều giá trị khí hậu rất có thể tương ứng với hoạt động của một cơn bão Ngoài ra, không thể sử dụng phương pháp này với mây
Thông thường, để xác định trung bình khí hậu và độ lệch chuẩn, ta có thể sử dụng các công thức thường dùng trong thống kê Các công thức này có nhược điểm nếu xuất hiện một số hạng bất thường trong tập mẫu thống kê, giá trị trung bình và
độ lệch chuẩn thống kê sẽ bị sai lệch hoàn toàn (ví dụ trong chuỗi nhiệt độ tháng bảy có số hạng 1000°C) Do đó, người ta thường dùng các đại lượng khác như
median và mad để thay thế cho giá trị trung bình và độ lệch chuẩn khi xác định các
đặc trưng thống kê Trong đề tài này, chúng tôi sử dụng phương pháp trung bình và
độ lệch chuẩn hai trọng số của Lanzante (1996) Phương pháp này đã được một số tác giả sử dụng như Gleason (2002), Feng và nnk (2004) Trình bày dưới đây chủ yếu dựa theo Feng và nnk (2004)
Theo phương pháp hai trọng số, các phần tử tập trung quanh tâm của phân bố
sẽ có trọng số lớn hơn so với các phần tử bất thường nằm ngoài trung tâm khi tính toán giá trị trung bình và độ lệch chuẩn Trọng số sẽ giảm dần đến 0 khi vượt quá một ngưỡng nào đó Giả sử ta có một chuỗi các quan trắc Xi thô n phần tử, có thể chứa các số hạng bất thường Trọng số ui cho mỗi phần tử Xi được tính như sau :
u i
i (2.2.1)
với M, MAD là median và mad xác định từ chuỗi Xi, c là hằng số cho biết ngưỡng loại bỏ các số hạng bất thường Khi ui có giá trị tuyệt đối lớn hơn 1, nó sẽ được gán bằng 1, bảo đảm ui chỉ nằm trong khoảng [-1,1] Điều này hoàn toàn được quyết định bởi giá trị của c và c được lấy bằng 7.5 theo Lanzante (1996) Giá trị trung bình và độ lệch chuẩn của chuỗi Xi bây giờ được xác định như sau:
1 i
2 2 i
n 1 i
2 2 i i
bi
) u 1 (
) u 1 )(
M X ( M
2 i 2
i
5 0 n
1 i
4 2 i 2 i bi
) u 1 )(
u 1 (
) u 1 ( ) M X ( n
S (2.2.3)
Trang 36nghĩa là (1-ui2) đóng vai trò trọng số thay vì ui Đây là một đánh giá tốt của giá trị trung bình và độ lệch chuẩn, không chịu tác động của các số hạng bất thường nếu xuất hiện trong chuỗi thống kê Từ đây, với mỗi giá trị quan trắc Xo để kiểm tra chất lượng dựa trên thông tin khí hậu, ta xác định chỉ số Z như sau:
bi
bi
s
X X
Z −
= 0
(2.2.4) Cách xác định Z như vậy cho thấy phương pháp Lanzante được sử dụng tốt nhất khi Xi có phân bố chuẩn như các yếu tố nhiệt độ và độ ẩm Theo Feng và nnk (2004), những quan trắc ứng với Z > 5 sẽ bị xem là bất thường và cần được đánh dấu nghi ngờ về mặt khí hậu Có thể sử dụng tiêu chuẩn chặt hơn như Z > 3 hay Z >
4 nhưng theo kinh nghiệm thực tế những tiêu chuẩn này thường loại bỏ một số các quan trắc đúng Ngoài ra, không cần thiết phải kiểm tra quá chặt ở bước kiểm tra khí hậu bởi những quan trắc sai nếu có thể qua được bước kiểm tra này cũng không thể qua được bước kiểm tra không gian
Thay vì xác định giá trị trung bình và độ lệch chuẩn cho từng tháng, đề tài sẽ xác định riêng cho từng ngày với mỗi trạm Chuỗi Xi sẽ được thiết lập bằng cách sử dụng mười ngày số liệu quan trắc xung quanh ngày đang tính và mở rộng sang cho mọi năm có thể Ví dụ với ngày N của năm 2009, ngoài quan trắc X(N) ta đưa thêm vào chuỗi Xi các quan trắc X(N-1), …, X(N-5) và X(N+1), …, X(N+5), sau đó tiếp tục mở rộng chuỗi với quan trắc từ ngày N-5 đến N+5 của năm 2008, 2007, … cho đến khi không còn số liệu quan trắc Bằng cách này ta sẽ có được một chuỗi đủ dài cho phép xác định giá trị khí hậu của một biến nào đó vào một ngày nhất định trong năm Con số 10 ngày xung quanh ngày đang tính là một tham số và có thể điều chỉnh như đối với mưa con số này cần lớn hơn
Tuy nhiên, kiểm tra khí hậu sẽ không thể thực hiện được với những trạm mới lắp đặt, do không thể thiết lập một chuỗi Xi đủ dài để xác định các đặc trưng khí hậu cho một trạm mới Để giải quyết vấn đề này, đặc trưng khí hậu cho mỗi trạm mới sẽ được lấy từ đặc trưng khí hậu từ các trạm cũ xung quanh Giá trị độ lệch chuẩn được giữ nguyên như giá trị tương ứng tại trạm gần nhất Giá trị trung bình cũng được lấy từ trạm gần nhất nhưng đã được điều chỉnh theo độ cao sử dụng các số liệu quan trắc mới nhất
Kiểm tra khí hậu được áp dụng như đã mô tả ở trên cho các biến nhiệt độ và
độ ẩm Với gió, kiểm tra khí hậu được kết hợp với kiểm tra vật lý Nếu ff > 35m/s quan trắc này sẽ bị loại bỏ Nếu ff < 35 m/s nhưng Z > 5, quan trắc bị đánh dấu nghi ngờ nhưng không bị loại bỏ mà cần được thực hiện thêm các kiểm tra khác bởi gió lớn trong trường hợp này có thể tương ứng với một cơn bão đang hoạt động Với
Trang 37mưa hay áp suất, quá trình kiểm tra cũng tương tự như với gió đã nêu trên Kiểm tra khí hậu không được áp dụng cho yếu tố lượng mây, độ cao chân mây và tầm nhìn
xa Các quan trắc sau khi đã qua được khâu kiểm tra khí hậu và vật lý như trên sẽ tiếp tục trải qua khâu kiểm tra phù hợp Hệ thống thực hiện các kiểm tra phù hợp sau:
- Nếu độ cao trạm (height) > 0 thì pmsl > ps
- Nếu dd = 0 thì ff = 0
- Nếu ff = 0 thì dd = 0
- Độ hụt điểm sương t-td < 30°C
- Nếu lượng mây N = 0 thì độ cao chân mây h = 9
- Nếu tầm nhìn xa vv < 1000m, không thể xảy ra các hiện tượng thời tiết
Trang 38giữa các quan trắc này được thực hiện qua một số công cụ thống kê sẽ trình bày dưới đây dựa theo Feng và nnk (2004)
Không gian các trạm xung quanh được xác định phụ thuộc vào yếu tố đang xét Ngoại trừ áp suất, các trạm có thể đưa vào danh sách các trạm xung quanh điểm trạm đang xét cần nằm trong đường tròn với bán kính 2° quanh điểm này Với pmsl
và ps, khoảng cách này được nâng lên 4° do trường áp suất có quy mô lớn hơn so
với các trường còn lại Bây giờ với các trạm nằm trong đường tròn đang xét, ta xác định hệ số tương quan R giữa trạm đang xét với các trạm xung quanh dựa trên tập
số liệu quan trắc quá khứ của Nd ngày, ngay trước ngày đang xét Trong đề tài này,
Nd được lấy bằng 30 (tương đương một tháng) Một trạm sẽ được xem là có tương quan với trạm đang xét nếu R >= 0.5 và tương quan có độ tin cậy trên 95% Tập hợp các trạm này được xác định là các trạm xung quanh của trạm đang xét
Các trạm này sau đó được sắp xếp theo thứ tự giảm dần của R và xây dựng phương trình hồi quy tuyến tính xác định quan trắc tại trạm đang xét từ quan trắc của mỗi trạm xung quanh Cần chú ý rằng các quan trắc sử dụng xây dựng phương trình hồi quy đã được kiểm tra khí hậu và kiểm tra phù hợp nhằm hạn chế các số liệu quá bất thường ảnh hưởng xấu đến phương trình hồi quy Số phương trình hồi quy sau đó sẽ được giới hạn lại bởi N = 5 phương trình, nếu có nhiều hơn năm phương trình hồi quy Giả sử quan trắc tại trạm đang khảo sát có giá trị X0 Mỗi phương trình sẽ cho ta đánh giá X0j với sai số RMSEj tại điểm trạm đang xét từ quan trắc Xj của trạm xung quanh Từ đây ta sẽ xác định được khoảng tin cậy của
X0 theo mỗi trạm xung quanh [X0j -F×RMSEj, X0j+F×RMSEj] với F là tham số giới hạn tin cậy Nếu X0 rơi ra ngoài khoảng tin cậy với tất cả N khoảng tin cậy thu nhận được, quan trắc X0 sẽ bị loại bỏ Trong kiểm tra này, F được lấy bằng 5 với mưa và gió, bằng 3 với các biến còn lại
Có thể thấy phương pháp xử lý của kiểm tra không gian khá linh hoạt Bằng cách sử dụng quan hệ thống kê qua hồi quy tuyến tính và xét tác động đồng thời của tất cả các trạm xung quanh, ngay cả khi xuất hiện những quan trắc bất hợp lý từ các trạm xung quanh, kiểm tra không gian vẫn có thể loại bỏ những quan trắc sai Đây
là một điểm mạnh của kiểm tra không gian mà các kiểm tra trước đó không có Hơn nữa, phương pháp của Hubbart (2001) còn cho phép đánh giá tối ưu quan trắc tại trạm đang xét (khôi phục dữ liệu) từ các trạm xung quanh trong trường hợp trạm này bị mất dữ liệu Công thức đánh giá dựa trên lý thuyết bình phương tối thiểu có dạng đơn giản như sau:
j
j j
e X RMSE RMSE X
1
2 1
2
0 (2.2.5)
Trang 39RMSEe= 1 ∑
=
−
N j
j
RMSE
1
2 (2.2.6) Dựa theo hai công thức này, cũng có thể đưa ra khoảng tin cậy như trên và chỉ cần xét một khoảng tin cậy thay vì N khoảng như trên Do đặc điểm của kiểm tra không gian không thể thực hiện độc lập riêng tại từng trạm mà phải có một số lượng nhất định quan trắc từ các trạm xung quanh tồn tại đồng thời với quan trắc đang khảo sát, kiểm tra không gian chỉ có thể thực hiện sau một thời gian nhất định nào đó khi số lượng thám sát đã truyền về đầy đủ trong khi kiểm tra khí hậu và kiểm tra phù hợp có thể thực hiện ngay khi nhận được số liệu từ một trạm nào đó Nghĩa là kiểm tra này cần một độ trễ nhất định so với hai kiểm tra khí hậu và kiểm tra phù hợp Điều này cũng đồng nghĩa với việc không thể thực hiện kiểm tra không gian cho các trạm đảo như Trường Sa hay Song Tử Tây, … do không có các trạm xung quanh Với các trạm đảo này, kiểm tra khí hậu sẽ được thực hiện chặt hơn với tiêu chuẩn Z <= 3
2.3 NHÂN TỐ DỰ BÁO
Số liệu dự báo từ 2 mô hình GSM và HRM tại các thời điểm 06, 12, …, 72
giờ sẽ được sử dụng làm nhân tố dự báo tương ứng với thời điểm quan trắc của
yếu tố dự báo Riêng với tmin và tmax, nhân tố dự báo sẽ được lấy từ trường dự
báo vào thời điểm 01h và 13h giờ Việt Nam thuộc quãng thời gian xác định của
tmin và tmax cho đêm hay ngày Số liệu này được cho trên lưới kinh vĩ độ phân
giải 1.25° với GSM và 0.125° với HRM Dựa theo đề xuất của Glahn và Lowry (1972), Applequist và nnk (2002), Wilson và Vallee (2002) các biến có thể trở thành nhân tố dự báo cần được rút ra từ dự báo mô hình bao gồm: mưa, mưa đối lưu, tốc độ mưa, tốc độ mưa đối lưu, lượng mây, gió 10m, nhiệt độ 2m, độ hụt điểm sương 2m, áp suất mực biển, độ cao chân mây, độ cao đỉnh mây, địa thế vị, gió, nhiệt độ, độ ẩm, tốc độ thẳng đứng tại các mực áp suất cơ bản 1000, 950, 850, 700,
500, 300mb Từ các biến cơ sở này, các tác giả trên đề xuất một số biến dẫn xuất cũng có khả năng trở thành nhân tố dự báo Dưới đây là các biến dẫn xuất đề tài sử dụng:
- Trường trên cao: độ ẩm riêng, độ ẩm tương đối, nhiệt độ điểm sương,
nhiệt độ thế vị tương đương, xoáy tương đối, phân kỳ, hội tụ ẩm
- Gradient: áp dụng toán tử gradient theo 2 hướng kinh độ, vĩ độ, ta sẽ có
các trường gradient cho địa thế vị, gió, nhiệt độ, độ hụt điểm sương Riêng với phương thẳng đứng, toán tử gradient cho nhiệt độ chính là tốc độ giảm đoạn nhiệt, còn đối với biến gió thì cho biết độ đứt gió Với các biến còn lại gồm địa thế vị, nhiệt độ thế vị tương đương, độ ẩm riêng ta chỉ xác
Trang 40định độ chênh lệch giữa các biến tại các mực áp suất khác nhau như độ lệch của phân kỳ giữa mực 850 và 300mb
- Bình lưu: áp dụng toán tử bình lưu cho các biến nhiệt độ, độ ẩm riêng, độ
hụt điểm sương, nhiệt độ thế vị tương đương, xoáy tương đối
- Trung bình trong 1 cột khí quyển: tích phân thẳng đứng các trường 3
chiều từ mực 950mb đến mực 500mb rồi lấy trung bình Toán tử này được thực hiện cho tất cả các biến 3 chiều cơ sở cũng như dẫn xuất, cộng thêm các biến bình lưu
- Các trường khác: các chỉ số bất ổn định (chỉ số K và Showalter), lượng
nước giáng thủy khả năng (xác định từ tích phân thẳng đứng của độ ẩm riêng), tích giữa tốc độ thẳng đứng và lượng nước giáng thủy khả năng, laplacian của bình lưu nhiệt độ
Có một số biến không tồn tại trong kết quả dự báo của GSM (JMA không phát báo các biến này): mưa đối lưu, tốc độ mưa, tốc độ mưa đối lưu, lượng mây, cao chân mây, độ cao đỉnh mây và tốc độ thẳng đứng Do đó, số lượng các biến có thể trở thành nhân tố dự báo với GSM sẽ nhỏ hơn so với số biến có thể với HRM Ngoài các nhân tố dự báo từ mô hình trên, đề tài còn sử dụng quan trắc làm nhân tố dự báo với mục đích đưa thêm yếu tố quán tính (persistence) vào phương trình dự báo Với các biến nhiệt độ, ẩm và gió, nhân tố dự báo chính là giá trị của yếu tố dự báo nhưng được lấy tại thời điểm phân tích khi bắt đầu làm dự báo Riêng với biến mây, có ba nhân tố dự báo theo Weiss (2001) được cho dưới dạng nhị phân cho biết lượng mây tại thời điểm phân tích nhỏ hơn 2/8, 5/8 hay 8/8 hay không Ví
dụ với lượng mây 3/8, giá trị của nhân tố dự báo ứng với ngưỡng mây trên lần lượt
là 0, 1, 1
Các nhân tố dự báo địa khí hậu gồm có độ cao mặt trời (biến động theo năm
và theo ngày), kinh độ trạm, vĩ độ trạm và độ cao trạm Ba yếu tố sau chỉ được sử dụng khi xây dựng phương trình dự báo cho một khu vực khi cần thiết phải nhóm lại quan trắc của các trạm trong khu vực
Từ trường dự báo trên lưới của mô hình, các nhân tố dự báo cần được xác định tại điểm trạm bằng một phương pháp nội suy thích hợp Với các trường trên cao, phương pháp nội suy đa thức bậc ba được áp dụng nội suy từ lưới về điểm trạm Với các trường bề mặt, giá trị dự báo được xác định đơn giản bằng điểm lưới gần nhất Tuy nhiên, do trường dự báo từ GSM có độ phân giải khá thô 1.25° nên ngoại trừ trường mưa các biến bề mặt cũng được nội suy tuyến tính về điểm trạm
Như vậy, với mỗi thời điểm, mỗi điểm trạm sẽ có 242 biến dự báo với HRM và
222 với GSM Đây là tập các biến có thể sử dụng làm nhân tố dự báo cho phương
pháp UMOS và KF