1. Trang chủ
  2. » Khoa Học Tự Nhiên

Áp dụng phương pháp umos để cải thiện dự báo pha mưa trên khu vực việt nam

99 191 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 99
Dung lượng 2,17 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Từ lâu, phương pháp dự báo thống kê bằng cách xây dựng các phương trình hồi quy tuyến tính đơn giản giữa yếu tố dự báo với các yếu tố đã biết nhưng không phải từ mô hình số trị đã được á

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

––––––––––––––

LƯƠNG NHƯ NGUYÊN

ÁP DỤNG PHƯƠNG PHÁP UMOS ĐỂ CẢI THIỆN DỰ BÁO PHA

MƯA TRÊN KHU VỰC VIỆT NAM

LUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội – Năm 2016

Trang 2

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

––––––––––––––––

LƯƠNG NHƯ NGUYÊN

ÁP DỤNG PHƯƠNG PHÁP UMOS ĐỂ CẢI THIỆN DỰ BÁO PHA

MƯA TRÊN KHU VỰC VIỆT NAM

Chuyên ngành: Khí tượng và Khí hậu học

Mã số: 60440222

LUẬN VĂN THẠC SĨ KHOA HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC: TS BÙI MINH TĂNG

Hà Nội – Năm 2016

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan Luận văn “Áp dụng phương pháp UMOS để cải thiện dự báo pha mưa trên khu vực Việt Nam” là công trình nghiên cứu do cá nhân tôi thực hiện dưới sự hướng dẫn khoa học của Tiến sỹ Bùi Minh Tăng, không sao chép từ các công trình nghiên cứu của người khác Số liệu và kết quả của Luận văn chưa từng được công bố ở bất kỳ một công trình khoa học nào khác

Các thông tin thứ cấp sử dụng trong Luận văn là có nguồn gốc rõ ràng, được trích dẫn đầy đủ, trung thực và đúng quy cách

Tôi xin hoàn toàn chịu trách nhiệm về tính xác thực và nguyên bản của Luận văn./

Hà Nội, ngày 20 tháng 12 năm 2016

Tác giả Luận văn

Lương Như Nguyên

Trang 4

LỜI CẢM ƠN

Lời đầu tiên, tôi xin trân trọng cảm ơn Tiến sỹ Bùi Minh Tăng đã định hướng nghiên cứu và các phương pháp luận cho tôi trong suốt quá trình thực hiện nghiên cứu Luận văn Thạc sỹ

Trong quá trình nghiên cứu và học tập tại Khoa Khí tượng, Thủy văn và Hải dương học, Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội tôi đã có cơ hội được tiếp thu những kiến thức cơ bản và chuyên sâu về chuyên ngành Khí tượng và Khí hậu học Qua đó, đã giúp tôi có được những kiến thức chuyên môn cũng như kinh nghiệm trong suốt quá trình học tập, tạo động lực trong nghiên cứu khoa học, phục vụ hiệu quả trong quá trình nghiên cứu, thực hiện và hoàn thiện Luận văn Thạc sỹ của tôi

Tôi xin trân trọng cảm ơn các đồng chí Lãnh đạo,các thầy giáo, cô giáo và các cán bộ trong Khoa Khí tượng, Thủy văn và Hải dương học đã tận tình hướng dẫn, giúp đỡ tôi về các điều kiện trong suốt quá trình học tập và thực hiện Luận văn

Xin chân thành cảm ơn các đồng chí Lãnh đạo và cán bộ của Trung tâm Dự báo khí tượng thủy văn Trung ương đã tạo điều kiện cho tôi tham gia khóa đào tạo Thạc sỹ, các đề tài nghiên cứu khoa học do Trung tâm Dự báo khí tượng thủy văn Trung ương chủ trì đã cung cấp thông tin, số liệu quan trắc, dự báo, tài liệu và tận tình giúp đỡ tôi trong quá trình thực hiện Luận văn

Trân trọng cảm ơn sự quan tâm, giúp đỡ của bạn bè, đồng nghiệp và gia đình

đã luôn sát cánh, động viên, giúp đỡ tôi trong quá trình học tập và hoàn thành Luận văn./

Hà Nội, ngày 20 tháng 12 năm 2016

Tác giả Luận văn

Lương Như Nguyên

Trang 5

MỤC LỤC

MỤC LỤC 1

DANH MỤC BẢNG 4

DANH MỤC HÌNH VẼ 6

DANH MỤC KÝ HIỆU VIẾT TẮT 7

MỞ ĐẦU 9

CHƯƠNG I: TỔNG QUAN 13

1.1 Tổng quan về các phương pháp thống kê sau mô hình 13

1.2 Tình hình nghiên cứu nước ngoài 14

1.3 Tình hình nghiên cứu trong nước 18

CHƯƠNG II: SỐ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 23

2.1 Số liệu 23

2.1.1 Số liệu quan trắc 23

2.1.2 Số liệu dự báo 24

2.2 Phương pháp nghiên cứu 25

2.2.1 Phương pháp UMOS 25

2.2.2 Phương pháp GMOS 31

2.3 Áp dụng phương pháp UMOS cho bài toán dự báo POP 34

2.3.1 Xác định yếu tố dự báo 34

2.3.2 Xác định nhấn tố dự báo 34

2.3.3 Xây dựng phương trình dự báo POP 37

2.4 Phương pháp đánh giá kết quả dự báo POP 38

2.4.1 Điểm số Brier 38

2.4.2 Biểu đồ tin cậy 40

2.4.3 Đường đặc trưng hoạt động ROC và chỉ số ROCA 42

2.5 Xây dựng hệ thống GMOS để đưa dự báo UMOS từ điểm trạm về lưới phân giải cao 43

Trang 6

CHƯƠNG III: KẾT QUẢ, ĐÁNH GIÁ 46

3.1 Kết quả xây dựng phương trình dự báo 46

3.2 Kết quả đánh giá dự báo 49

3.2.1 Đánh giá các chỉ số kỹ năng 49

3.2.2 Biểu đồ độ tin cậy 54

3.3 Thử nghiệm kết quả hiện thị dưới dạng lưới GMOS cho dự báo POP 62 KẾT LUẬN VÀ KIẾN NGHỊ 65

TÀI LIỆU THAM KHẢO i

PHỤ LỤC 1:Danh sách các trạm quan trắc khí tượng bề mặt thuộc Việt Nam được sử dụng trong Luận văn v

PHỤ LỤC 2:Danh sách các nhân tố dự báo dự tuyển từ mô hình WRF-ARW ix

PHỤ LỤC 3:Minh họa sự biến đổi của phương trình dự báo và RV tại trạm Bắc Quang hạn dự báo 24 giờ với mô hình WRF-ARW vào mùa đông xiv

PHỤC LỤC 4:Minh họa sự biến đổi của phương trình dự báo và RV tại trạm Bắc Quang hạn dự báo 24 giờ với mô hình WRF-ARW vào mùa hè xv

PHỤ LỤC 5:Minh họa sự biến đổi của phương trình dự báo và RV tại trạm Bạch Long Vỹ hạn dự báo 24 giờ với mô hình WRF-ARW xvii

PHỤ LỤC 6:Minh họa sự biến đổi của phương trình dự báo và RV tại trạm Bãi Cháy hạn dự báo 24 giờ với mô hình WRF-ARW xix

PHỤ LỤC 7:Minh họa sự biến đổi của phương trình dự báo và RV tại trạm Buôn Ma Thuột hạn dự báo 24 giờ với mô hình WRF-ARW xxi

PHỤ LỤC 8:Minh họa sự biến đổi của phương trình dự báo và RV tại trạm Cà Mau hạn dự báo 24 giờ với mô hình WRF-ARW xxiii

PHỤ LỤC 9:Minh họa sự biến đổi của phương trình dự báo và RV tại trạm Cần Thơ hạn dự báo 24 giờ với mô hình WRF-ARW xxv

PHỤ LỤC 10:Minh họa sự biến đổi của phương trình dự báo và RV tại trạm Hà Nội hạn dự báo 24 giờ với mô hình WRF-ARW xxvii

Trang 7

PHỤ LỤC 11:Minh họa sự biến đổi của phương trình dự báo và RV tại trạm Vinh hạn dự báo 24 giờ với mô hình WRF-ARW xxix

Trang 8

DANH MỤC BẢNG

Bảng 2.1:Số lượng các trạm quan trắc tại các Đài khu vực 23 Bảng 2.2: Cấu hình chi tiết của mô hình WRF-ARW 25 Bảng 3.1: Tần suất tuyển chọn và tần suất tuyển chọn đầu tiên của các nhân tố trong phương trình POP hạn 24 giờ khi dung lượng mẫu tăng vào mùa đông đối với mô hình WRF-ARW 46 Bảng 3.2: Tần suất tuyển chọn và tần suất tuyển chọn đầu tiên của các nhân tố trong phương trình POP hạn 24 giờ khi dung lượng mẫu tăng vào mùa hè đối với mô hình WRF-ARW 47 Bảng 3.3: Tần suất tuyển chọn và tần suất tuyển chọn đầu tiên của các nhân tố trong phương trình POP hạn 48 giờ khi dung lượng mẫu tăng vào mùa đông đối với mô hình WRF-ARW 48 Bảng 3.4: Tần suất tuyển chọn và tần suất tuyển chọn đầu tiên của các nhân tố trong phương trình POP hạn 48 giờ khi dung lượng mẫu tăng vào mùa hè đối với mô hình WRF-ARW 48 Bảng 3.5: Kết quả tính toán chỉ số BSS cho dự báo POP hạn 24 giờ từ UMOS

và DMO của mô hình WRF-ARW và từ DMO của mô hình GSM trung bình trên 9 khu vực và toàn bộ Việt Nam năm 2014 50 Bảng 3.6: Kết quả tính toán chỉ số BSS cho dự báo POP hạn 24 giờ từ UMOS

và DMO của mô hình WRF-ARW và từ DMO của mô hình GSM trung bình trên 9 khu vực và toàn bộ Việt Nam năm 2015 51 Bảng 3.7: Kết quả tính toán chỉ số BSS cho dự báo POP hạn 48 giờ từ UMOS

và DMO của mô hình WRF-ARW và từ DMO của mô hình GSM trung bình trên 9 khu vực và toàn bộ Việt Nam năm 2014 51 Bảng 3.8: Kết quả tính toán chỉ số BSS cho dự báo POP hạn 48giờ từ UMOS

và DMO của mô hình WRF-ARW và từ DMO của mô hình GSM trung bình trên 9 khu vực và toàn bộ Việt Nam năm 2015 52 Bảng 3.9: Kết quả tính toán chỉ số ROCA cho dự báo POP hạn 24 giờ từ UMOS và DMO của mô hình WRF-ARW và từ DMO của mô hình GSM trung bình trên 9 khu vực và toàn bộ Việt Nam năm 2014 52 Bảng 3.10: Kết quả tính toán chỉ số ROCA cho dự báo POP hạn 24giờ từ UMOS và DMO của mô hình WRF-ARW và từ DMO của mô hình GSM trung bình trên 9 khu vực và toàn bộ Việt Nam năm 2015 53

Trang 9

Bảng 3.11: Kết quả tính toán chỉ số ROCA cho dự báo POP hạn 48giờ từ UMOS và DMO của mô hình WRF-ARW và từ DMO của mô hình GSM trung bình trên 9 khu vực và toàn bộ Việt Nam năm 2014 53 Bảng 3.12: Kết quả tính toán chỉ số ROCA cho dự báo POP hạn 48giờ từ UMOS và DMO của mô hình WRF-ARW và từ DMO của mô hình GSM trung bình trên 9 khu vực và toàn bộ Việt Nam năm 2015 54

Trang 10

DANH MỤC HÌNH VẼ

Hình 2.1: Miền định hướng dự báo của mô hình WRF-ARW 24 Hình 2.2: Biểu đồ tin cậy 41 Hình 2.3: Đường đặc trưng hoạt động 43 Hình 3.1: Biểu đồ tin cậy cho dự báo POP theo UMOS cho mô hình WRF- ARW vào mùa hènăm 2014 cho hạn dự báo 24giờ tại 9 khu vực nghiên cứu……… ………55 Hình 3.2: Biểu đồ tin cậy cho dự báo POP theo UMOS cho mô hình WRF- ARW vào mùa đông năm 2014 cho hạn dự báo 24giờ tại 9 khu vực nghiên cứu 56 Hình 3.3: Biểu đồ tin cậy cho dự báo POP theo UMOS cho mô hình WRF- ARW vào mùa hènăm 2015 cho hạn dự báo 24giờ tại 9 khu vực nghiên cứu……… 57 Hình 3.4: Biểu đồ tin cậy cho dự báo POP theo UMOS cho mô hình WRF- ARW vào mùa đôngnăm 2015 cho hạn dự báo 24giờ tại 9 khu vực nghiên cứu 58 Hình 3.5: Biểu đồ tin cậy cho dự báo POP theo UMOS cho mô hình WRF- ARW vào mùa hènăm 2014 cho hạn dự báo 48giờ tại 9 khu vực nghiên cứu……… 59 Hình 3.6: Biểu đồ tin cậy cho dự báo POP theo UMOS cho mô hình WRF- ARW vào mùa đôngnăm 2014 cho hạn dự báo 48giờ tại 9 khu vực nghiên cứu 60 Hình 3.7: Biểu đồ tin cậy cho dự báo POP theo UMOS cho mô hình WRF- ARW vào mùa hènăm 2015 cho hạn dự báo 48giờ tại 9 khu vực nghiên cứu……… 61 Hình 3.8: Biểu đồ tin cậy cho dự báo POP theo UMOS cho mô hình WRF- ARWvào mùa đôngnăm 2015 cho hạn dự báo 48giờ tại 9 khu vực nghiên cứu 62 Hình 3.9: Bản đồ dự báo hạn 24 giờ cho xác suất xảy ra mưa từ 00Z ngày 04/08/2015 theo GMOS với dự báo từ UMOS của mô hình WRF-ARW và quan trắc tương ứng 63 Hình 3.10: Bản đồ dự báo hạn 48 giờ cho xác suất xảy ra mưa từ 00Z ngày 04/08/2015 theo GMOS với dự báo từ UMOS của mô hình WRF-ARW và quan trắc tương ứng 64

Trang 11

DANH MỤC KÝ HIỆU VIẾT TẮT

ANN: Artificial Neural Network - Phương pháp mạng thần kinh nhân tạo BCDG:Tên phương pháp hiệu chỉnh viết tắt của 4 tác giả là: Bergthorssen,

Cressman, Doss và Glann

BOM:Bureau of Meteorology - Cục Khí tượng Úc

BSS: Brier Skill Score - Chỉ số kỹ năng Brier

CMA: China Meteorological Administration- Cơ quan Khí tượng Trung

Quốc

DMO:Direct Model Output - Kết quả dự báo trực tiếp từ mô hình

ECMWF:European Centre for Medium-Range Weather Forecasts-Trung

tâm dự báo hạn vừa Châu Âu

ETS: Equitable Threat Score - Tên một loại chỉ số kỹ năng

FAR: False Alarm Ratio - Tỷ lệ dự báo khống

GASP: Global Analysis and Prediction- Mô hình phân tích và dự báo toàn

cầu

GMOS: Gridded Model Ouput Statistics - Thống kê sau mô hình trên lưới GSM: Global Spectral Model - Mô hình phổ toàn cầu của JMA

HKO:HongKong Observatory- Cơ quan Khí tượng Hồng Kông

JMA: Japan Meteorological Agency - Cơ quan Khí tượng Nhật bản

KF: Kalman Filter - Phương pháp lọc Kalman dạng tổng quát (ma trận) LAPS: Limited Area Prediction System- Hệ thống mô hình dự báo giới hạn

khu vực

LFM: Limited Fine Mesh- Mô hình lưới mịn giới hạn

LR:Linear Regression - Hồi quy tuyến tính

MLR: Multi Linear Regression - Hồi quy tuyến tính đa biến

MOS:Model Output Statistics - Phương pháp dự báo thống kê động lực sau

mô hình

NCEP: National Centers for Environmental Prediction - Trung tâm dự báo

môi trường quốc gia Mỹ

Trang 12

NeTCDF:Network Common Data Form - Tên một loại định dạng file

NGM:Nested Grid Model- Mô hình lưới lồng

NWP: Numerical Weather Prediction - Dự báo thời tiết số trị

POD:Probability Of Detection - Xác suất phát hiện hiện tượng

POP: Probability Of Precipitation - Xác suất xảy ra mưa

PP:Perfect Prognosis - Phương pháp dự báo hoàn hảo

PQPF:Probabilistic Quantitative Precipitation Forecast - Dự báo xác suất

định lượng mưa

ROC: Relative Operating Characteristic- Đường đặc trưng hoạt động

ROCA: Relative Operating Characteristic Area - Diện tích đường đặc trưng

VCE: Vertical Change of Elevation- Biến đổi theo địa hình

WRF-ARW:Weather Reasearch and Forecasting Model-Mô hình dự báo

khu vực của Mỹ

Trang 13

MỞ ĐẦU

Dự báo mưa, đặc biệt dự báo định lượng mưa là một vấn đề rất khó khăn, đồng thời cũng là một trong những yêu cầu cấp thiết trong công tác dự báo, đặc biệt trong dự báo bão, lũ, phục vụ phòng chống thiên tai và phát triển kinh tế-xã hội, điều tiết hồ chứa Việc sử dụng phương pháp synốp truyền thống chỉ có thể dự báo mưa một cách định tính Tuy các mô hình dự báo thời tiết số trị (NWP) có thể đưa

ra những dự báo định lượng, nhưng những sản phẩm dự báo trực tiếp từ mô hình

(DMO-Direct Model Output) thường có những sai số hệ thống nhất định liên quan

đến nhiều yếu tố, đặc biệt là vấn đề tham số hóa Hơn nữa, DMO cũng chưa tính đến các yếu tố địa phương của chính những địa điểm dự báo

Từ lâu, phương pháp dự báo thống kê bằng cách xây dựng các phương trình hồi quy tuyến tính đơn giản giữa yếu tố dự báo với các yếu tố đã biết (nhưng không phải từ mô hình số trị) đã được áp dụng trong dự báo thời tiết.Từ khi mô hình dự báo số được đưa vào nghiệp vụ, phương pháp thống kê có kết hợp với các sản phẩm của mô hình bắt đầu được hình thành để tăng cường thêm những kết quả của dự báo động lực trong dự báo nghiệp vụ.Hai phương pháp thống kê cơ bản không có và có

sử dụng sản phẩm của mô hình NWP là Dự báo hoàn hảo (PP-Perfect Prognosis)

và Thống kê sau mô hình (MOS-Model Ouput Statistics).Về cơ bản, cả hai cách tiếp

cận này đều sử dụng các phương trình hồi quy nhiều biến, trong đó các nhân tố được lựa chọn thông qua một sơ đồ tuyển chọn nhân tố.Hiện nay, ở hầu hết các Trung tâm dự báo trên thế giới, song song với việc đưa ra các sản phẩm mô hình thường có các chỉ dẫn thống kê (guidance) để thêm giá trị vào những sản phẩm trực tiếp của mô hình.Đây là phương thức hợp lý để diễn xuất mô hình một cách khách quan nhằm loại bỏ những sai số của mô hình và dự báo định lượng cho địa điểm có tính đến các điều kiện khí hậu và địa phương cụ thể.Cơ quan Khí tượng Mỹ là nơi

đã áp dụng phương pháp MOS nhiều nhất đối với các mô hình khác nhau để đưa ra các sản phẩm dự báo nghiệp vụ Ngoài ra, Trung tâm Dự báo hạn vừa Châu Âu (ECMWF), Cơ quan Khí tượng Úc (BOM), Cơ quan Khí tượng Hồng Kông (HKO),

Trang 14

Cục Khí tượng Trung Quốc (CMA),…cũng áp dụng phương pháp MOS đối với mô hình nghiệp vụ để nâng cao chất lượng dự báo DMO

Trong Luận vănlựa chọn phương pháp UMOS thay vì phương pháp hồi quy tuyến tính truyền thống Sự khác biệt cơ bản mang đến tính ưu việt của phương pháp UMOS là so với cách tiếp cận hồi quy tuyến tính đa biến là: UMOS đặt trọng tâm vào ma trận SSCP (Sums of Squares and Cross Products, tích của ma trận chuyển vị và ma trận của nhân tố dự báo) và thực hiện giải hệ phương trình tuyến tính trên ma trận này để xác định tập hệ số hồi quy tuyến tính Điều quan trọng là khi mô hình thay đổi, ma trận SSCP sẽ được tính thông qua một phương pháp lấy trọng số giữa ma trận SSCP cũ và mới.Dự báo cần hiệu chỉnh được lấy từ sản phẩm

dự báo của mô hình khu vực khu vực WRF-ARW, các phương trình UMOS sẽ được xây dựng chi tiết cho từng điểm trạm có quan trắc trên lãnh thổ Việt Nam Đối với bài toán dự báo mưa tích lũy 24 giờ trong Luận văn sẽ tập trung vào bài toán dự báo xảy ra mưa hay không (dự báo pha) với ngưỡng mưa 0.1mm/24 giờđược xem là ngưỡng để xác định có hay không xảy ra mưa Số liệu để xây dựng các phương trình dự báo được lấy từ dự báo của các mô hình WRF-ARW từ năm 2011 đến năm

2013 và đánh giá độc lập trong hai năm 2014 và 2015

Một số kết quả chính thu được cho thấy phương pháp UMOS đãcải thiện chất lượng dự báo đáng kể so với DMO của mô hình WRF-ARW Các giá trị BSS dương và lớn chỉđược tìm thấy trong các phương trình dự báo POP mùa đông và mùa hè theo UMOS Với phương pháp UMOS, chất lượng dự báo POP của các phương trình mùa đông và mùa hè cũng có nhiều khác biệt.Chất lượng dự báo vào mùa đông tốt hơn nhiều so với mùa hè tại tất cả các khu vực.Chất lượng hạn dự báo

24 giờ luôn tốt hơn 48giờ.Bên cạnh đó, mức độ cải thiện chất lượng dự báo POP của UMOS còn đạt cả khả năng dự báo xác suất hiện tượng cũng như khả năng phân hoạch giữa các sự kiện xảy ra hay không xảy ra

Cấu trúc Luận văn gồm: Phần Mở đầu, 3 Chương, Kết luận, Danh mục tài liệu tham khảo và Phụ lục:

Trang 15

MỞ ĐẦU

Chương 1: Tổng quan về vấn đề nghiên cứu

1.1 Tổng quan về các phương pháp thống kê sau mô hình

1.2 Tình hình nghiên cứu nước ngoài

1.3 Tình hình nghiên cứutrong nước

Chương 2: Số liệu và phương pháp nghiên cứu

2.1 Số liệu

2.1.1 Số liệu quan trắc 2.1.1 Số liệu dự báo 2.2 Phương pháp nghiên cứu

2.2.1 Phương pháp UMOS 2.2.2 Phương pháp GMOS 2.3 Áp dụng phương pháp UMOS cho bài toán dự báo POP

2.3.1 Xác định yếu tố dự báo 2.3.2 Xác định nhân tố dự báo 2.3.3 Xây dựng phương trình dự báo POP 2.4 Phương pháp đánh giá kết quả dự báo POP

2.4.1 Điểm số Brier 2.4.2 Biểu đồ tin cậy 2.4.3 Đường đặc trưng hoạt động ROC và chỉ số ROCA 2.5 Xây dựng hệ thống GMOS để đưa dự báo UMOS từ điểm trạm về lưới phân giải cao

Chương 3: Kết quả và đánh giá

3.1 Kết quả xây dựng phương trình dự báo

3.2 Kết quả đánh giá dự báo

3.2.1 Đánh giá các chỉ số kỹ năng 3.2.2 Biểu đồ tin cậy

3.3 Thử nghiệm kết quả hiển thị dưới dạng lưới GMOS cho dự báo POP KẾT LUẬN

Trang 16

TÀI LIỆU THAM KHẢO

PHỤ LỤC

Trang 17

CHƯƠNG I: TỔNG QUAN

1.1.Tổng quan về các phương pháp thống kê sau mô hình

Như đã biết, có rất nhiều phương pháp dự báo khí hậu và dự báo thời tiết nghiệp vụ đều dựa trên nền tảng của phương pháp thống kê.Điều này là do khí quyển là một hệ thống động lực phi tuyến nên không thể dự báo chính xác theo quan điểm dự báo tất định (deterministic) Vì vậy, các phương pháp thống kê thực

sự cần thiết và trở thành một phần không thể thiếu của các hệ thống dự báo.Trong khoa học khí quyển, việc ứng dụng các phương pháp thống kê trong dự báo nghiệp

vụ có thể phân làm 2 dạng: Dự báo thống kê cổ điển và Dự báo thống kê động lực (Wilks, 1995, 2006) Phương pháp dự báo thống kê cổ điển được nghiên cứu phát triển trước khi có các sản phẩm dự báo thời tiết số (NWP)và chủ yếu được ứng dụng cho dự báo khí hậu Với sự phát triển của khoa học khí quyển và công nghệ tính toán, các sản phẩm NWP được sử dụng rộng rãi và dẫn đến sự ra đời của phương pháp dự báo thống kê động lực do các thông tin dự báo trực tiếptừ mô hình NWP (DMO) vẫn chưa thực sự chính xác Mục đích chính của phương pháp dự báo thống kê động lực (MOS) là sử dụng các thông tin NWP kết hợp với các công cụ tính toán thống kê để tăng cường chất lượng dự báo của DMO Hiện tại, phương pháp này được sử dụng tại hầu hết các Trung tâm dự báo trên thế giới và đóng vai trò như là các hệ thống diễn giải (guidance) trợ giúp cho các dự báo viên trong nghiệp vụ dự báo Phương pháp này thực sự quan trọng trong việc cung cấp các bản tin dự báo định lượng hoặc dự báo cho các điểm không thuộc lưới tính toán của mô hình NWP

Về cơ bản, MOS đều sử dụng các thông tin dự báo từ mô hình như là các nhân tố dự báo, trong đó các phương trình dự báo được xây dựng dựa trên mối quan

hệ giữa các dự báo từ thời điểm trước đó của mô hình NWP nhưng xác định tại thời điểm hiện tại với quan trắc hiện tại của yếu tố dự báo Kể từ khi ra đời cho đến nay, cách tiếp cận MOS đã được nghiên cứu và sử dụng trong nghiệp vụ tại nhiều Trung tâm Khí tượng trên thế giới Cụ thể, Mỹ là nơi đã áp dụng MOS nhiều nhất đối với các mô hình khác nhau để đưa ra các sản phẩm dự báo nghiệp vụ như hệ thống

Trang 18

NGM-MOS dự báo cho khoảng 600 địa điểm trên nước Mỹ cho thời hạn 06 đến 60 giờ Ngoài ra, Trung tâm Dự báo hạn vừa Châu Âu (ECMWF) cũng sử dụng phương pháp MOS đối với sản phẩm mô hình của mình Cơ quan Khí tượng Úc cũng áp dụng phương pháp MOS đối với mô hình nghiệp vụ GAPS và LAPS cho hơn 600 địa điểm dự báo với thời hạn đến 7 ngày Phương pháp MOS cũng được sử dụng trong nghiệp vụ ở Tổng cục Khí tượng Trung Quốc (CMA) từ năm 1984, dự báo cho khoảng 260 địa điểm với thời hạn 24 đến 60 giờ Tại Hồng Kông, dự báo POP được dựa trên phương pháp LR và áp dụng cho hệ thống dự báo tổ hợp thu nhận được của ECMWF Nói chung, hầu hết các Trung tâm dự báo trên thế giới đều

sử dụng cách tiếp cận MOS để nâng cao chất lượng dự báo mưa từ các mô hình NWP, trong đó các phương pháp thống kê được sử dụng có thể khác nhau tùy thuộc vào từng hiện tượng được dự báo

1.2.Tình hình nghiên cứu nước ngoài

Những nỗ lực nghiên cứu áp dụng các phương pháp thống kê trong bài toán

dự báo xác suất định lượng mưa (PQPF) đầu tiên phải kể đến công trình nghiên cứu của Klein (1968) dựa trên cách tiếp cận dự báo hoàn hảo (PP) Tiếp theo thành công của Klein (1968), Glahn và Lowry (1972) là những ngườiđã tiên phong trong việc ứng dụng MOS nhằm mục đích: Nâng cao chất lượng dự báo mưa từ mô hình NWP;dự báo cho các điểm không được dự báo trực tiếp từ mô hình NWP và áp dụng cho bài toán hạ quy mô (downscaling) Đối với bài toán PQPF, mô hình MOS của Glahn và Lowry (1972) được xây dựng dựa trên phương pháp hồi quy tuyến tính đa biến (MLR) với yếu tố dự báo là xác suất xảy ra mưa thay vì lượng mưa hiểu theo nghĩa thông thường Cụ thể, lượng mưa quan trắc sẽ được quy về biến nhị phân trong đó nhận giá trị 1 nếu có mưa xảy ra (xác suất 100%) và giá trị 0 nếu không có mưa xảy ra (xác suất 0%) Glahn và Lowry (1972) gọi phương pháp thống

kê này là mô hình POP (Probability Of Precipatation) Quá trình tuyển chọn nhân tố

cho mô hình POP được thực hiện dựa trên phương pháp hồi quy từng bước với tiêu chuẩn dừng tuyển chọn dựa trên chỉ số đánh giá Brier Trong nghiên cứu này, Glahn

và Lowry (1972) không phát triển các phương trình MOS cho tất cả các trạm mà

Trang 19

dựa trên các đặc trưng khí hậu để nhóm các trạm vào trong các nhóm khác nhau và phát triển các phương trình MOS cho từng nhóm trạm này

Kế thừanhững thành công trong nghiên cứu của Glahn và Lowry (1972), rất nhiều nghiên cứu dựa trên cách tiếp cận MOS cho bài toán PQPF đã được thực hiện như nghiên cứu của Wasserman (1972), Lowry và Glahn (1976), Paegle (1974), Bermowitz (1975), Arritt và Frank (1985),…cho các trạm thuộc nước Mỹ; Tapp và cộng sự (1986) cho Úc; Lemcke và Kruizinga (1988) cho Hà Lan, Brunet và cộng

sự (1988) cho Canađa,…Hầu hết các nghiên cứu này dựa trên ý tưởng về mô hình POP của Glahn và Lowry (1972) nhưng đã được địa phương hóa và có một số điểm khác biệt liên quan đến các tùy chọn về ngưỡng mưa, tập nhân tố, dung lượng mẫu, mùa dự báo, tiêu chí tuyển chọn nhân tố,…Tuy nhiên, có một kết quả chung mà tất

cả các nghiên cứu nói trên chỉ ra các kết quả dự báo từ MOS đã cho thấy sự cải thiện đáng kể chất lượng dự báo so với DMO, dự báo khí hậu quán tính và dự báo chủ quan của dự báo viên Đặc biệt, cách tiếp cận MOS còn được ứng dụng để phát triển các phương trình dự báo lượng mưa trung bình lưu vực sông như trong các nghiên cứu của Charba (1998), Antolik (2000), Sokol (2003),…

Nói chung, những nghiên cứu ứng dụng MOS đầu tiên cho bài toán PQPF được dựa trên phương pháp MLR Với phương pháp thống kê này, có hai hạn chế

mà các nghiên cứu gặp phải đó là: Sự quá khớp (overfitting) của các phương trình

dự báo (có thể tạo ra các dự báo PQPF lớn hơn 1 hoặc nhỏ hơn 0 khi áp dụng cho tập số liệu độc lập) và quan hệ phi tuyến giữa yếu tố dự báo và các nhân tố dự báo không thể đưa vào trong tính toán Để giải quyết hai hạn chế này, một số phương pháp thống kê phi tuyến đã được đề xuất bao gồm phương pháp hồi quy logistic (LR) và mạng thần kinh nhân tạo (ANN) Nghiên cứu ứng dụng LR đầu tiên cho bài toán PQPF là của Applequist và nnk (2002) Trong nghiên cứu này, các tác giả đã đánh giá kỹ năng dự báo PQPF dựa trên một số phương pháp thống kê khác nhautrong đó MLR được sử dụng như là dự báo đối chứng Các kết quả đánh giá đã cho thấy phương pháp LR là có kỹ năng tốt hơn cả Đối với các phương pháp còn lại, sự cải thiện là không rõ ràng Ngoài nghiên cứu của Applequist và cộng sự

Trang 20

(2002), một số nghiên cứu ứng dụng LR cho bài toán PQPF phải kể đến là Gahrs và cộng sự (2003), Hamill và cộng sự (2004), Sloughter và cộng sự (2007) Đối với việc ứng dụng phương pháp ANN cho bài toán PQPF, đã có rất nhiều công trình nghiên cứu đề cập đến vấn đề này như Lindner and Krein (1993), Navone và Ceccatto (1994), Kuligowski và Barros (1998a,b), Hall và nnk (1999), Marban (2003), Nói chung, hầu hết các nghiên cứu này đều cho thấy sự cải thiện trong chất lượng dự báo PQPF khi áp dụng phương pháp ANN Ngoài ra, một kết quả quan trọng có thể rút ra từ những nghiên cứu nói trên là về cấu trúc của mạng ANN phù hợp cho bài toán PQPF, đó là một mạng gồm 3 lớp: một lớp đầu vào, một lớp ẩn và một lớp đầu ra Các hàm truyền trong mạng ANN nói trên đều có dạng hàm sigma phi tuyến giống như phương pháp hồi quy logistic

Tuy nhiên, vào những năm 90 bắt đầu nhận thấy những hạn chế của MOS dẫn đến giảm dần sử dụng MOS trong diễn giải dự báo.Vì khi xây dựng các phương trình hồi quy, tập số liệu mô hình dùng làm nhân tố dự báo phải đồng nhất Theo đánh giá của Jacks và nnk (1990) để có được một quan hệ thống kê ổn định, cần ít nhất hai năm số liệu dự báo từ mô hình và thám sát Sau đó khi sử dụng MOS, các đặc trưng của mô hình dự báo như các sơ đồ tham số hóa, độ phân giải, cần được giữ nguyên như khi sử dụng mô hình để thiết lập quan hệ thống kê Điều này rõ ràng là một hạn chế lớn của MOS, vì ta biết rằng từ thập kỷ 90 với sự phát triển nhanh của tốc độ tính toán cũng như các hệ thống quan trắc, các mô hình thường xuyên được cập nhật với độ phân giải ngày càng cao, các sơ đồ tham số hóa tinh tế hơn, trường phân tích chính xác hơn Erikson và nnk (2002) cho thấy sai số hệ thống sẽ xuất hiện khi sử dụng MOS với mô hình được cải tiến Do đó, khi mô hình

có sự thay đổi ta phải đợi ít nhất hai năm mới có thể bắt đầu sử dụng MOS trong dự báo hoặc dự báo lại với mô hình đã thay đổi cho hai năm trước đó nhằm xác định lại các hệ số hồi quy Với số phương trình hồi quy rất lớn (tại mỗi trạm, cho mỗi biến

và mỗi hạn dự báo có một phương trình hồi quy riêng biệt), chi phí cho tái xây dựng

hệ thống MOS khi mô hình thay đổi là khá lớn

Trang 21

Ví dụ thông qua hệ thống MOS của Mỹ: Hệ thống MOS đầu tiên được xây dựng cho mô hình LFM vào năm 1976,đến năm 1990 hệ thống này được thay thế bởi hệ thống MOS cho mô hình NGM (Jacks và nnk, 1990).Từ năm 1993, mô hình ETA bắt đầu được đưa vào chạy nghiệp vụ tại NCEP thay thế cho mô hình LFM

Do mô hình ETA thường xuyên được cải tiến, không có hệ thống MOS nào được xây dựng cho mô hình này trong suốt những năm 90 (Mao và nnk, 1999) Phải đến năm 2002 khi hệ thống dự báo với mô hình ETA đã trở nên ổn định, hệ thống MOS cho ETA mới bắt đầu được thực hiện (Dallavalle và nnk, 2004) Với hệ thống mới này, các tác giả đã tính đến khả năng mô hình thay đổi trong quá trình sử dụng MOS bằng cách lựa chọn một lưới tính cố định cho MOS thường có độ phân giải thô hơn so với độ phân giải mô hình hay làm trơn các nhân tố dự báo (Erikson và nnk, 2002)

Để giải quyết hạn chế này của phương pháp MOS truyền thống khi mô hình liên tục có sự thay đổi, người ta sử dụng các phương pháp thống kê có khả năng tự cập nhật Thông tin sẽ được truyền vào phương trình dự báo ngay khi có những thay đổi trong mô hình dự báo Hiện tại có hai phương pháp cho phép hệ phương trình

dự báo tự cập nhật:

+ Phương pháp thứ nhất: Sử dụng lọc Kalman, thay vì cố định các hệ số

hồi quy trong phương trình hồi quy, các hệ số này sẽ được cập nhật hàng ngày theo thời gian (Simonsen 1991, Homleid 1995) Cần chú ý là tên gọi lọc Kalman có thể gây hiểu lầm về một phương pháp lọc nhiễu.Thực tế lọc Kalman là một phương pháp đánh giá tối ưu trạng thái của một hệ thống thể hiện qua các biến trạng thái từ các quan trắc gián tiếp (Grewal và Andrews, 2001)

+ Phương pháp thứ hai: Về cơ bản vẫn sử dụng phương pháp MOS truyền

thống nhưng đưa thêm khả năng tự cập nhật cho MOS thông qua một phương pháp lấy trọng số giữa hai tập dữ liệu cũ và mới khi có thay đổi trong mô hình (Wilson và

Vallée, 2002) với tên gọi UMOS Nếu mô hình không có cải tiến nào đáng kể,

UMOS sẽ trở thành phương pháp MOS thông thường

Trang 22

Ngoài ra, một số tác giả đề xuất một số phương pháp mới thay thế cho MOS với tập số liệu mẫu ngắn hơn (Mao và cộng sự, 1999) hoặc phương pháp phi tuyến thông qua mạng tế bào thần kinh có khả năng tự cập nhật (Yuval và Hsieh, 2003) Cần lưu ý khi sử dụng các phương pháp phi tuyến thay thế cho phương pháp hồi quy tuyến tính, vấn đề thay đổi của mô hình khi sử dụng MOS vẫn không được giải quyết

Cả hai phương pháp này cùng xuất hiện những năm đầu thập kỷ 90 và nhanh chóng được các Trung tâm dự báo trên thế giới triển khai ứng dụng, đặc biệt là lọc Kalman Được đề xuất bởi các tác giả Bắc Âu, lọc Kalman nhanh chóng được triển khai thực hiện đầu tiên tại các nước Đan Mạch (Simonsen, 1991), Nauy (Homleid, 2004) hay Iceland (Crochet, 2004) Sau đó phương pháp này dần được các nước khác tại Châu Âu sử dụng như Pháp (Météo France, 2002), Đức (Haalman, 2003), Rumani (Diaconu, 2002), Hy Lạp (Golanis và Anadranistokis, 2002), Tại các nước Đông Á, lọc Kalman được ứng dụng nhiều trong hệ thống diễn giải dự báo hạn ngắn tại Cơ quan Khí tượng Nhật Bản (JMA) và Cơ quan Khí tượng Hàn quốc (KMA)

Từ năm 1996, JMA chủ yếu sử dụng lọc Kalman trong diễn giải kết quả dự báo từ

mô hình cho mọi yếu tố khí tượng cơ bản: mưa, gió, nhiệt độ (JMA, 2006) Tại Hàn Quốc, dự báo nhiệt độ cho 40 điểm trạm của Hàn Quốc cùng 32 điểm khác tại CHDCND Triều Tiên, Trung Quốc, Nhật Bản theo phương pháp lọc Kalman và một biến thể của nó là DLM (Joo, 2006) Riêng với phương pháp UMOS, dù được phát triển tại Mỹ nhưng lại được ứng dụng tại Canada (Wilson và Vallée, 2002, 2003)

1.3.Tình hình nghiên cứu trong nước

Kể từ năm 2000, khi mô hình số dự báo thời tiết đầu tiên HRM bắt đầu được đưa vào chạy dự báo tại Việt Nam, cho đến nay có nhiều mô hình khác nhau đang được chạy nghiên cứu hay dự báo thử nghiệm tại một số Trung tâm dự báo và nghiên cứu của Việt Nam Tuy nhiên, một hệ thống diễn giải dự báo cho các sản phẩm dự báo từ mô hình NWP vẫn chưa được triển khai nghiệp vụ tại Việt Nam cho đến trước năm 2008 Tại cácTrung tâm có sử dụng mô hình dự báo, sản phẩm

Trang 23

dự báo cuối cùng vẫn là sản phẩm dự báo trực tiếp từ mô hình, chưa có bất kỳ hiệu chỉnh nào

Trong nỗ lực tăng cường chất lượng dự báo từ các mô hình NWP, Võ Văn Hòa và cộng sự (2007) đã thử nghiệm lọc Kalman để hiệu chỉnh dự báo từ mô hình HRM Mặc dù phương trình thống kê mà nhóm tác giả đã sử dụng còn đơn giản, kết quả hiệu chỉnh cho thấy những cải tiến đáng kể và chỉ ra khả năng phát triển dự báo thống kê sau mô hình ở Việt Nam

Bên cạnh việc ứng dụng trực tiếp từ mô hình, dự báo tổ hợp (DBTH) cũng đang ở trong giai đoạn bước đầu tìm hiểu và thử nghiệm Các nghiên cứu ứng dụng DBTH đầu tiên tập trung vào bài toán dự báo quỹ đạo bão trên khu vực Biển Đông dựa trên tổ hợp các dự báo từ các Trung tâm dự báo bão quốc tế như các nghiên cứu của Nguyễn Chi Mai và nnk (2004), Đỗ Lệ Thủy và nnk (2009) Trong những nghiên cứu này, các phương pháp tính toán trung bình tổ hợp (TBTH) với các trọng

số tỷ lệ nghịch với sai số dự báo của từng dự báo thành phần tương ứng và hồi quy tuyến tính đa biến được sử dụng Các kết quả đánh giá cho một số mùa bão từ 2000-

2004 đã cho thấy chất lượng dự báo TBTH được xác định theo các cách tiếp cận nói trên đã được cải thiện so với TBTH dạng trung bình đơn giản (trọng số như nhau)

Vẫn theo hướng nghiên cứu dự báo bão, Trần Tân Tiến và nnk (2010, 2013)

đã thử nghiệm các phương án tính toán TBTH khác nhau dựa trên tổ hợp đa mô hình đa vật lý cho mục đích dự báo quỹ đạo và cường độ bão hạn từ 3-5 ngày trên khu vực Tây Bắc Thái Bình Dương Các kết quả nghiên cứu từ các đề tài nghiên cứu khoa học (NCKH) cấp Nhà nước mang mã số KC.08.05 và KC.08.01 này đã cho thấy việc tính toán TBTH theo các trọng số khác nhau đã cải thiện được chất lượng dự báo quỹ đạo và cường độ bão so với trung bình đơn giản (trọng số như nhau)

Đối với bài toán dự báo các trường khí tượng, trong khuôn khổ đề tài NCKH cấp Nhà nước mang mã số KC.09.04, Trần Tân Tiến và nnk (2004) đã thử nghiệm

tổ hợp các trường khí tượng từ các mô hình NWP khác nhau dưới dạng trung bình cộng đơn giản và có trọng số Các kết quả thử nghiệm và đánh giá cũng cho thấy

Trang 24

việc lấy trung bình có trọng số theo sai số dự báo đã đem lại hiệu quả trong việc nâng cao chất lượng dự báo một số trường khí tượng trên Biển Đông Tiếp theo hướng nghiên cứu này, Trung tâm Dự báo khí tượng thủy văn Trung ương đã thử nghiệm một số phương pháp thống kê như trung bình trượt, hồi quy tuyến tính, hồi quy Gauss không thuần nhất để hiệu chỉnh DBTH cho một số trường quy mô lớn (áp, gió, ẩm) hay được tham khảo trong dự báo bão từ hệ thống tổ hợp (HTTH) đa

mô hình toàn cầu (Võ Văn Hòa và nkk (2007)) Các kết quả đánh giá dựa trên chuỗi

số liệu 3 năm (2005-2007) đã cho thấy chất lượng dự báo TBTH và xác suất đã được cải thiện đáng kể khi áp dụng các phương pháp thống kê nói trên để khử sai số

hệ thống trong các dự báo thành phần

Để thử nghiệm DBTH cho bài toán dự báo mưa lớn ở Việt Nam, Hoàng Đức Cường và nnk (2007) đã ứng dụng các phiên bản tham số hóa vật lý khác nhau trong mô hình MM5 để tạo ra DBTH Phương án tính toán TBTH có trọng số tỷ lệ nghịch với phương sai sai số của từng dự báo thành phần đã được thực hiện Các kết quả thử nghiệm cho một số đợt mưa lớn năm 2004 và 2005 cho thấy không có nhiều

sự khác biệt trong chất lượng dự báo mưa lớn bằng DBTH trọng số như nhau và có trọng số thay đổi Gần đây, Hoàng Đức Cường và nnk (2011) đã thử nghiệm DBTH cho mục đích dự báo bão và một số hiện tượng thời tiết dựa trên mô hình WRF và MM5 Cũng tương tự như nghiên cứu của nhóm tác giả này năm 2007, phương án tính TBTH có và không có trọng số được thử nghiệm cho cả bài toán dự báo bão và mưa lớn Các kết quả thử nghiệm cho các năm 2005-2007 đã thấy DBTH có trọng

số tốt hơn DBTH trung bình đơn giản trong một số hình thế thời tiết cụ thể

Bùi Minh Tăng và cộng sự (2009) đã thử nghiệm dự báo định lượng mưa cho hạn dựa báo 24 giờ dựa trên một số phương pháp MOS truyền thống như hồi quy tuyến tính đa biến (MLR), phân tích riêng biệt (MDA), mạng thần kinh nhân tạo (ANN) và hồi quy logistic (LR) từ sản phẩm của mô hình HRM và GSM Các phương trình MOS được phát triển cho cả mục đích dự báo định lượng và dự báo xác suất Các kết quả đánh giá đã cho thấy kỹ năng dự báo mưa đã được cải thiện so với dự báo trực tiếp từ mô hình, trong đó phương pháp MLR có kỹ năng tốt nhất và

Trang 25

hiệu quả nhất về mặt tính toán Ngoài ra, với cùng một phương pháp thống kê thì áp dụng cho mô hình GSM sẽ đem lại hiệu quả hơn so với mô hình HRM Tuy nhiên, các phương pháp được sử dụng trong nghiên cứu này vẫn bộc lộ những hạn chế của phương pháp MOS truyền thống

Năm 2009, Đỗ Lệ Thủy và cộng sựlần đầu tiênđã nghiên cứu ứng dụng các phương pháp MOS tự cập nhật trọng số (UMOS) và lọc Kalman (KF) để thử nghiệm dự báo cho một số yếu tố khí tượng bề mặt như nhiệt độ, gió, độ ẩm cho đến hạn dự báo 72 giờ cho 6 giờ một Chất lượng dự báo các yếu tố này đã được tăng lên đáng kể sau khi thực hiện hiệu chỉnh thống kê sau mô hình UMOS và KF trên các sản phẩm mô hình So sánh hai phương pháp UMOS và KF, hiệu chỉnh dự báo theo phương pháp UMOS thường tạo ra một dự báo có sai số nhỏ hơn so với phương pháp KF, một phần do KF chưa thực hiện dự báo đồng thời như UMOS.Tuy nhiên, yếu tố quan trọng nhất và được quan tâm nhất trong các bản tin

dự báo thời tiết là lượng mưa lại chưa được đề cập đến trong nghiên cứu theo hướng thống kê sau mô hình có cập nhật này Ngoài ra, so với các hệ thống diễn giải sau

mô hình hoàn chỉnh của nước ngoài, các hệ thống UMOS và KF được phát triển còn thiếu yếu tố tầm nhìn xa và độ cao chân mây

Năm 2014, Võ Văn Hòa và các cộng sự đã cải tiến phương pháp KF để có thể áp dụng cho dự báo đồng thờivà áp dụng UMOS, KF và GMOS cho 3 yếu tố lượng mưa, tầm nhìn xa và độ cao chân mây để tạo ra một hệ thống MOS hoàn chỉnh Kết quả từ nghiên cứu này cũng cho thấy 2 phương pháp UMOS và KF đều

có chất lượng dự báo tốt hơn so với DMO và UMOS có chất lượng dự báo tốt hơn

so với KF đối với hầu hết các yếu tố dự báo, hạn dự báo ở tất cả các khu vực nghiên cứu

Mặc dù vậy, các nghiên cứu trước đây tại Việt Nam về áp dụng phương pháp UMOS để cải thiện chất lượng dự báo các yếu tố đều dựa trên sản phẩm của mô hình toàn cầu là GSM với độ phân giải chưa cao là 0.5 độ Trong khi đó hiện tại các sản phẩm dự báo từ mô hình khu vực có độ phân giải cao hơn nhiều thì chưa có một nghiên cứu nào hướng tới.Vì vậy, trong Luận văn sẽ sử dụng phương pháp UMOS

Trang 26

dựa trên sản phẩm của mô hình khu vực WRF-ARW có độ phân giải 16km, đểdự báo POP nhằm nâng cao chất lượng dự báo pha mưa tại khu vực Việt Nam

Trong phạm vi Luận vănnày sẽ áp dụng phương pháp UMOS với sản phẩm

dự báo của mô hình khu vực WRF-ARW Các phương trình UMOS sẽ được xây dựng chi tiết cho từng điểm trạm có quan trắc trên lãnh thổ Việt Nam Đối với bài toán dự báo mưa tích lũy 24 giờ trong Luận văn tập trung vào bài toán dự báo xảy

ra mưa hay không (dự báo pha) với ngưỡng mưa 0.1mm/24 giờđược xem là ngưỡng

để xác định có hay không có xảy ra mưa Các chỉ số đánh giá kỹ năng cải thiện của phương pháp UMOS so với sản phẩm dự báo trực tiếp từ mô hình gồm POD, FAR

và ETS Số liệu để xây dựng các phương trình dự báo được lấy từ dự báo của các

mô hình WRF-ARW từ năm 2011 đến năm 2013 và đánh giá trong hai năm 2014 và

2015 Chi tiết về số liệu sử dụng và phương pháp xây dựng phương trình sẽ được dẫn giải chi tiết trong Chương 2 dưới đây và các kết quả áp dung cho mô hình WRF-ARW sẽ được đưa ra trong Chương 3

Ngoài việc xây dựng dự báo tại từng điểm trạm, một sự mở rộng về kết quả ở dạng lưới mô hình GMOS (Chương 2, mục 2.2.2) cũng sẽ được đề cập, qua đó đánh giá khả năng đưa vào ứng dụng trong thực tế

Trang 27

CHƯƠNG II: SỐ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU 2.1.Số liệu

Để xây dựng các phương trình dự báo POP tại các điểm trạm của Việt Nam theo phương pháp UMOS, trong Luận văn đã sử dụng số liệu quan trắc và dự báo từ tháng 01/01/2011 cho đến tháng 31/12/2015.Trong đó, chuỗi số liệu từ01/01/2011 đến 31/12/2013 được sử dụng để làm tập dữ liệu phụ thuộc trong quá trình xây dựng các phương trình dự báo POP Chuỗi số liệu từ01/01/2014 đến 31/12/2015 đóng vai trò làm tập số liệu độc lập và các kết quả đánh giá chất lượng dự báo sẽ thực hiện trên chuỗi số liệu này

2.1.1.Số liệu quan trắc

Số liệu quan trắc được sử dụng trong Luận văn là lượng mưa tích lũy 24 giờ, tính từ 00h00 GMT ngày hôm trước đến 00h00 GMT ngày hôm sau(để phân biệt số liệu mưa ngày tính từ 19h00 ngày hôm trước đến 19h00 ngày hôm sau) tại 171 điểm trạm trên 9 khu vực của Việt Nam Số lượng các trạm quan trắc tại các khu vực được thể hiện trong Bảng 2.1

Bảng 2.1:Số lượng các trạm quan trắc tại các Đài KTTV khu vực

TT Tên Đài KTTV khu vực Số lượng trạm khí tượng

Trang 28

2.1.2.Số liệu dự báo

Số liệu dự báo sử dụng được lấy từ sản phẩm của mô hình dự báo khu vực WRF-ARW với điều kiện biên và điều kiện đầu vào từ sản phẩm của mô hình toàn cầu GSM Đây là một thành phần trong hệ thống dự báo tổ hợp hạn ngắn SREPS hiện đang được chạy tại Trung tâm Dự báo KTTV Trung ương Số liệu của mô hình WRF-ARW sao lưu theo định dạng NetCDF và được quản lý trong cơ sở dữ liệu dưới dạng cấu trúc cây thư mục và tên tệp tin Mỗi tệp tin NetCDF sẽ chứa toàn bộ các trường phân tích và dự báo từ mô hình WRF-ARW cần thiết để xây dựng bộ nhân tố dự báo sơ tuyển tại một phiên dự báo

Mô hình WRF-ARW sử dụng có hạn dự báo đến 60 giờ, khoảng thời gian giữa các sản phẩm đầu ra là 03 giờ, với độ phân giải là 16km, miền dự báo từ 00-

280N và 950E-1280E

Hình 2.1: Miền định hướng dự báo của mô hình WRF-ARW

Dưới đây là cấu hình chi tiết của mô hình WRF-ARW mà Luận văn lựa chọn

Trang 29

Bảng 2.2: Cấu hình chi tiết của mô hình WRF-ARW

Cấu hình mô hình

Mô tả chi tiết WRF-ARW (Ver 3.1)

Động lực Hệ phương trình nguyên thủy, dạng

Hệ tọa độ thẳng đứng Sigma (σ)

Độ phân giải ngang (độ hoặc km) 17km x 17km

Trang 30

Y= a0 + a1X1+ … + apXp (2.1)

Từ tập số liệu quá khứ và áp dụng dự báo tương lai,các hệ số ai sẽ được xác định theo phương pháp bình phương tối thiểu dựa trên tập số liệu phụ thuộc dung lượng mẫu n Viết dưới dạng ma trận, công thức tính vector hệ số ai có dạng sau:

a = (XTX)-1XTy (2.2) Trong đó y là vector yếu tố dự báo kích thước n, X là ma trận nhân tố dự báo kích thước (p+1)×n, với mỗi vector cột, tương ứng vector nhân tố dự báo kích thước

n MOS không cố định trước tập p các nhân tố mà thực hiện hồi quy từng bước với

p tăng dần từ 1 cho đến một giá trị nào đó thỏa mãn tiêu chuẩn dừng Tại mỗi bước, bài toán hồi quy mà MOS thực hiện hoàn toàn đồng nhất với mô tả toán học ở trên

Nếu thực hiện như mô tả ở trên, khi muốn cập nhật phương trình dự báo (2.1) với tập số liệu phụ thuộc đã được mở rộng thêm từ n lên n+m (m là số ngày mới tích lũy thêm dữ liệu), toàn bộ quá trình phải được thực hiện lại từ đầu với hồi quy từng bước và tại mỗi bước phải giải các hệ phương trình tuyến tính (2.2) Với tập các nhân tố có thể vào khoảng 200, tại mỗi bước ta phải giải 200 hệ phương trình tuyến tính (2.1).Thông thường, mỗi phương trình dự báo sau khi thỏa mãn điều kiện dừng có khoảng 10 nhân tố, số lần giải phương trình sẽ là 2000 lần.Nhân lên với số trạm cần cập nhật, chi phí tính toán cho mỗi lần cập nhật sẽ rất lớn.Với tốc độ của máy tính hiện nay, khối lượng tính toán như trên có thể giảm thiểu nếu thực hiện tính toán song song cho nhiều trạm tại cùng một thời điểm.Khó khăn thực

sự nằm ở phương thức thiết kế, lưu trữ và sử dụng số liệu cho bài toán cập nhật.Với những vấn đề cố hữu như trên, các Trung tâm dự báo thường không thực hiện cập nhật phương trình dự báo theo ngày hay theo tháng mà thực hiện một lần duy nhất rồi áp dụng cho các năm kế tiếp hoặc cập nhật theo từng năm Với dung lượng tập phụ thuộc đủ dài, cách thực hiện như vậy vẫn đảm bảo một kết quả tốt do phương trình dự báo sẽ ổn định trên một tập dữ liệu đủ dài Tất nhiên, nếu tận dụng được tập

số liệu mới để tăng dung lượng tập phụ thuộc, phương trình dự báo thu được sẽ có chất lượng tốt hơn

Trang 31

Với các nghiên cứu của mình, Ross (1987, 1989, 1992) và sau đó là Wilson

và Vallee (2002) chỉ ra rằng vẫn có thể thực hiện cập nhật cho MOS mà chi phí tính toán không lớn nếu thực hiện theo cách thông thường Ý tưởng cập nhật được hình thành dựa trên biểu diễn lại dạng toán học của phương pháp hồi quy tuyến tính đa

biến Từ công thức (2.2) dễ thấy vector a được xác định thông qua ma trận XTX kích thước (p+1)×(p+1) và vector XTy kích thước p+1 Mỗi phần tử Mij của ma trận

XTX chỉ đơn giản là tích vô hướng giữa hai vector nhân tố dự báo kích thước n thứ i

và j, trong khi mỗi phần tử Vi của vector XTy là tích vô hướng giữa vector nhân tố

dự báo kích thước n thứ i với vector yếu tố dự báo kích thước n

Mij=

n 1 k

toàn bộ cho n+1 số hạng Khả năng cập nhật rõ ràng đã thể hiện ngay trong phân

tích trên Nếu muốn cập nhật, thay vì phải lưu chuỗi dữ liệu Xi hay Y với kích thước n tăng lên từng ngày, bài toán sẽ đơn giản hơn nếu ta chỉ cần lưu các phần tử Mij và Vi và thay đổi giá trị của chúng từng ngày bằng cách cộng thêm một số hạng

mới vào như trên Cách thực hiện này sẽ tiết kiệm dung lượng lưu trữ với một ma

trận và một vector kích thước không thay đổi (p+1)×(p+1) và p+1 so với ma trận nhân tố dự báo và vector yếu tố dự báo có dung lượng n tăng dần Các hệ số ai cuối cùng vẫn hoàn toàn được xác định theo công thức (2.2) của bài toán hồi quy tuyến tính đa biến

Tuy nhiên, bằng cách thay đổi điểm nhìn như vậy, phương pháp mới đòi hỏi tập các nhân tố p phải được xác định trước.Đây là chi phí phải trả cho việc đưa ý tưởng cập nhật vào MOS Điều này cũng đồng nghĩa quá trình hồi quy từng bước sẽ không được thực hiện và các nhân tố dự báo phải cố định giống như trong phương

Trang 32

pháp lọc Kalman.Một quá trình sơ tuyển cần được thực hiện tuyển chọn trước các nhân tố này.Thông thường p vào khoảng 10 và dung lượng lưu trữ được sử dụng cập nhật phương trình dự báo cho một trạm sẽ rất nhỏ với 132 số thực (11×11+11) Cách thức thực hiện này chính là UMOS dưới dạng đơn giản nhất và nếu so với MOS truyền thống thì khối lượng tính toán của nó là không đáng kể

Trong thực tế, khối lượng tính toán còn giảm hơn nữa do không cần thiết phải giải hệ phương trình (2.2) từng ngày, do các phương trình dự báo MOS có tính

ổn định cao Một thay đổi nhỏ trên thang thời gian ngày của ma trận XTX sẽ không

có tác động tới giá trị của tập hệ số a Phương trình (2.2) chỉ cần giải trên quy mô

tuần hoặc quy mô tháng và công việc hàng ngày chỉ liên quan đến cập nhật ma trận

XTX và vector XTY bằng cách cộng thêm một số hạng thích hợp vào mỗi phần tử Khối lượng tính toán chỉ tăng lên khi ta giải hệ phương (2.2) vào thời gian đã định trước theo tháng hay tuần

Hai ma trận XTX và vector XTY có tầm quan trọng đặc biệt trong phương

pháp UMOS Nếu coi vector yếu tố dự báo Y tương đương như các vector nhân tố

dự báo khác thì rõ ràng với cùng bản chất tích vô hướng, phần tử Vi của XTY không

có gì khác so với phần tử Mij của XTX Do đó, để đơn giản thay vì phải tách biệt và lưu trữ hai ma trận và vector, người ta ghép vector XTY vào cột cuối ma trận XTX

và gọi chung là ma trận SSCP (Sums of Squares and Cross Products) với kích thước

(p+2)×(p+1) Như tên gọi, SSCP thể hiện rõ bản chất tích vô hướng của nó.Tóm lại,

thay vì cách tiếp cận hồi quy tuyến tính đa biến, UMOS đặt trọng tâm vào ma trận

SSCP và thực hiện giải hệ phương trình tuyến tính trên ma trận này để xác định tập

hệ số ai

Cách tiếp cận này hoàn toàn trùng với phương pháp MOS truyền thống (tất nhiên trong trường hợp tập p nhân tố dự báo đã được cố định trước) và chỉ trở nên khác biệt nếu mô hình dự báo thay đổi Nếu vẫn thực hiện theo MOS truyền thống, khi mô hình thay đổi ta phải đợi một khoảng thời gian đủ dài để có thể phát triển một phương trình dự báo mới trong khi không thể sử dụng phương trình dự báo cũ

Dự báo sau mô hình sẽ không thể thực hiện trong khoảng thời gian đợi này và cách

Trang 33

giải quyết duy nhất có thể là chạy lại mô hình mới với thời gian trước đây nhằm xây dựng lại MOS Tuy nhiên, khi thay đổi điểm nhìn sang ma trận SSCP, vấn đề sẽ được giải quyết đơn giản hơn nếu xác định ma trận SSCP trong thời gian chuyển đổi giả định một quan hệ tuyến tính chuyển dần từ ma trận SSCP cũ sang ma trận SSCP mới và kết thúc khi mô hình mới đã có được một chuỗi dự báo đủ dài Giả thiết này không có cơ sở toán học (không tương đương với hồi quy tuyến tính đa biến) nhưng có thể chấp nhận về mặt ứng dụng và hiệu quả có thể có được trong giai đoạn chuyển đổi mô hình.Như vậy, khi mô hình thay đổi ma trận SSCP sẽ được tính thông qua một phương pháp lấy trọng số giữa ma trận SSCP cũ và mới

SSCP = woSSCPo + wnSSCPn(2.5) Wilson và Vallee (2002) đưa ra một công thức thực nghiệm cho trọng số này dưới dạng

max min

2 max max

N N

N N w

N

N w N

 với Nn ≤ Nmax(2.6)

wn=1, w0=0 với Nn > Nmax trong đó wn là trọng số cho ma trận SSCP mới, wo: trọng số cho ma trận SSCP cũ, Nn: dung lượng mẫu từ tập số liệu mới, No: dung lượng mẫu từ tập số liệu cũ, Nmin: dung lượng mẫu tối thiểu mà khi vượt quá mô hình mới bắt đầu tác động tới ma trận SSCP, Nmax: dung lượng mẫu tối đa mà khi vượt quá mô hình cũ được xem như không còn tác động tới ma trận SSCP, wmax: tham số điều khiển Dạng hàm này được hai tác giả lựa chọn trên nguyên tắc:

 Kết quả từ mô hình cũ không ảnh hưởng đến phương trình dự báo mới sau một khoảng thời gian đủ dài

 Mô hình ngay sau khi thay đổi sẽ không tác động tới giá trị của ma trận SSCP cho tới khi tích lũy được một dung lượng tối thiểu

So với lọc Kalman, MOS truyền thống có điểm mạnh nằm ở khả năng phân mùa dự báo do chất lượng dự báo của mô hình cũng có đặc tính phân mùa Phân

Trang 34

mùa dự báo cũng có thể thực hiện dễ dàng cho UMOS thông qua hai tập p nhân tố

dự báo khác nhau cho hai mùa Để làm trơn quá trình chuyển mùa, UMOS giống

như MOS có thể cập nhật thêm một số ngày của mùa còn lại trong thời đoạn chuyển mùa Nếu tập nhân tố dự báo như nhau cho cả hai mùa, Wilson và Vallee (2002) sử dụng thêm một sơ đồ trọng số chuyển mùa cho ma trận SSCP giữa hai mùa đông và

hè với trọng số có dạng hàm bậc thang (2/3,1/3), (1/2,1/2) cho tới (1/3,2/3) Các trọng số này còn được điều chỉnh bởi dung lượng mẫu ma trận SSCP mỗi mùa nhằm loại bỏ khả năng SSCP chịu tác động nhiều hơn bởi ma trận SSCP tương ứng với mùa có dung lượng lớn hơn

N

N N w

Như mô tả ở trên, nếu UMOS thực hiện phân mùa với hai tập nhân tố khác nhau, quá trình cập nhật của UMOS sẽ tách thành hai quá trình độc lập riêng cho

mùa đông và mùa hè Phương pháp thực hiện như vậy so với nguyên tắc liên tục tự cập nhật sẽ bị gián đoạn tại hai thời điểm chuyển mùa Nếu thực hiện nguyên tắc

này, UMOS phải cố định tập nhân tố dự báo cho cả hai mùa và quá trình phân mùa

theo nhân tố dự báo không được thực hiện theo phương thức phân mùa của MOS truyền thống Ngoài ra, tập nhân tố cố định thích hợp cho mô hình cũ, nhưng có thể không thích hợp cho mô hình mới cũng có thể dẫn đến chất lượng dự báo giảm Để

giải quyết vấn đề, UMOS sẽ được thực hiện phức tạp hơn tương tự như quá trình

hồi quy từng bước của MOS truyền thống

Tư tưởng của phương pháp có thể hiểu được nếu quan sát công thức (2.2) khi

ta có thể rút ra từ ma trận XTX một ma trận con tương ứng vector XTY một vector con chỉ chứa p’ biến mà ta quan tâm từ p biến tổng thể, sau đó giải hệ phương trình

có dạng tương tự như (2.2) nhưng cho ma trận con và vector con này để tìm các hệ

số ai cho tập p’ biến này Có thể rút ra nhiều tập p’ biến khác nhau từ tập p và đây là

Trang 35

cơ sở để thực hiện hồi quy từng bước Ta sẽ bắt đầu từ p’ bằng 1 và giải hệ phương trình dạng (2.2) trên mỗi tập con với một phần tử có thể để lựa chọn nhân tố đầu tiên, sau đó tiếp tục tăng p’ và dừng cho đến khi đạt được một tiêu chuẩn dừng nào

đó Theo phương pháp này, tập p các nhân tố dự báo ban đầu sẽ không cần cố định

và sử dụng trong phương trình dự báo giống như lọc Kalman Ta chỉ cần chọn ra một bộ p nhân tố đủ lớn các nhân tố có khả năng trở thành nhân tố dự báo nhưng cũng không quá lớn để duy trì một ma trận SSCP có dung lượng nhỏ Tập con các nhân tố được tuyển chọn cho phương trình dự báo sẽ thay đổi khi chuyển từ tuần sang tuần, tháng sang tháng, mùa sang mùa hoặc từ mô hình cũ sang mô hình mới Phương trình dự báo do đó sẽ biến đổi liên tục, “trơn” khi chuyển mùa hay chuyển đổi mô hình Tuy nhiên, do thực hiện tuyển chọn nhân tố, cách thực hiện này đòi hỏi phải có một tập dữ liệu phụ thuộc Như vậy, để làm trơn quá trình chuyển mùa hay chuyển đổi mô hình, bên cạnh khối lượng tính toán tăng thêm, dung lượng lưu trữ cũng tăng thêm Tất nhiên, nếu so với MOS truyền thống thì chi phí này vẫn nhỏ hơn Với tập dữ liệu phụ thuộc cần chú ý trong thời gian chuyển đổi mô hình,

UMOS sẽ không thực hiện lưu tập phụ thuộc với độ dài n tăng dần từng ngày như

MOS truyền thống mà cố định độ dài tập training bằng Nmax trong công thức (2.6) Đây là dung lượng mẫu tối đa để một phương trình dự báo khi xây dựng theo MOS truyền thống ổn định

2.2.2 Phương pháp GMOS

Như đã biết, nhu cầu xã hội đòi hỏi phải có những dự báo tại nhiều điểm với mức độ chi tiết ngày càng cao Với sản phẩm từ mô hình NWP, việc nội suy về các điểm dự báo bất kỳ trong miền tích phân là hoàn toàn khả thi Tuy nhiên, như đã phân tích ở phần tổng quan, sai số hệ thống luôn tồn tại trong các sản phẩm DMO

từ mô hình NWP Trong khi đó, các dự báo MOS chỉ có thể cung cấp các dự báo đã hiệu chỉnh sai số hệ thống tại các điểm trạm Để có thể giải quyết bài toán này, tiếp cận giải pháp đưa các dự báo MOS tại trạm về một lưới dự báo có độ phân giải tương đương với mật độ trạm Với lưới dự báo này, việc tạo ra các dự báo MOS cho các điểm không trùng trạm quan trắc và nằm trong miền không gian bao trùm của

Trang 36

lưới MOS là hoàn toàn khả thi và vẫn đảm bảo chất lượng dự báo Cách tiếp cận này đã được NCEP nghiên cứu và triển khai nghiệp vụ với tên gọi là GMOS (Gridded MOS) GMOS thực chất là một phương pháp phân tích hơn là một phương pháp dự báo sau mô hình Hay nói một cách đơn giản GMOS là phương pháp phân tích khách quan để đưa dữ liệu dự báo tại trạm về lưới

Như đã biết, có nhiều phương pháp phân tích khác nhau từ đơn giản như hiệu chỉnh liên tiếp tới phức tạp như 3DVAR Trong Luận văn này, đề xuất sử dụng một biến thể của phương pháp hiệu chỉnh liên tiếp có tên gọi BCDG được NCEP áp dụng (Glahn và cộng sự, 2009) Phương pháp hiệu chỉnh liên tiếp trong phân tích khách quan được Bergthorssen và Doos (1955) đề xuất đầu tiên và Cressman (1959) phát triển thêm sau đó Trên cơ sở này, Glahn và cộng sự (2009) đã thực hiện một

số thay đổi khi áp dụng cho dự báo sau mô hình và đặt tên phương pháp là BCDG

Về mặt toán học, phương pháp hiệu chỉnh liên tiếp BCDG có dạng:

j

N

1 j

j 1 i j 1

i i

w

o)fHwf

từ trường phân tích về điểm quan trắc Với các yếu tố bề mặt cơ bản đang xét, toán

tử H được lấy bằng toán tử nội suy tuyến tính hoặc đơn giản hơn bằng cách lấy điểm gần nhất Trọng số w được xác định từ công thức sau:

2 2

2 2 d R

d R w

 (2.9) Với R là bán kính ảnh hưởng, vượt quá khoảng cách này quan trắc không còn ảnh hưởng đến điểm lưới đang xét (trọng số bằng 0), d là khoảng cách thực từ quan trắc đến điểm lưới

Theo công thức (2.8) để thực hiện hiệu chỉnh theo phương pháp BCDG ta cần có giá trị phán đoán ban đầu f0 Giá trị này có thể xác định từ các dự báo khu vực như đã nói ở trên hay lấy trung bình của các điểm trạm Hai tham số khác cần được cung cấp gồm: số lần quét và bán kính ảnh hưởng trong mỗi lần quét Thông

Trang 37

thường, bán kính ảnh hưởng sẽ được giảm dần theo số lần quét để sau mỗi bước hiệu chỉnh liên tiếp các quá trình quy mô nhỏ hơn có thể được đưa vào trường phân tích Liên quan tới quy mô, độ phân giải lưới phân tích cũng cần được xác định thích hợp cho phân bố của điểm trạm đang xét Độ phân giải lưới và bán kính quét

có một quan hệ nhất định với nhau So với BCDG nguyên bản, Glahn và nnk (2009) trong BCDG đưa thêm hai nhân tố mới:

+ Phân biệt giữa các điểm đất, biển và nước,điều này có nghĩa BCDG thực hiện trên ba hệ thống phân tích khác nhau trên cùng một lưới phân tích

+ Hiệu chỉnh biến đổi của trường phân tích theo độ cao, hiệu chỉnh này chủ yếu được thực hiện cho trường nhiệt độ với biến thiên theo độ cao được xác định trực tiếp từ số liệu trên trạm cho mỗi điểm trạm

Để thực hiện hai nhân tố mới này, BCDG cần sử dụng thêm trường mặt nạ đất, biển, nước và trường địa hình trên lưới phân tích BCDG thực hiện nhân tố đầu tiên tương tự như thực hiện đồng thời ba hệ thống phân tích BCDG đã nói ở trên Phân tích cho một loại điểm chỉ sử dụng quan trắc với cùng loại điểm tương ứng Thực hiện nhân tố thứ hai, BCDG sử dụng khái niệm biến đổi theo địa hình VCE

(Vertical Change of Elevation) VCE tại một điểm trạm A với quan trắc OA (thực tế

là dự báo từ MOS) và độ cao địa hình EA có thể xác định từ điểm trạm bên cạnh B tương ứng với OB và EB theo công thức:

A B

A BEE

OOVCE

A B i

A B

) E E (

) O O ( VCE

Trang 38

phân tích theo cách này đảm bảo VCE tại mỗi trạm phụ thuộc vào hình thế thời tiết đang xét và không giả định trước một giá trị như 6.5/1km ví dụ với biến nhiệt độ,đây là một nét đặc sắc của phương pháp BCDG Khi thực hiện toán tử nội suy H

từ lưới về điểm trạm A như trong công thức (2.8),đầu tiên giá trị tại mỗi điểm lưới xung quanh điểm trạm đang xét sẽ được hiệu chỉnh về cùng độ cao với điểm trạm Sau khi cả bốn điểm lưới đã được hiệu chỉnh, quá trình nội suy tuyến tính thông thường mới bắt đầu được thực hiện

2.3 Áp dụng phương pháp UMOS cho bài toán dự báo POP

2.3.1.Xác định yếu tố dự báo

Yếu tố dự báo sử dụng để đưa vào phương trình dự báo ở đây là xác suất xảy

ra mưa(POP) Ngưỡng dự báo sử dụng để xác định có hay không có mưa là 0.1 mm, tức là nếu lượng mưa tích lũy 24 giờ tại trạm lớn hơn 0.1mm thì POP = 100%, còn ngược lại thì POP = 0%

2.3.2 Xác định nhấn tố dự báo

Số liệu dự báo từ 2 mô hình WRF-ARW tại các thời điểm 24, 48 giờ sẽ được

sử dụng làm nhân tố dự báo tương ứng với thời điểm quan trắc của yếu tố dự

báo, số liệu này dựa trên lưới kinh vĩ độ phân giải 16km của mô hình

Dựa theo đề xuất của Glahn và Lowry (1972), Applequist và nnk (2002), Wilson và Vallee (2002) các biến có thể trở thành nhân tố dự báo cần được rút ra từ

dự báo mô hình bao gồm: lượng mây, gió 10m, nhiệt độ 2m, độ hụt điểm sương 2m,

áp suất mực biển, độ cao chân mây, độ cao đỉnh mây, địa thế vị, gió, nhiệt độ, độ ẩmtại các mực áp suất cơ bản 850, 700, 500 mb

Từ các biến cơ sở này, còn sử dụng các biến dẫn xuất như sau:

- Trường trên cao: Độ ẩm riêng, độ ẩm tương đối, nhiệt độ điểm sương,

nhiệt độ thế vị tương đương, xoáy tương đối, phân kỳ, hội tụ ẩm

- Gradient: Áp dụng toán tử gradient theo 2 hướng kinh độ và vĩ độ, ta sẽ có

các trường gradient cho địa thế vị, gió, nhiệt độ, độ hụt điểm sương Riêng với phương thẳng đứng, toán tử gradient cho tabiết sự giảm nhiệt độ theo độ cao, ứng suất trượt (shear) với hai thành phần gió

Trang 39

- Bình lưu: Áp dụng toán tử bình lưu cho các biến nhiệt độ, độ ẩm riêng, độ

hụt điểm sương, nhiệt độ thế vị tương đương, xoáy tương đối

- Trung bình trong 1 cột khí quyển: Tích phân thẳng đứng các trường 3

chiều từ mực 850mb đến mực 500mb rồi lấy trung bình Toán tử này được thực hiện cho tất cả các biến 3 chiều cơ sở cũng như dẫn xuất, cộng thêm các biến bình lưu

- Các trường khác:Các chỉ số bất ổn định (chỉ số K và Showalter), lượng

nước giáng thủy khả năng (xác định từ tích phân thẳng đứng của độ ẩm riêng), tích giữa tốc độ thẳng đứng và lượng nước giáng thủy khả năng, laplacian của bình lưu nhiệt độ

Ngoài các nhân tố dự báo từ mô hình trên, còn sử dụng quan trắc làm nhân tố

dự báo với mục đích đưa thêm yếu tố quán tính (persistence) vào phương trình dự báo, đó là nhân tố quan trắc mưa 24 giờ tính đến thời điểm quan trắc Các nhân tố

dự báo địa khí hậu gồm có độ cao mặt trời (biến động theo năm và theo ngày), kinh

độ trạm, vĩ độ trạm và độ cao trạm

Từ trường dự báo trên lưới của mô hình, các nhân tố dự báo cần được xác định tại điểm trạm bằng một phương pháp nội suy thích hợp Với các trường trên cao, phương pháp nội suy đa thức bậc ba được áp dụng nội suy từ lưới về điểm trạm Với các trường bề mặt, giá trị dự báo được xác định đơn giản bằng điểm lưới

gần nhất.Như vậy, với mỗi thời điểm, mỗi điểm trạm sẽ có khoảng hơn 130

nhân tố dự báo

Các nhân tố dự báo cần phải được chuẩn hóa trước khi xây dựng phương trình thống kê Tất nhiên các biến này khác nhau về thứ nguyên và không thể so sánh với nhau, nhưng phương trình thống kê xem các nhân tố dự báo như nhau, không phân biệt thứ nguyên Bậc độ lớn chênh lệch quá lớn giữa các nhân tố dự báo

sẽ dẫn đến sai sót trong xây dựng phương trình thống kê khi các đại lượng quá lớn hay quá nhỏ sẽ bị bỏ qua Để khắc phục vấn đề này, tập hợp các nhân tố dự báo sẽ được chuẩn hóa về một tập hợp nhân tố mới theo công thức như sau:

Trang 40

k k ksd

xx

xˆ  

(2.12)

Ở đây xˆklà giá trị chuẩn hóa của nhân tố dự báo thứ xk, xkvà sdktương ứng là giá trị trung bình và độ lệch chuẩn của nhân tố xk xác định từ tập số liệu quá khứ Sau khi được chuẩn hóa, các nhân tố mới xˆklà vô thứ nguyên và có giá trị tập trung trong khoảng từ -3 cho đến +3 Đối với các biến luôn dương (như lượng mưa,

độ ẩm,…) thì các giá trị này sẽ nằm trong khoảng [0,3]

Do đặc thù của UMOS yêu cầu tập các nhân tố dự báo đưa vào xây dựng

phương trình dự báo phải xác định trước cho nên ta chỉ có thể sử dụng cả 130 nhân

tố hoặc rút gọn số lượng các nhân tố Điều này khác với cách tiếp cận MOS truyền thống, khi có thể đưa đồng thời cả 130 nhân tố vào tuyển chọn và xác định tập các

nhân tố tối ưu cuối cùng trong quá trình training Rõ ràng xử lý một ma trận SSCP với kích cỡ 130×130 cho mỗi điểm trạm không phải là một giải pháp tốt khi khối

lượng tính toán sẽ rất lớn và cũng không cần thiết nếu sử dụng quá nhiều nhân tố khi các biến có quan hệ tương hỗ nhất định Do đó, một quá trình rút gọn tập các nhân tố cần được thực hiện nhằm giảm thiểu khối lượng tính toán trong khi vẫn đảm bảo những thông tin quan trọng thu được từ các biến dự báo Với phương pháp

UMOS, sẽ thực hiện tuyển chọn theo phương pháp tuyển chọn hồi quy từng bước

tiến cho hai mùa đông và hè trên tập dữ liệu dự báo vào thời gian không có thay

đổi của mô hình dự báo Hai tập nhân tố rút gọn này sau đó sẽ được ghép lại

chuyển thành tập nhân tố khả năng cho phương pháp UMOS

Quá trình tuyển chọn được thực hiện dựa theo chỉ số R2 hay RV (Reduction

of Variance) Quá trình này sẽ dừng lại khi RV không tăng thêm với một tỷ lệ phần

trăm cho trước nào đó so với RV của bước trước đó Tỷ lệ này được gọi là tỷ lệ dừng, đóng vai trò quan trọng quyết định tới số lượng nhân tố dự báo Với phương

pháp UMOS do mới chỉ là quá trình sơ tuyển nên tỷ lệ dừng 0.5% Thông thường với mỗi trạm, tập nhân tố dự báo rút gọn cho UMOS có khoảng từ 20 đến 40 nhân

tố Cần chú ý rằng với mỗi trạm, cho mỗi hạn dự báo với mỗi yếu tố, tập nhân tố dự báo là khác nhau

Ngày đăng: 27/08/2017, 16:40

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w