1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Đánh giá kết quả dự báo nhiệt độ và lượng mưa của một số mô hình dự báo thời tiết cho khu vực việt nam

105 23 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 105
Dung lượng 3,46 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Bài toán đánh giá dự báo là đánh giá mức độ chính xác của mô hình hoặcmức độ sai khác giữa các sản phẩm dự báo của mô hình với những kết quả quantrắc thực tế nhằm chỉ ra những ưu điểm, n

Trang 1

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

-o0o -PHẠM THỊ TUYẾT MÂY

ĐÁNH GIÁ KẾT QUẢ DỰ BÁO NHIỆT ĐỘ VÀ LƯỢNG MƯA CỦA MỘT SỐ MÔ HÌNH DỰ BÁO THỜI TIẾT CHO KHU VỰC VIỆT NAM

LUẬN VĂN THẠC SỸ KHOA HỌC

HÀ NỘI, 2012

Trang 2

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

-o0o -PHẠM THỊ TUYẾT MÂY

ĐÁNH GIÁ KẾT QUẢ DỰ BÁO NHIỆT

ĐỘ VÀ LƯỢNG MƯA CỦA MỘT SỐ

MÔ HÌNH DỰ BÁO THỜI TIẾT CHO

KHU VỰC VIỆT NAM

Trang 3

MỤC LỤC

MỤC LỤC 1

CHƯƠNG 1 TỔNG QUAN VỀ BÀI TOÁN ĐÁNH GIÁ DỰ BÁO TRONG KHÍ TƯỢNG VÀ CÁC CHỈ SỐ ĐÁNH GIÁ 6

1.1 Bài toán đánh giá dự báo trong khí tượng 6

1.1.1 Mục đích và ý nghĩa của bài toán đánh giá 6

1.1.2 Mô hình chung cho đánh giá dự báo các yếu tố thời tiết 7

1.1.3 Sơ lược về tiêu chuẩn đánh giá 10

1.1.4 Các loại yếu tố dự báo 11

1.1.5 Các thuộc tính của một dự báo tốt 12

1.2 Một số phương pháp và chỉ số đánh giá phổ biến 14

1.2.1 Sơ đồ chung đánh giá sản phẩm mô hình dự báo thời tiết số 14

1.2.2 Phương pháp đánh giá đối với biến liên tục 17

1.2.3 Phương pháp đánh giá đối với dự báo pha 21

1.3 Cơ sở lý thuyết của phương pháp đánh giá fuzzy 24

1.4 Tình hình nghiên cứu chung liên quan đến đề tài trên thế giới và tại Việt Nam33 CHƯƠNG 2 KHÁI QUÁT VỀ CÁC MÔ HÌNH DỰ BÁO THỜI TIẾT SỐ HRM, MM5 VÀ NGUỒN SỐ LIỆU SỬ DỤNG 36

2.1 Giới thiệu về mô hình MM5 36

2.1.1 Giới thiệu mô hình 36

2.1.2 Cấu trúc mô hình 36

2.1.3 Hệ các phương trình thủy nhiệt động lực của MM5 37

2.1.4 Điều kiện biên 37

2.1.5 Các quá trình tham số hóa 38

2.2 Giới thiệu về mô hình HRM 40

2.2.1 Giới thiệu mô hình 40

2.2.2 Cấu trúc lưới và phương pháp số 40

2.2.3 Hệ các phương trình cơ bản 40

2.2.4 Các quá trình tham số hóa vật lý 41

2.3 Số liệu 42

CHƯƠNG 3 KẾT QUẢ ĐÁNH GIÁ NHIỆT ĐỘ VÀ LƯỢNG MƯA CỦA MÔ HÌNH MM5 VÀ HRM CHO KHU VỰC VIỆT NAM 45

3.1 Kết quả đánh giá nhiệt độ 45

3.2 Kết quả đánh giá lượng mưa 51

3.3 Kết quả thử nghiệm đánh giá mưa bằng phương pháp fuzzy 66

3.3.1 Kết quả thử nghiệm với chuỗi số liệu mẫu 66

3.3.2 Thử nghiệm đánh giá kết quả dự báo mưa bằng phương pháp fuzzy cho Việt Nam 71

3.3.2.1 Thử nghiệm đánh giá cho dự báo mưa do bão gây ra 71

3.3.2.2 Thử nghiệm đánh giá cho dự báo mưa do không khí lạnh gây ra 75

KẾT LUẬN 79

TÀI LIỆU THAM KHẢO 81

Tiếng Việt: 81

Tiếng Anh: 81

Trang 4

DANH MỤC HÌNH VẼ

Hình 1.1 Sơ đồ chung cho đánh giá các yếu tố thời tiết 8

Hình 1.2 Sơ (NWP) 16

Hình 1.3 Toán đồ tụ điểm cho dự báo gió biển Bên trái là trường hợp dự báo 00 giờ, bên phải là trường hợp dự báo 36 giờ (số liệu lấy từ trạm phao) 17

Hình 1.4 Sơ đồ biểu diễn các chỉ số phục vụ đánh giá chất lượng dự báo mưa 21

Hình 1.5 a Miền quan trắc; b Đánh giá truyền thống (phải tương thích cả về không gian và thời gian giữa dự báo và quan trắc); c Đánh giá bằng phương pháp fuzzy (vùng dự báo tính đến cả miền lân cận quanh điểm quan trắc) 24

Hình 1.6 Cửa sổ quan trắc và dự báo của phương pháp đánh giá fuzzy 25

Hình 2.1 Sơ đồ lồng ghép hai miền tính cho MM5 39

Hình 2.2 Các trạm quan trắc trong miền tính 43

Hình 3.1 Nhiệt độ trung bình trong các tháng mùa hè tại các trạm a) HRM1; b) OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) 46

Hình 3.2 Nhiệt độ trung bình trong các tháng mùa đông tại các trạm a) HRM1; b) OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) 47

Hình 3.3 Sai số ME của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa đông (a) và mùa hè (b) 48

Hình 3.4 Sai số MAE của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa đông (a) và mùa hè (b) 49

Hình 3.5 Sai số RMSE của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa đông (a) và mùa hè (b) 50

Hình 3.6 Hệ số tương quan nhiệt độ của các mô hình cho toàn Việt Nam (a) và các khu vực (b, c, d) 51

Hình 3.7 Giá trị trung bình mưa tích lũy 24 giờ trong các tháng mùa hè a) HRM1; b) OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) 52

Hình 3.8 Giá trị trung bình mưa tích lũy 24 giờ trong các tháng mùa đông a) HRM1; b) OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) 53

Hình 3.9 Điểm số ME của mưa cho toàn Việt Nam và các khu vực trong các tháng mùa đông (a) và mùa hè (b) 54

Hình 3.10 Điểm số MAE của mưa cho toàn Việt Nam và các khu vực trong các tháng mùa đông (a) và mùa hè (b) 55

Hình 3.11 Chỉ số RMSE của mưa cho Việt Nam và các khu vực trong mùa đông (a) và mùa hè (b) 56

Hình 3.12 Hệ số tương quan của mưa của các mô hình cho Việt Nam (a) và các khu vực (b, c, d) 58

Hình 3.13 Chỉ số FBI cho Việt Nam và các khu vực trong thời kỳ mùa đông 59

Hình 3.14 Chỉ số FBI cho Việt Nam và các khu vực trong thời kỳ mùa hè 59

Hình 3.15 Chỉ số TS các khu vực theo các ngưỡng mưa trong mùa đông 61

Hình 3.16 Chỉ số TS các khu vực theo các ngưỡng mưa trong mùa hè 62

Hình 3.17 Chỉ số POD các khu vực theo các ngưỡng mưa trong mùa đông 63

Hình 3.18 Chỉ số POD các khu vực theo các ngưỡng mưa trong mùa hè 63

Hình 3.19 Chỉ số TSS các khu vực theo các ngưỡng mưa trong mùa đông 64

Hình 3.20 Chỉ số TSS các khu vực theo các ngưỡng mưa trong mùa hè 65

Hình 3.21 Vùng mưa thám sát (trái) và vùng mưa dự báo 3h (phải) (mm/h) lúc 15h UTC ngày 29/5/1999 66

2

Trang 5

Hình 3.22 Kết quả đánh giá bằng phương pháp fuzzy cho hạn dự báo 03 giờ ngày 29/5/1999 Hình 3.23 Vùng mưa thám sát (trái) và vùng mưa dự báo mưa tích lũy 24h (phải) (mm/ngày) ngày 6/7/2007 Hình 3.24 Kết quả đánh giá bằng phương pháp fuzzy cho dự báo mưa 24 giờ ngày 06/7/2007 Hình 3.25 Vùng mưa thám sát (trái) và vùng mưa dự báo 24h (phải) (mm/ngày) ngày 23/12/2007 (không khí lạnh) Hình 3.26 Kết quả đánh giá bằng phương pháp fuzzy cho hạn dự báo mưa tích lũy 24 giờ ngày 23/12/2007

Trang 6

MỞ ĐẦU

Như chúng ta đã biết, khí hậu nói chung và thời tiết nói riêng ảnh hưởngđến mọi mặt đời sống kinh tế - xã hội của loài người Vì vậy việc dự báo cácyếu tố khí hậu cũng như thời tiết đang ngày càng quan trọng và cần thiết, trởthành mối quan tâm lớn của tất cả các quốc gia trên thế giới Và giờ đây nó càngtrở nên cấp bách hơn bao giờ hết khi ảnh hưởng của

các nước trên thế giới trong đó Việt Nam cũng là một trongnhững quốc gia chịu ảnh hưởng nặng nề của biến đổi khí hậu

s

nghiệp vụhoặc nghiê

văn Trung ương, RAMS, HRM, WRF

Mỗi mô hình số đều chứa đựng các sai số sinh ra do số liệu ban đầu, docác quá trình tham số hóa trong khí quyển chưa đủ chính xác , cần phải tìm ra được những điểm mạnh của mô hình để khai thác và sử dụng

đồng thời chỉ ra những điểm yếu để tìm cách khắcphục, đem lại hiệu quả cao hơn cho công tác dự báo Bên cạnh đó, kết quả đánhgiá còn có thể cho biết về sai số hệ thống của mô hình, là cơ sở cho việc hiệuchỉnh mô hình cho tốt hơn Chính vì vậy, vấn đề đánh giá định lượng sản phẩmcủa các mô hình số là rất cần thiết và có ý nghĩa khoa học

Bài toán đánh giá dự báo là đánh giá mức độ chính xác của mô hình hoặcmức độ sai khác giữa các sản phẩm dự báo của mô hình với những kết quả quantrắc thực tế nhằm chỉ ra những ưu điểm, nhược điểm của mô hình, giúp cho cácchuyên gia nghiên cứu tìm kiếm các giải pháp cải tiến, phát triển, nâng cao chấtlượng dự báo của mô hình Hơn nữa, kết quả đánh giá dự báo có thể đưa ranhững thông tin giúp các nhà quản lý quyết định có nên đầu tư cơ sở vật chất,trang thiết bị để phát triển mô hình hay không

Chính vì vậy, trong

4

Trang 7

khuôn khổ của luận văn tác giả tập trung vào việc đánh giá chất lượng dự báo24h của nhiệt độ, lượng mưa của hai mô hình dự báo thời tiết số được sử dụngphổ biến hiện nay ở Việt Nam là mô hình HRM và mô hình MM5 Ngoài phần

Mở đầu, Kết luận và Tài liệu tham khảo, luận văn được bố cục cụ thể như sau:

Chương 1 Tổng quan về bài toán đánh giá dự báo trong khí tượng và cácchỉ số đánh giá

Chương 2 Khái quát về các mô hình dự báo thời tiết số HRM, MM5 vànguồn số liệu sử dụng

Chương 3 Kết quả đánh giá nhiệt độ và lượng mưa của mô hình MM5

và HRM cho khu vực Việt Nam

Trang 8

CHƯƠNG 1 TỔNG QUAN VỀ BÀI TOÁN ĐÁNH GIÁ DỰ BÁO

TRONG KHÍ TƯỢNG VÀ CÁC CHỈ SỐ ĐÁNH GIÁ

1.1 Bài toán đánh giá dự báo trong khí tượng

1.1.1 Mục đích và ý nghĩa của bài toán đánh giá

Đánh giá chất lượng dự báo thời tiết nói chung là phương pháp thẩm trađánh giá và xác định định lượng mức độ chính xác của mô hình hoặc mức độ saikhác giữa các sản phẩm dự báo của mô hình với những kết quả quan trắc thực tếnhằm chỉ ra những ưu điểm, nhược điểm của mô hình, giúp cho các chuyên gianghiên cứu tìm kiếm các giải pháp cải tiến, phát triển, nâng cao chất lượng dựbáo của mô hình

Có ba lý do quan trọng nhất để đánh giá dự báo là:

- Kiểm tra chất lượng dự báo – dự báo chính xác đến đâu và sẽ được cải tiến ra sao

- Nâng cao chất lượng dự báo: Bước đầu tiên để tiến tới dự báo tốt hơn làviệc tìm ra cái gì mà người làm dự báo đang làm sai

nào thì một hệ thống dự báo được cho là dự báo tốt hơn so với những hệ thống

dự báo khác và bằng cách nào mà hệ thống dự báo đó đem lại kết quả tốt hơnnhư vậy

Các hoạt động đánh giá chỉ hữu ích khi chúng đưa ra được các quyết định

về sản phẩm dự báo đang được đánh giá Quyết định đó sẽ làm phát sinh nhữngthay đổi trong sản phẩm dự báo hoặc cách thức dự báo được thực hiện sau đó,hoặc quyết định đó xác nhận và khẳng định sản phẩm dự báo thỏa mãn cho cácmục đích của người sử dụng và của xã hội Các sản phẩm dự báo được phổ biếnrộng rãi trong công chúng thì phải được viết đủ khách quan để người sử dụng

có thể kiểm tra, còn các số liệu quan trắc khí quyển thực tế phải được thể hiệnmột cách chính xác những gì diễn ra trong thực tế Hơn nữa, một vài phươngpháp đánh giá còn đòi hỏi quan trắc tại một điểm cũng có thể đại diện một cáchđầy đủ và khách quan các hiện tượng thời tiết xảy ra trong một khu vực

Chính tính cấp thiết trong các hoạt động đánh giá chất lượng dự báo thời

tiết cho thấy mục đích đánh giá phải được thiết lập trước khi hệ thống đánh giá

6

Trang 9

được xác lập Từ đây các hoạt động đánh giá trong khí tượng cũng như trongcác hoạt động dự báo thời tiết có thể được phân chia thành hai mục đích chính làđánh giá hành chính và đánh giá khoa học.

Mục đích hành chính: Các thông tin đánh giá trong mục đích quản lý hành

chính nhằm cung cấp thông tin cho việc mua sắm các trang thiết bị chính nhưcác máy tính có cấu hình cao hơn, tốc độ xử lý nhanh hơn,… Xác định khi nào,hoặc có nên thay thế một sản phẩm đang được sử dụng bằng một sản phẩm dựbáo mới hay không, và còn nhiều các quyết định khác để phát triển tối ưu nguồnlực về con người cũng như các nguồn trang thiết bị khác phục vụ cho công tácphát hành một bản tin dự báo thời tiết

Mục đích khoa học: Đánh giá với mục đích khoa học là xác định một cách

đầy đủ và chi tiết ưu điểm cũng như nhược điểm của một sản phẩm dự báo Cáchoạt động này giúp tìm ra các biện pháp thích hợp để cải thiện chất lượng dựbáo phục vụ cũng như cung cấp các thông tin để hoạch định phương hướng choviệc nghiên cứu và phát triển tiếp theo

Ngoài ra một số tác giả khác còn xét đến mục đích kinh tế nhưng đó làvấn đề rất phức tạp nên trong giới hạn luận văn này không được đề cập đến

1.1.2 Mô hình chung cho đánh giá dự báo các yếu tố thời tiết

Hình 1.1 là một kiểu mô hình chung nhất để đánh giá dự báo các yếu tốthời tiết, ngoài ra có thể có các mô hình đánh giá khác nữa Tuy nhiên đây là môhình cho thấy bức tranh chi tiết nhất về quan hệ giữa đặc trưng của phép đánhgiá các đại lượng đo và các giải pháp khác nhau để có thể lựa chọn Sơ đồ này

sử dụng cho việc quyết định các bước cần thiết phải được làm trước khi lựachọn các phương pháp đánh giá cụ thể

Tất cả các phương pháp đánh giá đều bắt đầu từ việc tập hợp các tập số

liệu quan trắc và dự báo (hình bình hành ở trên cùng trong Hình 1.1) Bước tiếp

theo là xử lý số liệu, bước này phụ thuộc vào việc quyết định của người sử dụng

(hình thoi trong sơ đồ) Quan trọng nhất là việc quyết định của người sử dụng

lựa chọn mục đích đánh giá hành chính hay khoa học như đã nêu ở trên

Khi mục đích đánh giá đã được xác định, tiến hành phân loại các tập sốliệu mẫu theo mục đích đã định trước Phân loại nghĩa là chia nhỏ các phần tửtrong tập mẫu ra thành hai hay nhiều nhóm theo một nguyên tắc đã định sẵn, sau

đó thực hiện đánh giá cho từng nhóm một cách riêng biệt Trên Hình 1.1 đã chỉ

Trang 10

ra hai kiểu phân loại là “Phân loại ngoại bộ” và “Phân loại nội bộ”.

Phân loại ngoại bộ là kiểu phân loại mà nguyên tắc lựa chọn độc lập đối

với các yếu tố đang cần được đánh giá Kiểu phân loại ngoại bộ phổ biến nhất là

cho phép xác định các biến đổi trong đánh giá theo thời gian trong ngày hoặc

theo mùa Phân loại ngoại bộ có thể tiến hành ở bất cứ thời điểm nào trong quá

trình trước khi tính toán các đánh giá thống kê thực tế, và có thể được làm cho

cả mục đích hành chính hay mục đích khoa học

Các tập số liệu dùng để đánh giá

Bảng liên hợp

Nguyên lý phát hiện

Trang 11

Hình 1.1 Sơ đồ chung cho đánh giá các yếu tố thời tiết

8

Trang 12

Xuất phát từ các câu hỏi đặt ra đối với đánh giá khoa học thấy rằng, cần

có một nhu cầu phân loại cao hơn đối với tập mẫu Chẳng hạn như, nếu ta quantâm đến dự báo cực trị thì tập mẫu sẽ phải được phân nhóm để tách các giá trịcực trị đó ra từ chuỗi các sự kiện chung Kiểu phân nhóm này được gọi là “phânloại nội bộ” bởi vì nguyên tắc phân loại được quyết định bởi mục đích đánh giá

và sử dụng chính yếu tố đang được đánh giá Có hai cách để thực hiện phân loạinội bộ, trên Hình 1.1 cho thấy sự khác nhau trong kết quả đánh giá thu được từhai cách phân loại đó

Phân loại theo quan trắc nghĩa là phân loại theo giá trị của các yếu tố khítượng quan trắc được Sau đó, các tiêu chuẩn đánh giá có thể được tính toáncho từng nhóm giá trị quan trắc và giá trị thống kê được tạo thành này gọi là giátrị có điều kiện đối với quan trắc Một ví dụ cho phân bố có điều kiện của dự báo

là một giá trị đặc biệt hay một phạm vi các giá trị quan trắc

Phân loại theo dự báo nghĩa là phân loại theo giá trị của các yếu tố khítượng được dự báo Cũng tương tự như trên, các giá trị thống kê được tínhtoán theo cách phân loại này được gọi là điều kiện dự báo Việc lựa chọn kiểuphân loại phụ thuộc vào mục đích đánh giá Trong nhiều trường hợp cần phải sửdụng kết hợp cả hai cách phân loại trên để đưa ra một kết quả hoàn chỉnh Hơn

nữa, như đã thấy ở sơ đồ trên, những đại lượng đánh giá khác nhau (hình ô van

bên dưới) đặc trưng cho một kiểu phân nhóm khác và đưa ra nhiều thông tin

khác nhau về sản phẩm.

Một cách khác, trong đánh giá hành chính, người ta ít quan tâm chi tiếtđến việc biểu diễn những biến theo các giá trị khác nhau trong dự báo Mà thayvào đó, các câu hỏi đặt ra đều mang tính chung chung và chỉ cần một câu trả lờingắn gọn xúc tích nào đó Vì vậy, phân loại nội bộ có thể vẫn được thực hiệnnhưng nó hiếm khi được dùng đến Tuy nhiên, ưu điểm lớn của đánh giá hànhchính là biểu diễn chất lượng sản phẩm chỉ bằng vài con số hoặc việc so sánhthuận tiện hay hướng xác minh dễ dàng Bản chất chung của đánh giá hànhchính có mối liên hệ mật thiết với các quy tắc điểm số tổng kết được chỉ ra ởHình 1.1 Đôi khi việc tóm tắt cũng trở nên khó khăn khi phải cố gắng tổng kếttất cả các thông tin về chất lượng sản phẩm chỉ trong một điểm số để cung cấpcho nhà quản lý Nhu cầu tóm tắt thông tin đánh giá chỉ bằng một con số gây ramột áp lực lớn cho việc thiết kế hệ thống đánh giá để đảm bảo được rằng:

- Điểm số được lựa chọn theo yêu cầu là đáng tin cậy;

9

Trang 13

- Các sự kiện hợp thành đều được xem xét công bằng như nhau trong các điểm số;

Hạn chế chung của bản tổng kết đánh giá này là tất cả các sự kiện đềuđược xem là như nhau trong quá trình trung bình hóa Điều này làm cho việcthực hiện thuận tiện hơn (việc tính toán sẽ đơn giản hơn khi sử dụng đại lượngtrung bình), nhưng cũng vì thế mà rất khó để có thể tìm được một hàm trọng sốchính xác và phản ánh đủ khách quan cho các sự kiện hợp thành của mục đích

sử dụng mà không có bất kỳ trở ngại nào đối với các thuộc tính của điểm số.Làm thế nào để đưa ra các hàm trọng số của các sự kiện hợp thành trong đánhgiá tổng hợp vẫn còn là vấn đề chưa giải quyết được

Trước đây, các điểm số đánh giá đã được đánh giá quá cao Vì thế các dựbáo viên sớm thất vọng khi phải cố gắng sử dụng chúng để trả lời các câu hỏi vềcác vấn đề mang tính chất khoa học Tính chất của việc đánh giá tổng kết đó hạnchế việc sử dụng trong mục đích khoa học bởi thiếu sự phân loại đánh giá bằngnhững điều kiện cho trước Ví dụ, điểm số tổng kết không thể nói mưa dự báotốt như thế nào trong các trường hợp ngưỡng thấp mà chỉ có thể nói mưa được

dự báo tốt như thế nào một cách chung chung Không thể nói, dưới điều kiệnnào mô hình phần tử hữu hạn khu vực RFE (Regional Finite Element model) tốthơn mô hình phổ, chỉ có thể nói rằng mô hình RFE tốt hơn hoặc xấu hơn mộtchút so với mô hình phổ

1.1.3 Sơ lược về tiêu chuẩn đánh giá

Các điểm số dùng trong đánh giá được minh họa theo từng cặp ở phía dướiHình 1.1 cho thấy mối quan hệ giữa chúng Ví dụ, bảng liên hợp và đồ thị điểm làhoàn toàn tương tự nhau, chúng cung cấp các dạng thông tin như nhau, bảng liênhợp xuất phát từ yếu tố dự báo pha cùng đồ thị điểm xuất phát từ biến dự báo liêntục Điểm tổng kết luôn được phân loại theo cách này: Điểm Brier và điểm RP đều

đo chính xác các đặc tính của khả năng xảy ra hay biến pha, chúng tương tự sai sốbình phương trung bình của dự báo theo biến liên tục Chú

ý rằng dự báo pha không tương tự như sai số trung bình tuyệt đối Có hai loạiđại lượng đo được phân loại tương ứng theo dự báo và quan trắc là “Bảng độtin cậy” và “Nguyên lý phát hiện tín hiệu” Trong khi đó bảng liên hợp và đồ thịđiểm lại tổng quát hơn, cho phép phân loại theo một trong hai cách hoặc theo cảhai cách Nguyên lý phát hiện tín hiệu là một ý tưởng mới mẻ và hiện nay chưađược sử dụng rộng rãi

Trang 14

Các điểm số liệt kê trên Hình 1.1 gồm 3 loại, đó là: điểm số tuyến tính,điểm số toàn phương (bậc hai) và điểm số kỹ năng.

Điểm số toàn phương đưa ra trọng lượng của sai số theo bình phươngcủa chúng trong khi điểm số tuyến tính cho sai số có giá trị bậc nhất Vì vậyđiểm số toàn phương thường đưa ra trọng số sai số lớn hơn là điểm số tuyếntính và điểm số này rất phù hợp trong các trường hợp sai số lớn thực sự nghiêmtrọng hơn sai số nhỏ

Điểm số kỹ năng được xây dựng để đánh giá mối quan hệ giữa dự báo vàmột giá trị chuẩn nào đó Giá trị chuẩn được chọn lựa để mô tả một dự báokhông kỹ năng

Ba tiêu chuẩn được sử dụng để so sánh là: chuẫn ngẫu nhiên, chuẩn quántính và chuẩn khí hậu Tính ngẫu nhiên mô tả sự phỏng đoán thuần túy và khôngyêu cầu hiểu biết tri thức, chuẩn quán tính là một dự báo xác định và yêu cầu cáchiểu biết về điều kiện thời tiết, còn chuẩn khí hậu là một dự báo trạng thái thờitiết diễn ra trong khoảng thời gian dài và cần phải có sự hiểu biết về tiến trìnhlịch sử của thời tiết Điểm số kỹ năng được biểu diễn trong công thức sau:

SS

SC ST

PS ST

trong đó SC là điểm có được từ dự báo, ST là điểm đạt được từ dự báo chuẩn và

PS là điểm từ dự báo hoàn hảo Điểm số kỹ năng có thể được hình thành từ việc

sử dụng bất kỳ một trong các điểm số Điểm số kỹ năng phổ biến nhất dựa trênnền tảng của điểm Brier (điểm kỹ năng Brier), điểm RP (điểm kỹ năng RP), cácgiá trị của bảng ngẫu nhiên (điểm Heidke) và sai số trung bình tuyệt đối Tiêuchuẩn thường được sử dụng nhất là chuẩn khí hậu, còn điểm Heidke lại thườngxuyên được kết hợp với chuẩn ngẫu nhiên Không có điểm kỹ năng cơ bản nào

là quan trọng hơn, chúng bình đẳng như nhau và đều biểu hiện đặc tính của kỹnăng

1.1.4 Các loại yếu tố dự báo

Sau khi giải quyết xong những vấn đề về phân loại và những yêu cầu củamột mô hình đánh giá đã đặt ra cần lựa chọn một phương pháp thích hợp để đápứng các yêu cầu đó Hình chữ nhật trên Hình 1.1 đưa ra gợi ý cho cách lựa chọnphù hợp tùy thuộc vào bản chất dự báo được đánh giá Phụ thuộc vào mục đíchđánh giá người ta chia ra thành hai dạng dự báo là: Dự báo các đại lượng liên tục

11

Trang 15

và dự báo pha.

* Yếu tố dự báo liên tục: Là các yếu tố được dự báo tại một giá trị nhấtđịnh hoặc trong một khoảng giá trị nào đó Trong số các yếu tố thời tiết thì nhiệt

độ, áp suất, và gió là hay được dự báo theo cách này

* Yếu tố dự báo pha: Là các yếu tố dự báo có thể xảy ra hoặc không xảy

ra Chẳng hạn như xét sự xuất hiện của giáng thủy (có hoặc không), hoặc xétdạng giáng thủy (băng, tuyết, nước)

Một số yếu tố có thể được dự báo liên tục hoặc dự báo pha tùy thuộc vàoyêu cầu của người sử dụng trong quá trình làm dự báo Tuy nhiên khi một dựbáo mà cho kết quả biến thiên liên tục thì phải được đánh giá theo pha bởi vì tất

cả những thông tin đó rất cần thiết cho người sử dụng

Trong đó, mỗi pha được gán bằng một xác suất xảy ra và tổng tất cả xác suấtphải bằng 1 (tức là một cái gì đó phải xảy ra) Dự báo pha là một dự báo xác suấtthu hẹp, ở đây xác suất chỉ có hai trường hợp xảy ra hoặc là 0% hoặc là 100%

và hiển nhiên là một trong hai trường hợp ấy chắc chắn sẽ xảy ra

1.1.5 Các thuộc tính của một dự báo tốt

Do tính chất phức tạp của bài toán đánh giá, việc lựa chọn, sử dụng nhữngchỉ số nào để phản ánh được tất cả các khía cạnh là vấn đề khó khăn Chẳnghạn, khi nói về đánh giá chất lượng dự báo (có thể là của một mô hình) Murphy(1993) đã đưa ra 3 khái niệm để chỉ mức độ “tốt” của một dự báo là:

1) Độ chắc chắn (Consistency) của dự báo là mức độ phù hợp giữa dự báo

và kiến thức hiểu biết của dự báo viên;

2) Chất lượng dự báo (Quality) là mức độ phù hợp giữa dự báo với thực tế

xảy ra;

3) Ý nghĩa (hay giá trị - Value) của dự báo là mức độ mà dự báo có thểgiúp cho người ra quyết định thấy rõ hoặc đạt được lợi ích nào đó về kinh tếhoặc lợi ích khác

Cũng theo Murphy (1993), đã đưa ra 9 khái niệm được gọi là 9 thuộc tính đóng góp cho độ chắc chắn của dự báo như sau:

- Độ lệch (Bias): Là mức độ phù hợp giữa trung bình quan trắc và trung

Trang 16

bình dự báo.

- Tính liên kết (Association): Là mức độ chặt chẽ về quan hệ tuyến tính

giữa dự báo và quan trắc(chẳng hạn, hệ số tương quan là thước đo mối quan hệtuyến tính này)

- Độ chính xác (Accuracy):

K

- Kỹ năng dự báo (Skill):

một dự báo tham chiếu nào đó Dự báo tham chiếunói chung là dự báo không có kỹ năng, như dự báo ngẫu nhiên (may rủi), dự báoquán tính, hoặc dự báo khí hậu Kỹ năng ám chỉ sự tăng lên của độ chính xác do

hệ thống dự báo “thông minh”

- Độ tin cậy (Reliability): Là sự phù hợp trung bình giữa các giá trị dự báo

và các giá trị quan trắc Nếu tất cả các trường hợp dự báo được xem xét khi đó

độ tin cậy trên toàn bộ giống như thiên hướng (bias) Nếu các trường hợp dựbáo được phân chia thành các khoảng khác nhau hoặc theo các phân hạng thì độtin cậy giống như độ lệch có điều kiện (conditional bias) Thông thường độ tincậy được cải tiến nhờ Bias Nhưng sau khi cải tiến làm độ tin cậy của các dựbáo tương đương tăng lên thì chính Bias lại sẽ bị khử đi

- Độ phân giải (Resolution): Là năng lực của dự báo có thể phân loại tập

các sự kiện thành các tập con có phân bố tần suất khác nhau Điều đó có nghĩa làphân bố nhận được khi “A” được dự báo khác với phân bố nhận được khi “B”được dự báo Thậm chí nếu các dự báo là sai, hệ thống dự báo có độ phân giảinếu nó có thể phân chia một cách thành công phân bố của các dạng khác nhau.(Nói cách khác, có thể tách biệt được các trường hợp dự báo thành những tập cócùng phân bố)

- Độ nhọn (hay độ nhạy bén - Sharpness): Là xu hướng của dự báo có thể

dự báo được các giá trị cực trị Độ nhọn là một thuộc tính của dự báo, tương tựnhư độ phân giải, một dự báo có thể có thuộc tính này ngay cả khi nó sai (trongtrường hợp này nó có thể là kém tin cậy);

- Độ phân biệt (hay độ phân lớp - Discrimination): Là khả năng của dự

13

Trang 17

báo có thể tách biệt các quan trắc thành những trường hợp có tần suất dự báocao hơn, tức là có khả năng phân lớp Là khả năng của dự báo có thể tách biệtcác quan trắc thành những trường hợp có tần suất dự báo cao hơn, tức là có khảnăng phân lớp.

- Độ biến động (hay tính không chắc chắn - Uncertainty): Là sự dao động

của các giá trị quan trắc trong tập mẫu đánh giá và không phụ thuộc vào giá trị

dự báo Đối với các biến được dự báo theo pha thì độ biến động là 1 nếu sự kiệnxảy ra và 0 nếu sự kiện không xảy ra Đại lượng này liên quan đến độ “khókhăn” của dự báo Độ biến động càng lớn có nghĩa là sẽ có những dao động lớnvới nhiều tần số khác nhau trong yếu tố dự báo đang được đánh giá và dĩ nhiênviệc dự báo sẽ khó khăn hơn Độ biến động của từng tập số liệu sẽ rất khác nhau

và do đó, việc so sánh giữa các con số đánh giá thống kê của tập số liệu là hếtsức mạo hiểm vì chúng thường rất nhạy với độ biến động

Theo truyền thống thì đánh giá dự báo tập trung nhấn mạnh vào độ chínhxác và kỹ năng dự báo Nhưng cũng cần lưu ý rằng các thuộc tính khác của dựbáo cũng ảnh hưởng mạnh đến giá trị dự báo

1.2 Một số phương pháp và chỉ số đánh giá phổ biến

1.2.1 Sơ đồ chung đánh giá sản phẩm mô hình dự báo thời tiết số

a Những nguyên nhân gây sai số trong mô hình dự báo số

Để ứng dụng được một mô hình khu vực hạn chế vào trong nghiệp vụ dựbáo thời tiết đòi hỏi trước hết là phải đánh giá được sai số dự báo của mô hình

so với thực tế Các nguyên nhân có thể đưa đến dự báo sai của mô hình số cóthể tóm tắt như sau:

- Các công thức toán học để mô tả các quá trình vật lý xảy ra trong khí quyển là chưa hoàn chỉnh;

hình số mô tả hoàn chỉnh);

- Các quá trình vật lý và các sơ đồ tham số hóa chưa thật sự hoàn thiện;

- Một số giả thiết không thực sự phù hợp được đưa ra để có thể giải được

hệ phương trình thủy nhiệt động lực học mô tả khí quyển thực

- Điều kiện biên và điều kiện ban đầu của các biến khí tượng là chưa hoàn

Trang 18

chỉnh và phụ thuộc khá nhiều vào địa hình Các trạm thám sát thưa thớt, đặc biệt

số liệu quan trắc và bộ số liệu này phải tương

, số liệu quan trắc có thể sẽ được phântích về lưới dự báo hoặc

phẩm Trong trường hợp này

, điều quan trọng trong đánh giá môhình là phải luôn ghi nhớ thủ tục kiểm tra lại số liệu quan trắc khi đánh giá kếtquả

Để đánh giá một sản phẩm mô hình số có hiệu quả, yêu cầu đặt ra lànhững vấn đề quyết định cần giải quyết phải được làm cho mục đích đánh giátrước khi một hệ thống đánh giá được thiết lập “Đánh giá hành chính” trả lờicâu hỏi về xu hướng trong kỹ năng và độ chính xác của mô hình và thườngđược sử dụng để so sánh độ chính xác của hai mô hình khác nhau Tương tựnhư đánh giá các yếu tố thời tiết cho những mục đích hành chính, có mộtkhuynh hướng nhằm giảm thiểu các kết quả chỉ bằng một vài con số thông quaviệc sử dụng các điểm số tổng kết

15

Trang 19

“Phân loại ngoại bộ” ở đây có ý nghĩa là phân chia bộ số liệu đánh giá theo mùa hoặc theo thời gian chạy mô hình

Các tập số liệu dùng để đánh giá

Mục đích

khoa học

Quản lý hành chính

Phân loại ngoại bộ

Phân loại theo không gian

Phân loại nội bộ

Sai số trung bình tuyệt đối

Sai số bình phương trung bình

Trang 20

Khi phân loại theokhông gian được tiến hành theo mục đích khoa học, các khu vực có quy mô dướilưới được ưu tiên lựa chọn để phản ánh các chế độ khí hậu khác nhau như cáckhu vực có địa hình đồi núi, các vùng núi khuất gió, bờ biển,…

1.2.2 Phương pháp đánh giá đối với biến liên tục

1.2.2.1 Phương pháp toán đồ tụ điểm

Tốc độ gió mô hình PPR (kts) Tốc độ gió mô hình PPR (kts)

Hình 1.3 Toán đồ tụ điểm cho dự báo gió biển Bên trái là trường hợp dự báo 00 giờ,

bên phải là trường hợp dự báo 36 giờ (số liệu lấy từ trạm phao)

Toán đồ tụ điểm là phương pháp đơn giản nhất, chủ yếu phục vụ cho cácbiến liên tục như nhiệt độ và gió, thường gồm tất cả các điểm số ứng với mỗicặp dự báo – quan trắc tương ứng trên cùng một đồ thị với tung độ và hoành độ

có tỷ lệ như nhau Trường hợp lý tưởng là các điểm số nằm trên một đườngthẳng đi qua gốc tọa độ và tạo với trục hoành một góc 450 (giá trị dự báo bằnggiá trị quan trắc) Đường 450 này thường được vẽ ra để thuận tiện cho việc nộisuy các điểm rời rạc

Hình 1.3 là một ví dụ về toán đồ tụ điểm cho dự báo gió biển Mỗi điểm

“x” đại diện cho ít nhất một lần xuất hiện của cặp dự báo – quan trắc riêng lẻ.Trên mỗi đồ thị còn có một đường thẳng thứ hai mà có thể không đi qua gốc tọa

độ, đó chính là đường hồi quy bình phương tối thiểu tương ứng với tập số liệu

17

Trang 21

quan trắc.

Nếu dự báo là hoàn hảo thì đường hồi quy sẽ trùng với đường 450 Sựphù hợp giữa đường hồi quy và đường 450 cho thấy chất lượng của dự báo.Chất lượng dự báo sẽ giảm đi nếu đường hồi quy có khuynh hướng lệch theochiều nằm ngang hơn Nếu đường hồi quy nằm ngang hoàn toàn thì khi đó quantrắc hoàn toàn độc lập với dự báo

Một đại lượng đánh giá khác có thể ước lượng từ đồ thị điểm là sai sốbình phương hoặc độ lệch Hình 1.3 chỉ ra một đồ thị điểm khác cho dự báonhiệt độ khách quan (sản phẩm mô hình thống kê) Tập số liệu mẫu là 701trường hợp (số liệu này được lấy từ 11 trạm vùng Đại Tây Dương - CASSP).Trong đồ thị này không thấy xuất hiện các dấu “x” như đồ thị trước, thay vào đó

là các con số Các số trên đồ thị này biểu hiện số trường hợp các cặp giá trị nhiệt

độ quan trắc - dự báo tương ứng với đồ thị điểm

Một đồ thị điểm mô tả phân loại cơ bản từ tất cả các trường hợp đượcmiêu tả riêng rẽ Điều này cho phép cân nhắc một cách linh hoạt cho phân tích

số liệu Giả sử -200C và +100C được chọn như là ngưỡng của nhiệt độ cực trị,giá trị này có thể nhận được từ phân tích trên đồ thị Tất cả các điểm, ở đâynhiệt độ quan trắc nằm trong giới hạn của cực trị và không có nhiệt độ dự báođược gọi là miền các sự kiện dự báo sót (missed events) và tất cả các điểm ởđây giá trị dự báo nằm trong phạm vi cực trị và không quan trắc được gọi làmiền báo động sai (false alarms) Miền các sự kiện dự báo sót và miền báo độngsai có thể thấy trên đồ thị Qua đồ thị có thể thấy, tất cả nhiệt độ có giá trị caonhất đã bị bỏ sót (dự báo dưới ngưỡng) trong khi đó nhiệt độ thấp xảy ra ở cảhai miền các sự kiện dự báo sót và miền báo động sai

Phân loại trên cơ sở quan trắc chỉ cho phép nhận dạng miền các sự kiện

dự báo sót (đường ngang vẽ đậm ở các giá trị ngưỡng) Phân loại trên cơ sở dựbáo chỉ cho phép nhận dạng được miền báo động sai (đường đứng vẽ đậm ở cácgiá trị ngưỡng) Từ đây có thể thấy rằng điều quan trọng nhất là phải sử dụng cảhai kiểu phân loại để nhận được thông tin đầy đủ và hoàn hảo về một sản phẩmđang được đánh giá Ví dụ những giá trị thấp nhất đã bị bỏ sót có thể lấy lạiđược đơn giản bằng cách tưởng tượng di chuyển tất cả các điểm trên đồ thị đếnbên trái giá trị ngưỡng 100C, nhưng cái giá phải trả cho việc hiệu chỉnh này là

sự tăng lên đột ngột trong miền báo động sai Điều này sẽ không nhìn thấy nếu

Trang 22

phân loại trên cơ sở của một mình quan trắc Do vậy luôn luôn có thể hiệu đínhcho sự kiện cực trị đã bị bỏ sót.

Phân loại trên cơ sở dự báo có lẽ có ích hơn cho hiểu biết về ý nghĩa thựccủa dự báo Thông tin chi tiết về ý nghĩa của dự báo cho các nhiệt độ khác nhau

có thể nhận được từ một chuỗi phân bố có điều kiện cho mỗi nhiệt độ dự báohoặc cho phạm vi của nhiệt độ

1.2.2.2 Các chỉ số đánh giá

Trong các công thức dưới đây, Fi và Oi tương ứng là giá trị mô hình vàgiá trị quan trắc của một biến nào đó (nhiệt độ, lượng mưa), i=1,2,…, N, N làdung lượng mẫu

a Sai số trung bình (ME - Mean Error)

ME

Giá trị của ME nằm trong khoảng (-∞, +∞) ME cho biết xu hướng lệchtrung bình của giá trị dự báo so với giá trị quan trắc, nhưng không phản ánh độlớn của sai số ME dương cho biết giá trị dự báo vượt quá giá trị quan trắc vàngược lại Mô hình được xem là “hoàn hảo” (không thiên lệch về một phía nàocả) nếu ME=0

b Sai số tuyệt đối trung bình (MAE-Mean Absolute Error)

MAE

Giá trị MAE nằm trong khoảng (0,+∞) MAE biểu thị biên độ trung bìnhcủa sai số mô hình nhưng không nói lên xu hướng lệch của giá trị dự báo vàquan trắc Khi MAE = 0, giá trị của mô hình hoàn toàn trùng khớp với giá trịquan trắc, mô hình được xem là “lý tưởng” Thông thường MAE được sử dụngcùng với ME để đánh giá độ tin cậy Chẳng hạn, nếu MAE của sản phẩm khácbiệt hẳn so với ME thì việc hiệu chỉnh là hết sức mạo hiểm Trong trường hợpngược lại, khi mà MAE và ME tương đối “sát” với nhau thì có thể dùng ME đểhiệu chỉnh sản phẩm dự báo một cách đáng tin cậy

c Sai số bình phương trung bình MSE (Mean Square Error)

19

Trang 23

MSE là trung bình của tổng bình phương của hiệu giữa các giá trị mô hình

và quan trắc, phản ánh mức độ dao động của sai số Mô hình là “lí tưởng”

Khi so sánh MAE và RMSE ta thấy: RMSE ≥ MAE Còn RMSE = MAEkhi và chỉ khi tất cả các sai số có độ lớn như nha0u: RMSE = MAE =0

e Hệ số tương quan (Correlation coefficient)

Trang 24

20

Trang 25

1.2.3 Phương pháp đánh giá đối với dự báo pha

Đánh giá thống kê theo loại (categorical statistics) là loại tiêu chuẩn đánhgiá sự phù hợp giữa sự xảy ra hiện tượng dự báo và hiện tượng quan trắc tại nútlưới

Các điểm số đánh giá được dựa vào bảng ngẫu nhiên sau (Damrath, 2002):

Hình 1.4 Sơ đồ biểu diễn các chỉ số phục vụ đánh giá chất lượng dự báo mưa

Hits (H) = dự báo có + quan trắc có

Misses (M) = dự báo không + quan trắc có

False alarms (F) = dự báo có + quan trắc không

Correct negatives (CN) = dự báo không + quan trắc không

Dưới đây là một vài điểm số thường dùng trong đánh giá dự báo mưa địnhlượng ở trên thế giới:

a Chỉ số FBI (BS hay FBI - Bias score): Đánh giá tỷ số giữa vùng dự báo và

vùng thám sát

FBI < 1: vùng dự báo nhỏ hơn vùng thám sát

FBI > 1: vùng dự báo lớn hơn vùng thám sát

FBI = 1: vùng dự báo trùng với vùng thám sát (giá trị lý tưởng)

FBIFBI là tỉ lệ giữa số lần có xảy ra hiện tượng theo mô hình

và theo quan trắc Giá trị FBI biến đổi trong khoảng từ 0 đến +∞

Trang 26

FBI càng nhỏ hơn 1 mô hình cho kết quả càng sai sót nhiều; FBI

càng lớn hơn 1 mô hình cho kết quả càng sai khống nhiều Đại lượng

FBI chỉ cho biết mức độ phù hợp giữa mô hình và quan trắc về tần số

xuất hiện nhưng không phản ánh độ chính xác của mô hình

b Xác suất phát hiện (Probability of Detection - POD)

c Tỷ phần phát hiện sai (False Alarms Ratio - FAR)

FAR

FAR cho biết tỷ lệ mô phỏng/dự báo khống của mô hình (mô hình cho kếtquả có nhưng thực tế hiện tượng không xảy ra) Giá trị của FAR biến đổi từ 0cho đến 1 FAR=0 khi F=0, tức tỷ lệ khống của mô hình bằng 0 Giá trị của FARcàng gần 0 thì mô hình càng tốt (tối ưu) Ngược lại, FAR càng tiệm cận tới 1(tương đương với H tiến gần tới không) thì mô hình càng kém

d Điểm số thành công (Critical Success Index – CSI hay Threat Score – TS)

CSI TS

TS phản ánh mối quan hệ giữa số lần mô hình cho kết quả hiện tượng cóxuất hiện và số lần quan trắc được hiện tượng có xuất hiện Nó có thể đượcxem như thước đo độ chính xác của mô hình khi bỏ qua không xem xét nhữngtrường hợp hiện tượng không xuất hiện Phạm vi biến thiên của TS từ 0 đến 1.TS=0 nghĩa là mô hình không có kỹ năng, TS=1 – mô hình là hoàn hảo

Trang 27

22

Trang 28

e Điểm số thành công hợp lý (Equitable Threat Score – ETS)

lý “F” và “M” theo cùng một cách, không phân biệt nguồn gốc của sai số dựbáo

f Điểm số so le (Odds Ratio)

h Độ chính xác (Percentage Correct – PC hay Fraction Correct - FC)

PC

FC phản ánh tỷ lệ trùng khớp giữa kết quả của mô hình và quan trắc trong

cả hai pha có và không xuất hiện hiện tƣợng Giá trị của PC biến đổi trongkhoảng từ 0 đến 1 Nếu mô hình là hoàn hảo, tức kết quả mô hình trùng khớphoàn toàn với quan trắc thì PC bằng 1, ngƣợc lại, PC sẽ bằng 0 nếu tất cả mọi

Trang 29

trường hợp kết quả của mô hình đều ngược với quan trắc PC càng lớn độ chínhxác mô phỏng, dự báo của mô hình càng cao.

23

Trang 30

1.3 Cơ sở lý thuyết của phương pháp đánh giá fuzzy

Những dự báo có độ phân giải cao của các mô hình số trị có thể khá chínhxác và cung cấp cho dự báo viên những thông tin rất hữu ích Tuy nhiên, khiđánh giá sử dụng các phương pháp truyền thống chúng lại thường có kết quảkhông tốt bởi vì rất khó khăn trong việc dự báo trùng khớp hoàn toàn với quantrắc ở độ phân giải cao Đánh giá “fuzzy” tiến tới trùng khớp bằng cách làmgiảm yêu cầu về mức độ chính xác giữa dự báo và quan trắc Mấu chốt của cáchtiếp cận fuzzy là việc sử dụng một cửa sổ không gian (spatial window) hoặcvùng lân cận các điểm dự báo và/hoặc quan trắc Việc xử lý số liệu trong cửa sổ

có thể bao gồm trung bình (nâng qui mô) hoặc ngưỡng phụ thuộc vào phươngpháp fuzzy đặc biệt được sử dụng và mô hình giải quyết ẩn nó liên quan tới việclàm thế nào để có một dự báo tốt Kích thước của vùng lân cận có thể được thayđổi để cung cấp các kết quả đánh giá ở nhiều kích thước, do đó cho phép người

sử dụng xác định tại kích thước nào thì dự báo có kỹ năng tốt

Phương pháp đánh giá fuzzy cho phép vùng dự báo có thể không thậttrùng khớp với vùng thám sát Mức chênh lệch cho phép được xác định bởi mộtvùng lân cận địa phương Sự khác nhau giữa phương pháp đánh giá truyềnthống và phương pháp đánh giá fuzzy được thể hiện trong Hình 1.5

Không phải dễ dàng chỉ ngay ra được kích thước vùng lân cận thích hợp

Nó còn phụ thuộc vào khoảng cách giữa các ô lưới, độ phân giải thời gian, vàtrạng thái thời tiết, vì vậy một giá trị đơn lẻ có thể không thích hợp cho tất cảcác loại dự báo cũng như các miền tính

Phương pháp đánh giá fuzzy giải quyết được điều này bằng cách thay đổikích thước của miền lân cận, bởi vậy nó đem lại các thông tin cho chất lượng

dự báo như là một hàm của quy mô

Trang 31

Một số phương pháp đánh giá fuzzy giả định rằng các ô lưới lân cận củavùng quan trắc cũng được mở rộng tương ứng như vùng dự báo Đây là mộttrong những cách thể hiện sự không chắc chắn trong quan trắc Trường hợp nàyđược thể hiện trong hình 1.6, được gọi là vùng quan trắc – vùng dự báo.

(Đánh giá fuzzy) (Đánh giá fuzzy)

Hình 1.6 Cửa sổ quan trắc và dự báo của phương pháp đánh giá fuzzy

Để mô tả kỹ phương pháp đánh giá fuzzy, một số các ký hiệu được thiếtlập như sau:

Gọi X là giá trị quan trắc trong một ô lưới, Y là giá trị dự báo trong ôlưới tương ứng s biểu thị giá trị các ô lưới xung quanh điểm lưới đang xét,trong đó s là quy mô lưới ( ) biểu thị giá trị trung bình toàn miền tính.

Ix cho biết sự kiện quan trắc được trong hộp lưới (có xảy ra = 1, không xảy ra =0), và Iy cho biết sự kiện dự báo được trong hộp lưới tương ứng I x sI y s

biểu thị các sự kiện quan trắc và dự báo trong vùng lân cận các hộp lướiđangxét Việc quyết định sử dụng phương pháp nào để xác định sự kiện trong vùnglân cận I s phụ thuộc vào từng phương pháp đánh giá fuzzy đang được sửdụng, như chúng ta sẽ xét đến dưới đây Một số phương pháp đòi hỏi I s phảiđược tách riêng, ví dụ như 0 hoặc 1, trong khi đó các phương pháp khác chophép sử dụng các giá trị trung gian

Ký hiệu P x s là thành phần của hộp lưới tại vùng lân cận quan trắc và

P y s là thành phần của hộp lưới tại vùng lân cận dự báo:

Trang 32

x s

trong đó n là số ô lưới trong vùng dự báo

Bằng cách so sánh dự báo với các sự kiện quan trắc ta có thể tính được sai

số quy mô phụ thuộc E s

Y strong vùng lân cận

Phương pháp đánh giá fuzzy khá đơn giản: Chọn một tập hợp các quy môvới các chỉ số: s = 1, 2, …., S và ngưỡng cường độ sự kiện với các chỉ số k = 1,

2, , K, thông qua đó để tính toán các kết quả đánh giá fuzzy

a Đối với mỗi quy mô s: Với mỗi điểm thám sát, thu thập các ô lưới dựbáo trong cửa sổ quy mô s xung quanh điểm thám sát đó Nếu trường hợp là

“vùng thám sát – vùng dự báo” thì cũng thu thập những thám sát tương ứngtrong cửa sổ tương ứng

b Đối với mỗi ngưỡng cường độ k quy mô tính toán ( I x s , I y s , P x s ,

E s)k phụ thuộc vào việc lựa chọn các biến của mô hình (được đề cậpdưới đây)

c Đối với mỗi ngưỡng cường độ k có một điểm số đại diện cho toànmiền

Mỗi phương pháp đánh giá fuzzy cho kết quả là một ma trận (k x s) cácđiểm số đánh giá đối với các điểm số thay đổi tùy thuộc vào quy mô (s) vàcường độ (k)

Bằng cách kiểm tra việc thực hiện dự báo theo cách này có thể quyết địnhđược sự kết hợp quy mô, cường độ tại dự báo với độ phân giải cao hữu ích Kếtquả đánh giá fuzzy có thể được tập hợp theo dự báo tháng, dự báo mùa, hoặccác hiện tượng thời tiết tương tự để tìm ra quy luật có tính hệ thống

a Các phương pháp đánh giá fuzzy đặc trưng

Tất cả các phương pháp đều sử dụng một trong hai loại đã được đề cậpđến ở trên là: “một điểm quan trắc – một vùng dự báo”, và “một vùng quan trắc– một vùng dự báo” Tùy vào từng nhu cầu cụ thể về thông tin chất lượng dự báo mà người dùng có thể lựa chọn phương pháp phù hợp

26

Trang 33

a Nâng quy mô (Upscaling):

Là một trong những phương pháp đánh giá đơn giản và xuất hiện sớmnhất Các giá trị dự báo và quan trắc được lấy trung bình theo các quy mô tăngdần và được đem so sánh bằng cách sử dụng các điểm số truyền thống Mô hìnhđưa ra một dự báo có chất lượng thì tương thích với quan trắc khi lấy trungbình trong các quy mô lưới thô Yates và Cộng sự (CS) (2006) sử dụng cả cácbiến liên tục và các biến pha để đánh giá dự báo nâng quy mô, trong khi Zepeda-Arce và CS(2000) và Weygandt cùng CS (2004) đánh giá dự báo mưa bằng cách

sử dụng các điểm số truyền thống Trong trường hợp này quy tắc để tính toáncác hiện tượng trong vùng lân cận là:

0 Y

s

Nguong Nguong

Tương tự đối với I x s .

b Độ phủ tối thiểu (Minimum coverage)

Damrath (2004) giả định rằng trong các vùng lân cận sự kiện quan trắc và

dự báo không có độ nhọn, tức là các hiện tượng có thể xảy ra ở bất cứ đâu trongvùng lân cận đó, với xác suất tương ứng là P x sP y s Ông đã thử nghiệm vớihai mô hình cơ bản Đầu tiên, thiết lập một độ phủ tiêu chuẩn tối thiểu, dự báotốt nếu như các hiện tượng được dự báo vượt quá một xác suất phủ tối thiểucủa vùng dự báo đã chọn, hiện tượng xảy ra trong vùng lân cận được xác địnhnhư sau:

dự báo xác suất thường dùng là xác suất phát hiện POD, tỉ lệ báo động sai FAR,điểm cảnh báo ETS được tính cho các hiện tượng xảy ra trong vùng lân cận

c Fuzzy lôgic (Fuzzy logic)

Trang 34

Phương pháp lôgic được Damrath (2004) xác định các hiện tượng xảy ratrong vùng lân cận như xác suất của chính các thành phần trong hộp lưới:

Dự báo

Vì vậy, Ebert (2002) đã cải tiến phương pháp này bằng cách dùng các xácsuất đồng thời để xác định các yếu tố trong bảng:

Dự báo

Các điểm số trong bảng này được tính từ các yếu tố trong bảng phía

trên d Bảng liên hợp các sự kiện (Multi-event contingency table)

Atger (2001) đã đưa ra một bảng liên hợp các sự kiện để ước lượng sự phùhợp giữa dự báo và quan trắc cho nhiều ngưỡng đã định Bảng liên hợp truyềnthống 2x2 chỉ sử dụng cho một sự kiện đơn lẻ, các giá trị của biến không vượt quámột ngưỡng nhất định Bảng này không những có thể mở rộng các ngưỡng cường

độ mà còn có thể tăng kích thước, ví dụ như kích thước về không

Trang 35

28

Trang 36

gian, thời gian Bất kỳ một thành phần lân cận nào I y s cũng có thể được xác định theo nguyên tắc.

e Cường độ - quy mô (Intensity-scale)

Phương pháp này được đề xuất bởi Casati (2004), quy mô phụ thuộc vào

hiệu sai số, I y - I x , sử dụng mảng hai chiều Hiệu sai số I y I x s tại mỗi quy mô cóthể coi như là tổng sai số trung bình tại quy mô lớn nhất và thay đổi tùy vào tínhchất đặc trưng của quy mô đó Các giá trị bình phương trung bình được tínhtheo miền và phụ thuộc vào điểm kỹ năng (ss) có tính đến dự báo ngẫu nhiênkhông có kỹ năng Trường hợp này một dự báo tốt là dự báo đúng nhiều hơn làquan trắc sắp xếp ngẫu nhiên Phương pháp này không giống với các phươngpháp khác, phương pháp này sử dụng cửa sổ rời rạc hơn là các cửa sổ động,chính vì vậy phương pháp này được thực hiện khá nhanh

f Điểm kỹ năng phần tử (Fractions skill score - FBS).

Phương pháp này được phát triển bởi Roberts (2005), so sánh trực tiếpcác phần tử trong sự kiện trong các cửa sổ bao quanh vùng quan trắc và dự báo.Nguyên tắc cơ bản của mô hình là một dự báo tốt khi tần suất các sự kiện dự báogần trùng với tần suất các sự kiện quan trắc Thay vì suy luận từ các tần suấtxuất hiện sự kiện các vùng lân cận, chúng được sử dụng trực tiếp để so sánh cácđiểm số Brier, như sau:

FBS

Trong đó N là số các ô lưới trong cửa sổ FBS là một trong những trườnghợp (bằng một nửa) của điểm số Brier nhưng giá trị quan trắc lúc này chỉ nhậngiá trị từ 0 đến 1 Kết quả có thể được biểu diễn như là một điểm số kỹ năng cácphần tử

Trang 37

29

Trang 38

FSS 1

1

Số hạng thứ hai trong mẫu số là khả năng dự báo kém nhất để không có

sự chồng chéo giữa dự báo và quan trắc FSS nhận giá trị trong khoảng từ 0 đến

2b/(b2-1) khi quy mô tăng lên

g Phương pháp tiếp cận thực tế (Pragmatic approach)

Phương pháp này sử dụng các dự báo trước trong một vùng lân cận cácđiểm quan trắc Thay vì đánh giá xác suất dự báo trong các ô lân cận dựa trêncác quan trắc, trong miền lân cận được chọn để đánh giá dựa trên các giá trịquan trắc ở trung tâm hộp lưới Phương pháp này sử dụng điểm Brier (BS) vàđiểm kỹ năng Brier (BSS) để đánh giá các dự báo thành công Quyết định tới môhình: Một dự báo tốt là dự báo có khả năng cao phát hiện sự kiện có xảy ra haykhông Để xác định mức độ phát triển của dự báo thực tiễn nó được đem so sánhvới đầu ra của mô hình, BSS được đối chiếu với đầu ra của mô hình mà có xácsuất bằng 0 hoặc 1 tại điểm quan trắc Để áp dụng, thay vì tính toán BSS với lưu

ý đến khí hậu tiêu biểu trong toàn miền quan trắc

BSS 1

h Phương pháp thực nghiệm hoàn hảo (Practically perfect hindcast)

Brooks (1998) đã phát triển một phương pháp đánh giá fuzzy để giảiquyết vấn đề đánh giá các sự kiện hiếm Rất khó khăn nếu không nói là khôngthể để đạt được một dự báo hoàn hảo cho các sự kiện hiếm hoi, do đó, điểm sốnhư số điểm cảnh báo (TS) thường có giá trị rất thấp Mục đích đưa ra các điểm

số đánh giá trong trường hợp này là so sánh nó với số điểm đạt được bằng một

"thực nghiệm hoàn hảo", đó là dự báo không gian đã được xác định bởi mộtkiến thức dự báo hoàn hảo của dự báo viên về các quan trắc trước đó

Trang 39

Nếu quan trắc trên một mạng lưới có độ phân giải cao (ví dụ, dữ liệu radar)thì xác suất P x s có thể được ước lượng từ quan trắc trong các vị trí lân cận Đối vớimỗi quy mô nhất định, các ngưỡng xác suất được xác định như sau:

đánh giá với I x tương ứng

i Căn bậc hai có điều kiện của RPS (Conditional square root of RPS)

Germann và Zawadzki (2004) áp dụng phương pháp một điểm quan trắc– một vùng dự báo để đánh giá lượng mưa Tần suất xuất hiện của các giá trị dựbáo giáng thủy tăng theo hàm lôga thời gian, được dùng để phân cấp các điểm

số xác suất (RPS) Căn bậc hai của nó có thể được hiểu như là độ lệch chuẩncủa xác suất Thông thường mưa quan trắc được dùng để đánh giá kết quả để sosánh với các sự kiện khác của dự báo Điểm số này là căn bậc hai của RPS (kýhiệu là CSRR)

j Vùng liên đới RMSE (Area related RMSE)

Rezacova et al (2006) đề xuất, cách tiếp cận của phương pháp này là sosánh các giá trị dự báo lưới phân giải cao và quan trắc trong vùng lân cận đểđưa ra sai số quy mô phụ thuộc vào quan trắc E s Dự báo tốt là dự báo có độphân bố cường độ gần đúng với thám sát Phương pháp này tính toán diện tíchliên quan đến sai số bình phương trung bình RMSE Các giá trị quan trắc và dựbáo được sắp xếp từ nhỏ đến lớn sau đó RMSE được tính từ chuỗi số liệu đượcsắp xếp đó Quy mô phụ thuộc vào giá trị RMSE có thể được vẽ trên bản đồhoặc chúng có thể được tổng hợp trên các miền

Trang 40

Tùy vào từng nhu cầu cụ thể về thông tin chất lượng dự báo mà ngườidùng có thể lựa chọn phương pháp phù hợp.

NO-NF: Vùng lân cận quan trắc – vùng lân cận dự báo

31

Ngày đăng: 21/11/2020, 22:31

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w