1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Nghiên cứu ứng dụng mô hình ARIMA để dự báo lượng mưa vụ đông xuân ở một số tỉnh vùng đồng bằng bắc bộ

94 21 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 94
Dung lượng 3,05 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

DANH MỤC CÁC KÍ HIỆU VIẾT TẮTAGCM Mô hình hoàn lưu chung khí quyển ACF Hàm tự tương quan Autocorrelation function ANN Phương pháp mạng thần kinh AOGCM Mô hình kết hợp couple đại dương kh

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

-Nguyễn Hữu Quyền

NGHIÊN CỨU ỨNG DỤNG MÔ HÌNH ARIMA ĐỂ DỰ BÁO LƯỢNG MƯA VỤ ĐÔNG XUÂN Ở MỘT SỐ TỈNH

VÙNG ĐỒNG BẰNG BẮC BỘ

LUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội – 2013

Trang 2

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

Nguyễn Hữu Quyền

-NGHIÊN CỨU ỨNG DỤNG MÔ HÌNH ARIMA ĐỂ DỰ BÁO LƯỢNG MƯA VỤ ĐÔNG XUÂN Ở MỘT SỐ TỈNH VÙNG

ĐỒNG BẰNG BẮC BỘ

Chuyên ngành: Khí tượng và khí hậu học

Mã số: 60.44.87

LUẬN VĂN THẠC SĨ KHOA HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC:PGS TS Dương Văn Khảm

Hà Nội – 2013

Trang 3

LỜI CẢM ƠN

Trước tiên học viên xin trân trọng cảm ơn các thầy cô trong Khoa Khí tượng Thủy văn và Hải dương học đã hướng dẫn và giúp đỡ tận tình học viên trong suốt thời gian tham gia lớp cao học.

Đặc biệt, học viên xin bày tỏ lòng biết ơn sâu sắc đến PGS TS Dương Văn Khảm, người đã trực tiếp định hướng và hướng dẫn học viên trong suốt quá trình hoàn thành luận văn Sự hiểu biết sâu sắc về khoa học cũng như những kinh nghiệm của thầy là tiền đề để giúp học viên mở rộng kiến thức và hoàn thành khóa luận tốt nghiệp.

Xin trân trọng cảm ơn Lãnh đạo Viện Khoa học Khí tượng Thủy văn và Môi trường, các bạn đồng nghiệp trong cơ quan, đã tạo điều kiện về thời gian

và quan tâm động viên tinh thần trong thời gian học viên đi học và hoàn thành luận văn.

Cuối cùng xin cảm ơn gia đình và bạn bè đã luôn bên tôi, cỗ vũ và động viên tôi trong suốt quá trình hoàn thành luận văn này.

Nguyễn Hữu Quyền

Trang 4

MỤC LỤC

MỞ ĐẦU 1

Chương 1 TỔNG QUAN 3

1.1 Cơ sở khoa học của dự báo khí hậu mùa 3

1.2 Các nghiên cứu trên thế giới 8

1.3 Các nghiên cứu ở trong nước 13

Chương 2 MÔ HÌNH ARIMA VÀ SỐ LIỆU SỬ DỤNG 21

2.1 Giới thiệu cấu trúc của mô hình ARIMA 21

2.1.1 Mô hình tự hồi quy trung bình trượt ARIMA 22

2.1.2 Mô hình động thái ARIMAX 23

2.2 Phương pháp áp dụng mô hình ARIMA và ARIMAX đối với bài toán dự báo mưa mùa 24

2.2.1 Xác định tính ổn định ngẫu nhiên của chuỗi thời gian 25

2.2.2 Nhận dạng cấu trúc của mô hình 28

2.2.3 Xác định các tham số của mô hình 32

2.2.4 Kiểm định mô hình 35

2.2.5 Phần mềm thống kê SAS đối với mô hình ARIMA và ARIMAX 36

2.3 Các nguồn số liệu được sử dụng 36

2.3.1 Số liệu quan trắc mưa từ các trạm khí tượng 37

2.3.2 Số liệu về các chỉ số khí hậu 37

2.3.3 Số liệu về số vết đen mặt trời (Sunspot Number) 38

2.3.4 Xử lý số liệu 38

Chương 3 KẾT QUẢ VÀ NHẬN XÉT 41

3.1 Xây dựng mô hình dự báo mưa vụ đông xuân bằng mô hình ARIMA 41

3.1.1 Xác định tính ổn định của chuỗi lượng mưa vụ Đông xuân 41

3.1.2 Nhận dạng mô hình ARIMA 43

3.1.3 Xác định các thông và kiểm định mô hình ARIMA 44

3.2 Xây dựng mô hình dự báo lượng mưa vụ đông xuân bằng mô hình động thái ARIMAX 46

3.2.1 Xác định tính ổn định của chuỗi nhân tố dự báo 46

Trang 5

3.2.2 Khảo sát mối quan hệ giữa chỉ số lượng mưa và các biến tham ra dự

tuyển 49

3.2.3 Nhận dạng cấu trúc của mô hình động thái ARIMAX 53

3.2.4 Kiểm định các thông số trong mô hình động thái ARIMAX 55

3.3 Đánh giá khả năng mô phỏng của các mô hình ARIMA 60

KẾT LUẬN 67

TÀI LIỆU THAM KHẢO 68

Trang 6

DANH MỤC HÌNH

Hình1.1 Diễn biến về lượng mưa hàng năm và số vết đen mặt trời với các bước

trượt 11 (hình trên), 21 (hình giữa), 33 (hình dưới) ở Beijing, Trung Quốc [40] 5

Hình 1.2 Biến trình lượng mưa tháng theo quan trắc và theo mô phỏng 9

Hình 1.3 Mối quan hệ giữa lượng mưa quan trắc và mô phỏng theo phương pháp ANN và mô hình ARIMA vùng Hyderabad [35] 11

Hình 1.4 Sơ đồ xây dựng mô hình dự báo khí hậu mùa [13] 16

Hình 1.5 Sơ đồ thực hiện dự báo và cảnh báo hạn hán [14] 17

Hình 1.6 Kết quả quan trắc và dự báo Tmin2m theo REG trong 4 mùa 18

tại trạm Láng [12] 18

Hình 2.1 Các thành phần trong chuỗi quan trắc khí hậu [10] 26

Hình 2.2 Minh họa diễn biến của chuỗi lượng mưa tháng và hàm tự tương quan đối với trạm Hà Nội trước khí sai phân (A,A‟) và sau khi sai phân (B,B‟) 28

Hình 2.3 Một số dạng chính của hàm ACF và PACF tưng ứng với các dạng mô hình ARIMA khác nhau [20] 30

Hình 2.4 Một số dạng chính của hàm tương quan chéo giữa biến nhập (X) và biến phụ thuộc (Y) tưng ứng với các dạng mô hình ARIMA khác nhau [20] 31

Hình 2.5 [2] Vị trí nhóm nhân tố ENSO 37

Hình 2.6 [9] Mật độ phổ của chỉ số SOI và nhiệt độ bề mặt nước biển 38

ở các vùng Nino 38

Hình 2.7 Sơ đồ khối xây dựng mô hình ARIMA và ARIMAX 40

Hình 3.1 Diễn biến lượng mưa vụ đông xuân tại 9 trạm 42

vùng Đồng bằng Bắc Bộ 42

Hình 3.2 Hàm ACF (bên trái) và hàm PACF (bên phải) của chuỗi 44

lượng mưa vụ đông xuân trạm Hà Nội 44

Hình 3.3 Hàm ACF (bên trái) và hàm PACF (bên phải) của 45

chuỗi sai số trong mô hình ARIMA hanoi (0, 0, [4, 5]) 45

Hình 3.4 Hàm tự tương quan của chuỗi nhân tố dự báo thuộc nhóm chỉ số ENSO 48

Trang 7

Hình 3.7 Diễn biến hàm tương quan chéo giữa chỉ số lượng mưa vụ Đông Xuântrạm Hà Nội và dị thường nhiệt độ bề mặt nước biển ở các vùng NINO với thời giantrễ từ 1 đến 120 tháng so với thời gian dự báo 51

Hình 3.8 Diễn biến hàm tương quan chéo giữa chỉ số lượng mưa vụ Đông Xuântrạm Hải Dương và dị thường nhiệt độ bề mặt nước biển ở các vùng NINO với thờigian trễ từ 1 đến 120 tháng so với thời gian dự báo 51

Hình 3.9 Diễn biến hàm tương quan chéo giữa chỉ số lượng mưa vụ Đông Xuântrạm Hà Nội và chỉ số SOI, vết đen Mặt Trời với thời gian trễ từ 1 đến 120 tháng sovới thời gian dự báo 52

Hình 3.10 Diễn biến hàm tương quan chéo giữa chỉ số lượng mưa vụ Đông Xuântrạm Hải Dương và chỉ số SOI, vết đen Mặt Trời với thời gian trễ từ 1 đến 120tháng so với thời gian dự báo 52

Hình 3.11 Hàm tự tương quan và tự tương quan riêng phần của chuỗi sai số dự báotrong mô hình động thái ARIMAX 58

Hình 3.12 Mô phỏng lượng mưa vụ đông xuân theo các mô hình được xây dựng tạimột số trạm vùng đồng bằng Bắc Bộ 62

Hình 3.12 Mô phỏng lượng mưa vụ đông xuân theo các mô hình được xây dựng tạimột số trạm vùng đồng bằng Bắc Bộ (tiếp theo) 63

Hình 3.12 Mô phỏng lượng mưa vụ đông xuân theo các mô hình được xây dựng tạimột số trạm vùng đồng bằng Bắc Bộ (tiếp theo) 64

Hình 3.13 Kết quả dự báo lượng mưa vụ đông xuân theo các mô hình được xâydựng tại một số trạm vùng đồng bằng Bắc Bộ 65

Trang 8

DANH MỤC BẢNG

Bảng 1.1 Các đặc trưng liên quan đến mô hình ARIMA tại các trạm 11trên lãnh thổ Thái Lan [39] 11Bảng 1.2 Kết quả nhận dạng các mô hình ARIMA và mô hình12 động thái ARIMA

[18] 12

Bảng 1.3 So sánh sai số quân phương (RMSE) từ các mô hình được tính toán trên

số liệu phụ thuộc (In-sample) và số liệu độc lập (Out-sample)[18] 13Bảng 3.1 Hệ số tự tương quan và giới hạn tin cậy của chuỗi lượng mưa vụ đông

xuân tại 9 trạm vùng Đồng bằng Bắc Bộ 43Bảng 3.2 Các đặc trưng thông số của mô hình ARIMA hanoi (4, 0, [4, 5]) 44Bảng 3.3 Ma trận tương quan giữa các thông số của mô hình ARIMA hanoi (4, 0,[4, 5]) 45Bảng 3.4 Các đặc trưng thông số của mô hình ARIMA hanoi (0, 0, [4, 5]) 45

45

Bảng 3.6 Thứ tự các bước trễ theo tháng……… …….51

Bảng 3.7 Kết quả nhận dạng cấu trúc của mô hình động thái ARIMAX đối với các

trạm vùng đồng bằng Bắc Bộ 54Bảng 3.8 Các đặc trưng thống kê của các thông số trong mô hình động tháiARIMAX 56Bảng 3.9 Ma trận tương quan giữa các thông số trong mô hình động thái ARIMAX

57

Bảng 3.10 Các chỉ tiêu đánh giá khả năng mô phỏng của các mô hình đối với chuỗiphụ thuộc 66Bảng 3.11 Các chỉ tiêu đánh giá khả năng mô phỏng của các mô hình đối với chuỗiđộc lập 66

Trang 9

DANH MỤC CÁC KÍ HIỆU VIẾT TẮT

AGCM Mô hình hoàn lưu chung khí quyển

ACF Hàm tự tương quan (Autocorrelation function)

ANN Phương pháp mạng thần kinh

AOGCM Mô hình kết hợp (couple) đại dương khí quyển

AOL-GCM Mô hình khí quyển - đại dương – đất

ARIMA Mô hình tự hồi quy trung bình trượt

ARIMAX Mô hình động thái (Dynamic Regression)

CCF Hàm tương quan chéo (Cross correlation function)

ECMWF Trung tâm Dự báo Thời tiết hạn vừa châu Âu

ENSO Dao động Nam về El Niño/La Nina

GCM Mô hình khí hậu toàn cầu

MAE Sai số trung bình tuyệt đối (Mean Absolute Error)

ME Sai số trung bình, hay sai số hệ thống (Mean Error)

MEI Multivariate ENSO Index

MOS Thống kê sản phẩm đầu ra mô hình (Model Output Statistics)MSSS Điểm kỹ năng của mô hình (Mean Square Skill Score)

NCAR Trung tâm Quốc gia về Nghiên cứu Khí quyển (Hoa Kỳ)NCEP Trung tâm Quốc gia Dự báo Môi trường (Hoa Kỳ)

NCSS National Council for the Social Studies

NOAA Cơ quan Quản lý Khí quyển và Đại dương (Hoa Kỳ)

OGCM Mô hình hoàn lưu chung đại dương

PAFC Tự tương quan riềng phần (Part autocorrelation function)RCM Mô hình khí hậu khu vực

RegCM Mô hình khí hậu khu vực của NCAR

RMSE Sai số quân phương

SAS Statistical Analysis System

SOI Chỉ số dao động nam (Southern Oscillation Index)

SST Nhiệt độ mặt nước biển (Sea Surface Temperature)

SSTA Chuẩn sai nhiệt độ mặt nước biển (Sea Surface Temperature

Anomalies)VDMT Vết đen Mặt Trời

WMO Tổ chức Khí tượng Thế giới (World Meteorological

Organization)

Trang 10

MỞ ĐẦU

Các thông tin dự báo khí hậu, đặc biệt là dự báo mưa mùa có ý nghĩa lớn đếncác hoạt động phát triển kinh tế xã hội như: kế hoạch sản xuất nông nghiệp, du lịch,đánh bắt và nuôi trồng thủy sản, quản lý, khai thác có hiệu quả nguồn tài nguyênnước Mức độ tin cậy về dự báo mưa mùa thường thấp hơn so với các yếu tố dựbáo khác, nguyên nhân là do sự phân bố theo không gian và sự biến đổi theo thờigian của lượng mưa phụ thuộc vào nhiều yếu tố khác Chính vì vậy công tác nghiêncứu dự báo mưa mùa tuy không còn mới nhưng vẫn đang rất được quan tâm ở nhiềunước trên thế giới, trong đó có Việt Nam

Ở vùng đồng bằng Bắc Bộ trong những năm gần đây sản xuất lúa vụ đôngxuân luôn phải đối mặt với tình trạng thiếu nước nghiêm trọng ở giai đoạn đầu vụ,nhiều khu vực đã phải chuyển đổi diện tích trồng lúa vụ đông xuân sang trồng cáccây hoa màu Việc dự báo được lượng mưa vụ đông xuân, đặc biệt là tổng lượngmưa trong khoảng từ tháng 10 năm trước đến tháng 1 năm sau sẽ cho phép tính toánđược tổng lượng nước cần phải tưới đối với các cây trồng cạn trong vụ đông vàlượng nước đổ ải làm đất đối với vụ lúa đông xuân thông qua các mô hình khí tượngnông nghiệp Các kết quả này sẽ là cơ sở khoa học trong việc lập kế hoạch tích trữnước cho các hồ chứa trong vùng, bố trí hợp lý cây vụ đông và đưa ra quyết định vềthời vụ cơ cấu cây trồng Đây là bài toán có ý nghĩa rất quan trọng trong công tácchỉ đạo sản xuất nông nghiệp ở các tỉnh đồng bằng Bắc Bộ mà sự thành công của nóphụ thuộc rất nhiều vào kết quả dự báo tổng lượng mưa trong giai đoạn này

Hiện nay ở Việt Nam, các bản tin dự báo hạn mùa đã đáp ứng phần nào nhucầu phục vụ phát triển kinh tế xã hội và phòng tránh giảm nhẹ thiên tai, tuy nhiên đểgiải quyết bài toán nêu trên, sẽ gặp phải khó khăn về nguồn dữ liệu đầu vào, các kếtquả dự báo mưa còn mang tính định tính, chưa đưa ra định lượng và hơn nữa, thời hạn

dự báo là 3 tháng liên tiếp, chưa thật sự phù hợp với yêu cầu của bài toán nông nghiệp

ở vùng này

Hiện nay có hai cách tiếp cận để nghiên cứu dự báo mưa mùa vụ là bằngphương pháp thống kê và phương pháp mô hình động lực Nhìn chung, phương

Trang 11

pháp thống kê truyền thống đã đạt được những kết quả nhất định, nhiều mô hìnhthống kê có đóng góp chính trong việc đưa ra bản tin dự báo tổng lượng mưa mùa.Phương pháp mô hình động lực là hướng nghiên cứu đang rất được quan tâm pháttriển, nó có những ưu điểm vượt trội về khả năng cung cấp sản phẩm dự báo, tuynhiên, việc giải mô hình số rất phức tạp và tốn kém, cần phải có công cụ máy tínhcấu hình cao và hơn nữa kết quả dự báo mưa cũng chưa đạt được độ chính xác nhưmong muốn.

Mô hình ARIMA là mô hình phân tích chuỗi thời gian , nó không chỉxem xétcác chu kỳ tự vận động của chuỗi dữ liệu dự báo , các mối tương tác trong quá trình

tư ̣vâṇ đông ̣ của các nhân tốảnh hưởng khác mànócòn đánh giáđươc ̣ các quy luâṭ saisốtrong quátrinh̀ mô phỏng đểnâng cao đô ̣chinh́ xác của dư ̣báo Mặc dù mô hìnhnày đã được áp dụng ở nhiều nước trên thế giới nhưng ở Việt Nam cho đến nay vẫncòn rất ít các nghiên cứu áp dụng trong dự báo khí hậu mùa

Xuất phát từ các nhận thức nêu trên và để góp phần đáp ứng nhu cầu thực

tiễn, chúng tôi chọn đề tài luận văn tốt nghiệp là: "Nghiên cứu ứng dụng mô hình ARIMA để dự báo lƣợng mƣa vụ đông xuân ở một số tỉnh vùng đồng bằng Bắc Bộ".

Các nôi dung chính của luận văn được trình bày trong 3 chương như sau:Chương 1: Tổng quan

Chương 2: Mô hình ARIMA và số liệu sử dụng

Chương 3: Kết quả và thảo luận

Trang 12

Chương 1 TỔNG QUAN

Trong chương này, sẽ trình bày cơ sở khoa học của dự báo khí hậu mùa vàtóm lược các công trình nghiên cứu tiêu biểu nhằm rút ra được những thông tin cầnkhai thác, ứng dụng hoặc cải tiến trong việc thực hiện các nội dung của đề tài

1.1 Cơ sở khoa học của dự báo khí hậu mùa

Trải qua hàng nghìn năm con người đã có kinh nghiệm tìm cánh thích ứngvới quy luật diễn biến khí hậu, biểu hiện rõ rệt nhất là sự hình thành mùa, vụ trongnông nghiệp Tuy nhiên trong thực tế sự dao động mang tính quy luật của các hiệntượng thời tiết khí hậu diễn ra không ổn định, tính bất thường của nó sẽ ảnh hưởngđến các hoạt động kinh tế - xã hội, trong đó có sản xuất nông nghiệp Vì vậy nếu dựbáo được mức độ biến động của các yếu tố khí hậu, đặc biệt là yếu tố lượng mưatrong từng mùa, vụ sẽ cho phép thực hiện công tác chỉ đạo sản xuất hợp lý, tiết kiệmđược nguồn nước, giảm chi phí trong sản xuất, nâng cao năng suất cây trồng… Đóchính là một trong những yêu cầu đối với các nhà nghiên cứu dự báo khí hậu

Trong khí tượng, công tác dự báo nghiệp vụ thường được chia thành 2 loại:

dự báo thời tiết và dự báo khí hậu Dự báo thời tiết là dự báo trước trạng thái củakhí quyển tại một địa điểm và thời điểm cụ thể (thời điểm có thể là từng giờ, từngngày) Dự báo khí hậu là dự báo các đặc trưng về điều kiện khí quyển trong từngkhoảng thời gian dài như: tháng, mùa, vụ, năm, thập kỷ, thế kỷ, trong đó, được quantâm nhiều nhất là dự báo hạn mùa (tháng, mùa, vụ) Dự báo khí hậu hạn mùa khácvới dự báo thời tiết không chỉ ở phạm vi thời gian, mục đích mà còn khác cả sảnphẩm, cách tiếp cận và phương pháp Nhiều thông tin mà nghiên cứu dự báo thờitiết có thể bỏ qua, nhưng nghiên cứu dự báo mùa lại cần phải tính toán rất thậntrọng [36]

Do tính tương tác không tuyến tính của các hình thế thời tiết ở quy mô synopnên dự báo thời tiết chỉ có thể dự báo trước được một số ngày Theo WMO quy địnhcác dự báo khí tượng có hạn dự báo nhỏ hơn hoặc bằng 10 ngày được xem là dự báothời tiết (thời đoạn 10 ngày là cận trên của chu kỳ Synop) và hạn dự báo trongkhoảng tháng, mùa, vụ được xem là dự báo mùa [41]

Trang 13

Sản phẩm của dự báo thời tiết bao gồm nhiều yếu tố khí tượng với các mứcđịnh lượng khác nhau, nhưng sản phẩm của dự báo hạn mùa thường là mức độ daođộng xung quanh giá trị trung bình nhiều năm của một số yếu tố khí hậu chính nhưnhiệt độ và lượng mưa Ngoài ra các hiện tượng thời tiết đặc biệt như: bão, áp thấpnhiệt đới, mưa lớn, nắng nóng, rét đậm, rét hại, khô hạn cũng đã được nghiên cứutrong công tác dự báo mùa để nhằm giảm thiệt hại do thiên tai gây ra đối với pháttriển kinh tế - xã hội của mỗi quốc gia.

Mục tiêu của các mô hình dự báo thời tiết là nắm bắt chính xác trạng thái củakhí quyển trong khoảng thời gian dự báo Mức độ chính xác của mô hình dự báothời tiết thường phụ thuộc vào hạn dự báo, khả năng giải các phương trình biếnđộng ngắn hạn của các đặc trưng khí quyển và độ chính xác của điều kiện ban đầu

và điều kiện biên Nhưng đối với các mô hình dự báo hạn mùa, cần phải nắm bắtđược dị thường của khí hậu mùa, đây là một bài toán rất phức tạp mà sự thành côngcủa dự báo phụ thuộc vào mức độ hiểu biết về mối quan hệ tương tác giữa khíquyển, lục địa và đại dương [41]

Theo [36], các hoạt động tự nhiên của hệ thống khí hậu làm gia tăng biếnđộng của khí hậu trên tất cả quy mô thời gian Một số các quá trình xảy ra trongkhoảng thời gian ngắn như sự phát triển của hệ thống synop trong khí quyển là mộttrong những nguyên nhân dẫn đến sai số dự báo mùa Tuy nhiên, sự thay đổi chậmcủa hệ thống khí hậu là nguồn gốc cơ bản cho phép dự báo khí hậu mùa Nguyênnhân của sự thay đổi này bao gồm sự thay đổi trong khoảng thời gian dài của đạidương, hệ thống tương tác đại dương-khí quyển và các thành phần khác như băngbiển, điều kiện bề mặt đất, độ che phủ của tuyết…

El Nino và Dao động Nam (SO) được xem là nhân tố tác động lớn nhất đến

dị thường khí hậu, trong đó có lượng mưa Walker (1924) đã phát hiện ra dao độngcủa khí áp quy mô lớn, từ năm này qua năm khác ở 2 phía Đông và Tây của khu vựcxích đạo Thái Bình Dương (Tahiti và Darwin) và được gọi là Dao động Nam Hơn

40 năm sau, trong công trình nghiên cứu của Jacob Bjerknes (1969) thừa nhận có sựquan hệ chặt chẽ giữa Dao động Nam và sự thay đổi về nhiệt độ bề mặt nước biểntrên khu vực Xích Đạo đông Thái Bình Dương Mối quan hệ này thể hiện sự tươngtác giữa đại dương và khí quyển mà biểu hiện của nó chính là hiện tượng

Trang 14

ENSO (El Nino–Southern Oscillation) ENSO được dùng để chỉ cả 2 hai hiện tượng

El Nino, La Nina và có liên quan với Dao động Nam ENSO là nhân tố ảnh hưởnglớn nhất đến các dao động khí hậu hàng năm, chính sự kết hợp này là nguồn gốcchính sinh ra dị thường về nhiệt độ và lượng mưa trên phạm vi toàn cầu [32,33]

Trong những năm gần đây đã có nhiều tác giả sử dụng các phương pháp khácnhau để tìm quy luật dao động của ENSO cũng như đánh giá ảnh hưởng của nó đếncác yếu tố khí hậu đã làm rõ hơn về sự tương tác giữa khí quyển và đại dương, vàđặc biệt là dự báo hiện tượng ENSO theo quy mô tháng và năm đã hỗ trợ tốt hơncho các dự báo hạn mùa ở nhiều nơi trên thế giới [36]

Ngoài ra, nhân tố tác động bên ngoài hệ thống khí hậu như sự thay đổi số vếtđen mặt trời cũng được xem xét đến trong nghiên cứu dự báo khí hậu mùa (Vết đenMặt Trời là các khu vực tối trên bề mặt Mặt Trời Độ sáng bề mặt của vết đen vàokhoảng 1/4 độ sáng của những vùng xung quanh Nguyên nhân xuất hiện vết đen là

do nhiệt độ của chúng thấp hơn các vùng xung quanh [42]) Tuy nhiên, tác động của

nhân tố này đến quy mô khí hậu mùa thường là không lớn và có xu hướng hoạtđộng trên quy mô thời gian dài, đáng kể nhất là chu kỳ mặt trời 11 năm [40]

Hình1.1 Diễn biến về lượng mưa hàng năm và số vết đen mặt trời với cácbước trượt 11 (hình trên), 21 (hình giữa), 33 (hình dưới) ở Beijing, Trung Quốc[40]

Trang 15

Cho đến nay, có hai cách tiếp cận để dự báo khí hậu mùa là dự báo bằngphương pháp thống kê thực nghiệm và phương pháp động lực Mỗi phương phápđều tồn tại những điểm mạnh yếu và có xu hướng bổ xung cho nhau, do vậy cáchoạt động dự báo mùa ở nhiều trung tâm thông thường phụ thuộc vào sự tổng hợpcác thông tin được cung cấp bởi các công cụ dự báo thống kê và mô hình động lực[36].

Phương pháp thống kê thực nghiệm phụ thuộc vào mối quan hệ giữa yếu tố

dự báo với các nhân tố dự báo Nhân tố dự báo có thể là các quan trắc hiện tại vàquá khứ hoặc các trường tái phân tích khí quyển, đại dương (SST, SOI, MEI ),hoặc cũng có thể là các trường dự báo của các mô hình khí hậu toàn cầu (hạ thấp qui

mô thống kê - Statistical Downscaling) Mối quan hệ giữa yếu tố dự báo với cácnhân tố dự báo được xây dựng dựa trên các tập số liệu lịch sử và giả thiết rằng mốiquan hệ đó vẫn duy trì trong tương lai Các công cụ phân tích thống kê khác nhaunhư: phân tích tương quan, hồi quy, xác suất có điều kiện, hàm phân biệt, phân tíchchuỗi thời gian …được sử dụng nhằm nắm bắt được tính chất vật lý và các quá trìnhđộng lực trong hệ thống khí hậu Ưu điểm của cách tiếp cận này đó là quá trình tínhtoán trong các mô hình không cần công hiệu máy tính lớn, đơn giản, dễ áp dụngtrong thực tiễn, kết quả dự báo mang tính khách quan, tuân theo một quy tắc nhấtđịnh Ban đầu, hướng tiếp cận này không thực sự thành công, nhưng với sự gia tănghiểu biết về hiện tượng ENSO và các hình thế thời tiết khác đã giúp cho phươngpháp này đáng tin cậy hơn [36] Tuy nhiên, cách tiếp cận này tồn tại một số điểmnhư: chỉ đơn thuần dựa vào mối quan hệ tuyến tính, không biểu diễn trực tiếp quan

hệ vật lý giữa nhân tố dự báo và yếu tố dự báo, các điều kiện khí hậu chưa từng xảy

ra không được xét đến trong quá trình dự báo, và kết quả dự báo phụ thuộc nhiềuvào độ dài chuỗi số liệu

Phương pháp động lực là hướng nghiên cứu mô phỏng khí hậu bằng mô hình

số Để biểu diễn các quan hệ vật lý giữa các yếu tố, người ta xây dựng các mô hình

số dựa trên mối tương tác vật lý của sự chuyển động Phát triển sớm nhất của loại

mô hình này là mô hình hoàn lưu chung khí quyển (AGCM), sau đó, do sự ảnhhưởng quan trọng của đại dương đối với hệ thống khí hậu nên đã lồng ghép mô hình

Trang 16

hoàn lưu chung đại dương (OGCM) với mô hình hoàn lưu chung khí quyển để tạothành hệ thống mô hình kết hợp (couple) đại dương khí quyển (AOGCM) Mặtkhác, do nhu cầu sử dụng thông tin dự báo với độ phân giải không gian cao, các nhàkhoa học đã đưa ra các mô hình khí hậu khu vực (RCM), mô hình RCM được xâydựng theo nguyên tắc RCM được lồng vào một GCM nào đó Phương pháp lồngghép RCM vào AOGCM thường được gọi là hạ thấp qui mô động lực (DynamicalDownscaling) Hiện nay, các mô hình hoàn lưu chung khí quyển đại dương và các

mô hình khí hậu khu vực là công cụ chủ yếu được sử dụng để xác định sự biến độngkhí hậu trong quá khứ và dự báo khí hậu cho tương lai Nếu kết quả đầu ra của môhình có sai số hệ thống, nó sẽ thực hiện thêm quá trình thống kê sản phẩm mô hình(MOS) để đạt được kết quả đầu ra tốt hơn Ngoài ra, một số các trung tâm lớn nhưTrung tâm dự báo thời tiết hạn vừa châu âu (ECMWF), Cơ quan Quản lý Khí quyển

và Đại dương Hoa Kỳ (NOAA) hiện đang sử dụng các mô hình khí quyển - đạidương – đất (AOL-GCM) để đưa ra sản phẩm dự báo mùa [30,34]

Ưu điểm chính của mô hình động lực là: mô hình động lực không bị hạn chếbởi sự không ổn định của khí hậu, có thể nắm bắt được các giá trị cực trị hoặcnhững hiện tượng bất thường có thể chưa từng xuất hiện trong khí hậu Tuy nhiên,

mô hình còn có những nhược điểm sau: việc giải mô hình số rất phức tạp, cần phải

có công cụ máy tính lớn, đầu tư lớn về hệ thống đồng hóa dữ liệu, hơn nữa các môhình này cũng có thể chứa đựng nhiều sai số từ các quá trình tương tác với các nhân

tố tác động (forcing) dẫn đến sai số của các mô hình biến đổi mạnh theo vùng, theomùa và tùy thuộc từng yếu tố khí tượng [22]

Như đã trình bày ở trên, tác giả đã tổng quan một số các nội dung liên quan đến cơ sở khoa học đối với dự báo khí hậu mùa, bao gồm: hạn dự báo, sản phẩm

dự báo, các nhân tố chính tác động đến khí hậu mùa và đặc biệt là các cách tiếp cận để dự báo mùa hiện nay Tiếp theo, sẽ tổng quan các nghiên cứu tiêu biểu liên quan đến dự báo mưa mùa (trọng điểm là phương pháp thống kê) trên thế giới và ở Việt Nam.

Trang 17

1.2 Các nghiên cứu trên thế giới

Từ những điểm mạnh, điểm yếu của phương pháp thống kê và phương pháp

mô hình số như đã trình bày ở trên, đã có nhiều quan điểm cho rằng cách giải quyếttối ưu trong trường hợp này là kết hợp cả hai phương pháp để tận dụng điểm mạnh

và hạn chế yếu điểm của mỗi phương pháp Chính vì vậy, đã có nhiều nghiên cứu

dự báo mưa mùa theo hướng tiếp cận bằng phương pháp thống kê truyền thống hoặckết hợp cả động lực và thống kê nhằm tăng chất lượng dự báo

Hướng tiếp cận kết hợp cả động lực và thống kê bao gồm: 1) Thống kê sau

mô hình (MOS): Dựa trên mối quan hệ thống kê giữa sản phẩm dự báo mưa(hindcast) của các mô hình động lực và số liệu quan trắc lượng mưa, xem sản phẩm

dự báo của mô hình động lực như là các nhân tố dự báo 2) Hạ thấp qui mô thống kê(Statistical Downscaling): Dựa trên mối quan hệ thống kê giữa số liệu quan trắcmưa và các trường tái phân tích, coi dự báo của GCM là hoàn hảo và sử dụng chúngnhư là nhân tố dự báo để xác định yếu tố dự báo cho tương lai 3) So sánh sản phẩm

dự báo mưa (hindcast) của cả 2 phương pháp thống kê và động lực để chọn mô hìnhphù hợp nhất phục vụ công tác dự báo nghiệp vụ Chi tiết về các phương pháp nàyđược trình bày trong các nghiên cứu của Pai và CS 2006, Lim và CS 2010,Rajeevan và CS 2007, Liew và CS 2009 Sau đây khái quát một số nghiên cứuđiển hình theo hướng động lực và thống kê

Năm 2011, trong nghiên cứu dự báo mưa mùa cho khu vực châu Phi, AnneRourke đã đánh giá kỹ năng mô phỏng lượng mưa mùa bằng cả 2 phương phápđộng lực và thống kê đối với từng vùng, từng mùa Trên cơ sở đó đã chọn được môhình phù hợp nhất được áp dụng đối với từng mùa và từng khu vực nhỏ trong vùngnghiên cứu [24]

Indira Kadel năm 2012 đã sử dụng phương pháp Downscaling thống kê để

dự báo mưa mùa cho khu vực Nepal của Ấn Độ, trong đó, nhân tố dự báo đượcchọn từ bộ số liệu tái phân tích của NCEP/NCAR về tham số khí quyển đại, dươngthời kỳ 1970 – 2010 [23]

Trang 18

Hướng tiếp cận theo phương pháp thống kê truyền thống: Đây là hướng

nghiên cứu không mới, nhưng do tính đơn giản, dễ sử dụng, ít tốn kém, kết quảtương đối ổn định nên cho đến nay các mô hình thống kê vẫn đang được sử dụngkhá phổ biến Nhiều mô hình thống kê có vai trò chính trong việc dự báo tổng lượngmưa mùa, đặc biệt là các quốc gia nằm trong vùng nhiệt đới, là nơi sự kiện ENSOtác động mạnh đến lượng mưa [17] Phần lớn các mô hình thống kê được xây dựngtrên cơ sở hồi quy tuyến tính giữa các nhân tố dự báo (các chỉ số ENSO) và chỉ sốlượng mưa, khái quát một cách khá toàn diện và đầy đủ được trình bày trong báocáo của A Troccoli và M Harrison (2008) Ở đây, chỉ tổng quan các nghiên cứu điểnhình liên quan đến mô hình ARIMA

Năm 2009, P.E Naill và nnk đã áp dụng mô hình ARIMA để dự báo lượngmưa tháng cho khu vực Jordan thuộc vùng ven biển Địa Trung Hải Trong nghiêncứu này các tác giả đã sử dụng hàm tự tương quan và tự tương quan riêng phần củachuỗi lượng mưa để xác định các tham số p,d,q trong mô hình ARIMA, từ đó chọnđược mô hình ARIMA (1, 0, 0) (0, 1, 1)12 là mô hình dự báo lượng mưa tháng chokhu vực nghiên cứu [28] Cũng theo hướng nghiên cứu này năm 2006, Chookait vànnk đã áp dụng mô hình ARIMA (0, 1, 1) (0, 1, 1)12 đối với chuỗi sô liệu mưa tháng

từ năm 1996 đến 2005 để dự báo mưa cho vùng Thái Lan [21] Diễn biến giữa kếtquả mô phỏng và số liệu quan trắc của 2 nghiên cứu này được trình bày trên hình1.3

Hình 1.2 Biến trình lượng mưa tháng theo quan trắc và theo mô phỏng

Trang 19

Từ hình 1.2 nhận thấy kết quả quan trắc và mô phỏng là khá tương đồng đốivới các tháng có lượng mưa không lớn, tuy nhiên do chỉ xét duy nhất quá trình tựhồi quy của chuỗi lượng mưa nên mô hình không thể nắm bắt được những dị thường

về lượng mưa, đây là điểm hạn chế lớn nhất trong các nghiên cứu này

Cũng trong năm 2006, V.K Somvanshi và nnk đã sử dụng phương phápmạng thần kinh nhân tạo (ANN) và mô hình ARIMA để dự báo tổng lượng mưahàng năm cho khu vực Ấn Độ phục vụ công tác quản lý tài nguyên nước Trongnghiên cứu này, các tác giả đã sử dụng chuỗi tổng lượng mưa hàng năm của vùngHyderabad thuộc Ấn Độ có độ dài chuổi là 104 năm (1901 – 2003), trong đó 93năm đầu được dùng để xây dựng mô hình, 10 năm còn lại được sử dụng để kiểmđịnh mô hình Từ kết quả tính toán, các tác giả nhận thấy việc áp dụng phương phápANN và mô hình ARIMA trong dự báo hạn dài ở khu vực Hyderabad là khá phùhợp và có thể áp dụng để phát triển cho các vùng khác thuộc Ấn Độ Kết quả môphỏng mưa từ phương pháp ANN và từ mô hình ARIMA được thể hiện ở hình 1.3[35]

ARIMA trên chuỗi phụ thuộc ARIMA trên chuỗi độc lập

ANN trên chuỗi phụ thuộc ANN trên chuỗi độc lập

Trang 20

Hình 1.3 Mối quan hệ giữa lượng mưa quan trắc và mô phỏng theo phươngpháp ANN và mô hình ARIMA vùng Hyderabad [35].

Liên quan đến dự báo tổng lượng mưa hàng năm, năm 2005, UruyaWeesakul và nnk đã nghiên cứu áp dụng mô hình ARIMA để dự báo lượng mưahàng năm phục vụ công tác lập kế hoạch điều tiết nước trên toàn lãnh thổ Thái Lan.Các kết quả dự báo trên chuỗi số liệu độc lập (1991-2003) là khá tốt, sai số tươngđối trên toàn quốc dao động từ 7.5% đến 26.9 %, Bảng …[39]

Bảng 1.1 Các đặc trưng liên quan đến mô hình ARIMA tại các trạm

trên lãnh thổ Thái Lan [39]

Ngoài việc xem xét thành thành phần tự hồi quy và trung bình trượt trong mô hìnhARIMA, năm 2009, Bambang và nnk còn xem xét tác động của các chỉ số khí hậukhác đến lượng mưa tháng trên một số vùng của Indonesia Mục tiêu của nghiêncứu này là xác định được mô hình dự báo mưa tốt nhất trong số các mô hình

Trang 21

ARIMA, mô hình động thái ARIMA đơn biến và mô hình động thái ARIMA đabiến Số liệu sử dụng là tổng lượng mưa tháng thời kỳ 1989 - 2008 được quan trắctại các trạm khí tượng và số liệu về chỉ số DMI, SST tại các vùng NINO [18] Kếtquả nhận dạng mô hình được trình bày trong bảng 1.2.

Bảng 1.2 Kết quả nhận dạng các mô hình ARIMA và mô hình

động thái ARIMA [18]

Mô hình ARIMA

Mô hình động thái ARIMA đơn biến (Single-input Transfer Function)

Mô hình động thái ARIMA đa biến (Multi-input Transfer Function models)

Trang 22

Trên cơ sở nhận dạng và xác định các tham số trong các mô hình được trìnhbày ở bảng 1.2, các tác giả đã kiểm định các mô hình để chọn ra mô hình tốt nhất,phù hợp cho mỗi vùng trong khu vực nghiên cứu Kết quả được trình bày trongbảng 1.3 [18].

Bảng 1.3 So sánh sai số quân phương (RMSE) từ các mô hình được tính toán trên

số liệu phụ thuộc (In-sample) và số liệu độc lập (Out-sample)[18]

Từ bảng 1.3 nhận thấy khi có sự tham gia của các biến về chỉ số ENSO ở cácvùng NINO vào mô hình động thái ARIMA thì sai số của mô hình đã giảm đáng kể

so với trường hợp chỉ xét riêng thành phần tự hồi quy và trung bình trượt trong môhình ARIMA

1.3 Các nghiên cứu ở trong nước

Ở Việt Nam hiện nay đang sử dụng các mô hình thống kê để dự báo mưa hạnmùa, các thông tin dự báo được cập nhật hàng tháng trên trang Web của Viện Khoahọc Khí tượng Thủy Văn và Môi trường (http://www.imh.ac.vn) và Trung tâm Khí

trung vào nhận định về diễn biến của hiện tượng ENSO, kết quả dự báo là xác suấtcác pha hụt chuẩn, cận chuẩn, vượt chuẩn của lượng mưa ở quy mô cấp vùng

Cho đến nay, thông qua các đề tài, dự án, luận văn khoa học, luận án tiến sỹ,

đã có nhiều công trình nghiên cứu liên quan đến dự báo mùa nói chung và dự báomưa nói riêng Cách tiếp cận để giải quyết bài toán dự báo mùa trong các nghiên

Trang 23

cứu này đều dựa theo phương pháp thống kê hoặc phương pháp mô hình số Có thể chia các công trình nghiên cứu này thành 4 nhóm như sau:

1) Nhóm công trình nghiên cứu theo phương pháp thống kê truyền thống.

Trong đó, các nhân tố dự báo là số liệu quan trắc hoặc các trường tái phân tích khíquyển, đại dương Trong cách tiếp cận này, quan hệ thống kê giữa yếu tố dự báo vớicác nhân tố dự báo được xây dựng dựa trên các tập số liệu lịch sử và giả thiết rằngmối quan hệ đó vẫn duy trì trong tương lai Trong số các công trình nghiên cứuthuộc nhóm này là đề án “Nghiên cứu thử nghiệm dự báo khí hậu ở Việt Nam”được thực hiện bởi nhóm tác giả Nguyễn Duy Chinh, Nguyễn Văn Thắng, PhanVăn Tân Trong nghiên cứu này, đối tượng dự báo được xác định là chuẩn sai nhiệt

độ và lượng mưa mùa (3 tháng liên tục) trên 7 vùng khí hậu Việt Nam, nhân tố dựbáo bao gồm: chuẩn sai nhiệt độ bề mặt nước biển (SSTA) của các khu vực NINO,chỉ số SOI và số liệu về 12 thành phần trực giao đầu tiên của trường số liệu SSTtoàn cầu Về mặt phương pháp các tác giả đã thử nghiệm nhiều phương pháp phântích thống kê khác nhau như: phân tích tự tương quan, phân tích hồi quy nhiều biến,phân tích hồi quy từng bước, phân tích phân biệt, phân tích mạng thần kinh nhântạo, phân tích tương quan Canon và từ đó đã chọn được phương pháp hồi quy nhiềubiến để xây dựng quy trình dự báo[1] Các kết quả trong nghiên cứu này đã và đangđược sử dụng vào công tác nghiệp vụ dự báo khí hậu của Viện Khoa học Khí tượngThủy Văn và Môi trường

Cũng theo hướng tiếp cận này còn có một số công trình nghiên cứu khácnhư: Lương Văn Việt, năm 2006, đã dự báo mưa, nhiệt và ẩm cho khu vực Nam Bộ[16]; Lê Đức Cương, năm 2001, đã thử nghiệm dự báo số lượng xoáy thuận nhiệtđới hoạt động trên biển Đông và dọc bờ biển Việt Nam [2]; Phan Thị Lê Hằng năm

2008 đã thử nghiệm khả năng dự báo số đợt nắng nóng, rét đậm, rét hại cho cáctrạm đại diện trên lãnh thổ Việt Nam [4] Hầu hết các nghiên cứu này các tác giảđều đã sử dụng nhân tố dự báo là các chỉ số giám sát ENSO

2) Nhóm công trình nghiên cứu theo phương pháp mô hình số

Trang 24

Việc nghiên cứu sử dụng các mô hình số trị trong dự báo khí hậu mùa ở nước

ta mới bắt đầu được thực hiện từ đầu những năm 2000, đến nay đã có nhiều côngtrình nghiên cứu mô phỏng mùa các trường khí hậu bằng các mô hình số trị Nộidung của các công trình nghiên cứu này từng bước giải quyết một số vấn đề như:tìm hiểu về cấu trúc của mô hình; nghiên cứu ảnh hưởng của kích thước, vị trí miềntính và độ phân giải của mô hình, ảnh hưởng của các điều kiện biên và điều kiệnban đầu, ảnh hưởng của việc tham số hóa quá trình vật lý đến khả năng mô phỏngkhí hậu mùa từ các mô hình khí hậu khu vực, từ đó, đánh giá khả năng ứng dụng môhình khí hậu khu vực vào điều kiện Việt Nam Chi tiết về hướng nghiên cứu này đãđược Phan Văn Tân và CS trình bày trong Báo cáo tổng kết đề tài cấp Đại học Quốcgia (QG.TĐ.06.05) [11] Về nhóm các công trình nghiên cứu theo phương pháp môhình số ở Việt Nam đã được tổng quan khá chi tiết và đầy đủ trong luận văn thạc sỹcủa Nguyễn Đăng Mậu (2012)

3) Nhóm công trình nghiên cứu theo phương pháp hạ thấp qui mô thống kê (Statistical Downscaling), đây là hướng nghiên cứu kết hợp của cả 2 phương pháp,

thống kê và mô hình số Trong đó nhân tố dự báo là các trường dự báo của mô hìnhGCM được tổng hợp, phân tích lại và giả thiết rằng dự báo này là hoàn hảo Mộttrong những công trình nghiên cứu đi đầu theo hướng này là đề tài “Nghiên cứu xâydựng mô hình dự báo khí hậu cho Việt Nam dựa trên kết quả của mô hình động lựctoàn cầu” của Nguyễn Văn Thắng, năm 2006 Trong nghiên cứu này, yếu tố dự báo

là chỉ số mưa, nhiệt độ mùa (12 mùa, mỗi mùa gồm 3 tháng liên tiếp) của 7 vùngkhí hậu Việt Nam) và các yếu tố khác, như số lượng các đợt không khí lạnh, mưalớn diện rộng, nắng nóng, xoáy thuận nhiệt đới…, nhân tố dự báo là các trườngchuẩn sai nhiệt độ mặt nước biển (SSTA), khí áp mực biển (SLPA), bức xạ sóng dài(OLRA), tốc độ gió (U, V) ở các mức độ cao 1000 mb, 850 mb, 700 mb, 500 mb,

200 mb; (theo ô lưới) Các trường này là kết quả của các mô hình toàn cầu đã đượctổng hợp và phân tích lại tại các trung tâm khí hậu như CPC/NCEP, NCAR, IRI(Mỹ), CPTEC/INPE (Brasil), NCC, BoM (Úc), ECMWF (EC) Trên cơ sở bản đồ

Trang 25

hệ số tương quan giữa yếu tố dự báo và giá trị tại mỗi ô lưới của các trường khí hậutoàn cầu nêu trên, sẽ chọn được các vị trí có tương quan tốt nhất được sử dụng làmnhân tố dự tuyển trong mô hình hồi quy từng bước để lọc nhân tố Sơ đồ xây dựng

mô hình dự báo khí hậu mùa được trình bày trong hình 1.4 [13] Từ kết quả của Đềtài các tác giả cho rằng phương pháp Downscaling thống kê không chỉ áp dụng tốttrong dự báo khí hậu mùa mà có thể áp dụng dự báo trong các lĩnh vực khác, nếuyếu tố dự báo có liên quan mật thiết với các trường khí tượng, khí hậu, ví dụ như xuthế các dịch bệnh của con người, động vật, năng suất cây trồng, mùa vụ,

Hình 1.4 Sơ đồ xây dựng mô hình dự báo khí hậu mùa [13]

Cũng theo hướng nghiên cứu này, năm 2008, Nguyễn Văn Thắng và CS đãthực hiện đề tài “Xây dựng phương án chi tiết thử nghiệm ứng dụng công nghệ dự

Trang 26

báo và cảnh báo sớm hạn hán ở Việt Nam” Trong nghiên cứu này, trên cơ sởphương pháp Downscalling thống kê, đã xây dựng thành công công nghệ dự báo vàcảnh báo sớm 3 loại hạn hán: hạn khí tượng, hạn thủy văn và hạn khí tượng nôngnghiệp cho 7 vùng khí hậu ở Việt Nam Sơ đồ thực hiện dự báo và cảnh báo hạn hánđược trình bày trong hình 1.5 dưới đây [14].

Hình 1.5 Sơ đồ thực hiện dự báo và cảnh báo hạn hán [14]

Gần đây, trong đề tài cấp nhà nước KC08.29/0610 [12], tác giả Phan VănTân và CS đã áp dụng phương pháp Downscaling thống kê để dự báo hạn mùa cácyếu tố và hiện tượng khí hậu cực đoan tại các điểm trạm ở Việt Nam Trong đó: yếu

tố dự báo là nhiệt độ cực trị, số đợt mưa lớn, số đợt không khí lạnh và khả năng xuấthiện nắng nóng và rét đậm Nhân tố dự báo là số liệu tái phân tích của NCEP với độphân giản 2.50 bao gồm các biến cơ bản như: áp suất mực biển PMSL, độ cao địathế vị h, gió u,v, nhiệt độ T và độ ẩm RH tại các mực áp suất cơ bản 1000, 850, 700,500mb Đây là nghiên cứu có tính khoa học và thực tiễn cao, các bước thực hiệnnhư: phân tích chọn lựa nhân tố dự báo, lựa chọn phương pháp xây dựng mô hìnhđối với mỗi yếu tố dự báo đều được thực hiện với nhiều phương án khác nhau, từ đóchọn được phương án phù hợp nhất đối với mỗi yếu tố dự báo Cụ thể là: đã thửnghiệm hai phương pháp lựa chọn các nhân tố dự báo: 1) sử dụng các

Trang 27

biến cơ bản của ô lưới chứa điểm trạm làm nhân tố dự tuyển (21 biến); 2) sử dụng

kỹ thuật phân tích thành phần chính PCA trên một miền cho trước đối với mỗitrường khí quyển Mỗi yếu tố dự báo (tùy thuộc vào bản chất của từng yếu tố) đượcthử nghiệm 2 trong 4 phương pháp thông kê bao gồm hồi quy tuyến tính đa biến(MLR), mạng thần kinh nhân tạo (ANN), ước lượng hồi qui xác suất sự kiện(REEP) và phân tích riêng biệt Fisher (FDA) Từ các kết quả nghiên cứu, một số các

mô hình dự báo về nhiệt độ cực trị, khả năng xuất hiện nắng nóng và rét đậm đượckhuyến cáo có thể sử dụng trong dự báo mùa Minh họa kết quả dự báo và quan trắc

về nhiệt độ tối thấp của nghiên cứu này trên chuỗi số liệu độc lập trạm Láng đượctrình bày trên hình 1.6

Hình 1.6 Kết quả quan trắc và dự báo Tmin2m theo REG trong 4

mùa tại trạm Láng [12]

Trang 28

4) Nhóm công trình nghiên cứu theo phương pháp thống kê trên sản phẩm

mô hình (Model Output Statistics – MOS) Trong đó, yếu tố dự báo và nhân tố dự

báo chính là các trường khí hậu nhận được từ mô hình khí hậu khu vực Đây là mộthướng tiếp cận khá mới mẻ, phương pháp này cần phải có kết quả mô phỏng nhiềunăm từ mô hình khí hậu khu vực Cho đến nay ở Việt Nam vẫn còn rất ít công trìnhnghiên cứu theo hướng này

Năm 2009, tác giả Nguyễn Minh Trường đã thực hiện báo cáo chuyên đề

“Nghiên cứu xây dựng các mô hình thống kê, lựa chọn tập nhân tố dự báo, lậpchương trình tính, kiểm tra độ chính xác bằng tập số liệu mẫu”, thuộc đề tàiKC08.29/0610 [15] Trong chuyên đề này, tác giả đã phân tích các cơ chế thời tiết,khí hậu khu vực Việt Nam để làm cơ sở khoa học cho việc lựa chọn một số nhân tố

dự báo phù hợp được lấy từ mô hình RegCM, sau đó sẽ xây dựng MOS để dự báomột số hiện tượng và yếu tố khí hậu cực đoan hạn mùa cho khu vực Việt Nam Báo

cáo bước đầu đã đưa ra được cơ sở khoa học trong việc nghiên cứu phương pháp MOS đối với dự báo hạn mùa cho khu vực Việt Nam Có thể hướng nghiên cứu này

sẽ được phát triển mạnh trong tương lai khi có được chuỗi số liệu dự báo lại(hindcast) của các mô hình khí hậu khu vực đủ dài

Tóm lại: Từ tổng quan nghiên cứu trong và ngoài nước về dự báo khí hậuhạn mùa trong đó có dự báo mưa có thể rút ra một số điểm chính sau:

Đối với nghiên cứu dự báo mưa hạn mùa, có hai cách tiếp cận là sử dụngphương pháp thống kê (thống kê truyền thống và downscaling thống kê) và phươngpháp mô hình động lực Nhìn chung, phương pháp thống kê truyền thống đã đạtđược những kết quả nhất định, nhiều mô hình thống kê có đóng góp chính trongviệc đưa ra bản tin dự báo tổng lượng mưa mùa Phương pháp downscaling thống

kê phụ thuộc nhiều vào độ chính xác của sản phẩm dự báo từ các GCM, tuy nhiênsai số của các GCM hiện nay vẫn còn khá lớn nên kết quả nhận được theo hướngnày cũng còn nhiều hạn chế Phương pháp mô hình động lực là hướng nghiên cứuđang rất được quan tâm, nó có những ưu điểm vượt trội về khả năng cung cấp sảnphẩm dự báo nhưng độ chính xác cũng chưa đạt được như mong muốn

Trang 29

Dự báo mưa hạn mùa ở Việt Nam hiện mới dừng lại trong phạm vi các môhình thống kê, mặc dù đã có một số công trình nghiên cứu ứng dụng các mô hình sốnhưng chưa có điều kiện đưa vào nghiệp vụ, có thể do một số nguyên nhân như: khảnăng tính toán của máy tính, chưa có điều kiện biên ổn định (chưa chủ động đượcsản phẩm của mô hình toàn cầu), hạn chế về độ chính xác của sản phẩm dự báo

Các thông tin dự báo hạn mùa, trong đó có dự báo mưa đã đáp ứng phần nàonhu cầu phục vụ phát triển kinh tế xã hội và đời sống Tuy nhiên, để ứng dụng cóhiệu quả thì bản tin dự báo mùa còn có những hạn chế như: 1) Đối tượng dự báomới giới hạn ở hai yếu tố là nhiệt độ trung bình và tổng lượng mưa, thiếu thông tin

dự báo về các yếu tố khí hậu quan trọng khác như: nhiệt độ cực trị, lượng mưa lớnnhất, bốc hơi, độ ẩm, số giờ nắng, gió, khả năng khô hạn 2) thông tin dự báo về 3tháng kề nhau nhiều khi không phù hợp với yêu cầu sản xuất nông nghiệp trongnhững thời kỳ sinh trưởng quan trọng của cây trồng, nhất là các thông tin dự báotheo từng tháng và dự báo đầu vụ cùng với dự báo 3 tháng để có kế hoạch điều tiếtnước và bố trí cơ cấu cây trồng hợp lý ngay từ đầu vụ

Hiện nay, mô hình ARIMA đã được nhiều nước trên thế giới nghiên cứu ứngdụng trong dự báo mưa hạn mùa, trong đó có các nước gần Việt Nam như Thái Lan,Indonesia đã sử dụng mô hình này trong hoạt động nghiệp vụ Tuy nhiên ở ViệtNam, hướng tiếp cận này còn rất hạn chế Để thực hiện nhiệm vụ luận văn thạc sỹ,tác giả nhận thấy việc nghiên cứu mô hình ARIMA đối với bài toán dự báo mưa hạnmùa ở Việt Nam là hướng nghiên cứu có ý nghĩa khoa học và thực tiễn Nhằm có cơ

sở khoa học và những nhận định đúng đắn về mô hình này, bước đầu tác giả nghiêncứu cho một vùng trọng điểm về sản xuất nông nghiêp và một vụ sản xuất thườngxuyên gặp khó khăn về nguồn nước là khu vực đồng bằng Bắc Bộ với thời gian dựbáo là 4 tháng Từ kết quả nghiên cứu này sẽ nhân rộng cho các vùng khác, vụ sảnxuất khác Ngoài ra, có thể khai thác mô hình này để dự báo hạn mùa với một sốyếu tố khí hậu quan trọng khác, khi các mô hình động lực chưa đạt được kết quảnhư mong muốn

Trang 30

Chương 2

MÔ HÌNH ARIMA VÀ SỐ LIỆU SỬ DỤNG

Trong chương này, sẽ giới thiệu về cấu trúc của các mô hình ARIMA baogồm mô hình tự hồi quy trung bình trượt ARIMA và mô hình động thái ARIMA,trên cơ sở đó sẽ đưa ra phương pháp áp dụng các loại mô hình này đối với bài toán

dự báo mưa hạn mùa, và cuối cùng là phân tích các nguồn số liệu phù hợp sử dụnglàm nhân tố đầu vào cho mô hình ARIMA

2.1 Giới thiệu cấu trúc của mô hình ARIMA

Với mục đích xem xét mối quan hệ giữa các quan trắc trong quá khứ với hiệntại nhằm dự báo cho tương lai của một biến trình nào đó, năm 1970, Box và Jenkins

đã đưa ra mô hình tự hồi quy trung bình trượt ARIMA (AutoRegresive Integrated Moving Average) Mô hình này là mô hình dự báo định lượng theo chuỗi thời gian,

giá trị tương lai của yếu tố dự báo sẽ phụ thuộc vào quy luật vận động của chính yếu

tố đó

Năm 1976, trên cơ sở mô hình tự hồi quy trung bình trượt, Box-Tiao đã pháttriển thành công mô hình động thái ARIMA (Transfer Function Model) Mô hìnhnày không chỉ xem xét mối quan hệ trong quá khứ với hiện tại của yếu tố dự báo màcòn xem xét tác động từ các chuỗi thời gian khác đến yếu tố dự báo

Để thuận tiện khi trình bày, từ đây, mô hình tự hồi quy trung bình trượt được

ký hiệu là ARIMA và mô hình động thái được ký hiệu là ARIMAX.

Đến nay các mô hình ARIMA và ARIMAX được áp dụng khá phổ biến trongnhiều lĩnh vực kinh tế, xã hội, môi trường Các mô hình này không quá phức tạp,nhưng có thể áp dụng hữu hiệu đối với nhiều dạng bài toán dự báo khác nhau.Trong lĩnh vực khí tượng thủy văn, mô hình ARIMA và ARIMAX là một trongnhững công cụ quan trọng phục vụ công tác dự báo ở một số nước trên thế giới

Chi tiết về thuật toán và phương pháp áp dụng đối với mỗi loại mô hình sẽđược trình bày sau đây:

Trang 31

2.1.1 Mô hình tự hồi quy trung bình trượt ARIMA

Mô hình ARIMA cũng có thể được hiểu tương tự như mô hình tự hồi quy

tuyến tính, nhưng về bản chất có sự khác biệt với mô hình tự hồi quy tuyến tính là

các hệ số hồi quy của mô hình ARIMA được xác định theo tiêu chuẩn hội tụ, sai số

còn lại chính là thành phần ngẫu nhiên Khi dự báo, thành phần ngẫu nhiên này

chính là sai số dự báo của khoảng thời gian trước, khi tạo chuỗi nó là chuỗi ngẫu

nhiên sao cho đảm bảo các đặc trưng thống kê không thay đổi theo thời gian Do

vậy, mô hình này được thực hiện đối với chuỗi ổn định ngẫu nhiên (chuỗi dừng),

khi chuỗi chưa đạt được độ ổn định, có thể dùng phép biến đổi thống kê để đưa về

dạng ổn định ngẫu nhiên và khi dự báo, cần phải đưa trở lại giá trị thực của đại

lượng ban đầu

Giả sử có chuỗi thời gian ổn định ngẫu nhiên hoặc bất ổn định ngẫu nhiên Yt

(t=1,2,…,n) thì dạng thức cơ bản của mô hình ARIMA bao gồm 3 thành phần sau:

Thành phần tự hồi quy bậc p (p= 1, 2,…); Thành phần sai phân bậc d (d=0,1,2…);

và thành phần trung bình trượt bậc q (q = 1, 2,…) và được ký hiệu là

ARIMA(p,d,q) Dạng tổng quát của mô hình ARIMA(p,d,q) có thể được viết như

sau [20]:

Wt = µ + p1Wt-l + p2Wt-2 +…+ ppWt-p - q1at-1 - q2at-2 -…- qqat-q + at (2.1)Trong đó:

yt, yt-l, yt-2, …, yt-p là giá trị quan trắc ở các bước thời gian t, t-1, t-2,…, t-p

at, at-1, at-2, …, at-q là sai số ngẫu nghiên (giữa giá trị thực và giá trị tính toán)

ở các bước thời gian t, t-1, t-2,…, t-q;

p1, p2, …, pp ; q1, q3, , qq là các tham số hồi quy

Phương trình 2.1 cũng có thể viết gọn lại thông qua phép toán dịch chuyển lùi

Trang 32

yt, at như đã trình bày ở trên

p2B2 –… – ppBp) là phép toán tự hồi quy

q(B) = (1 – q1B – q2B2 –… – qqBq) là phép toán trung bình

trượt 2.1.2 Mô hình động thái ARIMAX

Mô hình động thái ARIMAX có sự khác biệt cơ bản so với mô hình tự hồi

quy trung bình trượt ARIMA là ngoài việc xem xét quá trình tự hồi quy trung bình

trượt của chuỗi yếu tố dự báo, nó còn cho phép xem xét ảnh hưởng của các chuỗi

thời gian khác tác động đến yếu tố dự báo, chuỗi tác động (biến độc lập) được gọi là

chuỗi nhập, chuỗi bị tác động (biến phụ thuộc) được gọi là chuỗi xuất

Giả sử ta có các chuỗi độc lập Xit (i = 1,2…m; t=1,2…n) và chuỗi phụ thuộc

Yt (t=1,2…n), khi đó mô hình động thái ARIMAX được viết dưới dạng tổng quát

 Yt là giá trị quan trắc ở các bước thời gian t; μ là hằng số;

 B là phép toán dịch chuyển lùi theo quy tắc : BX t = X t-1 , BkX t = X t-k ;

i0

U BU Bs; S s (B)  S  S B   S Bs là

những trọng số động thái của chuỗi độc lập thứ i;

 k là thời điểm tác động của chuỗi độc lập thứ i tại thời điểm t = k;

 p(B) = (1 – p1B – p2B2 –… – ppBp); q(B) = (1 – q1B – q2B2 –… – qqBq) là

phép toán tự hồi quy và trung bình trượt của chuỗi phụ thuộc;

Trang 33

 at, là sai số ngẫu nghiên (giữa giá trị thực và giá trị tính toán).

Lưu ý : các chuỗi Xit và Yt trong công thức 2.3 phải là các chuỗi có tính ổnđịnh ngẫu nhiên, nếu chuỗi không ổn định, sẽ cần phải thông qua bước sai phân đểđưa chuỗi về dạng ổn định ngẫu nhiên

Tóm lại: Bản chất của các mô hình ARIMA và ARIMAX là mô hình ngẫunhiên Việc phân tích chuỗi thời gian trong các mô hình này bắt buộc phải chấpnhận một giả thiết hết sức cơ bản là tính ổn định của các quá trình ngẫu nhiên, tính

ổn định ở đây có nghĩa là các đặc trưng thống kê (hay phân phối xác suất) khôngthay đổi theo thời gian Trong thực tế nhiều quá trình ngẫu nhiên có tính ổn địnhtrong một khoảng thời gian gián đoạn hữu hạn nào đó có thể coi là ổn định Ví dụchuỗi tổng lượng mưa tháng là chuỗi không dừng, còn chuỗi tổng lượng mưa năm

có thể coi là dừng vì khi đó qui luật bên trong năm bị loại trừ Các chuỗi khôngdừng có thể trở thành dừng nhờ một số phép biến đổi sai phân Lợi thế cơ bản củacác mô hình này là cho phép dự báo với độ chính xác nhất định, mặc dù chưa hiểu

rõ bản chất của các quá trình tác động từ các nhân tố dự báo đến yếu tố dự báo

2.2 Phương pháp áp dụng mô hình ARIMA và ARIMAX đối với bài toán dự báo mưa mùa

Trong mục 2.1 đã trình bày các dạng tổng quát của mô hình ARIMA vàARIMAX, nó có thể bao gồm nhiều thành phần tham gia vào mô hình như: thànhphần tự hồi quy, thành phần trung bình trượt, thành phần sai phân, thành phần ảnhhưởng của các chuỗi nhập khác (các chuỗi nhân tố dự báo), trong mỗi thành phần lại

có các thành phần con khác nhau Bài toán cần giải quyết ở đây là đưa ra đượcphương pháp xác định các thành phần có ý nghĩa về mặt thống kê để tham gia vào

mô hình dự báo mưa hạn mùa Đây là bài toán khá phức tạp, độ chính xác của môhình dự báo không chỉ phụ thuộc vào các chuỗi nhập, chuỗi xuất mà còn phụ thuộcviệc lựa chọn chính xác các thành phần tham gia vào mô hình dự báo Để giải quyếtbài toán này luận văn đã thực hiện theo các bước sau:

Trang 34

1) Áp dụng phương pháp thống kê sai phân để xác định tính ổn định ngẫu nhiên của các chuỗi dữ liệu tham gia vào mô hình ARIMA và ARIMAX;

2) Kế thừa phương pháp Box Jenkin đối với mô hình ARIMA và phương phápBox Tao đối với mô hình ARIMAX trong việc nhận dạng các thành phần tự hồi quy,thành phần trung bình trượt và thành phần ảnh hưởng của các chuỗi nhập đến chuỗilượng mưa thông qua việc xem xét sự biến đổi các hàm tự tương quan, tự tương quanriêng phần và tương quan chéo;

3) Sử dụng phương pháp bình phương tối thiểu trong việc xác định các tham số trong mô hình ARIMA và ARIMAX;

4) Áp dụng các phương pháp kiểm nghiệm giả thiết thống kê trong khí hậu đểchọn lựa các tham số có đủ độ tin cậy thống kê tham gia trong mô hình ARIMA vàARIMAX;

5) Sử dụng công cụ phần mềm thống kê SAS để tính toán các đặc trưng của chuỗi thời gian và các tham số trong mô hình ARIMA và ARIMAX

Sau đây sẽ trình bày cụ thể từng nội dung này:

2.2.1 Xác định tính ổn định ngẫu nhiên của chuỗi thời gian

Chuỗi thời gian là chuỗi số liệu được sắp xếp theo trình tự thời gian Nếu mộtchuỗi thời gian có giá trị trung bình và phương sai không đổi theo thời gian thìchuỗi đó được xem là ổn định ngẫu nhiên (chuỗi có tính dừng) hay nói một cáchkhác cụ thể hơn đó là một chuỗi thời gian không có xu thế, không có chu kỳ, mà chỉdao động xung quanh kỳ vọng của nó

Một chuỗi quan trắc khí hậu trung bình tháng thường bao gồm 3 thành phần:1) thành phần ngẫu nhiên là sự tăng lên hay giảm đi thường xen kẽ nhau, góp phầnlàm cho các trị số khí hậu dao động xung quanh một giá trị nào đó Giá trị đó có thể làtrung bình số học, nếu chuỗi không có thành phần chu kỳ và xu thế 2) Thành

phần chu kỳ là những biến đổi của chuỗi lặp lại nhiều lần sau những khoảng thờigian nhất định nào đó Mối tương quan giữa các thành phần trong một chu kỳthường đạt trị số lớn nhất 3) Thành phần xu thế là biểu hiện xu hướng tăng hoặc

Trang 35

giảm theo thời gian của các thành phần trong chuỗi, trị số đầu của xu thế là cực tiểu

hoặc cực đại và trị số cuối của xu thế là cực đại hoặc cực tiểu Biểu đồ minh họa 3

thành phần này được trình bày trong hình 2.1

b) a)

Hình 2.1 Các thành phần trong chuỗi quan trắc khí hậu [10]

Để loại bỏ thành phần xu thế và chu kỳ nhằm đưa các chuỗi quan trắc về

dạng ổn định ngẫu nhiên, thường sử dụng phép lọc sai phân, phép lọc Loga, phép

lọc căn thức [10] Trong luận văn này chúng tôi chọn phép lọc sai phân, cụ thể như

sau:

- Đối với việc loại bỏ thành phần xu thế: sử dụng phép biến đổi sai phân bậc 1

hoặc bậc 2 Sai phân bậc 1 là chênh lệch giữa 2 giá trị kề nhau trong chuỗi

Trong đó: Yt là giá trị của sai phân bậc 1

Yt và Yt-1 là các thời đoạn trước và thời đoạn sau đó

Trang 36

Nếu sai phân bậc 1 vẫn còn thể hiện xu thế thì thực hiện tiếp sai phân bậc 2.

Sai phân bậc 2 chính là sai phân của sai phân bậc 1:

2(Yt) = Yt - Yt-1 = (Yt - Yt-1) - (Yt-1 - Yt-2) (2.6) Nếu sai phân bậc 2 chưa đạt được tính dừng ta có thể tiếp tục lấy sai phân

bậc 3 hoặc cao hơn

- Đối với việc loại bỏ thành phần mùa và chu kỳ: Sai phân mùa là chênh lệch giá

trị của hai quan trắc cách nhau khoảng thời gian L, L có thể là một năm, hai năm…

hay một mùa… Ví dụ : nếu là số liệu tổng lượng mưa tháng, ta có L =12 Do đó sai

phân mùa bậc 1 có tính mùa là:

Cũng có thể lấy sai phân bậc 2 của sai phân mùa bậc 1 khi chuỗi chưa đạt

được độ ổn định:

- Kiểm tra tính ổn định ngẫu nhiên của chuỗi

Trong thực hành, để kiểm tra các chuỗi thời gian tham ra trong mô hình

ARIMA hoặc ARIMAX đã đạt tiêu chuẩn ổn định ngẫu nhiên hay chưa, thường dựa

vào hàm tự tương quan Theo Quenouille đã chứng minh chuỗi thời gian được xem

là ổn định ngẫu nhiên khi hầu hết hệ số tự tương quan của chuỗi (rk ) thỏa mản biểu

thức giới hạn tin cậy (2.8) và tiến dần về 0, ngoại trừ một số bước trễ như bước

mùa, vụ, chu kỳ …, nằm ngoài khoảng này [6, 37]

Biểu thức giới hạn tin cậy có thể viết dưới dạng sau:

Trong đó: Sr là sai số chuẩn của các hệ số tự tương quan rk ; t/ 2,n1 là điểm

phần trăm  =0.05 của phân bố Student với n-1 bậc tự do.

Hình 2.2 minh họa chuỗi dữ liệu tổng lượng mưa tháng trước khi sai phân vàsau khi sai phân Trên hình này, phần hình A, A‟ ở phía trên ứng với trường hợp

Trang 37

chuỗi chưa ổn định, phần hình B, B‟ ứng với chuỗi sau khi sai phân và được xem làchuỗi ổn định ngẫu nhiên.

Hình 2.2 Minh họa diễn biến của chuỗi lượng mưa tháng và hàm tự tương quan đối với trạm Hà Nội trước khí sai phân (A,A‟) và sau khi sai phân (B,B‟)

2.2.2 Nhận dạng cấu trúc của mô hình

Sau khi đã loại bỏ được các thành phần chu kỳ, xu thế của chuỗi thời gian, sẽtiến hành nhận dạng cấu trúc của mô hình Box - Jenkin đã đưa ra phương phápnhận dạng cấu trúc của mô hình ARIMA thông qua việc xem xét sự biến đổi củahàm tự tương quan (Autocorrelation function - ACF) và tự tương quan riêng phần(Part autocorrelation function - PAFC) để xác định các thành phần tự hồi quy (AR)

và thành phần trung bình trượt (MA) Đối với mô hình ARIMAX, Box Tao đã đưa

ra một số dáng điệu chính của hàm tương quan chéo (Cross correlation function CCF) để xác định mức độ ảnh hưởng (hàm truyền) của các chuỗi nhập đến chuỗiyếu tố dự báo Định nghĩa và thuật toán để tính các hàm ACF, PACF và CCF đượctrình bày chi tiết trong tài liệu ARIMA [37]

Trang 38

-Xuất phát từ bản chất của hàm ACF và PACF, Box - Jenkin đã đưa ra một sốdạng biểu đồ thường gặp đối với hàm ACF và PACF, tương ứng với nó là các dạngcủa mô hình ARIMA nhằm hỗ trợ cho việc nhận dạng cấu trúc của mô hình, cácdạng biểu đồ này được trình bày trong hình 2.3 Chi tiết về cách áp dụng biểu đồnày được trình bày dưới đây:

 Nếu biểu đồ hàm ACF có dạng nhỏ dần theo các bước trễ thời gian và biểu

đồ hàm PACF chỉ có giá trị khác 0 tại bước thời gian t-1, sau đó giảm đột

ngột về 0, (cụm từ „khác 0‟ hay „bằng 0‟ ở đây được hiểu theo thuật ngữ thống

kê, nếu các giá trị này nằm trong khoảng từ - t/ 2,n1*Sr đến + t/ 2,n1 * Sr

được xem là bằng 0, ngoài khoảng này được xem là khác 0 ) thì có một thông

số tự hồi qui (p=1) được chọn, mô hình có dạng ARIMA(1,0,0) Ngược lại,

khi biểu đồ hàm PACF tắt dần, hàm ACF có giá trị khác 0 bước t-1, sau đó

giảm đột ngột về 0, trong trường hợp này mô hình có dạng ARIMA(0,0,1).

Dáng điệu của hàm ACF và PACF trong các trường hợp này được minh họatrên hình (Hình 2.3a)

 Tương tự như trên, nếu biểu đồ hàm ACF tắt dần, hàm PACF có giá trị khác

0 ở các bước thời gian t-1, t-2, sau đó giảm đột ngột về 0 thì mô hình có hai thông số tự

hồi qui (p=2), mô hình có dạng ARIMA(2,0,0) Ngược lại, nếu hàm PACF có dạng tắt

dần, hàm ACF có giá trị khác 0 ở các bước thời gian t-1, t-2, sau đó giảm đột ngột về 0

thì mô hình có hai thông số trung bình trượt (q=2), mô hình có dạng ARIMA(0,0,2) Đồ

thị của hạn ACF và PACF trong các trường hợp này được minh họa trên hình (Hình2.3b)

 Khi biểu đồ hàm ACF có dạng tắt dần và có giá trị khác 0 ở các bước thờigian t-1, t-2…t-p, tương tự hàm hàm PACF có dạng tắt dần và có giá trị khác 0 ở cácbước thời gian t-1, t-2…t-q, trong trường hợp này cả 2 thành phần AR và MA đều có

trong mô hình, dạng của mô hình trong trường hợp này sẽ là ARIMA(p,0,q) Đồ thị của

hạn ACF và PACF trong các trường hợp này được minh họa trên hình (Hình 2.3c)

Trang 39

(2.3b)

(2.3c)Hình 2.3 Một số dạng chính của hàm ACF và PACF tưng ứng với các dạng

mô hình ARIMA khác nhau [20]

Đối với việc xác định ảnh hưởng của từng chuỗi nhập đến yếu tố dự báotrong mô hình ARIMAX, Box Tao cũng sử dụng phương pháp trực quan để xem xét

sự biến đổi của hàm tương quan chéo (Cross correlation function - CCF), từ đó đưa

Trang 40

ra hàm truyền tương ứng của chuỗi nhập X tham gia trong mô hình ARIMAX Nội dung của phương pháp có thể bao gồm 4 dạng chính sau:

(2.4A)

(2.4B)

(2.4C)

(2.4D)

Hình 2.4 Một số dạng chính của hàm tương quan chéo giữa biến nhập (X)

và biến phụ thuộc (Y) tưng ứng với các dạng mô hình ARIMA khác nhau [20]1) Nếu hàm tương quan chéo (CCF) giữa biến độc lập X và biến phụ thuộc Y

có giá trị „khác 0‟ tại bước thời gian (t-b), sau đó giảm đột ngột, các bước

Ngày đăng: 20/11/2020, 09:20

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w