DANH MỤC CÁC KÍ HIỆU VIẾT TẮTAGCM Mô hình hoàn lưu chung khí quyển ACF Hàm tự tương quan Autocorrelation function ANN Phương pháp mạng thần kinh AOGCM Mô hình kết hợp couple đại dương kh
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-Nguyễn Hữu Quyền
NGHIÊN CỨU ỨNG DỤNG MÔ HÌNH ARIMA ĐỂ DỰ BÁO LƯỢNG MƯA VỤ ĐÔNG XUÂN Ở MỘT SỐ TỈNH
VÙNG ĐỒNG BẰNG BẮC BỘ
LUẬN VĂN THẠC SĨ KHOA HỌC
Hà Nội – 2013
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Nguyễn Hữu Quyền
-NGHIÊN CỨU ỨNG DỤNG MÔ HÌNH ARIMA ĐỂ DỰ BÁO LƯỢNG MƯA VỤ ĐÔNG XUÂN Ở MỘT SỐ TỈNH VÙNG
ĐỒNG BẰNG BẮC BỘ
Chuyên ngành: Khí tượng và khí hậu học
Mã số: 60.44.87
LUẬN VĂN THẠC SĨ KHOA HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:PGS TS Dương Văn Khảm
Hà Nội – 2013
Trang 3LỜI CẢM ƠN
Trước tiên học viên xin trân trọng cảm ơn các thầy cô trong Khoa Khí tượng Thủy văn và Hải dương học đã hướng dẫn và giúp đỡ tận tình học viên trong suốt thời gian tham gia lớp cao học.
Đặc biệt, học viên xin bày tỏ lòng biết ơn sâu sắc đến PGS TS Dương Văn Khảm, người đã trực tiếp định hướng và hướng dẫn học viên trong suốt quá trình hoàn thành luận văn Sự hiểu biết sâu sắc về khoa học cũng như những kinh nghiệm của thầy là tiền đề để giúp học viên mở rộng kiến thức và hoàn thành khóa luận tốt nghiệp.
Xin trân trọng cảm ơn Lãnh đạo Viện Khoa học Khí tượng Thủy văn và Môi trường, các bạn đồng nghiệp trong cơ quan, đã tạo điều kiện về thời gian
và quan tâm động viên tinh thần trong thời gian học viên đi học và hoàn thành luận văn.
Cuối cùng xin cảm ơn gia đình và bạn bè đã luôn bên tôi, cỗ vũ và động viên tôi trong suốt quá trình hoàn thành luận văn này.
Nguyễn Hữu Quyền
Trang 4MỤC LỤC
MỞ ĐẦU 1
Chương 1 TỔNG QUAN 3
1.1 Cơ sở khoa học của dự báo khí hậu mùa 3
1.2 Các nghiên cứu trên thế giới 8
1.3 Các nghiên cứu ở trong nước 13
Chương 2 MÔ HÌNH ARIMA VÀ SỐ LIỆU SỬ DỤNG 21
2.1 Giới thiệu cấu trúc của mô hình ARIMA 21
2.1.1 Mô hình tự hồi quy trung bình trượt ARIMA 22
2.1.2 Mô hình động thái ARIMAX 23
2.2 Phương pháp áp dụng mô hình ARIMA và ARIMAX đối với bài toán dự báo mưa mùa 24
2.2.1 Xác định tính ổn định ngẫu nhiên của chuỗi thời gian 25
2.2.2 Nhận dạng cấu trúc của mô hình 28
2.2.3 Xác định các tham số của mô hình 32
2.2.4 Kiểm định mô hình 35
2.2.5 Phần mềm thống kê SAS đối với mô hình ARIMA và ARIMAX 36
2.3 Các nguồn số liệu được sử dụng 36
2.3.1 Số liệu quan trắc mưa từ các trạm khí tượng 37
2.3.2 Số liệu về các chỉ số khí hậu 37
2.3.3 Số liệu về số vết đen mặt trời (Sunspot Number) 38
2.3.4 Xử lý số liệu 38
Chương 3 KẾT QUẢ VÀ NHẬN XÉT 41
3.1 Xây dựng mô hình dự báo mưa vụ đông xuân bằng mô hình ARIMA 41
3.1.1 Xác định tính ổn định của chuỗi lượng mưa vụ Đông xuân 41
3.1.2 Nhận dạng mô hình ARIMA 43
3.1.3 Xác định các thông và kiểm định mô hình ARIMA 44
3.2 Xây dựng mô hình dự báo lượng mưa vụ đông xuân bằng mô hình động thái ARIMAX 46
3.2.1 Xác định tính ổn định của chuỗi nhân tố dự báo 46
Trang 53.2.2 Khảo sát mối quan hệ giữa chỉ số lượng mưa và các biến tham ra dự
tuyển 49
3.2.3 Nhận dạng cấu trúc của mô hình động thái ARIMAX 53
3.2.4 Kiểm định các thông số trong mô hình động thái ARIMAX 55
3.3 Đánh giá khả năng mô phỏng của các mô hình ARIMA 60
KẾT LUẬN 67
TÀI LIỆU THAM KHẢO 68
Trang 6DANH MỤC HÌNH
Hình1.1 Diễn biến về lượng mưa hàng năm và số vết đen mặt trời với các bước
trượt 11 (hình trên), 21 (hình giữa), 33 (hình dưới) ở Beijing, Trung Quốc [40] 5
Hình 1.2 Biến trình lượng mưa tháng theo quan trắc và theo mô phỏng 9
Hình 1.3 Mối quan hệ giữa lượng mưa quan trắc và mô phỏng theo phương pháp ANN và mô hình ARIMA vùng Hyderabad [35] 11
Hình 1.4 Sơ đồ xây dựng mô hình dự báo khí hậu mùa [13] 16
Hình 1.5 Sơ đồ thực hiện dự báo và cảnh báo hạn hán [14] 17
Hình 1.6 Kết quả quan trắc và dự báo Tmin2m theo REG trong 4 mùa 18
tại trạm Láng [12] 18
Hình 2.1 Các thành phần trong chuỗi quan trắc khí hậu [10] 26
Hình 2.2 Minh họa diễn biến của chuỗi lượng mưa tháng và hàm tự tương quan đối với trạm Hà Nội trước khí sai phân (A,A‟) và sau khi sai phân (B,B‟) 28
Hình 2.3 Một số dạng chính của hàm ACF và PACF tưng ứng với các dạng mô hình ARIMA khác nhau [20] 30
Hình 2.4 Một số dạng chính của hàm tương quan chéo giữa biến nhập (X) và biến phụ thuộc (Y) tưng ứng với các dạng mô hình ARIMA khác nhau [20] 31
Hình 2.5 [2] Vị trí nhóm nhân tố ENSO 37
Hình 2.6 [9] Mật độ phổ của chỉ số SOI và nhiệt độ bề mặt nước biển 38
ở các vùng Nino 38
Hình 2.7 Sơ đồ khối xây dựng mô hình ARIMA và ARIMAX 40
Hình 3.1 Diễn biến lượng mưa vụ đông xuân tại 9 trạm 42
vùng Đồng bằng Bắc Bộ 42
Hình 3.2 Hàm ACF (bên trái) và hàm PACF (bên phải) của chuỗi 44
lượng mưa vụ đông xuân trạm Hà Nội 44
Hình 3.3 Hàm ACF (bên trái) và hàm PACF (bên phải) của 45
chuỗi sai số trong mô hình ARIMA hanoi (0, 0, [4, 5]) 45
Hình 3.4 Hàm tự tương quan của chuỗi nhân tố dự báo thuộc nhóm chỉ số ENSO 48
Trang 7Hình 3.7 Diễn biến hàm tương quan chéo giữa chỉ số lượng mưa vụ Đông Xuântrạm Hà Nội và dị thường nhiệt độ bề mặt nước biển ở các vùng NINO với thời giantrễ từ 1 đến 120 tháng so với thời gian dự báo 51
Hình 3.8 Diễn biến hàm tương quan chéo giữa chỉ số lượng mưa vụ Đông Xuântrạm Hải Dương và dị thường nhiệt độ bề mặt nước biển ở các vùng NINO với thờigian trễ từ 1 đến 120 tháng so với thời gian dự báo 51
Hình 3.9 Diễn biến hàm tương quan chéo giữa chỉ số lượng mưa vụ Đông Xuântrạm Hà Nội và chỉ số SOI, vết đen Mặt Trời với thời gian trễ từ 1 đến 120 tháng sovới thời gian dự báo 52
Hình 3.10 Diễn biến hàm tương quan chéo giữa chỉ số lượng mưa vụ Đông Xuântrạm Hải Dương và chỉ số SOI, vết đen Mặt Trời với thời gian trễ từ 1 đến 120tháng so với thời gian dự báo 52
Hình 3.11 Hàm tự tương quan và tự tương quan riêng phần của chuỗi sai số dự báotrong mô hình động thái ARIMAX 58
Hình 3.12 Mô phỏng lượng mưa vụ đông xuân theo các mô hình được xây dựng tạimột số trạm vùng đồng bằng Bắc Bộ 62
Hình 3.12 Mô phỏng lượng mưa vụ đông xuân theo các mô hình được xây dựng tạimột số trạm vùng đồng bằng Bắc Bộ (tiếp theo) 63
Hình 3.12 Mô phỏng lượng mưa vụ đông xuân theo các mô hình được xây dựng tạimột số trạm vùng đồng bằng Bắc Bộ (tiếp theo) 64
Hình 3.13 Kết quả dự báo lượng mưa vụ đông xuân theo các mô hình được xâydựng tại một số trạm vùng đồng bằng Bắc Bộ 65
Trang 8DANH MỤC BẢNG
Bảng 1.1 Các đặc trưng liên quan đến mô hình ARIMA tại các trạm 11trên lãnh thổ Thái Lan [39] 11Bảng 1.2 Kết quả nhận dạng các mô hình ARIMA và mô hình12 động thái ARIMA
[18] 12
Bảng 1.3 So sánh sai số quân phương (RMSE) từ các mô hình được tính toán trên
số liệu phụ thuộc (In-sample) và số liệu độc lập (Out-sample)[18] 13Bảng 3.1 Hệ số tự tương quan và giới hạn tin cậy của chuỗi lượng mưa vụ đông
xuân tại 9 trạm vùng Đồng bằng Bắc Bộ 43Bảng 3.2 Các đặc trưng thông số của mô hình ARIMA hanoi (4, 0, [4, 5]) 44Bảng 3.3 Ma trận tương quan giữa các thông số của mô hình ARIMA hanoi (4, 0,[4, 5]) 45Bảng 3.4 Các đặc trưng thông số của mô hình ARIMA hanoi (0, 0, [4, 5]) 45
45
Bảng 3.6 Thứ tự các bước trễ theo tháng……… …….51
Bảng 3.7 Kết quả nhận dạng cấu trúc của mô hình động thái ARIMAX đối với các
trạm vùng đồng bằng Bắc Bộ 54Bảng 3.8 Các đặc trưng thống kê của các thông số trong mô hình động tháiARIMAX 56Bảng 3.9 Ma trận tương quan giữa các thông số trong mô hình động thái ARIMAX
57
Bảng 3.10 Các chỉ tiêu đánh giá khả năng mô phỏng của các mô hình đối với chuỗiphụ thuộc 66Bảng 3.11 Các chỉ tiêu đánh giá khả năng mô phỏng của các mô hình đối với chuỗiđộc lập 66
Trang 9DANH MỤC CÁC KÍ HIỆU VIẾT TẮT
AGCM Mô hình hoàn lưu chung khí quyển
ACF Hàm tự tương quan (Autocorrelation function)
ANN Phương pháp mạng thần kinh
AOGCM Mô hình kết hợp (couple) đại dương khí quyển
AOL-GCM Mô hình khí quyển - đại dương – đất
ARIMA Mô hình tự hồi quy trung bình trượt
ARIMAX Mô hình động thái (Dynamic Regression)
CCF Hàm tương quan chéo (Cross correlation function)
ECMWF Trung tâm Dự báo Thời tiết hạn vừa châu Âu
ENSO Dao động Nam về El Niño/La Nina
GCM Mô hình khí hậu toàn cầu
MAE Sai số trung bình tuyệt đối (Mean Absolute Error)
ME Sai số trung bình, hay sai số hệ thống (Mean Error)
MEI Multivariate ENSO Index
MOS Thống kê sản phẩm đầu ra mô hình (Model Output Statistics)MSSS Điểm kỹ năng của mô hình (Mean Square Skill Score)
NCAR Trung tâm Quốc gia về Nghiên cứu Khí quyển (Hoa Kỳ)NCEP Trung tâm Quốc gia Dự báo Môi trường (Hoa Kỳ)
NCSS National Council for the Social Studies
NOAA Cơ quan Quản lý Khí quyển và Đại dương (Hoa Kỳ)
OGCM Mô hình hoàn lưu chung đại dương
PAFC Tự tương quan riềng phần (Part autocorrelation function)RCM Mô hình khí hậu khu vực
RegCM Mô hình khí hậu khu vực của NCAR
RMSE Sai số quân phương
SAS Statistical Analysis System
SOI Chỉ số dao động nam (Southern Oscillation Index)
SST Nhiệt độ mặt nước biển (Sea Surface Temperature)
SSTA Chuẩn sai nhiệt độ mặt nước biển (Sea Surface Temperature
Anomalies)VDMT Vết đen Mặt Trời
WMO Tổ chức Khí tượng Thế giới (World Meteorological
Organization)
Trang 10MỞ ĐẦU
Các thông tin dự báo khí hậu, đặc biệt là dự báo mưa mùa có ý nghĩa lớn đếncác hoạt động phát triển kinh tế xã hội như: kế hoạch sản xuất nông nghiệp, du lịch,đánh bắt và nuôi trồng thủy sản, quản lý, khai thác có hiệu quả nguồn tài nguyênnước Mức độ tin cậy về dự báo mưa mùa thường thấp hơn so với các yếu tố dựbáo khác, nguyên nhân là do sự phân bố theo không gian và sự biến đổi theo thờigian của lượng mưa phụ thuộc vào nhiều yếu tố khác Chính vì vậy công tác nghiêncứu dự báo mưa mùa tuy không còn mới nhưng vẫn đang rất được quan tâm ở nhiềunước trên thế giới, trong đó có Việt Nam
Ở vùng đồng bằng Bắc Bộ trong những năm gần đây sản xuất lúa vụ đôngxuân luôn phải đối mặt với tình trạng thiếu nước nghiêm trọng ở giai đoạn đầu vụ,nhiều khu vực đã phải chuyển đổi diện tích trồng lúa vụ đông xuân sang trồng cáccây hoa màu Việc dự báo được lượng mưa vụ đông xuân, đặc biệt là tổng lượngmưa trong khoảng từ tháng 10 năm trước đến tháng 1 năm sau sẽ cho phép tính toánđược tổng lượng nước cần phải tưới đối với các cây trồng cạn trong vụ đông vàlượng nước đổ ải làm đất đối với vụ lúa đông xuân thông qua các mô hình khí tượngnông nghiệp Các kết quả này sẽ là cơ sở khoa học trong việc lập kế hoạch tích trữnước cho các hồ chứa trong vùng, bố trí hợp lý cây vụ đông và đưa ra quyết định vềthời vụ cơ cấu cây trồng Đây là bài toán có ý nghĩa rất quan trọng trong công tácchỉ đạo sản xuất nông nghiệp ở các tỉnh đồng bằng Bắc Bộ mà sự thành công của nóphụ thuộc rất nhiều vào kết quả dự báo tổng lượng mưa trong giai đoạn này
Hiện nay ở Việt Nam, các bản tin dự báo hạn mùa đã đáp ứng phần nào nhucầu phục vụ phát triển kinh tế xã hội và phòng tránh giảm nhẹ thiên tai, tuy nhiên đểgiải quyết bài toán nêu trên, sẽ gặp phải khó khăn về nguồn dữ liệu đầu vào, các kếtquả dự báo mưa còn mang tính định tính, chưa đưa ra định lượng và hơn nữa, thời hạn
dự báo là 3 tháng liên tiếp, chưa thật sự phù hợp với yêu cầu của bài toán nông nghiệp
ở vùng này
Hiện nay có hai cách tiếp cận để nghiên cứu dự báo mưa mùa vụ là bằngphương pháp thống kê và phương pháp mô hình động lực Nhìn chung, phương
Trang 11pháp thống kê truyền thống đã đạt được những kết quả nhất định, nhiều mô hìnhthống kê có đóng góp chính trong việc đưa ra bản tin dự báo tổng lượng mưa mùa.Phương pháp mô hình động lực là hướng nghiên cứu đang rất được quan tâm pháttriển, nó có những ưu điểm vượt trội về khả năng cung cấp sản phẩm dự báo, tuynhiên, việc giải mô hình số rất phức tạp và tốn kém, cần phải có công cụ máy tínhcấu hình cao và hơn nữa kết quả dự báo mưa cũng chưa đạt được độ chính xác nhưmong muốn.
Mô hình ARIMA là mô hình phân tích chuỗi thời gian , nó không chỉxem xétcác chu kỳ tự vận động của chuỗi dữ liệu dự báo , các mối tương tác trong quá trình
tư ̣vâṇ đông ̣ của các nhân tốảnh hưởng khác mànócòn đánh giáđươc ̣ các quy luâṭ saisốtrong quátrinh̀ mô phỏng đểnâng cao đô ̣chinh́ xác của dư ̣báo Mặc dù mô hìnhnày đã được áp dụng ở nhiều nước trên thế giới nhưng ở Việt Nam cho đến nay vẫncòn rất ít các nghiên cứu áp dụng trong dự báo khí hậu mùa
Xuất phát từ các nhận thức nêu trên và để góp phần đáp ứng nhu cầu thực
tiễn, chúng tôi chọn đề tài luận văn tốt nghiệp là: "Nghiên cứu ứng dụng mô hình ARIMA để dự báo lƣợng mƣa vụ đông xuân ở một số tỉnh vùng đồng bằng Bắc Bộ".
Các nôi dung chính của luận văn được trình bày trong 3 chương như sau:Chương 1: Tổng quan
Chương 2: Mô hình ARIMA và số liệu sử dụng
Chương 3: Kết quả và thảo luận
Trang 12Chương 1 TỔNG QUAN
Trong chương này, sẽ trình bày cơ sở khoa học của dự báo khí hậu mùa vàtóm lược các công trình nghiên cứu tiêu biểu nhằm rút ra được những thông tin cầnkhai thác, ứng dụng hoặc cải tiến trong việc thực hiện các nội dung của đề tài
1.1 Cơ sở khoa học của dự báo khí hậu mùa
Trải qua hàng nghìn năm con người đã có kinh nghiệm tìm cánh thích ứngvới quy luật diễn biến khí hậu, biểu hiện rõ rệt nhất là sự hình thành mùa, vụ trongnông nghiệp Tuy nhiên trong thực tế sự dao động mang tính quy luật của các hiệntượng thời tiết khí hậu diễn ra không ổn định, tính bất thường của nó sẽ ảnh hưởngđến các hoạt động kinh tế - xã hội, trong đó có sản xuất nông nghiệp Vì vậy nếu dựbáo được mức độ biến động của các yếu tố khí hậu, đặc biệt là yếu tố lượng mưatrong từng mùa, vụ sẽ cho phép thực hiện công tác chỉ đạo sản xuất hợp lý, tiết kiệmđược nguồn nước, giảm chi phí trong sản xuất, nâng cao năng suất cây trồng… Đóchính là một trong những yêu cầu đối với các nhà nghiên cứu dự báo khí hậu
Trong khí tượng, công tác dự báo nghiệp vụ thường được chia thành 2 loại:
dự báo thời tiết và dự báo khí hậu Dự báo thời tiết là dự báo trước trạng thái củakhí quyển tại một địa điểm và thời điểm cụ thể (thời điểm có thể là từng giờ, từngngày) Dự báo khí hậu là dự báo các đặc trưng về điều kiện khí quyển trong từngkhoảng thời gian dài như: tháng, mùa, vụ, năm, thập kỷ, thế kỷ, trong đó, được quantâm nhiều nhất là dự báo hạn mùa (tháng, mùa, vụ) Dự báo khí hậu hạn mùa khácvới dự báo thời tiết không chỉ ở phạm vi thời gian, mục đích mà còn khác cả sảnphẩm, cách tiếp cận và phương pháp Nhiều thông tin mà nghiên cứu dự báo thờitiết có thể bỏ qua, nhưng nghiên cứu dự báo mùa lại cần phải tính toán rất thậntrọng [36]
Do tính tương tác không tuyến tính của các hình thế thời tiết ở quy mô synopnên dự báo thời tiết chỉ có thể dự báo trước được một số ngày Theo WMO quy địnhcác dự báo khí tượng có hạn dự báo nhỏ hơn hoặc bằng 10 ngày được xem là dự báothời tiết (thời đoạn 10 ngày là cận trên của chu kỳ Synop) và hạn dự báo trongkhoảng tháng, mùa, vụ được xem là dự báo mùa [41]
Trang 13Sản phẩm của dự báo thời tiết bao gồm nhiều yếu tố khí tượng với các mứcđịnh lượng khác nhau, nhưng sản phẩm của dự báo hạn mùa thường là mức độ daođộng xung quanh giá trị trung bình nhiều năm của một số yếu tố khí hậu chính nhưnhiệt độ và lượng mưa Ngoài ra các hiện tượng thời tiết đặc biệt như: bão, áp thấpnhiệt đới, mưa lớn, nắng nóng, rét đậm, rét hại, khô hạn cũng đã được nghiên cứutrong công tác dự báo mùa để nhằm giảm thiệt hại do thiên tai gây ra đối với pháttriển kinh tế - xã hội của mỗi quốc gia.
Mục tiêu của các mô hình dự báo thời tiết là nắm bắt chính xác trạng thái củakhí quyển trong khoảng thời gian dự báo Mức độ chính xác của mô hình dự báothời tiết thường phụ thuộc vào hạn dự báo, khả năng giải các phương trình biếnđộng ngắn hạn của các đặc trưng khí quyển và độ chính xác của điều kiện ban đầu
và điều kiện biên Nhưng đối với các mô hình dự báo hạn mùa, cần phải nắm bắtđược dị thường của khí hậu mùa, đây là một bài toán rất phức tạp mà sự thành côngcủa dự báo phụ thuộc vào mức độ hiểu biết về mối quan hệ tương tác giữa khíquyển, lục địa và đại dương [41]
Theo [36], các hoạt động tự nhiên của hệ thống khí hậu làm gia tăng biếnđộng của khí hậu trên tất cả quy mô thời gian Một số các quá trình xảy ra trongkhoảng thời gian ngắn như sự phát triển của hệ thống synop trong khí quyển là mộttrong những nguyên nhân dẫn đến sai số dự báo mùa Tuy nhiên, sự thay đổi chậmcủa hệ thống khí hậu là nguồn gốc cơ bản cho phép dự báo khí hậu mùa Nguyênnhân của sự thay đổi này bao gồm sự thay đổi trong khoảng thời gian dài của đạidương, hệ thống tương tác đại dương-khí quyển và các thành phần khác như băngbiển, điều kiện bề mặt đất, độ che phủ của tuyết…
El Nino và Dao động Nam (SO) được xem là nhân tố tác động lớn nhất đến
dị thường khí hậu, trong đó có lượng mưa Walker (1924) đã phát hiện ra dao độngcủa khí áp quy mô lớn, từ năm này qua năm khác ở 2 phía Đông và Tây của khu vựcxích đạo Thái Bình Dương (Tahiti và Darwin) và được gọi là Dao động Nam Hơn
40 năm sau, trong công trình nghiên cứu của Jacob Bjerknes (1969) thừa nhận có sựquan hệ chặt chẽ giữa Dao động Nam và sự thay đổi về nhiệt độ bề mặt nước biểntrên khu vực Xích Đạo đông Thái Bình Dương Mối quan hệ này thể hiện sự tươngtác giữa đại dương và khí quyển mà biểu hiện của nó chính là hiện tượng
Trang 14ENSO (El Nino–Southern Oscillation) ENSO được dùng để chỉ cả 2 hai hiện tượng
El Nino, La Nina và có liên quan với Dao động Nam ENSO là nhân tố ảnh hưởnglớn nhất đến các dao động khí hậu hàng năm, chính sự kết hợp này là nguồn gốcchính sinh ra dị thường về nhiệt độ và lượng mưa trên phạm vi toàn cầu [32,33]
Trong những năm gần đây đã có nhiều tác giả sử dụng các phương pháp khácnhau để tìm quy luật dao động của ENSO cũng như đánh giá ảnh hưởng của nó đếncác yếu tố khí hậu đã làm rõ hơn về sự tương tác giữa khí quyển và đại dương, vàđặc biệt là dự báo hiện tượng ENSO theo quy mô tháng và năm đã hỗ trợ tốt hơncho các dự báo hạn mùa ở nhiều nơi trên thế giới [36]
Ngoài ra, nhân tố tác động bên ngoài hệ thống khí hậu như sự thay đổi số vếtđen mặt trời cũng được xem xét đến trong nghiên cứu dự báo khí hậu mùa (Vết đenMặt Trời là các khu vực tối trên bề mặt Mặt Trời Độ sáng bề mặt của vết đen vàokhoảng 1/4 độ sáng của những vùng xung quanh Nguyên nhân xuất hiện vết đen là
do nhiệt độ của chúng thấp hơn các vùng xung quanh [42]) Tuy nhiên, tác động của
nhân tố này đến quy mô khí hậu mùa thường là không lớn và có xu hướng hoạtđộng trên quy mô thời gian dài, đáng kể nhất là chu kỳ mặt trời 11 năm [40]
Hình1.1 Diễn biến về lượng mưa hàng năm và số vết đen mặt trời với cácbước trượt 11 (hình trên), 21 (hình giữa), 33 (hình dưới) ở Beijing, Trung Quốc[40]
Trang 15Cho đến nay, có hai cách tiếp cận để dự báo khí hậu mùa là dự báo bằngphương pháp thống kê thực nghiệm và phương pháp động lực Mỗi phương phápđều tồn tại những điểm mạnh yếu và có xu hướng bổ xung cho nhau, do vậy cáchoạt động dự báo mùa ở nhiều trung tâm thông thường phụ thuộc vào sự tổng hợpcác thông tin được cung cấp bởi các công cụ dự báo thống kê và mô hình động lực[36].
Phương pháp thống kê thực nghiệm phụ thuộc vào mối quan hệ giữa yếu tố
dự báo với các nhân tố dự báo Nhân tố dự báo có thể là các quan trắc hiện tại vàquá khứ hoặc các trường tái phân tích khí quyển, đại dương (SST, SOI, MEI ),hoặc cũng có thể là các trường dự báo của các mô hình khí hậu toàn cầu (hạ thấp qui
mô thống kê - Statistical Downscaling) Mối quan hệ giữa yếu tố dự báo với cácnhân tố dự báo được xây dựng dựa trên các tập số liệu lịch sử và giả thiết rằng mốiquan hệ đó vẫn duy trì trong tương lai Các công cụ phân tích thống kê khác nhaunhư: phân tích tương quan, hồi quy, xác suất có điều kiện, hàm phân biệt, phân tíchchuỗi thời gian …được sử dụng nhằm nắm bắt được tính chất vật lý và các quá trìnhđộng lực trong hệ thống khí hậu Ưu điểm của cách tiếp cận này đó là quá trình tínhtoán trong các mô hình không cần công hiệu máy tính lớn, đơn giản, dễ áp dụngtrong thực tiễn, kết quả dự báo mang tính khách quan, tuân theo một quy tắc nhấtđịnh Ban đầu, hướng tiếp cận này không thực sự thành công, nhưng với sự gia tănghiểu biết về hiện tượng ENSO và các hình thế thời tiết khác đã giúp cho phươngpháp này đáng tin cậy hơn [36] Tuy nhiên, cách tiếp cận này tồn tại một số điểmnhư: chỉ đơn thuần dựa vào mối quan hệ tuyến tính, không biểu diễn trực tiếp quan
hệ vật lý giữa nhân tố dự báo và yếu tố dự báo, các điều kiện khí hậu chưa từng xảy
ra không được xét đến trong quá trình dự báo, và kết quả dự báo phụ thuộc nhiềuvào độ dài chuỗi số liệu
Phương pháp động lực là hướng nghiên cứu mô phỏng khí hậu bằng mô hình
số Để biểu diễn các quan hệ vật lý giữa các yếu tố, người ta xây dựng các mô hình
số dựa trên mối tương tác vật lý của sự chuyển động Phát triển sớm nhất của loại
mô hình này là mô hình hoàn lưu chung khí quyển (AGCM), sau đó, do sự ảnhhưởng quan trọng của đại dương đối với hệ thống khí hậu nên đã lồng ghép mô hình
Trang 16hoàn lưu chung đại dương (OGCM) với mô hình hoàn lưu chung khí quyển để tạothành hệ thống mô hình kết hợp (couple) đại dương khí quyển (AOGCM) Mặtkhác, do nhu cầu sử dụng thông tin dự báo với độ phân giải không gian cao, các nhàkhoa học đã đưa ra các mô hình khí hậu khu vực (RCM), mô hình RCM được xâydựng theo nguyên tắc RCM được lồng vào một GCM nào đó Phương pháp lồngghép RCM vào AOGCM thường được gọi là hạ thấp qui mô động lực (DynamicalDownscaling) Hiện nay, các mô hình hoàn lưu chung khí quyển đại dương và các
mô hình khí hậu khu vực là công cụ chủ yếu được sử dụng để xác định sự biến độngkhí hậu trong quá khứ và dự báo khí hậu cho tương lai Nếu kết quả đầu ra của môhình có sai số hệ thống, nó sẽ thực hiện thêm quá trình thống kê sản phẩm mô hình(MOS) để đạt được kết quả đầu ra tốt hơn Ngoài ra, một số các trung tâm lớn nhưTrung tâm dự báo thời tiết hạn vừa châu âu (ECMWF), Cơ quan Quản lý Khí quyển
và Đại dương Hoa Kỳ (NOAA) hiện đang sử dụng các mô hình khí quyển - đạidương – đất (AOL-GCM) để đưa ra sản phẩm dự báo mùa [30,34]
Ưu điểm chính của mô hình động lực là: mô hình động lực không bị hạn chếbởi sự không ổn định của khí hậu, có thể nắm bắt được các giá trị cực trị hoặcnhững hiện tượng bất thường có thể chưa từng xuất hiện trong khí hậu Tuy nhiên,
mô hình còn có những nhược điểm sau: việc giải mô hình số rất phức tạp, cần phải
có công cụ máy tính lớn, đầu tư lớn về hệ thống đồng hóa dữ liệu, hơn nữa các môhình này cũng có thể chứa đựng nhiều sai số từ các quá trình tương tác với các nhân
tố tác động (forcing) dẫn đến sai số của các mô hình biến đổi mạnh theo vùng, theomùa và tùy thuộc từng yếu tố khí tượng [22]
Như đã trình bày ở trên, tác giả đã tổng quan một số các nội dung liên quan đến cơ sở khoa học đối với dự báo khí hậu mùa, bao gồm: hạn dự báo, sản phẩm
dự báo, các nhân tố chính tác động đến khí hậu mùa và đặc biệt là các cách tiếp cận để dự báo mùa hiện nay Tiếp theo, sẽ tổng quan các nghiên cứu tiêu biểu liên quan đến dự báo mưa mùa (trọng điểm là phương pháp thống kê) trên thế giới và ở Việt Nam.
Trang 171.2 Các nghiên cứu trên thế giới
Từ những điểm mạnh, điểm yếu của phương pháp thống kê và phương pháp
mô hình số như đã trình bày ở trên, đã có nhiều quan điểm cho rằng cách giải quyếttối ưu trong trường hợp này là kết hợp cả hai phương pháp để tận dụng điểm mạnh
và hạn chế yếu điểm của mỗi phương pháp Chính vì vậy, đã có nhiều nghiên cứu
dự báo mưa mùa theo hướng tiếp cận bằng phương pháp thống kê truyền thống hoặckết hợp cả động lực và thống kê nhằm tăng chất lượng dự báo
Hướng tiếp cận kết hợp cả động lực và thống kê bao gồm: 1) Thống kê sau
mô hình (MOS): Dựa trên mối quan hệ thống kê giữa sản phẩm dự báo mưa(hindcast) của các mô hình động lực và số liệu quan trắc lượng mưa, xem sản phẩm
dự báo của mô hình động lực như là các nhân tố dự báo 2) Hạ thấp qui mô thống kê(Statistical Downscaling): Dựa trên mối quan hệ thống kê giữa số liệu quan trắcmưa và các trường tái phân tích, coi dự báo của GCM là hoàn hảo và sử dụng chúngnhư là nhân tố dự báo để xác định yếu tố dự báo cho tương lai 3) So sánh sản phẩm
dự báo mưa (hindcast) của cả 2 phương pháp thống kê và động lực để chọn mô hìnhphù hợp nhất phục vụ công tác dự báo nghiệp vụ Chi tiết về các phương pháp nàyđược trình bày trong các nghiên cứu của Pai và CS 2006, Lim và CS 2010,Rajeevan và CS 2007, Liew và CS 2009 Sau đây khái quát một số nghiên cứuđiển hình theo hướng động lực và thống kê
Năm 2011, trong nghiên cứu dự báo mưa mùa cho khu vực châu Phi, AnneRourke đã đánh giá kỹ năng mô phỏng lượng mưa mùa bằng cả 2 phương phápđộng lực và thống kê đối với từng vùng, từng mùa Trên cơ sở đó đã chọn được môhình phù hợp nhất được áp dụng đối với từng mùa và từng khu vực nhỏ trong vùngnghiên cứu [24]
Indira Kadel năm 2012 đã sử dụng phương pháp Downscaling thống kê để
dự báo mưa mùa cho khu vực Nepal của Ấn Độ, trong đó, nhân tố dự báo đượcchọn từ bộ số liệu tái phân tích của NCEP/NCAR về tham số khí quyển đại, dươngthời kỳ 1970 – 2010 [23]
Trang 18Hướng tiếp cận theo phương pháp thống kê truyền thống: Đây là hướng
nghiên cứu không mới, nhưng do tính đơn giản, dễ sử dụng, ít tốn kém, kết quảtương đối ổn định nên cho đến nay các mô hình thống kê vẫn đang được sử dụngkhá phổ biến Nhiều mô hình thống kê có vai trò chính trong việc dự báo tổng lượngmưa mùa, đặc biệt là các quốc gia nằm trong vùng nhiệt đới, là nơi sự kiện ENSOtác động mạnh đến lượng mưa [17] Phần lớn các mô hình thống kê được xây dựngtrên cơ sở hồi quy tuyến tính giữa các nhân tố dự báo (các chỉ số ENSO) và chỉ sốlượng mưa, khái quát một cách khá toàn diện và đầy đủ được trình bày trong báocáo của A Troccoli và M Harrison (2008) Ở đây, chỉ tổng quan các nghiên cứu điểnhình liên quan đến mô hình ARIMA
Năm 2009, P.E Naill và nnk đã áp dụng mô hình ARIMA để dự báo lượngmưa tháng cho khu vực Jordan thuộc vùng ven biển Địa Trung Hải Trong nghiêncứu này các tác giả đã sử dụng hàm tự tương quan và tự tương quan riêng phần củachuỗi lượng mưa để xác định các tham số p,d,q trong mô hình ARIMA, từ đó chọnđược mô hình ARIMA (1, 0, 0) (0, 1, 1)12 là mô hình dự báo lượng mưa tháng chokhu vực nghiên cứu [28] Cũng theo hướng nghiên cứu này năm 2006, Chookait vànnk đã áp dụng mô hình ARIMA (0, 1, 1) (0, 1, 1)12 đối với chuỗi sô liệu mưa tháng
từ năm 1996 đến 2005 để dự báo mưa cho vùng Thái Lan [21] Diễn biến giữa kếtquả mô phỏng và số liệu quan trắc của 2 nghiên cứu này được trình bày trên hình1.3
Hình 1.2 Biến trình lượng mưa tháng theo quan trắc và theo mô phỏng
Trang 19Từ hình 1.2 nhận thấy kết quả quan trắc và mô phỏng là khá tương đồng đốivới các tháng có lượng mưa không lớn, tuy nhiên do chỉ xét duy nhất quá trình tựhồi quy của chuỗi lượng mưa nên mô hình không thể nắm bắt được những dị thường
về lượng mưa, đây là điểm hạn chế lớn nhất trong các nghiên cứu này
Cũng trong năm 2006, V.K Somvanshi và nnk đã sử dụng phương phápmạng thần kinh nhân tạo (ANN) và mô hình ARIMA để dự báo tổng lượng mưahàng năm cho khu vực Ấn Độ phục vụ công tác quản lý tài nguyên nước Trongnghiên cứu này, các tác giả đã sử dụng chuỗi tổng lượng mưa hàng năm của vùngHyderabad thuộc Ấn Độ có độ dài chuổi là 104 năm (1901 – 2003), trong đó 93năm đầu được dùng để xây dựng mô hình, 10 năm còn lại được sử dụng để kiểmđịnh mô hình Từ kết quả tính toán, các tác giả nhận thấy việc áp dụng phương phápANN và mô hình ARIMA trong dự báo hạn dài ở khu vực Hyderabad là khá phùhợp và có thể áp dụng để phát triển cho các vùng khác thuộc Ấn Độ Kết quả môphỏng mưa từ phương pháp ANN và từ mô hình ARIMA được thể hiện ở hình 1.3[35]
ARIMA trên chuỗi phụ thuộc ARIMA trên chuỗi độc lập
ANN trên chuỗi phụ thuộc ANN trên chuỗi độc lập
Trang 20Hình 1.3 Mối quan hệ giữa lượng mưa quan trắc và mô phỏng theo phươngpháp ANN và mô hình ARIMA vùng Hyderabad [35].
Liên quan đến dự báo tổng lượng mưa hàng năm, năm 2005, UruyaWeesakul và nnk đã nghiên cứu áp dụng mô hình ARIMA để dự báo lượng mưahàng năm phục vụ công tác lập kế hoạch điều tiết nước trên toàn lãnh thổ Thái Lan.Các kết quả dự báo trên chuỗi số liệu độc lập (1991-2003) là khá tốt, sai số tươngđối trên toàn quốc dao động từ 7.5% đến 26.9 %, Bảng …[39]
Bảng 1.1 Các đặc trưng liên quan đến mô hình ARIMA tại các trạm
trên lãnh thổ Thái Lan [39]
Ngoài việc xem xét thành thành phần tự hồi quy và trung bình trượt trong mô hìnhARIMA, năm 2009, Bambang và nnk còn xem xét tác động của các chỉ số khí hậukhác đến lượng mưa tháng trên một số vùng của Indonesia Mục tiêu của nghiêncứu này là xác định được mô hình dự báo mưa tốt nhất trong số các mô hình
Trang 21ARIMA, mô hình động thái ARIMA đơn biến và mô hình động thái ARIMA đabiến Số liệu sử dụng là tổng lượng mưa tháng thời kỳ 1989 - 2008 được quan trắctại các trạm khí tượng và số liệu về chỉ số DMI, SST tại các vùng NINO [18] Kếtquả nhận dạng mô hình được trình bày trong bảng 1.2.
Bảng 1.2 Kết quả nhận dạng các mô hình ARIMA và mô hình
động thái ARIMA [18]
Mô hình ARIMA
Mô hình động thái ARIMA đơn biến (Single-input Transfer Function)
Mô hình động thái ARIMA đa biến (Multi-input Transfer Function models)
Trang 22Trên cơ sở nhận dạng và xác định các tham số trong các mô hình được trìnhbày ở bảng 1.2, các tác giả đã kiểm định các mô hình để chọn ra mô hình tốt nhất,phù hợp cho mỗi vùng trong khu vực nghiên cứu Kết quả được trình bày trongbảng 1.3 [18].
Bảng 1.3 So sánh sai số quân phương (RMSE) từ các mô hình được tính toán trên
số liệu phụ thuộc (In-sample) và số liệu độc lập (Out-sample)[18]
Từ bảng 1.3 nhận thấy khi có sự tham gia của các biến về chỉ số ENSO ở cácvùng NINO vào mô hình động thái ARIMA thì sai số của mô hình đã giảm đáng kể
so với trường hợp chỉ xét riêng thành phần tự hồi quy và trung bình trượt trong môhình ARIMA
1.3 Các nghiên cứu ở trong nước
Ở Việt Nam hiện nay đang sử dụng các mô hình thống kê để dự báo mưa hạnmùa, các thông tin dự báo được cập nhật hàng tháng trên trang Web của Viện Khoahọc Khí tượng Thủy Văn và Môi trường (http://www.imh.ac.vn) và Trung tâm Khí
trung vào nhận định về diễn biến của hiện tượng ENSO, kết quả dự báo là xác suấtcác pha hụt chuẩn, cận chuẩn, vượt chuẩn của lượng mưa ở quy mô cấp vùng
Cho đến nay, thông qua các đề tài, dự án, luận văn khoa học, luận án tiến sỹ,
đã có nhiều công trình nghiên cứu liên quan đến dự báo mùa nói chung và dự báomưa nói riêng Cách tiếp cận để giải quyết bài toán dự báo mùa trong các nghiên
Trang 23cứu này đều dựa theo phương pháp thống kê hoặc phương pháp mô hình số Có thể chia các công trình nghiên cứu này thành 4 nhóm như sau:
1) Nhóm công trình nghiên cứu theo phương pháp thống kê truyền thống.
Trong đó, các nhân tố dự báo là số liệu quan trắc hoặc các trường tái phân tích khíquyển, đại dương Trong cách tiếp cận này, quan hệ thống kê giữa yếu tố dự báo vớicác nhân tố dự báo được xây dựng dựa trên các tập số liệu lịch sử và giả thiết rằngmối quan hệ đó vẫn duy trì trong tương lai Trong số các công trình nghiên cứuthuộc nhóm này là đề án “Nghiên cứu thử nghiệm dự báo khí hậu ở Việt Nam”được thực hiện bởi nhóm tác giả Nguyễn Duy Chinh, Nguyễn Văn Thắng, PhanVăn Tân Trong nghiên cứu này, đối tượng dự báo được xác định là chuẩn sai nhiệt
độ và lượng mưa mùa (3 tháng liên tục) trên 7 vùng khí hậu Việt Nam, nhân tố dựbáo bao gồm: chuẩn sai nhiệt độ bề mặt nước biển (SSTA) của các khu vực NINO,chỉ số SOI và số liệu về 12 thành phần trực giao đầu tiên của trường số liệu SSTtoàn cầu Về mặt phương pháp các tác giả đã thử nghiệm nhiều phương pháp phântích thống kê khác nhau như: phân tích tự tương quan, phân tích hồi quy nhiều biến,phân tích hồi quy từng bước, phân tích phân biệt, phân tích mạng thần kinh nhântạo, phân tích tương quan Canon và từ đó đã chọn được phương pháp hồi quy nhiềubiến để xây dựng quy trình dự báo[1] Các kết quả trong nghiên cứu này đã và đangđược sử dụng vào công tác nghiệp vụ dự báo khí hậu của Viện Khoa học Khí tượngThủy Văn và Môi trường
Cũng theo hướng tiếp cận này còn có một số công trình nghiên cứu khácnhư: Lương Văn Việt, năm 2006, đã dự báo mưa, nhiệt và ẩm cho khu vực Nam Bộ[16]; Lê Đức Cương, năm 2001, đã thử nghiệm dự báo số lượng xoáy thuận nhiệtđới hoạt động trên biển Đông và dọc bờ biển Việt Nam [2]; Phan Thị Lê Hằng năm
2008 đã thử nghiệm khả năng dự báo số đợt nắng nóng, rét đậm, rét hại cho cáctrạm đại diện trên lãnh thổ Việt Nam [4] Hầu hết các nghiên cứu này các tác giảđều đã sử dụng nhân tố dự báo là các chỉ số giám sát ENSO
2) Nhóm công trình nghiên cứu theo phương pháp mô hình số
Trang 24Việc nghiên cứu sử dụng các mô hình số trị trong dự báo khí hậu mùa ở nước
ta mới bắt đầu được thực hiện từ đầu những năm 2000, đến nay đã có nhiều côngtrình nghiên cứu mô phỏng mùa các trường khí hậu bằng các mô hình số trị Nộidung của các công trình nghiên cứu này từng bước giải quyết một số vấn đề như:tìm hiểu về cấu trúc của mô hình; nghiên cứu ảnh hưởng của kích thước, vị trí miềntính và độ phân giải của mô hình, ảnh hưởng của các điều kiện biên và điều kiệnban đầu, ảnh hưởng của việc tham số hóa quá trình vật lý đến khả năng mô phỏngkhí hậu mùa từ các mô hình khí hậu khu vực, từ đó, đánh giá khả năng ứng dụng môhình khí hậu khu vực vào điều kiện Việt Nam Chi tiết về hướng nghiên cứu này đãđược Phan Văn Tân và CS trình bày trong Báo cáo tổng kết đề tài cấp Đại học Quốcgia (QG.TĐ.06.05) [11] Về nhóm các công trình nghiên cứu theo phương pháp môhình số ở Việt Nam đã được tổng quan khá chi tiết và đầy đủ trong luận văn thạc sỹcủa Nguyễn Đăng Mậu (2012)
3) Nhóm công trình nghiên cứu theo phương pháp hạ thấp qui mô thống kê (Statistical Downscaling), đây là hướng nghiên cứu kết hợp của cả 2 phương pháp,
thống kê và mô hình số Trong đó nhân tố dự báo là các trường dự báo của mô hìnhGCM được tổng hợp, phân tích lại và giả thiết rằng dự báo này là hoàn hảo Mộttrong những công trình nghiên cứu đi đầu theo hướng này là đề tài “Nghiên cứu xâydựng mô hình dự báo khí hậu cho Việt Nam dựa trên kết quả của mô hình động lựctoàn cầu” của Nguyễn Văn Thắng, năm 2006 Trong nghiên cứu này, yếu tố dự báo
là chỉ số mưa, nhiệt độ mùa (12 mùa, mỗi mùa gồm 3 tháng liên tiếp) của 7 vùngkhí hậu Việt Nam) và các yếu tố khác, như số lượng các đợt không khí lạnh, mưalớn diện rộng, nắng nóng, xoáy thuận nhiệt đới…, nhân tố dự báo là các trườngchuẩn sai nhiệt độ mặt nước biển (SSTA), khí áp mực biển (SLPA), bức xạ sóng dài(OLRA), tốc độ gió (U, V) ở các mức độ cao 1000 mb, 850 mb, 700 mb, 500 mb,
200 mb; (theo ô lưới) Các trường này là kết quả của các mô hình toàn cầu đã đượctổng hợp và phân tích lại tại các trung tâm khí hậu như CPC/NCEP, NCAR, IRI(Mỹ), CPTEC/INPE (Brasil), NCC, BoM (Úc), ECMWF (EC) Trên cơ sở bản đồ
Trang 25hệ số tương quan giữa yếu tố dự báo và giá trị tại mỗi ô lưới của các trường khí hậutoàn cầu nêu trên, sẽ chọn được các vị trí có tương quan tốt nhất được sử dụng làmnhân tố dự tuyển trong mô hình hồi quy từng bước để lọc nhân tố Sơ đồ xây dựng
mô hình dự báo khí hậu mùa được trình bày trong hình 1.4 [13] Từ kết quả của Đềtài các tác giả cho rằng phương pháp Downscaling thống kê không chỉ áp dụng tốttrong dự báo khí hậu mùa mà có thể áp dụng dự báo trong các lĩnh vực khác, nếuyếu tố dự báo có liên quan mật thiết với các trường khí tượng, khí hậu, ví dụ như xuthế các dịch bệnh của con người, động vật, năng suất cây trồng, mùa vụ,
Hình 1.4 Sơ đồ xây dựng mô hình dự báo khí hậu mùa [13]
Cũng theo hướng nghiên cứu này, năm 2008, Nguyễn Văn Thắng và CS đãthực hiện đề tài “Xây dựng phương án chi tiết thử nghiệm ứng dụng công nghệ dự
Trang 26báo và cảnh báo sớm hạn hán ở Việt Nam” Trong nghiên cứu này, trên cơ sởphương pháp Downscalling thống kê, đã xây dựng thành công công nghệ dự báo vàcảnh báo sớm 3 loại hạn hán: hạn khí tượng, hạn thủy văn và hạn khí tượng nôngnghiệp cho 7 vùng khí hậu ở Việt Nam Sơ đồ thực hiện dự báo và cảnh báo hạn hánđược trình bày trong hình 1.5 dưới đây [14].
Hình 1.5 Sơ đồ thực hiện dự báo và cảnh báo hạn hán [14]
Gần đây, trong đề tài cấp nhà nước KC08.29/0610 [12], tác giả Phan VănTân và CS đã áp dụng phương pháp Downscaling thống kê để dự báo hạn mùa cácyếu tố và hiện tượng khí hậu cực đoan tại các điểm trạm ở Việt Nam Trong đó: yếu
tố dự báo là nhiệt độ cực trị, số đợt mưa lớn, số đợt không khí lạnh và khả năng xuấthiện nắng nóng và rét đậm Nhân tố dự báo là số liệu tái phân tích của NCEP với độphân giản 2.50 bao gồm các biến cơ bản như: áp suất mực biển PMSL, độ cao địathế vị h, gió u,v, nhiệt độ T và độ ẩm RH tại các mực áp suất cơ bản 1000, 850, 700,500mb Đây là nghiên cứu có tính khoa học và thực tiễn cao, các bước thực hiệnnhư: phân tích chọn lựa nhân tố dự báo, lựa chọn phương pháp xây dựng mô hìnhđối với mỗi yếu tố dự báo đều được thực hiện với nhiều phương án khác nhau, từ đóchọn được phương án phù hợp nhất đối với mỗi yếu tố dự báo Cụ thể là: đã thửnghiệm hai phương pháp lựa chọn các nhân tố dự báo: 1) sử dụng các
Trang 27biến cơ bản của ô lưới chứa điểm trạm làm nhân tố dự tuyển (21 biến); 2) sử dụng
kỹ thuật phân tích thành phần chính PCA trên một miền cho trước đối với mỗitrường khí quyển Mỗi yếu tố dự báo (tùy thuộc vào bản chất của từng yếu tố) đượcthử nghiệm 2 trong 4 phương pháp thông kê bao gồm hồi quy tuyến tính đa biến(MLR), mạng thần kinh nhân tạo (ANN), ước lượng hồi qui xác suất sự kiện(REEP) và phân tích riêng biệt Fisher (FDA) Từ các kết quả nghiên cứu, một số các
mô hình dự báo về nhiệt độ cực trị, khả năng xuất hiện nắng nóng và rét đậm đượckhuyến cáo có thể sử dụng trong dự báo mùa Minh họa kết quả dự báo và quan trắc
về nhiệt độ tối thấp của nghiên cứu này trên chuỗi số liệu độc lập trạm Láng đượctrình bày trên hình 1.6
Hình 1.6 Kết quả quan trắc và dự báo Tmin2m theo REG trong 4
mùa tại trạm Láng [12]
Trang 284) Nhóm công trình nghiên cứu theo phương pháp thống kê trên sản phẩm
mô hình (Model Output Statistics – MOS) Trong đó, yếu tố dự báo và nhân tố dự
báo chính là các trường khí hậu nhận được từ mô hình khí hậu khu vực Đây là mộthướng tiếp cận khá mới mẻ, phương pháp này cần phải có kết quả mô phỏng nhiềunăm từ mô hình khí hậu khu vực Cho đến nay ở Việt Nam vẫn còn rất ít công trìnhnghiên cứu theo hướng này
Năm 2009, tác giả Nguyễn Minh Trường đã thực hiện báo cáo chuyên đề
“Nghiên cứu xây dựng các mô hình thống kê, lựa chọn tập nhân tố dự báo, lậpchương trình tính, kiểm tra độ chính xác bằng tập số liệu mẫu”, thuộc đề tàiKC08.29/0610 [15] Trong chuyên đề này, tác giả đã phân tích các cơ chế thời tiết,khí hậu khu vực Việt Nam để làm cơ sở khoa học cho việc lựa chọn một số nhân tố
dự báo phù hợp được lấy từ mô hình RegCM, sau đó sẽ xây dựng MOS để dự báomột số hiện tượng và yếu tố khí hậu cực đoan hạn mùa cho khu vực Việt Nam Báo
cáo bước đầu đã đưa ra được cơ sở khoa học trong việc nghiên cứu phương pháp MOS đối với dự báo hạn mùa cho khu vực Việt Nam Có thể hướng nghiên cứu này
sẽ được phát triển mạnh trong tương lai khi có được chuỗi số liệu dự báo lại(hindcast) của các mô hình khí hậu khu vực đủ dài
Tóm lại: Từ tổng quan nghiên cứu trong và ngoài nước về dự báo khí hậuhạn mùa trong đó có dự báo mưa có thể rút ra một số điểm chính sau:
Đối với nghiên cứu dự báo mưa hạn mùa, có hai cách tiếp cận là sử dụngphương pháp thống kê (thống kê truyền thống và downscaling thống kê) và phươngpháp mô hình động lực Nhìn chung, phương pháp thống kê truyền thống đã đạtđược những kết quả nhất định, nhiều mô hình thống kê có đóng góp chính trongviệc đưa ra bản tin dự báo tổng lượng mưa mùa Phương pháp downscaling thống
kê phụ thuộc nhiều vào độ chính xác của sản phẩm dự báo từ các GCM, tuy nhiênsai số của các GCM hiện nay vẫn còn khá lớn nên kết quả nhận được theo hướngnày cũng còn nhiều hạn chế Phương pháp mô hình động lực là hướng nghiên cứuđang rất được quan tâm, nó có những ưu điểm vượt trội về khả năng cung cấp sảnphẩm dự báo nhưng độ chính xác cũng chưa đạt được như mong muốn
Trang 29Dự báo mưa hạn mùa ở Việt Nam hiện mới dừng lại trong phạm vi các môhình thống kê, mặc dù đã có một số công trình nghiên cứu ứng dụng các mô hình sốnhưng chưa có điều kiện đưa vào nghiệp vụ, có thể do một số nguyên nhân như: khảnăng tính toán của máy tính, chưa có điều kiện biên ổn định (chưa chủ động đượcsản phẩm của mô hình toàn cầu), hạn chế về độ chính xác của sản phẩm dự báo
Các thông tin dự báo hạn mùa, trong đó có dự báo mưa đã đáp ứng phần nàonhu cầu phục vụ phát triển kinh tế xã hội và đời sống Tuy nhiên, để ứng dụng cóhiệu quả thì bản tin dự báo mùa còn có những hạn chế như: 1) Đối tượng dự báomới giới hạn ở hai yếu tố là nhiệt độ trung bình và tổng lượng mưa, thiếu thông tin
dự báo về các yếu tố khí hậu quan trọng khác như: nhiệt độ cực trị, lượng mưa lớnnhất, bốc hơi, độ ẩm, số giờ nắng, gió, khả năng khô hạn 2) thông tin dự báo về 3tháng kề nhau nhiều khi không phù hợp với yêu cầu sản xuất nông nghiệp trongnhững thời kỳ sinh trưởng quan trọng của cây trồng, nhất là các thông tin dự báotheo từng tháng và dự báo đầu vụ cùng với dự báo 3 tháng để có kế hoạch điều tiếtnước và bố trí cơ cấu cây trồng hợp lý ngay từ đầu vụ
Hiện nay, mô hình ARIMA đã được nhiều nước trên thế giới nghiên cứu ứngdụng trong dự báo mưa hạn mùa, trong đó có các nước gần Việt Nam như Thái Lan,Indonesia đã sử dụng mô hình này trong hoạt động nghiệp vụ Tuy nhiên ở ViệtNam, hướng tiếp cận này còn rất hạn chế Để thực hiện nhiệm vụ luận văn thạc sỹ,tác giả nhận thấy việc nghiên cứu mô hình ARIMA đối với bài toán dự báo mưa hạnmùa ở Việt Nam là hướng nghiên cứu có ý nghĩa khoa học và thực tiễn Nhằm có cơ
sở khoa học và những nhận định đúng đắn về mô hình này, bước đầu tác giả nghiêncứu cho một vùng trọng điểm về sản xuất nông nghiêp và một vụ sản xuất thườngxuyên gặp khó khăn về nguồn nước là khu vực đồng bằng Bắc Bộ với thời gian dựbáo là 4 tháng Từ kết quả nghiên cứu này sẽ nhân rộng cho các vùng khác, vụ sảnxuất khác Ngoài ra, có thể khai thác mô hình này để dự báo hạn mùa với một sốyếu tố khí hậu quan trọng khác, khi các mô hình động lực chưa đạt được kết quảnhư mong muốn
Trang 30Chương 2
MÔ HÌNH ARIMA VÀ SỐ LIỆU SỬ DỤNG
Trong chương này, sẽ giới thiệu về cấu trúc của các mô hình ARIMA baogồm mô hình tự hồi quy trung bình trượt ARIMA và mô hình động thái ARIMA,trên cơ sở đó sẽ đưa ra phương pháp áp dụng các loại mô hình này đối với bài toán
dự báo mưa hạn mùa, và cuối cùng là phân tích các nguồn số liệu phù hợp sử dụnglàm nhân tố đầu vào cho mô hình ARIMA
2.1 Giới thiệu cấu trúc của mô hình ARIMA
Với mục đích xem xét mối quan hệ giữa các quan trắc trong quá khứ với hiệntại nhằm dự báo cho tương lai của một biến trình nào đó, năm 1970, Box và Jenkins
đã đưa ra mô hình tự hồi quy trung bình trượt ARIMA (AutoRegresive Integrated Moving Average) Mô hình này là mô hình dự báo định lượng theo chuỗi thời gian,
giá trị tương lai của yếu tố dự báo sẽ phụ thuộc vào quy luật vận động của chính yếu
tố đó
Năm 1976, trên cơ sở mô hình tự hồi quy trung bình trượt, Box-Tiao đã pháttriển thành công mô hình động thái ARIMA (Transfer Function Model) Mô hìnhnày không chỉ xem xét mối quan hệ trong quá khứ với hiện tại của yếu tố dự báo màcòn xem xét tác động từ các chuỗi thời gian khác đến yếu tố dự báo
Để thuận tiện khi trình bày, từ đây, mô hình tự hồi quy trung bình trượt được
ký hiệu là ARIMA và mô hình động thái được ký hiệu là ARIMAX.
Đến nay các mô hình ARIMA và ARIMAX được áp dụng khá phổ biến trongnhiều lĩnh vực kinh tế, xã hội, môi trường Các mô hình này không quá phức tạp,nhưng có thể áp dụng hữu hiệu đối với nhiều dạng bài toán dự báo khác nhau.Trong lĩnh vực khí tượng thủy văn, mô hình ARIMA và ARIMAX là một trongnhững công cụ quan trọng phục vụ công tác dự báo ở một số nước trên thế giới
Chi tiết về thuật toán và phương pháp áp dụng đối với mỗi loại mô hình sẽđược trình bày sau đây:
Trang 312.1.1 Mô hình tự hồi quy trung bình trượt ARIMA
Mô hình ARIMA cũng có thể được hiểu tương tự như mô hình tự hồi quy
tuyến tính, nhưng về bản chất có sự khác biệt với mô hình tự hồi quy tuyến tính là
các hệ số hồi quy của mô hình ARIMA được xác định theo tiêu chuẩn hội tụ, sai số
còn lại chính là thành phần ngẫu nhiên Khi dự báo, thành phần ngẫu nhiên này
chính là sai số dự báo của khoảng thời gian trước, khi tạo chuỗi nó là chuỗi ngẫu
nhiên sao cho đảm bảo các đặc trưng thống kê không thay đổi theo thời gian Do
vậy, mô hình này được thực hiện đối với chuỗi ổn định ngẫu nhiên (chuỗi dừng),
khi chuỗi chưa đạt được độ ổn định, có thể dùng phép biến đổi thống kê để đưa về
dạng ổn định ngẫu nhiên và khi dự báo, cần phải đưa trở lại giá trị thực của đại
lượng ban đầu
Giả sử có chuỗi thời gian ổn định ngẫu nhiên hoặc bất ổn định ngẫu nhiên Yt
(t=1,2,…,n) thì dạng thức cơ bản của mô hình ARIMA bao gồm 3 thành phần sau:
Thành phần tự hồi quy bậc p (p= 1, 2,…); Thành phần sai phân bậc d (d=0,1,2…);
và thành phần trung bình trượt bậc q (q = 1, 2,…) và được ký hiệu là
ARIMA(p,d,q) Dạng tổng quát của mô hình ARIMA(p,d,q) có thể được viết như
sau [20]:
Wt = µ + p1Wt-l + p2Wt-2 +…+ ppWt-p - q1at-1 - q2at-2 -…- qqat-q + at (2.1)Trong đó:
yt, yt-l, yt-2, …, yt-p là giá trị quan trắc ở các bước thời gian t, t-1, t-2,…, t-p
at, at-1, at-2, …, at-q là sai số ngẫu nghiên (giữa giá trị thực và giá trị tính toán)
ở các bước thời gian t, t-1, t-2,…, t-q;
p1, p2, …, pp ; q1, q3, , qq là các tham số hồi quy
Phương trình 2.1 cũng có thể viết gọn lại thông qua phép toán dịch chuyển lùi
Trang 32yt, at như đã trình bày ở trên
p2B2 –… – ppBp) là phép toán tự hồi quy
q(B) = (1 – q1B – q2B2 –… – qqBq) là phép toán trung bình
trượt 2.1.2 Mô hình động thái ARIMAX
Mô hình động thái ARIMAX có sự khác biệt cơ bản so với mô hình tự hồi
quy trung bình trượt ARIMA là ngoài việc xem xét quá trình tự hồi quy trung bình
trượt của chuỗi yếu tố dự báo, nó còn cho phép xem xét ảnh hưởng của các chuỗi
thời gian khác tác động đến yếu tố dự báo, chuỗi tác động (biến độc lập) được gọi là
chuỗi nhập, chuỗi bị tác động (biến phụ thuộc) được gọi là chuỗi xuất
Giả sử ta có các chuỗi độc lập Xit (i = 1,2…m; t=1,2…n) và chuỗi phụ thuộc
Yt (t=1,2…n), khi đó mô hình động thái ARIMAX được viết dưới dạng tổng quát
Yt là giá trị quan trắc ở các bước thời gian t; μ là hằng số;
B là phép toán dịch chuyển lùi theo quy tắc : BX t = X t-1 , BkX t = X t-k ;
i0
U BU Bs; S s (B) S S B S Bs là
những trọng số động thái của chuỗi độc lập thứ i;
k là thời điểm tác động của chuỗi độc lập thứ i tại thời điểm t = k;
p(B) = (1 – p1B – p2B2 –… – ppBp); q(B) = (1 – q1B – q2B2 –… – qqBq) là
phép toán tự hồi quy và trung bình trượt của chuỗi phụ thuộc;
Trang 33 at, là sai số ngẫu nghiên (giữa giá trị thực và giá trị tính toán).
Lưu ý : các chuỗi Xit và Yt trong công thức 2.3 phải là các chuỗi có tính ổnđịnh ngẫu nhiên, nếu chuỗi không ổn định, sẽ cần phải thông qua bước sai phân đểđưa chuỗi về dạng ổn định ngẫu nhiên
Tóm lại: Bản chất của các mô hình ARIMA và ARIMAX là mô hình ngẫunhiên Việc phân tích chuỗi thời gian trong các mô hình này bắt buộc phải chấpnhận một giả thiết hết sức cơ bản là tính ổn định của các quá trình ngẫu nhiên, tính
ổn định ở đây có nghĩa là các đặc trưng thống kê (hay phân phối xác suất) khôngthay đổi theo thời gian Trong thực tế nhiều quá trình ngẫu nhiên có tính ổn địnhtrong một khoảng thời gian gián đoạn hữu hạn nào đó có thể coi là ổn định Ví dụchuỗi tổng lượng mưa tháng là chuỗi không dừng, còn chuỗi tổng lượng mưa năm
có thể coi là dừng vì khi đó qui luật bên trong năm bị loại trừ Các chuỗi khôngdừng có thể trở thành dừng nhờ một số phép biến đổi sai phân Lợi thế cơ bản củacác mô hình này là cho phép dự báo với độ chính xác nhất định, mặc dù chưa hiểu
rõ bản chất của các quá trình tác động từ các nhân tố dự báo đến yếu tố dự báo
2.2 Phương pháp áp dụng mô hình ARIMA và ARIMAX đối với bài toán dự báo mưa mùa
Trong mục 2.1 đã trình bày các dạng tổng quát của mô hình ARIMA vàARIMAX, nó có thể bao gồm nhiều thành phần tham gia vào mô hình như: thànhphần tự hồi quy, thành phần trung bình trượt, thành phần sai phân, thành phần ảnhhưởng của các chuỗi nhập khác (các chuỗi nhân tố dự báo), trong mỗi thành phần lại
có các thành phần con khác nhau Bài toán cần giải quyết ở đây là đưa ra đượcphương pháp xác định các thành phần có ý nghĩa về mặt thống kê để tham gia vào
mô hình dự báo mưa hạn mùa Đây là bài toán khá phức tạp, độ chính xác của môhình dự báo không chỉ phụ thuộc vào các chuỗi nhập, chuỗi xuất mà còn phụ thuộcviệc lựa chọn chính xác các thành phần tham gia vào mô hình dự báo Để giải quyếtbài toán này luận văn đã thực hiện theo các bước sau:
Trang 341) Áp dụng phương pháp thống kê sai phân để xác định tính ổn định ngẫu nhiên của các chuỗi dữ liệu tham gia vào mô hình ARIMA và ARIMAX;
2) Kế thừa phương pháp Box Jenkin đối với mô hình ARIMA và phương phápBox Tao đối với mô hình ARIMAX trong việc nhận dạng các thành phần tự hồi quy,thành phần trung bình trượt và thành phần ảnh hưởng của các chuỗi nhập đến chuỗilượng mưa thông qua việc xem xét sự biến đổi các hàm tự tương quan, tự tương quanriêng phần và tương quan chéo;
3) Sử dụng phương pháp bình phương tối thiểu trong việc xác định các tham số trong mô hình ARIMA và ARIMAX;
4) Áp dụng các phương pháp kiểm nghiệm giả thiết thống kê trong khí hậu đểchọn lựa các tham số có đủ độ tin cậy thống kê tham gia trong mô hình ARIMA vàARIMAX;
5) Sử dụng công cụ phần mềm thống kê SAS để tính toán các đặc trưng của chuỗi thời gian và các tham số trong mô hình ARIMA và ARIMAX
Sau đây sẽ trình bày cụ thể từng nội dung này:
2.2.1 Xác định tính ổn định ngẫu nhiên của chuỗi thời gian
Chuỗi thời gian là chuỗi số liệu được sắp xếp theo trình tự thời gian Nếu mộtchuỗi thời gian có giá trị trung bình và phương sai không đổi theo thời gian thìchuỗi đó được xem là ổn định ngẫu nhiên (chuỗi có tính dừng) hay nói một cáchkhác cụ thể hơn đó là một chuỗi thời gian không có xu thế, không có chu kỳ, mà chỉdao động xung quanh kỳ vọng của nó
Một chuỗi quan trắc khí hậu trung bình tháng thường bao gồm 3 thành phần:1) thành phần ngẫu nhiên là sự tăng lên hay giảm đi thường xen kẽ nhau, góp phầnlàm cho các trị số khí hậu dao động xung quanh một giá trị nào đó Giá trị đó có thể làtrung bình số học, nếu chuỗi không có thành phần chu kỳ và xu thế 2) Thành
phần chu kỳ là những biến đổi của chuỗi lặp lại nhiều lần sau những khoảng thờigian nhất định nào đó Mối tương quan giữa các thành phần trong một chu kỳthường đạt trị số lớn nhất 3) Thành phần xu thế là biểu hiện xu hướng tăng hoặc
Trang 35giảm theo thời gian của các thành phần trong chuỗi, trị số đầu của xu thế là cực tiểu
hoặc cực đại và trị số cuối của xu thế là cực đại hoặc cực tiểu Biểu đồ minh họa 3
thành phần này được trình bày trong hình 2.1
b) a)
Hình 2.1 Các thành phần trong chuỗi quan trắc khí hậu [10]
Để loại bỏ thành phần xu thế và chu kỳ nhằm đưa các chuỗi quan trắc về
dạng ổn định ngẫu nhiên, thường sử dụng phép lọc sai phân, phép lọc Loga, phép
lọc căn thức [10] Trong luận văn này chúng tôi chọn phép lọc sai phân, cụ thể như
sau:
- Đối với việc loại bỏ thành phần xu thế: sử dụng phép biến đổi sai phân bậc 1
hoặc bậc 2 Sai phân bậc 1 là chênh lệch giữa 2 giá trị kề nhau trong chuỗi
Trong đó: Yt là giá trị của sai phân bậc 1
Yt và Yt-1 là các thời đoạn trước và thời đoạn sau đó
Trang 36Nếu sai phân bậc 1 vẫn còn thể hiện xu thế thì thực hiện tiếp sai phân bậc 2.
Sai phân bậc 2 chính là sai phân của sai phân bậc 1:
2(Yt) = Yt - Yt-1 = (Yt - Yt-1) - (Yt-1 - Yt-2) (2.6) Nếu sai phân bậc 2 chưa đạt được tính dừng ta có thể tiếp tục lấy sai phân
bậc 3 hoặc cao hơn
- Đối với việc loại bỏ thành phần mùa và chu kỳ: Sai phân mùa là chênh lệch giá
trị của hai quan trắc cách nhau khoảng thời gian L, L có thể là một năm, hai năm…
hay một mùa… Ví dụ : nếu là số liệu tổng lượng mưa tháng, ta có L =12 Do đó sai
phân mùa bậc 1 có tính mùa là:
Cũng có thể lấy sai phân bậc 2 của sai phân mùa bậc 1 khi chuỗi chưa đạt
được độ ổn định:
- Kiểm tra tính ổn định ngẫu nhiên của chuỗi
Trong thực hành, để kiểm tra các chuỗi thời gian tham ra trong mô hình
ARIMA hoặc ARIMAX đã đạt tiêu chuẩn ổn định ngẫu nhiên hay chưa, thường dựa
vào hàm tự tương quan Theo Quenouille đã chứng minh chuỗi thời gian được xem
là ổn định ngẫu nhiên khi hầu hết hệ số tự tương quan của chuỗi (rk ) thỏa mản biểu
thức giới hạn tin cậy (2.8) và tiến dần về 0, ngoại trừ một số bước trễ như bước
mùa, vụ, chu kỳ …, nằm ngoài khoảng này [6, 37]
Biểu thức giới hạn tin cậy có thể viết dưới dạng sau:
Trong đó: Sr là sai số chuẩn của các hệ số tự tương quan rk ; t/ 2,n1 là điểm
phần trăm =0.05 của phân bố Student với n-1 bậc tự do.
Hình 2.2 minh họa chuỗi dữ liệu tổng lượng mưa tháng trước khi sai phân vàsau khi sai phân Trên hình này, phần hình A, A‟ ở phía trên ứng với trường hợp
Trang 37chuỗi chưa ổn định, phần hình B, B‟ ứng với chuỗi sau khi sai phân và được xem làchuỗi ổn định ngẫu nhiên.
Hình 2.2 Minh họa diễn biến của chuỗi lượng mưa tháng và hàm tự tương quan đối với trạm Hà Nội trước khí sai phân (A,A‟) và sau khi sai phân (B,B‟)
2.2.2 Nhận dạng cấu trúc của mô hình
Sau khi đã loại bỏ được các thành phần chu kỳ, xu thế của chuỗi thời gian, sẽtiến hành nhận dạng cấu trúc của mô hình Box - Jenkin đã đưa ra phương phápnhận dạng cấu trúc của mô hình ARIMA thông qua việc xem xét sự biến đổi củahàm tự tương quan (Autocorrelation function - ACF) và tự tương quan riêng phần(Part autocorrelation function - PAFC) để xác định các thành phần tự hồi quy (AR)
và thành phần trung bình trượt (MA) Đối với mô hình ARIMAX, Box Tao đã đưa
ra một số dáng điệu chính của hàm tương quan chéo (Cross correlation function CCF) để xác định mức độ ảnh hưởng (hàm truyền) của các chuỗi nhập đến chuỗiyếu tố dự báo Định nghĩa và thuật toán để tính các hàm ACF, PACF và CCF đượctrình bày chi tiết trong tài liệu ARIMA [37]
Trang 38-Xuất phát từ bản chất của hàm ACF và PACF, Box - Jenkin đã đưa ra một sốdạng biểu đồ thường gặp đối với hàm ACF và PACF, tương ứng với nó là các dạngcủa mô hình ARIMA nhằm hỗ trợ cho việc nhận dạng cấu trúc của mô hình, cácdạng biểu đồ này được trình bày trong hình 2.3 Chi tiết về cách áp dụng biểu đồnày được trình bày dưới đây:
Nếu biểu đồ hàm ACF có dạng nhỏ dần theo các bước trễ thời gian và biểu
đồ hàm PACF chỉ có giá trị khác 0 tại bước thời gian t-1, sau đó giảm đột
ngột về 0, (cụm từ „khác 0‟ hay „bằng 0‟ ở đây được hiểu theo thuật ngữ thống
kê, nếu các giá trị này nằm trong khoảng từ - t/ 2,n1*Sr đến + t/ 2,n1 * Sr
được xem là bằng 0, ngoài khoảng này được xem là khác 0 ) thì có một thông
số tự hồi qui (p=1) được chọn, mô hình có dạng ARIMA(1,0,0) Ngược lại,
khi biểu đồ hàm PACF tắt dần, hàm ACF có giá trị khác 0 bước t-1, sau đó
giảm đột ngột về 0, trong trường hợp này mô hình có dạng ARIMA(0,0,1).
Dáng điệu của hàm ACF và PACF trong các trường hợp này được minh họatrên hình (Hình 2.3a)
Tương tự như trên, nếu biểu đồ hàm ACF tắt dần, hàm PACF có giá trị khác
0 ở các bước thời gian t-1, t-2, sau đó giảm đột ngột về 0 thì mô hình có hai thông số tự
hồi qui (p=2), mô hình có dạng ARIMA(2,0,0) Ngược lại, nếu hàm PACF có dạng tắt
dần, hàm ACF có giá trị khác 0 ở các bước thời gian t-1, t-2, sau đó giảm đột ngột về 0
thì mô hình có hai thông số trung bình trượt (q=2), mô hình có dạng ARIMA(0,0,2) Đồ
thị của hạn ACF và PACF trong các trường hợp này được minh họa trên hình (Hình2.3b)
Khi biểu đồ hàm ACF có dạng tắt dần và có giá trị khác 0 ở các bước thờigian t-1, t-2…t-p, tương tự hàm hàm PACF có dạng tắt dần và có giá trị khác 0 ở cácbước thời gian t-1, t-2…t-q, trong trường hợp này cả 2 thành phần AR và MA đều có
trong mô hình, dạng của mô hình trong trường hợp này sẽ là ARIMA(p,0,q) Đồ thị của
hạn ACF và PACF trong các trường hợp này được minh họa trên hình (Hình 2.3c)
Trang 39(2.3b)
(2.3c)Hình 2.3 Một số dạng chính của hàm ACF và PACF tưng ứng với các dạng
mô hình ARIMA khác nhau [20]
Đối với việc xác định ảnh hưởng của từng chuỗi nhập đến yếu tố dự báotrong mô hình ARIMAX, Box Tao cũng sử dụng phương pháp trực quan để xem xét
sự biến đổi của hàm tương quan chéo (Cross correlation function - CCF), từ đó đưa
Trang 40ra hàm truyền tương ứng của chuỗi nhập X tham gia trong mô hình ARIMAX Nội dung của phương pháp có thể bao gồm 4 dạng chính sau:
(2.4A)
(2.4B)
(2.4C)
(2.4D)
Hình 2.4 Một số dạng chính của hàm tương quan chéo giữa biến nhập (X)
và biến phụ thuộc (Y) tưng ứng với các dạng mô hình ARIMA khác nhau [20]1) Nếu hàm tương quan chéo (CCF) giữa biến độc lập X và biến phụ thuộc Y
có giá trị „khác 0‟ tại bước thời gian (t-b), sau đó giảm đột ngột, các bước