LỜI CAM ĐOAN Được sự hướng dẫn của PGS.TS Trần Trọng Nguyên, luận văn Thạc sĩ chuyên ngành Toán ứng dụng với đề tài “Chuỗi thời gian không dừng và ứng dụng trong phân tích và dự báo kin
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
LUẬN VĂN THẠC SĨ TOÁN HỌC
Người hướng dẫn khoa học: PGS TS Trần Trọng Nguyên
HÀ NỘI, 2016
Trang 2Tác giả cũng xin bày tỏ lòng biết ơn chân thành tới Phòng Sau đại học, các thầy cô giáo dạy cao học trường Đại học Sư phạm Hà Nội 2 đã giúp đỡ tác giả trong suốt quá trình học tập và hoàn thành luận văn tốt nghiệp
Tác giả xin được gửi lời cảm ơn đến gia đình, bạn bè đã luôn ủng hộ, quan tâm để tác giả có thể hoàn thành luận văn
Hà Nội, tháng 6 năm 2016
TÁC GIẢ
Bùi Văn Bằng
Trang 3LỜI CAM ĐOAN
Được sự hướng dẫn của PGS.TS Trần Trọng Nguyên, luận văn Thạc sĩ
chuyên ngành Toán ứng dụng với đề tài “Chuỗi thời gian không dừng và ứng
dụng trong phân tích và dự báo kinh tế” được hoàn thành bởi sự nhận thức của
bản thân, số liệu và kết quả nghiên cứu trong luận văn này là trung thực không trùng với bất kỳ luận văn nào khác
Tôi cũng xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện luận văn này đã được cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ nguồn gốc
TÁC GIẢ
Bùi Văn Bằng
Trang 4MỤC LỤC
MỞ ĐẦU 1
1 Lý do chọn đề tài 1
2 Mục đích nghiên cứu 2
3 Nhiệm vụ nghiên cứu 2
4 Đối tượng và phạm vi nghiên cứu 2
5 Phương pháp và công cụ nghiên cứu 2
6 Kết cấu của luận văn 3
7 Đóng góp mới của luận văn 3
CHƯƠNG I: KIẾN THỨC CHUẨN BỊ 4
1.1 Quá trình ngẫu nhiên 4
1.2 Chuỗi thời gian 5
1.3 Kỳ vọng của biến ngẫu nhiên 5
1.4 Sai phân của chuỗi thời gian 6
1.5 Toán tử dịch chuyển lùi 7
1.6 Hiệp phương sai 8
1.7 Hàm tự tương quan 10
CHƯƠNG 2: CHUỖI THỜI GIAN KHÔNG DỪNG VÀ MÔ HÌNH TRUNG BÌNH TRƯỢT TÍCH HỢP TỰ HỒI QUY 18
2.1 Chuỗi thời gian không dừng 18
2.2 Một số quá trình ngẫu nhiên giản đơn 19
2.2.1 Nhiễu trắng 19
2.2.2 Bước ngẫu nhiên 20
2.2.3 Quá trình trung bình trượt (MA) 22
2.2.3.1 Quá trình trung bình trượt bậc nhất – MA(1) 22
2.2.3.2 Quá trình trung bình trượt bậc q – MA(q) 23
2.2.3.3 Quá trình trung bình trượt vô hạn– MA() 23
2.2.4 Quá trình tự hồi quy (AR) 24
2.2.4.1 Quá trình tự hồi quy bậc 1 - AR(1) không có hệ số chặn 24
Trang 52.2.4.2 Quá trình AR(1) có hệ số chặn 26
2.2.4.3 Quá trình tự hồi quy bậc p 28
2.3 Nhận biết tính dừng của chuỗi thời gian 30
2.3.1 Nhận biết qua đồ thị 30
2.3.2 Nhận biết qua biểu đồ tự tương quan 32
2.3.3 Kiểm định nghiệm đơn vị 35
2.3.3.1 Kiểm định Dickey- Fuller 35
2.3.3.2 Kiểm định Philips và Perron 41
2.4 Một số vấn đề về chuỗi thời gian không dừng 43
2.4.1 Hậu quả khi ước lượng mô hình chuỗi thời gian không dừng 43
2.4.2 Hồi quy giả mạo 44
2.4.3 Chuỗi dừng xu thế và dừng sai phân 49
2.4.4 Đồng tích hợp 49
2.4.4.1 Khái niệm đồng tích hợp 49
2.4.4.2 Kiểm định hồi quy đồng tích hợp 50
2.5 Loại bỏ tính không dừng trong chuỗi thời gian 52
2.6 Mô hình trung bình trượt tích hợp tự hồi quy ARIMA 54
2.6.1 Cách xây dựng mô hình ARIMA cho dữ liệu chuỗi thời gian 54
2.6.1.1 Mô hình tự hồi quy bậc 1 54
2.6.1.2 Mô hình trung bình trượt bậc 1 55
2.6.1.3 Các mô hình tự hồi quy bậc cao 55
2.6.1.4 Mô hình trung bình trượt bậc cao 56
2.6.1.5 Mô hình trung bình trượt và tự hồi quy ARMA 57
2.6.1.6 Mô hình trung bình trượt, tích hợp, tự hồi quy ARIMA 58
2.6.1.7 Mô hình ARIMA có yếu tố mùa vụ 59
2.6.2 Phương pháp Box-Jenkins 60
2.6.2.1 Định dạng mô hình - xác định các tham số d, p, q 60
2.6.2.2 Ước lượng mô hình 63
2.6.2.3 Kiểm định tính thích hợp của mô hình 65
2.6.2.4 Dự báo và sai số dự báo 65
Trang 6CHƯƠNG 3: ỨNG DỤNG CHUỖI THỜI GIAN KHÔNG DỪNG TRONG
PHÂN TÍCH VÀ DỰ BÁO KINH TẾ 67
3.1 Phân tích và dự báo kinh tế dựa vào dữ liệu chuỗi thời gian 67
3.2 Ứng dụng mô hình ARIMA trong phân tích và dự báo 71
3.2.1 Xác định vấn đề, thu thập dữ liệu 71
3.2.2 Phân tích sơ bộ 71
3.2.3 Lựa chọn và ước lượng mô hình 72
3.2.4 Đánh giá mô hình 79
3.2.5 Thực hiện phân tích và dự báo 81
3.2.6 Trình bày kết quả phân tích và dự báo 84
3.2.7 Theo dõi kết quả dự báo, cập nhật và đánh giá lại mô hình 84
3.3 Ưu nhược điểm của phương pháp dự báo bằng mô hình ARIMA 84
3.3.1 Ưu điểm 84
3.3.2 Nhược điểm 85
KẾT LUẬN 86
TÀI LIỆU KHAM KHẢO 87
PHỤ LỤC 88
Trang 7DANH MỤC BẢNG, BIỂU
Bảng 1.1: CPI của Việt Nam và các chuỗi sai phân 7
Bảng 2.1: Kiểm định ADF cho chuỗi GDP ước lượng theo mô hình 1 39
Bảng 2.2: Kiểm định ADF cho chuỗi GDP ước lượng theo mô hình 2 39
Bảng 2.3: Kiểm định ADF cho chuỗi GDP ước lượng theo mô hình 3 40
Bảng 2.4: Kiểm định ADF cho sai phân bậc nhất của chuỗi GDP 41
Bảng 2.5: Kiểm định Phillips và Perron cho chuỗi GDP 42
Bảng 2.6: Kết quả hồi quy LC theo LY 45
Bảng 2.7: Kiểm định nghiệm đơn vị với chuỗi LC 47
Bảng 2.8: Kiểm định nghiệm đơn vị với chuỗi LY 47
Bảng 2.9: Kiểm định nghiệm đơn vị với chuỗi LY khi thêm biến xu thế 48
Bảng 2.10: Kiểm định nghiệm đơn vị với phần dư sau khi hồi quy 50
Bảng 2.11: Kết quả hồi quy LC, LY theo phương trình 51
Bảng 2.12: Kiểm định nghiệm đơn vị với chuỗi D(S_LOGGDP) 53
Bảng 2.13: Đặc tính đồ thị của các mô hình AR, MA 57
Bảng 2.14: Bậc p, q của ARIMA 61
Bảng 2.15: Ước lượng các tham số 65
Bảng 3.1: Kiểm định nghiệm đơn vị về tính dừng của chuỗi S_LOGGDP 73
Bảng 3.2: Kiểm định nghiệm đơn vị về tính dừng của chuỗi sai phân bậc 1 76
Bảng 3.3: Kiểm định nghiệm đơn vị về tính dừng của chuỗi sai phân bậc 2 77
Bảng 3.4: Kết quả ước lượng mô hình theo ARIMA theo EQ01 78
Bảng 3.5: Kết quả ước lượng mô hình theo ARIMA theo EQ02 80
Bảng 3.6: Kết quả ước lượng mô hình theo ARIMA theo EQ03 80
Bảng 3.7: So sánh các mô hình 81
Bảng 3.8: Kết quả dự báo GDP quý I năm 2013 84
Trang 8DANH MỤC HÌNH
Hình 1.1: Lược đồ SACF và SPACF của chuỗi CPI 14
Hình 1.2: Biểu đồ hệ số tự tương quan và tự tương quan riêng 14
Hình 1.3: Biểu đồ hàm tự tương quan của chuỗi kim ngạch xuất khẩu 15
Hình 1.4: Biểu đồ hàm tự tương quan của chuỗi CPI theo quý 16
Hình 2.1: Đồ thị của chuỗi thời gian dừng, không dừng 19
Hình 2.2: Đồ thị sai phân bậc 2 của chuỗi CPI theo quý 30
Hình 2.3: Đồ thị sai phân bậc 2 của chuỗi CPI theo tháng 31
Hình 2.4: Đồ thị kim ngạch xuất khẩu hàng hóa của Việt Nam 32
Hình 2.5: Biểu đồ hàm tự tương quan của một chuỗi không dừng 33
Hình 2.6: Biểu đồ hàm tự tương quan của chuỗi kim ngạch xuất khẩu VN 33
Hình 2.7: Biểu đồ hàm tự tương quan của chuỗi GDP theo quý Việt Nam 34
Hình 2.8: Biểu đồ hàm tự tương quan chuỗi KNXK sau khi lấy sai phân 35
Hình 2.9: Biểu đồ GDP của Mỹ từ quý I năm 1970 đến quý IV năm 1980 38
Hình 2.10: Đồ thị biến LC, LY 46
Hình 3.1: Đồ thị chuỗi GDP của Việt Nam theo quý từ năm 1990 đến 2012 71
Hình 3.2: Đồ thị chuỗi LOGGDP 72
Hình 3.3: Đồ thị chuỗi S_LOGGDP 73
Hình 3.4: Biểu đồ hàm tự tương quan của chuỗi S_LOGGDP 74
Hình 3.5: Biểu đồ hàm tự tương quan sai phân bậc 1 chuỗi S_LOGGDP 75
Hình 3.6: Biểu đồ hàm tự tương quan sai phân bậc 2 chuỗi S_LOGGDP 77
Hình 3.7: Biểu đồ hàm tự tương quan của phần dư 79
Hình 3.8: Giá trị thực và dải biến động của giá trị dự báo 81
Hình 3.9: Đồ thị sai số dự báo của chuỗi LOGGDP 82
Hình 3.10: Đồ thị sai số dự báo của chuỗi GDP 83
Hình 3.11: Giá trị thực tế và giá trị dự báo của chuỗi GDP 83
Trang 9DANH MỤC CHỮ VIẾT TẮT
1 AIC Akaike information criterion Tiêu chuẩn thông tin
Akaike
2 ACF Autocorrelation function Hàm tự tương quan
3 ADF Augumented Dickey- Fuller Dickey- Fuller mở rộng
4 ARIMA Autoregressive interrated
6 CPI Consumer price index Chỉ số giá tiêu dùng
7 GDP Gross domestic product Tổng sản phẩm quốc nội
8 PACF Partial autocorrelation function Hàm tự tương quan riêng
9 SACF Sample autocorrelation function Hàm tự tương quan mẫu
Trang 10MỞ ĐẦU
1 Lý do chọn đề tài
Việt Nam đã và đang thiết lập nền kinh tế thị trường định hướng XHCN
Cơ chế quản lý kinh tế, tài chính đã và đang đổi mới sâu sắc, toàn diện với mục tiêu tăng trưởng với tốc độ cao, bền vững, xây dựng đất nước giàu mạnh Chính sách kinh tế phải được hoạch định phù hợp với điều kiện cụ thể của Việt Nam
Để có được những chính sách kinh tế năng động, hợp lý, có hiệu quả, dự báo kinh tế là một trong những công cụ hữu ích làm cơ sở khoa học có căn cứ để đưa
ra các quyết định và xây dựng các chính sách phù hợp
Ngày nay cùng với sự phát triển của khoa học công nghệ, có nhiều phương pháp dự báo định lượng, trong đó có phương pháp sử dụng các quá trình ngẫu nhiên đặc biệt là các mô hình chuỗi thời gian Các dữ liệu về chuỗi thời gian đã và đang được sử dụng một cách thường xuyên, hiệu quả và đáng tin cậy như một công cụ hữu hiệu để phân tích kinh tế, xã hội cũng như trong nghiên cứu khoa học
Có nhiều phương pháp dự báo kinh tế dựa vào dữ liệu chuỗi thời gian như: Mô hình hồi quy đơn phương trình; mô hình hồi quy phương trình đồng thời; mô hình tự hồi quy véc tơ (VAR); mô hình trung bình trượt tích hợp tự hồi quy ARIMA
Phân tích hồi quy dựa trên các dữ liệu chuỗi thời gian thường ngầm giả định rằng chuỗi thời gian đối tượng phải là dừng, nếu không các phương pháp kiểm định trở nên không đáng tin cậy Nhưng trong thực tế các mô hình kinh tế
vĩ mô thì chuỗi thời gian thường lại không dừng
Việc phát triển ứng dụng chuỗi dừng, chuỗi không dừng trong nghiên cứu, phân tích và dự báo kinh tế là một trong các phát triển đột phá của kinh tế học hiện đại vào cuối thế kỷ 20 Nhiều nghiên cứu, nhiều tác giả đều khởi nguồn khi nghiên cứu các chuỗi không dừng trong kinh tế
Trang 11Được sự gợi ý của thầy hướng dẫn và nhận thấy tính thiết thực của vấn đề,
em đã chọn đề tài “Chuỗi thời gian không dừng và ứng dụng trong phân tích
và dự báo kinh tế” để làm nội dung cho luận văn
2 Mục đích nghiên cứu
Tìm hiểu về lý thuyết chuỗi thời gian dừng, không dừng
Tìm hiểu phương pháp dự báo dựa vào dữ liệu chuỗi thời gian
Ứng dụng phân tích và dự báo một số chuỗi thời gian không dừng trong kinh tế
3 Nhiệm vụ nghiên cứu
Nghiên cứu về tính dừng, không dừng của chuỗi thời gian
Nghiên cứu các phương pháp kiểm định tính dừng của chuỗi thời gian
Nghiên cứu cách loại bỏ tính không dừng của dữ liệu chuỗi thời gian
Nghiên cứu các phương pháp dự báo dựa vào dữ liệu chuỗi thời gian trong đó tập trung vào mô hình trung bình trượt tích hợp tự hồi quy
Ứng dụng phân tích và dự báo một số chuỗi thời gian không dừng trong kinh tế
4 Đối tượng và phạm vi nghiên cứu
Các chuỗi thời gian dừng và không dừng
Tập trung vào các chuỗi thời gian trong kinh tế
5 Phương pháp và công cụ nghiên cứu
* Phương pháp nghiên cứu:
Phương pháp tiếp cận hệ thống: Phương pháp thống kê toán
Phương pháp thực nghiệm: Nghiên cứu các dữ liệu thực nghiệm theo thời gian, phân tích nhận diện vấn đề, sử dụng dữ liệu lịch sử để kiểm định các
mô hình
Trang 12 Phương pháp phân tích tổng hợp: Nghiên cứu dữ liệu, phân tích tổng hợp các quan điểm, qua đó chỉ ra sự vượt trội, giới hạn của từng phương pháp
Phương pháp mô hình hóa: Xác định, ước lượng và kiểm định các mô hình
* Công cụ nghiên cứu: Luận văn sử dụng các phần mềm Eviews, Excel để nhận dạng, ước lượng và kiểm định các tham số trong các mô hình cũng như độ phù hợp của mô hình
6 Kết cấu của luận văn
Ngoài phần mở đầu và kết luận, danh mục tài liệu tham khảo, , nội dung của luận văn được chia thành 3 chương sau:
Chương 1 Kiến thức chuẩn bị
Chương 2 Chuỗi thời gian không dừng và mô hình trung bình trượt tích hợp tự hồi quy
Chương 3 Ứng dụng chuỗi thời gian không dừng trong phân tích và dự báo kinh tế
7 Đóng góp mới của luận văn
Đưa ra mô hình dự báo tối ưu và có ý nghĩa thực tiễn
Trang 13CHƯƠNG I: KIẾN THỨC CHUẨN BỊ
Trong chương này giới thiệu một số kiến thức về kỳ vọng; phương sai và hiệp phương sai; sai phân của chuỗi thời gian; toán tử dịch chuyển lùi; hàm tự tương quan Đây là kiến thức cơ bản để nghiên cứu chuỗi thời gian không dừng 1.1 Quá trình ngẫu nhiên
Giả sử ta nghiên cứu sự tiến triển của một hệ vật chất nào đó theo thời gian Gọi Yt là vị trí (tình trạng) của hệ tại thời điểm t, Yt chính là một biến ngẫu nhiên mô tả vị trí (tình trạng) của hệ thống Quá trình Y t t 0
được gọi là một quá trình ngẫu nhiên
Tập hợp các vị trí (tình trạng) có thể của hệ là không gian trạng thái Định nghĩa 1.1: Họ Y , t t Tcác biến ngẫu nhiên nhận giá trị trên I được gọi là một quá trình ngẫu nhiên với tập chỉ số T và không gian trạng thái I
Giả sử T là một tập vô hạn nào đó Nếu với mỗi t T, Yt là biến ngẫu nhiên thì ta ký hiệu Y Y , t t T và gọi Y là hàm ngẫu nhiên (với tham biến
Trang 141.2 Chuỗi thời gian
Khái niệm 1.1: Chuỗi thời gian là một chuỗi số liệu được thu thập trong một thời kì hoặc một khoảng thời gian lặp lại như nhau trên cùng một đối tượng, một không gian một địa điểm
Với số liệu chuỗi thời gian ta thường sử dụng chỉ số t để chỉ thứ tự của các quan sát, chẳng hạn Xt, Yt,…, trong đó t = 1, 2, …, n Chuỗi thời gian có thể được thu thập theo đơn vị thời gian là năm, tháng, ngày hay chi tiết hơn như giờ, phút, …
Mặc dù chuỗi thời gian chỉ là một phép thử của một quá trình ngẫu nhiên, nhưng chúng cũng được gọi là quá trình ngẫu nhiên, ký hiệu là:
Yt với t = 1,2,
Đặc trưng của chuỗi thời gian là: tính xu hướng, tính mùa vụ, tính ngẫu nhiên và tính tương quan
1.3 Kỳ vọng của biến ngẫu nhiên
* Kỳ vọng của biến ngẫu nhiên
Kỳ vọng của biến ngẫu nhiên rời rạc Yt thường được kí hiệu là E(Y )t
Trang 15Kỳ vọng toán phản ánh giá trị trung tâm của phân phối xác suất theo biến ngẫu nhiên
Một số tính chất:
EX .E X ; const (1.3.5)
Với X, Y là 2 biến ngẫu nhiên thì: E X YE X E Y (1.3.6)
Với X, Y là 2 biến ngẫu nhiên độc lập thì:E X.Y E X E Y (1.3.7)
Ví dụ 1.1: Ta xét một số quá trình sau đây
Nếu Yt Yt 1 ut, với E u t 0 thì E Y t E Y t 1 E u t E Y t 1 Nếu Yt ut, với E u t 0 thì E Y t E utE E u t NếuYt t ut, E u t 0 thì E Y t E t utE t E u t t
Sai phân bậc nhất của chuỗi Yt trễ 1 thời kỳ, kí hiệu là D(Yt) hay ∆Yt
được tính như sau: ∆Yt = Yt – Yt-1 (1.4.1)
Sai phân bậc 2 của chuỗi Yt trễ 1 thời kỳ, kí hiệu là D2(Yt) hoặc ∆2Yt :
∆2Yt = ∆Yt – ∆Yt-1 Sai phân bậc d của chuỗi Yt, kí hiệu là Dd(Yt) hoặc ∆dYt:
∆dYt = ∆d-1Yt – ∆d-1Yt-1 (1.4.2)
Trang 16Khi nói sai phân bậc d của một chuỗi ta hiểu là d lần lấy sai phân trễ 1 thời kỳ cho một chuỗi dữ liệu nào đó
Sai phân bậc 1 của chuỗi Yt trễ k thời kỳ:
Ví dụ 1.2: Chuỗi sai phân được lập từ một chuỗi số liệu gốc
Bảng 1.1: CPI của Việt Nam và các chuỗi sai phân
Tháng CPI Sai phân bậc
1 trễ 1 thời kỳ
Sai phân bậc
1 trễ 2 thời kỳ
Sai phân bậc 2 trễ 1 thời kỳ
1.5 Toán tử dịch chuyển lùi
Một cách ký hiệu rất hữu ích khi xem xét sự dịch chuyển lùi (trễ) của chuỗi thời gian là toán tử L tác động lên chuỗi Yt, viết là: LYt = Yt-1
Công thức đó được hiểu là toán tử L làm dữ liệu Yt dịch chuyển lùi về phía quá khứ một thời kỳ Hai lần L sẽ dịch chuyển Yt lùi về quá khứ hai thời kỳ: L(LYt) = L2Yt = Yt-2
Tổng quát: k
t t k
L Y Y , k là một số nguyên bất kỳ (1.5.1)
Trang 17Đối với chuỗi dữ liệu theo tháng, nếu chúng ta muốn xem xét sự thay đổi của quan sát so với giá trị của cùng kỳ năm trước, chúng ta sử dụng ký hiệu L12,
và ký hiệu là L12Yt = Yt-12
Ký hiệu dịch chuyển lùi rất tiện dụng khi mô tả một quá trình lấy sai phân Sai phân bậc nhất trễ một thời kỳ có thể được viết thành
Yt’ = Yt – Yt-1 = Yt – LYt = (1 – L)Yt Chú ý rằng sai phân bậc nhất trễ một thời kỳ ký hiệu là (1 – L) Tương tự, nếu ta lấy sai phân bậc hai (trễ một thời kỳ):
Yt” = (Yt’ – Y’t-1) = (Yt – Yt-1) – (Yt-1 – Yt-2) = Yt – 2Yt-1 + Yt-2 = (1 – 2L + L2)Yt
Như vậy: Yt” = (1 – L)2Yt
Chú ý rằng sai phân bậc hai được ký hiệu là (1 – L)2 Điều quan trọng là sai phân bậc hai khác với sai phân trễ hai thời kỳ (được ký hiệu là 1 – L2) Tương tự, sai phân trễ 12 thời kỳ phải được ký hiệu là 1 – L12, còn sai phân bậc
12 (tức là 12 lần lấy sai phân) sẽ được ký hiệu là (1 – L)12
Sai phân bậc d của chuỗi Yt có thể ký hiệu ngắn gọn là: (1 – L)dYt
Nếu lấy sai phân trễ một thời kỳ của chuỗi Yt sau khi đã lấy sai phân theo mùa vụ thì có thể ký hiệu là (1 – L)(1 – Ls)Yt
Ký hiệu dịch chuyển lùi rất tiện dụng bởi vì ký hiệu này có thể nhân với nhau theo cách tính toán học để thấy được ảnh hưởng kết hợp Chẳng hạn,
(1 – L)(1 – Ls)Yt = (1 – L – Ls + Ls+1)Yt = Yt – Yt-1 – Yt-s + Yt-s+1
1 L Y 1 L L L Y L Y với 1
1.6 Hiệp phương sai
* Phương sai: Thước đo lường sự tập trung của các giá trị có thể có của một biến ngẫu nhiên xung quanh giá trị trung bình của nó
Phương sai của biến ngẫu nhiên Yt, là kỳ vọng của bình phương sai lệch của biến ngẫu nhiên so với kỳ vọng toán của nó, kí hiệu var(Y )t :
Trang 18Phương sai phản ánh mức độ phân tán của các giá trị của biến ngẫu nhiên
so với giá trị trung tâm của kỳ vọng toán Phương sai càng nhỏ thì các giá trị càng tập trung ở giá trị gần trung tâm
Tính chất:
var( X) var X ; const (1.6.5)
Với X, Y là 2 biến ngẫu nhiên độc lập thì:
Khi tính phương sai để thuận tiện ta hay dùng công thức:
var aXbY a var X b var Y 2ab cov X, Y (1.6.8)
* Độ lệch chuẩn: Độ lệch chuẩn của biến ngẫu nhiên Yt , ký hiệu là sd(Y )t hay
Trang 19Khi xét đồng thời hai biến ngẫu nhiên X và Y, cần quan tâm đến hiệp phương sai, ký hiệu là cov(X,Y), được định nghĩa bởi công thức sau:
cov X, Y E X Y với X E X ; Y E Y (1.6.10) Công thức (1.6.10) có thể viết thành: cov X, Y E X.Y x Y (1.6.11) Khi X và Y là hai biến ngẫu nhiên độc lập thì theo (1.3.7) ta có:
cov(X, Y) E X.Y E X E Y 0 Tính chất:
cov aX, bY ab cov X, Y (1.6.13) Hàm hiệp phương sai đối với chuỗi Yt là chuỗi vô hạn các hiệp phương sai:
Y t Y t k cov(Y , Yt ) E
* Hệ số tự tương quan giữa Yt và Yt-k là: k
k 0
Trang 20
kk corr Y , Yt t k Y , Y , ,Yt 1 t 2 t k 1
Sử dụng công thức Yule - Walker để tính truy hồi kk
* Hàm tự tương quan mẫu (SACF), kí hiệu
k
Giả sử rằng có một mẫu kích thước n, (Y , Y , Y )1 2 n , từ đây sẽ tính được
i 1 k
1 2SE
Trang 21n 2 t
t 1
yvar(Y )
t 1
y ySACF(k)
t k
Y người ta còn tính hệ số tự tương quan riêng mẫu của Yt và Yt k
* Hàm tự tương quan riêng mẫu (SPACF), kí hiệu kk
Công thức đệ quy của Durbin:
Ví dụ 1.3: Cho CPI theo tháng của Việt Nam từ tháng 1 năm 1995 đến tháng 12
năm 2007, n=156 (phụ lục 1) Hãy tính ACF(k) và PACF(k), k=1, 2, 3
Trang 22t 1
y yACF(k)
và vẽ lược đồ tương quan tương ứng (Hình 1.1)
* Lược đồ tương quan: Các SACF, SPACF được trình bày bằng một biểu đồ gọi là lược đồ tương quan (correlogram), lược đồ tương quan mẫu vẽ các k và
kk
tương ứng với các độ trễ khác nhau
Thanh đầu của bảng trong Hình 1.1 (Autocorrelation) là biểu đồ của hàm
tự tương quan của chuỗi tương ứng với các độ trễ k được trình bày ở cột thứ 3
Các giá trị tương ứng được trình bày ở cột AC Hệ số tự tương quan riêng k
kk
được trình bày ở cột PAC (Partial Auto-Correlation) và biểu đồ của nó được trình bày trong thanh thứ hai của bảng
Trang 23Hình 1.1: Lược đồ SACF và SPACF của chuỗi CPI
Trong Hình 1.1 các đường nét đứt chính là ranh giới xác định một hệ số tự tương quan có ý nghĩa thống kê hay không ở mức tin cậy 95% Những giá trị
Trang 24Nhìn Hình 1.2 chúng ta thấy rằng mức độ tương quan giữa các giá trị CPI cách nhau 1, 2, 3, 4 thời kỳ là khá cao Tiếp theo, hệ số tương quan tại các độ trễ
12 và 24 khá cao trong khi hệ số tương quan khác tại các độ trễ lớn hơn 4 đều gần 0 Điều này cho thấy chuỗi có tính mùa vụ, giữa các quan sát cách nhau 12
và bội số của 12 thời kỳ có tính tương quan cao
Biểu đồ trong Hình 1.3 cho thấy các hệ số tự tương quan ở các độ trễ từ 1 đến 36 đều có ý nghĩa thống kê Độ lớn của các hệ số tự tương quan giảm dần chứng tỏ các quan sát gần nhau có ảnh hưởng đến nhau chặt chẽ hơn so với các quan sát ở xa Đây là một chuỗi có xu thế
Hình 1.3: Biểu đồ hàm tự tương quan của chuỗi kim ngạch xuất khẩu
Với chuỗi ngẫu nhiên, các quan sát ở mỗi thời kỳ không có liên hệ với nhau ở bất kỳ độ trễ nào Như vậy về lý thuyết, các hệ số tự tương quan của chuỗi ở mọi độ trễ đều bằng 0 Tuy nhiên, trong thực tế, các quan sát của một chuỗi ít nhiều đều có tương quan với nhau Vì thế, biểu đồ tự tương quan của chuỗi ngẫu nhiên thường có các hệ số tự tương quan khác 0 chút ít, nhưng đều không có ý nghĩa thống kê (nằm trong phần đường nét đứt)
Trang 25Hình 1.4: Biểu đồ hàm tự tương quan của chuỗi CPI theo quý
Nhìn vào Hình 1.4 ta thấy các hệ số tự tương quan của chuỗi đều không
có ý nghĩa thống kê ở mức 95% Do vậy, chuỗi này là ngẫu nhiên
* Kiểm định hệ số tương quan
+) Tiêu chuẩn Barlett
Giả thiết cần kiểm định: H :0 k 0 ; H :1 k 0
thì ta chấp nhận giả thiết H0, với mức ý nghĩa
Ta đã biết các SACF được trình bày bằng một biểu đồ gọi là lược đồ tương quan (correlogram), lược đồ này vẽ các k
k
xấp xỉ bằng 2 / n (n là kích thước mẫu hay số quan sát)
Kiểm định Bartlett trên đây mới đưa ra kết luận về từng hệ số tương quan Pierce đã đưa ra kiểm định về sự bằng 0 đồng thời của các hệ số tự tương quan
Trang 26Box-+) Tiêu chuẩn Box-Pierce (thống kê Q)
H : 0;
m 2
+) Tiêu chuẩn Ljung- Box (thống kê LB)
Một dạng khác của Q là thống kê Ljung- Box (LB)
2 m
2 k
Trang 27CHƯƠNG 2: CHUỖI THỜI GIAN KHÔNG DỪNG VÀ MÔ HÌNH
TRUNG BÌNH TRƯỢT TÍCH HỢP TỰ HỒI QUY Trong chương trước đã đề cập đến những kiến thức quan trọng để phân tích động thái của chuỗi thời gian Chương này sẽ giới thiệu các khái niệm về chuỗi dừng, chuỗi không dừng; điều kiện dừng của một số quá trình ngẫu nhiên giản đơn; các kiểm định để xem một chuỗi thời gian có dừng hay không Sau đó
sẽ phân biệt sự khác nhau giữa chuỗi thời gian với xu hướng dừng và chuỗi thời gian dừng với sai phân Một vấn đề thường gặp trong lĩnh vực hồi quy liên quan đến dữ liệu chuỗi thời gian là hiện tượng hồi quy giả mạo và hậu quả khi ước lượng mô hình với dữ liệu chuỗi thời gian không dừng Từ đó ta bàn đến cách loại bỏ tính không dừng trong chuỗi thời gian Chương này cũng nghiên cứu mô hình chuỗi thời gian một biến số ARIMA, phương pháp Box-Jenkins Đây là mô hình cơ bản được sử dụng rộng rãi trong dự báo chuỗi thời gian đặc biệt là dự báo các chuỗi vĩ mô trong thị trường tài chính tiền tệ
2.1 Chuỗi thời gian không dừng
Chuỗi Yt được gọi là chuỗi thời gian dừng nếu kì vọng, phương sai và hiệp phương sai không đổi theo thời gian, nghĩa là:
tE(Y ) , t
cov(Y , Y )cov(Y , Y )cov(Y , Y ) cov(Y , Y )
Trang 28không đổi, nhưng cov(Y , Y )t t 5 có thể khác với cov(Y , Y )t t 6
Hình ảnh minh họa cho chuỗi thời gian dừng, không dừng:
Hình 2.1: Đồ thị của chuỗi thời gian dừng, không dừng
2.2 Một số quá trình ngẫu nhiên giản đơn
Trang 29 t
2 t
Đôi khi điều kiện (2.2.1.3) được thay bằng điều kiện mạnh hơn:
u , ut độc lập với nhau với t (2.2.1.4)
Quá trình thỏa mãn (2.2.1.1), (2.2.1.2), (2.2.1.3) được gọi là nhiễu trắng độc lập
Nếu các điều kiện (2.2.1.1), (2.2.1.2) và (2.2.1.4) được thỏa mãn và
2
t
u N(0, ) thì quá trình ngẫu nhiên đó được gọi là nhiễu trắng Gauss
Từ điều kiện (2.2.1.4) suy ra (2.2.1.3) nhưng điều ngược lại không đúng
Nhiễu trắng là một chuỗi dừng
2.2.2 Bước ngẫu nhiên
Chuỗi Yt được gọi là bước ngẫu nhiên nếu:
Trang 30Áp dụng tính chất phương sai ta suy ra:var(Y )t t 2 Điều trên chứng tỏ bước ngẫu nhiên là chuỗi không dừng
+) Hiệp phương sai:
Ta có: Yt = Yt-1 + ut nhân 2 vế với Yt-1 ta được:
var(Y )t t
+) Xét sai phân bậc nhất của chuỗi Yt
Sai phân bậc nhất của Yt: ∆Yt = Yt – Yt-1 = ut Trong trường hợp này ∆Yt là chuỗi dừng (vì ut là nhiễu trắng)
+) Nếu đưa thêm vào mô hình bước ngẫu nhiên một hằng số, thì Yt được gọi là bước ngẫu nhiên có bụi:
Yt = α + Yt-1 + ut , với ut là nhiễu trắng (2.2.2.1) Tương tự ta có: Yt = αt + Y0 + u1 + u2…+ ut
Sử dụng tính chất của kỳ vọng, phương sai với lưu ý 2
E u 0; var u ta tính được:
0
E(Y )t Y t
2var(Y )t t
Điều này chứng tỏ bước ngẫu nhiên có bụi không dừng
Trang 312.2.3 Quá trình trung bình trượt (MA)
2.2.3.1 Quá trình trung bình trượt bậc nhất – MA(1)
Quá trình trung bình trượt MA(1) có dạng:
Y u u với ut là nhiễu trắng (2.2.3.1) +) Kỳ vọng: Vì ut là nhiễu trắng nên E u t 0
t t t 1 t t 1
E Y E u u E E u E u +) Phương sai:
cov Y , Y
0var Y
Trang 322.2.3.2 Quá trình trung bình trượt bậc q – MA(q)
Quá trình trung bình trượt bậc q – MA(q) có dạng:
Y u u u , t = 1, 2, 3,…,n (2.2.3.2.1) trong đó: ut là nhiễu trắng
+) Phương sai: 2 2 2
var Y 1 +) Hiệp phương sai:
q k 2
i i k t
Các điều kiện được thỏa mãn do vậy MA(q) đều là quá trình dừng
2.2.3.3 Quá trình trung bình trượt vô hạn– MA()
Quá trình trung bình trượt MA() có dạng:
Trang 33Với quá trình (2.2.3.3.1) dễ dàng chứng minh được điều kiện để chuỗi
Trung bình, hiệp phương sai của quá trình MA() với các hệ số có thể tính tổng theo giá trị tuyệt đối như sau:
2.2.4 Quá trình tự hồi quy (AR)
2.2.4.1 Quá trình tự hồi quy bậc 1 - AR(1) không có hệ số chặn
Quá trình tự hồi quy AR(1) có dạng:
Y Y u , ut là nhiễu trắng (2.2.4.1.1)
Ta thấy bước ngẫu nhiên là trường hợp đặc biệt của quá trình tự hồi quy AR(1)
Trang 34Với 1thì ta có:
2 t 2
1 ( )var(Y )
cov(Y , Y ) cov Y , Y u var Y cov Y , u
var(Y )
Từ kết quả trên ta có thể rút ra các kết luận dưới đây:
i) Trong trường hợp 1 thì Y1 t không thỏa mãn điều kiện dừng, do E(Yt) và var(Yt) phụ thuộc t Tuy nhiên khi t đủ lớn thì (2.2.4.1.2), (2.2.4.1.3) và (2.2.4.1.5) có dạng:
t t
lim E(Y ) 0
Trang 35 Khi 1 thì quá trình AR(1) là chuỗi dừng
Khi 1 thì quá trình AR(1) là chuỗi không dừng
Khi thì quá trình AR(1) là bước ngẫu nhiên 1
2.2.4.2 Quá trình AR(1) có hệ số chặn
Biểu diễn của Y như sau:
Y Y u , với ut là nhiễu trắng (2.2.4.2.1) Xét: Y1 Y0 u1
Trang 362 t 1 t
E(Y ) (1 ) vì E u t E u t 1 0 do ut là nhiễu trắng
TH2: Khi 1, thì
t 1 i
nếu thì 1 Yt là bước ngẫu nhiên, E(Y )t Y0 t
+) Hiệp phương sai: k cov(Y , Y )t y k ;
Trang 37cov(Y , Y )
E (Y )(Y )
E ( (Y ) u )(Y )E( (Y ) E(u (Y )var Y E u 0 Y 0var Y cov u , Y
k 0
ACF(k)
(2.2.4.2.3) 2.2.4.3 Quá trình tự hồi quy bậc p
Quá trình tự hồi quy bậc p có dạng:
Trang 38Ta có: (L)Yt 0 ut
Điều kiện để phương trình AR(p) hội tụ là: 1 i 1, i 1, 2, , p
Phương trình đặc trưng đối với AR(p): p
1 z z 0 (2.2.4.3.2) Điều kiện để chuỗi Yt tuân theo AR(p) trong phương trình (2.2.4.3.1) có tính dừng là phương trình đặc trưng (2.2.4.3.2) có tất cả các nghiệm z thỏa mãn
i
z 1 Điều kiện cần, nhưng chưa đủ, là
p i
Y Y Y Y unhân hai vế của phương trình với Y t rồi lấy kì vọng hai vế ta được:
Trang 39Nhân hai vế (Yt ) với (Yt k ), sau đó lấy kỳ vọng ta được phương trình Yule-Walker:
2 k
Điều này hàm ý hàm tự tương quan của bất kì chuỗi AR(p) dừng nào đều
có đặc điểm k 0 khi k Các quan sát ở xa nhau hầu như không tương quan với nhau
2.3 Nhận biết tính dừng của chuỗi thời gian
-40 -30 -20 -10 0 10 20
90 92 94 96 98 00 02 04 06 08 10 12 14
CPI_DIF
Hình 2.2: Đồ thị sai phân bậc 2 của chuỗi CPI theo quý
Trang 40+) Nếu đồ thị biểu diễn chuỗi cho thấy không có sự thay đổi rõ ràng trong phương sai, chúng ta nói rằng chuỗi là dừng ở phương sai
Hình 2.3: Đồ thị sai phân bậc 2 của chuỗi CPI theo tháng
Ví dụ 2.2: Hình 2.3 là biểu diễn của chuỗi sai phân bậc 2 của chuỗi CPI theo tháng của Việt Nam tính theo phương pháp so với cùng kỳ năm trước (ký hiệu trong đồ thị là CPI_DIF2) Giá trị của chuỗi dao động quanh mức trung bình bằng 0 và không thay đổi theo thời gian Tuy nhiên, phương sai của cả chuỗi thay đổi Ta nói, chuỗi này dừng ở trung bình nhưng không dừng ở phương sai Tuy nhiên, nếu đem chia nhỏ chuỗi đó thành ba chuỗi ứng với 3 giai đoạn: trước tháng 1/2002, từ tháng 1/2002 đến tháng 1/2008 và sau tháng 1/2008, thì chúng ta sẽ thấy ba bộ phận của chuỗi ban đầu lại là các chuỗi dừng
ở cả trung bình và phương sai
Ví dụ 2.3: Chuỗi số liệu về xuất khẩu hàng hóa theo tháng của Việt Nam được biểu diễn ở Hình 2.4 là một chuỗi không dừng Đồ thị cho thấy chuỗi có xu thế và dao động mạnh hơn vào thời kỳ từ sau khi Việt Nam gia nhập WTO (năm 2007) Do vậy, chuỗi không dừng cả ở trung bình và ở phương sai