Ý nghĩa khoa học Luận văn được trình bày có hệ thống với các mục rõ ràng chặt chẽ về Phântích chuỗi thời gian và ứng dụng.. Vì bản chất thứ tự của chuỗi số nên với số liệu chuỗi thời gia
Trang 1LUẬN VĂN THẠC SĨ KHOA HỌC
Người hướng dẫn khoa học
TS LÊ VĂN DŨNG
Đà Nẵng - Năm 2015
Trang 2LUẬN VĂN THẠC SĨ KHOA HỌC
Người hướng dẫn khoa học
TS LÊ VĂN DŨNG
Đà Nẵng - Năm 2015
Trang 3Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi Các kếtquả nêu trong luận án là trung thực và chưa từng được ai công bố trong bất kìcông trình nào khác.
Tác giả
Phan Thị Thanh Nhạn
Trang 4MỞ ĐẦU 1
1 Lí do chọn đề tài 1
2 Mục đích nghiên cứu 1
3 Đối rượng và phạm vi nghiên cứu 2
4 Phương pháp nghiên cứu 2
5 Ý nghĩa khoa học 2
6 Cấu trúc luận văn 2
CHƯƠNG 1 KIẾN THỨC CƠ SỞ 4
1.1 XÁC SUẤT VÀ BIẾN NGẪU NHIÊN 4
1.1.1 Xác suất 4
1.1.2 Biến ngẫu nhiên 4
1.2 CÁC THAM SỐ ĐẶC TRƯNG CỦA BIẾN NGẪU NHIÊN 5
1.2.1 Kỳ vọng toán 5
1.2.2 Phương sai 6
1.2.3 Độ lệch tiêu chuẩn 6
1.3 HIỆP PHƯƠNG SAI, HỆ SỐ TƯƠNG QUAN 7
CHƯƠNG 2 CHUỖI THỜI GIAN VÀ MỘT SỐ MÔ HÌNH CHUỖI THỜI GIAN 8
2.1 GIỚI THIỆU VỀ CHUỖI THỜI GIAN 8
2.1.1 Khái niệm chuỗi thời gian 8
2.1.2 Tính chất chuỗi thời gian 9
2.2 NHIỄU TRẮNG 9
2.3 QUÁ TRÌNH TUYẾN TÍNH 11
2.4 QUÁ TRÌNH HỒI QUY TUYẾN TÍNH 11
2.4.1 Ước lượng tham số 12
2.4.2 Tính chất của các ước lượng và bài toán suy diễn thống kê 16
Trang 5gian 17
2.4.4 Dự báo quá trình hồi quy tuyến tính 21
2.5 QUÁ TRÌNH DỪNG 22
2.6 QUÁ TRÌNH TRUNG BÌNH TRƯỢT 23
2.7 QUÁ TRÌNH TỰ HỒI QUY 27
2.8 QUÁ TRÌNH TRUNG BÌNH TRƯỢT TỰ HỒI QUY 34
2.9 QUÁ TRÌNH TRUNG BÌNH TRƯỢT TÍCH HỢP TỰ HỒI QUY 37
2.10 HÀM TỰ TƯƠNG QUAN RIÊNG 37
2.11 ƯỚC LƯỢNG THAM SỐ 38
2.11.1 Ước lượng hàm hiệp phương sai và hàm tự tương quan 39
2.11.2 Ước lượng hàm tự tương quan riêng 39
2.11.3 Ước lượng tham số quá trình tự hồi quy A(p) 39
2.12 BÀI TOÁN DỰ BÁO 40
CHƯƠNG 3 ỨNG DỤNG MÔ HÌNH CHUỖI THỜI GIAN VÀ DỰ BÁO 45
3.1 THÔNG TIN SỐ LIỆU 45
3.2 ÁP DỤNG MÔ HÌNH HỒI QUY TUYẾN TÍNH CHUỖI THỜI GIAN 46
3.3 ÁP DỤNG MÔ HÌNH ARIMA 52
KẾT LUẬN VÀ KIẾN NGHỊ 63
TÀI LIỆU THAM KHẢO 64 QUYẾT ĐỊNH GIAO ĐỀ TÀI( BẢN SAO)
PHỤ LỤC
Trang 6AIC Akaike Information Criterion
MAE Mean Absolute Error
MAPE Mean Abs Percent Error
OLS Ordinary Least Squares
RMSE Root Mean Squared Error
VNM Vinamilk
Trang 7Số hiệu hình vẽ Tên hình vẽ Trang
Hình 3.1 Ước lượng mô hình
hồi quy theo X2t, X3t 41
Hình 3.2 Ước lượng lại mô hình
hồi quy theo X2t, X3t vớiβ1 = 0 42
Hình 3.3 Ước lượng phần dư với tương quan bậc 2 43Hình 3.4 Ước lượng lại phần dư với tương quan bậc 1 44
Hình 3.5 Khắc phục hiện tượng tự tương quan bậc 1,
ước lượngYt+1∗ theoX2t∗, X3t∗ 45
Hình 3.6 Đánh giá chất lượng dự báo
chỉ số giá mở cửa của VNM 47
Hình 3.12 Biểu đồ tương quan và
Hình 3.13 Biểu đồ kiểm tra tính dừng của chuỗi phần dư 54Hình 3.14 Biểu đồ tự tương quan của chuỗi phần dư 55Hình 3.15 Ước lượng∆Xt theo mô hình
Arima(p,d,q) với:p = q = 0, d = 1 56
Trang 8MỞ ĐẦU
1 Lí do chọn đề tài
Ngày nay, Xác suất thống kê là môn học cơ sở được giảng dạy trong cáctrường đại học, cao đẳng Không những thế nó còn được ứng dụng nhiều trongcác ngành như kinh tế, kỹ thuật, sinh học, y học, Nó giúp chúng ta cách tổchức chỉ đạo, sản xuất, phân phối lưu thông, góp phần dự báo kinh tế, đánh giáchất lượng sản phẩm, năng suất lao động, thu nhập và xử lý một khối lượng lớn
số liệu thông tin,
Phân tích chuỗi thời gian là một phần khá thú vị và hữu ích trong phânmôn này Nó không chỉ là công cụ hữu hiệu để phân tích trong kinh tế, xã hộicũng như trong các nghiên cứu khoa học kĩ thuật mà còn đặt ra BÀI TOÁN
DỰ BÁO gây được sự chú ý của các nhà kinh tế học, xã hội học
Trong đời sống, việc quan sát, phân tích nhận định, dự báo kết quả để đưa
ra quyết định đúng đắn và kịp thời đóng vai trò quan trọng, quyết định sự thànhbại trong kinh doanh, sản xuất, nghiên cứu khoa học
Dự báo còn là một nhu cầu không thể thiếu cho những hoạt động của conngười trong bối cảnh bùng nổ thông tin Dự báo sẽ cung cấp những cơ sở cầnthiết cho các hoạch định, và có thể nói rằng nếu không có khoa học dự báo thìnhững dự định tương lai của con người vạch ra sẽ không có sự thuyết phục đángkể
Với các lí do trên, dưới sự hướng dẫn của thầy giáo Lê Văn Dũng, tôi quyết
định chọn đề tài nghiên cứu: Phân tích chuỗi thời gian và ứng dụng cho luận
văn tốt nghiệp thạc sĩ của mình
Trang 93 Đối tượng và phạm vi nghiên cứu
3.1 Đối tượng nghiên cứu:
• Các đặc trưng của chuỗi thời gian
• Một vài ứng dụng của chuỗi thời gian
3.2 Phạm vi nghiên cứu: Các khái niệm, định nghĩa, định lý liên quan
4 Phương pháp nghiên cứu
Cơ bản sử dụng phương pháp nghiên cứu tài liệu( sách, báo, và các tài liệutrên internet có liên quan tới đề tài của luận văn) để thu thập thông tin nhằm hệthống lại các vấn đề lý thuyết một cách logic
Để thuận tiện cho việc nghiên cứu và soạn thảo luận văn này, tôi sử dụngphần mềm latex để thực hiện, vì Latex là một phần mềm tương đối dễ sử dụng
và rất linh hoạt trong việc tìm và sửa lỗi Và đặc biệt là phần mềm miễn phí.Bên cạnh đó tôi còn sử dụng phần mềm EXCEL để tính toán và phầnmềm EViews 6 để phác họa sự ảnh hưởng các yếu tố của chuỗi thời gian lênhiện tượng khảo sát
Thu thập các bài báo khoa học, các tài liệu liên quan đến đề tài
Tham khảo các tài liệu trên mạng Internet
5 Ý nghĩa khoa học
Luận văn được trình bày có hệ thống với các mục rõ ràng chặt chẽ về Phântích chuỗi thời gian và ứng dụng Bên cạnh đó, luận văn còn đưa ra ví dụ ápdụng thực tế và một số bài toán dự báo
Hi vọng luận văn này có thể được sử dụng như một tài liệu tham khảo hữuích cho sinh viên các trường Đại học, Cao đẳng
6 Cấu trúc luận văn
Bố cục bao gồm 3 chương :
• Chương 1: Kiến thức cơ sở
1.1 Xác suất và biến ngẫu nhiên
Trang 101.2 Các tham số của biến ngẫu nhiên.
1.3 Hiệp phương sai, hệ số tương quan
• Chương 2: Chuỗi thời gian và một số mô hình chuỗi thời gian
2.1 Giới thiệu về chuỗi thời gian
2.2 Nhiễu trắng
2.3 Qúa trình tuyến tính
2.4 Qúa trình hồi quy tuyến tính
2.5 Qúa trình dừng
2.6 Qúa trình trung bình trượt
2.7 Qúa trình tự hồi quy
2.8 Qúa trình trung bình trượt tự hồi quy
2.9 Qúa trình trung bình trượt tích hợp tự hồi quy
2.10 Hàm tự tương quan riêng
2.11.Ước lượng tham số
2.12 Bài toán dự báo
• Chương 3: Ứng dụng mô hình chuỗi thời gian
3.1 Thông tin số liệu
3.2 Áp dụng mô hình hồi quy tuyến tính chuỗi thời gian
3.3 Áp dụng mô hình ARIMA
Do thời gian thực hiện khóa luận không nhiều, kiến thức còn hạn chế nênkhi làm khóa luận không tránh khỏi những hạn chế và sai sót Tôi mong nhậnđược sự góp ý của quý thầy cô và các bạn
Trang 11CHƯƠNG 1
KIẾN THỨC CƠ SỞ
1.1 XÁC SUẤT VÀ BIẾN NGẪU NHIÊN
1.1.1 Xác suất
ChoΩ là một tập khác rỗng,F là mộtσ-đại số trênΩ Một hàm tập hợp
P :F →R được gọi là độ đo xác suất nếu thoã mãn 3 điều kiện sau:
+ Với mọi A ∈ F, 0≤P(A)≤1
1.1.2 Biến ngẫu nhiên
Định nghĩa 1.1.1 Cho không gian xác suất(Ω, F , P ) Ánh xạX : Ω →
R được gọi là biến ngẫu nhiên nếu X là hàm đo được, tức là với mọi a ∈ R,{ω ∈ Ω : X(ω) < a} ∈ F
Định nghĩa 1.1.2 (Hàm phân phối xác suất) Cho biến ngẫu nhiênX, hàm
sốF (x) = P (X < x), x ∈ R được gọi là hàm phân phối xác suất của X
Định nghĩa 1.1.3 (Biến ngẫu nhiên độc lập) Cho n biến ngẫu nhiên
X1, , Xn xác định trên cùng một không gian mẫu có các hàm phân phối xácsuất lần lượt làF1(x), , Fn(x) Ta nói các biến ngẫu nhiên X1, , Xn độc lậpnếu với mọix1, , xn ∈ R ta có
P (X1 < x1, , Xn < xn) = F1(x1) Fn(xn)
Trang 12Định nghĩa 1.1.4 (Biến ngẫu nhiên rời rạc và biến ngẫu nhiên liên tục) Ta
gọi X là biến ngẫu nhiên rời rạc, nếu nó có miền giá trị hữu hạn hoặc vô hạnđếm được Nếu biến ngẫu nhiênX có miền giá trịx1, x2, , xn thì bảng số
P P (X = x1) P (X = x2) P (X = xn)
được gọi là bảng phân phối xác suất biến ngẫu nhiên X
Biến ngẫu nhiên X được gọi là biến ngẫu nhiên liên tục nếu tồn tại một
hàm sốf :R → R khả tích không âm sao cho với mọi y ∈ R,
F (y) =
Z y
−∞
f (x)dx,
trong đó :F (y) là hàm phân phối củaX
Khi đó,f (x)được gọi là hàm mật độ củaX
1.2 CÁC THAM SỐ ĐẶC TRƯNG CỦA BIẾN NGẪU NHIÊN
Trang 13Cho biến ngẫu nhiên X, số V ar(X) = E(X − E(X))2 được gọi là
phương saicủa biến ngẫu nhiênX
+ Nếu biến ngẫu nhiên rời rạc X có bảng phân phối xác suất
1.3 HIỆP PHƯƠNG SAI, HỆ SỐ TƯƠNG QUAN
Định nghĩa 1.3.1 Cho 2 biến ngẫu nhiên X và Y Hiệp phương sai của
Trang 14ii.Cov(aX + a0, bY + b0) = ab Cov(X, Y );
iii NếuX và Y độc lập thìCov(X, Y ) = 0.
Định nghĩa 1.3.3 Hệ số tương quan của hai biến ngẫu nhiên X và Y, kíhiệu làCorr(X, Y ), được xác định bởi công thức:
Corr(X, Y ) = p Cov(X, Y )
V ar(X)pV ar(Y ).
Định lý 1.3.4.
i.| Corr(X, Y )| ≤ 1;
ii NếuX vàY độc lập thì Corr(X, Y ) = 0;
iii NếuY = aX + b thìCorr(X, Y ) = ±1.
Trang 15CHƯƠNG 2
CHUỖI THỜI GIAN VÀ MỘT SỐ MÔ HÌNH CHUỖI THỜI
GIAN
2.1 GIỚI THIỆU VỀ CHUỖI THỜI GIAN
Trong kinh tế, xã hội, chúng ta thường làm việc với các biến số quan sátdọc theo thời gian như: GDP hàng năm, tỉ lệ thất nghiệp hàng năm, chỉ số giátiêu dùng hàng tháng, chỉ số chứng khoán hàng ngày, giá vàng hàng giờ, cácbiến số trên được gọi là biến số chuỗi thời gian Ta có thể xem chuỗi thời gian
là một dãy biến ngẫu nhiên(Xt)với chỉ số thời giant Nói chung, một dãy biếnngẫu nhiên(Xt)như vậy còn được gọi là quá trình ngẫu nhiên Trong khóa luậnnày chúng tôi chỉ xét đến chuỗi thời gian(Xt) với chỉ sốtlà tập số nguyên Z
2.1.1 Khái niệm chuỗi thời gian
Chuỗi các quan sát được thu nhập trên cùng một đối tượng tại các mốc thờigian cách đều nhau được gọi là chuỗi thời gian Các giá trị trong chuỗi thời gianđược gọi là số liệu chuỗi thời gian
Vì bản chất thứ tự của chuỗi số nên với số liệu chuỗi thời gian chúng ta cònquan tâm đến hiện tượng sau:
-Tự tương quan (autocorrelation): Chuỗi (Xt) được gọi là có tự tương quanbậcpnếu:corr(Xt, Xt−p) 6= 0
-Tự tương quan với số liệu chuỗi thời gian đôi khi còn được gọi là tươngquan chuỗi (serial correlation)
Trang 162.1.2 Tính chất của chuỗi thời gian:
-Số liệu chuỗi thời gian và tính tự tương quan: Chuỗi các quan sát trong sốliệu chéo thường được xem như là độc lập với nhau và do đó không tương quanvới nhau, tuy nhiên với số liệu chuỗi thời gian, người ta thường thấy chúng cótính tự tương quan:corr(Yt, Yt − s)thường khác 0
-Số liệu chuỗi thời gian và yếu tố mùa vụ: các số liệu kinh tế xã hội thườngchịu tác động của yếu tố thời vụ Ví dụ: Gía cả thực phẩm tiêu dùng tăng vào dịpTết, Số lượng người đi du lịch tăng vào các kì nghĩ lễ, doanh thu về hàng điệnlạnh thường cao vào mùa hè và thấp vào mùa đông Yếu tố mùa vụ thườngxuất hiện với các số liệu có tần suất xuất hiện bé hơn một năm, như số liệu quý,
số liệu tháng
-Số liệu chuỗi thời gian và yếu tố xu thế: Đa phần chuỗi thời gian còn
có yếu tố xu thế, chỉ xu thế tăng (hay giảm) trong thời kỳ khá dài của chuỗisố.Chẳng hạn GDP của một nền kinh tế thường có xu hướng gia tăng, do tácđộng của sự cải thiện công nghệ, chất lượng nguồn nhân lực và sự gia tăng cácyếu tố đầu tư vào như vốn và lao động
- Số liệu chuỗi thời gian với yếu tố bất thường: Chỉ sự thay đổi bất thườngcủa các giá trị trong số liệu Sự thay đổi này không thể dự đoán được dựa vàocác số liệu kinh nghiệm trong quá khứ, về mặt bản chất yếu tố này không cótính chu kỳ
2.2 NHIỄU TRẮNG
Định nghĩa 2.2.1 Chuỗi thời gian đơn giản nhất là dãy biến ngẫu nhiên
không tương quan(Wt; t ∈ Z)cóE(Wt) = 0vàV arWt = σ2 Chuỗi thời gian
này được gọi là nhiễu trắng với tham sốσ2 và được kí hiệu làWt ∼ W N (0; σ2)
Nếu Wt có phân phối chuẩn thì Wt được gọi là nhiễu trắng Gauss
Trang 17Trong trường hợp Wt là dãy biến ngẫu nhiên độc lập cùng phân phối xácsuất thì ta sẽ kí hiệu làWt ∼ IID(0; σ2).
Ví dụ 2.2.2 ChoWt ∼ W N (0; σ2) Chuỗi thời gian(Xt) xác định bởi
Xt = 1
3(Wt−1 + Wt + Wt+1),
được gọi là trung bình trượt
Ví dụ 2.2.3 Chuỗi thời gian(Xt)thỏa mãn
Xt = Xt−1 − 0, 9Xt−2 + Wt,
được gọi là tự hồi quy
Ví dụ 2.2.4 Chuỗi thời gian(Xt)thỏa mãn
Xt = δ + Xt−1 + Wt,
được gọi là du động ngẫu nhiên có hệ số chặn
Ví dụ 2.2.5 Xét chuỗi thời gian(Xt)thỏa mãn
Xt = 2 cos(2π
50t + 0, 6π) + Wt,
được gọi là tín hiệu nhiễu
Định nghĩa 2.2.6 Cho chuỗi thời gian(Xt; t ∈ Z)
Trang 182.4 QUÁ TRÌNH HỒI QUY TUYẾN TÍNH
Xét mô hình hồi quy tuyến tính đơn giản với số liệu chuỗi thời gian nhưsau:
Yt = β1 + β2.X2t+ + βk.Xkt+ Wt, (2.2)trong đó β1, β2, βk là các tham số, Wt là sai số ngẫu nhiên thể hiện chotác động của các biến khác lên biếnY
Ký hiệu Yt thể hiện giá trị của biến số tại thời điểm t chứ không phải làcác giá trị trễ của các biến số khác
Mô hình tuyến tính được mô tả bởi (2.2) ở trên có thể được viết thuận tiệntrong một ký hiệu tổng quát hơn bằng cách định nghĩa các cột vector:
Trang 192.4.1 Ước lượng tham số
Kí hiệu nquan sát ngẫu nhiên ởnthời điểm khác nhau là
Trang 20Để cung cấp cho một số phiên bản hữu ích để tham khảo sau này Bình thường
Qminlà ước lượng không thiên vị, tức là,E( ˆβ) = β, và có phương sai nhỏ nhấttrong lớp của ước lượng không tuyến tính
Nếu sai số Ut,là không đáng kể, thì βˆcũng là ước lượng khả năng tối đa cho β
và thường được phân phối với:
Trang 21tập hợp con r < q biến độc lập, nói rằng, Xt:r = (x1t, x2t, , xrt)0 đang ảnhhưởngYt biến phụ thuộc.
Các mô hình đơn giản là
Trong đóβr = (β1, β2, , βr)0 là một tập hợp con của các hệ số của các q biếngốc và
Xr = [x1:r, x2:r, , xn:r]0 (2.11)Xét cặp giả thiết:
Trang 22Những khảo sát này đã được sử dụng trong quá khứ một cách từng bước, nơi màcác biến được thêm vào hoặc xóa khi các giá trị từF − testhoặc vượt quá haykhông vượt quá mức một số định trước.
Các thủ tục, gọi là đa thức hồi quy theo từng bước, rất hữu ích trong việc đưamột tập hợp các biến số
Một cách khác là tập trung vào một thủ tục lựa chọn mô hình mà không tiếnhành tuần tự, nhưng chỉ đơn giản là đánh giá mỗi mô hình trên giá trị riêng của
nó Giả sử chúng ta xem xét một mô hình hồi quy bình thường với hệ số k vàbiểu thị các ước lượng khả năng tối đa cho phương sai như sau:
σk2 = SSEk
Trong đó: SSEk là tổng bình phương phần dư theo mô hình với các hệ số hồiquy k Sau đó, Akaike (1969, 1973, 1974) đề nghị đo sự phù hợp cho mô hìnhđặc biệt này bằng định nghĩa:
Định nghĩa 2.4.1 Akaike’s Information Criterion(AIC)
Trang 23Định nghĩa 2.4.3 Bayesian Information Criterion (BIC):
BIC = logσ2k+ k.logn
trong đóσ2 là phương sai,k là các tham số trong mô hình, và nlà cỡ mẫu của
mô hình
2.4.2 Tính chất của các ước lượng và bài toán suy diễn thống kê
Do Mô hình 2.2 Yt = β1 + β2.X2t + + βk.Xkt + ut là mô hình hồiquy tuyến tính, nên ta sử dụng phương pháp ước lượng OLS( Ordinary LeastSquares) và tính chất các ước lượng này được thể hiện qua các định lý sau:
Định lý 2.4.4 Định lý Gauss-Markov
Ước lượng OLS là các ước lượng tuyến tính, không chệch và tốt nhất trong lớp các ước lượng tuyến tính không chệch.
Định lý 2.4.5 Phương sai của các hệ số ước lượng góc và sai số chuẩn
của các hệ số góc được tính bởi các công thức sau đây:
V ar( ˆβ)j = σ
2
(1 − R2j)P
ix2ij, j = 2, 3, k. (2.19)Se( ˆβ)j = σ
Trang 242.4.3 Các vấn đề tự tương quan trong mô hình hồi quy chuỗi thời
Khi ρ1 < 0 ta nói mô hình có tự tương quan bậc 1 âm Điều này ngụ
ý rằng giữaut vàut−1 có quan hệ tuyến tính ngược chiều : nếuut là bé thìrất có khả năng làut−1 sẽ lớn và ngược lại
Khi ρ1 > 0 ta nói mô hình có tự tương quan bậc 1 dương Điều nàyngụ ý rằng giữaut vàut−1 có quan hệ tuyến tính cùng chiều : nếuut là lớnthì rất có khả năng làut−1 sẽ lớn
Khi ρ1 = 0 ta nói mô hình không có tự tương quan Và khi đó nếuut
là lớn (hay bé) thì ta không có thông tin gì để cho rằngut−1 sẽ lớn hay bé
Tự tương quan trong mô hình hồi quy cũng có thể có dạng tổng quát hơnnhư sau :
• Tự tương quan bậcp:
Sai số ngẫu nhiên ut được gọi là có sự tương quan bậc p nếu có thểviết được dưới dạng:ut = ρ1.ut−1 + + ρp.ut−p + εt,
trong đóεt là nhiễu trắng
+ Hậu quả của hiện tượng tự tương quan:
Phương sai các hệ số ước lượng thu được bằng phương pháp OLS là chệch.Kết luận từ bài toán xây dựng khoảng tin cậy là không đáng tin cậy và thường
là bé hơn so với khoảng tin cậy đúng
Kết luận từ bài toán kiểm định giả thuyết thống kê về các hệ số là không
Trang 25đáng tin cậy.
Hậu quả của hiện tượng tự tương quan là khá nghiêm trọng và nếu mô hình
có hiện tượng này chúng ta cần khắc phục nó
+ Kiểm định hiện tượng tự tương quan bậc 1:
Xét biểu diễn sai số ngẫu nhiên dưới dạng AR(1) như sau:ut = ρ1.ut−1+εt.Trong đóεtlà nhiễu trắng và giả sử|ρ1| < 1, ngoài ra mô hìnhut = ρ1.ut−1+εt
thỏa mãn các giả thiết của OLS cho mô hình hồi quy chuỗi thời gian
Để kiểm định giả thuyết cho rằng không có tự tương quan bậc 1, chúng taxét cặp giả thuyết sau :H0 : ρ1 = 0vàH1 : ρ1 6= 0
Ta xét 2 trường hợp :
• Trường hợp các biến giải thích đều là biến ngoại sinh chặt :
Giả sử các biến độc lập trong mô hình 2.23:Yt+1 = β1+β2.X2t+β3.X3t+ + βk.Xkt+ ut là biến ngoại sinh chặt, ta có kiểm địnhtnhư sau:Ước lượng mô hìnhut = ρ1.ut−1+ εt sau đó sử dụng kiểm địnhtnhưthông thường Tuy nhiên dout là không quan sát được nên ta dựa vào ướclượng của nó là các phần dưet , thay vìut = ρ1.ut−1+ εt ta ước lượng môhình sau :et = ρ1.et−1 + vt
Khi các biến giải thích trong mô hình (2.23) là ngoại sinh chặt, thì cácthống kê t và F thu được từ et = ρ1.et−1 + vt xấp xỉ quy luật Student vàquy luật Fisher tương ứng với điều kiện mẫu lớn
+ Kiểm địnhtđược thực hiện như sau:
Bước 1: Ước lượng mô hình (2.23) thu được phần dưet
Bước 2: Ước lượnget theoet−1 với t = 1, 2 ntheo mô hình:
et = ρ1.et−1 + vt
Bước 3: Sử dụng thống kê t thông thường để kiểm định cặp giả thuyết:
H0 : ρ1 = 0và H1 : ρ1 6= 0
• Trường hợp có biến giải thích không phải là biến ngoại sinh chặt:
+ Kiểm địnhtđược thực hiện như sau:
Bước 1: Ước lượng mô hình (2.23) thu được phần dưet
Bước 2: Ước lượng et theo các biến giải thích của mô hình (2.23) và et−1
vớit = 1, 2 ntheo mô hình:et = α1+α2.x2t+ +αk.xkt+ρ.et−1+vt
Trang 26Trong đóvt là sai số ngẫu nhiên của phương trình.
Bước 3: Sử dụng thống kê t thông thường để kiểm định cặp giả thuyết:
H0 : ρ = 0và H1 : ρ 6= 0
+ Kiểm định hiện tượng tự tương quan bậcp:
Sai số ngẫu nhiên u có thể được biểu diễn dưới dạng AR(p) như sau: ut =
ρ1.ut−1 + + ρ1p.ut−p+ εt
Trong đóεt là nhiễu trắng
Xét cặp giả thuyết:H0 : ρ1 = ρ2 = = ρp = 0vàH1 : ρ21+ ρ22+ + ρ2p 6= 0
+Kiểm định F:
Bước 1: Ước lượng mô hình 2.23 thu được phần dưet
Bước 2: Ước lượng mô hình hồi quy phụ :
Bước 3: Tính giá trị của thống kê quan sát và bác bỏH0nếu(n−p)R2ε > χ2α(p)
+ Khắc phục hiện tượng tự tương quan:
- Trường hợp tự tương quan bậc 1
Xét mô hình hồi quy hai biến như sau:
Yt = β1 + β2.X2t+ ut ⇒ ut = Yt− β1 − β2.X2t (2.24)
Do đó khiY, X2 là các chuỗi không dừng thìut cũng là chuỗi không dừng
và giả sử ut được biểu diễn dưới dang sau: ut = ρ1ut−1 + εt, trong đó εt lànhiễu trắng
Nói một cách khác ut có tự tương quan bậc 1 với hệ số tương quan bằngρ.Trong tình huống này, ta khắc phục như sau :
Lấy sai phân cả hai vế của
Yt = β1 + β2.X2t+ ut (2.25)
Trang 27để được
∆Yt = β2.∆X2t + εt (2.26)Trong mô hình 2.26, sai số ngẫu nhiên εt là nhiễu trắng và do đó nó không tựtương quan
Nếu trong mô hình 2.25, X2t là biến ngoại sinh chặt thì có thể dễ dàng chứngminh được rằng biến ∆X2t trong mô hình 2.26 cũng là biến ngoại sinh chặt.Khi đó có thể sử dụng phương pháp OLS cho mô hình∆Yt = β2.∆X2t+ εt đểnhận được các ước lượng đáng tin cậy
Trong trường hợp hệ số tự tương quan bậc 1 của ut không phải là 1 mà gầnbằng 1 thì việc biến đổi sai phân để thu được mô hình∆Yt = β2.∆X2t+ εt vẫnhữu ích do nó làm giảm một cách đáng kể mức độ tương quan trong sai số ngẫunhiên trong mô hình
Phương pháp sai phân chỉ phù hợp cho mô hình có biến giải thích là biến ngoạisinh chặt
- Trường hợp tự tương quan bậc p:
Xét mô hình hồi quy k biến như sau:
Yt = β1+ β2.X2t+ + βk.Xkt+ ut ⇒ ut = Yt− β1− β2.X2t− − βk.Xkt
(2.27)
Do đó khi Y, X2, , Xk là các chuỗi không dừng thì ut cũng là chuỗi khôngdừng và giả sửut được biểu diễn dưới dang sau: ut = ρ1ut−1 + ρput−p+ εt,trong đóεt là nhiễu trắng
Ta có:
Yt = β1 + β2.X2t+ ut (2.28)Biểu diễn mô hình này cho thời điểmt − 1 như sau:
Yt−1 = β1 + β2.X2(t−1)+ ut−1 (2.29)Giả sửρ1 đã biết, hi đó nhân hai vế của (2.29) vớiρ1 ta được :
ρ1.Yt−1 = ρ1.β1 + ρ1.β2.X2(t−1)+ ρ1.ut−1 (2.30)Tương tự nhân hai vế của (2.29) vớiρ2 ta được:
ρ2.Yt−2 = ρ2.β1 + ρ2.β2.X2(t−2)+ ρ2.ut−2 (2.31)
Trang 28Sai số ngẫu nhiên εt trong (2.33) thỏa mãn các điều kiện về sai số ngẫunhiên trong mô hình hồi quy.
Biến X2t∗ là biến ngoại sinh chặt Điều này có thể dễ dàng chứng minh dotính ngoại sinh chặt của biếnX2t
Do đó mô hình (2.33) thỏa mãn các giả thiết 1 đến giả thiết 5 của mô hìnhhồi quy chuỗi thời gian, và chúng ta có thể sử dụng phương pháp OLS cho môhình này Ước lượng của hệ số góc trong mô hình mới chính là ước lượng của
hệ số góc trong mô hình ban đầu
2.4.4 Dự báo quá trình hồi quy tuyến tính
Xét mô hình hồi quy tuyến tính đơn giản với số liệu chuỗi thời gian nhưsau:
Yt = β1 + β2.X2t+ + βk.Xkt+ Wt (2.34)
Dự báo giá trị kì vọng củaYt khi biết các giá trị X2t,X3t, ,Xkt là
E(Yt/X2t, X3t, , Xkt) = β1 + β2.X2t + + βk.Xkt (2.35)
Trang 292.5 QÚA TRÌNH DỪNG
Định nghĩa 2.5.1 Chuỗi thời gian(Xt; t ∈ Z)được gọi là quá trình dừngnếu thỏa mãn 2 điều kiện
i Hàm trung bình µ(t)là một hằng số (không phụ thuộc vàot);
ii.γ(t + h, t) chỉ phụ thuộc vàohmà không phụ thuộc vào t
Nếu (Xt)là quá trình dừng thì
V ar(Xt) = Cov(Xt, Xt) = γ(t, t) = γ(0, 0) (2.36)Điều đó có nghĩaV ar(Xt)là một hằng số không phụ thuộc t Hơn nữa ta có
γ(t + h, t) = Cov(Xt+h; Xt) = Cov(Xh; X0) = γ(h, 0) (2.37)
Do đó ta có thể định nghĩa hàm hiệp phương sai và hàm tự tương quan củaquá trình dừng như sau
Định nghĩa 2.5.2 Cho(Xt; t ∈ Z) là quá trình dừng
Hàm hiệp phương sai:
γ(h) = Cov(Xt+h; Xt) (2.38)Hàm tự tương quan:
ii.|γ(h)| ≤ γ(0) với mọih ∈ Z;
iii Với mọi số nguyên dương nvà với mọi số thực hay phức a1, a2, , an
Trang 30ii Theo bất đẳng thức Cauchy-Schwartz,ta có:
1 Chuỗi thời gian (Xt; t ∈ Z) được gọi là quá trình trung bình trượt cấp q
(MA(q)) nếu có biểu diễn
Trang 31Cov(Yt+h,Yt) = Cov(Xt+h, Xt).
Do đó không mất tính tổng quát ta giả sửµ = 0 Khi đó ta có
γ(t + h, t) = cov(Xt+h; Xt) = E(Xt+hXt)
Trang 34hội tụ bình phương trung bình và
2.7 QUÁ TRÌNH TỰ HỒI QUY
Định nghĩa 2.7.1 Chuỗi thời gian(Xt; t ∈ Z)được gọi là quá trình tự hồiquy cấpp, kí hiệu là AR(p), nếu(Xt)là quá trình ngẫu nhiên thỏa mãn phươngtrình
Xt = δ + α1Xt−1 + α2Xt−2 + + αpXt−p+ Wt (2.43)trong đóα1, α2, , αplà các hằng số (αp 6= 0),(Wt)là nhiễu trắng với tham số
σ2 vàWt không tương quan vớiXs với mọis < t
Nếu(Xt; t ∈ Z)là quá trình tự hồi quy và là quá trình dừng thì(Xt; t ∈ Z)
được gọi là quá trình dừng tự hồi quy.
Định lý 2.7.2 Cho(Xt; t ∈ Z)là quá trình tự hồi quy cấp p:
Xt = δ + α1Xt−1 + α2Xt−2 + + αpXt−p + Wt (2.44)
Trang 35Khi đó(Xt) là quá trình dừng khi và chỉ khi đa thức kết hợp
1 − α1x − α2z2 − − αpzp = 0 (2.45)
không có nghiệm trên đường tròn đơn vị|z| = 1.
Ví dụ 2.7.3 Cho(Xt; t ∈ Z)là quá trình tự hồi quy cấp 2:
Xt = 1 + 1.5Xt−1 − 0.56Xt−2 + Wt.(Xt)có phải là quá trình dừng không?
Lời giải XétΦ(z) = 1 − 1.5z + 0.56z2
Φ(z) = 0có 2 nghiệm: z1 = 107 ;z2 = 54 nằm ngoài đường tròn đơn vị Vậy(Xt)
là quá trình dừng
Ví dụ 2.7.4 Cho dãy(Xt)thỏa mãn phương trình sai phânXt = pXt−1+
Wt, trong đóWt là nhiễu trắng vớiσ2 = 1và Wt không tương quan vớiXs vớimọis < t Tìm p > 0đểXn là quá trình dừng
Trang 36Vậy (Xt)là quá trình dừng khi và chỉ khi|p| 6= 1.
Định lý 2.7.6 Nếu(Xt; t ∈ Z) là quá trình dừng tự hồi cấpp: