Nội dung nghiên cứu: Nghiên cứu tổng hợp mô hình chuỗi thời gian, hai mô hình chính sử dụng để dự báo giá cổ phiếu trong ngắn hạn là mô hình hồi quy tuyến tính chuỗi thời gian và mô hình
Trang 1ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC SƯ PHẠM
KHOA TOÁN -
Trang 2ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC SƯ PHẠM
KHOA TOÁN -
Tên đề tài: Một số mô hình toán học phân tích và dự báo
Trang 3ĐẠI HỌC ĐÀ NẴNG CỘNG HOÀ XÃ HỘi CHỦ NGHĨA VIỆT NAM
TRƯỜNG ĐHSP Độc lập - Tự do - Hạnh phúc
KHOA TOÁN -
-
NHIỆM VỤ KHÓA LUẬN TỐT NGHIỆP
Họ và tên sinh viên: TRƯƠNG THỊ MỸ VÂN
Lớp: 11CTUD1
1 Tên đề tài: Một số mô hình toán học phân tích và dự báo giá cổ phiếu
2 Sử dụng hai phương pháp để dự báo giá cổ phiếu Vinamilk:
-Mô hình hồi quy tuyến tính chuỗi thời gian
-Mô hình ARIMA
3 Nội dung nghiên cứu: Nghiên cứu tổng hợp mô hình chuỗi thời gian, hai mô hình chính sử dụng để dự báo giá cổ phiếu trong ngắn hạn là mô hình hồi quy tuyến tính chuỗi thời gian và mô hình ARIMA Nghiên cứu, khảo sát các phương pháp ước lượng, kiểm tra hệ số hồi quy, sai số ngẫu nhiên có thể tác động đến biến phụ thuộc và phương pháp dự báo Nghiên cứu, ứng dụng phần mềm Eview để dự báo giá cổ phiếu Vinamilk
4 Giáo viên hướng dẫn: TS LÊ VĂN DŨNG
5 Ngày giao đề tài: Ngày 5 tháng 10 năm 2014
6 Ngày hoàn thành: Ngày 1 tháng 5 năm 2015
Chủ nhiệm Khoa Giáo viên hướng dẫn
Sinh viên đã hoàn thành và nộp báo cáo cho Khoa ngày….tháng…năm 2015
Kết quả điểm đánh giá:
Ngày…tháng…năm 2015
CHỦ TỊCH HỘI ĐỒNG
Trang 4LỜI CẢM ƠN
Sau thời gian học tập và hoàn thành khóa luận này, tôi đã nhận được sự hướng dẫn, giúp đỡ tận tình của quý Thầy Cô, gia đình và bạn bè Với lòng kính trọng và biết ơn sâu sắc tôi xin được bày tỏ lời cảm ơn chân thành tới:
- Ban chủ nhiệm Khoa Toán, các Thầy Cô và các cán bộ khoa Toán, trường Đại Học Sư Phạm, Đại học Đà Nẵng đã nhiệt tình giảng dạy và giúp
đỡ tôi trong suốt quá trình học tập tại trường
- Đặc biệt, tôi xin bày tỏ lòng biết ơn sâu sắc đến Thầy TS Lê Văn Dũng
là người đã hết lòng giúp đỡ, dạy bảo, động viên và tạo mọi điều kiện thuận lợi để tôi có thể hoàn thành khóa luận tốt nghiệp này
- Nhân đây tôi cũng xin gởi lời cảm ơn đến gia đình, bạn bè đã giúp đỡ động viên tôi cả về vật chất lẫn tinh thần trong suốt quá trình làm khóa luận tốt nghiệp
Mặc dù khóa luận đã được hoàn thành đúng thời gian quy định nhưng do điều kiện thời gian và kiến thức còn hạn chế nên khóa luận của tôi không tránh khỏi những thiếu sót Vì vậy, tôi rất mong nhận được sự đóng góp ý kiến của các Thầy Cô và các bạn để tạo điều kiện cho khóa luận của tôi được hoàn thiện hơn
Đà Nẵng, tháng 5 năm 2015
Sinh viên
Trương Thị Mỹ Vân
Trang 5MỤC LỤC
LỜI MỞ ĐẦU 1
1 TÍNH CẤP THIẾT CỦA ĐỀ TÀI 1
2 MỤC TIÊU VÀ NHIỆM VỤ NGHIÊN CỨU 2
3 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU 2
4 PHƯƠNG PHÁP NGHIÊN CỨU 2
5 BỐ CỤC KHÓA LUẬN 3
CHƯƠNG 1: KIẾN THỨC CƠ SỞ 4
I Giới thiệu về số liệu chuỗi thời gian 4
1 Khái niệm chuỗi thời gian 4
2 Một số đặc trưng của chuỗi thời gian 4
II Mô hình hồi quy tuyến tính với chuỗi thời gian 5
1 Cơ sở lý luận 5
2 Tính chất mẫu lớn của ước lượng OLS 12
3 Vấn đề tự tương quan trong mô hình hồi quy chuỗi thời gian 13
4 Dự báo 19
III Mô hình ARIMA ( Mô hình trung bình trượt, tích hợp, tự hồi quy ) 20
1 Cơ sở lý luận 20
2 Xem xét tính dừng của chuỗi quan sát 24
3 Nhiễu trắng 25
4 Hàm tự tương quan 26
5 Phương pháp Box-Jenkins 29
CHƯƠNG 2: ỨNG DỤNG MÔ HÌNH HỒI QUY TUYẾN TÍNH CHUỖI THỜI GIAN VÀ ARIMA VÀO DỰ BÁO GIÁ CỔ PHIẾU VINAMILK 33
I Giới thiệu về số liệu 33
II Ứng dụng 33
1 Áp dụng vào mô hình hồi quy tuyến tính chuỗi thời gian 33
2 Áp dụng vào mô hình ARIMA 39
KẾT LUẬN VÀ KIẾN NGHỊ 51
TÀI LIỆU THAM KHẢO 52
Trang 6DANH MỤC CÁC CHỮ VIẾT TẮT
GLS Generalized Least Squaresmethod
MAS Mean Absolute Error
AIC Akaike Information Criterion
OLS Ordinary Least Squares
Trang 7LỜI MỞ ĐẦU
1 TÍNH CẤP THIẾT CỦA ĐỀ TÀI
Thị trường chứng khoán trên thế giới nói chung và ở Việt Nam nói riêng luôn là nơi hấp dẫn các tổ chức và cá nhân đầu tư bởi mức sinh lợi cao của nó Tuy nhiên, đây cũng là một hoạt động tiềm ẩn rất nhiều rủi ro Vì thế, việc đưa ra dự báo xu hướng biến động của chỉ số giá chứng khoán để có một sách lược phù hợp cho hoạt động đầu tư của cá nhân, tổ chức thu hút rất nhiều sự quan tâm của các nhà kinh tế lượng tài chính trong và ngoài nước Đề tài này cung cấp cách thức xây dựng mô hình hồi quy tuyến tính chuỗi thời gian và
mô hình ARIMA trong dự báo giá cổ phiếu Vinamilk trên thị trường chứng khoán Việt Nam
Qua hơn mười năm thực hiện đường lối đổi mới của Đảng, nền kinh tế nước ta đã đạt được những thành tựu và bước tiến hết sức quan trọng Tuy nhiên, để đạt được mục tiêu là đến năm 2020 đưa nước ta về cơ bản trở thành một nước công nghiệp có cơ sở vật chất và kỹ thuật hiện đại, cơ cấu kinh tế hợp lý, đảm bảo nhịp độ tăng trưởng bình quân GDP ở mức 9-10%/năm, thực hiện công nghiệp hóa hiện đại hóa thành công thì đòi hỏi chúng ta phải có vốn rất lớn Vì vậy để đáp ứng yêu cầu đó đến tháng 7/2000 Việt Nam đã cho ra đời trung tâm giao dịch chứng khoán tại Thành Phố Hồ Chí Minh Tuy nhiên trong giai đoạn hiện nay thị trường mới hình thành và còn mang tính chất thử nghiệm nên việc đưa ra những phân tích về xu hướng biến động và dự báo giá
cổ phiếu cho thị trường là rất có ý nghĩa
Qua một thời gian nghiên cứu các tài liệu về chứng khoán, về mô hình
để phân tích về sự biến động của giá chứng khoán trên thị trường và bằng sự
hiểu biết của tôi trong suốt quá trình học tập tôi đã chọn đề tài: MỘT SỐ MÔ
Trang 82 MỤC TIÊU VÀ NHIỆM VỤ NGHIÊN CỨU
2.1 Mục tiêu
- Hệ thống kiến thức cơ sở về lý thuyết chuỗi thời gian, mô hình hồi quy tuyến tính chuỗi thời gian, mô hình ARIMA
- Tìm hiểu, áp dụng hai mô hình hồi quy tuyến tính chuỗi thời gian và
mô hình ARIMA vào dự báo giá cổ phiếu Vinamilk trong ngắn hạn bằng cách
sử dụng phần mềm Eview
2.2 Nhiệm vụ nghiên cứu
- Nghiên cứu, tìm hiểu, giới thiệu mô hình hồi quy tuyến tính chuỗi thời gian và mô hình ARIMA
- Nghiên cứu các khái niệm liên quan đến mô hình hồi quy tuyến tính chuỗi thời gian và mô hình ARIMA, các phương pháp ước lượng, kiểm định
hệ số hồi quy và dự báo
- Nghiên cứu, áp dụng vào dự báo giá cổ phiếu Vinamilk trong ngắn hạn
3 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
3.1 Đối tượng
- Số liệu VNM được lấy từ ngày 9-1-2015 đến ngày 4-3-2015
- Nguồn cập nhật số liệu là trang web cophieu68.com Đây là trang web chuyên cung cấp số liệu về thị trường chứng khoán Việt Nam
3.2 Phạm vi nghiên cứu
Giáo trình kinh tế lượng
4 PHƯƠNG PHÁP NGHIÊN CỨU
4.1 Nghiên cứu lý thuyết
- Nghiên cứu tổng hợp lý thuyết: nghiên cứu cơ sở khoa học của đề tài
- Nghiên cứu giáo trình và tài liệu tham khảo có liên quan đến đề tài
- Trao đổi với giáo viên hướng dẫn
4.2 Nghiên cứu thực nghiệm
- Phương pháp sử dụng mô hình hồi quy tuyến tính chuỗi thời gian
- Phương pháp sử dụng mô hình ARIMA
Trang 95 BỐ CỤC KHÓA LUẬN
Khóa luận gồm 55 trang, với các nội dung :
Mở đầu (2 trang)
Chương 1- Kiến thức cơ sở (25 trang)
Chương 2- Ứng dụng mô hình hồi quy tuyến tính chuỗi thời gian và
ARIMA vào dự báo giá cổ phiếu vinamilk (15 trang)
Kết luận (1 trang)
Với 16 tài liệu tham khảo: 6 tiếng việt, 5 tiếng anh và 5website
Trang 10CHƯƠNG 1: KIẾN THỨC CƠ SỞ
I Giới thiệu về số liệu chuỗi thời gian
Trong kinh tế xã hội, chúng ta thường làm việc với các biến số được quan sát dọc theo thời gian như: GDP hàng năm, tỷ lệ thất nghiệp hàng năm, ngoài ra cũng có thể gặp các biến số như mức lạm phát hàng tháng, chỉ số VN-INDEX hàng ngày, hay giá vàng trên thị trường thế giới được cập nhật sau mỗi hai phút trên các website thông dụng,…
Các biến số trên đều là các biến số chuỗi thời gian, hay còn gọi đơn giản
là chuỗi thời gian
Ta có thể xem chuỗi thời gian là một dãy biến ngẫu nhiên (X t) với chỉ số thời gian t Nói chung, một dãy biến ngẫu nhiên (X t) còn được gọi là quá trình ngẫu nhiên Trong khóa luận này chỉ xét đến chuỗi thời gian (X t) với chỉ
số t là tập số nguyên
1 Khái niệm chuỗi thời gian
Chuỗi các quan sát được thu thập trên cùng một đối tượng tại các mốc thời gian cách đều nhau được gọi là chuỗi thời gian
Vì bản chất thứ tự của chuỗi số nên với số liệu chuỗi thời gian chúng ta còn quan tâm đến hiện tượng sau:
- Tự tương quan (autocorrelation): Chuỗi X t được gọi là có tự tương quan bậc p nếu: Corr(X t,X tp) 0
- Tự tương quan với số liệu chuỗi thời gian đôi khi còn được gọi là tương quan chuỗi (serial correlation)
2 Một số đặc trưng của chuỗi thời gian
- Số liệu chuỗi thời gian và tính tự tương quan: Chuỗi các quan sát trong
số liệu chéo thường được xem như là độc lập với nhau và do đó không tương quan với nhau, tuy nhiên với số liệu chuỗi thời gian, người ta thường thấy chúng có tính tự tương quan: Corr(Y t,Y ts) thường khác 0
- Số liệu chuỗi thời gian và yếu tố mùa vụ: các số liệu kinh tế xã hội
Trang 11thường chịu tác động của yếu tố thời vụ Yếu tố mùa vụ thường xuất hiện với các số liệu có tần suất xuất hiện bé hơn một năm, như số liệu quý, số liệu tháng…
- Số liệu chuỗi thời gian và yếu tố xu thế: Đa phần chuỗi thời gian còn có yếu tố xu thế, chỉ xu thế tăng (hay giảm) trong thời kỳ khá dài của chuỗi số.Chẳng hạn GDP của một nền kinh tế thường có xu hướng gia tăng, do tác động của sự cải thiện công nghệ, chất lượng nguồn nhân lực và sự gia tăng các yếu tố đầu tư vào như vốn và lao động
II Mô hình hồi quy tuyến tính với chuỗi thời gian
1 Cơ sở lý luận
Xét mô hình hồi quy tuyến tính với số liệu chuỗi thời gian như sau:
t
Y =12X2t k X kt u t (*)
1.1 Các giả thiết của mô hình
Trong đó1,2…là các tham số, u tlà sai số ngẫu nhiên thể hiện cho tác động của các biến khác lên biến Y
Ký hiệu Y t thể hiện giá trị của biến số tại thời điểm t chứ không phải là các giá trị trễ của các biến số khác
Phát biểu giả thiết cho mô hình (*) như sau:
- Giả thiết 1: Sai số ngẫu nhiên không tự tương quan :
s t u
u
Corr
k
X X
Trang 12- Giả thiết 5: Sai số ngẫu nhiên tuân theo quy luật chuẩn u t 2
,
0
N
1.2 Tính chất của các ước lượng và bài toán suy diễn thống kê
Do mô hình Y t=12X2t k X kt u t là hồi quy tuyến tính, nên ta sử dụng phương pháp ước lượng OLS và tính chất các ước lượng này được thể hiện qua các định lý sau:
Định lý 1: ( Định lý Gauss-Markov)
Khi các giả thiết 1 đến giả thiết 4 thỏa mãn thì các ước lượng OLS là các ước lượng tuyến tính, không chệch và tốt nhất trong lớp các ước lượng tuyến
tính không chệch
Định lý 2: Khi các giả thiết 1 đến giả thiết 4 thỏa mãn thì phương sai của
các hệ số ước lượng góc và sai số chuẩn của các hệ số góc được tính bởi các công thức sau đây:
x R
j
x R
Se
2 2
e i
N , var , trong đó
j
var được tính bởi công thức (*)
1.3 Mô hình hồi quy sử sụng ngôn ngữ ma trận
1.3.1 Ước lượng OLS và ma trận hiệp phương sai của hệ số ước lượng
Trang 13.
e e e e
n
n t
.
, , ,
2 1
2 1
Do đó phương pháp OLS đưa về việc giải bài toán cực trị : tìm véc tơ
sao cho cực tiểu biểu thức:
(1.5) chính là công thức ước lượng OLS cho các hệ số hồi quy
Để xem xét công thức tính ma trận phương sai-hiệp phương sai của các
hệ số ước lượng, ta biến đổi công thức (1.5) như sau:
Trang 14Do đó sử dụng điều kiện (1.4) ta có thể biểu diễn ma trận hiệp phương sai giữa các hệ số ước lượng bởi:
1 1 2 1
' '
|' var ' '
X X X uu X
X X
X
X
2 22
1 1 1
t t t X X
X n
X
2 2
X X
X
X
t t
t t t
t
2
2 2
t t
X n X
2
2 2
2
' det
t
t t t
t t t
x x
X
x
X x
n X
2
2 2
2 2 2
2 2 2 2 2
2
2 2 2
2 2
1
2 1 1
var ,
cov
, cov var
X
2 2
2 2 2
x22
2 2
X
2 2 2 2 2
1 , cov
Gọi ( Y t,X2t, ,X kt) với t=1,2, ,n là mẫu ngẫu nhiên của mô hình (*) Khi đó ta có thể biểu diễn lại như sau:
Trang 152 2
22 2 1
2
1 1
21 2 1
n kn
k n
n
k k
k k t
u X
X Y
u X
X Y
u X
X Y
Y (1.3)
Trong đó Y, X, và u là các ma trận có kích thước lần lượt là : (n×1), (n×k), (k×1) và (n×1) như sau :
n
k k
X X
X
X X
X
X X
.
.
1
1
3 2
2 32
22
1 31
21
,
1
2 1
.
.
u
u u
u
Các giả thiết của phương pháp OLS :
Giả thiết 1: Việc ước lượng được dựa trên cơ sở mẫu ngẫu nhiên (X,Y) Giả thiết 2: Eu X 0n1 với 0n1 là véc tơ gồm n thành phần bằng 0
Giả thiết 3: Euu' X2I , trong đó I là ma trận đơn vị cỡ n×n, dấu ‘ trên đầu mỗi ma trận là ký hiệu của ma trận chuyển vị
2 1
2 3
2 2 2 1 2
1 3
1 2 1 2 1
'
.
.
.
n n
n n
n n
u u
u u u u u
u u u
u u u u
u u u
u u u u
2 1
2 3
2 2
2 1
2
1 3
1 2
1 2
1
'
.
.
.
.
n n
n n
n n
u E u
u E u u E u u E
u u E u
u E u
E u u E
u u E u
u E u u E u
Trang 16 uu I
2
2 2
'
0 0 0
.
0 0 0
0 0 0
có biến nào là hằng số trong tập số liệu
Phần học về đại số ma trận đã cho biết rằng nếu các véc tơ cột (dòng) của một ma trận vuông là phụ thuộc tuyến tính thì ma trận này là không khả nghịch, nghĩa là không tồn tại ma trận nghịch đảo
Ngoài ra, trong ma trận X có cột thứ nhất là véc tơ mà các thành phần đều bằng 1, nên nếu trong tồn tại một biến độc lập nào đó là hằng số thì ma trận X ' X sẽ không tồn tại ma trận nghịch đảo Tuy nhiên giả thiết này là tầm thường và sẽ được bỏ qua, vì trong các tệp số liệu thì các biến số nói chung đều không phải là hằng số
Trang 17Như vậy là ước lượng không chệch của
' '
' '
' '
c2, trong đó c ij là phần tử nằm trên dòng i cột j của ma trận C Như vậy các thành phần trên đường chéo chính của ma trận CC' là không âm Từ đó và từ biểu thức (1.11) ta có ngay:
var với mọi j=1,2, , k
Đây là điều cần chứng minh
Trang 182 Tính chất mẫu lớn của ước lượng OLS
2.1 Một số khái niệm
Mô hình hồi quy chuỗi thời gian thường sử dụng thông tin về quan hệ giữa các biến số trong một thời kỳ để suy diễn về quan hệ giữa các biến số này trong tương lai Do đó một cách tự nhiên, chúng ta mong muốn rằng quan
hệ này là ổn định theo thời gian.Một số khái niệm liên quan chặt chẽ đến sự
ổn định này là chuỗi dừng, được định nghĩa như sau:
- Chuỗi dừng: Một chuỗi X t với E(X2t) hữu hạn được gọi là chuỗi dừng (stationary series) nếu thỏa mãn ba điều kiện sau đây:
(i) Kỳ vọng không đổi:E(X t)
(ii)Phương sai không đổi:var(X t)= 2
(iii)Hiệp phương sai không phụ thuộc vào thời điểm tính toán: Cov(
)
, t s
t X
X =svới mọi t
Như vậy chuỗi dừng là chuỗi có kỳ vọng, phương sai và hiệp phương sai
là không đổi theo thời gian
- Chuỗi không dừng: Là chuỗi không thỏa mãn một trong ba điều kiện
trên được gọi là chuỗi không dừng (non-stationary)
- Chuỗi phụ thuộc yếu: Chuỗi dừng x tđược gọi là phụ thuộc yếu nếu hệ
số tương quan giữa x tvà x th tiến đến 0 với một tốc độ khá nhanh khi h tiến
Ta có các giả thiết cho mô hình (*) như sau:
- Giả thiết 1: Các chuỗi số Y t,X2t, ,X kt là các chuỗi dừng và phụ thuộc yếu
Trang 19- Giả thiết 2: Sai số ngẫu nhiên không tự tương quan: corru u t s
k
X X s
t, | , , 0 ,
- Giả thiết 3: Tại mỗi t, ta có Eu t |X2t, ,X kt 0
- Giả thiết 4: Phương sai sai số là bằng nhau tại mọi thời điểm:
Định lý 1: Khi các giả thiết 1 và 2 thỏa mãn thì các hệ số ước lượng thu
được từ phương pháp OLS là các ước lượng vững, nghĩa là:
Với mọi 0 bé tùy ý ta luôn có:
Định lý 2: Khi các giả thiết 1 đến giả thiết 5 thỏa mãn thì các ước lượng
OLS là tiệm cận hiệu quả trong lớp các ước lượng tuyến tính và vững, nghĩa là:
n j j
3 Vấn đề tự tương quan trong mô hình hồi quy chuỗi thời gian
3.1 Hậu quả của tự tương quan trong mô hình hồi quy chuỗi thời gian 3.1.1 Hiện tượng tự tương quan
Khi mô hình Y t=12X2t k X kt u t(*) có hiện tượng tự tương
Trang 20quan, nghĩa là sai số ngẫu nhiên u tại các thời điểm khác nhau là có tương quan với nhau và khi đó có thể biểu diễn như sau:
+ Tự tương quan bậc 1: Sai số ngẫu nhiên u tđược gọi là có tự tương quan bậc 1 nếu có thể biểu diễn được dưới dạng: u t=1u t1t
3.1.2 Hậu quả của hiện tượng tự tương quan
-Phương sai các hệ số ước lượng thu được bằng phương pháp OLS là chệch
-Kết luận từ bài toán xây dựng khoảng tin cậy là không đáng tin cậy và thường là bé hơn so với khoảng tin cậy đúng
-Kết luận từ bài toán kiểm định giả thuyết thống kê về các hệ số là không đáng tin cậy
Hậu quả của hiện tượng tự tương quan là khá nghiêm trọng và nếu mô hình có hiện tượng này chúng ta cần khắc phục nó
Trang 213.2 Phát hiện hiện tượng tự tương quan
3.2.1 Xem xét đồ thị phần dư
Để phát hiện tự tương quan bậc 1, ta có thể xem xét đồ thị rải điểm giữa
t
e và e t1
3.2.2 Kiểm định hiện tượng tự tương quan bậc 1
Xét biểu diễn sai số ngẫu nhiên dưới dạng AR(1) như sau: u t 1u t1t
Trong đó t là nhiễu trắng và giả sử |1|<1, ngoài ra mô hình
t t
u 1 1 thỏa mãn các giả thiết của OLS cho mô hình hồi quy chuỗi thời gian
Để kiểm định giả thuyết cho rằng không có tự tương quan bậc 1, chúng
ta xét cặp giả thuyết sau:
+Trường hợp các biến giải thích đều là biến ngoại sinh chặt :
Giả sử các biến độc lập trong mô hìnhY t=12X2t k X kt u t(*) là biến ngoại sinh chặt, ta có kiểm định:
Kiểm định t : Ước lượng mô hìnhu t 1u t1t sau đó sử dụng kiểm định t như thông thường Tuy nhiên do u t là không quan sát được nên ta dựa vào ước lượng của nó là các phần dư e t , thay vì u t 1u t1t ta ước lượng
mô hình sau: e t e t1t
Khi các biến giải thích trong mô hình (*) là ngoại sinh chặt, thì các thống kê t và F thu được từ e t e t1t xấp xỉ quy luật Student và quy luật Fisher tương ứng với điều kiện mẫu lớn
Kiểm định t được thực hiện như sau:
Bước1: Ước lượng mô hình (*) thu được các phần dư e t
Trang 22Bước2: Ước lượng e t theo e t1 với t=1,2 ,n: e t e t1 t
Bước3: Sử dụng thống kê t thông thường để kiểm định cặp giả thuyết :
0 :
; 0
- Các biến giải thích là biến ngoại sinh chặt ( do đó sẽ không sử dụng được với mô hình có biến giải thích là biến trễ của biến phụ thuộc )
- Chuỗi số là liên tục: không có quan sát bị mất ở giữa
e 12 2 1
Trong đó t là sai số ngẫu nhiên của phương trình này
Bước3: Sử dụng thống kê t để kiểm định cặp giả thuyết:
0
; 0
1
n
n d
h với d là thống kê DW cho mô hình (**)
Nếu giả thuyết H0 về không có tự tương quan bậc 1 là đúng thì thống kê
h tuân theo quy luật chuẩn hóa N(0,1) Kết luận đưa ra trong kiểm định này
Trang 23dựa trên sự so sánh giá trị quan sát của thống kê h với các giá trị tới hạn của quy luật chuẩn hóa
3.2.3 Kiểm định tự tương quan bậc p
Sai số ngẫu nhiên u có thể được biểu diễn dưới dạng AR(p) như sau:
t p t p t
kt k t
kt k t
Bước 3: Tính giá trị của thống kê quan sát và bác bỏ H0 nếu:n pR e2 2 p
3.3 Khắc phục hiện tượng tự tương quan
a) Trường hợp tự tương quan bậc 1
Để đơn giản cho việc trình bày, chúng tôi xét mô hình hồi quy hai biến như sau:
t t
Y 12 2 (1)
Suy ta u t Y t 12X2t (2) Do đó khi Y và X2 là các chuỗi không dừng thì u t cũng thường là chuỗi không dừng và giả sử u t biểu diễn được dưới
Trang 24dạng sau u t 1u t1t
Trong đó t là nhiễu trắng
Nói một cách khác, u t có tự tương quan bậc 1 với hệ số tương quan bằng
Trong tình huống này, ta khắc phục như sau : Lấy sai phân cả hai vế của (1) để được Y t 2X2t t (3)
Trong mô hình Y t 2X2t t , sai số ngẫu nhiên t là nhiễu trắng và
do đó nó không tự tương quan Nếu trong mô hình (1), X2t là biến ngoại sinh chặt thì có thể dễ dàng chứng minh được rằng biến X2t trong mô hình (2) cũng là biến ngoại sinh chặt Khi đó có thể sử dụng phương pháp OLS cho
mô hình Y t 2X2t t để nhận được các ước lượng đáng tin cậy
Trong trường hợp hệ số tự tương quan bậc 1 của u t không phải là 1 mà gần bằng 1 thì việc biến đổi sai phân để thu được mô hình Y t 2X2t t
vẫn hữu ích do nó làm giảm một cách đáng kể mức độ tương quan trong sai
số ngẫu nhiên trong mô hình Phương pháp sai phân chỉ phù hợp cho mô hình
có biến giải thích là biến ngoại sinh chặt
b) Trường hợp tự tương quan bậc p
Xét mô hình hồi quy k biến như sau: Y t 12X2t k X kt u t
Suy ta u t Y t 12X2t k X kt Do đó khi Y và X , ,2 X k là các chuỗi không dừng thì u t cũng thường là chuỗi không dừng và giả sử u t biểu diễn được dưới dạng sau: u t 1u t1 p u tp t
Trong đó t là nhiễu trắng
Ta có: Y t 1 2X2t u t (1)
Biểu diễn mô hình này cho thời điểm (t-1) như sau:
1 ) 1 ( 2 2
1Y t X t u t
Trang 25Tương tự nhân hai vế của (*) với2ta được:
p p
1 1
4.1 Dự báo giá trị của biến phụ thuộc
Giả sử xét mô hình hồi quy hai biến:Y t 12X t u t với hàm hồi quy mẫu tương ứng: Y t 1 2 X t
t t
x
x n Y
1 2
2
2 1 var
Trang 26Với
2 / 1
1 2
t t
x
x n Y
Y se
X Y E Y t
t t n
t t se Y Y t se Y
Y /2, 2 , /2, 2
4.2.Đánh giá sai số dự báo
Căn bậc hai của trung bình bình phương sai số:
n
Y Y RMSE
n i
t t
n t
t t
Y Y
MAPE
n
t t
Trang 27một biến số cụ thể là một chỉ tiêu tốt phản ánh giá trị trong tương lai của nó,
cụ thểcho X t là giá trị của biến số tại thời điểm t với X t=f(X t1,X t2, ,X0,t) Mục đích của phân tích là để thấy rõ một số mối quan hệ giữa các giá trị
t
X được quan sát đến nay để cho phép chúng ta dự báo giá trị X t trong tương lai Phương pháp này đặc biệt hữu ích cho việc dự báo trong ngắn hạn
1.1.Mô hình tự hồi quy p-AR(p)
Trong mô hình tự hồi quy quá trình phụ thuộc vào tổng trọng số của các giá trị quá khứ và số hạng nhiễu ngẫu nhiên :
t p t p t
t
X 1 1 2 2
Định nghĩa:
Chuỗi thời gian (X t;tZ) được gọi là quá trình tự hồi quy cấp p, kí hiệu
là AR(p), nếu (X t) là quá trình ngẫu nhiên thỏa mãn phương trình:
t p t p t
Nếu (X t;tZ) là quá trình tự hồi quy và là quá trình dừng thì ( X t;tZ) được gọi là quá trình dừng tự hồi quy
Định lý:
Cho (X t;tZ) là quá trình tự hồi quy cấp p:
t p t p t
0
p z z
1
Trang 28Định lý:
Cho (X t;tZ ) là quá trình dừng tự hồi quy cấp p:
t p t p t
Khi đó hàm hiệp phương sai (h) là nghiệm của phương trình Walker:
Yule-) ( ) (
) 2 ( )
) 2 (
) 1 (
1
) 2 ( ) 1 (
1 )
1 (
) 1 (
) 1 ( 1
2 1
p p
p
p p
1 có biểu diễn trung bình trượt một
X khi và chỉ khi đa thức kết hợp p
p z a z
a
z
không có nghiệm trên hình tròn đơn vị |z| 1
1.2 Mô hình trung bình trượt q-MA(q)
Trong mô hình trung bình trượt, quá trình được mô tả hoàn toàn bằng tổng trọng số của các ngẫu nhiên hiện hành có độ trễ :
q t q t
t t
t t
X 1 1 2 2
-Chuỗi thời gian (X t;tZ ) được gọi là quá trình trung bình trượt cấp vô hạn (MA(∞)) nếu nó biểu diễn :
Trang 291 1
Định nghĩa: Cho(X t;tZ) là quá trình trung bình trƣợt cấp q:
q t q t
t t
t p t p t
t p t p t
t p t p t