Với phương pháp chuỗi thờigian hay còn gọi là Box-Jenkins, các nhà nghiên cứu đã tiến hành dự báo chonhiều biến số kinh tế khác nhau, và đa phần họ đều đi đến kết luận chung rằngphương p
Trang 1LỜI CÁM ƠN
Đầu tiên tôi xin gửi lời cám ơn chân thành đến toàn thể trường Đại học Kinh tế Huế, các khoa, ngành, bộ môn đã tạo điều kiện thuận lợi để tôi hoàn thành tốt chương trình Đại học của mình và giúp tôi có thể tham gia nghiên cứu khóa luận tốt nghiệp này.
Tôi cũng xin gửi lời cám ơn sâu sắc đến toàn thể quý giảng viên, quý Thầy Cô trong trường, đặc biệt là các Thầy Cô giáo giảng viên trong khoa Tài chính - Ngân hàng trường Đại học Kinh tế Huế, đã cung cấp cho tôi một hành trang quý báu từ tri thức đến kỹ năng để tôi có thể vững vàng hơn trong những bước đầu tiên trên con đường sự nghiệp sắp tới của mình.
Tôi cũng xin gửi lời cám ơn chân thành nhất đến Cô Phạm Thị Thanh Xuân, Cô đã dìu dắt và hỗ trợ, giúp đỡ tôi rất nhiều trong quá trình nghiên cứu khóa luận tốt nghiệp, đã tận tình giải đáp những thắc mắc, những tình huống khó khăn mà tôi gặp phải Tôi xin bày tỏ lòng biết ơn sâu sắc trước sự giúp đỡ tận tình của Cô.
Cuối cùng, lời cám ơn còn lại tôi xin gửi đến toàn thể anh chị, cán bộ nhân viên phòng Quan hệ khách hàng Doanh nghiệp – Ngân hàng thương mại Cổ phần Công thương Việt Nam chi nhánh Thừa Thiên Huế đã giúp tôi có những kinh nghiệm, kỹ năng thực tế trong quá trình làm việc và giải quyết tình huống thực tiễn.
Mặc dù đã rất nỗ lực cố gắng song bài nghiên cứu sẽ không tránh khỏi những sai sót, rất mong nhận được sự góp ý sửa chữa từ quý Thầy Cô giáo và các giảng viên.
Một lần nữa tôi xin chân thành cám ơn!
Huế, tháng 5 năm 2015 Sinh viên thực hiện Đặng Nữ Hà My
Trường Đại học Kinh tế Huế
Trang 2MỤC LỤC
Trang
DANH MỤC CÁC KÍ HIỆU VÀ CHỮ VIẾT TẮT i
DANH MỤC HÌNH VẼ VÀ BIỂU ĐỒ ii
DANH MỤC BIỂU BẢNG iv
TÓM TẮT ĐỀ TÀI v
PHẦN I: ĐẶT VẤN ĐỀ 1
1 Lý do lựa chọn đề tài 1
2 Mục tiêu nghiên cứu 3
3 Phương pháp nghiên cứu 3
4 Đối tượng nghiên cứu 3
5 Phạm vi nghiên cứu 4
6 Kết cấu đề tài 4
PHẦN II: NỘI DUNG VÀ KẾT QUẢ NGHIÊN CỨU 6
CHƯƠNG 1: CƠ SỞ LÍ LUẬN VÀ THỰC TIỄN VỀ CSCK, TSSL THỊ TRƯỜNG VÀ MÔ HÌNH ARIMA TRONG DỰ BÁO 6
1.1 Cơ sở lí luận về chỉ số chứng khoán, TSSL và rủi ro của thị trường 6
1.1.1 Chỉ số chứng khoán 6
1.1.2 Tỉ suất sinh lợi và rủi ro của thị trường 7
1.2 Cơ sở lí luận về mô hình ARIMA dùng trong dự báo 8
1.2.1 Bài toán dự báo 8
1.2.1.1 Tổng quan về dự báo 8
1.2.1.2 Phân loại dự báo 8
a Phương pháp định tính 9
Trường Đại học Kinh tế Huế
Trang 3b Phương pháp định lượng 9
1.2.1.3 Trình tự một quá trình dự báo 10
1.2.1.4 Các công cụ thống kê đánh giá mức độ chính xác của dự báo 10
1.2.2 Chuỗi thời gian 12
1.2.2.1 Khái niệm 12
1.2.2.2 Chuỗi thời gian trong dự báo 13
1.2.3 Tính dừng 14
1.2.3.1 Khái niệm 14
1.2.3.2 Hậu quả của chuỗi không dừng 15
1.2.3.3 Kiểm định tính dừng 16
a Dựa trên đồ thị của chuỗi thời gian 16
b Dựa trên lược đồ tự tương quan và tự tương quan riêng phần 16
c Kiểm định nghiệm đơn vị (Unit root test) 18
1.2.3.4 Biến đổi chuỗi không dừng thành chuỗi dừng 20
1.2.4 Quá trình tự hồi quy (AR), trung bình trượt (MA) và các mô hình tự hồi quy tích hợp trung bình trượt (ARMA) 21
1.2.4.1 Quá trình tự hồi quy (AR – Autoregressive) 21
a Quá trình tự hồi quy bậc 1 – AR(1) 21
b Quá trình tự hồi quy bậc p – AR(p) 22
1.2.4.2 Quá trình trung bình trượt (MA – Moving Average) 22
1.2.4.3 Quá trình tự hồi quy tích hợp trung bình trượt (ARMA) 23
1.2.4.4 Quá trình tự hồi quy, đồng liên kết, trung bình trượt (ARIMA) 23
1.2.5 Phương pháp Box – Jenkins (BJ) 24
1.3 Cơ sở thực tiễn về đối tượng và phương pháp nghiên cứu 27
Trường Đại học Kinh tế Huế
Trang 41.3.1 Tổng hợp các nghiên cứu trong nước 27
1.3.2 Tổng hợp các nghiên cứu nước ngoài 28
1.3.3 Nhận xét 30
1.4 Xác định yếu tố cơ bản trong phân tích – Đề xuất mô hình 31
Kết luận chương 1 31
CHƯƠNG 2: CHỈ SỐ CHỨNG KHOÁN VN-INDEX VÀ DIỄN BIẾN THỊ TRƯỜNG CHỨNG KHOÁN VIỆT NAM GIAI ĐOẠN 2010 - 2015 32
2.1 Sơ lược về thị trường chứng khoán Việt Nam và chỉ số VN-Index 32
2.1.1 Những đặc tính lớn của chỉ số VN-Index 32
2.1.1.1 Khái niệm thị trường chứng khoán 32
2.1.1.2 Chức năng của thị trường chứng khoán 32
2.1.1.3 Cơ cấu của thị trường chứng khoán 34
2.1.1.4 Đối tượng tham gia thị trường chứng khoán 35
2.1.1.5 Thị trường chứng khoán Việt Nam 35
2.1.1.6 Chỉ số chứng khoán VN-Index 36
2.1.2 Mối quan hệ giữa TTCK với các biến số khác của nền kinh tế 37
2.1.2.1 Lạm phát và thị trường chứng khoán 37
2.1.2.2 Cung tiền và thị trường chứng khoán 38
2.1.2.3 Tỷ giá hối đoái và thị trường chứng khoán 38
2.1.2.4 Giá vàng và thị trường chứng khoán 40
2.2 Tổng quan về diễn biến của TTCK Việt Nam 2010 – 2015 41
2.2.1 Giai đoạn 2010 đến 2011 41
2.2.2 Giai đoạn năm 2012 43
2.2.3 Giai đoạn năm 2013 44
Trường Đại học Kinh tế Huế
Trang 52.2.4 Giai đoạn năm 2014 cho đến nay 45
Kết luận chương 2 48
CHƯƠNG 3: ỨNG DỤNG MÔ HÌNH ARIMA TRONG DỰ BÁO CHỈ SỐ VN-INDEX VÀ TỶ SUẤT SINH LỢI CỦA THỊ TRƯỜNG 49
3.1 Kết quả nghiên cứu 49
3.1.1 Dữ liệu nghiên cứu 49
3.1.2 Đặc tính của dữ liệu 49
3.1.3 Xây dựng mô hình thực nghiệm 52
3.1.4 Dự báo chỉ số VN-Index trong ngắn hạn với mô hình ARIMA 58
3.2 Thảo luận 60
Kết luận chương 3 62
PHẦN III: KẾT LUẬN 63
1 Kết luận 63
2 Hạn chế 64
2.1 Hạn chế của mô hình 64
2.2 Hạn chế của đề tài 65
3 Hướng phát triển của đề tài 66
TÀI LIỆU THAM KHẢO 68
PHỤ LỤC 72
Trường Đại học Kinh tế Huế
Trang 6DANH MỤC CÁC KÍ HIỆU VÀ CHỮ VIẾT TẮT
AR Tự hồi quy (Autoregressive)
ARIMA Tự hồi quy tích hợp trung bình trượt (Autogressive Integrated Moving
Average)CSCK Chỉ số chứng khoán
CSTT Chính sách tiền tệ
CTCK Công ty chứng khoán
HĐKD Hoạt động kinh doanh
HNX Sàn giao dịch chứng khoán Hà Nội
HOSE Sàn giao dịch chứng khoán TP Hồ Chí Minh
MA Trung bình trượt (Moving Average)
NHNN Ngân hàng Nhà nước
PACF Hàm tự tương quan riêng phần
TSSL Tỉ suất sinh lợi
TTCK Thị trường chứng khoán
TTCP Thủ tướng Chính phủ
TTGDCK Trung tâm giao dịch chứng khoán
Trường Đại học Kinh tế Huế
Trang 7DANH MỤC HÌNH VẼ VÀ BIỂU ĐỒ
Trang
Hình 1.1: Sơ đồ quy trình dự báo 10
Hình 1.2: Các thành phần của một chuỗi thời gian 13
Hình 1.3: Phân tích chuỗi số liệu từ năm 1976 đến 1999 trong dự báo 14
Hình 1.4: Các bước của phương pháp Box-Jenkins 24
Hình 2.5: Diễn biến VN-Index 2010 – 2011 41
Hình 2.6: Diễn biến VN-Index năm 2012 43
Hình 2.7: Diễn biến VN-Index năm 2013 45
Hình 2.8: Diễn biến VN-Index 2014 – nay 46
Hình 3.9: Thống kê chỉ số VN-Index 49
Hình 3.10: Đồ thị chuỗi VN-Index từ 2010 – 2015 50
Hình 3.11: ACF và PACF chuỗi VN-Index 50
Hình 3.12: TSSL CSCK VN-Index từ 2010 – 2015 51
Hình 3.13: Thống kê TSSL của chỉ số VN-Index 52
Hình 3.14: Dự báo trong mẫu cho TSSL 54
Hình 3.15: PPXS phần dư mô hình ARIMA(1,1,0) 54
Hình 3.16: Phần dư, giá trị thực và giá trị ước lượng từ mô hình ARIMA(1,1,0) 55
Hình 3.17: Giá trị thực và dự báo cho chỉ số VN-Index 56
Hình 3.18: Giá trị thực và dự báo cho chỉ số VN-Index 57 Trường Đại học Kinh tế Huế
Trang 8Hình 20: Kiểm định nghiệm đơn vị cho chuỗi gốc VN-Index 73
Hình 21: ACF và PACF của chuỗi TSSL CSCK gốc VN-Index 74
Hình 22: Kiểm định nghiệm đơn vị chuỗi TSSL CSCK gốc VN-Index 75
Hình 23: Ước lượng mô hình ARIMA(1,1,0) 77
Hình 24: Ước lượng mô hình ARIMA(2,1,0) 77
Hình 25: Ước lượng mô hình ARIMA(0,1,1) 78
Hình 26: Ước lượng mô hình ARIMA(0,1,2) 78
Hình 27: Ước lượng mô hình ARIMA(1,1,1) 79
Hình 28: Ước lượng mô hình ARIMA(1,1,2) 79
Hình 29: Ước lượng mô hình ARIMA(2,1,1) 80
Hình 30: Ước lượng mô hình ARIMA(2,1,2) 80
Hình 31: Kiểm tra tự tương quan phần dư mô hình ARIMA(1,1,0) 81
Hình 32: ACF và PACF của phần dư mô hình ARIMA(1,1,0) 82
Hình 33: Kiểm tra tự tương quan phần dư mô hình ARIMA(0,1,1) 83
Hình 34: Kiểm tra tự tương quan phần dư mô hình ARIMA(2,1,1) 84
Trường Đại học Kinh tế Huế
Trang 9DANH MỤC BIỂU BẢNG
Trang
Bảng 1.1: Nhận dạng mô hình ARIMA(p,q) 25
Bảng 3.2: Xác định mô hình ARIMA(p,d,q) 53
Bảng 3.3: Giá trị thực tế và dự báo điểm ngoài mẫu cho chỉ số VN-Index 57
Bảng 3.4: Giá trị dự báo khoảng cho chỉ số VN-Index 58
Bảng 3.5: Giá trị dự báo điểm cho chỉ số VN-Index gốc và tỷ suất sinh lợi 59
Bảng 3.6: Giá trị dự báo khoảng cho chỉ số VN-Index gốc và tỷ suất sinh lợi 60
Trường Đại học Kinh tế Huế
Trang 10TÓM TẮT ĐỀ TÀI
Ngày nay, đời sống kinh tế xã hội đang từng bước phát triển đã nâng cao hơn nữavai trò của công tác dự báo trong mọi lĩnh vực Vấn đề đặt ra là làm sao để dự báochính xác chiều hướng vận động của đối tượng đang nghiên cứu là một điều không
hề dễ dàng Vào những năm 70 của thế kỷ XIX, phương pháp chuỗi thời gian ra đời
đã mở ra một kỷ nguyên mới cho hoạt động dự báo Với phương pháp chuỗi thờigian (hay còn gọi là Box-Jenkins), các nhà nghiên cứu đã tiến hành dự báo chonhiều biến số kinh tế khác nhau, và đa phần họ đều đi đến kết luận chung rằngphương pháp chuỗi thời gian là một phương pháp đơn giản nhưng tỏ ra rất hiệu quảtrong công tác dự báo ngắn hạn
Trước thực tế như vậy, tôi xin trình bày đề tài nghiên cứu “Ứng dụng mô hìnhARIMA trong dự báo chỉ số VN-Index” Mục tiêu cốt lõi của đề tài là tiến hành dựbáo cho tỷ suất sinh lợi chỉ số chứng khoán VN-Index, từ đó làm căn cứ đưa ra kếtquả dự báo cho chỉ số VN-Index, tạo tiền đề cho các nhà đầu tư, doanh nghiệp cũngnhư những nhà hoạch định chính sách đưa ra được các biện pháp tốt nhất trong quảntrị rủi ro và thúc đẩy thị trường Đồng thời thông qua đề tài này, tôi cũng muốnkiểm nghiệm xem liệu những mô hình ARIMA đã được cả thế giới đánh giá rất cao
đó có phù hợp với thị trường chứng khoán Việt Nam hay không
Trên cơ sở thực tiễn chuỗi dữ liệu chỉ số chứng khoán VN-Index sau khi chuyển
về chuỗi tỷ suất sinh lợi, thông qua các tiêu chí chung đã được nhiều nhà nghiêncứu đề xuất như AIC, SIC, R2, kết hợp với quá trình đánh giá, phân tích và cuốicùng cũng đã lựa chọn được mô hình ARIMA(1,1,0) làm mô hình dự báo cho tỷsuất sinh lợi chỉ số VN-Index Kết quả dự báo của mô hình được đánh giá là tươngđối sát với giá trị thực tế, giá trị dự báo cho chỉ số VN-Index biến động tăng dầntrong tương lai Những kết quả này là căn cứ cho các nhà đầu tư, doanh nghiệp vàcác nhà hoạch định chính sách đưa ra được những quyết định phù hợp và đúng đắn.Trường Đại học Kinh tế Huế
Trang 11PHẦN I: ĐẶT VẤN ĐỀ
1 Lý do lựa chọn đề tài
Ra đời vào đầu năm 2000, thị trường chứng khoán (TTCK) Việt Nam được biếtđến như một kênh đầu tư hết sức hấp dẫn đối với các nhà đầu tư, chính khả năngsinh lợi khổng lồ mà thị trường mang lại đã thu hút rất nhiều nhà đầu tư, doanhnghiệp coi TTCK là nơi tạo ra nguồn thu nhập và huy động vốn chủ yếu của họ.Tuy nhiên, bên cạnh mức sinh lợi cao, đây cũng là hoạt động luôn tồn tại nhiều rủi
ro tiềm ẩn bởi nhà đầu tư không phải lúc nào cũng dự đoán được chính xác xuhướng của giá cổ phiếu trong tương lai Theo lý thuyết định giá chứng khoán, nếuTTCK hoạt động hiệu quả thì thông tin về giá chứng khoán trong quá khứ khôngthể được sử dụng để dự đoán cho diễn biến của giá chứng khoán trong tương lai, bởikhi đó giá chứng khoán vận động một cách hoàn toàn ngẫu nhiên Nhưng trong thực
tế, kể cả ở những nước có thị trường phát triển, giả định về thị trường hiệu quảkhông hẳn là phù hợp, đặc biệt ở nước ta, TTCK còn non trẻ, mới chỉ mang tính thửnghiệm và hoạt động với khá nhiều quy định giới hạn chặt chẽ, các nhà đầu tư bướcđầu làm quen với loại hình đầu tư mới này nên trong hành vi đầu tư còn ẩn chứanhững đặc điểm riêng Chính điều này đã tạo ra những đặc thù trong sự vận độngcủa giá chứng khoán, do đó việc đưa ra phân tích chuỗi thời gian về xu hướng biếnđộng về giá cổ phiếu cho thị trường là rất có ý nghĩa Nếu các nhà đầu tư, doanhnghiệp không nghiên cứu phân tích kỹ lưỡng trên góc độ lý luận và thực tiễn, khônglường hóa được rủi ro tiềm ẩn mà mình phải đối mặt trong tương lai là bao nhiêu thìquả thực rất khó để thành công Do đó, việc dự báo chính xác sự biến động giá của
cổ phiếu để có một sách lược phù hợp và đúng đắn nhằm phục vụ cho công việckinh doanh của các cá nhân, tổ chức hay hoạch địch chiến lược của một quốc gia đãthu hút rất nhiều sự quan tâm của các nhà kinh tế lượng tài chính trong vàngoài nước
Trường Đại học Kinh tế Huế
Trang 12Kể từ khi ra đời cho đến nay, TTCK Việt Nam đã chứng kiến biết bao giai đoạnthăng trầm, lúc thì tăng trưởng cực nóng, tỉ suất sinh lợi thị trường luôn ở mức cao
kỉ lục, lúc lại sụt giảm mạnh, tỉ suất sinh lợi thị trường có khi chạm đến ngưỡng âmkhá lớn Điển hình đáng chú ý vào năm 2008, thị trường lao dốc một cách đột ngộttới mức mà không ai ngờ tới, từ hơn 800 điểm vào đầu năm 2008 giảm còn hơn 300điểm vào cuối năm, giảm hơn 70% Thị trường đảo chiều đột ngột và mạnh mẽkhiến nhiều nhà đầu tư ngỡ ngàng, lợi nhuận của họ bị sụt giảm một cách nghiêmtrọng và tiêu tan trong phút chốc, để lại những khoản lỗ không hề nhỏ cho các nhàđầu tư Những thay đổi thường xuyên và liên tục một cách chóng mặt như vậy càngchứng tỏ được tầm quan trọng của việc dự báo đối với các nhà đầu tư cũng như cácdoanh nghiệp Tại thị trường Việt Nam, sự biến động của chỉ số VN-Index phản ánhrủi ro hệ thống, vì vậy, việc dự báo được sự tăng giảm của VN-Index cũng đồngthời giúp các nhà đầu tư nhận biết chiều hướng biến động giá của các cổ phiếu trênthị trường này, qua đó tạo nên cái nhìn đúng đắn hơn về khả năng kiếm lời củamình khi quyết định lựa chọn đầu tư vào cổ phiếu này thay vì các cổ phiếu khác;giúp các doanh nghiệp biết mình đang đứng ở đâu và phải làm gì trong tương lai đểcải thiện tình hình hiện tại; giúp các nhà hoạch định chính sách đưa ra được nhữngchính sách đúng đắn để thúc đẩy sự tăng trưởng hay cải thiện sự sụt giảm của thịtrường
Chính vì sự biến động không ngừng như vậy, cho nên việc dự báo VN-Indexluôn luôn là cần thiết trong mọi giai đoạn và mọi trường hợp Những nghiên cứutrước đây về dự báo chỉ số VN-Index tuy đã được tiến hành nhưng trong phạm vithời gian đã cũ, cái mà chúng ta muốn hướng đến là dự báo cho tương lai, đặc biệt
là trong tương lai gần để có căn cứ ra quyết định đúng đắn và phù hợp, chính vì vậy
tôi đã lựa chọn nghiên cứu đề tài: “Ứng dụng mô hình ARIMA trong dự báo chỉ
số VN-Index” với hi vọng sẽ cung cấp một cái nhìn chuẩn xác hơn về tình hình
hiện tại cũng như trong tương lai của TTCK Việt Nam, tạo nền tảng cơ bản giúpcho các nhà đầu tư, doanh nghiệp và các nhà hoạch định chính sách có thể đưa raTrường Đại học Kinh tế Huế
Trang 13được những quyết định sáng suốt trong hoạt động đầu tư, quản trị rủi ro và hoạchđịnh các sách lược, góp phần thúc đẩy thị trường hoạt động hiệu quả hơn.
2 Mục tiêu nghiên cứu
Tổng hợp những lí luận cơ bản trong phân tích chuỗi thời gian và khả năng ứngdụng quan trọng của nó trong việc dự báo các biến số kinh tế xã hội
Nghiên cứu chiều hướng vận động của chỉ số VN-Index từ năm 2010 đến nay
Xác định những nguyên nhân cơ bản giải thích cho sự biến động bất thường củachỉ số VN-Index trong giai đoạn nghiên cứu
Dự báo tỷ suất sinh lợi của chỉ số chứng khoán VN-Index, từ đó suy ra kết quả
dự báo cho chỉ số VN-Index trong 10 phiên giao dịch tiếp theo
3 Phương pháp nghiên cứu
Cơ sở dữ liệu: Chỉ số chứng khoán VN-Index lấy từ website cophieu68.com, bắtđầu từ ngày 01/04/2010 đến ngày 31/03/2015
Phương pháp nghiên cứu: Ứng dụng mô hình dự báo ngắn hạn ARIMA
Công cụ xử lý số liệu: Phần mềm Eviews 6.0, SPSS 18.0 và Excel 2010
4 Đối tượng nghiên cứu
Đề tài hướng đến đối tượng nghiên cứu là chuỗi thời gian của chỉ số chứng khoánVN-Index tính từ năm 2010 cho đến nay Chuỗi chỉ số chứng khoán VN-Index saukhi thu thập sẽ được chuyển đổi về tỷ suất sinh lợi và căn cứ vào chuỗi tỷ suất sinhlợi này để phục vụ cho mục tiêu nghiên cứu của đề tài như đã đề cập ở trên
Trường Đại học Kinh tế Huế
Trang 14 Đề tài sử dụng số liệu đơn chuỗi thời gian, chỉ nghiên cứu trên dữ liệu quá khứ tỷsuất sinh lợi chỉ số chứng khoán VN-Index mà không sử dụng thêm bất kì số liệunào khác.
Đề tài chỉ tập trung phân tích sự vận động của dữ liệu quá khứ và dự báo chotương lai chứ không phân tích cụ thể các nhân tố bên ngoài tác động đến tỷ suấtsinh lợi chỉ số VN-Index
6 Kết cấu đề tài: Kết cấu đề tài gồm có 3 phần
Phần I: Đặt vấn đề Phần này nêu ra lí do lựa chọn đề tài, mục đích, đối tượng vàphạm vi nghiên cứu
Phần II: Nội dung và kết quả nghiên cứu, gồm có:
Chương 1 cung cấp những kiến thức lí luận nền tảng về các khái niệm, thuậtngữ sử dụng trong bài nghiên cứu như chỉ số chứng khoán, tỉ suất sinh lợi,
và lí thuyết về các mô hình chuỗi thời gian như tính dừng, nhận dạng và ướclượng mô hình ARIMA dùng cho mục đích dự báo Chương này cũng điểmqua tình hình thực tiễn ứng dụng các mô hình chuỗi thời gian trong dự báo
Chương 2 cung cấp các thông tin sơ lược về chỉ số VN-Index cũng như cáinhìn tổng quan về diễn biến của chỉ số chứng khoán VN-Index từ đầu năm
2010 cho đến nay
Chương 3 cung cấp kết quả nghiên cứu, xác định mô hình thực nghiệm vàtiến hành dự báo tỷ suất sinh lợi của chỉ số chứng khoán VN-Index, từ đó suyTrường Đại học Kinh tế Huế
Trang 15ra kết quả dự báo cho chỉ số VN-Index trong thời gian 10 ngày giao dịch tiếptheo từ 01/04/2015 đến 14/04/2015 Từ kết quả dự báo sẽ đưa ra phần nhậnxét, trao đổi và thảo luận những vấn đề liên quan đến kết quả.
Phần III: Kết luận Phần này sẽ nêu rõ những gì mà đề tài đã làm được, hạn chế
là gì và hướng phát triển đề tài như thế nào
Phần cuối cùng mà đề tài trình bày là các tài liệu tham khảo, phụ lục hỗ trợ đểgiải thích cho những kết quả có được của đề tài
Trường Đại học Kinh tế Huế
Trang 16PHẦN II: NỘI DUNG VÀ KẾT QUẢ NGHIÊN CỨU
CHƯƠNG 1: CƠ SỞ LÍ LUẬN VÀ THỰC TIỄN VỀ CHỈ SỐ CHỨNG
KHOÁN, TỶ SUẤT SINH LỢI THỊ TRƯỜNG VÀ MÔ HÌNH ARIMA
TRONG DỰ BÁO
Chương 1 sẽ cung cấp một cái nhìn rõ nét về các khái niệm cơ bản Những kháiniệm về tỷ suất sinh lợi, rủi ro, dự báo, chuỗi thời gian, sẽ được làm rõ giúp ngườiđọc dễ dàng nhận diện được những thuật ngữ sử dụng xuyên suốt bài nghiên cứu
1.1 Cơ sở lí luận về chỉ số chứng khoán, tỉ suất sinh lợi và rủi ro của thị trường
1.1.1 Chỉ số chứng khoán
Chứng khoán: Là các công cụ để huy động vốn trung và dài hạn, là các giấy tờ
có giá, có khả năng chuyển đổi, chuyển nhượng nhằm xác nhận quyền sở hữu, quan
hệ vay nợ giữa người nắm giữ nó và chủ thể phát hành ra nó Đối với mỗi loạichứng khoán thường có các tính chất sau:
- Tính thanh khoản (tính lỏng) của một chứng khoán: Là khả năng chuyển đổi giữachứng khoán đó sang tiền mặt Tính lỏng của chứng khoán thể hiện qua việc chứngkhoán đó được mua bán, trao đổi trên thị trường
- Tính sinh lời: Thể hiện ở thu nhập của nhà đầu tư, được sinh ra từ việc gia tăng giáchứng khoán trên thị trường, hay các khoản tiền lãi được trả hàng năm
- Tính rủi ro: Đây là đặc trưng cơ bản của chứng khoán.Trong quá trình trao đổi,mua đi bán lại, giá của chứng khoán bị giảm hoặc mất hoàn toàn ta gọi là rủi ro
Chỉ số chứng khoán: Là một giá trị thống kê phản ánh tình hình của TTCK,
được tổng hợp từ một danh mục các cổ phiếu theo những phương thức nhất định.Thông thường, một danh mục sẽ bao gồm các cổ phiếu có những điểm chung: cùngniêm yết trên một Sở giao dịch chứng khoán, cùng một ngành nghề hay cùng mứcvốn hóa thị trường Chỉ số chứng khoán được tính theo phương pháp bình quân giaquyền, thể hiện giá bình quân hiện tại so với giá bình quân thời kì gốc đã chọn.Hiện nay, trên TTCK Việt Nam có hai chỉ số chứng khoán chính là VN-Index (sànTrường Đại học Kinh tế Huế
Trang 17HOSE) và HNX-Index (sàn HNX) Về cơ bản, chỉ số chứng khoán được tính theo
công thức:
n
1 i 1 i
i 1 n
Trong đó: P1i: Giá thị trường của cổ phiếu i tại thời điểm hiện tại
Q1i: Khối lượng lưu hành cổ phiếu i tại thời điểm hiện tại
P0i: Giá cổ phiếu i tại thời điểm được chọn làm gốc
Q0i: Khối lượng lưu hành của cổ phiếu i tại thời điểm được chọn làm gốc
(Đối với TTCK Việt Nam, năm 2000 chính là năm được chọn làm gốc)
1.1.2 Tỉ suất sinh lợi và rủi ro của thị trường
Tỷ suất sinh lợi của thị trường: Là thông tin để đánh giá mức độ hấp dẫn khi
đầu tư trên TTCK Tương tự tỷ suất sinh lợi cổ phiếu, tỷ suất sinh lợi của thị trườngđược tính dựa trên chuỗi dữ liệu chỉ số chứng khoán, là phần trăm giữa mức lợinhuận thu được so với mức giá chứng khoán được chọn làm mốc Công thức tính tỷsuất sinh lợi thị trường cụ thể như sau:
Ri, Index= ,
, 1 ln(Pt, Index) – ln(Pt-1, Index) = ln ,
Trong đó: Pt, Indexlà chỉ số chứng khoán tại thời điểm t
Pt-1, Indexlà chỉ số chứng khoán tại thời điểm t-1Trong công thức trên, có thể lấy ln (lôgarit tự nhiên cơ số e) của chuỗi giá chứngkhoán sau đó lấy sai phân ta cũng tính toán ra được tỷ suất sinh lợi của thị trường
Rủi ro của thị trường: Được đo lường bằng phương sai hoặc độ lệch chuẩn
của chuỗi dữ liệu tỷ suất sinh lợi chỉ số chứng khoán
Trang 18Độ lệch chuẩn: 2
Ở đây, thuật ngữ rủi ro thị trường không phân biệt đâu là rủi ro hệ thống và phi
hệ thống, điều này không ảnh hưởng đến mục tiêu nghiên cứu của đề tài, bởi vì đềtài chỉ tập trung vào việc mô phỏng và phân tích biến động của chuỗi tỷ suất sinh lợichỉ số chứng khoán ở quá khứ, hiện tại và tương lai, chứ không chú trọng phân tích
và giải thích các nhân tố ảnh hưởng khác tạo nên sự biến động của chuỗi tỷ suấtsinh lợi chỉ số chứng khoán
1.2 Cơ sở lí luận về mô hình ARIMA dùng trong dự báo
1.2.1 Bài toán dự báo
1.2.1.2 Phân loại dự báo: Dựa theo phương pháp dự báo có thể chia dự
báo thành phương pháp định tính và phương pháp định lượng
Trường Đại học Kinh tế Huế
Trang 19a Phương pháp định tính
Các phương pháp định tính chủ yếu dựa vào kinh nghiệm và phán đoán củangười nghiên cứu, thường được sử dụng khi dữ liệu lịch sử không sẵn có hay cónhưng không đầy đủ, hoặc không đáng tin cậy, hoặc đối tượng dự báo bị ảnh hưởngbởi các nhân tố không thể lượng hóa được Do dựa vào ý kiến chủ quan của ngườilàm dự báo nên phương pháp định tính dễ dẫn đến kết quả dự báo thường sai lệch sovới thực tế Phương pháp định tính gồm có: phương pháp tổng hợp lực lượng bánhàng, phương pháp lấy ý kiến chuyên gia, phương pháp Delphi,
b Phương pháp định lượng
Phương pháp định lượng dựa vào các mô hình toán và giả định rằng dữ liệu quákhứ cũng như các yếu tố liên quan khác có thể được kết hợp để đưa ra các dự đoántin cậy cho tương lai Nói cách khác, dựa trên những dữ liệu quá khứ để phát hiệnchiều hướng vận động của đối tượng phù hợp với một mô hình toán học nào đó vàđồng thời sử dụng mô hình này làm mô hình ước lượng Tiếp cận định lượng trêngiả định rằng giá trị tương lai của biến dự báo sẽ phụ thuộc vào xu thế vận động củađối tượng đó trong quá khứ Có hai phương pháp dự báo định lượng:
- Phương pháp chuỗi thời gian dựa trên phân tích chuỗi dữ liệu của một biến số duynhất theo thời gian, biến độc lập có thể là thời gian, độ trễ biến quan sát hay độ trễcủa sai số Giả định chủ yếu là trong tương lai biến số dự báo sẽ giữ nguyên chiềuhướng vận động đã xảy ra trong quá khứ và hiện tại
- Phương pháp kinh tế lượng (mô hình nhân quả) dựa trên giả định biến số dự báo
có thể được giải thích bởi nhiều biến số độc lập khác Mục đích của mô hình nhânquả là tìm ra mô hình toán mô tả tất cả các mối quan hệ giữa các biến số và sử dụng
nó để dự báo cho biến số đang được quan tâm
Nhìn chung, phương pháp chuỗi thời gian và phương pháp nhân quả có lợi thế là
dự báo hoàn toàn khách quan dựa trên giá trị có trước của các biến số đã được chọn;
có những tiêu chí để đo lường độ chính xác của dự báo nên có thể dễ dàng so sánhTrường Đại học Kinh tế Huế
Trang 20và lựa chọn ra mô hình dự báo tốt nhất; khi mô hình đã được xây dựng thì việc tìm
ra kết quả dự báo điểm hay dự báo khoảng sẽ rất đơn giản Tuy nhiên, hạn chế củaphương pháp định lượng là kết quả dự báo chỉ có giá trị trong ngắn hoặc trung hạn,trong dài hạn với khoảng cách dự báo quá dài sẽ làm sai số tăng lên nên kết quả dựbáo có thể không chính xác
1.2.1.3 Trình tự một quá trình dự báo
Hình 1.1: Sơ đồ quy trình dự báo
Nguồn: Wilson & Keating, 2007
1.2.1.4 Các công cụ thống kê đánh giá mức độ chính xác của dự báo
Có sáu thước đo đánh giá mức độ chính xác của dự báo, dùng để so sánh độchính xác của hai hay nhiều phương pháp khác nhau, đo lường sự hữu ích hay độ tincậy của nhiều phương pháp cụ thể và giúp tìm ra một giải pháp tối ưu, bao gồm:
Trường Đại học Kinh tế Huế
Trang 21Sai số dự báo tuyệt đối trung bình (Mean Absolute Error):
n t
t 1
1ˆ
t 1 t
ˆu1MAPE
n y
Sai số bình phương trung bình (Mean Squared Error):
n 2 t
t 1
1ˆ
n
Sai số bình phương trung bình gốc (Root Mean Squared Error): RMSE =√
Trong đó: ˆut là sai số dự báo trong giai đoạn t
ytlà giá trị dự báo trong giai đoạn t
n là số quan sát trong giai đoạn kiểm tra
Hệ số không ngang bằng Theil’s U (Theil Inequality Coeficient): U =
Hệ số này chính là tỷ số giữa RMSE của mô hình dự báo gốc và RMSE của môhình dự báo thô giản đơn (mô hình Naive) Mô hình Naive sử dụng giá trị thực tế ytcho giá trị dự báo kế tiếp yt+1 Nếu giá trị Theil’s U càng tiến về 0 thì mô hình dựbáo càng chính xác; giá trị này lớn hơn 1 hàm ý rằng sai số dự báo của mô hình gốclớn hơn mô hình Naive, do đó mô hình là chưa tốt để tiến hành dự báo Trong thực
tế giá trị U<0.55 được đánh giá là rất tốt
Trang 22tháng) hay dạng dữ liệu (dữ liệu gốc, dữ liệu chuyển hóa logarit, ) thì chỉ cóMAPE và Theil’s U là có thể sử dụng được Nếu chuỗi dữ liệu chỉ có một vài sai số
dự báo lớn thì không nên sử dụng chỉ tiêu MSE hay RMSE mà nên sử dụng MAE.Khi tất cả những sai số dự báo là tương đương xấp xỉ nhau, chúng ra nên dùng côngthức MSE Khi chúng ta có những chỉ tiêu MAE, MSE, RMSE được tính đồng thờithì việc lựa chọn sẽ căn cứ vào công thức có giá trị nhỏ nhất Tóm lại, tất cả các chỉtiêu trên là để xem xét một mô hình có tốt hay không, từ đó làm căn cứ cho việc lựachọn ra mô hình tốt nhất phù hợp với mục tiêu nghiên cứu
1.2.2 Chuỗi thời gian
1.2.2.1 Khái niệm
Chuỗi thời gian là một tập hợp các quan sát của một hay nhiều đại lượng đượcghi nhận theo thời gian Chuỗi thời gian có thể có những tần suất khác nhau nhưtheo năm, quý, tháng, tuần, ngày, giờ, Dữ liệu chuỗi thời gian phổ biến nhất là dữliệu tài chính được ghi nhận qua thời gian dài, thường có số quan sát khá lớn Ví dụnhư tổng sản phẩm quốc nội GDP, chỉ số giá tiêu dùng CPI, chỉ số chứng khoánVN-Index, lạm phát, tỷ giá, doanh số của một cửa hàng,
Các giá trị chuỗi thời gian của đại lượng y được kí hiệu: y1, y2, , yt, , yn; trong
đó ytlà giá trị quan sát của biến y tại thời điểm t Những biến đi sau hay trễ s thời kìvới ytgọi là biến trễ, được kí hiệu yt-s, Các biến đi trước hay dẫn s thời kì với ytgọi
là biến dẫn, kí hiệu yt+s
Một chuỗi thời gian thông thường gồm có các thành phần cơ bản như tính xuhướng (trend), tính mùa vụ (seasonal), tính chu kỳ (cyclical), các điểm bất thường(outliers) và tính ngẫu nhiên (irregular)
Trường Đại học Kinh tế Huế
Trang 23Hình 1.2: Các thành phần của một chuỗi thời gian
Nguồn: QMS 320
- Tính xu hướng: Thành phần này để chỉ xu hướng tăng hay giảm của đại lượng y
trong thời gian dài Về mặt đồ thị thành phần này có thể biểu diễn bởi một đườngthẳng hay đường cong trơn Nếu chuỗi thời gian mà không bao hàm các yếu tố xuhướng, tức không tăng hay không giảm theo thời gian thì chuỗi thời gian đó có hiệntượng dừng theo giá trị trung bình (stationary mean)
- Tính mùa vụ: Là chiều hướng tăng hay giảm của đại lượng y tính theo mùa trong
năm (mùa có thể là tháng, quý, ) Ví dụ: lượng tiêu thụ hàng hóa tăng lên vào dịptết Nguyên đán, hay lượng vé đi bơi tăng vào mùa hè,
- Tính chu kì: Là sự thay đổi tăng (giảm) của chuỗi dữ liệu lên xuống xoay quanh xu
hướng dài hạn Chu kì là đối tượng khó dự đoán trong dài hạn
- Tính ngẫu nhiên: Chỉ sự thay đổi bất thường của các giá trị trong chuỗi thời gian
mà không xác định được chiều hướng vận động của nó Những thay đổi này đượcgây ra do những yếu tố bên ngoài dữ liệu và chúng ta không thể dự đoán đượcchúng Mục đích của chúng ta là phải mô hình hóa mọi thành phần của chuỗi thờigian cho tới khi thành phần sai số là ngẫu nhiên
1.2.2.2 Chuỗi thời gian trong dự báo
Việc quan sát mẫu trong dự báo là rất quan trọng, cần phải xác định rõ đâu là giaiđoạn ước lượng, giai đoạn hậu nghiệm, tiền nghiệm, giai đoạn dự báo lùi, để côngTrường Đại học Kinh tế Huế
Trang 24tác dự báo phù hợp hơn với mục tiêu nghiên cứu Dưới đây là một ví dụ minh họa
về chuỗi thời gian trong dự báo từ năm 1976 đến năm 1999:
Hình 1.3: Phân tích chuỗi số liệu từ năm 1976 đến 1999 trong dự báo
Nguồn: Nguyễn Trọng Hoài (2001)
1.2.3 Tính dừng
1.2.3.1 Khái niệm
Dữ liệu của bất kỳ chuỗi thời gian nào đều có thể được coi là được tạo ra từ một
quá trình ngẫu nhiên và một tập hợp dữ liệu cụ thể có thể được coi là một kết quả
cá biệt của quá trình ngẫu nhiên đó Hay nói các khác, có thể xem quá trình ngẫunhiên là tổng thể và một tập hợp dữ liệu cụ thể là một mẫu có được của tổng thể đó.Một tính chất của quá trình ngẫu nhiên được các nhà phân tích về chuỗi thời gianđặc biệt quan tâm và xem xét kỹ lưỡng là Tính dừng Một quá trình ngẫu nhiên Yt
được coi là dừng nếu kỳ vọng, phương sai và hiệp phương sai tại cùng một độ trễcủa nó không đổi theo thời gian
Cụ thể, Ytđược gọi là dừng nếu:
- Phương sai: Var(y t )= E(y t –µ) 2 = σ 2 (t) (2)
- Đồng phương sai: Cov(y t ,y t+k ) = E[(y t – µ)(y t+k – µ)]= γ k ( t) (3)
Điều kiện thứ 3 có nghĩa là hiệp phương sai giữa ytvà yt+kchỉ phụ thuộc vào độtrễ về thời gian (k) giữa hai thời đoạn chứ không phụ thuộc vào thời điểm t Ví dụTrường Đại học Kinh tế Huế
Trang 25Cov(y2,y7) = Cov(y10,y15) = Cov(y30,y35) = … = Cov(yt,yt+5) Nhưng Cov(yt,yt+5) cóthể khác Cov(yt,yt+6)… Quá trình ngẫu nhiên yt được coi là không dừng nếu nó viphạm ít nhất một trong ba điều kiện trên.
Gujarati (2003) cho rằng, mặc dù mối quan tâm chính của chúng ta là ở cácchuỗi dừng, nhưng thông thường ta lại hay gặp phải các chuỗi không dừng do bảnchất của chuỗi có yếu tố xu thế hoặc ngẫu nhiên, và đó dường như là bản chất củacác biến kinh tế Ví dụ cổ điển của trường hợp chuỗi không dừng là mô hình bướcngẫu nhiên, kinh tế lượng chuỗi thời gian thường chia bước ngẫu nhiền thành 2 loại:bước ngẫu nhiên không có hằng số và bước ngẫu nhiên có hằng số
1.2.3.2 Hậu quả của chuỗi không dừng
Trong mô hình hồi quy cổ điển, ta giả định rằng sai số ngẫu nhiên có kỳ vọngbằng không, phương sai không đổi và chúng không tương quan với nhau Với dữliệu là các chuỗi không dừng, các giả thiết này bị vi phạm, các kiểm định t, F mất
hiệu lực, ước lượng và dự báo không hiệu quả hay nói cách khác phương pháp OLS không áp dụng cho các chuỗi không dừng.
Điển hình là hiện tượng hồi quy giả mạo: nếu mô hình tồn tại ít nhất một biếnđộc lập có cùng xu thế với biến phụ thuộc, khi ước lượng mô hình ta có thể thuđược các hệ số có ý nghĩa thống kê và hệ số xác định R2rất cao Nhưng điều này cóthể chỉ là giả mạo, R2 cao có thể là do hai biến này có cùng xu thế chứ không phải
do chúng tương quan chặt chẽ với nhau
Theo Gujarati (2003), nếu một chuỗi thời gian là không dừng, ta chỉ có thểnghiên cứu hành vi của nó trong phạm vi thời gian đang xem xét Lúc này chúng tachỉ xem xét được những tình tiết của hiện tại và quá khứ chứ không dự báo đượccho tương lai vì chuỗi không dừng biến động một cách không hội tụ, tức giá trị quákhứ lúc này tác động đến giá trị hiện tại một cách vô hạn và không bao giờ kết thúc.Khi xây dựng các mô hình dự báo, chúng ta giả định rằng các xu hướng hiện tại vàquá khứ giữ nguyên chiều hướng vận động cho tương lai Do vậy, nếu thực hiện môTrường Đại học Kinh tế Huế
Trang 26hình hóa trên một chuỗi dữ liệu không dừng thì việc dự báo cho tương lai rất khậpkhiễng và dường như không có ý nghĩa.
Trong thực tế, phần lớn các chuỗi thời gian đều là chuỗi không dừng, kết hợpvới những hậu quả trình bày trên đây cho thấy tầm quan trọng của việc xác địnhmột chuỗi thời gian là có tính dừng hay không
1.2.3.3 Kiểm định tính dừng
a Dựa trên đồ thị của chuỗi thời gian
Một cách trực quan chuỗi yt có tính dừng nếu như đồ thị y=f(t) cho thấy trungbình và phương sai của quá trình yt không đổi theo thời gian Ngược lại, nếu nhìnvào đồ thị của một chuỗi theo thời gian mà trung bình của nó có xu hướng tănghoặc giảm theo từng thời kỳ thì lúc này có thể suy đoán rằng điều kiện một bị viphạm (điều kiện trung bình không đổi theo thời gian), nên chuỗi đó là không dừng.Phương pháp này cho ta cái nhìn trực quan, đánh giá ban đầu về tính dừng củachuỗi thời gian Tuy nhiên, với những chuỗi thời gian có xu hướng không rõ ràng,phương pháp này trở nên khó khăn và đôi khi không chính xác
b Dựa trên lược đồ tự tương quan và tự tương quan riêng phần
* Tự tương quan (ACF)
Một cách kiểm định đơn giản tính dừng là dùng hàm tự tương quan (ACF
-Autocorelation Function), với độ trễ k, ký hiệu bằng ρk, được xác định như sau:
t t k k
t
cov(y , y )ACF(k)
Trường Đại học Kinh tế Huế
Trang 27Bartlett’s đã chỉ ra rằng nếu một chuỗi là ngẫu nhiên và dừng, thì các hệ số tựtương quan ρk sẽ có phân phối xấp xỉ chuẩn với kỳ vọng toán bằng 0 và phương sai1/n với n khá lớn, ~ N(0, 1/n).
Ta cần kiểm định giả thiết: H0: ρk= 0 (chuỗi dừng)
* Tự tương quan riêng phần (PACF)
Các hệ số tự tương quan ρk(k ≥ 2) phản ánh mức độ kết hợp tuyến tính của ytvà
yt+k Tuy nhiên, mức độ kết hợp giữa hai biến còn có thể do một số biến khác gây
ra Trong trường hợp này là ảnh hưởng từ các biến yt-1, …, yt-k+1 Do đó để đo độ kếthợp riêng rẽ giữa ytvà yt-kta sử dụng hàm tương quan riêng PACF với hệ số tươngquan riêng ρkkđược ước lượng theo công thức đệ quy của Durbin:
Trang 28H0: ρ1= ρ2= … = ρm= 0 (chuỗi đang xét là dừng)
H1: tồn tại ít nhất một ρk≠ 0 (chuỗi đang xét là chưa dừng)
Giả thiết H0được kiểm định bằng thống kê Q: 2
1
m
k k
Với n: kích thức mẫu, m: độ dài của trễ; ta có Q ~ Nếu Q > với mộtmức ý nghĩa xác định thì ta bác bỏ giả thiết Ho, tức ít nhất phải có một giá trị ρk ≠ 0,lúc này có thể suy đoán chuỗi đang xét chưa dừng và ngược lại
+ Một dạng khác của Q là thống kê Ljung-Box (LB): Với giả thiết Ho và H1tương tự như thống kê Q ở trên, ta có tiêu chuẩn kiểm định như sau:
Với Nếu LB > ta bác bỏ giả thiết Ho, tương tự lúc này có thểsuy đoán chuỗi đang xét là chưa dừng và ngược lại
Thống kê LB được xem là tốt hơn so với thống kê Q đối với các mẫu số nhỏ.Với Eviews, ta dễ dàng có được các giá trị của LB với các độ trễ khác nhau (cột Q-Stat) và xác suất nhỏ nhất để giả thiết H0bị bác bỏ (cột Prob)
c Kiểm định nghiệm đơn vị (Unit root test)
* Nhiễu trắng
Tính dừng là một giả định yếu hơn giả định phân phối chuẩn, tuy nhiên hồi quyvới chuỗi thời gian có tính dừng sẽ cho ta các thống kê đáng tin cậy, chỉ cần số quansát tăng lên thì độ tin cậy sẽ càng lớn Do vậy sai số ut không nhất thiết phải tuântheo phân phối chuẩn, miễn là mẫu quan sát đủ lớn Thay vào đó utđược giả định là
Trang 29những thông tin ẩn chứa trong utmà chúng ta có thể khai thác để cải thiện mô hìnhhồi quy.
* Bước ngẫu nhiên
Nếu y t = y t-1 +u t với utlà nhiễu trắng, thì ytđược gọi là bước ngẫu nhiên
* Kiểm định nghiệm đơn vị Dickey – Fuller (Unit root test)
Một tiêu chuẩn khác để kiểm định tính dừng là kiểm định nghiệm đơn vị, đượcgiới thiệu bởi Dickey (1976), Dickey & Fuller (1979); kiểm định này được sử dụngphổ biến trong nghiên cứu thay vì dùng lược đồ tương quan vì có tính học thuật vàchuyên nghiệp hơn Xét mô hình sau với utlà nhiễu trắng: y t = ρy t-1 +u t (1.1)Nếu ρ=1 thì ytlà bước ngẫu nhiên và không dừng Do đó để kiểm định tính dừngcủa ytta kiểm định giả thiết:
H0: ρ=1 (ytlà chuỗi không dừng)
H1: ρ≠1 (ytlà chuỗi dừng)Chúng ta biến đổi phương trình (1.1) thành:
yt– yt-1= ρyt-1- yt-1+ut
= (ρ – 1)yt-1+ut ∆Yt -1 = yt-1 + ut
Như vậy, các giả thiết có thể viết lại:
H0: 0 (ytlà chuỗi không dừng)
H1: 0 (ytlà chuỗi dừng)Trường Đại học Kinh tế Huế
Trang 30Ở đây ta không thể sử dụng kiểm định t vì yt có thể là chuỗi không dừng, hayDickey và Fuller cho rằng các giá trị t của hệ số yt-1 sẽ không tuân theo xác suấtStudent mà theo xác suất (tau statistic), kiểm định thống kê còn được gọi làkiểm định Dickey – Fuller Ta sử dụng tiêu chuẩn kiểm định như sau
yt là một chuỗi dừng và ngược lại.Tiêu chuẩn DF cũng được áp dụng cho các môhình sau:
1.2.3.4 Biến đổi chuỗi không dừng thành chuỗi dừng
Nếu một chuỗi thời gian không có yếu tố dừng, chúng ta phải biến đổi nó thànhdừng trước khi xây dựng mô hình ARIMA, phương pháp là lấy sai phân cấp d vớid=1 hoặc d=2, Cụ thể xét bước ngẫu nhiên: y t= yt-1+ ut với utlà nhiễu trắng Talấy sai phân cấp 1 của yt: D(yt) = yt- yt-1= ut Trong trường hợp này D(yt) là chuỗidừng vì utlà nhiễu trắng
Trường hợp tổng quát, với mọi chuỗi thời gian nếu sai phân cấp 1 của Ytchưadừng ta tiếp tục lấy sai phân cấp 2, 3… Các nghiên cứu đã chứng minh luôn tồn tạimột giá trị d xác định để sai phân cấp d của Ytlà chuỗi dừng Khi đó Ytđược gọi là
liên kết bậc d, ký hiệu là I(d) Sai phân cấp d được lấy như sau:
(1)(2)(3)
Trường Đại học Kinh tế Huế
Trang 31+ Sai phân cấp 1: D(yt) = yt-yt-1
+ Sai phân cấp 2: D(D(yt)) = D2(yt) = (yt-yt-1) - (yt-1- yt-2)
…
+ Sai phân cấp d: D(Dd-1(yt))
Nếu ytở dạng lôgarít thì D(yt) sẽ phản ánh phần trăm thay đổi của yt so với thời
kì trước đó, lúc này nếu yt là giá chứng khoán thì D(yt) chính là tỷ suất sinh lợi tạithời điểm t
1.2.4 Quá trình tự hồi quy (AR), trung bình trượt (MA) và các mô hình tự
hồi quy tích hợp trung bình trượt (ARMA)
Trước khi đi vào nghiên cứu các mô hình, chúng ta cần làm rõ khái niệm độ trễcủa một biến hay còn gọi là biến trễ: biến trễ là biến giá trị quá khứ của biến hiệntại Mô hình hồi quy không chỉ bao gồm biến hiện tại mà còn bao gồm giá trị quákhứ (giá trị trễ) Biến trễ thường gặp trong dữ liệu chuỗi thời gian Mô hình chứabiến phụ thuộc là biến trễ gọi là mô hình tự hồi quy, và nếu mô hình có độ trễ càngcao thì càng mất nhiều quan sát, đây là yếu tố cần chú ý khi lựa chọn mô hình
1.2.4.1 Quá trình tự hồi quy (AR – Autoregressive)
a Quá trình tự hồi quy bậc 1 – AR(1)
Thực hiện hồi quy yttheo yt-1 và sai số ngẫu nhiên ut, thu được quá trình AR(1)như sau: yt 0 1yt 1 ut (1.2), trong đó utlà nhiễu trắng
Điều kiện để Ytdừng là 1 < 1 Để hiểu rõ hơn, ta thay yt 1 0 1yt 2 ut 1
Trang 32Dễ nhận ra nếu 1 > 1 thì giá trị trung bình của chuỗi yt phụ thuộc vào thời gian
t, tức chuỗi lúc này không dừng Khi đó tác động của sai số ngẫu nhiên ut-k đối với
yt sẽ tăng dần theo thời gian Do đó, để phù hợp với thực tiễn, chúng ta nên áp đặtđiều kiện dừng là 1 < 1
b Quá trình tự hồi quy bậc p – AR(p)
Thực hiện hồi quy Yttheo các quan sát trong quá khứ yt-p (biến trễ), ta thu đượcquá trình AR(p), trong đó p là số độ trễ sử dụng trong mô hình Một quá trìnhAR(p) có dạng: yt 0 1yt 1 2yt 2 pyt p , trong đó uut tlà nhiễu trắng
Điều kiện cần để ytdừng là
p i
AR(p) chỉ bao gồm các biến trễ của biến phụ thuộc và hạng sai số ngẫu nhiên, nó
không bao gồm bất kỳ một biến nào khác, nên nó được xem là một mô hình có “dữ
liệu tự nói”.
1.2.4.2 Quá trình trung bình trượt (MA – Moving Average)
Hồi quy yt theo sai số hiện tại và độ trễ của nó ta thu được quá trình trung bìnhtrượt MA(q), với q là độ trễ của sai số Quá trình MA(q) có dạng:
Trường Đại học Kinh tế Huế
Trang 331.2.4.3 Quá trình tự hồi quy tích hợp trung bình trượt (ARMA)
Thực hiện kết hợp quá trình AR(p) và MA(q) ta thu được quá trình ARMA(p,q).Một quá trình ARMA(p,q) sẽ có p số hạng tự hồi quy và q số hạng trung bình trượtnhư sau: yt 0 1yt 1 2yt 2 pyt p ut 1ut 1 2ut 2 qut q
Vì các ut là nhiễu trắng nên sẽ không ảnh hưởng đến tính dừng của ARMA(p,q)
Và điều kiện dừng của ARMA cũng chính là điều kiện dừng của mô hình AR(p),tức| i| < 1
1.2.4.4 Quá trình tự hồi quy, đồng liên kết, trung bình trượt (ARIMA – Autoregressive Intergrated Moving Average)
Một chuỗi thời gian có thể tuân theo nhiều mô hình khác nhau, tuy nhiên, cả ba
mô hình trên đều đòi hỏi chuỗi thời gian phải có tính dừng Nhưng trong thực tế, tồntại rất nhiều chuỗi thời gian không dừng Vậy làm cách nào để ứng dụng các môhình trên trong thực tế? Câu trả lời chính là dùng phương pháp lấy sai phân để biếnđổi một chuỗi thời gian không dừng thành chuỗi dừng trước khi áp dụng mô hìnhARMA như đã trình bày ở trên
Nếu một chuỗi thời gian dừng ở sai phân bậc d, ta nói chuỗi liên kết bậc d, ký
hiệu I(d) Kết hợp với quá trình ARMA ta có được mô hình Tự hồi quy, Đồng liênkết, Trung bình trượt ARIMA(p,d,q), với p số hạng tự hồi quy và q số hạng trungbình trượt, và cần lấy sai phân bậc d để chuỗi dừng Phương trình tổng quát nhưsau: D d (y t ) = + [α 1 D d (y t -1 ) +…+ α p D d (y t -p )] + [ 1 u t-1 +…+ q u t-q ]+ u t
Như vậy, xác định được các giá trị p, d, q ta sẽ mô hình hóa được chuỗi Đồngthời ta dễ dàng nhận ra, mô hình ARIMA chỉ sử dụng các giá trị quá khứ của bảnthân nó chứ hoàn toàn không sử dụng thêm một biến độc lập nào khác, đây chính là
triết lý “hãy để dữ liệu tự nói”.
Trường Đại học Kinh tế Huế
Trang 341.2.5 Phương pháp Box – Jenkins (BJ)
George Box & Gwilym Jenkins (1976) đã nghiên cứu mô hình tự hồi quy tíchhợp trung bình trượt ARIMA, thường gọi là phương pháp Box-Jenkins Phươngpháp này không dựa trên một hay nhiều phương trình mà dựa vào việc phân tíchtính ngẫu nhiên của một chuỗi thời gian Theo đó, chuỗi thời gian có thể được giảithích bằng hành vi ở hiện tại, trong quá khứ, các trễ và các yếu tố ngẫu nhiên Mộtcâu hỏi lớn đặt ra đối với mô hình ARIMA là làm thế nào xác định các giá trị p, d, q
và xây dựng được mô hình phù hợp? Box-Jenkins đã đưa ra phương pháp để xácđịnh mô hình này qua các bước:
Hình 1.4: Các bước của phương pháp Box-Jenkins
Nguồn: Tác giả tự tổng hợp
Bước 1: Nhận Dạng (xác định các giá trị p, d, q)
Trước tiên, kiểm tra tính dừng của chuỗi dữ liệu gốc, nếu chưa dừng thì tiếnhành lấy sai phân I(d), bậc của d ở đây chính là bậc d trong mô hình ARIMA(p,d,q) Nếu chuỗi dừng ngay tại chuỗi gốc thì d=0, nếu chuỗi dừng ở sai phân bậc Ithì d=1, Tuy nhiên, qua quá trình thực nghiệm nhận thấy rằng nếu lấy ln (lôgarít
tự nhiên cơ số e) chuỗi dữ liệu trước khi thực hiện các bước sau sẽ cho mô hình phùhợp hơn
Công cụ chủ yếu để xác định p, q cho mô hình ARIMA là dựa trên Lược đồ tựtương quan ACF và Tự tương quan riêng phần PACF của chuỗi gốc đã được biếnđổi thành chuỗi dừng, kết hợp với phương pháp thử và sai:
NHẬN DẠNG ƯỚC LƯỢNG KIỂM TRA
DỰ BÁO
Trường Đại học Kinh tế Huế
Trang 35Bảng 1.1: Nhận dạng mô hình ARIMA(p,q)
MA(1)=ARIMA(0,1) = 0 sau 1 bước trễ ( 1≠ 0) Giảm dần về 0 từ bước trễ 1MA(2)=ARIMA(0,2) = 0 sau 2 bước trễ ( 1, 2 ≠ 0) Giảm dần về 0 từ bước trễ 2MA(q)=ARIMA(0,q) = 0 sau q bước trễ ( 1, 2, , q≠ 0) Giảm dần về 0 từ bước trễ qAR(1)=ARIMA(1,0) Giảm theo CSN về 0 từ bước trễ 1(*) = 0 sau 1 bước trễ ( 11≠ 0)AR(2)=ARIMA(2,0) Giảm theo CSN về 0 từ bước trễ 2 = 0 sau 2 bước trễ ( 11, 22≠ 0)
AR(p)=ARIMA(p,0) Giảm theo CSN về 0 từ bước trễ p = 0 sau p bước trễ
( 11, 22, , qq≠ 0)ARIMA(1,1) Giảm theo CSN về 0 từ bước trễ 1 Giảm dần về 0 từ bước trễ 1ARIMA(p,q) Giảm theo CSN về 0 từ bước trễ p Giảm dần về 0 từ bước trễ q
(*) Giảm theo dạng hàm mũ hoặc sin, tương tự cho các trường hợp còn lại
Nguồn: Tác giả tự tổng hợp
Khi quyết định lựa chọn một mô hình ARIMA(p,q), chúng ta cần kết hợp với
các tiêu chí chung được nhiều nhà nghiên cứu ứng dụng Dưới đây là ba tiêu chí
phổ biến:
Tiêu chí thông tin Akaike (Akaike Info Criterion), đề xuất bởi Akaike (1974):
2 p q 1ˆ
Trang 36Về bản chất, các tiêu chuẩn này được mở rộng từ tổng bình phương phần dư
(RSS – Residual Sum Squared) gồm hai thành phần: thành phần phương sai sai số (có nguồn gốc từ tổng bình phương phần dư) và thành phần phạt (penalty term).
Nếu ta đưa thêm biến vào mô hình thì làm giảm thiểu RSS phải đủ để bù đắp sự giatăng hình phạt tương ứng của việc thêm biến Do đó, điều kiện để lựa chọn p, q làtối thiểu hóa AIC, SIC, HQIC Về mặt lý thuyết thì SIC tỏ ra chính xác hơn, vànghiêm ngặt hơn trong việc đưa thêm biến vào mô hình Song thực tiễn thì SICkhông nắm bắt được hết tự tương quan của chuỗi thời gian nên người ta thườngdùng AIC làm tiêu chuẩn phổ biến hơn HQIC đứng giữa hai tiêu chí trên trong việclựa chọn
Bước 2: Ước lượng
Để ước lượng các hệ số của mô hình, đôi khi ta có thể thực hiện bằng phươngpháp bình phương nhỏ nhất (OLS), nhưng cũng có trường hợp phải sử dụng cácphương pháp ước lượng phi tuyến Ngày nay, với sự trợ giúp của các phần mềmthống kê, ta có thể dễ dàng thực hiện điều này
Bước 3: Kiểm tra
Box và Jenkins đề cập hai cách tiếp cận là “phù hợp hơn” (over fitting) và “chẩnđoán phần dư” “Phù hợp hơn” được hiểu là khi ta thêm các điều khoản ARIMAvào mô hình ở bước 1 thì các hệ số không có ý nghĩa thống kê, tức lúc này mô hình
ở bước 1 là phù hợp hơn “Chẩn đoán phần dư” là xem phần dư của mô hình códừng hay cụ thể có phải là nhiễu trắng hay không, tức có ngẫu nhiên hay không(không có tự tương quan) Nếu phần dư không phải là nhiễu trắng thì phải xem xétđịnh dạng, nhận dạng lại mô hình như ở bước 1 Tức lúc này có những yếu tố trong
mô hình không phải là ngẫu nhiên mà ta chưa khai thác hết Có thể kiểm tra xemphần dư có phải là nhiễu trắng hay không thông qua lược đồ tự tương quan ACF vàPACF, Lijung Box hay LM test của Breuch Godfrey Đồng thời, cũng cần kiểm traxem phần dư có tiệm cận phân phối chuẩn hay không, điều kiện hội tụ và dừng cóthỏa mãn không Đặc biệt, sai số dự báo càng nhỏ thì mô hình càng tốt
Trường Đại học Kinh tế Huế
Trang 37Thông thường, một chuỗi dữ liệu có thể phù hợp với nhiều mô hình ARIMAkhác nhau, do đó chúng ta cần thử nhiều mô hình để chọn được mô hình phù hợpnhất Đó là lý do tại sao phương pháp lập mô hình ARIMA của Box-Jenkins đượcxem là nghệ thuật nhiều hơn là khoa học Cần phải có kỹ năng tốt để lựa chọn đúng
mô hình ARIMA thích hợp nhất, với các tiêu chuẩn thường được áp dụng như: Loglikelihood (càng lớn càng tốt), Akaike, Schwarz (càng nhỏ càng tốt) hay so sánh với
dữ liệu quá khứ để lựa chọn mô hình thích hợp nhất
Bước 4: Dự báo
Dựa trên mô hình vừa xây dựng, tiến hành dự báo điểm và dự báo khoảng chonhững thời điểm trong tương lai, kết hợp với đánh giá độ chính xác của dự báo.Phương pháp tốt nhất là ta chỉ nên dự báo cho một thời gian ngắn so với hiện tại vì
dự báo càng xa sẽ cho sai số càng lớn
1.3 Cơ sở thực tiễn về đối tượng nghiên cứu và phương pháp nghiên cứu
1.3.1 Tổng hợp các nghiên cứu trong nước
Những năm gần đây, việc ứng dụng các mô hình chuỗi thời gian, đặc biệt là môhình ARIMA đã được giới học thuật Việt Nam nỗ lực tiếp cận và ứng dụng để dựbáo cho nhiều chỉ tiêu kinh tế quan trọng Trong đó có thể kể đến một số nghiên cứuđiển hình như sau:
Trung & cs (2010), nghiên cứu việc ứng dụng mô hình ARIMA để dự báo Index Họ chọn mô hình ARIMA(0,1,1) làm mô hình tốt nhất để tiến hành dự báo
VN-và nhận định rằng dữ liệu dự báo rất sát với dữ liệu thực tế
Gương (2012), nghiên cứu kỹ thuật khai phá dữ liệu chuỗi thời gian áp dụngtrong dự báo giá chứng khoán Tác giả đã ứng dụng mô hình ARIMA trong dự báochỉ số VN-Index Điểm nổi bật của đề tài là bên cạnh việc tiếp cận mô hìnhARIMA, tác giả đã đưa ra những chỉ dẫn cụ thể trong việc sử dụng phần mềmEviews – một công cụ đắc lực phục vụ cho việc ước lượng mô hình chuỗi thời gian.Trường Đại học Kinh tế Huế
Trang 38Dũng (2012), nghiên cứu dự báo lạm phát quý I năm 2013 qua mô hìnhARIMA, kết luận cuối cùng họ sử dụng mô hình ARIMA (13,1,1) để tiến hành dựbáo Họ cũng đưa ra nhận định là kết quả dự báo tương đối chính xác.
Tài (2012), nghiên cứu dự báo sản lượng lúa Việt Nam bằng các mô hình toánhọc Tác giả sử dụng hai mô hình: hồi quy tuyến tính và phân tích chuỗi thời gianthông qua mô hình ARIMA Mô hình chuỗi thời gian tỏ ra tốt hơn cho công tác dựbáo Tác giả cũng nhấn mạnh dự báo sản lượng lúa ở vụ đông xuân cho kết quả tốthơn vụ hè thu vì vụ đông xuân ít chịu ảnh hưởng của thời tiết và sâu hại, diện tíchgieo xạ ổn định
Thi (2009), nghiên cứu dự báo giá cá sông tại thành phố Hồ Chí Minh bằng cácquá trình ngẫu nhiên – mô hình ARIMA
Giám, Hân, Phương & Thùy (2012), nghiên cứu xây dựng mô hình ARIMA cho
dự báo khách du lịch quốc tế đến Việt Nam Họ đã chọn ra mô hìnhARIMA(12,1,12) phù hợp để tiến hành dự báo Họ cũng khẳng định mô hìnhARIMA chưa phải là tối ưu trong việc dự báo vì một số giả định của nó vẫn còn bị
vi phạm cần phải khắc phục
Bách (2010), nghiên cứu phân tích dự báo giá và rủi ro thị trường cổ phiếu niêmyết tại Việt Nam Tác giả đã trình bày chi tiết về việc ứng dụng mô hình ARIMA,ARCH/GARCH vào dự báo giá, rủi ro của cả hai chỉ số VN-Index và HNX-Index.Tác giả nhấn mạnh việc ứng dụng mô hình đòi hỏi sự linh động cao của nhànghiên cứu
1.3.2 Tổng hợp các nghiên cứu nước ngoài
Các nghiên cứu về dự báo giá và tỷ suất sinh lợi ở nước ngoài xuất hiện từnhững thập niên 70 của thế kỷ XIX và vô cùng phong phú, đa dạng Nó thực sự đãphát triển khi Việt Nam mới còn chập chững bước vào công cuộc khởi phục kinh tế
Để nắm bắt được xu hướng vận động dài hạn của chuỗi dữ liệu thời gian, nhiều tácgiả đã sử dụng mô hình tự hồi quy tích hợp trung bình trượt (ARIMA) để nhậnTrường Đại học Kinh tế Huế
Trang 39dạng, đánh giá và phân tích, từ đó tìm ra quy luật vận động của chuỗi thời gian vàxây dựng mô hình phục vụ cho mục đích nghiên cứu.
Radha (2004), nghiên cứu ứng dụng mô hình ARMA, ARMA-GARCH,ARMA-EGARCH trong dự báo lãi suất ngắn hạn MIBOR của tín phiếu kho bạc.Ông đi đến kết luận rằng ARIMA-GARCH là mô hình thích hợp nhất để dự báo giátrị trong ngắn hạn
Natalia et al (2005), kiểm tra hiệu quả dạng yếu của TTCK Nga, xem xét chogiai đoạn từ 01/09/1995 đến 01/05/2001 Họ sử dụng dữ liệu hàng ngày, hàng tuầntrên hàng loạt chỉ số của hệ thống thương mại Nga Họ cho rằng trên các mô hìnhtuyến tính và phi tuyến đề nghị gồm: ARIMA và ARCH/GARCH thì không có môhình nào cung cấp dự báo tốt hơn so với các mô hình còn lại Đồng thời, đưa ra kếtluận rằng dự báo chính xác nhất thu được ở những quan sát đầu tiên ngoài mẫuước lượng
Tatyana (2010), nghiên cứu sự biến động của thị trường dầu thô Brent và WTIthông qua việc sử dụng các công cụ để kiểm tra hành vi biến động của chuỗi dữ liệugiá dầu trong quá khứ, từ đó xác định các mô hình ARMA để dự báo giá dầu trongngắn hạn
Pawan (2002), nghiên cứu dự báo biến động của phương sai có điều kiện của tỷsuất sinh lợi chỉ số chứng khoán S&P 500 Tác giả đã ứng dụng mô hình Garch,Mean Revision và ARIMA là những ước lượng ban đầu Tác giả cũng đi đến kếtluận rằng mô hình EGARCH là phù hợp nhất với các thông số dữ liệu
Ravindran et al (2007), nghiên cứu dự báo tỷ giá hối đoái đồng đôla Mỹ Ringgit Malaysia bằng việc ứng dụng mô hình ARIMA và GARCH Họ kết luậnARIMA và GARCH là những mô hình hỗ trợ đáng kể cho cho công tác quản trị rủi
-ro t-rong việc thay đổi tỷ giá hối đoái
Trường Đại học Kinh tế Huế
Trang 40Với những bằng chứng vừa nêu trên, chúng ta có thể thấy sự phát triển rất mạnh
mẽ của việc ứng dụng mô hình ARIMA vào việc dự báo giá và tỷ suất sinh lợi củacác biến số tài chính trên các thị trường ở nước ngoài
1.3.3 Nhận xét
So với các bài nghiên cứu nước ngoài, các bài nghiên cứu trong nước vẫn bộc
lộ nhiều hạn chế Về cơ bản, các mô hình ARIMA được nghiên cứu sâu và rộng rãihơn so với các mô hình biến thể của nó Có thể thấy các bài nghiên cứu trong nướcđang tích cực và nỗ lực để tiếp cận, giới thiệu các ứng dụng ARIMA đến côngchúng Tuy nhiên, để nắm bắt và hiểu được sơ bộ cách thức sử dụng mô hình khilần đầu đọc vào các tài liệu này sẽ không phải là điều dễ dàng, và việc ứng dụngchúng vào thực tiễn cũng sẽ gặp nhiều khó khăn Hơn nữa, so với các nghiên cứu ởnước ngoài thì nghiên cứu của chúng ta còn hẹp và chưa mở rộng ra tất cả các lĩnhvực đời sống xã hội, cũng như chưa thể ứng dụng triệt để và hiệu quả những môhình này vào phát triển kinh tế xã hội đất nước Bên cạnh đó, các đề tài nghiên cứu
về lĩnh vực chứng khoán còn tổng quan, chưa đi sâu vào các khía cạnh nhỏ, và điềuquan trọng là thường có độ trễ rất lớn từ những nghiên cứu học thuật trước khi đivào thực tiễn rộng rãi đối với các nghiên cứu ở Việt Nam
Với những hạn chế như vậy, trên quan điểm của mình, tôi xin trình bày đề tài
nghiên cứu “Ứng dụng mô hình ARIMA trong dự báo chỉ số VN-Index”, thông qua
việc tiếp cận chỉ số chứng khoán VN-Index kết hợp với quá trình nhận dạng, đánhgiá và phân tích chuỗi thời gian của chỉ số VN-Index, từ đó nắm bắt được quy luậtvận động chung của chuỗi dữ liệu và tiến hành xây dựng mô hình phục vụ cho mụcđích dự báo trong ngắn hạn của đề tài nghiên cứu để có những biện pháp quản trị rủi
ro cũng như đầu tư hiệu quả Hy vọng bài nghiên cứu sẽ cung cấp các kiến thức hữuích cho những người mới tiếp cận mô hình lần đầu và có nhiều bài nghiên cứu mớihơn về việc ứng dụng mô hình ARIMA vào những lĩnh vực đa dạng của đời sống xãhội cũng như góp phần đóng góp đáng kể cho sự phát triển kinh tế tài chính củađất nước
Trường Đại học Kinh tế Huế