Đối với những dự án mới, mô hình CAPM cung cấp một tỉ suất sinh lợi yêu cầu thông qua hệ số beta của nó và có thể được chấp nhận bởi các nhà đầu tư.. Đối với các tài sản rủi ro đang giao
Trang 1TRƯỜNG ĐẠI HỌC KINH TẾ TP HỒ CHÍ MINH
TRẦN TRỌNG HUỲNH
ỨNG DỤNG MACHINE LEARNING
TRONG MÔ HÌNH CAPM
LUẬN VĂN THẠC SĨ KINH TẾ
TP Hồ Chí Minh – Năm 2020
Trang 2TRƯỜNG ĐẠI HỌC KINH TẾ TP HỒ CHÍ MINH
TRẦN TRỌNG HUỲNH
ỨNG DỤNG MACHINE LEARNING
TRONG MÔ HÌNH CAPM
Chuyên ngành: Tài Chính – Ngân Hàng (Tài Chính) Hướng đào tạo: Hướng nghiên cứu
Mã số: 8340201
LUẬN VĂN THẠC SĨ KINH TẾ
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS NGUYỄN KHẮC QUỐC BẢO
TP Hồ Chí Minh – Năm 2020
Trang 3LỜI CAM ĐOAN
Tác giả nghiên cứu “Ứng dụng machine learning trong mô hình CAPM” cam
đoan sử dụng dữ liệu đã công bố trên các trang web uy tín, không sửa chữa hoặc làm
đẹp kết quả Nghiên cứu này nối tiếp với những nghiên cứu trước đó, không sao chép
hay gian lận trong nghiên cứu
TP Hồ Chí Minh, ngày 24 tháng 12 năm 2020
Tác giả
Trần Trọng Huỳnh
Trang 4MỤC LỤC
LỜI CAM ĐOAN
MỤC LỤC
DANH MỤC CÁC TỪ VIẾT TẮT
DANH MỤC CÁC BẢNG
DANH MỤC CÁC HÌNH
TÓM TẮT
ABSTRACT
CHƯƠNG 1 GIỚI THIỆU CHUNG 1
1.1 Đặt vấn đề 1
1.2 Mục tiêu nghiên cứu 3
1.3 Câu hỏi nghiên cứu 4
1.4 Phương pháp nghiên cứu 4
1.5 Đối tượng và phạm vi nghiên cứu 5
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT 6
2.1 Mô hình định giá tài sản vốn (CAPM) 6
2.2 Giá trị kiểm định thực nghiệm của CAPM 14
2.3 Support Vector Regression (SVR) 17
2.4 Support Vector Regression (SVR) và các nghiên cứu liên quan 20
CHƯƠNG 3 PHƯƠNG PHÁP NGHIÊN CỨU 23
3.1 Giả thuyết nghiên cứu và dữ liệu nghiên cứu 23
3.2 Mô hình nghiên cứu và giả thuyết về tính hiệu quả của mô hình 27
CHƯƠNG 4 KẾT QUẢ VÀ THẢO LUẬN 29
4.1 Thống kê mô tả 29
4.2 Kết quả kiểm định CAPM 34
4.3 Kiểm định tính dừng 37
4.4 Dự báo tỉ suất sinh lợi với mô hình CAPM 38
Trang 54.5 Dự báo tỉ suất sinh lợi với mô hình SVR dưới khung CAPM 48
4.6 Mở rộng mô hình SVR cho danh mục đầu tư 57
CHƯƠNG 5 KẾT LUẬN VÀ KHUYẾN NGHỊ 62
5.1 Kết luận chung 62
5.2 Khuyến nghị 64
5.3 Đóp góp của đề tài và hạn chế 64 TÀI LIỆU THAM KHẢO
PHỤ LỤC
Trang 6DANH MỤC CÁC TỪ VIẾT TẮT
CAL Đường phân bổ vốn (Capital Allocation Line)
CAPM Mô hình định giá tài sản vốn (Capital Asset Pricing Model) HOSE Sở Giao dịch Chứng khoán Thành phố Hồ Chí Minh
MAE Mean Absolute Error
RMSE Root Mean Square Error
SML Đường thị trường chứng khoán (Security Market Line) SVM Support Vector Machine
SVR Support Vector Regression
Trang 7phiếu
37
Bảng 4.6 Các mô hình dự báo tỉ suất sinh lợi Vnindex 43 Bảng 4.7 Giá trị MAE cho các dự báo 44 Bảng 4.8 Thống kê chỉ số MAE và RMSE của 212 mã chứng khoán 45 Bảng 4.9 Kết quả hồi quy RMSECAPM theo các biến độc lập 47 Bảng 4.10 Sai số dự báo của các mô hình 52 Bảng 4.11 Các thống kê cho chỉ số MAE và RMSE các chứng khoán 52 Bảng 4.12 Kết quả kiểm định Wilcoxon cho mô hình fittedsvr và capm 54 Bảng 4.13 Kết quả kiểm định Wilcoxon cho mô hình presvr và precapm 54 Bảng 4.14 Kết quả hồi quy RMSECAPM theo các biến độc lập 55 Bảng 4.15 Kiểm định Wilcoxon khi cố định vnindex 57 Bảng 4.16 Kiểm định Wilcoxon khi cố định rf và beta 57 Bảng 4.17 Sai số của các mô hình đo lường bằng MAE, RMSE 59 Bảng 4.18 Kiểm định Wilcoxon cho mô hình presvr và precapm 60 Bảng 4.19 Kiểm định Wilcoxon cho mô hình svr và capm 60
Trang 8DANH MỤC CÁC HÌNH
Hình 2.2 Đường CML và các cơ hội đầu tư khi α thay đổi 10
Hình 2.4 Siêu phẳng phân lớp H cho trường hợp Ф là ánh xạ
đồng nhất
18
Hình 4.2 Phân phối tỉ suất sinh lợi trung bình 31 Hình 4.3 Mối quan hệ giữa beta và tỉ suất sinh lợi trung bình 32 Hình 4.4 Biến động tỉ suất sinh lợi của chỉ số Vnindex và Lợi
suất trái phiếu
33
Hình 4.5 Tỉ suất sinh lợi Vnindex từ 01/2011 đến 03/2012 40 Hình 4.6 Biểu đồ ACF của tỉ suất sinh lợi Vnindex 41 Hình 4.7 Biểu đồ PACF của tỉ suất sinh lợi Vnindex 42 Hình 4.8 Tỉ suất sinh lợi Vnindex và các dự báo 43
Hình 4.11 Các phân phối và tương quan giữa tỉ suất sinh lợi vượt
trội (R) và phần bù rủi ro (premium)
Trang 9TÓM TẮT
Nghiên cứu thực hiện nhằm kiểm tra liệu mô hình SVR dưới khung CAPM có dự báo tỉ suất sinh lợi tốt hơn so với dự báo của mô hình CAPM hay không Kết quả là mô hình SVR fitted tốt hơn CAPM Tuy nhiên, mô hình presvr không chứng tỏ tốt hơn mô hình precapm cho dự báo giá trị tương lai, nguyên nhân do dự báo tỉ suất sinh lợi danh mục thị trường sai lệch nhiều so với thực tế Mở rộng nghiên cứu cho danh mục đầu tư thì mô hình SVR cải thiện hiệu quả rõ rệt Nghiên cứu phát hiện rằng CAPM là một khung nền chưa tốt vì CAPM không phù hợp trong thực nghiệm, đó cũng là nguyên nhân chính làm cho mô hình SVR có sai số dự báo vẫn còn ở mức cao
Từ khóa: Machine Learning, SVR, CAPM, tỉ suất sinh lợi, beta, RMSE
Trang 10ABSTRACT
The study investigates whether the SVR model forecast the return is better than the CAPM model The obtained result reveals that the SVR model is chosen However, the presvr model is not effective than the precapm model in future forecasting, caused by the forecasting of return on the market portfolio could be bias estimator Exping the analysis list portfolio’s return, the most effective model is the SVR model The finding
of the study shows that the CAPM model does not believe, due to the CAPM is not suitable in the practical study This result provides evidence of why the error in forecasting by the SVR model is hight
Keyworks: Machine Learning, SVR, CAPM, return, beta, RMSE
Trang 11CHƯƠNG 1 GIỚI THIỆU CHUNG
1.1 Đặt vấn đề
Dự báo tỉ suất sinh lợi khi đầu tư vào một tài sản rủi ro là một trong những mối quan tâm hàng đầu của các nhà đầu tư Việc dự báo sai lệch dẫn đến nhiều rủi ro, gây ra những tổn thất cho các nhà đầu tư Hơn nữa, hiệu ứng này có thể làm cho thị trường kém hiệu quả hơn, ảnh hưởng đến sự phát của cả nền kinh tế Ngược lại, nếu dự báo hợp lý
sẽ giúp các nhà đầu tư ra những quyết định đúng đắng, họ sẽ mạnh dạng đầu tư và vì thế giúp cho thị trường hoạt động hiệu quả hơn
Không những nhà đầu tư quan tâm mà còn có cả giới học thuật không ngừng phát triển mô hình nhằm mục đích cải thiện độ chính xác và độ tin cậy trong việc dự báo Mô hình định giá tài sản vốn (CAPM) được giới thiệu và phát triển trong thập niên 60 bởi Jack Treynor (1961, 1962), William Sharpe (1964), John Lintner (1965), Jan Mossin (1966) và Black (1972) dựa trên lý thuyết đa dạng hóa và danh mục đầu tư Markowitz
Mô hình này lượng hóa mối quan hệ giữa rủi ro hệ thống của một tài sản và lợi nhuận
kỳ vọng của tài sản đó Mô hình CAPM (phiên bản Sharpe-Lintner-Black) là một trong những công cụ quản lý tài sản quan trọng trong những năm gần đây Điểm thuận lợi của
nó chính là tính đơn giản và có thể áp dụng vào thực tế Đối với những dự án mới, mô hình CAPM cung cấp một tỉ suất sinh lợi yêu cầu thông qua hệ số beta của nó và có thể được chấp nhận bởi các nhà đầu tư Đối với các tài sản rủi ro đang giao dịch trên thị trường thì mô hình CAPM cho phép ước tính một tỉ suất sinh lợi tối thiểu để cung cấp thông tin cho các nhà đầu tư về khoản đầu tư tiềm năng này Tuy nhiên, việc chấp nhận hay bác bỏ sự tồn tại mô hình CAPM trong thực nghiệm lại là một đề tài gây tranh cãi cho đến ngày nay bởi mô hình CAPM có quá nhiều giả định và ước lượng hệ số beta cũng là một chủ đề làm đau đầu các nhà nghiên cứu
Một vài năm sau đó, Banz (1981) nghiên cứu các cổ phiếu trên thị trường Mỹ từ năm 1926 đến năm 1975 nhận thấy rằng lợi suất trung bình cổ phiếu phụ thuộc nhiều
Trang 12vào quy mô vốn hóa của công ty Cụ thể, công ty có quy mô vốn hóa nhỏ có tỉ suất sinh lợi trung bình cao hơn những công ty có quy mô vốn hóa lớn Và vì vậy, mô hình CAPM không hữu ích Nghiên cứu sau này của Basu (1983) trên thị trường NYSE thời gian từ
1926 đến 1975 cho kết quả tương tự là không ủng hộ mô hình CAPM trong tập dữ liệu này
Eugene Fama và Kenneth French (1992) trong nghiên cứu của mình trên thị trường chứng khoán Mỹ từ năm 1963 đến năm 1990 thấy rằng ngoài nhân tố thị trường tác động đến tỉ suất sinh lợi trung bình của cổ phiếu còn có nhân tố quy mô vốn hóa và chỉ số giá trị sổ sách trên giá trị thị trường (B/M) của công ty Nghiên cứu cho thấy mối quan hệ
có ý nghĩa thống kê giữa lợi suất cổ phiếu và hai nhân tố mới được thêm vào Mô hình sau đó được giới thiệu gọi là mô hình Fama-French 3 nhân tố Theo Fama-French, biến B/M có giá trị thấp tức là giá trị thị trường của cổ phiếu cao tương đối so với giá trị sổ sách, thường đi kèo với lợi nhuận cao của doanh nghiệp Ngoài ra, quy mô của công ty cũng có liên quan đến lợi nhuận doanh nghiệp Hiệu ứng này rõ nét vào năm 1980, tuy nhiên đến năm 1981 lợi nhuận tính trên tài sản của doanh nghiệp nhỏ không có sự khác biệt lớn so với với doanh nghiệp có quy mô lớn Mô hình Fama-French 3 nhân tố đã giải thích một phần biến động tỉ suất sinh lợi của cổ phiếu, được sử dụng rộng rãi trong học thuật cũng như trong thực tế, góp phần khắc phục những nhược điểm của các phiên bản CAPM trước đó Với ý nghĩa lớn lao này, Fama và French được vinh dự trao giải Nobel năm 2013
Năm 2015, Fama và French đã mở rộng mô hình 3 nhân tố bằng cách thêm vào 2 biến độc lập trong mô hình (gọi là mô hình Fama-French 5 nhân tố) Hai biến được thêm vào liên quan đến lợi nhuận và đầu tư của công ty Bộ dữ liệu cũ được tái sử dụng nhưng được kéo dài thêm 22 năm Kết quả của mô hình 5 nhân tố có hệ số giải thích R2 rất cao, trên 90%
Một cách tiếp cận khác cho mô hình CAPM là ứng dụng thuật toán Machine Learning trong mô hình dự báo Ưu điểm của phương pháp này là xấp xử gần đúng hàm
Trang 13phi tuyến, xử lý nhiễu (noise), khám phá những thành phần tiềm ẩn của dữ liệu, đáng chú ý là khả năng “học” để cải thiện độ chính xác bởi các thuật toán trong Machine Learning Những nghiên cứu thực nghiệm ứng dụng Machine Learning tiên phong trong phân tích thị trường chứng khoán là Abraham, Nath và Mahanti (2001), tác giả đã sử dụng bộ dữ liệu Nasdaq-100 ở thị trường Mỹ, thuật toán dùng để so sánh là PCA, ANN, NFUZZ và tác giả dùng tiêu chuẩn RMSE để đánh giá chất lượng mô hình Cùng năm
2001, Cao và Tay nghiên cứu ứng dụng ANN, SVM trong chuỗi thời gian cho 5 hợp đồng giao sau ở thị trường Chocago, tác giả sử dụng tiêu chí đánh giá là NMSE, DS, WDS Gần đây nhất, nhóm tác giả gồm Fong-Ching Yuan, Chao-Hui Lee, Chaochang Chiu (2020) sử dụng SVR để dự báo giá vàng, dùng phương pháp GA-LSSVR và phân tích độ nhạy, tiêu chí đánh giá chất lượng mô hình là MSE và MAPE
Ở Việt Nam, các công trình ứng dụng Machine Learning trong lĩnh vực tài chính còn nghèo nàn Một số nghiên cứu phải kể đến như Nguyễn Công Điều (2012) đã sử dụng thuật toán thuật toán heuristic để dự báo chứng khoán, tác giả sử dụng tiêu chí MSE
để đánh giá chất lượng mô hình Gần đây có công trình nghiên cứu của Kỳ và Tuyền (2018), sử dụng xích Markov bậc cao cho dự báo chuỗi thời gian Tiêu chí đánh giá chất lượng mô hình là MAPE, RMSE, MAE Trong bối cảnh hiện nay, Machine Learning như là một xu hướng tiếp cận trong mọi lĩnh vực nói chung, trong đó có lĩnh vực tài chính Việc kết hợp mô hình lý thuyết nền tảng và ứng dụng thuật toán Machine Learning hứa hẹn sẽ cho kết quả khả quan hơn so với từng phương pháp riêng lẻ Đó là động cơ thúc đẩy nghiên cứu này
1.2 Mục tiêu nghiên cứu
- Mục tiêu tổng quát: Tìm ra mô hình nhằm cải thiện độ chính xác trong dự báo tỉ suất sinh lợi của các tài sản rủi ro
- Mục tiêu cụ thể:
Kết hợp phương pháp hồi quy SVR dưới khung CAPM nhằm cải thiện độ chính xác dự báo
Trang 14 So sánh khả năng dự báo của mô hình CAPM và mô hình SVR dưới khung CAPM
Tìm ra các nhân tố tác động đến sai số của mô hình CAPM và SVR
1.3 Câu hỏi nghiên cứu
Mô hình CAPM có phù hợp trong thực nghiệm hay không?
Liệu phương pháp hồi quy SVR dưới khung CAPM có dự báo tốt hơn mô hình CAPM hay không?
Nhân tố nào làm sai lệch CAPM so với thực tế?
1.4 Phương pháp nghiên cứu
Để thực hiện dự báo tỉ suất sinh lợi của các tài sản rủi ro bằng mô hình kết hợp SVR dưới khung CAPM, nghiên cứu thực hiện theo 4 bước
Trước tiên là kiểm định mô hình CAPM trong thực nghiệm Bước này rất quan trong trong việc xác định mối tương quan giữa các biến liên quan Hơn nữa, nếu khung nền CAPM được đáp ứng trong thực nghiệm thì thuật toán SVR sẽ phát huy tối đa hiệu quả trong dự báo
Thức hai là dự báo tỉ suất sinh lợi kỳ vọng của danh mục Vnindex Ở bước này, nghiên cứu đề xuất 10 mô hình dự báo, trong đó mô hình dự báo cuối cùng là sự lựa chọn tốt nhất trong 9 mô hình còn lại theo phương pháp kiểm tra cuộn
Thứ ba là lựa chọn tham số đầu vào cho thuật toán SVR Theo đó, các quan sát đầu tiên sẽ được dùng để xác định tham số đầu vào, sau đó sẽ thực hiện dự báo cho quan sát tiếp theo theo phương pháp cuộn theo tháng
Cuối cùng, nghiên cứu so sánh với mô hình CAPM (dự báo đầu ra bằng mô hình CAPM cũng được thực hiện theo phương pháp cuộn)
Để giải thích cho sự sai lệch của mô hình SVR so với thực tế, nghiên cứu sử dụng phương pháp hồi quy các biến liên quan Trong đó, sai lệch của các mã cổ phiếu được được tính bằng RMSE
Các dự báo sẽ được thực hiện trên các chứng khoán riêng lẻ và danh mục đã được
đa dạng hóa, thực hiện trên thị trường chứng khoán HOSE từ 01/2011 đến 10/2020 Một
Trang 15số chứng khoán không hoạt động liên tục trong giai đoạn này sẽ bị loại Cuối cùng thu được 212 mã chứng khoán hợp lệ Các chứng khoán sau đó sẽ được xếp vào 10 danh mục từ nhỏ đến lớn theo hệ số beta (độ dài 24 tháng) ở tháng gần nhất, tương tự như trong nghiên cứu của Fama và French (1992)
1.5 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của đề tài này là mô hình định giá tài sản vốn (CAPM) và thuật toán SVR trong Machine Learning Phạm vi nghiên cứu là 212 công ty niêm yết trên thị trường chứng khoán TP Hồ Chí Minh (HOSE) Thời gian nghiên cứu được giới hạn từ năm 01/2011 đến 10/2020
Trang 16CHƯƠNG 2 CƠ SỞ LÝ THUYẾT
2.1 Mô hình định giá tài sản vốn (CAPM)
2.1.1 Lý thuyết lựa chọn danh mục Markowitz
Mô hình định giá tài sản vốn là một tập hợp các ước tính liên quan đến tỉ suất sinh lợi kỳ vọng cân bằng của các tài sản rủi ro Mô hình CAPM được xây dựng trên nền tảng của lý thuyết lựa chọn danh mục của Markowitz (1959) Trong mô hình của Markowitz
(1959), nhà đầu tư lựa chọn danh mục đầu tư ở thời điểm t-1 có tỉ suất sinh lợi mang lại
ở thời điểm t là một biến ngẫu nhiên Mô hình Markowitz giả định các nhà đầu tư là e
ngại rủi ro, khi lựa chọn danh mục họ chỉ quan tâm đến kỳ vọng và phương sai trong một kỳ nắm giữ của lợi nhuận đầu tư Nhà đầu tư lựa chọn danh mục “trung bình – phương sai - hiệu quả”, tức là:
Tối thiểu hóa phương sai danh mục với mức lợi nhuận kỳ vọng cho trước
Tối đa hóa lợi nhuận với phương sai cho trước
Mô hình danh mục đầu tư Markowitz cung cấp điều kiện Đại Số về trọng số của tài sản trong danh mục trung bình – phương sai - hiệu quả Sharpe (1964) và Lintner (1965) thêm vào hai giả định trong mô hình Markowitz (1959) để xác định một danh mục phải là trung bình - phương sai – hiệu quả Đó là:
Kỳ vọng của các nhà đầu tư là thuần nhất: các yếu tố đầu vào giống nhau cho tất
cả nhà đầu tư
Các nhà đầu tư có thể vay và cho vay tùy ý ở mức lãi suất phi rủi ro
Trang 17Hình 2.1 Các cơ hội đầu tư
(Nguồn: Fama-French (2004)) Hình 2.1 mô tả các cơ hội đầu tư Trục hoành biểu diễn rủi ro của danh mục, được
đo bằng độ lệch chuẩn của tỉ suất sinh lợi danh mục Trục tung biểu diễn tỉ suất sinh lợi
kỳ vọng của danh mục Đường cong abc được gọi là đường biên phương sai tối thiểu
của tài sản rủi ro (Minimum variance frontier for risky assets), đường biên này cho biết mức phương sai khả thi thấp nhất khi cho trước một mức tỉ suất sinh lợi kỳ vọng Nếu
không có vay mượn với lãi suất phi rủi ro thì các danh mục trên điển b và nằm trên đường cong abc mới là danh mục trung bình – phương sai – hiệu quả bởi vì các nhà đầu tư luôn
tối đa hóa lợi nhuận với mức phương sai cho trước Khi vay mượn với lãi suất phi rủi ro
khả thi, nhà đầu tư sẽ phân bổ một tỉ trọng x vào tài sản phi rủi ro và 1-x vào tài sản rủi
ro trên đường thẳng nối điểm g trong miền danh mục rủi ro khả thi và điểm r trên trục f
tung (đường thẳng này gọi là đường phân bổ vốn – CAL) Để thu được danh mục trung bình – phương sai – hiệu quả thì đường CAL phải tiếp xúc với đường biên phương sai tối thiểu của tài sản rủi ro, tức là đường thẳng nối r và điểm T trong hình 2.1 (gọi là f
đường biên trung bình – phương sai – hiệu quả với một tài sản phi rủi ro) Ngược lại,
Trang 18mọi điểm trên đường biên trung bình – phương sai – hiệu quả với một tài sản phi rủi ro
là danh mục hiệu quả, kết quả này có được trong “separation theorem” của Tobin’s (1958)
Với giả định kỳ vọng thuần nhất của các nhà đầu tư và kết hợp với giả định ở mô hình Markowitz (các nhà đầu tư tối ưu trung bình – phương sai), tất cả nhà đầu tư đều
chọn danh mục T (trong hình 2.1) trong tập các cơ hội đầu tư của các tài sản rủi ro kết hợp với điểm r f Vì tất cả nhà đầu tư điều nắm giữ cùng một danh mục rủi ro T của các
tài sản rủi ro, nên các nhà đầu tư cùng chọn một tập hợp tỉ trọng giống nhau cho mỗi tài
sản rủi ro, khi đó T chính là danh mục thị trường (gọi là danh mục M - danh mục theo tỉ
trọng giá trị của tất cả các tài sản rủi ro có thể đầu tư)
Khi giả định “không hạn chế vay và cho vay ở mức lãi suất phi rủi ro” khó tồn tại trong thực tế, Fischer Black (1972) phát triển một phiên bản của CAPM không có vay hoặc mượn phi rủi ro Giá thị trường cân bằng ngụ ý rằng khi một nhà đầu tư cân nhắc lựa chọn một danh mục hiệu quả theo các trọng số thì danh mục đó chính là danh mục thị trường (do tất cả các nhà đầu tư đều có kỳ vọng thuần nhất) Và vì vậy, danh mục thị trường là một danh mục hiệu quả được lựa chọn bởi các nhà đầu tư, điều này nghĩa là
điều kiện phương sai tối thiểu cho danh mục M được thỏa mãn, nó là quan hệ giữa tỉ suất
sinh lợi kỳ vọng và rủi ro của mô hình Black CAPM
Mối quan hệ giữa tỉ suất sinh lợi kỳ vọng và rủi ro trong phiên bản CAPM của Black và Sharpe-Lintner chỉ khác nhau về r (phiên bản của Black f r là tài sản không f
tương quan với thị trường, trong khi phiên bản của Sharpe-Lintner là vay và cho vay với lãi suất phi rủi ro)
2.1.2 Giả định và hàm ý của CAPM
Các giả định chia ra 2 phần: về hành vi cá nhân và cấu trúc thị trường
- Hành vi cá nhân:
Trang 19 Các nhà đầu tư là e ngại rủi ro và luôn chọn danh mục trung bình – phương sai - hiệu quả
Thời gian nắm giữ danh mục chỉ trong một kỳ đơn lẻ
Kỳ vọng của các nhà đầu tư là thuần nhất
- Cấu trúc thị trường:
Tất cả các tài sản đều công khai, giao dịch đại chúng, có thể chia nhỏ tùy ý và cho phép bán khống
Các nhà đầu tư có thể vay và cho vay một lượng tùy ý ở mức lãi suất phi rủi ro
Thông tin là có sẵn và công khai
Không có thuế và chi phí giao dịch
2.1.3 Logic của CAPM
Chúng ta bắt đầu với một nhà đầu tư kết hợp phần bổ tỉ trọng α vào tài sản i và 1 –
α vào danh mục thị trường (0 ≤ α ≤ 1) Khi đó tỉ suất sinh lợi là một hàm theo α như sau:
Trang 20Hình 2.2 Đường CML và các cơ hội đầu tư khi α thay đổi
(Nguồn: Tác giả tự xây dựng) Khi tất cả các nhà đầu tư đều có cùng kỳ vọng, họ cùng chọn một danh mục sao
cho tối ưu hóa tỉ số Sharpe:
Trang 21 Vì tại M đường cong màu đỏ tiếp xúc với đường CML nên
hệ số góc cả hai đường băng nhau Do đó:
2 cov ,
2.1.4 Nội dung của mô hình CAPM
Khi vay và cho vay với lãi suất phi rủi ro khả thi, tỉ suất sinh lợi kỳ vọng của tài sản không tương quan với thị trường phải bằng với lãi suất phi rủi ro (r f ) Mối quan hệ giữa tỉ suất sinh lợi kỳ vọng và hệ số beta được gọi là mô hình CAPM có phương trình như sau:
Trang 22 i f i M f (2.1)
E r r E r r Trong đó:
r f là lãi suất phi rủi ro hoặc kỳ vọng tỉ suất sinh lợi tài sản không tương quan với thị trường
E r i là tỉ suất sinh lợi kỳ vọng của tài sản i
E r M là tỉ suất sinh lợi kỳ vọng của danh mục thị trường
Hệ số beta:
cov ,var
i M i
M
r r r
tỉ lệ với hệ số beta của nó và tỉ suất sinh lợi vượt trội của thị trường Cụ thể, phần bù rủi
ro bằng E r M r f
Trang 23Hình 2.3 Đường thị trường chứng khoán
(Nguồn: Bodie, Kane, Marcus (2012)) Phương trình mô tả mối quan hệ giữa tỉ suất sinh lợi kỳ vọng và hệ số beta được gọi là đường thị trường chứng khoán (Security Market Line – SML), thể hiện ở hình 2.3 Đường SML cung cấp một tiêu chuẩn để đánh giá thành quả đầu tư Với một mức rủi ro cho trước được xác định bằng hệ số beta của nó, đường SML dự báo một tỉ suất sinh lợi yêu cầu tối thiểu để bù đắp cho những đầu tư rủi ro này Từ phân tích trên, mô hình CAPM rất hữu ích cho việc ra quyết đầu tư Đối với những dự án đầu tư mới, mô hình CAPM cung cấp một tỉ suất sinh lợi yêu cầu mà dự án mang lại thông qua hệ số beta của
Trang 24nó, từ đó có thể dễ dàng đánh giá có nên đầu tư hay không Ngoài ra, mô hình CAPM còn được sử dụng trong việc xác định chi phí sử dụng vốn cổ phần
2.1.5 Hàm ý, ưu điểm và hạn chế của mô hình CAPM
Hàm ý của mô hình CAPM bao gồm hai ý chính sau đây:
Phần bù của tài sản rủi ro tỉ lệ thuận với hệ số beta của nó
Danh mục thị trường là danh mục hiệu quả
Mô hình CAPM đã nhanh chóng thống lĩnh vị trí quan trọng trong nền tài chính hiện đại kể từ lúc hình thành Hầu hết các nhà quả lý, quỹ đầu tư đều một phần dựa vào
mô hình CAPM để xác định một mức tỉ suất sinh lợi tối thiểu mà các nhà đầu tư đòi hỏi, đây được xem như mức rào cản mà mà tỉ suất sinh lợi từ bất kỳ dự án nào cũng phải bắt buộc vượt qua để thuyết phục các nhà đầu tư Một ưu thế cơ bản của mô hình CAPM là tính đơn giản của nó rất dễ dàng ứng dụng trong thực tế Hơn nữa, hệ số beta của nó cho phép đo lường rủi ro hệ thống của chứng khoán đó
Bên cạnh những ưu điểm trên, mô hình CAPM bộc lộ rất nhiều hạn chế xung quanh những giả định khó tồn tại trong thực tế, điều này dẫn đến hai luồng ý kiến trái chiều xung quanh việc kiểm định mô hình CAPM trong thực nghiệm
2.2 Giá trị kiểm định thực nghiệm của CAPM
Kiểm định mô hình CAPM chủ yếu dựa vào mối quan hệ tuyến tính giữa tỉ suất sinh lợi kỳ vọng và hệ số beta của các tài sản rủi ro Theo Fama-French (2004), có 3 khía cạnh để kiểm định bao gồm:
Thứ nhất, tỉ suất sinh lợi của các tài sản chỉ có quan hệ tuyến tính với hệ số beta của nó mà không có biến giải thích khác có ý nghĩa
Thứ hai, phần bù beta dương, trong đó phần bù beta chính là kỳ vọng tỉ suất sinh lợi vượt trội của danh mục thị trường
Trang 25 Thứ ba, trong phiên bản CAPM của Sharpe-Lintner, tài sản không tương quan với thị trường có tỉ suất sinh lợi kỳ vọng nên bằng với lãi suất phi rủi ro và phần bù beta nên bằng tỉ suất sinh lợi kỳ vọng của thị trường trừ đi lãi suất phi rủi ro
Hầu hết các kiểm định này sử dụng hồi quy dữ liệu chéo hoặc chuỗi thời gian Đối với phương pháp kiểm định dựa vào hồi quy dữ liệu chéo trong mô hình CAPM phiên bản Sharpe-Lintner là ước lượng hệ số góc và hệ số chặn trong mối quan hệ giữa tỉ suất sinh lợi và hệ số beta Cách tiếp cận này là hồi quy tỉ suất sinh lợi trung bình của tài sản
và các hệ số beta ước lượng tương ứng Mô hình CAPM dự đoán rằng hệ số chặn chính
là lãi suất phi rủi ro và hệ số góc chính là tỉ suất sinh lợi vượt trội của thị trường Ngay lập tức có 2 vấn đề cần quan tâm đó là ước lượng của hệ số beta có thể gây ra sai số đo lường và biến động trong phần dư giữa các đơn vị chéo Hơn nữa, tương quan dương của các phần dư trong hồi quy bằng phương pháp bình phương nhỏ nhất cũng làm cho sai số chuẩn của hệ số góc chệch xuống, vì vậy vấn đề suy diễn thống kê không còn tin cậy
Để cải thiện độ chính xác trong ước lượng hệ số beta, các nhà nghiên cứu điển hình như Blume và Marshall (1970), Friend, Irwin và Blume (1970), Black, Jensen và Scholes (1972) đã sử dụng danh mục các chứng khoán thay vì các chứng khoán riêng lẻ Ước lượng beta trong danh mục đa dạng hóa chính xác hơn so với hệ số beta của các chứng khoán riêng lẻ Do đó, sử dụng danh mục trong hồi quy dữ liệu chéo với biến phụ thuộc
là tỉ suất sinh lợi trung bình và biến giải thích là hệ số beta tương ứng của danh mục, sẽ giúp giảm thiểu vấn đề về các lỗi nghiêm trọng trong sai số đo lường Việc lựa chọn danh mục đa dạng hóa các chứng khoán bằng cách sắp xếp hệ số beta của các chứng khoán riêng lẻ, sau đó các chứng khoán được nhóm theo giá trị từ bé đến lớn của hệ số beta
Fama và MacBeth (1973) đề xuất cải thiện vấn đề tương quan phần dư giữa các đơn vị chéo, thay vì hồi quy đơn tỉ suất sinh lợi trung bình theo tháng và hệ số beta thì tác giả đề xuất hồi quy tháng theo tháng (month by month), tức là sử dụng chuỗi thời
Trang 26gian Kết quả là nghiên cứu này ủng hộ mô hình CAPM với dữ liệu trên thị trường NYSE
từ 1/1926 đến 6/1968
Jensen (1968) lần đầu tiên sử dụng chuỗi thời gian trong mô hình CAPM Lintner Tác giả nghiên cứu hiệu quả của các quỹ hỗ tương từ năm 1945-1964 với mô hình hồi quy:
r r r r Theo lý thuyết thì hệ số alpha (gọi là alpha – Jensen) phải bằng 0 Kết quả là trung bình trong 115 quỹ nghiên cứu không có khả năng dự đoán giá chứng khoán Tức là nghiên cứu không ủng hộ mô hình CAPM phiên bản Sharpe-Lintner
Các kiểm định đầu tiên từ mô hình CAPM Sharpe-Lintner hầu như bác bỏ CAPM Mặc dù vẫn tồn tại mối tương quan dương giữ tỉ suất sinh lợi kỳ vọng và hệ số beta nhưng nó quá phẳng, tức là hệ số góc trong mô hình hồi quy quá gần 0, hệ số góc này lẻ
ra phải bằng tỉ suất sinh lợi kỳ vọng vượt trội của thị trường Các hồi quy cũng cho thấy rằng hệ số chặn lớn hơn lãi suất phi rủi ro (đại diện là T-bill một tháng), hệ số của beta thì nhỏ hơn tỉ suất sinh lợi kỳ vọng vượt trội của thị trường (đại diện bởi danh mục thị trường của Mỹ trừ lãi suất T-bill một tháng) Các nghiên cứu điển hình như Douglas (1968), Black, Jensen, Scholes (1972), Miller và Scholes (1972), Blume và Friend (1973), Fama và MacBeth (1973) hay gần đây là Fama và French (1992)
Nghiên cứu Kiran Lohano và Muhammad Kashif (2018) trong nghiên cứu kiểm định mô định giá tài sản ở Pakistan từ 11/2000 đến 12/2016, sử dụng cả 3 phương pháp hồi quy là OLS, SURE và GMM, chứng tỏ rằng mô hình 3 nhân tố giải thích tốt hơn mô hình CAPM Hơn nữa, kiểm định Wald cho tất cả các hệ số chặn bằng không, kết quả là thống kê Wald có p-value thấp gần bằng 0 cho cả 3 phương pháp hồi quy Do đó, mô hình CAPM không có giá trị trong thực nghiệm
Pankaj Chaudhary (2018) nghiên cứu trên thị trường chính khoán ở Ấn Độ từ 1/2001 đến 1/2015 bằng cách sắp xếp các hệ số beta theo thứ tự tăng dần theo mỗi năm, sau đó lấy 25 danh mục, mỗi danh mục gồm 10 chứng khoán riêng lẻ Từ đó ước
Trang 27lượng đường SML để kiểm định mô hình CAPM Kết quả CAPM không có khả năng giải thích biến động của tỉ suất sinh lợi trong thị trường vốn trong giai đoạn nghiên cứu này Do đó mô hình CAPM bị bác bỏ
2.3 Support Vector Regression (SVR)
2.3.1 Tổng quan về SVR
Machine Learning là một lĩnh vực của trí tệ nhân tạo được ứng dụng rộng rãi ngày nay Việc ứng dụng Machine Learning như mà một xu hướng tất yếu do những tiện ích vượt trội mà nó mang lại Trong lĩnh vực tài chính, nó có thể giúp phát hiện những gian lận trong thương mại thông qua những phát hiện giao dịch bất thường Nó có khả năng
dự báo giá chứng khoán và cải thiện độ chính xác thông qua quá trình học trên tập dữ liệu mà nó có thể tự thu thập trên các trang mạng tin cậy Ngoài ra, nó có thể giúp khám phá những nhân tố tìm ẩn tác động đến mô hình, giúp cho mô hình hoàn thiện hơn, Thuật toán Support Vector (SV) là một thuật toán trong Machine Learning được phát triển ở Nga được đề xuất đầu tiên bởi Mangasarian do Ponstein (1965), Vapnik và Lerner (1963), Vapnik Chervonenkis (1964) Mặt dù không phổ biến bằng SVM nhưng thuật toán SVR được chứng minh hiệu quả trong ước tính hàm thực SVR là một thuật toán học có giám sát, SVR sử dụng hàm loss đối xứng làm hạn chế tác động sai lệch giữa giá trị cao và thấp Một ưu điểm nổi bậc của SVR là độ phức tạp thuật toán không phụ thuộc vào chiều của dữ liệu đầu vào Ngoài ra, nó có khả năng tổng quát hóa và độ chính xác dự đoán cao
2.3.2 Mô hình Toán học của SVR
Phương pháp phân lớp dựa vào thuật toán Support Vector Machine (SVM) là ánh
xạ từ các biến độc lập với N quan sát tới một không gian một hoặc nhiều chiều nhằm phân lớp giữa các nhóm Phương pháp này được đề xuất bởi Vapnik (1995), sử dụng tập training i, i 1,
i N
x y
để xây dựng mô hình tuyến tính với biên phân lớp phi tuyến Phân lớp giữa các nhóm được thực hiện bằng cách sử dụng siêu phẳng tối ưu được tính toán
Trang 28dựa vào N quan sát, trong đó x là biến độc lập, y là biến phân loại y i 1,1 Do đó, siêu phẳng phân lớp được cho bởi phương trình sau đây:
:w T x k b 0 2.3
Trong đó: :R n R m là ánh xạ từ tập ban đầu đến không gian nhiều chiều hơn
để thuận lợi cho việc phân lớp
Bằng cách điều chỉnh các trọng số w và hệ số b, ta có thể giả sử khoảng cách ngắn nhất của các điểm đến siêu phẳng (H) bằng 1 cho cả hai lớp Minh họa ở hình 2.3, bài toán phân lớp SVM chính là đi tìm các tham số w, b của mô hình
Hình 2.3 Siêu phẳng phân lớp H cho trường hợp là ánh xạ đồng nhất
(Nguồn: Machine Learning cơ bản của Vũ Hữu Tiệp năm 2020) Với quan sát thứ k, ta có: w T x k thì b 1 y k 1 và w T x k thì b 11
k
y , hoặc ta có thể gộp lại như sau: y kw T x k b1 2.4 Các tham số mô hình thu được bằng cách cực tiểu hóa w theo w và b với điều kiện ràng buộc (2.4) Điều kiện phân loại ban đầu được Vapnik (1995) đề xuất là
Trang 29 x T k
class sgn w x Tuy nhiên, ánh xạ sang không gian mới bởi có thể vẫn b
phân chia không hoàn hảo Do đó một lề mềm do Vapnik (1995) đề xuất là có thể cho cho phép một số quan sát bị phân loại sai, sử dụng các biến bù k đo độ sai lệch của quan sát thứ k Khi đó điều kiện ràng buộc trở thành y kw T x k b 1 k 2.5
Tối ưu hóa hàm mục tiêu với ràng buộc (2.5):
2 ,
Q y y K x x Hàm K x x i, j x i T x j được gọi là kernel Từ đó, phân lớp
sẽ được quyết định bởi:
1
N T
Trang 30i i
, trong đó C chính là siêu tham số
Một số hàm kernel thông dụng hay sử dụng là dạng tuyến tính, đa thức và dạng mũ:
2.4 Support Vector Regression (SVR) và các nghiên cứu liên quan
Machine Learning ngày nay có mặt trong hầu hết các lĩnh vực Google Translate là minh chứng điển hình, từ khi giới thiệu tháng 4 năm 2006 cho đến ngày nay, nó ngày một hoàn thiện hơn do ứng dụng Machine Learning để cải thiện độ chính xác trong chuyển ngữ Facebook cũng làm điều tương tự cho việc gợi ý kết bạn, phân loại thư rác
từ Google Mail, chuẩn đoán y khoa, ứng dụng trong tài chính để dự đoán giao dịch bất thường, dự báo giá chứng khoán,…
Năm 2011, Joao và cộng sự nghiên cứu ứng dụng SVR để dự báo số lượng mây và sản lượng điện trong nhà máy quang điện ở Nhật Dữ liệu trong mô hình từ 5/2008 đến 6/2010, dữ liệu dùng để dự đoán là từ 3/6/2009 đến 2/6/2010, nhóm nghiên cứu sử dụng hàm kernel dạng mũ Độ chính xác dự báo được đo lường bằng các chỉ tiêu RMSE, MAE, MAPE Kết quả dự báo rất tốt, RMSE khoảng 10%, MAE đạt gần 6% Nghiên cứu còn tìm thấy mối tương quan cao giữa giá trị dự đoán và giá trị đo đường trong sản xuất điện
Zeynab Ramedani và cộng sự (2014) nghiên cứu về dự đoán bức xạ mặt trời toàn cầu dựa vào SVR với hàm kernel dạng mũ, thực nghiệm ở Tehran với diện tích 730 km2 được lựa chọn, dữ liệu hằng ngày trong 6 năm từ năm 1994 đến năm 2000 Nhóm tác giả
so sánh SVR với kernel dạng mũ so sánh với kernel đa thức và mô hình ANN Tiêu chí
Trang 31đánh giá hiệu quả dự đoán dựa vào RMSE và hệ số xác định R2 Kết quả thu được từ nghiên cứu thực nghiệm là mô hình SVR với kernel dạng mũ dự đoán vượt trội hơn Tác giả còn lưu ý về lựa chọn các tham số trong mô hình để cho kết quả chính xác hơn Trong nghiên cứu dự báo giá máy bay quân sự dựa vào SVR của nhóm tác giả Jifeng Tong và cộng sự (2015) Dữ liệu được sử dụng là các loại máy bay quân sự năm
2014, vấn đề khó khăn cho dự báo chính là nhiều biến đầu vào trong khi cỡ mẫu quan sát nhỏ và nhiều đặc tính phức tạp không có dạng tuyến tính Nhóm tác giả sử dụng phương pháp SVR trong Machine Learning, sử dụng kernel là hàm dạng mũ, đã thu được một số kết quả khả quan: sai số trung bình (MSE) rất nhỏ là 5.37%, R2 = 99% rất lớn
Từ kết quả đó, nhóm tác giả đi đến kết luận phương pháp SVR cho kết quả tính toán chính xác hơn và khái quát hóa mạnh mẽ hơn trong xử lý các vấn đề phi tuyến Hạn chế của nghiên cứu là không mô tả rõ ràng phương pháp thực hiện nghiên cứu
Các ứng dụng Machine Learning trong lĩnh vực tài chính cũng rất đa dạng, điển hình như nghiên cứu ứng dụng mô hình Fama 3 và 5 nhân tố dưới khung Machine Learning của Gogas và cộng sự (2018) Tác giả sử dụng SVR so sánh với OLS đối với các mô hình: CAPM, Fama 3 và 5 nhân tố, mô hình APT Dữ liệu sử dụng như sau: đối với mô hình CAPM và mô hình Fama 3 nhân tố 7/1926 đến 12/2014 với 1062 quan sát,
mô hình Fama 5 nhân tố 7/1963 đến 12/2014 với 618 quan sát, mô hình APT 2/1986 đến 12/2014 với 346 quan sát, tất cả dữ liệu đều lấy trên sàn chứng khoán Mỹ Tiêu chí chất lượng mô hình dựa vào R2 hiệu chỉnh và MAPE Kết quả cho thấy phương pháp SVR với kernel dạng mũ và dạng đa thức hỗ trợ dự đoán tốt hơn so với phương pháp hồi quy OLS thông thường thông qua chỉ số MAPE và R2 hiệu chỉnh Một nhược điểm của nghiên cứu là không cập nhật mô hình dự báo theo thời gian làm mất ưu thế của Machine Learning
Henrique và cộng sự (2018) trong nghiên cứu dự đoán giá cổ phiếu sử dụng SVR cho dữ liệu hàng ngày có cập nhật mô hình theo gian, khắc phục nhược điểm ở nghiên cứu Gogas (2018) Nhóm tác giả so sánh với mô hình bước đi ngẫu nhiên trong giả thuyết
Trang 32thị trường hiệu quả (Efficient Market Hypothesis - EMH), nhóm tác giả sử dụng 2 tiêu chí đánh giá chất lượng mô hình là MAPE và RMSE Dữ liệu nghiên cứu bao gồm cổ phiếu ở Brazil, Mỹ và Trung quốc giai đoạn từ năm 2002 đến 2017 Nhóm tác giả chia
dữ liệu ra 2 giai đoạn theo tỉ lệ 7:3, giai đoạn đầu cho việc xác định các tham số đầu vào
và giai đoạn sau cho tập kiểm tra, bao gồm giá hàng ngày và giá từng phút Hàm kernel được sử dụng cho SVR là cả 3 hàm: tuyến tính, đa thức và dạng mũ Một số kết quả thu được như sau:
Mô hình SVR với kernel tuyến tính và tập huấn luyện cố định cho kết quả tốt hơn
so với dạng mũ và đa thức, vượt trội hơn mô hình bước đi ngẫu nhiên trong dữ liệu tính theo ngày
Khi dữ liệu tính theo phút, hiệu quả dự đoán của SVR giảm rõ rệt, kém hơn so với
mô hình bước đi ngẫu nhiên
Mô hình SVR với kernel tuyến tính và có cập nhật cho kết quả hầu hết tốt hơn so với mô hình bước đi ngẫu nhiên bất kể dữ liệu theo ngày hay theo phút
Một số hạn chế của nghiên cứu này là không xét đến chi phí giao dịch, rủi ro danh mục, kết quả phụ thuộc nhiều vào cổ phiếu được chọn làm đại diện, các dữ liệu khuyết cũng như các outliers
Gần đây nhất Yuan và cộng sự (2020) nghiên cứu sử dụng phương pháp Least Squares Support Vector Regression (LSSVR) để đự đoán giá vàng Trong mô hình nghiên cứu này, nhóm tác giả sử dụng data mining từ các tin tức mới bắt đầu 1/1/2016 đến 31/12/2017 ở Đài Loan để đo lường biến Opinion score, giá vàng giao ngay cũng lấy trong cùng thời kỳ, ngoài ra các biến độc lập bao gồm biến trễ một kỳ của vàng, giá bạc, platium, palladium, Opinion score Ngoài ra, nhóm tác giả sử dụng tiêu chuẩn đánh giá chất lượng là MAPE Để so sánh 2 mô hình dự báo, nhóm nghiên cứu dùng Wilcoxon test và Friedman test Kết quả nghiên cứu cho thấy phương pháp LSSVR được tối ưu các tham số bởi Genetic Algorithm có cải thiện về giá trị MAPE, có độ chính xác dự báo
vượt trội hơn
Trang 33CHƯƠNG 3 PHƯƠNG PHÁP NGHIÊN CỨU
3.1 Giả thuyết nghiên cứu và dữ liệu nghiên cứu
3.1.1 Dữ liệu nghiên cứu
Dữ liệu được thu thập bao gồm chỉ số Vnindex, giá đóng đã hiệu chỉnh của các mã
cổ phiếu, lợi suất trái phiếu kỳ hạn 1 năm lấy theo tháng từ 01/2011 đến 10/2020 Giá cổ phiếu và chỉ số Vnindex được lấy trên thị trường HOSE Để cho thuận tiện, chỉ số thời gian sẽ được đánh đấu bởi các số tự nhiên từ 1 đến 94 Số 1 ứng với 12/2012 và số 94 ứng với 09/2020
Dữ liệu thô được thu thập trên website https://cafef.vn/ cho các mã cổ phiếu, kể cả chỉ số Vnindex và https://vn.investing.com/ cho lợi suất trái phiếu chính phủ kỳ hạn 1 năm Dữ liệu sau đó được xử lý bằng cách xóa đi dữ liệu khuyết và các quan sát bất thường
Các mã cổ phiếu không đáp ứng thời gian hoạt động liên tục sẽ bị loại ra khỏi tập
dữ liệu Cuối cùng thu được 212 mã cổ phiếu hợp lệ trong nghiên cứu này
3.1.2 Mô tả biến
Các biến chính được tổng hợp trong bảng 3.1 sau đây:
Bảng 3.1 Mô tả biến
Tỉ suất sinh lợi mã cổ phiếu thứ i ở tháng t (đơn vị tính %/năm, sử dụng giá đóng cửa có điều chỉnh)
Trang 34Tỉ suất sinh lợi danh mục thị trường được đại diện bởi chỉ số Vnindex (đơn vị tính %/năm)
𝑅𝑝𝑖𝑡 𝑅𝑝𝑖𝑡 = 𝑟𝑝𝑖𝑡− 𝑟𝑓𝑡 Tỉ suất sinh lợi vượt trội của danh
premiumit 𝑝𝑟𝑒𝑚𝑖𝑢𝑚𝑖𝑡 = 𝛽𝑝𝑖𝑡(𝑟𝑀𝑡 − 𝑟𝑓𝑡) Phần bù rủi ro được xác định bằng
CAPM
rCAPMit rCAPMit = rft + premiumit
Tỉ suất sinh lợi danh mục i ở thời điểm t được xác định bằng mô hình CAPM
rSVRit rSVRit = rf + f(premiumit)
Tỉ suất sinh lợi danh mục i ở thời điểm t được xác định bằng mô hình SVR
DCAPMit DCAPMit =|rit –rCAPMit| Sai số tuyệt đối của mô hình CAPM DSVRit DSVRit = |rit –rSVRit| Sai số tuyệt đối của mô hình SVR
Trang 35Tỉ suất sinh lợi vượt trội của danh mục i
Đo lường rủi ro được thù của chứng khoán i
rmseprecapm
2 1
Trang 363.1.3 Giả thuyết nghiên cứu về mô hình CAPM
Sự phù hợp của mô hình CAPM trong thực nghiệm là một trong những yếu tố quan trọng ảnh hưởng trực tiếp sai số trong mô hình SVR Do đó, việc kiểm định CAPM là rất cần thiết mà qua đó ta có thể xác định liệu CAPM có phù hợp trong thực nghiệm hay không, phần bù rủi ro (premium) tác động như thế nào đến tỉ suất sinh lợi Nghiên cứu
sử dụng cả hai phương pháp kiểm định bao gồm: kiểm định cho các chứng khoán riêng
lẻ và danh mục đầu tư, với giả thuyết H0: Mô hình CAPM phù hợp với thực nghiệm Đối với kiểm định sử dụng các chứng khoán riêng lẻ: thực hiện kiểm định dựa vào các nghiên cứu trước đó của John Lintner (1965), Merton Miller và Myron Scholes (1972), thực hiện lại trên thị trường HOSE Theo đó, các cổ phiếu được hồi quy chuỗi thời gian giai đoạn 1 của chuỗi tỉ suất sinh lợi vượt trội của cổ phiếu theo biến tỉ suất sinh lợi vượt trội của danh mục thị chỉ số Vnindex để thu được hệ số beta ước lượng và phương sai của phần dư đối với từng mã cổ phiếu Mô hình hồi quy như sau:
r r r r Hồi quy phương trình (3.1) thu được hệ số ước lượng betaRatei và phần dư ei của
mã chứng khoán thứ i Dựa vào các phần dư ei, ta tính phương sai các phần dư này (kí kiệu là varRatei), tính tỉ suất sinh lợi trung bình vượt trội của mã chứng khoán thứ i (kí hiệu là meanRatei)
Tiếp theo, ước lượng đường thị trường chứng khoán SML bằng cách hồi quy chéo
Trang 37Đối với danh mục đầu tư: sử dụng kiểm định CAPM theo phương pháp của Fama Macbeth (1973), Kiran Lohano và Muhammad Kashif (2018) Theo đó, 212 mã cổ phiếu
sẽ được xếp vào 10 danh mục theo thứ tự hệ số beta quá khứ tăng dần và được xếp lại sau 6 tháng Sau đó hồi quy phương trình:
meanRp =b +b betarp +ε (3.3)Thực hiện F-test cho giả thuyết H0:b0 0,b1r Mt r ft Nếu chấp nhận H0 có nghĩa
là mô hình CAPM có giá trị trong thực nghiệm
3.2 Mô hình nghiên cứu và giả thuyết về tính hiệu quả của mô hình
Dự báo bằng mô hình SVR trên các chứng khoán riêng lẻ được thực hiện theo phương pháp kiểm tra cuộn, tức là dùng kết quả hiện tại dự báo cho kỳ tiếp theo và sau
đó dựa vào dữ liệu thực tế của kỳ tiếp theo này update các tham số mô hình, sử dụng các tham số update này để dự báo tiếp theo
Trong mô hình dự báo SVR và CAPM, việc dự báo tỉ suất sinh lợi chỉ số Vnindex rất quan trọng Nghiên cứu này sử dụng 10 mô hình dự báo như sau:
ARIMA000: Sử dụng mô hình ARIMA(p,d,q) cho dự báo với p=q=d=0
AR1: Sử dụng mô hình AR(p) cho dự báo với p=1
ARIMA101: Sử dụng mô hình ARIMA(p,d,q) cho dự báo với p=q=1,d=0
lag1: Sử dụng độ trễ 1 để dự báo
lag2: Sử dụng trung bình 2 độ trễ gần nhất cho dự báo
lag3: Sử dụng trung bình 3 độ trễ gần nhất cho dự báo
lag4: Sử dụng trung bình 4 độ trễ gần nhất cho dự báo
lag5: Sử dụng trung bình 5 độ trễ gần nhất cho dự báo
lag0: Sử dụng giá trị 0 cho dự báo
pvnindex: Kết hợp 9 mô hình trên theo phương pháp “lựa chọn tốt nhất” Tức là,
để dự báo cho kỳ thứ n, ta sử dụng mô hình có chỉ số MAE thấp nhất (bắt đầu từ kỳ đầu tiên cho đến kỳ thứ n-1) trong 9 mô hình
Trang 38Dự báo bằng mô hình CAPM: precapm:r it r f t, 1 beta i t, 1 prevnindex t r f t, 1
trong đó: hệ số beta và rf đều sử dụng dữ liệu quá khứ của tháng gần nhất vì chúng ổn định trong ngắn hạn Tuy nhiên, tỉ suất sinh lợi Vnindex biến động nên nghiên cứu sử dụng kết quả dự báo của mô hình pvindex
Dự báo bằng mô hình SVR: presvr:r it r f t, 1 prepremium it trong đó prepremiumit là dự báo của premium ở thời điểm t của chứng khoán i Theo đó, 50 chỉ
số thời gian đầu tiên sẽ được sử dụng để xác định các tham số đầu vào, các chỉ số thứ 51 đến 60 dùng để tối ứu hóa các tham số trong mô hình Các dự báo sẽ được thực hiện theo phương pháp cuộn
Để so sánh khả năng giải thích mối quan hệ giũ tỉ suất sinh lợi và phần bù rủi ro, nghiên cứu sử dụng 2 mô hình fitted để só sánh luần lượt là:
Mô hình fitted CAPM: capm:r it r ft beta r i Mt-r ft
Mô hình fitted SVR:fittedsvr:r it r ft premium it, trong đó premiumit được xác định bằng thuật toán SVR dưới khung CAPM
Nghiên cứu dự đoán rằng ứng dụng thuật toán SVR dưới khung CAPM sẽ dự báo
tỉ suất sinh lợi tốt hơn so với CAPM Trường hợp này Wilcoxon test được sử dụng cho kiểm định tính hiệu quả của hai mô hình
Ngoài ra để đánh giá chất lượng của từng mô hình, nghiên cứu sử dụng tiêu chí đánh giá là RMSE và MAE như nghiên cứu trước đây của Henrique và cộng sự (2018), Yuan và cộng sự (2020) Trong đó RMSE và MAE được xác định như sau:
2 1
Trang 39CHƯƠNG 4 KẾT QUẢ VÀ THẢO LUẬN
4.1 Thống kê mô tả
Trong giai đoạn 12/2012 - 09/2020, các hệ số beta và tỉ suất sinh lợi trung bình của các công ty tương đối ổn định, các hệ số beta thì giao động từ -0.641 đến 0.867 với khoảng hơn một nửa trong số này có hệ số beta âm Trong khi đó, tỉ suất sinh lợi trung bình thì giao động từ -0.387 đến 0.415 (tức là tỉ suất sinh lợi trung bình giao động từ -38.7%/năm đến 41.5%/năm) và phần lớn đều có mức tỉ suất sinh lợi dương (median = 0.132 > 0) Số liệu cụ thể được tóm lượt trong bảng 4.1 sau đây:
Bảng 4.1 Thống kê mô tả của các biến
Trang 40Hình 4.1 Phân phối hệ số beta
(Nguồn: Tính toán trên R) Phân phối của beta có hình dạng đối xứng với trung bình và trung vị bằng 0, bên cạnh đó có 2 giá trị đặc biệt nằm cách xa so với những quan sát còn lại Nằm ở phía cực
âm chính là mã cổ phiếu “KSB” (Công ty cổ phần Khoáng sản và Xây dựng Bình Dương)
có hệ số beta là −0.533 và tỉ suất sinh lợi trung bình là -0.387 (t -38.7 %/năm) Mã cổ phiếu “KSB” cũng là công ty có tỉ suất sinh lợi trung bình thấp nhất trong 212 công ty
Ở phía cực dương là mã cổ phiếu “SVC” (Công ty Cổ phần Dịch vụ tổng hợp Sài Gòn) với hệ số beta là 0.867 và tỉ suất sinh lợi trung bình hằng năm cũng rất thấp, xấp xỉ -3.4
%/năm Nhìn chung, biến động tỉ suất sinh lợi của các công ty đều thấp hơn so với biến