Phạm Hữu Ngà MSSV: 1512160 MSSV: 1512115 Đề tài: DỰ ĐOÁN THỊ TRƯỜNG CHỨNG KHOÁNG SỬ DỤNG MẠNG THẦN KINH NHÂN TẠO STOCK MARKET INDEX PREDICTION USING ARTIFICAL NEURAL NETWORK ĐẠI HỌC BÁ
Trang 1Nhóm 14:
1 Phan Trọng Nghĩa
2 Phạm Hữu Ngà
MSSV: 1512160 MSSV: 1512115
Đề tài: DỰ ĐOÁN THỊ TRƯỜNG CHỨNG KHOÁNG SỬ
DỤNG MẠNG THẦN KINH NHÂN TẠO ( STOCK MARKET INDEX PREDICTION USING ARTIFICAL NEURAL NETWORK) ĐẠI HỌC BÁCH KHOA THÀNH PHỐ HỒ CHÍ MINH
GVHD: Huỳnh Thái Hoàng
Trang 2‐ Hệ thông minh nhân tạo như : Mạng thông minh nhân tạo ( Artifical Neural Networks – ANN),
hệ suy luận mờ ( fuzzy inference system – FIS) , hệ suy luận thần kinh thích nghi mờ ( Adaptive neuro‐fuzzy Inference System – ANFIS) đã được áp dụng để model hóa rất nhiều lĩnh vực
phức tạp trong khoa học và kỹ thuật
Trang 42/ Những nghiên cứu được công bố khi áp dụng hệ thông minh nhân tạo vào lĩnh vực kinh tế:
1. Mạng thần kinh nhân tạo (ANN) cho hiệu suất tốt hơn trong việc dự đoán phá sản so vớiphương pháp thống kê truyền thống như phương pháp phân tách và hồi quy logistic
(Quah & Srivinasan 1998)
2. Nghiên cứu về xếp hạng tín nhiệm (credit rating) cho thấy ANN dự báo tốt hơn so với
các phương pháp thống kê do mối quan hệ phức tạp giữa tài chính và các biến đầu vào khác( Hájek, 2011)
3. Dự đoán phá sản ( Alfaro García, Gámez & Elizondo 2008; Lee, Booth, & Alarm, 2005)
4. Đánh giá rủi ro tính dụng (Yu, L., Wang, S., & Lai,2008)
Trang 53/ Hệ thần kinh nhân tạo được áp dụng trong việc dự đoán chứng khoán:
3.1: Nhắc lại về Artifical Neural Network:
Mạng thần kinh nhân tạo được lấy cảm hứng từ sinh học, gồm các tế bào thần kinh (neurons) đểtiếp nhận và xử lý thông tin, và được kết nối với nhau bằng các dây thần kinh , đại diện bởi
các trọng số (weights)
Trang 6Mạng thần kinh nhiều lớp Perceptron ( Multi‐Layer Perceptron – MLP) được ứng dụng kháphổ biến trong vấn đề kiểu hồi quy. MLP gồm 3 lớp chính:
Ngõ ra được tính bằng công thức
Trang 74. Dự đoán chỉ số thị trường NASDAQ:
Trong nghiên cứu này, ta sẽ áp dụng mạng thần kinh truyền thẳng được huấn luyện bởi
thuật toán lan truyền ngược sai số (backward propagation of errors)
Phương trình mô tả khái quát hệ thống để huấn luyện:
Chú thích:
y(k) : giá cổ phiếu tại thời điểm kn: số ngày trong quá khứ
D(k) : thứ tự ngày trong tuần
Input: Giá cổ phiếu các ngày trước đó
Thứ tự của ngày hiện tại trong tuầnOutput: giá trị cổ phiếu hiện tại
Trang 8Hiệu năng của ANN được đánh giá bởi 2 yếu tố :
Hệ số xác định bội R 2 :
R2 càng cao: mối liên hệ giữa biến
độc lập và biến phụ thuộc (khi tuyến
tính hóa) càng chặt chẽ
Sai số toàn phương trung bình (Mean Square Error –MSE)
MSE đại diện cho sai số bình phương trung bình
giữa giá trị dự đoán ( y‐ predicted) vàgiá trị thực tế (y‐ experimental)
M là số lượng data
Trang 9Phương pháp :
Dữ liệu huấn luyện sẽ được chia làm 2 loại training dataset :
4 prior working day
9 prior working day
Áp dụng lần lượt các Training function và Transfer function , từ đó tìm được kết quả
tối ưu cho cả 2 loại training datasetTạo 1 Mạng Neuron lan truyền ngược với 20 – 40 – 20 neurons ở lớp ẩn
Với training function và transfer function tối ưu, ta sẽ lần lượt thay đổi cấu trúc mạng ,
bao gồm số lớp ẩn và số neuron trong mỗi lớp ẩn
BEST METHOD
Trang 105. Kết quả và thảo luận:
Giá cổ phiếu qua từng ngày của NASDAQ được thu thập trong 99 ngày, từ ngày
28 tháng 1,2015 đến 18 tháng 6, 2015 , làm training dataset để huấn luyện cho model
Training function: LM (Levenberg‐Marquardt) ; OSS ( one step secant) ;
GDA ( gradient descentwith adaptive learning rate) ;
GDM ( gradient descent with momentum)
Transfer function: TANGSIG, PURELIN , LOGSIG
Trang 11a = tangsig(n) a = logsig(n) a = purelin(n)
Trang 125.1 : Four prior working day
Trang 15Lưu ý: Bất kỳ sự thay đổi số lượng tế bào thần kinh sẽ ảnh hưởng đến độ hiệu quả
của model,nhưng không có nghĩa là càng nhiều lớp ẩn hoặc càng nhiều neron trong lớp ẩn sẽ
đạt hiệu quả cao hơnEx: Mạng 5 – 5 có giá trị R2 chấp nhận được ( 0.8631)Nhưng mạng 5 – 10 lại có khả năng dự đoán kém
Trang 17Kết quả: Sử dụng Training function OSS và Transfer function LOGSIG sẽ cho kết quả R2tối ưu nhất cho Validation dataset (0.9622)
Trang 206. Kết luận:
Trang 21‐ Không có sự khác biệt nào đáng kể đối với 2 kiểu dữ liệu đầu vào là Four prior working day
Trang 22KHUYẾT ĐIỂM
Dự đoán khá chính xác xu hướng tăng, giảm của thị trường
Training set cố định, càng về lâu xu hướng có thể thay đổi, gây ra sự
không chính xácTrực quan, dễ sử dụng và theo dõi
Trang 237. Hướng phát triển
Phần mềm( Viết bằng python)
Tự lấy dữ liệu từ server
hoặc qua excel
Cập nhật dữ liệu theothời gian thực
Sau 1 khoảng thời gian
=> Tự xóa mẫu cũ
=> Cập nhật mẫu mới
=> Auto training
Trang 24Tài liệu tham khảo thêm:
Trang 25XIN CẢM ƠN ĐÃ LẮNG NGHE