‐ Hệ thông minh nhân tạo như : Mạng thông minh nhân tạo Artifical Neural Networks – ANN,hệ suy luận mờ fuzzy inference system – FIS , hệ suy luận thần kinh thích nghi mờ Adaptiveneuro
Trang 1ĐẠI HỌC BÁCH KHOA THÀNH PHỐ HỒ CHÍ MINH
SỬ DỤNG MẠNG THẦN KINH NHÂN TẠO
( STOCK MARKET INDEX PREDICTION USING ARTIFICAL NEURAL NETWORK)
Nhóm 14:
GVHD: Huỳnh Thái Hoàng
1 Phan Trọng Nghĩa MSSV: 1512160
2 Phạm Hữu Ngà MSSV: 1512115
Trang 2‐ Hệ thông minh nhân tạo như : Mạng thông minh nhân tạo ( Artifical Neural Networks – ANN),
hệ suy luận mờ ( fuzzy inference system – FIS) , hệ suy luận thần kinh thích nghi mờ ( Adaptiveneuro fuzzy Inference System – ANFIS) đã được áp dụng để model hóa rất nhiều lĩnh vực phức‐tạp trong khoa học và kỹ thuật
Trang 42/ Những nghiên cứu được công bố khi áp dụng hệ thông minh nhân tạo vào lĩnh vực kinh tế:
1 Mạng thần kinh nhân tạo (ANN) cho hiệu suất tốt hơn trong việc dự đoán phá sản so với phương pháp thống kê truyền thống như phương pháp phân tách và hồi quy logistic (Quah & Srivinasan 1998)
2 Nghiên cứu về xếp hạng tín nhiệm (credit rating) cho thấy ANN dự báo tốt hơn so với
các phương pháp thống kê do mối quan hệ phức tạp giữa tài chính và các biến đầu vào khác( Hájek, 2011)
3 Dự đoán phá sản ( Alfaro García, Gámez & Elizondo 2008; Lee, Booth, & Alarm, 2005)
4 Đánh giá rủi ro tính dụng (Yu, L., Wang, S., & Lai,2008)
Trang 53/ Hệ thần kinh nhân tạo được áp dụng trong việc dự đoán chứng khoán:
3.1: Nhắc lại về Artifical Neural Network:
Mạng thần kinh nhân tạo được lấy cảm hứng từ sinh học, gồm các tế bào thần kinh (neurons) đểtiếp nhận và xử lý thông tin, và được kết nối với nhau bằng các dây thần kinh , đại diện bởi các trọng số (weights)
Trang 6Mạng thần kinh nhiều lớp Perceptron ( Multi Layer Perceptron – MLP) được ứng dụng khá‐phổ biến trong vấn đề kiểu hồi quy MLP gồm 3 lớp chính:
Ngõ ra được tính bằng công thức
Trang 74 Dự đoán chỉ số thị trường NASDAQ:
Trong nghiên cứu này, ta sẽ áp dụng mạng thần kinh truyền thẳng được huấn luyện bởi
thuật toán lan truyền ngược sai số (backward propagation of errors)
Phương trình mô tả khái quát hệ thống để huấn luyện:
Input: Giá cổ phiếu các ngày trước đó Thứ
tự của ngày hiện tại trong tuầnOutput: giá trị cổ phiếu hiện tại
Chú thích:
y(k) : giá cổ phiếu tại thời điểm kn: số ngày trong quá khứ D(k) : thứ tự ngày trong tuần
Trang 8Hiệu năng của ANN được đánh giá bởi 2 yếu tố :
Hệ số xác định bội R 2 : Sai số toàn phương trung bình
(Mean Square Error –MSE)
R2 càng cao: mối liên hệ giữa biến MSE đại diện cho sai số bình phương trung bìnhđộc lập và biến phụ thuộc (khi tuyến giữa giá trị dự đoán ( y predicted) và‐
tính hóa) càng chặt chẽ giá trị thực tế (y experimental)‐
M là số lượng data
Trang 9Phương pháp :
Dữ liệu huấn luyện sẽ được chia làm 2 loại training dataset :
4 prior working day
9 prior working dayTạo 1 Mạng Neuron lan truyền ngược với 20 – 40 – 20 neurons ở lớp ẩn
Áp dụng lần lượt các Training function và Transfer function , từ đó tìm được kết quả tối
ưu cho cả 2 loại training dataset
Với training function và transfer function tối ưu, ta sẽ lần lượt thay đổi cấu trúc
mạng , bao gồm số lớp ẩn và số neuron trong mỗi lớp ẩn
BEST METHOD
Trang 105 Kết quả và thảo luận:
Giá cổ phiếu qua từng ngày của NASDAQ được thu thập trong 99 ngày, từ ngày
28 tháng 1,2015 đến 18 tháng 6, 2015 , làm training dataset để huấn luyện cho model
Training function: LM (Levenberg Marquardt) ; OSS ( one step secant) ; ‐
GDA ( gradient descentwith adaptive learning rate) ;
GDM ( gradient descent with momentum)
Transfer function: TANGSIG, PURELIN , LOGSIG
Trang 11a = tangsig(n) a = logsig(n) a = purelin(n)
Trang 125.1 : Four prior working day
Dataset
Trang 15Lưu ý: Bất kỳ sự thay đổi số lượng tế bào thần kinh sẽ ảnh hưởng đến độ hiệu quả
của model,nhưng không có nghĩa là càng nhiều lớp ẩn hoặc càng nhiều neron trong lớp ẩn sẽ
đạt hiệu quả cao hơnEx: Mạng 5 – 5 có giá trị R2 chấp nhận được ( 0.8631)Nhưng mạng 5 – 10 lại có khả năng dự đoán kém
Trang 175.1 : Nine prior working day
Kết quả: Sử dụng Training function OSS và Transfer function LOGSIG sẽ cho kết quả R2tối ưu nhất cho Validation dataset (0.9622)
Trang 206 Kết luận:
Trang 21‐ Không có sự khác biệt nào đáng kể đối với 2 kiểu dữ liệu đầu vào là Four prior working day
và Nine prior working day
ƯU ĐIỂM
Trang 237 Hướng phát triển
Phần mềm( Viết bằng python)
Tự lấy dữ liệu từ server Cập nhật dữ liệu theo
hoặc qua excel thời gian thực
Sau 1 khoảng thời gian
=> Tự xóa mẫu cũ
=> Cập nhật mẫu mới
=> Auto training
Trang 24Tài liệu tham khảo thêm:
Trang 25XIN CẢM ƠN ĐÃ LẮNG NGHE