Đề tài DỰ ĐOÁN THỊ TRƯỜNG CHỨNG KHOÁNG SỬ DỤNG MẠNG THẦN KINH NHÂN TẠ

Phạm Hữu Ngà MSSV: 1512160 MSSV: 1512115 Đề tài: DỰ ĐOÁN THỊ TRƯỜNG CHỨNG KHOÁNG SỬ DỤNG MẠNG THẦN KINH NHÂN TẠO STOCK MARKET INDEX PREDICTION USING ARTIFICAL NEURAL NETWORK ĐẠI HỌC BÁ

Trang 1

Nhóm 14:

1 Phan Trọng Nghĩa

2 Phạm Hữu Ngà

MSSV: 1512160 MSSV: 1512115

Đề tài: DỰ ĐOÁN THỊ TRƯỜNG CHỨNG KHOÁNG SỬ

DỤNG MẠNG THẦN KINH NHÂN TẠO ( STOCK MARKET INDEX PREDICTION USING ARTIFICAL NEURAL NETWORK) ĐẠI HỌC BÁCH KHOA THÀNH PHỐ HỒ CHÍ MINH

GVHD: Huỳnh Thái Hoàng

Trang 2

‐ Hệ thông minh nhân tạo như : Mạng thông minh nhân tạo ( Artifical Neural Networks – ANN),

hệ suy luận mờ ( fuzzy inference system – FIS) , hệ suy luận thần kinh thích nghi mờ ( Adaptive neuro‐fuzzy Inference System – ANFIS) đã được áp dụng để model hóa rất nhiều lĩnh vực

phức tạp trong khoa học và kỹ thuật

Trang 4

2/ Những nghiên cứu được công bố khi áp dụng hệ thông minh nhân tạo vào lĩnh vực kinh tế:

1. Mạng thần kinh nhân tạo (ANN) cho hiệu suất tốt hơn trong việc dự đoán phá sản so vớiphương pháp thống kê truyền thống như phương pháp phân tách và hồi quy logistic

(Quah & Srivinasan 1998)

2. Nghiên cứu về xếp hạng tín nhiệm (credit rating) cho thấy ANN dự báo tốt hơn so với

các phương pháp thống kê do mối quan hệ phức tạp giữa tài chính và các biến đầu vào khác( Hájek, 2011)

3. Dự đoán phá sản ( Alfaro García, Gámez & Elizondo 2008; Lee, Booth, & Alarm, 2005)

4. Đánh giá rủi ro tính dụng (Yu, L., Wang, S., & Lai,2008)

Trang 5

3/ Hệ thần kinh nhân tạo được áp dụng trong việc dự đoán chứng khoán:

3.1: Nhắc lại về Artifical Neural Network:

Mạng thần kinh nhân tạo được lấy cảm hứng từ sinh học, gồm các tế bào thần kinh (neurons) đểtiếp nhận và xử lý thông tin, và được kết nối với nhau bằng các dây thần kinh , đại diện bởi

các trọng số (weights)

Trang 6

Mạng thần kinh nhiều lớp Perceptron ( Multi‐Layer Perceptron – MLP) được ứng dụng kháphổ biến trong vấn đề kiểu hồi quy. MLP gồm 3 lớp chính:

Ngõ ra được tính bằng công thức

Trang 7

4. Dự đoán chỉ số thị trường NASDAQ:

Trong nghiên cứu này, ta sẽ áp dụng mạng thần kinh truyền thẳng được huấn luyện bởi

thuật toán lan truyền ngược sai số (backward propagation of errors)

Phương trình mô tả khái quát hệ thống để huấn luyện:

Chú thích:

y(k) : giá cổ phiếu tại thời điểm kn: số ngày trong quá khứ

D(k) : thứ tự ngày trong tuần

Input: Giá cổ phiếu các ngày trước đó

Thứ tự của ngày hiện tại trong tuầnOutput: giá trị cổ phiếu hiện tại

Trang 8

Hiệu năng của ANN được đánh giá bởi 2 yếu tố :

Hệ số xác định bội R 2 :

R2 càng cao: mối liên hệ giữa biến

độc lập và biến phụ thuộc (khi tuyến

tính hóa) càng chặt chẽ

Sai số toàn phương trung bình (Mean Square Error –MSE)

MSE đại diện cho sai số bình phương trung bình

giữa giá trị dự đoán ( y‐ predicted) vàgiá trị thực tế (y‐ experimental)

M là số lượng data

Trang 9

Phương pháp :

Dữ liệu huấn luyện sẽ được chia làm 2 loại training dataset :

4 prior working day

9 prior working day

Áp dụng lần lượt các Training function và Transfer function , từ đó tìm được kết quả

tối ưu cho cả 2 loại training datasetTạo 1 Mạng Neuron lan truyền ngược với 20 – 40 – 20 neurons ở lớp ẩn

Với training function và transfer function tối ưu, ta sẽ lần lượt thay đổi cấu trúc mạng ,

bao gồm số lớp ẩn và số neuron trong mỗi lớp ẩn

BEST METHOD

Trang 10

5. Kết quả và thảo luận:

Giá cổ phiếu qua từng ngày của NASDAQ được thu thập trong 99 ngày, từ ngày

28 tháng 1,2015 đến 18 tháng 6, 2015 , làm training dataset để huấn luyện cho model

Training function: LM (Levenberg‐Marquardt) ; OSS ( one step secant) ;

GDA ( gradient descentwith adaptive learning rate) ;

GDM ( gradient descent with momentum)

Transfer function: TANGSIG, PURELIN , LOGSIG

Trang 11

a = tangsig(n) a = logsig(n) a = purelin(n)

Trang 12

5.1 : Four prior working day

Trang 15

Lưu ý: Bất kỳ sự thay đổi số lượng tế bào thần kinh sẽ ảnh hưởng đến độ hiệu quả

của model,nhưng không có nghĩa là càng nhiều lớp ẩn hoặc càng nhiều neron trong lớp ẩn sẽ

đạt hiệu quả cao hơnEx: Mạng 5 – 5 có giá trị R2 chấp nhận được ( 0.8631)Nhưng mạng 5 – 10 lại có khả năng dự đoán kém

Trang 17

Kết quả: Sử dụng Training function OSS và Transfer function LOGSIG sẽ cho kết quả R2tối ưu nhất cho Validation dataset (0.9622)

Trang 20

6. Kết luận:

Trang 21

‐ Không có sự khác biệt nào đáng kể đối với 2 kiểu dữ liệu đầu vào là Four prior working day

Trang 22

KHUYẾT ĐIỂM

Dự đoán khá chính xác xu hướng tăng, giảm của thị trường

Training set cố định, càng về lâu xu hướng có thể thay đổi, gây ra sự

không chính xácTrực quan, dễ sử dụng và theo dõi

Trang 23

7. Hướng phát triển

Phần mềm( Viết bằng python)

Tự lấy dữ liệu từ server

hoặc qua excel

Cập nhật dữ liệu theothời gian thực

Sau 1 khoảng thời gian

=> Tự xóa mẫu cũ

=> Cập nhật mẫu mới

=> Auto training

Trang 24

Tài liệu tham khảo thêm:

Trang 25

XIN CẢM ƠN ĐÃ LẮNG NGHE

Định dạng
Số trang	26
Dung lượng	1,69 MB