Trong chuyên đề Công nghệ tri thức này, tôi đề xuất một vài mô hình sử dụng để dự đoán thị trường tài chính, chứng khoán Việt Nam.. Lịch sử hình thành Theo nhà sử học nổi tiếng người Phá
Trang 1TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN.
Nguyễn Hoàng Hạc – CH1101081.
NGHIÊN CỨU CÁC MÔ HÌNH PHÂN TÍCH VÀ DỰ ĐOÁN
Trang 2TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN.
Nguyễn Hoàng Hạc – CH1101081.
NGHIÊN CỨU CÁC MÔ HÌNH PHÂN TÍCH VÀ DỰ ĐOÁN
Trang 3DANH MỤC CÁC BẢNG 5
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ 5
MỞ ĐẦU 6
CHƯƠNG 1 GIỚI THIỆU VỀ THỊ TRƯỜNG CHỨNG KHOÁN 7
1 Tổng quan về thị trường chứng khoán 7
2 Lịch sử hình thành 7
3 Đầu tư chứng khoán là gì? 9
CHƯƠNG 2 MÔ HÌNH ARIMA 10
1 Giới thiệu 10
2 Lập mô hình AR, MA và ARIMA với dữ liệu chuỗi thời gian 10
2.1 Quá trình tự hồi quy (AR) 10
2.2 Quá trình trung bình trượt (MA) 11
2.3 Quá trình tự hồi quy và trung bình trượt (ARMA) 11
2.4 Quá trình trung bình trượt kết hợp tự hồi quy (ARIMA) 12
3 Phương pháp luận của Box – Jenkins 13
CHƯƠNG 3 NEURAL NETWORKS 15
1 Giới thiệu 15
2 Mạng neural 17
3 Đề xuất mạng neural cho thị trường chứng khoán 18
3.1 Chuẩn bị dữ liệu 19
3.2 Tiêu chí đánh giá 19
CHƯƠNG 4 MÔ HÌNH GOM CỤM TÍCH HỢP 22
1 Giới thiệu 22
2 Khai phá dữ liệu trên thị trường chứng khoán 23
2.1 Gom cụm và mô hình khai phá luật có trọng số cho phân tích thị trường chứng khoán 23
2.2 Gom cụm tích hợp và Khai phá sự kết hợp 24
2.3 Gom cụm và ước lương tần suất 24
2.4 K-Means 25
Trang 42.5 Khai phá luật kết hợp 26
2.6 Kỹ thuật khai phá luật có trọng số 27
3 Giải pháp 28
3.1 Giải thuật gom cụm tích hợp và khai phá luật có trọng số 28
3.2 Kỹ thuật gom cụm tích hợp và khai phá luật có trọng số 29
3.2.1 Trade Management 30
3.2.2 Clustering Process 30
3.2.3 Trade Relation 31
3.2.4 Trend Analyzer 31
CHƯƠNG 5 THỬ NGHIỆM VÀ KẾT LUẬN 32
1 Dữ liệu và công cụ thử nghiệm 32
2 Thử nghiệm với mô hình ARIMA 32
2.1 Nhận dạng mô hình 33
2.2 Ước lượng và kiểm định với mô hình ARIMA 34
2.3 Thực hiện dự báo 36
3 Kết luận 37
Trang 5DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT Chữ viết tắt Tên đầy đủ
DANH MỤC CÁC BẢNG
Bảng 1: Giải thuật Apriori 27
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ Hình 1: Kiến trúc mô hình mạng neural MLP 17
Hình 2: Kết nối của mạng neural Perceptron 18
Hình 3: Mô hình gom cụm tích hợp và khai phá luật có trọng số 30
Hình 4: Dữ liệu chứng khoáng của Công ty cổ phần Thủy sản Mekong 32
Hình 5: Biểu đồ giá đóng cửa 33
Hình 6: Biểu đồ tự tương quan của AAM 33
Hình 7: Biểu đồ tự tương quan của AAM sau khi sai phân 34
Hình 8: Ước lượng mô hình ARIMA(1,1,1) 34
Hình 9: Kết quả mô hình ARIMA(1,1,1) 35
Hình 10: Kiểm tra phần dư có nhiễu trắng (white noise) 35
Trang 6MỞ ĐẦU
Ra đời vào đầu năm 2000, thị trường chứng khoán Việt Nam đã trở thành mộtkênh đầu tư hết sức hấp dẫn đối với các nhà đầu tư, từ các tổ chức đầu tư chuyên nghiệpcho đến các nhà đầu tư cá nhân nghiệp dư nhỏ lẻ Tuy nhiên, bên cạnh mức sinh lợi cao,đây cũng là hoạt động luôn tồn tại nhiều rủi ro tiềm ẩn bởi nhà đầu tư không phải lúc nàocũng dự đoán được chính xác xu hướng của giá cổ phiếu trong tương lai
Dự đoán giá cổ phiếu, biến động của thị trường là một chủ đề thú vị, thu hút được
sự quan tâm của nhiều nhà đầu tư, chuyên gia, nhà khoa học Hiện nay, nhiều phươngpháp dự đoán đã được phát triển để dự đoán xu hướng biến động giá cổ phiếu, thị trườnghoặc tìm kiếm các cổ phiếu tiềm năng để đầu tư Ở Việt Nam, phương pháp phân tích và
dự đoán được nhiều người biết đến nhất là phân tích kỹ thuật và phân tích cơ bản Bêncạnh đó, phương pháp phân tích và dự đoán bằng định lượng thông quá các mô hình toánhọc đang dần được quan tâm
Thị trường chứng khoán trên thế giới nói chung và ở Việt Nam nói riêng luôn lànơi hấp dẫn các tổ chức và cá nhân đầu tư bởi mức sinh lợi cao của nó Tuy nhiên, đâycũng là một hoạt động tiềm ẩn rất nhiều rủi ro Vì thế, việc đưa ra dự đoán xu hướng biếnđộng của chỉ số giá chứng khoán để có một sách lược phù hợp cho hoạt đầu tư thu hút rấtnhiều sự quan tâm Trong chuyên đề Công nghệ tri thức này, tôi đề xuất một vài mô hình
sử dụng để dự đoán thị trường tài chính, chứng khoán Việt Nam Báo cáo gồm các phầnchính như sau:
Chương 1: Giới thiệu thị trường chứng khoán, trong chương này giới thiệu tổng
quát về thị trường chứng khoán, cổ phiếu, trái phiếu trên thị trường chứng khoán
Chương 2: Mô hình ARIMA, chương này trình bày mô hình ARIMA và sử dụng mô
hình ARIMA để dự đoán theo chuỗi thời gian
Chương 3: Mô hình Neural Networks, trình bày mô hình mạng neural và sử dụng mạng
neural trong dự đoán cho thị trường tài chính chứng khoán
Chương 4: Mô hình gom cụm tích hợp, trình bày mô hình gom cụm tích hợp và sử dụng
mạng mô hình gom cụm tích họp cho dự đoán chứng khoán.
Chương 5: Thử nghiệm và Kết luận, chương này trình thử nghiệm và đánh giá so sánh
giữa các mô hình
Trang 7CHƯƠNG 1 GIỚI THIỆU VỀ THỊ TRƯỜNG CHỨNG KHOÁN
1 Tổng quan về thị trường chứng khoán
Thị trường chứng khoán là thị trường trên đó giao dịch các loại chứng khoán như
cổ phiếu, trái phiếu, các công cụ phái sinh bao gồm cả chứng khoán niêm yết công khaitrên sàn giao dịch chứng khoán và chứng khoán giao dịch không công khai
Hàng hoá chủ yếu trên các sàn giao dịch chứng khoán lớn thường là cổ phiếu, còntrái phiếu và các công cụ phái sinh khác hay được mua bán trên thị trường OTC hơn Qui
mô của thị trường trái phiếu toàn cầu được ước tính vào khoảng 45.000 tỷ USD, còn qui
mô của thị trường cổ phiếu vào khoảng phân nửa con số đó Qui mô của thị trường cácchứng khoán phái sinh vào khoảng 300.000 tỷ USD [7], tuy nhiên người ta không so sánhtrực tiếp nó với 2 thị trường trên vì đó chỉ là giá trị danh nghĩa của chúng, trong khi cáccon số nói trước đó là giá trị thực của cổ phiếu trái phiếu
Những người tham gia vào thị trường chứng khoán vô cùng đa dạng, nhưng tựutrung lại có thể chia ra làm 2 loại chính: nhà đầu tư cá nhân và các tổ chức đầu tư, trong
đó các tổ chức chiếm đa số tính theo khối lượng giao dịch Giao dịch của các nhà đầu tưnày thường không được thực hiện một cách trực tiếp mà thông qua những người môi giớichứng khoán chuyên nghiệp
Phương thức giao dịch chủ yếu của thị trường chứng khoán là phương thức đấugiá, những người tham gia sẽ tiến hành đặt lệnh, trong đó nêu rõ mức giá mong muốn củamình Phương thức này giúp đảm bảo tính công bằng cao nhất cho mọi đối tượng thamgia Khi giá chào mua phù hợp với giá chào bán thì giao dịch sẽ được thực hiện, hay nóicách khác là được “khớp lệnh” Mục đích của sàn giao dịch chứng khoán là tạo thuận lợicho việc giao dịch các loại chứng khoán giữa người mua với người bán, qua đó tạo lậpnên một thị trường cho thứ hàng hoá đặc biệt này
2 Lịch sử hình thành
Theo nhà sử học nổi tiếng người Pháp Fernand Braudel, ngay từ thế kỉ 11, ở Cairo,những thương nhân người Hồi giáo và Do Thái đã xây dựng nên những hiệp hội thươngnghiệp đầu tiên và có những hiểu biết về các phương thức tín dụng và thanh toán, lànhững mầm mống cho thị trường chứng khoán sau này Giữa thế kỉ 13 những nhà ngânhàng ở Venetia bắt đầu tiến hành những giao dịch đối với các chứng khoán do Chính phủ
Trang 8phát hành, tuy nhiên năm 1351, chính quyền Venetia đã ra lệnh nghiêm cấm việc phổ biếnnhững tin đồn có mục đích là giảm giá trị các quỹ do Chính quyền sở hữu Những nhàngân hàng ở Pisa, Verona, Genoa và Florence thuộc Italy đã bắt đầu tiến hành mua bánchứng khoán do Chính phủ phát hành từ thế kỷ 14, điều này thực hiện được là vì đây lànhững thành bang độc lập, không nằm dưới quyền cai trị của một công tước nào mà bởimột hội đồng những người có ảnh hưởng.
Sau đó, chính người Hà Lan khởi xướng ra các công ty cổ phần, mà cổ đông có thểđầu tư vào để chia sẻ lợi nhuận cũng như thua lỗ Năm 1602, Công ty Đông Ấn đã pháthành những cổ phiếu đầu tiên ra Sàn giao dịch chứng khoán Amsterdam Đó là công tyđầu tiên trên thế giới phát hành cổ phiếu và trái phiếu Sàn giao dịch chứng khoánAmsterdam cũng được coi là sàn giao dịch đầu tiên trên thế giới hoạt động một cách liêntục Chính người Hà Lan là những người nghĩ ra những nghiệp vụ giao dịch chứng khoánnhư “bán khống”, “giao dịch quyền chọn”, “nghiệp vụ swap nợ - cổ phần”, “nghiệp vụngân hàng thương mại” và nhiều công cụ đầu cơ khác mà cho đến ngày nay người ta vẫncòn sử dụng
Ngày nay thì mọi quốc gia phát triển và hầu hết các nước đang phát triển đều có thịtrường chứng khoán, một thị trường không thể thiếu với mọi nền kinh tế muốn phát triểnvững mạnh vì các lý do sau:
Thứ nhất, thị trường chứng khoán là một trong những kênh huy động vốn quan
trọng nhất của các công ty, giúp các công ty có thể niêm yết công khai, tăng thêm vốn để
mở rộng hoạt động kinh doanh Tính thanh khoản mà thị trường chứng khoán tạo ra chophép các nhà đầu tư nhanh chóng và dễ dàng bán các loại chứng khoán khi có nhu cầu
Đó chính là một nét hấp dẫn của việc đầu tư vào cổ phiếu so với các hình thức đầu tư kémthanh khoản khác như đầu tư vào bất động sản chẳng hạn
Thứ hai, thị trường chứng khoán được coi là một chiếc phong vũ biểu của nền kinh
tế Lịch sử đã chỉ ra rằng, giá cổ phiếu và các loại tài sản tài chính khác là một phần quantrọng của hoạt động kinh tế và nó có thể gây ảnh hưởng hoặc là một thước đo đánh giá kỳvọng của xã hội Giá cổ phiếu tăng thường liên quan đến việc tăng lượng vốn đầu tư vàocác hoạt động kinh doanh và ngược lại Do đó, các ngân hàng trung ương luôn để mắt tớiviệc kiểm soát và ứng xử của thị trường chứng khoán và đến sự hoạt động trơn tru của hệ
Trang 9thống tài chính vì sự ổn định tài chính luôn là một trong những chức năng quan trọng nhấtcủa các ngân hàng trung ương.
3 Đầu tư chứng khoán là gì?
Chứng khoán (Security) là một công cụ tài chính giúp công ty có thể huy động vốnngoài thị trường vốn (capital market) Có 2 loại chứng khoán là: trái phiếu (Bond) và cổphiếu (Stock) Trái phiếu là công cụ nợ, mang lại lãi cố định, cũng có thể trao đổi trên thịtrường chứng khoán Công cụ này thường được các tổ chúc tài chính dùng hơn nhà đầu tư
cá nhân vì tính phúc tạp của nó Trong khi đó, cổ phiếu phổ biến, đơn giản và mang lại lợinhuận cao nên được các nhà đầu tư cá nhân lựa chọn nhiều Cổ phiếu được phân ra 2 loạinhỏ là cổ phiếu thường và cổ phiếu ưu đãi Cổ phiếu ưu đãi không phổ biến vì chỉ pháthành nội bộ hoặc cổ đông chiến lược và không được mua bán trên thị trường
Lợi nhuận và rủi ro mà cổ phiếu đem lại cho nhà đầu tư Lợi nhuận của cổ phiếubao gồm: cổ tức (dividend) và lợi nhuận chênh lệch từ việc bán cổ phiếu (capital gain)
Cổ tức là số tiền trích từ lợi nhuận hàng năm của công ty chia cho cổ đông dựa vào tỉ lệ sởhữu cổ phần của nhà đầu tư Số tiền này thường ít (khoảng 1000 – 2000 VNĐ/năm chomỗi cổ phiếu) Cái hấp dẫn nhà đầu tư là lợi nhuận chênh lệch vì cái này không có mộtmức cố định nào cả Do đặc trưng của cổ phiếu là không có thời hạn nhất định, khi nàocông ty còn niêm yết thì cổ phiếu đó còn giá trị, do vậy khả năng kiếm lợi nhuận từ cổphiếu có thể không bao giờ hết Nếu đầu tư tốt thì một cổ phiếu có thể đem lại vài trămphần trăm lợi nhuận cho nhà đầu tư
Dự đoán sự lên xuống của các chỉ số chứng khoán là một việc luôn diễn ra trên thịtrường chứng khoán Bất kỳ ai tham gia thị trường chứng khoan đều có thể đưa ra dựđoán dựa trên những cơ sở, lý lẽ của riêng mình Nhưng để có thể trở thành chuyên giaphân tích, dự đoán đúng nghĩa, bằng cấp là không đủ, mà cần phải có kinh nghiệm, có khảnăng phán đoán với độ chính xác cao Đây thực sự là đỉnh mà không phải ai cố gắng cũngđạt được
Trang 10CHƯƠNG 2 MÔ HÌNH ARIMA
1 Giới thiệu
Sự ra đời của cuốn sách Time Series Analysis: Forecasting and Control (Phân tích
chuỗi thời gian: dự đoán và kiểm soát) đã dẫn tới một kỷ nguyên mới của các công cụ dựđoán [14] [15] Được biết rộng rãi dưới cái tên phương pháp luận Box-Jenkins (BJ) [3],nhưng về mặt kỹ thuật được gọi là phương pháp luận ARIMA, trọng tâm của các phươngpháp dự đoán mới này không phải là xây dựng các mô hình đơn phương trình hay phươngtrình đồng thời mà là phân tích các tính chất xác suất hay ngẫu nhiên của bản thân các
chuỗi thời gian kinh tế theo triết lý “hãy để dữ liệu tự nói” Không giống như các mô hình hồi quy trong đó Y t được giải thích bởi k biến làm hồi quy X 1 , X 2 , X 3 , , X k, trong các
mô hình chuỗi thời gian kiểu BJ Y t có thể được giải thích bởi các giá trị trong quá khứ hay
giá trị trễ của bản thân biến Y và các sai số ngẫu nhiên Vì lý do này, các mô hình ARIMA đôi khi được gọi là mô hình lý thuyết a bởi vì các mô hình này không thể suy ra được từ
bất cứ lý thuyết kinh tế nào – và các lý thuyết kinh tế thường là cơ sở cho các mô hìnhphương trình đồng thời
2 Lập mô hình AR, MA và ARIMA với dữ liệu chuỗi thời gian
Nếu một chuỗi thời gian có tính dừng, ta có thể lập mô hình theo nhiều cách khácnhau
3.1 Quá trình tự hồi quy (AR)
Gọi Y t đại diện cho GDP vào thời gian t Nếu ta lập mô hình Y t như sau:
(Y t−δ)=α1(Y t −1−δ)+u t(2.1)
Với δ là giá trị trung bình của Y và u t là một số hạng sai số ngẫu nhiên khôngtương quan, có giá trị trung bình bằng 0 và phương sai không đổi σ2(nó được gọi là yếu tố
nhiễu ngẫu nhiên thuần túy – white noise) thì ta nói rằng Y t tuân theo quá trình ngẫu
nhiên tự hồi quy bậc nhất hay AR(1) Ở đây, giá trị Y trong thời đoạn t phụ thuộc vào
giá trị của nó trong thời đoạn trước và vào một yếu tố ngẫu nhiên; các giá trị của Y được
biểu diễn dưới dạng độ lệch khỏi giá trị trung bình của nó Nói một cách khác, mô hình
này cho biết giá trị dự đoán của Y trong thời đoạn t chỉ đơn giản là tỷ lệ ( α1) của giá trị
của nó trong thời đoạn (t – 1) cộng với yếu tố nhiễu ngẫu nhiên trong thời gian t; một lần nữa, các giá trị của Y cũng được biểu diễn xung quanh giá trị trung bình của nó.
Trang 11Nhưng nếu xem xét mô hình sau
(Y t−δ)=α1(Y t −1−δ)+α2(Y t −2−δ)+u i(2.2)
thì ta có thể nói rằng Y t tuân theo quá trình tự hồi quy bậc hai hay AR(2) Tức là,
giá trị của Y trong thời đoạn t phụ thuộc vào giá trị của nó trong hai thời đoạn trước đó, với các giá trị của Y được biểu diễn xung quanh giá trị trung bình δ
Nói chung ta có thể viết
(Y t−δ)=α1(Y t −1−δ)+α2(Y t −2−δ)+u i+…+α p(Y t− p−δ)+u i(2.3)
Trong trường hợp này, Y t là quá trình tự hồi quy bậc p hay AR(p).
Lưu ý rằng trong tất cả các mô hình trên, chỉ có các giá trị hiện tại và quá khứ của
Y được đưa vào mô hình; không có biến làm hồi quy nào khác Do vậy, ta nói rằng “dữ
liệu tự nói” Đây là một loại mô hình dạng rút gọn trong các mô hình phương trình đồng
thời
3.2 Quá trình trung bình trượt
(MA)
Quá trình AR vừa thảo luận không phải là cơ chế duy nhất có thể tạo ra Y Giả sử
ta lập mô hình Y như sau:
là một quá trình MA(q) Nói ngắn gọn, một quá trình trung bình trượt đơn giản là một kết
hợp tuyến tính của các số hạng nhiễu ngẫu nhiên thuần túy
3.3 Quá trình tự hồi quy và trung
bình trượt (ARMA)
Trang 12Tất nhiên, có nhiều khả năng là Y có các đặc điểm của cả AR và MA và do vậy có đặc điểm ARMA Vậy, Y t tuân theo quá trình ARMA(1, 1) nếu nó có thể viết dưới dạng
3.4 Quá trình trung bình trượt kết
hợp tự hồi quy (ARIMA)
Các mô hình chuỗi thời gian mà ta đã thảo luận được dựa vào giả thiết là các chuỗithời gian nghiên cứu có tính dừng yếu Nói ngắn gọn, giá trị trung bình và phương sai củachuỗi thời gian có tính dừng yếu là hằng số và đồng phương sai của nó không đổi theothời gian Nhưng ta biết rằng nhiều chuỗi thời gian kinh tế không có tính dừng, tức làchúng kết hợp (integrated)
Nhưng nếu một chuỗi thời gian là kết hợp bậc nhất [có nghĩa là nó có dạng I(1)], thì các sai phân bậc một của nó là I(0), tức là, có tính dừng Tương tự, nếu một chuỗi thời gian là I(2), sai phân bậc hai của nó là I(0) Nói chung, nếu một chuỗi thời gian là I(d), sau khi tính sai phân d lần ta có một chuỗi I(0).
Do vậy, nếu ta phải tính sai phân một chuỗi thời gian d lần để làm cho nó có tính dừng và sau đó áp dụng mô hình ARMA(p, q), ta nói rằng chuỗi thời gian ban đầu là
ARIMA(p, d, q), tức là nó là một chuỗi thời gian trung bình trượt kết hợp tự hồi quy, với
p biểu thị số các số hạng tự hồi quy, d biểu thị số lần chuỗi thời gian phải được tính sai
phân cho tới khi có tính dừng và q là số các số hạng trung bình trượt Vậy, một chuỗi thời gian ARIMA(2, 1, 2) phải được sai phân một lần (d=1) để nó có tính dừng Và chuỗi thời gian có tính dừng (sai phân bậc một) có thể được lập mô hình dưới dạng ARMA(2, 2), tức
là, nó có hai số hạng AR và hai số hạng MA Tất nhiên, nếu d = 0 (nghĩa là chuỗi thời gian khởi đầu có tính dừng), ARIMA(p, d = 0, q) = ARMA(p, q) Chú ý rằng một quá trình
ARIMA(p, 0, 0) có nghĩa là quá trình có tính dừng AR(p) thuần túy; một quá trình ARIMA(0, 0, q) có nghĩa là quá trình có tính dừng MA(q) thuần túy Khi biết các giá trị
của p, d và q, ta có thể phát biểu quá trình nào đang được lập mô hình.
Trang 13Điểm quan trọng cần lưu ý là để sử dụng phương pháp luận Box-Jenkins, ta phải
có chuỗi thời gian có tính dừng hay chuỗi thời gian có tính dừng sau khi đã thực hiện mộthay nhiều phép sai phân Lý do của giả thiết về tính dừng có thể được giải thích như sau:
Mục tiêu của B-J [Box-Jenkins] là xác định và ước lượng một mô hình thống kê cóthể được giải thích là đã tạo ra dữ liệu mẫu Nếu sau đó mô hình ước lượng này được sửdụng để dự đoán, ta phải giả thiết rằng các đặc điểm của mô hình này không đổi theo thờigian và đặc biệt là trong các khoảng thời gian tương lai Vậy, lý do đơn giản của việc yêucầu dữ liệu có tính dừng là bản thân mọi mô hình suy luận từ các dữ liệu này có thể đượcgiải thích là có tính dừng hay ổn định, từ đó cung cấp cơ sở có giá trị cho việc dự đoán[4]
3 Phương pháp luận của Box – Jenkins
Câu hỏi đáng giá nghìn vàng rõ ràng là: Xem xét một chuỗi thời gian, làm sao ta
biết được là nó tuân theo một quá trình AR thuần túy (và nếu có thì giá trị của p bằng bao nhiêu) hay một quá trình MA thuần túy (và nếu có thì giá trị của q bằng bao nhiêu) hay một quá trình ARMA (và nếu có thì các giá trị của p và q bằng bao nhiêu) hay một quá
trình ARIMA mà ta phải biết các giá trị của p, d và q Phương pháp luận BJ đã xuất hiệnđúng lúc để trả lời cho câu hỏi trên Phương pháp này gồm bốn bước:
Bước 1 Nhận dạng Tức là, tìm các giá trị thích hợp của p, d và q Ta sẽ trình bày
ngắn gọn biểu đồ tương quan (correlogram) và biểu đồ tương quan riêng phần (partialcorrelogram) hỗ trợ cho công việc này như thế nào
Bước 2 Ước lượng Sau khi đã nhận dạng các giá trị thích hợp của p và q, bước
tiếp theo là ước lượng các thông số của các số hạng tự hồi quy và trung bình trượt trong
mô hình Đôi khi phép tính này có thể được thực hiện bằng phương pháp bình phương tốithiểu nhưng đôi khi ta phải sử dụng các phương pháp ước lượng phi tuyến (thông số phituyến) Do bây giờ công việc này có thể được thực hiện tự động bằng một số phần mềmthống kê, ta không cần phải lo lắng về trình tự toán học của phép ước lượng này
Bước 3 Kiểm tra chẩn đoán Sau khi đã lựa chọn mô hình ARIMA cụ thể và ước
lượng các tham số của nó, ta tìm hiểu xem mô hình lựa chọn có phù hợp với dữ liệu ởmức chấp nhận hay không bởi vì có thể một mô hình ARIMA khác cũng phù hợp với dữliệu Đó là lý do tại sao phương pháp lập mô hình ARIMA của Box – Jenkins là một nghệ
Trang 14thuật nhiều hơn là một khoa học; cần phải có kỹ năng tốt để lựa chọn đúng mô hình
ARIMA Một kiểm định đơn giản về mô hình lựa chọn là xem xem các phần dư ước lượng
từ mô hình này có tính ngẫu nhiên thuần túy hay không; nếu có, ta có thể chấp nhận sựphù hợp này của mô hình; nếu không, ta phải lặp lại từ đầu: Như vậy, phương pháp luận
BJ là một quá trình lặp lại
Bước 4 Dự đoán Một trong số các lý do về tính phổ biến của phương pháp lập mô
hình ARIMA là thành công của nó trong dự đoán Trong nhiều trường hợp, các dự đoánthu được từ phương pháp này tin cậy hơn so với các dự đoán tính từ phương pháp lập môhình kinh tế lượng truyền thống, đặc biệt là đối với dự đoán ngắn hạn Tất nhiên, từngtrường hợp phải được kiểm tra cụ thể
Trang 15CHƯƠNG 3 NEURAL NETWORKS
1 Giới thiệu
Khái niệm phổ biến trong xã hội là tài sản mang đến sự thoải mái và sang trọng, vìvậy không ngạc nhiên khi đã có rất nhiều hoạt động được thực hiện trên nhiều cách để dựđoán thị trường tài chính, chứng khoán Do đó, dự đoán giá cổ phiếu hoặc thị trường tàichính trở thành thách thức lớn nhất đối với lĩnh vực trí tuệ nhân tạo Các chỉ số kỹ thuật,chỉ số cơ bản và chỉ số thống kê được đề xuất và được sử dụng với các kết quả khác nhau.Tuy nhiên, không kỹ thuật nào cũng được sử dụng thành công Mục tiêu của nghiên cứu
dự đoán phần lớn vượt quá khả năng của nghiên cứu trong lĩnh vực trí tuệ nhân tạo truyềnthống chủ yếu tập trung vào phát triển hệ thống thông minh nhằm mô phỏng trí thôngminh của con người Vì bản chất của thị trường chứng khoán là rất phức tạp (phi tuyếntính) và không ổn định Với sự phát triển của mạng neural, các nhà nghiên cứu và các nhàđầu tư hy vọng những “bí ẩn” của thị trường có thể được làm “sáng tỏ”
Mạng neural lấy cảm hứng từ hoạt động tế bào não của con người có thể học hỏicác mô hình dữ liệu, tổng hợp kiến thức của mình để nhận ra các mô hình mới trongtương lai
Các nhà nghiên cứu cho thấy Neural Nerworks có khả năng rất lớn trong các vấn
đề nhận dạng mẫu và máy học như phân lớp và hồi qui Ngày nay Neural Networks đượcxem như phương pháp khai phá dữ liệu phổ biến trong các lĩnh vực khác nhau như: kinh
tế, kinh doanh, công nghiệp và khoa học [6]
Các ứng dụng của Neural Networks cho các vấn đề dự đoán là rất hứa hẹn vìnhững đặc điểm đặc biệt của nó
Thứ nhất, các phương pháp truyền thống dựa trên các phương pháp như hồi qui
tuyến tính và hồi qui logistic trong khi Neural Networks là phương pháp dựa trên việc tựđiều chỉnh dựa vào dữ liệu huấn luyện, vì vậy nó có khả năng giải quyết các vấn đề vớimột chút tri thức về mô hình của nó và không ràng buộc mô hình dự đoán bằng cách thêmvào bất kỳ giả định rộng nào Bên cạnh đó, Neural Networks có thể tìm thấy mối quan hệgiữa đầu vào và đầu ra của hệ thống ngay cả khi mối quan hệ này có thể là rất phức tạpbởi vì nó có hàm xấp xỉ chung Do đó, Neural Networks được áp dụng tốt cho các khókhăn gặp phải khi trích các mối quan hệ giữa các dữ liệu, nhưng mặt khác nó yêu cầu một
Trang 16tập dữ liệu huấn luyện đủ lớn Chú ý, mặc dù đôi khi các qui tắc hoặc các mẫu mà chúng
ta tìm kiếm có thể không dễ để tìm thấy hoặc dữ liệu có thể bị hư do quá trình xử lý haytín hiệu nhiễu của dữ liệu trong hệ thống, nó vẫn được tin tưởng cho việc học qui nạphoặc phương pháp hướng dữ liệu là cách tốt nhất để đối phó với các vấn đề dự đoán trongthực tế
Thứ hai, Neural Networks có khả năng tổng quát hóa có nghĩa sau khi được huấn
luyện Neural Networks có thể nhận ra các mẫu mới ngay cả khi các mẫu này không cótrong tập huấn luyện Vì trong hầu hết các vấn đề nhận dạng mẫu dự đoán các sự kiệntương lai (dữ liệu không nhìn thấy) được dựa trên dữ liệu trước đó (tập huấn luyện), cácứng dụng của mạng neural sẽ rất có lợi
Thứ ba, mạng neural đã được xác định bằng hàm xấp xỉ chung Hàm này đã được
chứng minh là một mạng neural MLP (Multi Layer Perceptron) có thể xấp xỉ bất kỳ chứcnăng liên tục phức tạp nào mà cho phép chúng ta tìm hiểu bất kỳ mối quan hệ phức tạpgiữa đầu vào và đầu ra của hệ thống
Ý tưởng sử dụng mạng neural cho các vấn đề dự đoán lần đầu tiên được biễu diễnbởi Hu năm 1964 được sử dụng cho dự đoán thời tiết [8] Trường hợp không có bất kỳphương pháp học tập cho các mạng nhiều lớp làm cho nó không thể áp dụng các mạngnày để dự đoán các vấn đề phức tạp Nhưng trong những năm 1980, thuật toán lan truyềnngược đã được giới thiệu để huấn luyện một mạng neural MLP Werbos sử dụng kỹ thuậtnày để huấn luyện một mạng neural vào năm 1988 và tuyên bố mạng neural tốt hơn so vớiphương pháp hồi quy và mô hình Box-Jenkins trong vấn đề dự đoán [15]
Trong một thập kỷ gần đây rất nhiều nghiên cứu đã được thực hiện trên mạngneural để dự đoán những thay đổi thị trường chứng khoán Một trong những nỗ lực đầutiên là của Kimmoto và các đồng nghiệp của ông, trong đó họ sử dụng mạng neural để dựđoán các chỉ số của thị trường chứng khoán Tokyo [10] Mizuno và các đồng nghiệpcũng
sử dụng mạng neural để dự đoán giá các cổ phiếu trên thị trường chứng khoán Tokyo.Phương pháp của họ đã có thể dự đoán với độ chính xác 63% [12] Bằng cách kết hợpmạng neural và giải thuật di truyền, Phau và các đồng nghiệp dự đoán thị trường chứngkhoán Singapore với độ chính xác là 81% [12]
Trang 17Trong phần này, tôi xin giới thiệu một mô hình dự đoán dựa trên mạng neuralMLP để dự đoán những thay đổi trên thị trường chứng khoán Việt Nam Sử dụng mô hìnhnày, người ta có thể dự đoán giá trị cổ phiếu ngày hôm sau của một công ty chỉ dựa trênlịch sử giao dịch cổ phiếu của nó và không có bất kỳ thông tin của thị trường hiện tại.
4 Mạng neural
Ý tưởng về mạng neural lần đầu tiên được lấy cảm hứng từ hệ thần kinh của conngười trong đó bao gồm một số đơn vị xử lý đơn giản được gọi là tế bào thần kinh (hình1) Mỗi tế bào thần kinh nhận được một số tín hiệu từ bên ngoài hoặc từ tế bào thần kinhkhác và sau đó bằng cách xử lý chúng trong hàm kích hoạt (activation), đầu ra được gửiđến tế bào thần kinh khác Mỗi ảnh hưởng đầu vào là khác nhau từ các dữ liệu đầu vào
khác Ví dụ trong hình hai ảnh hưởng của tế bào thần kinh thứ i trên tế bào thần kinh thứ j được thể hiện bằng w ij , trọng số kết nối giữa các tế bào thần kinh i và j Do đó, trọng số
w ij lớn hơn sẽ được kết nối và ngược lại
Hình 1: Kiến trúc mô hình mạng neural MLP
Trang 18Hình 2: Kết nối của mạng neural Perceptron
Trong phần này, chúng ta tập trung vào nguồn dữ liệu chuyển tiếp cho mạng neuralnhiều lớp Các mạng này được tạo bằng các lớp tế bào thần kinh Lớp đầu tiên là lớp kếtnối với dữ liệu đầu vào Tiếp theo có thể có một hoặc nhiều lớp trung gian gọi là lớp ẩn.Lớp cuối cùng là lớp đầu ra cho kết quả Trong mạng thông tin phản hồi trái ngược vớimạng kết nối thường xuyên Hình 1 cho thấy ba lớp của mạng Perceptron
Một trong những phương pháp học trên Perceptron Neural Networks nhiều lớp làlỗi lan truyền ngược trong đó mạng học trên mẫu trong tập hợp dữ liệu và điều chỉnhtrọng số của các kết nối theo hướng đối nghịch với vector gradient của hàm lỗi (Errorfunction) theo cách thường dùng là tổng bình phương lỗi Phương pháp lan truyền ngượcchọn một vector huấn luyện từ tập dữ liệu huấn luyện và di chuyển nó từ lớp đầu vào sanglớp đầu ra Trong lớp đầu ra, lỗi được tính toán và được truyền ngược nên trọng số củacác kết nối sẽ được sửa chữa Điều này tiếp tục lặp cho đến khi lỗi đạt tới giá trị được xácđịnh trước Nó đã chứng minh chúng ta có thể xấp xỉ bất kỳ hàm liên tục với mạng gồm
ba lớp thông tin phản hồi với độ chính xác bất kỳ Có thể nói rằng tốc độ học tập sẽ giảmđáng kể theo sự gia tăng của số lượng các tế bào thần kinh và các lớp của mạng
5 Đề xuất mạng neural cho thị trường chứng khoán
Mặc dù tất cả các tính năng được đề cập cho các mạng neural, xây dựng một mạngneural để dự đoán bằng cách nào đó là rất phức tạp Để có một kết quả thực thi hài lòngngười ta phải xem xét một vài yếu tố quan trọng trong thiết kế của một mô hình dự đoán.Một trong những yếu tố chính là cấu trúc mạng bao gồm số lượng các lớp, số lượng tế bào
và các kết nối Các yếu tố khác được xem xét là các hàm kích hoạt trong mỗi neuron, giảithuật huấn luyện, chuẩn hóa dữ liệu, lựa chọn tập huấn luyện và tập kiểm tra cũng như độ
đo để đánh giá
Trang 19Trong mô hình hai mạng neural đề nghị gồm một Perceptron nhiều lớp forward và một hồi qui Elman được sử dụng Giải thuật lan truyền ngược được sử dụng
feed-để huấn luyện các mạng này
Dữ liệu đầu vào cho mạng neural là giá cao nhất, giá thấp nhất và giá trung bình
trong các ngày d trước đó Các thông tin khác có sẵn của thị trường chứng khoán không
được sử dụng vì mục tiêu là để dự đoán giá của các cổ phiếu chứng khoán chỉ dựa trênlịch sử giá cổ phiếu Nói cách khác, mô hình đề xuất có thể được xem như là mô hình dựđoán theo chuỗi thời gian
Mô hình này sử dụng một mạng neural gồm ba lớp trong đó lớp đầu vào có 3d neuron là giá cao nhất, giá thấp nhất và giá trung bình của giá đóng cửa trong d ngày Trong lớp ẩn có h neuron được kết nối đầy đủ đến lớp đầu vào và lớp đầu ra Có một
neuron trong lớp đầu ra dự đoán giá cổ phiếu dự kiến trong ngày tiếp theo của thị trườngchứng khoán
5.1 Chuẩn bị dữ liệu
Giá thấp nhất, giá cao nhất và giá trung bình của giá đóng cửa trong d ngày của cổ
phiếu được sử dụng để dự đoán giá cổ phiếu trong ngày tiếp theo Dữ liệu thị trườngchứng khoán được lấy từ trung tâm giao dịch chứng khoán Hồ Chí Minh (HOSE).Phương pháp này trái ngược với phương pháp khác, rối loạn của thị trường do nguyênnhân xã hội hay chính trị được bỏ qua trong bộ dữ liệu bởi vì chúng ta muốn dự đoán giádựa trên lịch sử giá Dữ liệu được sử dụng như đầu vào cho hệ thống là giá thấp nhất, giá
cao nhất và giá trung bình trong d ngày (d = {1, 2, , 10}) Hệ thống dự đoán giá của
ngày hôm sau bằng cách sử dụng dữ liệu ở trên
Trong ứng dụng mạng neural, dữ liệu đầu vào thường được chuẩn hóa trongkhoảng [0, 1] hoặc [-1, 1] theo một hàm kích hoạt của các neuron Vì vậy, trong báo cáonày giá của cổ phiếu trong thị trường chứng khoán được chuẩn hóa trong khoảng [-1, 1]bằng cách sử dụng công thức (3.1) Sau đó mạng neural được huấn luyện và kiểm tra bằnggiải thuật lan truyền ngược
price= 2 × price−(Max price+Min price)
Max price−Min price (3.1)
5.2 Tiêu chí đánh giá
Trang 20Trong các vấn đề dự đoán tiêu chuẩn đánh giá chung như độ lệch trung bình tuyệtđối, tỷ lệ phần trăm lỗi trung bình truyệt đối, bình phương lỗi trung bình tuyệt đối và bìnhphương lỗi trung bình gốc được tính dựa vào công thức (3.2, 3.3, 3.4, 3.5) Các tiêu chuẩnnày được ưa thích hơn vì nó chỉ ra lỗi dự đoán của hệ thống.
MAD= 1
|ValidationSet| ∑
for all days∈ValidationSet
❑
|price tomorrow forecast
−price real tommorow
|price forecast tomorrow−price real tommorow
price real tommorow |(3.3)
(price tomorrow forecast −price real tommorow)2(3.5)
Ngoài các tiêu chuẩn nêu trên, ba tiêu chuẩn khác được sử dụng để so sánh cácphương pháp dự đoán giá cổ phiếu Thước đo xu hướng dự đoán chính xác cho thấy tỷ lệ
phần trăm dự đoán đúng về những thay đổi trong ngày thứ n+1 so với ngày thứ n (3.6) Khi dự đoán là hoàn toàn ngẫu nhiên con số này khoảng 0,5 Như vậy, để có một phương pháp dự đoán đáng tin cậy chức năng này tối thiểu là 0,5 trở lên.
Mặc dù biết hướng các thay đổi là một yếu tố quan trọng đối với việc ra quyếtđịnh, chúng ta cũng cần phải biết số lượng các thay đổi Sẽ có hai tiêu chuẩn khác nhau đểxác định tỷ lệ dự đoán chính xác xu hướng so với xu hướng thực tế của những thay đổichứng khoán (3.7) và tỷ lệ của xu hướng dự đoán không chính xác so với xu hướng thực
tế của những thay đổi chứng khoán (3.8) Trong trường hợp lý tưởng, tỷ lệ dự đoán cho
dự đoán xu hướng chính xác sự thay đổi chứng khoán trong thực tế trong công thức (3.7)phải bằng 1 Ngoài ra, nếu chỉ số này là nhỏ hơn (hoặc lớn hơn) 1 sẽ cho thấy hướng cácthay đổi được dự đoán chính xác trong khi số lượng thay đổi được dự đoán ít hơn (hoặcnhiều hơn) Mặt khác, khi hướng thay đổi chứng khoán được dự đoán không chính xác, sốlượng (3.8) được mong đợi gần với 1 càng nhiều càng tốt điều đó cho thấy các lỗi dựđoán là tối thiểu trong trường hợp này
CorrectForecastTrend= 1
|ValidationSet| ∑
for alldays ∈ValidationSet
T ( price forecast tomorrow , price real today)(3.6)