MÔ HÌNH NEURAL NETWORK TRONG DỰ BÁO TÀI CHÍNH

mạng nơ ron nhân tạo

Trang 1

MỤC LỤC

Tóm tắt đề tài

Danh mục các hình

Chương 1: Mô hình Neural Network trong dự báo tài chính

1.1 Giới thiệu sơ lược về mô hình Neural Network 1

1.2 Nền tảng của mô hình Neural Network 1

1.3 Hoạt động của một Neural Network 2

1.4 Các mô hình mạng Neural Network 3

1.4.1 Các dạng mô hình Neuron 4

Mô hình cấu trúc một Neuron 4

Mô hình Neuron với vectơ nhập 4

1.4.2 Các dạng mô hình 5

Mô hình mạng một lớp Neuron 5

Mô hình mạng nhiều lớp Neuron 7

1.5 Mô hình Backpropagation Neural Network 7

1.5.1 Hoạt động của mạng Backpropagation 7

1.5.2 Các thông số phổ biến trong thiết kế một Backpropagation 8

1.5.3 Mục đích, công dụng của mô hình Neural Network 9

Chương 2: Các bước thiết kế một mô hình dự báo Neural Network 2.1 Sơ lược về việc thiết kế mô hình dự báo Neural Network 11

2.2 Quá trình lựa chọn các biến số 11

2.3 Quá trình thu thập dữ liệu 13

2.4 Quá trình xử lý và phân tích dữ liệu 13

2.5 Phân chia dữ liệu cho từng giai đoạn: huấn luyện, kiểm tra và công nhận 16

2.6 Xác định các thông số cho Neural Network 18

2.6.1 Tính toán số lượng các lớp ẩn 18

2.6.2 Tính toán số lượng các neuron ẩn 19

2.6.3 Tính toán số lượng các neuron đầu ra 21

2.6.4 Xác định loại hàm truyền 21

2.7 Xác định tiêu chuẩn đánh giá kết quả 22

2.8 Lựa chọn kiểu huấn luyện mô hình Neural Network 23

2.8.1 Xác định thông số lặp lại quá trình huấn luyện 23

2.8.2 Lựa chọn learning rate và momentum 26

Trang 2

2.9 Tiến hành thực hiện mô hình 27

Chương 3: Ứng dụng Neural Network vào thị trường tài chính Việt Nam 3.1 Dự báo kinh tế Việt Nam 2008 29

3.1.1 Lạm phát 30

3.1.2 Tỷ giá hối đoái 30

3.1.3 Kinh tế đoái ngoại 31

3.2 Lựa chọn phần mềm xử lý mô hình 31

3.3 Cách thức thu thập và xử lý dữ liệu thô 33

3.3.1 Các nhân tố ảnh hưởng thị trường chứng khoán Việt Nam 33

3.3.2 Cách thức thu thập và điều chỉnh dữ liệu đầu vào 34

3.3.3 Tổ chức file dữ liệu 36

3.3.4 Phân tích các biến đầu vào bằng Data Manager 36

3.4 Quá trình xử lý mô hình và phân tích kết quả 37

3.4.1 Cách thực hiện chạy chương trình Neuro Solutions 37

3.4.2 Kết quả nhận từ phần mềm Neuro Solutions 38

3.4.3 Kết quả dự báo VN-INDEX từ tháng 4/2008 đến tháng 5/2008 39

3.4.4 Phân tích kết quả 39

3.5 Chứng cứ ứng dụng mô hình Neural Network 40

3.5.1 Jason E.Kutsurelis ứng dụng mô hình Neural Network để dự báo S&P 500 40

3.5.2 Trường hợp 1: Đầu cơ giá lên từ tháng 1 năm 1994 41

3.5.3 Trường hợp 2: Sự sụp đổ vào tháng 10 năm 1986 44

3.5.4 Kết quả thử nghiệm cho cả hai trường hợp 47 Kết luận

Tài liệu tham khảo

Phụ lục

Trang 3

CHƯƠNG 1: MÔ HÌNH NEURAL NETWORK

TRONG DỰ BÁO TÀI CHÍNH 1.1 GIỚI THIỆU SƠ LƯỢC VỀ MÔ HÌNH NEURAL NETWORK

Neural Network trong một vài năm trở lại đây đã được nhiều người quan tâm và

đã áp dụng thành công trong nhiều lĩnh vực khác nhau, như tài chính, y tế, địa chất

và vật lý Thật vậy, bất cứ ở đâu có vấn đề về dự báo, phân loại và điều khiển, Neural Network đều có thể ứng dụng được Sự thành công nhanh chóng của mạng Neural Network có thể là do một số nhân tố chính sau:

 Năng lực : Neural Network là những kỹ thuật mô phỏng rất tinh vi, có khả năng mô phỏng các hàm cực kỳ phức tạp Đặc biệt, Neural Network hoạt động phi tuyến Trong nhiều năm, mô hình tuyến tính là kỹ thuật được sử dụng rộng rãi trong hầu hết các lĩnh vực, vì thế mô hình tuyến tính có tính chiến lược tối ưu hóa được biết nhiều nhất

 Dễ sử dụng : Neural Network có tính học theo các ví dụ Người sử dụng Neural Network thu thập các dữ liệu đặc trưng, và sau đó gọi các thuật toán huấn luyện để có thể tự học cấu trúc của dữ liệu Mặc dù người sử dụng làm tất cả những điều cần thiết để có thể chọn và chuẩn bị dữ liệu, sử dụng loại mạng phù hợp và có thể hiểu được các kết quả, nhưng mức độ người sử dụng biết cách áp dụng thành công Neural Network vẫn thấp hơn nhiều những người sử dụng các phương pháp thống kê truyền thống…

1.2 NỀN TẢNG CỦA MÔ HÌNH NEURAL NETWORK

Neural Network phát triển từ nghiên cứu về trí tuệ nhân tạo; đặc biệt cố gắng bắt chước bộ não có cấu trúc cấp thấp về khả năng học và chấp nhận sai của hệ thống neuron sinh học Bộ não con người gồm một số rất lớn neuron (khoảng

10.000.000.000 neuron) kết nối với nhau (trung bình mỗi neuron kết nối với hàng chục ngàn neuron khác) Mỗi neuron là một tế bào đặc biệt, có thể truyền các tín hiệu điện Neuron có cấu trúc rễ ngõ vào, thân tế bào và cấu trúc rễ ngõ ra (sợi

Trang 4

thần kinh) Các sợi thần kinh của một tế bào kết nối với các tế bào khác thông qua synapse Khi một neuron kích hoạt, nó tạo ra xung điện hóa học dọc theo sợi thần kinh Tín hiệu này đi qua các synapse đến các neuron khác, và tiếp tục bị kích hoạt Neuron hoạt động chỉ khi tất cả các tín hiệu nhận được ở thân tế bào thông qua rễ ngõ vào vượt quá một mức nào đó (ngưỡng hoạt động) Cường độ tín hiệu thu được của neuron phụ thuộc vào độ nhạy của synapse Chỉ có việc học làm thay đổi cường độ kết nối synapse

Do đó, từ một số rất lớn các đơn vị xử lý rất đơn giản này (mỗi đơn vị thực hiện tổng trọng số các ngõ vào sau đó kích hoạt một tín hiệu nhị phân nếu tổng ngõ vào vượt quá ngưỡng), bộ não điều khiển để hoạt động những công việc cực kì phức tạp Dĩ nhiên, sự phức tạp trong hoạt động của bộ não không thể trình bày hết, nhưng dù sao mạng trí tuệ nhân tạo có thể đạt được một vài kết quả đáng chú ý với

mô hình không phức tạp hơn bộ não

1.3 HOẠT ĐỘNG CỦA MỘT NEURAL NETWORK

Mỗi neuron nhận một số các ngõ vào (từ dữ liệu gốc, hay từ ngõ ra các neuron khác trong mạng) Mỗi kết nối đến ngõ vào có một cường độ (hay trọng số),

những trọng số này tương ứng với tác dụng synapse trong neuron sinh học Mỗi neuron cũng có một giá trị ngưỡng Tín hiệu được truyền qua hàm kích hoạt (hay còn gọi là hàm truyền) tạo giá trị ngõ ra neuron

Nếu sử dụng hàm truyền nấc (nghĩa là ngõ ra neuron là 0 nếu ngõ vào nhỏ hơn 0,

và là 1 nếu ngõ vào lớn hơn hay bằng 0) thì neuron hoạt động giống như neuron sinh học Thực tế, hàm nấc ít khi sử dụng trong mạng trí tuệ nhân tạo Lưu ý rằng trọng số có thể âm, nghĩa là synapse có tác dụng kiềm chế hơn là kích hoạt neuron, các neuron kiềm chế có thể tìm thấy trong bộ não

Trên đây là mô tả về các neuron đơn lẻ Trong thực tế các neuron được kết nối với nhau Khi mạng hoạt động, chúng phải có ngõ vào (mang giá trị hoặc biến của thế giới thực) và ngõ ra (dùng để dự báo hoặc điều khiển) Ngõ vào và ngõ ra tương ứng với các neuron giác quan và vận động, như tín hiệu đưa vào mắt và điều khiển

Trang 5

cánh tay Tuy nhiên chúng còn có các neuron ẩn đóng vai trò ẩn trong mạng Ngõ vào, neuron ẩn và ngõ ra cần được kết nối với nhau

Ta có mạng Neural Network tiến (feed-forward) cho như hình dưới Các neuron được sắp xếp theo cấu trúc liên kết lớp riêng biệt Lớp ngõ vào không phải là neuron thực: các neuron này hoạt động đơn giản là giới thiệu các giá trị của các biến vào Các neuron lớp ẩn và lớp ngõ ra được kết nối với tất cả các neuron lớp trước đó Cũng như vậy chúng ta có thể định nghĩa mạng có các kết nối một phần với một vài neuron trong lớp trước đó; tuy nhiên, trong hầu hết các ứng dụng mạng có kết nối đầy đủ vẫn tốt hơn

Hình 1.1 Cấu trúc Neural Network

Khi mạng hoạt động, các giá trị biến ngõ vào được đặt vào các neuron ngõ vào, và sau đó các neuron lớp ẩn và lớp ngõ ra lần lượt được kích hoạt Mỗi neuron tính giá trị kích hoạt của chúng bằng cách lấy tổng các trọng số ngõ ra của các neuron lớp trước đó, và trừ cho ngưỡng Giá trị kích hoạt truyền qua hàm kích hoạt tạo ra giá trị ngõ ra của neuron Khi toàn bộ mạng đã hoạt động, các ngõ ra của lớp ngõ

ra hoạt động như ngõ ra của toàn mạng

1.4 CÁC MÔ HÌNH MẠNG NEURAL NETWORK CƠ BẢN

Mô hình mạng Neural tổng quát có dạng theo hình 1.2

Hình 1.2 Mô hình mạng Neural tổng quát

Trang 6

Ngày nay, mạng Neural Network có thể giải quyết nhiều vấn đề phức tạp đối với con người, áp dụng trong nhiều lĩnh vực như nhận dạng, định dạng, phân loại, xử

lý tín hiệu, hình ảnh v.v…

1.4.1 Các dạng mô hình Neuron

Mô hình cấu trúc một Neuron

Ngõ vào một neuron có thể là đại lượng vô hướng hoặc có hướng, đại lượng này được nhân với trọng số tương ứng để đưa vào neuron, hoặc có thể cộng thêm ngưỡng (bias), thường bằng 1 Hình 1.3 là mô hình một neuron với ngõ vào vô hướng p không có ngưỡng b và có ngưỡng b Ngõ vào vô hướng p được nhân với

trọng số vô hướng w tạo thành wp, đối số wp qua hàm truyền f cho kết quả đầu ra

là vô hướng a = f(wp) Hình bên phải là neuron có ngưỡng b, giá trị b được cộng với wp rồi qua hàm truyền f cho kết quả đầu ra là vô hướng a = f(wp+b) Có thể

điều chỉnh những thông số của neuron như trọng số và ngưỡng (w và b) để đạt được yêu cầu mong muốn nghĩa là “huấn luyện” mạng

Hình 1.3 Mô hình cấu trúc một Neuron

Trang 7

Mô hình Neuron với vector nhập

Một neuron được cho trên hình 1.4 với vector nhập p = [p1, p2, ……pR ], trọng số

W = w1,1, w1,2,……w1,R, ngưỡng b và hàm truyền f Tổng đối số và ngưỡng tạo ở

ngõ ra n là:

n = w1,1p1 + w1,2,p2 + ……w1,R pR + b

hay n = W*p + b

Nếu có nhiều neuron thì cách biểu diễn trên không hiệu quả, do đó có thể định

nghĩa một lớp gồm nhiều neuron theo như hình 1.5

Trang 8

Hình 1.4 Mô hình Neuron với vector nhập

Hình 1.5 Một lớp gồm nhiều neuron

1.5.1 Các dạng mạng mô hình

Mô hình mạng một lớp Neuron

Trong hình dưới mô tả một lớp neuron với :

R : số phần tử của vectơ đầu vào

S : số neuron trong lớp

a : vector ngõ ra của lớp neuron

Trang 10

R R

w w

w

w w

w

w w

w

W

, 2

, 1

,

, 2 2

, 1 1

,

2

, 1 2

, 1 1

Trang 12

Mô hình mạng nhiều lớp Neuron

Hình 1.8: Mô hình mạng nhiều lớp Neuron

Mạng có nhiều lớp, mỗi lớp có một ma trận W, một ngưỡng b và một vectơ ngõ ra

a Thông thường giá trị ra của một lớp là giá trị vào của lớp tiếp theo Mỗi lớp

trong mạng đảm nhiệm vai trò khác nhau, lớp cho kết quả ở đầu ra của mạng được

gọi là lớp ngõ ra _ output layer, tất cả các lớp còn lại được gọi là lớp ẩn _ hidden

layers Mạng đa lớp có khả năng xử lý rất lớn Chẳng hạn như một mạng có hai

lớp, lớp thứ nhất là sigmoid, lớp thứ hai là linear có thể được huấn luyện đến một hàm gần đúng với một số kết nối cố định

1.5 MÔ HÌNH BACKPROPAGATION NETWORK

1.5.1 Hoạt động của mạng Backpropagation

Mô hình Neural Network bao gồm nhiều dạng mạng khác nhau như Perception,

Radial bias, hồi tiếp, Backpropagation v.v…

Backpropagation Neural Network bao gồm một tập hợp các thông số đầu vào

(inputs) và các đơn vị xử lý được biết đến như neurons, neurodes, hay nodes Các neuron trên mỗi layer thì có quan hệ kết nối hoàn toàn bởi sức mạnh kết nối được gọi trọng số, cái đi kèm với cấu trúc hệ thống, lưu trữ kíên thức của hệ thống đào

tạo Thêm vào các neuron xử lý, có một bias neuron được kết nối đến từng đơn vị

xử lý trong các lớp đầu ra và ẩn Bias neuron có một giá trị của một đại lượng

Trang 13

dương và cung cấp một mục đích tương tự như là hệ số chặn trong các mô hình hồi quy Các neuron và bias được sắp xếp trong các lớp, một lớp đầu vào, một hay nhiều các lớp ẩn và một lớp đầu ra Số lượng lớp ẩn và neuron nằm trong từng lớp

có thể thay đổi phụ thuộc vào kích thước và bản chất của từng bộ dữ liệu

Neural Network thì tương tự như mô hình hồi quy bình phương bé nhất tuyến tính

và phi tuyến và được xem như là cách tiếp cận thống kê thay thế để giải quyết vấn

đề bình phương bé nhất Cả Neural Network và phân tích hồi quy truyền thống đều

nỗ lực để tối thiểu hoá tổng bình phương các sai số Thuật ngữ bias tương tự như

hệ số chặn trong phương trình hồi quy Số lượng các neuron đầu vào thì bằng với

số lượng các biến độc lập trong khi các neural đầu ra thì thể hiện cho các biến phụ thuộc Mô hình hồi quy tuyến tính có thể được coi là Neural Network feed-

forward nhưng không có các lớp ẩn và một neural đầu ra với chức năng chuyển đổi tuyến tính Các trọng số kết nối các neural đầu vào đến từng neural đầu ra thì tương tự như hệ số trong hồi quy bình phương bé nhất tuyến tính Mô hình Neural Network với một lớp ẩn giống với mô hình hồi quy phi tuyến

Backpropagation network là một loại Neural Network feed-forward với các quy tắc giám sát Feed-forwad đề cập đến hướng đi của dòng thông tin từ các lớp đầu vào đến lớp đầu ra Các thông số đầu vào đi qua Neural Network một lần đến thẳng đầu ra Học có giám sát là một sự xử lý của việc so sánh mỗi dự báo của hệ thống với câu trả lời chính xác đã biết và sự điều chỉnh trọng số dựa trên kết quả sai số dự báo đến tối thiểu hoá chức năng sai số

Backpropagation network là hệ thống đa lớp phổ biến nhất được ước tính là được

sử dụng trong 80% ứng dụng và là tâm điểm của báo chí từ khi nó được sử dụng rộng rãi trong dự báo chuỗi thời gian của tài chính Hornik et al chỉ ra rằng hệ thống Backpropagation chuẩn sử dụng hàm tùy ý có thể xấp xỉ với bất kỳ hàm có thể đo lường trong các hành động chính xác và tốt đẹp, nếu có đủ số lượng của các neuron ẩn được sử dụng Hecht-Nielsen cũng biểu diễn nó thành hệ thống

Backpropagation có 3 lớp có thể xấp xỉ bất kỳ việc phác họa bản đồ tiếp diễn nhau Các Neural Network khác thì ít phổ biến hơn trong dự báo chuỗi thời gian

Trang 14

bao gồm hệ thống định kỳ (recurrent networks), hệ thống xác suất (probablistic networks) và fuzzy Neural Network

1.5.2 Các thông số phổ biến trong thiết kế một Backpropagation

Xử lý dữ liệu (Data processing)

Đơn vị thời gian: theo ngày, tuần, tháng, năm, quý

Loại dữ liệu: kỹ thuật, cơ bản

Phương pháp lấy mẫu dữ liệu

Phương pháp chia thang dữ liệu: lớn nhất, nhỏ nhất, trung vị, sai số chuẩn

Huấn luyện (Training)

Chỉ số học Learning rate mỗi layer

Thuật ngữ Momentum

Dung sai huấn luyện

Kích cỡ Epoch

Giới hạn Learning rate

Số lượng tối đa của các lần hoạt động

Số lần để lấy ngẫu nhiên các trọng số

Kích thước của các dữ liệu dùng để huấn luyện, kiểm tra, và đánh giá

Topology

Số lượng của neurons đầu vào

Số lượng của layers ẩn

Số lượng của neuron ẩn trong mỗi layer

Số lượng của neurons đầu ra

Hàm truyền cho mỗi neuron

Hàm sai số

1.5.3 Mục đích, công dụng của mô hình Neural Network

Mục đích của mô hình ngoài việc so sánh dữ liệu quá khứ với dữ liệu ước lượng trong quá khứ của mô hình để từ đó thấy được xu hướng trong tương lai của mô hình như thế nào Sau khi ước lượng từ những dữ liệu trong quá khứ mô hình sẽ

Trang 15

cho ra kết quả tương lai dự kiến Mô hình này hoàn toàn hữu ích đối với nhà đầu

tư tổ chức cũng như nhà đầu tư cá nhân

Đối với nhà đầu tư cá nhân, hiện nay trên thế giới, đều ưu thích loại hình option chỉ số Hình thức option chứng khoán không còn gì mới lạ Đó vừa là công cụ để phòng ngừa rủi ro cho nhà đầu tư chứng khoán,vừa là công cụ đầu tư trên thị trường và hầu hết các nhà đầu tư đều thích mua/ bán option chỉ số Việt Nam đang trong lộ trình cho việc sử dụng các công cụ phái sinh và option cũng không phải là ngoại lệ Và khi option ra đời, tất yếu sẽ có option chỉ số chứng khoán Chính do nhu cầu đó mà mô hình cung cấp cho các nhà đầu tư công cụ đắc lực để dự đoán chỉ số mà cụ thể trong đề tài này là VN-INDEX để có thể thực hiện call hay put option Đây là xu hướng tất yếu trong tương lai

Đối với nhà đầu tư tổ chức, nhất là các tập đoàn đa quốc gia, việc đầu tư vào một nền kinh tế hay một ngành nào đó cần phải xem xét tổng quát chung và quyết định thận trọng bởi lẽ họ đầu tư dài hạn nhiều hơn là ngắn hạn Khi một công ty đa quốc gia lựa chọn thị trường chứng khoán để đầu tư thì họ sẽ xem xét và dự báo các chỉ số đặc trưng của nền kinh tế đó quyết định tỷ trọng đầu tư trong danh mục các nước của mình như thế nào Ngoài ra, cũng như các nhà đầu tư tổ chức ở trong nước, các tập đoàn này sẽ tập trung hơn nữa vào các ngành tiềm năng thông qua các chỉ số đại diện ngành Thêm vào mô hình Neural Network theo ngành và điều chỉnh lại mô hình bẳng các yếu tố ảnh hưởng đến hoạt động ngành sẽ giúp các nhà đầu tư này dự báo được hướng phát triển trong tương lai các ngành trong một nền kinh tế

KẾT LUẬN

Có thể thấy trong một vài năm trở lại đây mô hình Neural Network được ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau, như tài chính, y tế, địa chất và vật lý, do đặc điểm là dễ sử dụng và năng lực xử lý cực kỳ tinh vi với khả năng mô phỏng các hàm cực kỳ phức tạp của mô hình này Cấu trúc và quy trình hoạt động của mô hình này được nghiên cứu, xây dựng và phát triển dựa trên ý tưởng về bộ não của

Trang 16

con người với khả năng học và chấp nhận sai trong hệ thống neuron sinh học Hiện nay, có rất nhiều dạng mô hình Neural Network khác nhau với từng kiểu cấu trúc mạng đa dạng Trong đó, phải kể đến mô hình Backpropagation là một mô hình với hệ thống đa lớp có nhiều tính năng ưu việt hơn cả, được sử dụng phổ biến

và là tâm điểm của báo chí từ khi mô hình này được sử dụng rộng rãi trong dự báo chuỗi thời gian trong tài chính Các thông số phổ biến trong thiết kế mô hình Backpropagation bao gồm xử lý dữ liệu, huấn luyện, topology Điểm đặc biệt của

mô hình này là khả năng xử lý hàm phi tuyến mạnh Ngoài ra, mô hình này còn có khả năng xử lý và so sánh các kết quả dự báo từ đó đưa ra kết quả chính xác dựa trên tiêu chuẩn tối thiểu hóa sai số

Trang 17

CHƯƠNG 2: CÁC BƯỚC THIẾT KẾ MỘT MÔ HÌNH DỰ

BÁO NEURAL NETWORK2.1 SƠ LƯỢC VỀ VIỆC THIẾT KẾ MÔ HÌNH DỰ BÁO NEURAL

NETWORK

Một phương pháp của việc thiết kế mô hình dự báo Neural Network là việc phân chia các bước Phương pháp này bao gồm 8 bước được trình bày trong bảng sau được phác thảo bởi Deboeck, Masters, Blum và Nelson và IIlingworth Quá trình thủ tục thường không phải là một bước mà đòi hỏi phải trải qua các bước trước và đặc biệt là giữa việc lựa chọn các biến số

Bước 1 Quá trình lựa chọn các biến số

Bước 2 Quá trình thu thập dữ liệu

Bước 3 Xử lý và phân tích dữ liệu

Bước 4 Phân chia dữ liệu cho từng giai đoạn: Huấn luyện, kiểm tra, và công

Bước 6 Xác định các tiêu chuẩn đánh giá kết quả

Bước 7

Lựa chọn kiểu huấn luyện Neural Network Xác định thông số lặp lại quá trình huấn luyện Lưa chọn learning rate và momentum

Bước 8 Tiến hành thực hiện mô hình

2.2 QUÁ TRÌNH LỰA CHỌN CÁC BIẾN SỐ

Trang 18

Thành công trong việc thiết kế Neural Network phụ thuộc vào sự hiểu biết rõ ràng vấn đề cần thực hiện Sự hiểu biết những biến số nào là đầu vào rất quan trọng trong thị trường đang được dự báo và cũng là vấn đề then chốt Và điều này không

hề đơn giản Việc sử dụng Neural Network ngày càng nhiều là do khả năng mạnh

mẽ của nó phát hiện các mối quan hệ phi tuyến phức tạp trong số các biến số khác nhau Tuy nhiên, các lý thuyết kinh tế có thể giúp chọn lựa các biến số nào là những dự báo quan trọng Tại thời điểm này trong quá trình thiết kế, vấn đề liên quan là các dữ liệu thô từ hàng loạt các chỉ số đa dạng được phát triển Những chỉ

số này sẽ hình thành các đầu vào thực sự cho Neural Network

Các nhà nghiên cứu tài chính rất quan tâm đến việc dự báo giá thị trường phải quyết định nên sử dụng cả yều tố đầu vào kinh tế cơ bản hay kỹ thuật từ một hay nhiều thị trường Các yếu tố đầu vào kỹ thuật thì được định nghĩa như các giá trị trễ của biến phụ thuộc hay các chỉ số được tính toán từ các giá trị trễ Các đầu vào

cơ bản là các biến kinh tế được cho là có ảnh hưởng đến các biến phụ thuộc Mô hình Neural Network đơn giản nhất sử dụng những giá trị trễ của các biến phụ thuộc hay những khác biệt với đầu ra Những mô hình như vậy thì làm tốt hơn mô hình truyền thống Box-Jenkins trong dự báo giá cả, mặc dù không phải tất cả đều nghiên cứu Một lối tiếp cận phổ biến hơn là tính toán các chỉ số kỹ thuật khác nhau và dựa trên giá cả trong quá khứ (và các khối lượng ngẫu nhiên và các lãi suất mở) của thị trường đang được dự báo Khi một cải tiến được thêm vào, dữ liệu liên thị trường có thể được sử dụng bởi vì mối liên hệ gần gũi giữa các loại thị trường, cả nội địa và quốc tế, đề nghị sử dụng các đầu vào kỹ thuật từ một số các thị trường liên quan nên cải thiện thành quả dự báo Ví dụ, ta có dữ liệu liên thị trường như Deutsche mark/yen và pound tỷ giá chéo và sự chênh lệch lãi suất có thể sử dụng như đầu vào của Neural Network khi dụ báo D-mark Các thông tin cơ bản như tài khoản vãng lai, cung tiền, hay chỉ số giá bán sỉ có thể rất hữu ích Chu kỳ của dữ liệu phụ thuộc vào mục tiêu của nhà nghiên cứu Một nhà kinh doanh không sàn trong thị trường cổ phiếu hay hàng hóa giao sau chắc chắn sẽ sử dụng dữ liệu theo ngày nếu thiết kế Neural Network như là một bộ phận của toàn

Trang 19

bộ hệ thống giao dịch Một nhà đầu tư với một tầm nhìn dài hạn có thể sử dụng dữ liệu theo tuần hay tháng như là đầu vào của Neural Network để hình thành tài sản hỗn hợp tốt nhất hơn là sử dụng một chiến lược mua hay giữ tiêu cực Một dự báo kinh tế về GDP, tỷ lệ thất nghiệp, hay các chỉ số kinh tế vĩ mô có thể sử dụng dữ liệu theo tháng hay theo quý

Trang 20

2.3 QUÁ TRÌNH THU THẬP DỮ LIỆU

Nhà nghiên cứu cần cân nhắc chi phí và tính có sẵn khi thu thập dữ liệu cho các biến số được chọn trong bước một Dữ liệu kỹ thuật thì có sẵn từ các nhà cung cấp với chi phí hợp lý, ngược lại các thông tin cơ bản thì khó có được hơn Thời gian dành cho việc thu thập khó có thể được sử dụng cho xử lý, đào tạo, và đánh giá việc thực hiện của hệ thống Nhà cung cấp nên có uy tín trong việc cung cấp dữ liệu có chất lượng cao, tuy nhiên tất cả dữ liệu nên được kiểm tra các lỗi sai bằng việc kiểm tra các thay đổi hàng ngày, phạm vi và tính ổn định hợp lý (tức là cao hơn nhiều hay gần bằng với giá đóng cửa, giá mở cửa cao hơn hay gần bằng với giá thấp nhất) và các quan sát bị thiếu

Các quan sát bị thiếu thường xuất hiện, có thể giải quyết bằng nhiều cách Tất cả các quan sát bị thiếu có thể được cắt bỏ hay một sự lựa chọn thứ hai là giả định các quan sát bị bỏ sót tiếp tục giống như nội suy hay lấy trung bình từ các giá trị gần đó Dành cho neuron đầu vào quan sát bị bỏ sót bằng việc mã hóa nó như là một nếu thiếu hay zero thường được làm

Khi sử dụng dữ liệu cơ bản như là đầu vào của Neural Network cần biết 4 vấn đề: Đầu tiên, phương pháp tính toán các chỉ số cơ bản nên được giữ cố định trong suốt các khoảng thời gian Thứ hai, dữ liệu không nên lặp lại từ khi có hiệu lực trong quá khứ sau khi nó được xuất bản lần đầu tiên vì nó được làm phổ biến trong các

cơ sở dữ liệu từ các con số lặp lại thì không có sẵn trong dự báo thực sự Thứ ba,

dữ liệu cần có một độ trễ thích hợp như đầu vào của Neural Network vì các dữ liệu

cơ bản thì không có sẵn và nhanh như các công bố của thị trường Thứ tư, nhà nghiên cứu nên tự tin rằng các nguồn thông tin sẽ tiếp tục được xuất bản các thông tin cơ bản cụ thể hay các nguồn tương tự là có sẵn

2.4 QUÁ TRÌNH XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

Xử lý dữ liệu đề cập đến việc phân tích và chuyển đổi các biến đầu vào và đầu ra

để tối thiểu hóa độ nhiễu, nhấn mạnh các mối quan hệ quan trọng, phát hiện xu

Trang 21

hướng, và san bằng sự phân phối của các biến số để phục vụ cho Neural Network trong việc học tập các mẫu hình liên quan Từ khi Neural Network là các sự kết hợp các mẫu hình, việc thể hiện của các dữ liệu trở nên quan trọng trong việc thiết

kế một hệ thống thành công Các biến đầu vào và đầu ra cho những cái mà dữ liệu

đã được thu thập thì hiếm khi cung cấp vào hệ thống dưới dạng thô Ít nhất, các dữ liệu thô cần được phân chia thành các ranh giới trên và dưới của hàm chuyển đổi (thường là [0 – 1] hay [-1 – 1])

Hai trong số việc chuyển đổi dữ liệu phổ biến nhất trong cả truyền thống và dự báo Neural Network là đầu tiên làm cho khác nhau và lấy log tự nhiên của một biến số Đầu tiên làm khác nhau đầu tiên, hay sử dụng sự khác nhau giữa các biến

số, có thể được sử dụng để loại bỏ xu hướng tuyến tính từ dữ liệu Việc chuyển đổi

có liên quan đến logarit thì hữu ích đối với dữ liệu mà có thể nhận cả giá trị lớn và

bé hay có đặc tính bằng việc mở rộng sang bên tay phải đuôi phân phối Biểu đồ trong hình 2.1 minh họa cô đọng hiệu ứng của việc chuyển đổi liên quan đến logarit trong khối lượng giao dịch tương lai hàng tháng của lúa mì Các việc

chuyển đổi có liên quan đến logarit cũng bao gồm nhiều lần hay các quan hệ tỷ số

để thêm vào cái mà được cho rằng làm đơn giản hóa hay cải thiện việc đào tạo của

Trang 22

Sau khi chuyển đổi Log tự nhiên

Một việc chuyển đổi dữ liệu phổ biến khác là sử dụng các tỷ số của các biến đầu vào Các tỷ số nhấn mạnh các mối quan hệ quan trọng (Ví dụ: lợn và bắp, các tỷ số của báo cáo tài chính) trong khi tại cùng thời điểm các mức độ bảo tồn khác nhau của sự tự do bởi vì các neuron đầu vào ít hơn thì đòi hỏi phải mã hoá các biến độc lập

Bên cạnh, làm cho khác nhau, lấy log, và các tỷ số, các nhà phân tích kỹ thuật có thể cung cấp một Neural Network với vô số các chỉ số bao gồm các trung bình di động, oscillators, đường phương hướng, và lọc các dao động Thật là một ý kiến hay nếu sử dụng kết hợp các chỉ số để làm giảm việc dư thừa của các biến số và cung cấp cho hệ thống khả năng thích ứng các điều kiện thay đổi của thị trường San bằng cả dữ liệu đầu vào và đầu ra bằng việc sử dụng cả trung bình di động đơn và mũ thì thường được sử dụng Kinh nghiệm làm việc trong việc huấn luyện

lý thuyết thị trường hiệu quả cho thấy rằng giá cả biểu diễn sự phụ thuộc thời gian hay tự tương quan dương trong khi sự thay đổi giá cả xung quanh một xu hướng hay một sự ngẫu nhiên Vì vậy nỗ lực để dự báo sự thay đổi giá cả như là đầu vào

có thể chứng minh là nó khó khăn Sử dụng trung bình di động để san bằng các biến độc lập và dự báo xu hướng có thể là một lối tiếp cận hứa hẹn hơn

Lấy mẫu và lọc dữ liệu đề cập đến việc di chuyển các quan sát từ việc huấn luyện

và đào tạo để tạo ra phân phối đồng nhất hơn Loại bộ lọc được sử dụng cần thích hợp với các mục tiêu của nhà nghiên cứu Ví dụ, một biểu đồ về sự thay đổi giá cả

Trang 23

của hàng hóa sẽ biểu lộ nhiều sự thay đổi nhỏ từ đó mà nhà đầu cơ không sàn không thể kiếm lợi nhuận sau khi cắt giảm các chi phí thủ tục thực tế Tuy nhiên, khu vực đông đúc của phân phối này sẽ tác động mạnh mẽ đến việc đào tạo Neural Network từ khi những thay đổi nhỏ về giá tính cho phần lớn những đào tạo thực

tế Hệ thống làm tối thiểu hóa tổng bình phương của các sai số (hay hàm sai số - error function) trong suốt việc đào tạo thực tế Bằng cách loại bỏ những thay đổi nhỏ về giá này, toàn bộ quá trình thực hiện có thể được cải thiện từ khi hệ thống

cụ thể hóa lớn hơn, những thay đổi về giá mang lại lợi nhuận tiềm năng Điều đó

là có thể cho các hệ thống giao dịch trở nên phi lợi nhuận thậm chí nếu Neural Network dự báo 85% của các điểm xoay chiều, vì các điểm xoay chiều có thể chỉ

là những thay đổi nhỏ về giá cả không quan trọng Mặt khác, các nhà giao dịch trên sàn nắm giữ vị thế qua đêm thì chắc chắn là thích thú với những thay đổi nhỏ

về giá Nhà nghiên cứu ắt hẳn là biết rõ là Neural Network nên được nghiên cứu như thế nào Một thuận lợi khác của lọc là làm giảm đi số lượng của huấn luyện thực tế cái mà cho phép kiểm tra nhiều hơn các biến đầu vào, lấy bắt đầu ngẫu nhiên trọng số, hay làm ẩn đi các neuron hơn là huấn luyện những nguồn dữ liệu lớn

Thực tế, quá trình tiền xử lý dữ liệu liên quan đến việc thử và sai Một phương pháp để lựa chọn các biến đầu vào thích hợp là kiểm tra nhiều sự kết hợp khác nhau Ví dụ, “top 20” danh sách các biến số bao gồm các chỉ số kỹ thuật khác nhau có thể kiểm tra trước mười biến tại một thời điểm với mỗi kết hợp khác nhau bởi hai hay ba biến số Mặc dù tăng cường sự tính toán, quá trình này nhận diện chắc chắn là vài biến số có thể là các dự báo xuất sắc chỉ khi được kết hợp với các biến số khác Lý thuyết chaos (hỗn độn) và các huấn luyện thống kê không thể tạo

ra một quyết định như vậy Cũng như vậy, danh sách top 20 có thể được huấn luyện theo thời gian khi nhà nghiên cứu có được kinh nghiệm dựa trên loại tiền xử

lý thích hợp cho ứng dụng của họ Lối tiếp cận này đặc biệt hữu dụng nếu quá trình huấn luyện có mối liên hệ nhỏ với số lượng của các thông số hay trọng số cái

Trang 24

mà chắc chắn là một trường hợp nếu tất cả 20 biến số đầu vào thể hiện cho Neural Network một lần

2.5 PHÂN CHIA DỮ LIỆU CHO TỪNG GIAI ĐOẠN: HUẤN

LUYỆN, KIỂM TRA, CÔNG NHẬN

Thủ tục thông thường là phân chia chuỗi thời gian thành ba phần tách biệt nhau là quá trình huấn luyện, kiểm tra và công nhận Quá trình huấn luyện là phần lớn nhất và được dùng bởi mô hình Neural Network để biết về kiểu mẫu hiện tại của

dữ liệu Quá trình kiểm tra dữ liệu, dọc theo cỡ mẫu từ 10% đến 30% của nhóm huấn luyện, thường được dùng đế ước lượng khả năng tính khái quát mà bước huấn luyện hỗ trợ Nhà nghiên cứu sẽ chọn những hệ thống mà thể hiện tốt nhất trong quá trình kiểm tra này Một bước kiểm tra cuối cùng về đặc tính của hệ thống điều chỉnh được tạo ra từ quá trình công nhận Kích cỡ của quá trình công nhận này được chọn phải đánh vào sự cân đối giữa việc tuân theo một số lượng mẫu đủ lớn để đánh giá hệ thống điều chỉnh và có đủ quan sát còn lại cho cả quá trình huấn luyện và kiểm tra Quá trình công nhận nên bao gồm hầu hết những quan sát gần nhau Cần nên lưu ý là không dùng quá trình công nhận như là một quá trình kiểm tra bằng cách lặp lại những thực hiện trong chuỗi các bước huấn luyện – kiểm tra – công nhận và huấn luyện các biến đầu vào dựa trên đặc tính của

hệ thống ở quá trình công nhận

Quá trình kiểm tra có thể hoặc chọn lựa một cách ngẫu nhiên từ quá trình huấn luyện hoặc chứa toàn bộ các quan sát theo sau ngay lập tức từ quá trình huấn luyện Thuận lợi từ việc lựa chọn sự kiện kiểm tra một cách ngẫu nhiên là nguy hiểm của việc sử dụng quá trình kiểm tra được mô tả đặc điểm bởi một loại của thị trường phần lớn có thể tránh khỏi Ví dụ, một quá trình kiểm tra nhỏ có thể chỉ bao gồm những giá trong điều kiện giá lên mạnh Quá trình kiểm tra sẽ thiên về những

hệ thống mà chuyên về xu hướng giá lên mạnh tại những khoản chi của các hệ thống được phổ biến mô tả tốt cả về hai xu hướng giá lên và giá xuống Đặc điểm của việc sử dụng các mẫu theo sau ngay quá trình huấn luyện khi kiểm tra thực tế

Trang 25

là đó là những quan sát gần nhất (không bao gồm quá trình công nhận) sẽ quan trọng hơn là những dữ liệu cũ hơn

Tính ngẫu nhiên được chọn trong kiểm tra các sự kiện không nên được thay thế trong quá trình huấn luyện vì điều này có thể ảnh hưởng đến khả năng để đánh giá một cách tổng quát đặc biệt là nếu quá trình kiểm tra có mối quan hệ lớn với quá trình huấn luyện (hơn 30%) Một phương pháp quyết định, như việc chọn mỗi quan sát trong kiểm tra thực tế, cũng không được yêu cầu từ khi nó có thể đưa kết quả trong các chu kỳ trong các dữ liệu mẫu hoàn toàn theo duy nhất kỹ thuật chọn mẫu đã dùng

Một lối tiếp cận chính xác hơn trong đánh giá Neural Network là sử dụng phép thử thông thường walk-forward cũng được biết là phép thử trượt hay di chuyển các khoảng hở Thông thường trong việc đánh giá tính đầy đủ của các hệ thống điều chỉnh, phép thử walk – forward bao gồm phân chia dữ liệu thành một chuỗi các quá trình huấn luyện – kiểm tra – công nhận chồng lên nhau Mỗi quá trình được

di chuyển phía trước thông qua chuỗi thời gian được trình bày trong hình 2.2 Phép thử Walk – forward cố gắng dựa theo huấn luyện hiện thực và kiểm tra tính trung thực, thiết thực của mô hình thông qua huấn luyện thông thường của nó trong một nhóm dữ liệu ngoài mẫu Trong phép thử Walk – forward, kích cỡ của quá trình công nhận khiến cho việc huấn luyện lại của mô hình Neural Network phải thường xuyên Huấn luyện lại thường xuyên mất nhiều thời gian, nhưng cho phép Network thích nghi nhanh hơn với những điều kiện thay đổi của thị trường Tính nhất quán hay tính thay đổi của kết quả trong nhóm dữ liệu ngoài mẫu là một thước đo quan trọng Ví dụ, trong trường hợp hệ thống điều chỉnh thông thường, Neural Network với kết quả dự báo tồi tệ trong sự giảm sút vốn nặng nề trong bất

cứ giai đoạn ngoài mẫu sẽ không được bổ sung để tránh rủi ro của sự phá sản

Hình 2.2 Phép thử Wark-forward trong chuỗi thời gian

Trang 26

Cần nên nhớ rằng các quá trình huấn luyện và kiểm tra phải có cùng tỷ lệ với nhau khi mục đích của quá trình kiểm tra là để quyết định khả năng bao quát của

Network Tuy nhiên, quá trình công nhận cũng nên có cùng tỷ lệ với hoặc quá trình huấn luyện hoặc quá trình kiểm tra khi điều này có khuynh hướng về tính toàn vẹn của quá trình công nhận như là kiểm duyệt cuối cùng và độc lập trong Neural Network Trong điều kiện sử dụng thực tế, các nhà nghiên cứu không có cách nào biết chính xác hàng loạt giá trị tương lai, nhưng chỉ có đánh giá hợp lý dựa trên một loạt các quá trình huấn luyện và hoặc kiểm tra

2.6 XÁC ĐỊNH CÁC THÔNG SỐ CHO NEURAL NETWORK

Có vô số cách để tạo nên Neural Network Neurodynamic và architecture là hai cách dùng để miêu tả cách thức tổ chức mô hình Neural Network Sự kết hợp giữa Neurodynamics và architecture xác định rõ mẫu của Neural Network

Neurodynamic miêu tả các đặc điểm của một Neuron riêng lẻ như chức năng truyền tải của nó và những biến đầu vào được kết nối như thế nào Một Neural Network architecture xác định cấu trúc của nó bao gồm số lượng neuron trong mỗi lớp và số lượng cũng như loại và mối liên hệ của chúng với nhau

Số lượng neuron đầu vào là một trong những mẫu dễ nhất có thể thu thập được khi các biến độc lập đã được huấn luyện sơ lược vì mỗi biến độc lập được trình bày bởi neuron đầu vào của chính nó

2.6.1 Tính toán số lượng các lớp ẩn

Trang 27

Các lớp ẩn cung cấp cho Network với khả năng của nó để phổ biến nó.Về mặt lý thuyết, một Neural Network với một lớp ẩn với số lượng đủ các neuron ẩn có thể duy trì bất kỳ chức năng nào Về thực tiễn, hệ thống Neural Network với một hay thỉnh thoảng là 2 lớp ẩn thường được dùng phổ biến và cũng cho thấy chức năng tốt Gia tăng các lớp ẩn cũng đồng nghĩa với việc gia tăng thời gian tính toán, và nguy hiểm của “học quá mức” làm cho việc dự báo ngoải mẫu tệ đi “Học quá mức” xảy ra khi mà một mô hình dự báo có quá nhiều cấp dễ dãi Nói các khác, nó

có tương đối nhiều quan sát có quan hệ với mẫu của nó Trong trường hợp hệ thống Neural Network, mức độ ảnh hưởng, không làm thay đổi số lượng lớp ẩn và neuron và kích cở của bước huấn luyện ( số lượng quan sát) quyết định của việc có thể xảy ra của “học quá mức” Mức độ ảnh hưởng càng lớn có liên quan đến kích

cỡ của bước huấn luyện, khả năng của Network để nhớ đặc tính của một quan sát riêng lẻ càng lớn Kết quả là việc khái quát cho bước công nhận bị mất đi và mô hình trở nên ít được sử dụng trong dự báo thực tế

Vì thế, cần nên nhớ là mọi hệ thống Neural Network nên bắt đầu tốt nhất là với một hay hầu hết là 2 lớp ẩn Nếu một Neural Network có 4 lớp ( ví dụ có 2 lớp ẩn ) chứng tỏ sự không thỏa mãn sau khi được kiểm tra nhiều lần với các neuron ẩn sử dụng một số lượng hợp lý các trọng số được thu thập ngẫu nhiên, sau đó các nhà nghiên cứu nên chú ý các biến đầu vào một thời gian trước khi thêm vào lớp ẩn thứ ba Cả lý thuyết và các công việc kinh nghiệm thực tế đều khuyên rằng Neural Network với nhiều hơn bốn lớp ẩn sẽ không cải tiến được kết quả

2.6.2 Tính toán số lượng các neuron ẩn

Mặc dù rất quan trọng, nhưng không có công thức thần kỳ nào trong việc lựa chọn

số lượng các neuron ẩn tốt nhất Vì thế, các nhà nghiên cứu đều sa vào các thí nghiệm Tuy nhiên, một vài quy luật ngón tay cái phát huy lợi thế.Việc số xấp xỉ gần đúng có thể tuân theo quy luật kim tự tháp được nghiên cứu bởi Masters Với một Network gồm 3 lớp với n neuron đầu vào và m neuron đầu ra thì sẽ có

SQRT(n x m) neuron Con số thực sự của neuron ẩn có thể dao động từ ½ đến 2 lần giá trị có được từ quy luật kim tự tháp phụ thuộc vào tính phức tạp của vấn đề

Trang 28

Baily và Thompson đề nghị số lượng các neuron ẩn trong Neural Network ba lớp nên bằng 75% số lượng neuron đầu vào Katz chỉ ra rằng số lượng neuron ẩn tốt nhất sẽ được tìm thấy trong khoảng từ ½ đến 3 lần số neuron đầu vào Ersoy đề nghị nên gấp đôi số lượng các neuron ẩn cho đến khi mô hình Network thể hiện tốt trong giai đoạn kiểm tra Klimasauskas đề nghị nên có ít nhất 5 lần giai đoạn huấn luyện, để tạo giới hạn trên cho số lượng các neuron đầu vào và neuron ẩn

Điều quan trọng là cần phải chú ý đến quy luật tính toán số lượng các neuron ẩn là bội số của số lượng các neuron đầu vào cũng đã coi như ám chỉ rằng bước huấn luyện cũng cần ít nhất hai lần số lượng trọng số và có thể lớn hơn gấp bốn lần hoặc hơn thế nữa Nếu không trong trường hợp này, những quy luật này sau này sẽ nhanh chóng dẫn các mô hình “khít quá mức” kể từ khi số lượng các neuron ẩn phụ thuộc hoàn toàn vào số lượng các neuron đầu vào (nó sẽ lần lượt quyết định số lượng các trọng số) Cách giải quyết này hoặc gia tăng kích cỡ của bước huấn luyện, hoặc nếu nó không thể, để xác lập mức giới hạn trên của các neuron đầu vào để số lượng các trọng số ít nhất cũng được phân nửa số lượng thực tế đã huấn luyện Việc lựa chọn các biến đầu vào trở nên cực kỳ quan trọng trong một Neural Network nhỏ từ khi sự thoải mái trong việc lựa chọn số lượng biến đầu vào quá nhiều và cho nó phớt lờ đi những cái không phù hợp đang dần biến mất ngày càng nhiều

Lựa chọn số lượng các neuron ẩn “tốt nhất” đòi hỏi cần phải huấn luyện Ba

phương pháp thường được sử dụng là phù hợp, phát triển và cấu trúc lại Trong cách tiếp cận phù hợp, một nhóm các Neural Network với các neuron ẩn khác nhau đã được huấn luyện và mỗi cái được đánh giá trong phần kiểm tra sử dụng số lượng hợp lý các trọng số bắt đầu được lựa chọn một cách ngẫu nhiên Việc gia tăng số lượng các neuron ẩn có thể là một hai hoặc nhiều hơn phụ thuộc vào các tài nguyên máy tính phù hợp Việc đưa ra các tiêu chuẩn ước lượng (ví dụ như tổng các sai lệch ) trong phần kiểm tra như là một công thức của nhiều neuron ẩn cho mỗi Neural Network một cách phổ biến sản sinh ra một đồ thị sai lệch có dạng hình cái bát Network với sai số ít nhất được thấy ở đáy bát đã được thu thập bởi vì

Trang 29

có thể phổ biến tốt nhất Cách tiếp cận này mất nhiều thời gian, nhưng hầu như đều cho kết quả tốt

Lối tiếp cận triển khai và cấu trúc lại bao gồm việc thay đổi số lượng các neuron

ẩn trong quá trình huấn luyện hơn là tạo nên những Network riêng biệt với những neuron ẩn khác nhau như trong lối phù hợp Nhiều phần mềm đóng gói Neural Network không hỗ trợ việc thêm vào hay bớt đi các neuron ẩn trong quá trình huấn luyện Lối tiếp cận cấu trúc bao gồm việc thêm vào các neuron ẩn cho đến khi mô hình cho thấy làm xấu đi các yếu tố ban đầu Lối tiếp cận cấu trúc lại cũng gần vậy ngoại trừ các neuron được xóa bỏ trong quá trình huấn luyện

Dù cho phương pháp nào được sử dụng để thu thập các neuron ẩn cho quá trình kiểm tra, nguyên tắc là luôn lựa các neuron thể hiện tốt trong giai đoạn huấn luyện với số lượng neuron ẩn ít nhất Khi kiểm tra một loạt các neuron ẩn, rất quan trọng

để giữ tất cả các biến khác nhất quán Việc thay đổi bất kỳ biến nào trong việc tạo

ra ấn tượng tốt về một mô hình Neural Network mới với bộ mặt về các sai phạm tiềm tàng khác nhau, cái có thể làm phức tạp không cần thiết việc lựa chọn số lượng tốt nhất các neuron ẩn

2.6.3 Tính toán số lượng các neuron đầu ra

Việc quyết định số lượng các neuron đầu ra là cái gì đó khó hơn đường thẳng phía trước kể từ khi có các lý do hấp dẫn luôn sử dụng chỉ một neuron đầu ra Hệ thống Neural Network với nhiều loại neuron đầu ra, đặc biệt nếu những đầu ra này được trải dài, sẽ tạo ra nhiều kết quả tồi khi so sánh với một Network chỉ với một biến đầu ra Một Neural Network đã được huấn luyện bằng cách chọn các trọng số như sai số trung bình trên tất cả các neuron đầu ra đã được giới hạn thấp nhất Ví dụ, một Neural Network cố gắng dự báo một tháng rưỡi giá tương lai sẽ tập trung hầu hết các hiệu quả của nó trong việc giảm dự báo với những sai lệch lớn giống như

là dự báo 6 tháng Kết quả là có một sự cải thiện lớn liên quan đến đến dự báo 1 tháng sẽ không được tạo ra nếu nó gia tăng hoàn toàn sai sót của dự báo 6 tháng bằng một số lượng lớn hơn sự cải tiến hoàn toàn của dự báo 1 tháng Cách giải quyết để có được hệ thống Neural Network chuyên môn hóa bằng cách sử dụng

Trang 30

các network phân biệt cho từng dự báo Sự chuyên môn hóa cũng tạo ra các sản phẩm được thiết kế dùng thử và sai sót một cái gì đó đơn giản hơn từ khi mỗi Neural Network nhỏ hơn và nhiều biến hơn cần để thay đổi sự hòa hợp trong mô hình cuối cùng

2.6.4 Xác định loại hàm truyền

Các hàm truyền là những công thức toán học mà quyết định số đầu ra của một quá trình neuron Chúng cũng đồng thời nối kết với các chức năng thay đổi, nén lại, kích hoạt hay đổi mới Điểm chính trong mô hình Neural Network hiện nay sử dụng chức năng hình S, nhưng những cái khác như tiếp tuyến và hồi quy cũng được đưa ra Mục đích của hàm truyền là để ngăn chặn các biến đầu ra trong việc đặt đến các giá trị lớn mà chúng có thẻ “làm liệt” mô hình và do đó hạn chế huấn luyện

Hàm truyền tuyến tính không có ích lắm trong các ánh xạ và loại phi tuyến

Levich và Thoma, Kao và Ma nhận ra rằng các thị trường tài chính đều phi tuyến

và cũng nhớ đề nghị rằng các hàm truyền phi tuyến thì thích hợp hơn Các hàm truyền như hình sigma thì thường sử dụng phổ biến hơn cả cho dữ liệu chuỗi thời gian vì chúng cũng phi tuyến và những đặc trưng tiếp diễn có thể là những tính năng ao ước được dùng cho mô hình Neural Network

Dữ liệu thô thường đều có cùng tỷ lệ và ở giữa 0 – 1 và -1 đến 1, vì thế nó thường nhất quán với loại hàm truyền đang được sử dụng

Tuyến tính và độ lệch chuẩn là hai trong các phương pháp phổ biến nhất được sử dụng trong hệ thống Neural Network Trong phương pháp tuyến tính, tât cả các biến đều được đo với số lớn nhất và nhỏ nhất được xác định theo công thức sau:

Với SV là giá trị cần cân, TF là giá trị tương ứng của hàm truyền, D là giá trị của mẫu, là giá trị lớn nhất và nhỏ nhất của mẫu

2.7 XÁC ĐỊNH TIÊU CHUẨN ĐÁNH GIÁ KẾT QUẢ

Trang 31

Hầu hết các sai lệch thông thường đều được tối thiểu trong mô hình Neural

Network là tổng các sai lệch bình phương Các hàm sai lệch khác được đưa ra nhờ các phần mềm Các hàm số sai lệch này có thể không phải là các tiêu chuẩn cuối cùng từ khi các phương pháp dự báo thông thường khác như MAPE thường không được tối thiểu trong mô hình này

Trong trường hợp các hệ thống điều chỉnh thông thường, các dự báo của Neural Network có thể chuyển thành tín hiệu mua bán tùy thuộc vào các tiêu chuẩn đã quyết định trước Ví dụ, tất cả các dự báo đều lớn hơn 0.8 hay 0.9 điều đó nghĩa là

đó là dấu hiệu mua, còn dự báo nhỏ hơn 0.2 hay 0.1 là dấu hiệu bán Dấu hiệu mua hay bán sau đó được đưa vào chương trình để tính xem các loại rủi ro và được huấn luyện lại và Neural Network đưa ra kết quả được điều chỉnh rủi ro Mức độ sai sót thấp và lợi nhuận giao dịch đều cần thiết đối với nhà đầu tư

Lọc lại chuỗi thời gian để loại bỏ nhiều sự thay đổi giá nhỏ có thể phần lớn ngăn chặn được trường hợp mà Neural Network với những điểm dự báo cao nhưng lại không mang đến lợi nhuận Cũng vậy, giá trị của hệ thống giao dịch đơn lẻ nào cũng chỉ có thể xác định đưa theo hệ thống danh mục đầu tư của người dùng Theo quan điểm này, mô hình Neural Network rất hữu ích nếu chúng hành động như là

hệ thống đếm xu hướng trái với những hệ thống theo sau xu hướng của các trái phiếu thông thường

2.8 LỰA CHỌN KIỂU HUẤN LUYỆN MÔ HÌNH NEURAL NETWORK

Quá trình huấn luyện một mạng lưới Neural nhằm học hỏi các mô hình dữ liệu có liên quan đến việc giới thiệu mạng lưới Neural có tính lặp đi lặp lại với các ví dụ nhằm nhận biết những câu trả lời nào là chính xác Mục tiêu của việc huấn luyện

là tìm cách để bố trí các trọng số ở giữa các neural nhằm định rõ toàn bộ số lượng tối thiểu của chức năng sai số Nếu mô hình không được “khít quá mức”, điều này

bố trí các trọng số nhằm cung cấp một khái quát hóa tốt Mạng lưới

Backpropagation sử dụng một thuật toán huấn luyện dốc xuống nhằm huấn luyện

Trang 32

các trọng số để di chuyển xuống một độ dốc nhất của bề mặt sai số Việc tìm thấy toàn bộ số lượng tối thiểu thì không được bảo đảm từ khi bề mặt sai số có thể chứa đựng một lượng cực tiểu cục bộ mà trong thuật toán có thể trở nên bế tắc Thuật ngữ momentum và 5 cho tới 10 việc xếp đặt ngẫu nhiên của các trọng số ban đầu

có thể cải tiến các cơ hội của sự đạt đến một mức tối thiểu chung Phần này sẽ được thảo luận khi kết thúc việc huấn luyện một mạng lưới Neural và việc lựa chọn tỷ lệ nghiên cứu và các giá trị momentum

2.8.1 Xác định thông số lặp lại quá trình huấn luyện

Có hai trường phái tư duy quan tâm về điểm mà việc huấn luyện nên được ngừng lại Các căng thẳng đầu tiên là sự nguy hiểm của việc đánh bẫy trong các mức cực tiểu cục bộ và sự khó khăn của việc đạt đến một mức cực tiểu chung Nhà nghiên cứu nên chỉ dừng việc huấn luyện cho đến khi không có sự cải tiến nào trong công thức sai số được dựa trên một số lượng hợp lý các trọng số ban đầu được lựa chọn ngẫu nhiên Điểm mà mạng lưới không cải tiến được gọi là sự hội tụ Cách nhìn thứ hai tán thành một chuỗi các gián đoạn mang tính huấn luyện Việc huấn luyện được dừng lại sau khi một số lượng các gián đoạn được định trước và khả năng của mạng lưới là tổng quát hóa các quá trình kiểm tra đã được đánh giá và quá trình huấn luyện được tiếp tục Việc tổng quát hóa là ý kiến mà một mô hình dựa trên vật mẫu của dữ liệu thì thích hợp cho việc dự báo tổng số lượng Mạng lưới

mà trong đó việc xếp đặt huấn luyện lỗi sai được chọn từ khi nó được cho rằng để khái quát hóa tốt nhất

Sự phê bình các thủ tục huấn luyện – kiểm tra rằng là các gián đoạn của các quá trình huấn luyện – kiểm tra thêm vào có thể gây ra lỗi sai trong việc xếp đặt huấn luyện – kiểm tra để rời xa hơn trước khi tăng trở lại hoặc nó thậm chí có thể rơi theo đường tiệm cận Nói một cách khác, nhà nghiên cứu không có cách nào để biết được nếu việc huấn luyện thêm có thể cải thiện khả năng khái quát hóa một cách đặc biệt của mạng lưới khi mà các trọng số ban đầu được lựa chọn ngẫn nhiên

Tiêu đề	Mô hình Neural Network trong dự báo tài chính
Trường học	Trường Đại Học Kinh Tế Quốc Dân
Chuyên ngành	Tài chính
Thể loại	Đề tài
Thành phố	Hà Nội

Định dạng
Số trang	65
Dung lượng	1,1 MB