HỌC VIỆN NGÂN HÀNG Khoa Hệ thống Thông tin Quản lý BÀI BÁO CÁO Học phần: Trí tuệ nhân tạo trong kinh doanh Đề tài: ỨNG DỤNG AI TRONG VIỆC DỰ ĐOÁN GIÁ CỔ PHIẾU CỦA APPLE Giảng viên hướng
Trang 1HỌC VIỆN NGÂN HÀNG Khoa Hệ thống Thông tin Quản lý
BÀI BÁO CÁO Học phần: Trí tuệ nhân tạo trong kinh doanh
Đề tài:
ỨNG DỤNG AI TRONG VIỆC DỰ ĐOÁN GIÁ CỔ
PHIẾU CỦA APPLE
Giảng viên hướng dẫn: Cô Nguyễn Phan Tình
Nhóm thực hiện : Nhóm 3
Mã lớp : 211IS42A14
Hà Nội, ngày 5 tháng 1 năm 2021
Trang 2Danh sách sinh viên thực hiện nhóm 3:
LỜI CẢM ƠN
Chúng em cũng xin gửi lời cảm ơn chân thành đến cô Nguyễn Phan Tình - Giảng viên Khoa Hệ thống thông tin và Quản lý, Học viện Ngân hàng Trong suốt quá trình học tập và thực hiện bài báo cáo cô đã luôn tạo điều kiện giúp đỡ để chúng em hoàn thành được bài báo cáo này
Chúng em đã cố gắng hoàn thiện bài báo cáo với tất cả sự nỗ lực và cố gắng của cả nhóm Tuy nhiên, do còn thiếu nhiều kinh nghiệm, chắc chắn bài báo cáo sẽ không tránh khỏi thiếu sót Chúng em rất mong nhận được sự quan tâm, những góp ý quý báu của cô để bài báo cáo của chúng em được hoàn thiện hơn
Chúng em xin chân thành cảm ơn cô!
Trang 3MỤC LỤC
I Xác định vấn đề 1
1.1 Phát biểu bài toán và lý do chọn bài toán 1
1.2 Giới thiệu chung về doanh nghiệp 1
II Xây dựng mô hình tổng quan 2
2.1 Cách thu thập dữ liệu 2
2.2 Cách mô hình hoạt động 4
III Tổng quan về thuật toán LTSM 5
3.1 Giới thiệu thuật toán 5
3.2 Sử dụng lý thuyết toán học 6
IV Mã lệnh mô hình 6
4.1 Đọc dữ liệu, tiền xử lý dữ liệu 6
4.2 Xây dựng mô hình 10
4.3 Huấn luyện mô hình và xác định độ chính xác của mô hình 11
4.4 Sử dụng mô hình 14
V Kết luận 14
TÀI LIỆU THAM KHẢO 16
Trang 4I Xác định vấn đề
1.1 Phát biểu bài toán và lý do chọn bài toán
Thị trường tài chính có luôn có một sức ảnh hưởng rõ rệt đến nền kinh tế của mỗi quốc gia Trong vài năm qua, những giao dịch như mua cổ phiếu hay chứng khoán đã trở thành trung tâm của sự chú ý, thu hút nhiều nhà đầu tư trên khắp cả nước Theo số liệu Trung tâm Lưu ký Việt Nam (VSD), chỉ trong tháng 10 năm 2021 đã có hơn 129.500 tài khoản chứng khoán được mở mới Con số này tăng gần 13% so với tháng 9 cùng năm Tính đến cuối tháng 10-2021, tổng số tài khoản đã mở trên thị trường chứng khoán Việt Nam là hơn 3,86 Trong số đó, các nhà đầu tư trong nước nắm giữ gần 99% (gần 3,83 triệu) tài khoản, khoảng 1% còn lại là do nhà đầu tư nước ngoài nắm giữ (hơn 38.700) tài khoản
Để có thể thu được lợi nhuận, các nhà đầu tư phải có những hiểu biết nhất định để có thể tiến hành quá trình phân tích - dự đoán Quá trình này nhằm xác định những chuyển động trong tương lai của giá trị cổ phiếu tại một sàn giao dịch nào đó Nếu có thể dự đoán một cách chính xác, các nhà đầu tư có thể ra những quyết định mua- bán đúng đắn, tối đa hóa lợi nhuận trong khi giữ được rủi ro thấp
Tuy nhiên, thị trường chứng khoán không phải lúc nào cũng có thể được dự đoán một cách dễ dàng bởi đặc điểm phi tuyến tính, vận động liên tục của nó Ngoài ra, còn có rất nhiều yếu tố có thể khiến quá trình dự đoán này bị chệch hướng chẳng hạn như lãi suất, chính trị, tăng trưởng kinh tế,
Với sự tiến bộ của AI, viêc dự đoán có thể diễn ra một cách nhanh chóng và chuẩn xác hơn bằng cách dựa vào những thông tin thị trường trên một vài website như BBC, Bloomberg, Yahoo Finance, kết hợp với thuật toán của trí tuệ nhân tạo
Chính vì những lý do trên, nhóm chúng em quyết định lựa chọn chủ đề: “Ứng dụng
AI trong dự đoán giá cổ phiếu của Apple” để nghiên cứu và kiểm chứng.
1.2 Giới thiệu chung về doanh nghiệp
Về doanh nghiệp Apple
Apple là một tập tập đoàn công nghệ có trụ sở tại Cupertino, CA Đồng thời, đây cũng là một trong những công ty có giá trị nhất trên thế giới Nó sản xuất các tiện ích kỹ
Trang 5thuật số phổ biến, bao gồm máy Mac, iPod, iPhone và iPad Công ty được thành lập vào năm 1976 bởi Steve Jobs và Steve Wozniak
Hiện nay, Apple đã lớn mạnh hơn với sự đa dạng sản phẩm mà công ty cung cấp cho người dùng như:
Điện tử gia dụng - Ipad, iPhone, iPod
Máy tính Apple cá nhân - MacBook
Máy chủ
Phần mềm máy tính - Macintosh
Phân phối phương tiện kỹ thuật số - iTunes
Apple đã là người tạo ra xu hướng ở Thung lũng Silicon trong gần 4 thập kỷ Các Apple II, Macintosh, iPod, iPhone và iPad đều được phân phối rộng rãi trên toàn thế giới
Về cổ phiếu của Apple
Cổ phiếu của Apple đã thu hút rất nhiều nhà đầu tư trong vài năm trở lại đây Điều này là vì công ty đã cho thấy khả năng nhạy bén trong việc làm mới các sản phẩm cũ như iPhone, iPad và dòng máy tính Mac của mình theo những cách khiến người tiêu dùng trung thành với thương hiệu của họ
Thêm vào đó, đại dịch Coronavirus đã thúc đẩy nhu cầu của người tiêu dùng đối với các sản phẩm của họ khi hàng trăm triệu người trên toàn thế giới bắt đầu làm việc, học tập
và giải trí tại nhà Cổ phiếu của Apple đang đạt mức cao kỷ lục và hoàn toàn có thể ghi nhận mức cao hơn
Tuy vậy, cũng có một số rủi ro đến từ hoạt động đầu tư vào Apple Đặc biệt là với sự phát triển như vũ bão hiện nay của công nghệ, một số thương hiệu điện thoại, đồ điện tử với những cách tân về ngoại hình sản phẩm như của Samsung hay cung cấp lợi ích khác biệt về giá như Trung Quốc sẽ cạnh tranh trực tiếp với Apple Điều này có thể dẫn đến sụt giảm giảm doanh thu và tiếp theo là giảm giá trị cổ phiếu của tập đoàn này
II Xây dựng mô hình tổng quan
2.1 Cách thu thập dữ liệu
Dữ liệu thu thập từ trang web
Trang 6https://finance.yahoo.com/quote/AAPL?p=AAPL&.tsrc=fin-srch ,
“datastockApple.csv” Mở tập tin datastockApple chứa dữ liệu trong 7 năm Chúng ta sẽ thấy nó chứa 7 cột: date (ngày), open (mức giá lúc mở cửa), high (mức giá cao nhất trong ngày), low (mức giá thấp nhất trong ngày), close (mức giá lúc đóng cửa), adj close (giá đóng cửa điều chỉnh) và volume (khối lượng giao dịch trong ngày)
Đầu tiên chúng ta sẽ xem xu hướng giá cổ phiếu của công ty Apple như thế nào:
Hình1: Bảng số liệu cổ phiếu của công ty Apple
Xác định thuộc tính cần mô tả của dữ liệu:
Date: Ngày
High: Mức giá cao nhất trong ngày
Low: Mức giá thấp nhất trong ngày
Open: Mức giá lúc mở cửa
Close: Mức giá lúc đóng cửa
Volume: Khối lượng giao dịch trong ngày
Trang 7Hình 2: Biểu đồ giá cổ phiếu của công ty Apple 2014-2021
Từ biều đồ ta có thể thấy được giá cổ phiếu của Apple biến đổi khó lường và khó có thể xác định bằng mắt thường được Thuật toán LSTM (Long short term memory) là một loại mạng thần kinh thường xuyên có khả năng ghi nhớ thông tin quá khứ và trong khi dự đoán các giá trị tương lai, nó cần thông tin trong quá khứ từ đó có thể dự đoán được các
dữ liệu trong tương lai một cách chính xác 80-90%
2.2 Cách mô hình hoạt động
Hình 3: Mô hình đề xuất tổng quát
Trang 8Trong mô hình đề xuất tổng quát gồm hai phần lớn: Huấn luyện mô hình và ứng dụng web
Huấn luyện mô hình: từ dữ liệu thô, là một tập các dữ liệu cổ phiếu, ta tiền xử lý
nó Sau đó tiến hành xử lý lấy đặt trang từ dữ liệu đã có thể huấn luyện ra model, cuối cùng huấn luyện sử dụng mô hình học sâu với mạng LSTM
Ứng dụng web: Dựa vào dữ liệu cổ phiếu của công ty Apple, tiền xử lý dữ liệu Sau đó sử dụng mô hình LSTM để dự đoán và in ra kết quả
III Tổng quan về thuật toán LTSM
3.1 Giới thiệu thuật toán
Dự đoán được coi là một trong những vấn đề khó giải quyết nhất trong ngành khoa học dữ liệu Chúng có thể ứng dụng trong hầu hết các lĩnh vực bao gồm dự đoán doanh số bán hàng đến tìm kiếm các mẫu trong dữ liệu của thị trường chứng khoán Người ta thấy rằng đối với hầu hết các vấn đề dự đoán này, mạng bộ nhớ ngắn hạn dài hạn, hay còn gọi
là LSTM được coi là giải pháp hiệu quả nhất
LSTM là viết tắt của cụm Long Short Term Memory, được sử dụng trong lĩnh vực Học sâu Nó là một loạt các mạng nơ-ron lặp lại (RNN) có khả năng học các phụ thuộc dài hạn, đặc biệt là trong các bài toán dự đoán trình tự LSTM có các kết nối phản hồi, tức
là nó có khả năng xử lý toàn bộ chuỗi dữ liệu, ngoại trừ các điểm dữ liệu đơn lẻ như hình ảnh
Một đơn vị LSTM thông thường bao gồm một tế bào (cell), một cổng vào (input gate), một cổng ra (output gate) và một cổng quên (forget gate) Tế bào ghi nhớ các giá trị trong các khoảng thời gian bất ý và ba cổng sẽ điều chỉnh luồng thông tin ra/vào tế bào
LSTM cho thấy hiệu suất vượt trội đối với nhiều lĩnh vực khác nhau như:
Dịch máy
Nhận dang chữ viết
Chú thích hình ảnh
Câu trả lời câu hỏi
Chuyển đổi video thành văn bản
Trang 9 Mô hình âm nhạc đa hình
Tổng hợp giọng nói
Dự đoán cấu trúc bậc hai của protein
3.2 Sử dụng lý thuyết toán học
Dự báo dài hạn là ước lượng tương lai trong thời gian dài, thường hơn một năm Dự báo dài hạn rất cần thiết trong quản trị sản xuất để trợ giúp các quyết định chiến lược về hoạch định sản phẩm, quy trình công nghệ và các phương tiện sản xuất
Phương pháp hồi quy tuyến tính Phân tích hồi quy tuyến tính là một mô hình dự báo thiết lập mối quan hệ giữa biến phụ thuộc với hai hay nhiều biến độc lập Trong phần này, chúng ta chỉ xét đến một biến độc lập duy nhất Nếu số liệu là một chuỗi theo thời gian thì biến độc lập là giai đoạn thời gian và biến phụ thuộc thông thường là doanh số bán ra hay bất kỳ chỉ tiêu nào khác mà ta muốn dự báo
Ta có: y – biến phụ thuộc cân bằng dự báo:
x - biến độc lập
a – độ dốc của đường xu hướng
b – tung độ gốc
n – số lượng quan sát
Mô hình này có công thức: Y = ax + b, với a = và b =
IV Mã lệnh mô hình
4.1 Đọc dữ liệu, tiền xử lý dữ liệu
Đầu tiên ta cần phải khai báo thư viện đầu vào để đọc dữ liệu:
Trang 10Đầu tiên ta dùng pandas_datareader để có thể tải trực tiếp dữ liệu chứng khoán của Apple:
Sau đó ta mô tả lại thuộc tính của dữ liệu:
Trang 11Việc đầu tiên đối với mỗi bài toán xây dựng mô hình là bước tiền xử lý dữ liệu, ở đây chúng ta cần kiểm tra xem có giá trị nào còn thiếu trong mô hình không?
Mô tả lại các hệ số của tập dữ liệu:
Mô tả lại loại dữ liệu:
Trang 12Hiển thị thông tin dữ liệu trong mỗi cột:
Giá cổ phiếu trong ngày được xác định bằng với mức giá lúc đóng cửa (Close), vậy nên ở bài này chúng ta sẽ tập trung xây dựng mô hình dựa trên dữ liệu ở mức giá đóng cửa của Apple Do đó sẽ tạo một dataframe mới chỉ chứa cột “Close” rồi chuyển đổi khung dữ liệu thành một mạng numpy Tạo một khung dữ liệu chứa dữ liệu cần xây dựng, sau đó chia dữ liệu thành 2 phần: Huấn luyện (chiếm 80%) và thử nghiệm (chiếm 20%)
Tạo tập dữ liệu đào tạo theo tỷ lệ:
Trang 13Mô hình LSTM hoạt động tốt nhất khi dữ liệu đầu vào ở dạng 3-d, vì vậy tiếp theo chúng ta cần định hình lại dữ liệu
4.2 Xây dựng mô hình
Đầu tiên ta gán model với mô hình tuần tự Sequential(), sau đó ta thêm một lớp LSTM, truyền lớp này 50 tế bào thần kinh, đặt giá trị trả về là true, hình dạng đầu vào có
số bước thời gian bằng với số bước x_train.shape [1] và số lượng tính năng là 1 Tiếp theo
ta tạo một lớp LSTM khác và nó cũng sẽ có 50 tế bào thần kinh và các chuỗi trẩ về sẽ là false Cuối cùng ta sử dụng lớp Dense, đây là lớp mạng lưới thần kinh giúp kết nối các mạng lưới lại với nhau, vì vậy ở lớp Dense đầu tiên ta truyền vào 25 tế bào thần kinh và ở lớp Dense tiếp theo ta truyền vào 1 tế bào thần kinh
Cuối cùng chúng ta sẽ biên dịch mô hình đã tạo:
Trang 144.3 Huấn luyện mô hình và xác định độ chính xác của mô hình
Chúng ta sẽ huấn luyện mô hình với các giá trị ở tệp dữ liệu huấn luyện Ở đây có thử đến 100 tuy nhiên ở epochs = 4 thì giá trị loss là hợp lý nhất
Tạo tập dữ liệu thử nghiệm và định hình lại dữ liệu:
Trang 15Cuối cùng sẽ cho mô hình chạy với những dữ liệu ở tệp dữ liệu thử nghiệm và xem kết quả
Trang 16
Đánh giá kết quả:
Ở đây ta sử dụng phương pháp RMSE để đánh giá độ chính xác của mô hình: Lỗi trung bình bình phương gốc (RMSE) là thước đo mức độ hiệu quả của mô hình Nó thực hiện điều này bằng cách đo sự khác biệt giữa các giá trị dự đoán và giá trị thực tế RMSE càng nhỏ tức là sai số càng bé thì mức độ ước lượng cho thấy độ tin cậy của mô hình có thể đạt cao nhất
Biểu diễn dưới dạng biểu đồ để có thể thấy được độ chính xác của thuật toán:
4.4 Sử dụng mô hình
Trang 17Sử dụng LSTM để dự đoán giá trị cổ phiếu của Apple vào ngày 23/12/2021
Giá trị thực tế của cổ phiếu công ty Apple vào ngày 23/12/2021: 176,27999
V Kết luận
Rất nhiều hoạt động kinh doanh và đời sống hiện nay đều đã sử dụng trí tuệ nhân tạo (AI) như một công cụ hỗ trợ công việc Nếu như con người không thể quét hàng triệu dữ liệu để lọc ra các dữ liệu có liên quan đến cổ phiếu trong vài giây thì với ứng dụng trí tuệ nhân tạo AI có thể làm được điều này Chúng ta có thể dễ dàng nhận thấy, với khả năng thu thập và phân tích lượng dữ liệu khổng lồ đó, những ứng dụng này sẽ giúp các nhà đầu
tư thực hiện giao dịch chính xác hơn, giảm bớt rủi ro và gia tăng lợi nhuận
Một ưu điểm vượt trội hơn khi sử dụng ứng dụng trí tuệ nhân tạo là các nhà đầu tư sẽ loại bỏ được yếu tố cảm xúc khi quyết định lựa chọn một danh mục đầu tư Dường như với ứng dụng trí tuệ nhân tạo, việc dự đoán giá cổ phiếu trở nên dễ dàng hơn rất nhiều Ngoài ra, áp dụng AI vào việc dự đoán giá cổ phiếu còn giúp tiết kiệm được thời gian và tiền bạc thuê chuyên gia tư vấn, từ đó giúp ta phân bổ thời gian một cách hợp lý hơn để đạt hiệu quả tốt nhất
Tuy nhiên việc áp dụng AI cũng mang đến một số hạn chế Một trong số đó là việc một khi ứng dụng trí tuệ nhân tạo được sử dụng rộng rãi thì con người sẽ làm gì? Nếu như trước đây, khi nhà đầu tư muốn mua cổ phiếu họ sẽ cần đến một chuyên gia tư vấn để
Trang 18giúp họ phân tích tất cả các yếu tố để đưa ra quyết định đầu tư thì nay những công việc này sẽ được thay thế bởi trí tuệ nhân tạo Nhưng đó chỉ là một vấn đề nhỏ vì robot có thể
xử lý công việc hiệu quả hơn con người ở nhiều lĩnh vực và vị trí công việc, tuy nhiên con người lại sở hữu nhiều khả năng tiềm tàng mà robot không bao giờ có được, bởi robot cũng chỉ là sản phẩm của trí tuệ con người mà thôi
Trong lĩnh vực đầu tư cổ phiếu, dù đạt tới đỉnh cao của trí tuệ nhưng robot không thể đọc được sắc thái trong nhu cầu của các nhà đầu tư, chỉ con người mới có thể làm được điều này Hay như với những khoản đầu tư mang tính phức tạp cao hơn, đòi hỏi phải có sự đánh giá kỹ lưỡng các yếu tố “thiên thời” thì máy móc cũng chưa thể đảm nhiệm được
Trong quá trình thực hiện nghiên cứu đề tài “Ứng dụng AI trong dự đoán giá cổ
phiếu của Apple”, mô hình LSTM đã được áp dụng Mô hình này cho khả năng dự đoán
trong thời gian ngắn và có tính chính xác ở mức khá Mô hình được thực hiện nhiều lần thử và các kết quả có thể thay đổi giữa các lần Tuy nó không cho ra kết quả tuyệt đối nhưng nó cũng đã dự đoán đúng sự tăng trưởng của cổ phiếu Trong trường hợp dự đoán những dữ liệu về lâu dài thì thông tin dự đoán chỉ mang tính chất tương đối
Có thể nói, việc áp dụng AI nói chung và mô hình LSTM mang lại rất nhiều lợi ích Tuy vẫn còn một số sai sót và hạn chế nhất định nhưng mô hình LSTM có rất nhiều tiềm năng Vậy nên, nếu mô hình được huấn luyện kỹ hơn hứa hẹn sẽ có thể trở thành một tham chiếu để tham khảo trong quá trình dự đoán các giá trị tương lai của thị trường giao dịch
Trang 19TÀI LIỆU THAM KHẢO
1 Nguồn code tham khảo:
Brownlee, J (2017) Multivariate Time Series Forecasting with LSTMs in Keras in Deep
Learning for Time Series
<https://machinelearningmastery.com/multivariate-time-series-forecasting-lstms-keras/? fbclid=IwAR1hrHoA_Kr5FHV3U61D6mKlqoASaNx9lODviEjTcU-FZJeDcu4g7j9_Flk>
<https://github.com/hung96ad/predict_price_cryptocurrencies?
fbclid=IwAR32RbdZxILSurtj2acbIA-x1_Vfxzxzq4b8FFjqJN1AwWeMjsR7kvXt6AE>
2 Dữ liệu tham khảo của Apple:
https://finance.yahoo.com/quote/AAPL?p=AAPL&.tsrc=fin-srch
3 What is LTSM (2021), <https://intellipaat.com/blog/what-is-lstm/>
4 Slide tài liệu môn “Trí tuệ nhân tạo trong kinh doanh – Khoa Hệ thống Thông Tin và
Quản lý”, Học Viện Ngân Hàng.
5 Nguyễn Minh Lợi (2020), Dự đoán giá cổ phiếu bằng phương pháp học sâu không
giám sát”, Luận văn Thạc Sỹ, Khoa Hệ thống thông tin, Trường Đại Học Thủ Dầu Một.
<http://viewer.tdmu.edu.vn/wpViewFile.aspx?EdataFileDetailId=33731>
6 Ngọc Quang (2019), Nhà đầu tư được lợi gì khi công ty chứng khoán ứng dụng AI vào
giao dịch.
< https://tinnhanhchungkhoan.vn/nha-dau-tu-duoc-loi-gi-khi-cac-cong-ty-chung-khoan-ung-dung-ai-vao-giao-dich-post223314.html>
7 Triệu Phong (2021), LTSM là gì?
<https://www.nguyentrieuphong.com/2021/07/LSTM-RNN-du-doan-co-phieu-.html>
8 Sử dụng mạng LTSM để dự đoán số liệu hướng thời gian
< http://trituevietvn.com/chi-tiet/su-dung-mang-lstm-long-short-term-memory-de-du-doan-so-lieu-huong-thoi-gian-123>