TRƯỜNG ĐẠI HỌC TÀI NGUYÊN VÀ MÔI TRƯỜNG HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN XÂY DỰNG MÔ HÌNH DỰ BÁO THỊ TRƯỜNG CHỨNG KHOÁN BẰNG LUẬT KẾT HỢP Hà Nội – 2016... TRƯỜNG ĐẠI HỌC TÀI NGUYÊN
Trang 1TRƯỜNG ĐẠI HỌC TÀI NGUYÊN VÀ MÔI TRƯỜNG HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
XÂY DỰNG MÔ HÌNH DỰ BÁO THỊ TRƯỜNG CHỨNG KHOÁN BẰNG LUẬT KẾT HỢP
Hà Nội – 2016
Trang 2TRƯỜNG ĐẠI HỌC TÀI NGUYÊN VÀ MÔI TRƯỜNG HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
NGUYỄN THỊ THOA
XÂY DỰNG MÔ HÌNH DỰ BÁO THỊ TRƯỜNG CHỨNG KHOÁN BẰNG LUẬT KẾT HỢP
Chuyên ngành: Công nghệ thông tin
Giáo viên hướng dẫn:
ThS Nguyễn Anh Thơ
Hà Nội – 2016
Trang 3LỜI CAM ĐOAN
Em xin cam đoan báo cáo đồ án tốt nghiệp này là quá trình tìm hiểu và
hoàn toàn do em thực hiện Các kết quả nghiên cứu đưa ra trong báo cáo này dựa vào các kết quả thu được trong quá trình nghiên cứu của em.Các bảng biểu,hình ảnh trong báo cáo phục vụ cho việc phân tích, nhận xét, đánh giá được thu thập
từ các nguồn khác nhau có ghi rõ trong phần tài liệu tham khảo
Em xin chân thành cảm ơn!
Hà Nội, ngày 07 tháng 06 năm 2016
Sinh viên thực hiện
Nguyễn Thị Thoa
Trang 4LỜI CẢM ƠN
Trên thực tế không có sự thành công nào mà không gắn liền với những sự giúp đỡ mọi người dù ít hay nhiều, dù trực tiếp hay gián tiếp Trong suốt thời gian học tập nhất là trong quá trình thực hiện đồ án, em đã nhận được rất nhiều
sự quan tâm giúp đỡ nhiệt tình của các thầy cô, bạn bè và gia đình
Đầu tiên em xin gửi lời cảm ơn sâu sắc đến Thầy Nguyễn Anh Thơ, Thầy
đã trực tiếp hướng dẫn và giúp đỡ em rất nhiều trong thời gian em làm đồ án này
Em cũng xin gửi lời cảm ơn đến thầy TS.Hà Mạnh Đào, Trưởng khoa Công nghệ thông tin đồng thời cũng là giáo viên chủ nhiệm của lớp em, cùng các thầy
cô giáo trong Khoa đã nhiệt tình giúp đỡ em trong quá trình học tập tại trường Cuối cùng, em xin gửi lời cảm ơn chân thành tới gia đình và bạn bè đã luôn giúp đỡ, động viên và tạo điều kiện tốt nhất cho em trong suốt quá trình học tập cũng như trong cuộc sống
Vì năng lực có hạn nên bài báo cáo của em còn nhiều hạn chế và không thể tránh khỏi những thiếu sót, mong thầy cô và các bạn có những ý kiến đóng góp
để em có thể hoàn thiện và phát triển đề tài hơn
Em xin chân thành cảm ơn!
Hà Nội, ngày 07 tháng 06 năm 2016
Sinh viên thực hiện
Nguyễn Thị Thoa
Trang 5MỤC LỤC DANH MỤC HÌNH VẼ
MỞ ĐẦU
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT 3
1.1 Khám phá tri thức và khai phá dữ liệu là gì? 3
1.2 Quá trình khám phá tri thức 3
1.2.1 Gom dữ liệu 4
1.2.2 Chọn lọc dữ liệu 4
1.2.3 Làm sạch dữ liệu 5
1.2.4 Làm giàu dữ liệu 5
1.2.5 Mã hóa dữ liệu 5
1.2.6 Đánh giá và trình diễn 6
1.3 Quá trình khai phá dữ liệu 6
1.4 Kiến trúc của hệ thống khai phá dữ liệu 7
1.5 Các kỹ thuật khai phá dữ liệu 9
1.6 Các dạng dữ liệu có thể khai phá được 14
1.7 Các lĩnh vực liên quan đến khai phá dữ liệu 15
1.7.1.Các lĩnh vực liên quan đến phát hiện tri thức và khai phá dữ liệu 15
1.7.2 Ứng dụng của khai phá dữ liệu 15
CHƯƠNG 2 : KHAI PHÁ DỮ LIỆU BẰNG LUẬT KẾT HỢP 17
2.1 Giới thiệu về Luật kết hợp 17
2.1.1.Các khái niệm cơ bản 19
2.1.2.Một số tính chất liên quan đến tập phổ biến 21
2.1.3.Khai phá luật kết hợp 22
2.2.Thuật toán khai phá dữ liệu bằng luật kết hợp 23
Trang 62.2.1.Thuật toán Apriori 23
2.2.2.Thuật toán Apriori Tid 26
2.2.3.So sánh thuật toán Apriori và thuật toán Apriori Tid 31
2.2.4.Thuật toán FP-Growth 31
2.2.5.So sánh thuật toán Apriori với thuật toán FP growth 39
CHƯƠNG 3 : XÂY DỰNG CHƯƠNG TRÌNH THỬ NGHIỆM VÀ ĐÁNH GIÁ ……… 40
3.1 Giới thiệu 40
3.1.1 Bài toán 40
3.1.2.Ngôn ngữ cài đặt 42
3.1.3.Cấu hình cài đặt 43
3.2 Mô tả dữ liệu 43
3.2.1.Nguồn dữ liệu 43
3.2.2.Mô tả chi tiết dữ liệu 44
3.3.Xây dựng mô hình dự đoán chỉ số chứng khoán 45
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 49
TÀI LIỆU THAM KHẢO 50
Trang 7DANH MỤC HÌNH VẼ
Hình 1.1 Quá trình khám phá tri thức 4
Hình 1.2 Quy trình khai phá dữ liệu 7
Hình 1.3 Kiến trúc của hệ thống khai phá dữ liệu 8
Hình 2.1 Mô tả Luật kết hợp 19
Hình 2.2 Mô tả tính chất liên kết nút 33
Hình 3.1 Mô hình phân tích và dự đoán mã chứng khoán 41
Hình 3.2 Dữ liệu biến động 44
Hình 3.3 Giao diện chương trình chính 46
Hình 3.4 Load dữ liệu 46
Hình 3.5 Tạo luật kết hợp với Minsupp và Minconf 47
Hình 3.6 Luật kết hợp với thuật toán Apriori 48
Hình 3.7 Lưu luật kết hợp 48