...Vũ Thị Phương.pdf tài liệu, giáo án, bài giảng , luận văn, luận án, đồ án, bài tập lớn về tất cả các lĩnh vực kinh tế...
Trang 1TRƯỜNG ĐẠI HỌC TÀI NGUYÊN VÀ MÔI TRƯỜNG HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
ỨNG DỤNG CÂY QUYẾT ĐỊNH ĐỂ PHÂN LOẠI KHÁCH
HÀNG VAY VỐN NGÂN HÀNG AGRIBANK
Hà Nội - 2016
Trang 2TRƯỜNG ĐẠI HỌC TÀI NGUYÊN VÀ MÔI TRƯỜNG HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
VŨ THỊ PHƯƠNG
ỨNG DỤNG CÂY QUYẾT ĐỊNH ĐỂ PHÂN LOẠI KHÁCH
HÀNG VAY VỐN NGÂN HÀNG AGRIBANK
Chuyên ngành: Công nghệ thông tin
NGƯỜI HƯỚNG DẪN: ThS.Nguyễn Anh Thơ
Trang 3LỜI CAM ĐOAN
Em xin cam đoan, báo cáo này là hoàn toàn do em thực hiện Các kết quả nghiên cứu đưa ra trong báo cáo này dựa vào các kết quả thu được trong quá trình tìm hiểu, nghiên cứu của em Nội dung báo cáo có tham khảo và sử dụng một số thông tin, tài liệu từ các nguồn sách báo, tạp chí được liệt kê trong danh mục các tài liệu tham khảo
Hà N ội, ngày 07 tháng 06 năm 2016
Sinh viên thực hiện
Vũ Thị Phương
Trang 4LỜI CẢM ƠN
Trong thời gian làm báo cáo đồ án tốt nghiệp, em đã nhận được nhiều sự giúp đỡ, đóng góp ý kiến và chỉ bảo nhiệt tình của thầy cô và bạn bè
Em xin chân thành cảm ơn thầy TS.Hà Mạnh Đào là trưởng khoa Công nghệ thông tin - Đại học Tài Nguyên và Môi Trường Hà Nội đồng thời là cố vấn học tập của em, cùng các thầy cô khoa Công nghệ thông tin - Đại học Tài Nguyên và Môi Trường Hà Nội đã tận tâm truyền dạy những kiến thức thiết thực trong suốt quá trình học, đồng thời em xin cảm ơn nhà trường đã tạo điều kiện tốt nhất cho tôi hoàn thành báo cáo đồ án tốt nghiệp
Đặc biệt, em xin bày tỏ sự biết ơn sâu sắc tới thầy giáo ThS.Nguyễn Anh Thơ, người đã định hướng và giúp đỡ em tận tình trong suốt quá trình làm báo cáo
đồ án tốt nghiệp
Trong quá trình hoàn thành báo cáo đồ án tốt nghiệp có thể còn nhiều thiếu sót, em rất mong nhận được sự đóng góp ý kiến từ các thầy cô và bạn bè để đồ án
có thể phát triển và hoàn thiện hơn
Hà N ội, ngày 07 tháng 06 năm 2016
Sinh viên thực hiện
Vũ Thị Phương
Trang 5MỤC LỤC DANH MỤC HÌNH VẼ
DANH MỤC BẢNG BIỂU
MỞ ĐẦU 1
CHƯƠNG 1: KHAI PHÁ DỮ LIỆU 3
1.1.Khám phá tri thức và khai phá dữ liệu là gì? 3
1.1.1.Tại sao cần khai phá dữ liệu 3
1.1.2 Các khái niệm cơ bản 3
1.2 Quá trình khám phá tri thức 5
1.2.1 Làm sạch dữ liệu 6
1.2.2 Tích hợp dữ liệu 6
1.2.3 Trích chọn dữ liệu 6
1.2.4 Chuyển đổi dữ liệu 7
1.2.5 Khai phá dữ liệu 7
1.2.6 Đánh giá mẫu 7
1.2.7 Biểu diễn tri thức 7
1.3 Xây dựng quy trình xây dựng mô hình khai phá dữ liệu 7
1.4 Các kỹ thuật khai phá dữ liệu 9
1.5 Các dạng dữ liệu có thể khai phá được 14
1.6 Các lĩnh vực liên quan đến khai phá dữ liệu 14
1.6.1 Các lĩnh vực liên quan đến phát hiện tri thức và khai phá dữ liệu 14
1.6.2 Ứng dụng của khai phá dữ liệu 15
CHƯƠNG 2: CÂY QUYẾT ĐỊNH VÀ PHƯƠNG PHÁP ID3 16
2.1 Cây quyết định 16
2.1.1 Cấu trúc cây quyết định 16
2.1.2 Xây dựng cây quyết định 18
2.1.3 Các kiểu cây quyết định 22
2.1.4 Cắt tỉa cây quyết định 22
2.1.5 Đánh giá độ phức tạp(Cost Complexity) 23
Trang 62.2 Thuật toán ID3 24
2.2.1 Xây dựng giải thuật ID3 24
2.2.2 Thuộc tính nào dùng để phân loại tốt nhất 26
2.2.3 Ví dụ 27
2.2.4 Khi nào lên sử dụng ID3 34
2.3 Tổng kết và đánh giá cây quyết định 35
2.3.1 Ưu nhược điểm của thuật toán ID3 35
2.3.2 So sánh ID3 với C4.5 35
CHƯƠNG 3: ỨNG DỤNG CÂY QUYẾT ĐỊNH CHO PHÂN LOẠI KHÁCH HÀNG VAY VỐN TẠI NGÂN HÀNG AGRIBANK 37
3.1 Giới thiệu bài toán 37
3.1.1 Bài toán phân lớp 37
3.1.2 Quy trình nghiệp vụ vay vốn tại ngân hàng Agribank 37
3.2 Tổng quan ngôn ngữ cài đặt 39
3.2.1 Ngôn ngữ cài đặt 39
3.2.2 Cấu hình cài đặt 40
3.3 Phân loại khách hàng vay vốn tại ngân hàng Agribank với ID3 40
3.3.1 Mô tả bài toán 40
3.3.2 Xây dựng mô hình phân loại với ID3 41
3.3.3 Cài đặt thực nghiệm 44
3.3.4 Kết quả thực nghiệm 45
3.3.5 So sánh và đánh giá mô hình 47
KẾT LUẬN VÀ KIẾN NGHỊ 48
TÀI LIỆU THAM KHẢO 49
PHỤ LỤC 50
Trang 7DANH MỤC HÌNH VẼ
Hình 1.1: Quá trình khám phá tri thức 5
Hình 1.2: Quy trình xây dựng mô hình khai phá dữ liệu 8
Hình 2.1: Mô hình cây quyết định 16
Hình 2.2: Cây quyết định phân cấp lương 18
Hình 2.3 : Phân tách dữ liệu 19
Hình 3.1: Mô hình phân loại dữ liệu ngân hàng bằng ID3 41
Hình 3.2: File excel sau khi thu thập và xử lý 43
Hình 3.3: Giao diện chương trình chính 44
Hình 3.4: Đọc dữ liệu từ file excel 45
Hình 3.5: Tạo ra cây quyết định 45
Hình 3.6: Load file dữ liệu cần đưa ra quyết định cho vay hay không cho vay 46
Hình 3.7: Ra quyết định cho khách hàng vay vốn hay không 46
Trang 8DANH MỤC BẢNG BIỂU
Bảng 2.1: Bảng dữ liệu lương 17
Bảng 2.2: Dữ liệu cho vay vốn tại ngân hàng 28
Bảng 3.1: Kho dữ liệu ngân hàng Agribank 42
Bảng 3.2: Bảng các thuộc tính của tập dữ liệu Data 43