Thông tin về bảng dữ liệuSỐ DƯ CÒN LẠI TRONG THẺ TẦN SUẤT UPDATE SỐ DƯ TRONG THẺ[0,1] SỐ LƯỢNG MUA HÀNG THỰC HIỆN SỐ TIỀN MUA TỐI ĐA 1 LẦN THỰC HIỆN SỐ LƯỢNG MUA HÀNG TRẢ GÓP CỦA CHỦ THẺ
Trang 1ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC
Báo cáo môn học hệ hỗ trợ quyết định:
Đề tài: phân loại khách hàng sử dụng
thẻ tín dụng
GVHD: TS Lê Chí Ngọc
Trang 2Vấn đề đặt ra
Dữ liệu sử dụng
Kết quả và Nhận xétThuật toán Kmeans
Nội dung
Trang 3*Hiện nay, tại các ngân hang việc đăng kí sử dụng thẻ tín dụng trở nên đơn giản hơn khi bạn chứng minh
được tài chính, thông tin cá nhân minh bạch…
SỐ LƯỢNG KHÁCH HÀNG TĂNG LÊN, CẦN HỆ THỐNG PHÂN LOẠI KHÁCH HÀNG ĐỂ CÓ NHỮNG CHÍNH SÁCH PHÙ HỢP
Trang 4DỮ LIỆU
Trang 5Thông tin về bảng dữ liệu
SỐ DƯ CÒN LẠI TRONG THẺ
TẦN SUẤT UPDATE SỐ DƯ TRONG THẺ([0,1])
SỐ LƯỢNG MUA HÀNG THỰC HIỆN
SỐ TIỀN MUA TỐI ĐA 1 LẦN THỰC HIỆN
SỐ LƯỢNG MUA HÀNG TRẢ GÓP CỦA CHỦ THẺ
TIỀN MẶT TRẢ BỞI CHỦ THẺ
Trang 6SỐ LƯỢNG GIAO DỊCH VỚI TIỀN MẶT
SỐ GIAO DỊCH ĐƯỢC THỰC HIỆN KHI MUA HÀNG
Trang 7SỐ LƯỢNG THANH TOÁN BỞI CHỦ THẺ
GIÁ TRỊ TỐI THIỂU THANH TOÁN
PHẦN TRĂM THANH TOÁN ĐẦY ĐỦ CỦA KH
HẠN DÙNG DỊCH VỤ CỦA THẺ TÍN DỤNG
Trang 8THUẬT TOÁN KMEANS
*Phân cụm là kỹ thuật quan trong trong khai phá dữ liệu, nó thuộc lớp các phương pháp unsupervised learning trong
Machine Leanrning Trong thuật toán này, chúng ta không biết nhãn (label) của từng điểm dữ liệu mục đích là làm thế nào để phân các điểm dữ liệu vào các nhóm khác nhau sao cho các điểm trong từng một cụm có tinh chất giống nhau
Trang 9Với tâm cụm cho trước, ta gán nhãn cho các điểm dữ liệu sao cho khoảng cách từ điểm đến tâm nhãn là nhỏ nhất
Với các điểm dữ liệu cùng nhãn, ta tìm tâm cụm của nhãn đó sao cho khoảng cách đến tâm cụm đến các điểm trong cụm là nhỏ nhất
Thuật toán dừng lại khi tâm các cụm sau vòng lặp liền nhau là không đổi
THUẬT TOÁN KMEANS
Trong thuật toán Kmeans, với K là số cụm cho trước, ta thực hiện vòng lặp 2 bài toán tối ưu
Trang 10THUẬT TOÁN ELBOW
Thuật toán ELBOW để lựa chọn số cụm tối ưu k cho dữ liệu, dựa trên chí số WSS
WSS ( with cluster sum of square): chỉ số thể hiện tổng khoảng các từ điểm dữ liệu đến các tâm của nhóm mà chúng được gán nhãn
Tuy nhiên, việc lựa chọn số tâm cụm đôi khi phụ thuộc vào kinh nghiệm hay yêu cầu của bài toán, nhưng thông thường khi sử dụng ELBOW, người ta sẽ chọn số tâm cụm là sự biến thiên WSS trước và sau là không quá lớn
Trang 11THUẬT TOÁN ELBOW
Trang 12Kết quả chạy thuật toán
Sử dụng thuật toán ELBOW để tìm số cụm
Chọn số cụm : 7
Trang 13Kết quả chạy thuật toán
Chí số các cụm, gán nhãn cho các điểm dữ liệu
Trang 14Kết quả chạy thuật toán
Nhận xét các nhóm dữ liệu:
L: Low(thấp)
M:Medium(trung bình)
H: Hight(cao)
Trang 15DEMO
Trang 20Kết quả phân tích với số cụm bằng 3
Trước hết, ta có kết quả tâm các cụm khách hàng
Trang 21Một số bảng phân tích
Nhóm 1; 73%
2291
nhóm 3; 1%
Chuỗi 1 Chuỗi 2 Chuỗi 2
Trang 22Phân bổ số tiền chi tiêu
số tiền mua hàng tối đa 1 lần số tiền trả góp số tiền trả góp
Trang 23số tiền mặt tiêu dùng số tiền mặt tiêu dùng số tiền mặt tiêu dùng
Trang 24Một số chỉ số cập nhật
tần suất mua hàng tần suất cập nhật số dư tần suất mua hàng trả góp
Trang 25giới hạn thẻ số tiền thanh toán tối thiểu số tiền thanh toán tối thiểu
Trang 26Nhóm 2: Tốt
Nhóm 1: Khá
Nhóm 0: Trung bình
Nhận xét chung
Trang 27Xin cảm ơn!!!