Lê Chí Ngọc DỰ ĐOÁN PHẢN HỒI CỦA KHÁCH HÀNG VỚI CHIẾN DỊCH TIẾP THỊ QUA ĐIỆN THOẠI... - Hiện nay nhiều tổ chức ngân hàng đã áp dụng hình thức telemarketing tiếp thị qua điện thoại để qu
Trang 1HỆ HỖ TRỢ QUYẾT ĐỊNH
Giảng viên hướng dẫn: TS Lê Chí Ngọc
DỰ ĐOÁN PHẢN HỒI CỦA KHÁCH HÀNG VỚI CHIẾN
DỊCH TIẾP THỊ QUA ĐIỆN THOẠI
Trang 2Điều tra, khảo sát
Dữ liệu thực nghiệm
Bài toán và mô hình
Kết quả và chương trình
MỤC LỤC
Trang 3Điều tra, khảo sát
Hiện trạng
- Hiện nay nhiều tổ chức ngân hàng đã áp dụng hình thức telemarketing (tiếp thị qua điện thoại) để quảng cáo trực tiếp sản phẩm của mình cho khách hàng
Trang 4Điều tra, khảo sát
Vấn đề đặt ra
Việc chi tiêu cho việc tiếp thị trực tiếp của các ngân hàng rất lớn
Trang 5Điều tra, khảo sát
Giải pháp
• Việc xây dựng mô hình dự đoán giúp ngân hàng tăng thông tin về khách hàng của mình,
dự đoán phản ứng của khách hàng với chiến dịch tiếp thị qua điện thoại.
Trang 6Dữ liệu thực nghiệm
Dữ liệu sử dụng được lấy bộ dữ liệu liên quan đến các chiến dịch tiếp thị của một tổ chức ngân hàng ở Bồ Đào Nha Các chiến dịch này được thực hiện qua các cuộc gọi điện thoại
Mục đích của chiến dịch là tiếp thị khách hàng đăng ký gửi tiền có kỳ hạn.
Trang 7Dữ liệu thực nghiệm
Một số bản ghi của bộ dữ liệu:
Trang 8Bài toán và mô hình áp dụng
Bài toán
- Bài toán sử dụng trong đề tài là bài toán phân loại nhị phân có giám sát:
+ Đầu vào: Các giá trị về thuộc tính của khách hàng gồm: tuổi; nghề nghiệp; tình trạng hôn nhân; học vấn; có nợ xấu hay không; số dư tài khoản trung bình hằng năm; có khoản vay nhà ở hay không; có khoản vay các nhân hay không; loại liên lạc; tháng, thời lượng lần liên lạc gần nhất; số lần
đã liên lạc trong đợt tiếp thị này; số ngày kể từ lần cuối liên lạc của đợt tiếp thị trước; số lần đã liên lạc trong đợt tiếp thị trước; kết quả của đợt tiếp thị trước
+ Đầu ra: Xác suất khách hàng đồng ý gửi tiền có kỳ hạn (giá trị thuộc khoảng (0, 1))
Trang 9Bài toán và mô hình áp dụng
Mô hình áp dụng
- Mô hình Hồi quy Logistic (Logistic Regression)
+ Sử dụng hàm sigmoid để phân lớp:
z =
s = wTX
+ Vector thuộc tính:
X = (x1, x2,…, xn)T
+ Vector hệ số của mô hình:
w = (w1, w2,…, wn)T
- Đầu ra là xác suất đối tượng được phân vào 1 trong 2 lớp:
ŷ = P(y = 1 | X, w) = f(s)
Trang 10Bài toán và mô hình áp dụng
Tính chất của mô hình Hồi quy Logistic
- Được sử dụng nhiều cho bài toán phân lớp
- Sau khi xây dựng mô hình, việc xác định lớp cho mỗi điểm dữ liệu được thực hiện bằng cách so sánh 2 xác suất P (y = 1 | X, w) và P (y = 0 | X,
w)
+ Nếu P (y = 1 | X, w) > P (y = 0 | X, w) thì điểm dữ liệu được phân vào lớp 1
+ Nếu P (y = 1 | X, w) < P (y = 0 | X, w) thì điểm dữ liệu được phân vào lớp 0
- Do P (y = 1 | X, w) + P (y = 0 | X, w) = 1 nên việc so sánh 2 xác suất sẽ đưa về việc so sánh một trong hai xác suất với 0.5:
+ Nếu P (y = 1 | X, w) > 0.5 thì điểm dữ liệu được phân vào lớp 1
+ Nếu P (y = 1 | X, w) < 0.5 thì điểm dữ liệu được phân vào lớp 0
Trang 11Kết quả
Accuracy.
Accuracy của mô hình:
Tổng các điểm dữ liệu được đoán đúng
Tổng các điểm dữ liệu ( = 0.8943231441048035)
Confusion matrix
Trang 12Kết quả
Precision - Recall.
Precision:
Số dữ liệu hệ đoán đúng
Số dữ liệu hệ đoán Recall:
Số dữ liệu hệ đoán đúng
Số dữ liệu thực sự đúng Đánh giá mô hình:
Trang 13Chương trình
Dự đoán phản hồi.
Trang 14Chương trình
Biểu đồ
Trang 15Chương trình
Biểu đồ