Điều này dẫn đến việc ngân hàng khó có thể: ® Xác định chính xác khách hàng tiềm năng: Việc thiếu một bức tranh toàn diện về khách hàng khiến ngân hàng khó khăn trong việc phân biệt nhữn
Trang 1TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
CƠ SỞ II TẠI THÀNH PHỎ HỎ CHÍ MINH
BAO CAO GIỮA KỲ
PHAN TÍCH NGHIỆP VỤ CHO VAY
CUA MOT NGAN HANG THUONG MAI TAI SEC
DUA THEO BO DU LIEU BERKA
Giảng viên: Đào Quốc Phương
Mã lớp: ML142
Nhom 8: Tran Thi Lan
Dao Ngoc Diém Quynh
Dang Thi Minh Thu V6 Thuy Linh
Lê Hoàng Tâm Nhi
TP.HCM, tháng 09 năm 2024
Trang 2
DANH SÁCH THÀNH VIÊN
STT HO VA TEN MSSV PHAN CONG NHIEM VU Tran Thi Lan 2211315013
Mô tả nghiệp vụ bảng 3, 5, 7 Trực quan hóa dữ liệu bằng PowerBI
Đào Ngọc Diễm Quỳnh 2211315019
Mô tả nghiệp vụ bảng 2, 6, 8 Phân tích dữ liệu nghiệp vụ 1, 4, 5,9
Dang Thi Minh Thu 2211315021
Mô hình ý niệm và mô hình logic
Trang 3
MỤC LỤC
CHƯƠNG I: GIỚI THIỆU NGHIỆP VỤ 2- 52 ©522S+SEESEESEEEEESEEEEEeEkerrrrrrervre 1
1 Tổng quan dự án 22-5252 +2x‡2E 231221211 2112211211221211211111211211111211.21111 11.1 me 1
2 Muc ti6u CUa GU AN na 2
3 Cac cdng cu duoc sty Mung eee ccececesseseeeceeeceeeenssnesneseecsaecseeceeeeneeaeenennecaeenaeeneeeneess 2
CHUGONG 2: MO HINH CO SO DU LIEU, eesssseessssseesssssneeessseteeessnteesssntessesntecessneeesssneeessness 3
1 M6 ta y niém va m6 hit Logic cố 3
2 Mô tả nghiệp vụ từng bang dữ lIỆU - 5 5 5 33 9 nh nh HH nh ng kg 6
A ACCOUNL A eee ố 6
BD Client .ố 7
C DISPOSITION eee cece eseecenceeseeceeeecesneecsceceaceeseccsueessaeceueeecsseseneesuceseneceaaeecseeseaeeetseeeaeees 8
d Permanent order (debits only) 00.0 ees cecceecceseeccenceeseecenceessuesenceesuceseeeceaceesseeseneeetaeeeneees 9
SN on 10
fo LOAM 12
Ø CT€CIIT CAFC GQ- Gv 14 I0) v88 or) in 15
CHƯƠNG 3: PHÂN TÍCH DỮ LIỆU -22£©225++22E+++EEEkkvrtttrkrrtrtrkrrrtrrkerriie 16
1 Diém oi 00 8n 6n (A.H,.H 16
2 Marketing mục tiêu cho nhóm khách hàng có thu nhập CaO: . 25 252 ssesse2 18
3 Phân tích danh mục CO VâyV: 5 + HH HH nh Thư ch 20
Ho, ca 6o cố 6 e 22
5 Tối ưu hóa phê duyệt khoản vay: 2+ ©2252 S5222+‡EE2EESEEEEE 2E EEEEEEEEEEEerrrrree 23
6 Cơ hội bán chéo (Cross-Selling) và bán thêm (Upselling): -« «-<« 25
Trang 47 Tác động của những thay đôi kinh tế - xã hội đến tình trạng vỡ nợ: .- 27
8 Phân tích Giá trị vòng đời khách hàng (Customer Lifetrme Value - CLN): 28
9 Phân loại rủi ro theo khu vực địa ý: .- SĂ Sàn HH HT TH TH TH KH nh He 30
10 Phân khúc khách hàng đề thực hiện chiến lược THaTk€fITE: 5-55 S< se seesxee 32
CHƯƠNG 4: CÁC BẢO CÁO TRỰC QUAN HÓA DỮ LIỆU -5- 5552 5525s 35
1 Cách thức hoạt động của PowerBÌ: - cv HH TH HH HH HH HH re 35 a Đọc yêu cầu và chuẩn bị câu chuyện người dùng (User Sfory) -5-55- 35
b Xác định các bảng cần thiẾt - 5256-5252 SCx2 E21 22112112112211211E 21.211.111 11eci ce 36
c Kết nối đến các chế độ xem trong Power Query -:-cscccccccccxetxrsrerrrererrrres 36
d Chuyên đổi dữ liệu trong Power Query và Mô hình hóa dữ liệu . . - 36
e Tao cac ii l0 n ố .ằ 36
f Truc quan hóa dữ liệu (Data V1suaÌ1ZzafIOT)) - - s5 + se ng ng no 36
2 Trực quan hóa đữ lIỆU: - -Ă Gà 1S TH TH TT HT TH HH HH HH TH HH tre 37 a Tổng quan tình hình hoạt động: 2-22 2552 +SE+SE£SEE+EEEEEEEEEEEEEEEEEEEEEkerkrrrrerrrrei 37
DU 01 0.0 8n 6 “X4d|AgH 39
c Phan tich theo khach hang? 1n 42
d Phan tich theo khu vurc dia ly: oo cece ccecececeseeeceseesseessecenecseeceecaeeaceseeceeeseeceeeeneeeneeeass 44 I5I00000 Ố.ỐỐ 45
' W0 c0 e0 45
1 Hỗ trợ brainstorm ý tưởng -:-+©52 5+ St St St #22 xEExE11111111 112111111 45
2 Hỗ trợ tôi ưu code SQLL +2 5< S<< SE SESE1E211211212211111111111111 0111101111 Ex xe 46
3 HG trợ lý giải kết quả báo cáo ¿s55 5c St 2t 23x 21221121121121121111 1111111111 47
4 Tableau Public hé tro phân tích và trực quan hóa dữ liệu 2 2 5+ 55+: 48
0000969070 50
Trang 5CHƯƠNG 1: GIỚI THIỆU NGHIỆP VỤ
1 Tổng quan dự án
Day là bộ dữ liệu tập hợp thông tin tài chính từ một ngân hàng Séc Ngân hàng cung cấp nhiều dịch vụ như chuyên tiền, rút tiền, gửi tiền, cho vay, phát hành thẻ, Trong phạm
vi bài báo cáo này, nhóm tập trung vào nghiệp vụ cho vay của ngân hàng
Hiện nay, ngân hàng đang đối mặt với thách thức lớn trong việc hiểu sâu sắc về hành vi và nhu cầu đa dạng của từng khách hàng Mặc dù đã thu thập được một lượng lớn
dữ liệu từ khách hàng hiện tại bao gồm các thông tin giao dịch, hồ sơ tín dụng, thông tin nhân khẩu học nhưng ngân hàng vẫn chưa tận dụng tôi đa nguồn dữ liệu quý giá này Điều này dẫn đến việc ngân hàng khó có thể:
® Xác định chính xác khách hàng tiềm năng: Việc thiếu một bức tranh toàn diện về khách hàng khiến ngân hàng khó khăn trong việc phân biệt những khách hàng có khả năng sử dụng các sản phâm và dịch vụ mới
e© Dánh giá chính xác rủi ro tín dụng: Việc không thể phân biệt khách hàng tốt và khách hàng có rủi ro cao khiến ngân hàng dễ mắc phải những quyết định cho vay sai lầm, dẫn đến tăng tỷ lệ nợ xấu và gây tốn thất cho ngân hàng
e Cá nhân hóa trải nghiệm khách hàng một cách hiệu quả: Việc thiếu các phân tích sâu về hành vi khách hàng khiến ngân hàng khó có thể cung cấp những sản
pham, dịch vụ và ưu đãi phủ hợp với từng đối tượng khách hàng, dẫn đến giảm lòng
trung thành và sự hài lòng của khách hàng
Vì vậy, việc xây dựng một hệ thong co sé dữ liệu mới quản lý thông tin và dự đoán hành vi của khách hàng là vô cùng cần thiết đề giúp ngân hàng giải quyết những vấn đề khó khăn đang gặp phải
Trang 62 Mục tiêu của dự án
Dự án nhằm xây dựng một hệ thông cơ sở dữ liệu tối ưu và ứng dụng các phương pháp phân tích dữ liệu hiện đại để giúp ngân hàng thương mại tối ưu hóa việc quản lý và khai thác dữ liệu khách hàng Cụ thé, dự án hướng đến các mục tiêu sau:
Hiểu rõ hành vi và nhu cầu khách hàng: Tận dụng dữ liệu hiện có từ các giao dịch, hồ sơ tín dụng và thông tin nhân khâu học đề xây dựng bức tranh toàn diện về từng khách hàng, từ đó nâng cao khả năng thấu hiểu và dự đoán hành vi của họ Xác định khách hàng tiềm năng: Sử dụng các công cụ phân tích để phân biệt rõ ràng những khách hàng có tiềm năng cao cho việc sử dụng các sản phẩm và dịch vụ mới của ngân hàng, tối ưu hóa chiến lược tiếp cận và phát triên khách hàng Đánh giá rủi ro tín dụng chính xác: Áp dụng các mô hình dự đoán rủi ro nhằm phân loại khách hàng theo mức độ rủi ro tín dụng, giúp giảm thiểu các quyết định cho vay sai lầm và kiêm soát tốt hơn tỷ lệ nợ xấu
Cá nhân hóa trải nghiệm khách hàng: Phân tích hành vị và sở thích của khách hàng đề đề xuất các sản phẩm, dịch vụ và ưu đãi phù hợp, từ đó nâng cao sự hài lòng, lòng trung thành và tôi ưu hóa mối quan hệ giữa ngân hàng với khách hàng Các công cụ được sử dụng,
Để giải quyết các thách thức mà ngân hàng đang gặp phải, việc lựa chọn và sử dụng các công cụ phân tích dữ liệu phù hợp là vô cùng quan trọng, nhóm đề xuất xử lý van dé dựa trên các công nghệ sau:
Hệ quản trị cơ sở dữ liệu (DBMS): Sử dụng một hệ quản trị cơ sở dữ liệu mạnh
mẽ và tin cậy như Microsoft SQL Server hoặc MySQL để lưu trữ, quản lý và truy
xuất dữ liệu khách hàng một cách hiệu quả
Công cụ Business Intelligence (BI): Sử dụng một công cụ BI như PowerBI đề trực quan hóa dữ liệu, tạo báo cáo, phân tích xu hướng và hỗ trợ ra quyết định
Trang 7Đề khai thác tôi đa giá trị từ lượng dữ liệu không lồ, chúng ta sẽ thực hiện một quy trình phân tích bao gồm các bước sau: Thu thập dữ liệu từ các hệ thống khác nhau và tích
hợp vào một kho dữ liệu trung tâm Tiếp theo, dữ liệu sẽ được làm sạch và chuẩn hóa đề
đảm bảo chất lượng và độ tin cậy Chúng ta có thể sử dụng các công cụ để dự đoán những hành vi và rủi ro của khách hàng trong tương lai Cuối cùng, kết quả phân tích sẽ được trực quan hóa bằng các công cụ BI, giúp các nhà quản lý dễ dàng hiểu và đưa ra các quyết định kinh doanh sáng suốt, từ đó nâng cao hiệu quả hoạt động và tăng cường khả năng cạnh tranh của ngân hàng
CHƯƠNG 2: MÔ HÌNH CƠ SỞ DỮ LIỆU
1 M6 ta y niệm và mô hình logic
Với mục tiêu xây dựng một hệ thông quản lý thông tin và dự đoán hành vi của khách hàng dựa trên các dữ liệu thu thập được trong quá khứ, thông qua quá trình khảo sát và sàng lọc đã chọn ra các trường dữ liệu quan trọng và có liên quan đến nghiệp vụ: + account: đặc điểm của tài khoản
+ client: đặc điểm của khách hàng
+ disposition: quyền của khách hàng đề vận hành tài khoản
+ permanent order: dic điểm của lệnh thanh toán
+ transaction: giao dich trén tai khoản
+ loan: khoản vay được cấp cho tài khoản nhất định
+ credit card: tin dụng được cap cho tai khoan nhat dinh
+ district demographic: dic diém nhan khau hoc cia mét quan
Trang 8|"Permanent order | PK | trans _id 7 Credit card
Loan | TK | account_id date 5 isposition | FK | disp_id
K | loan id type disp_id
A2 Al3 Al4 Als Ai6
Các mỗi quan hệ thuộc tính:
+ Account - Loan (1-n): Một tài khoản được vay nhiều khoản vay hoặc không có khoảng vay nào và mỗi khoản vay phải và chỉ phát sinh từ một tài khoản Account - Permanent order (1-n): Một tài khoản có thể thực hiện nhiều lệnh thanh toán hoặc không có lệnh nào và mỗi lệnh thanh toán phải và chỉ phát sinh từ một tài khoản
Account - Transaction (1-n): M6t tai khoản thực hiện nhiéu giao dich hoặc không
có giao dịch nào và mỗi giao dịch phải và chi phat sinh từ một tài khoản Account - Disposition (1-n): Mỗi tài khoản được cấp quyền một hoặc nhiều lần để vận hành tài khoản và môi lân câp quyên phải và chỉ được thực hiện trên một tài khoản
Trang 9Credit card - Disposition (1-n): Mỗi thẻ tín dụng được cấp quyền nhiều lần để vận hành tài khoản hoặc không có lần nào và mỗi lần cấp quyên phải và chỉ được thực hiện trên một thẻ tín dụng
Client - Disposition (1-1): Mỗi khách hàng chỉ được cấp quyền một lần để vận hành tài khoản và mỗi lần cấp quyền chỉ được thực hiện trên một khách hàng
District_Demographic - Client (1-n): Mỗi quận có một hoặc nhiều khách hàng và
mỗi khách hàng chỉ đến từ một quận
District_Demographic - Account (1-n): Mỗi quận có một hoặc nhiều tài khoản và
mỗi tài khoản chỉ đến từ một quận
Mô hình logic:
Khoa chinh (Primary Key)
Khoa ngoai (Foreign Key)
Account (account_id, district_id, date, frequency)
Client (client_id, birth_number, district_id)
Disposition (disp_id, client_id, account_id, type)
Permanent order (order_id, account_id, bank_to, account_to, amount, k_symbol)
Transaction (trans_id, account_id, date, type, operation, amount, balance, k_symbol, bank, account)
Loan (loan_id, account_id, date, amount, duration, payments, status)
Credit card (card_id, disp_id, type, issued)
District_Demographic (Al, A2, A3, A4, A5, A6, A7, A8, A9, Al0, All, Al2, Al13,A14, A15, A16)
Trang 102 Mô tả nghiệp vụ từng bảng dữ liệu
account_id int Mã duy nhất cho mỗi tai khoản
district_id int Dia chi của khách hàng
date int Ngày cấp khoản vay
frequency text Tần suất phát hành báo cáo
+ "POPLATEK MESICNE" la viết tất
cua phat hanh hang thang
+ "POPLATEK TYDNE" la viét tắt của phat hanh hang tuan
+ "POPLATEK PO OBRATU" la viét tat
cua phat hanh sau giao dich
Dữ liệu Account có thể được sử dụng cho nhiều mục đích khác nhau, bao gồm:
- _ Xác định nhóm khách hàng: Dựa vào địa chi (district ¡d), tần suất phát hành báo cao (frequency), có thể phân nhóm khách hàng đề đưa ra các chiến lược tiếp thị và chăm sóc khách hàng phủ hợp
- _ Dự đoán khả năng trả nợ: Bằng cách phân tích lịch sử giao dịch (dựa trên date và frequency), co thé xây dựng các mô hình dự đoán khả năng trả nợ của khách hàng,
từ đó đánh giá rủi ro tín dụng
Trang 11- - Đánh giá rủi ro tín dụng: Như đã đề cập ở trên, đữ liệu Account giúp xây dựng các mô hình đánh giá rủi ro tín dụng, từ đó đưa ra quyết định cho vay hợp lý
Trường dữ liệu Loại dữ liệu Mô tả
client_id int Mã duy nhất cho mỗi khách hàng
birth_number int Ngày sinh và giới tính của khách hàng
Dinh dang ngay sinh la YY MMDD, trong đó: +YYMMDD cho giới tính Nam
+ YYMM+50DD cho giới tính Nữ
district_id int Dia chi cua khach hang
Dữ liệu Client có thê được sử dụng cho nhiều mục đích khác nhau, bao gom:
- Quan ly théng tin khach hang: Ma duy nhat ‘client id’ dam bảo mỗi khách hàng trong hệ thống là một thực thể riêng biệt Điều này rất quan trọng đề theo dõi các khoản vay, lịch sử thanh toán và các giao dịch khác của từng khách hàng
- _ Phân khúc thị trường: Thông tin nhân khẩu học còn giúp phân nhóm khách hàng, ngân hàng có thê tạo ra các san pham vay và các chính sách tín dụng phủ hợp với từng nhóm
- - Phân tích rủi ro theo khu vực: Một số khu vực có thê có rủi ro tín dụng cao hơn
(ví dụ: khu vực kinh tế kém phát triển), và việc biết được địa chỉ của khách hàng giúp ngân hàng điều chính các tiêu chí đánh giá
- _ Marketing địa phương: Ngân hàng có thê sử dụng thông tin này để gửi các ưu đãi
và quảng cáo đến các nhóm khách hàng trong khu vực cụ thé
Trang 12disp_id int Mã duy nhất của một khách hàng với một tài khoản
client_id int Mã duy nhất cho mỗi khách hàng
account_id int Mã duy nhất cho mỗi tài khoản
type text Quyền của khách hàng trong vận hành tài khoản
+ Owner: có quyền phát hành lệnh thanh toán
cô định định kỳ và yêu cầu khoản vay
hệ giữa khách hàng và tài khoản Giúp xác định rõ ràng ai là chủ sở hữu tài khoản
và ai chỉ là người sử dụng, giúp ngân hàng cấp quyền thực hiện giao dịch hoặc thay đôi thông tin tài khoản một cách chính xác
Phân tích hành vi khách hàng: Bằng cách phân tích dữ liệu “type', ngân hàng có thê xác định số lượng khách hàng là chủ sở hữu so với người sử dụng của các tài khoản Giúp ngân hàng xác định nhóm khách hàng nào có khả năng thực hiện nhiều giao dịch hơn hoặc có nhu cầu sử dụng các dịch vụ tài chính cao hơn
Kiểm soat va bao mat: Dit liéu ‘account id’ va ‘client id’ lién kết khách hàng với tài khoản cụ thê, giúp ngân hàng theo dõi và kiểm soát truy cập vào tài khoản
Trang 13d Permanent order (debits only)
account_id int Mã duy nhất cho mỗi tài khoản
bank_to text Ngân hàng của người nhận
Mỗi ngân hàng có mã hai chữ cái duy nhất account_to int Tài khoản của người nhận
amount float Số tiền cho vay
k_symbol text Đặc điểm của khoản thanh toán
+ "POJISTNE" là viết tắt của thanh toán
- _ Phát hiện các khoản thanh toán bất thường: Bằng cách so sánh các khoản thanh
toán hiện tại với lịch sử thanh toán, có thé phat hiện các khoản thanh toán bất thường,
chăng hạn như việc chậm thanh toán
Trang 14Đánh giá hiệu quả của các chiến dịch thu hồi nợ: Dựa vào dữ liệu này, ngân hàng
có thể đánh giá hiệu quả của các chiến dịch thu hồi nợ và điều chỉnh chiến lược cho
phủ hợp
Xây dựng mô hình dự đoán nợ xấu: Thông qua việc phân tích các biến như amount, K_ symbol và lịch sử thanh toán, ngân hàng có thê xây dựng các mô hình
dự đoán khả năng khách hàng trở thành nợ xấu
Cải thiện quy trình thu hồi nợ: Dựa vào dữ liệu về các khoản thanh toán bất thường, ngân hàng có thể xây dựng các quy trình tự động hóa để nhắc nhở khách hàng thanh toán hoặc chuyển các khoản nợ khó thu cho các công ty thu hồi nợ chuyên nghiệp
Xác định khách hàng tiềm năng: Dựa vào dữ liệu về các khoản thanh toán, ngân hàng có thê xác định các khách hàng có khả năng cao sẽ sử dụng các sản phẩm và
dịch vụ khác của ngân hàng, từ đó triển khai các chiến dịch tiếp thị phù hợp
Cá nhân hóa sản phẩm: Bằng cách phân tích hành vi thanh toán của từng khách hàng, ngân hàng có thể đưa ra các đề xuất sản phẩm và dịch vụ phù hợp với nhu cầu
trans_id int Ma duy nhất cho một giao dịch trên một tài khoản
account_id int Mã duy nhất cho mỗi tài khoản
date int Ngày giao dịch
type text Kiéu giao dich + “PRIJEM” là viết tắt của tín dụng
10
Trang 15"VYBER KARTOU" rút tiền bằng thẻ tín dụng
"VKLAD" tín dụng bằng tiền mặt
"PREVOD Z.UC TU” nhận tử ngân hàng khác
"VYBER" rut tiền mặt
"PREVOD NA UCET" chuyên tiền sang ngân
Đặc điểm của khoản giao dịch
hiểm
“SLUZBY” là viết tắt của thanh toán cho sao
kê
“UROK” là viết tắt của lãi suất được ghi có
"SANKC UROK" là viết tắt của lãi suất phạt
nếu sô dư âm
"SIPO" là viết tắt của thanh toán hộ gia đình
“DUCHOD” là viết tắt của lương hưu
"UVER" là viết tắt của thanh toán cho vay
11
Trang 16bank text Ngân hàng đối tác
Mỗi ngân hàng có mã hai chữ cái duy nhất
account int Tài khoản của đôi tác
Dữ liệu Transaction có thể được sử dụng cho nhiều mục đích khác nhau, bao gồm:
- _ Quản lý giao dịch tài khoản: Mã duy nhất “trans ¡d” giúp ngân hàng theo dõi từng giao dịch riêng lẻ trên mỗi tài khoản Giúp quản lý và lưu trữ lịch sử giao dịch một cách chính xác, tránh nhằm lẫn hoặc trùng lặp
- _ Phân tích lịch sử giao dịch: Thông qua trường “date', ngân hàng có thể phân tích lịch sử giao dịch của khách hàng, như tần suất giao dịch, thời gian thực hiện giao
dịch nhiều nhất, và mẫu hình giao dịch của khách hàng
- _ Theo dõi số dư tài khoản: Trường “balance' cho biết số dư tài khoản sau mỗi giao dịch Ngân hàng có thể sử dụng thông tin này đề kiêm tra và đảm bảo rằng các giao
dịch đã được thực hiện đúng, đồng thời giúp khách hàng theo dõi số dư tài khoản
cua minh
- Dw bao nhu cau tai chinh cia khách hàng: Bằng cách phân tích xu hướng giao dịch từ các trường như “date”, 'type`, 'amount°, ngân hàng có thê dự báo nhu cầu tài chính của khách hàng trong tương lai, chăng hạn như nhu cầu vay vốn hoặc đầu tư
Trường dữ liệu Loại dữ liệu Mo ta
loan_id int Mã duy nhất cho mỗi hồ sơ vay
account_id int Mã duy nhất cho mỗi tai khoản
date int Ngày cấp khoản vay
12
Trang 17duration int Thời han cho vay
payments float Khoản thanh toán trả nợ hàng tháng
+ 'D'a viét tắt của hợp đồng đang trong thời hạn, khách hàng đang nợ
Dữ liệu Loan có thể được sử dụng cho nhiều mục đích khác nhau, bao gồm:
- - Quản lý và theo dõi khoản vay: Trường dữ liệu ‘loan id’ va ‘account id’ lién két các khoản vay với khách hàng cụ thê, đảm bảo rằng mỗi khoản vay được gán đúng cho tài khoản khách hàng tương ứng
- _ Lập kế hoạch tài chính: Giúp khách hàng và ngân hàng lập kế hoạch tài chính dựa trên các khoản thanh toán hàng tháng
- Phân tích hiệu suất: Đánh giá hiệu suất trả nợ của khách hàng để cải thiện quy trỉnh cho vay và quản lý rủi ro
13
Trang 18g Credit card
Trường dữ liệu Loại dữ liệu M6 ta
card_id int Mã duy nhất cho một thẻ tin dung
disp_id int Mã duy nhất biéu thị liên kết của một tài khoản
mà thẻ thuộc về
Bao gồm các loại thẻ dạng "junior", "classic",
"gold"
issued text Ngày phát hành Dinh dạng ngày phát hành ở dạng YYMMDD
Dữ liệu Credit card có thể được sử dụng cho nhiều mục đích khác nhau, bao gom:
- Quan ly théng tin thé tin dung: Ma duy nhat ‘card id’ dam bao mdi thé tin dung trong hệ thông là một thực thể riêng biệt Điều này rất quan trọng đề theo dõi tình trạng của từng thẻ, bao gồm các giao dịch, hạn mức tín dụng, và lịch sử thanh toán liên quan
- _ Liên kết thẻ tín dụng với tài khoản: Trường “disp ¡p` liên kết thẻ tín dụng với một tài khoản ngân hàng cụ thê, giúp ngân hàng quản lý mối quan hệ giữa tài khoản
và thẻ tín dụng, từ đó có thé dé dàng quản lý các khoản chỉ tiêu, thanh toán và hạn mức tín dụng
- - Cải thiện dịch vụ khách hàng: Thông qua các trường “card_1d” và “disp_ 1d”, ngân hàng có thể xác thực nhanh chóng thông tin về thẻ tín dụng khi xử lý các giao dịch
hoặc yêu cầu từ khách hàng, đảm bảo tính bảo mật và chính xác
14
Trang 19Trường dữ liệu Loại dữ liệu Mô tả
Al = district_id int Mã duy nhất cho mỗi quận
A2 text Tén quan
A3 text Khu vực
A4 int Dân số
AS int Số lượng khu tự quản có dân số < 490,
A6 int Số lượng khu tự quản có dân số từ 500 - 1999 A7 int Số lượng khu tự quản có dân số từ 2000 - 9999, A8 int Số lượng khu tự quản có dân số > 10000 A9 int Số lượng thành phố
ALO float Tỷ lệ dân số thành thị
All int Mức lương trung bình
A12 float Ty lệ thất nghiệp năm 1995,
Al3 float Ty lệ thất nghiệp năm 1996
Al4 int Số lượng doanh nhân trên 1000 người dân
15
Trang 20Al5 int Số lượng tội phạm năm 1995
Đánh giá rủi ro tín dụng dựa trên nhân khẩu học và kinh tế: Sử dụng các chỉ số
nhân khâu học và kinh tế xa héi (‘A10’, ‘ALI’, *A12”, “A13') để đánh giá rủi ro tín
dụng của khách hàng trong từng quận, khu vực
Phân tích thị trường và tôi ưu hóa chiến lược kinh doanh: Sử dụng dữ liệu nhân
khâu học (*A2', ‘A3’, ‘A4’, ‘A14’) dé xac định nhu cầu thị trường và thiết kế các
sản phẩm vay phù hợp
Quản lý rủi ro và tuân thủ quy định: Trường dữ liệu “A15”, “A16” xác định mức
độ rủi ro khi cho vay trong từng khu vực
CHUONG 3: PHAN TICH DU LIEU
1 Diém tin dung khach hang:
Bài toán: Xác định và phân loại khách hàng thành các loại rủi ro tín dụng khác nhau (vi dụ: thấp, trung bình, cao) dựa trên lịch sử trả nợ vay và số dư tài khoản của họ Từ đó, xác
định những đặc điểm ảnh hưởng đến việc xác định rủi ro
16
Trang 21
High Risk Female 40 54.05
High Risk Male 34 45.95 Low Risk Male 375 49.93 Low Risk Female 376 50.07 Medium Risk Female 1 50 Medium Risk Male 1 50
Rui ro trung bình: khách hàng chỉ có một trong hai vấn đề: hoặc số dư tài khoản
âm nhưng không có khoản vay gặp vấn đề, hoặc số dư tài khoản dương nhưng có khoản vay gặp vấn đề
Rủi ro thấp: khách hàng có tình hình tài chính tốt với số dư dương và không có
khoản vay chưa trả hay gặp vấn đề
Phụ nữ chiếm tỷ lệ nhiều hơn một chút trong nhóm rủi ro cao trong khi nhóm rủi ro thấp gần như ngang nhau giữa các giới Điều này có thê cho thấy rằng phụ nữ có thê phải đối mặt với các yêu tổ rủi ro cao hơn hoặc nhiều phụ nữ hơn đang ở trong tình huống tài chính rủi ro cao hơn
Độ tuổi đa dạng, không xác định được khoảng tuôi nhất định cho từng loại rủi ro
Đề xuât:
e_ Chiến lược tín dụng tùy chỉnh: Ngân hàng có thê áp dụng các chiến lược tín dụng khác nhau cho từng nhóm khách hàng rủi ro:
17
Trang 22o Nhóm tủi ro thấp: Cung cấp điều kiện vay ưu đãi hơn (lãi suất thấp, thời hạn
dài) nhằm khuyến khích họ tiếp tục sử dụng các sản phẩm tài chính của ngân hàng
©_ Nhóm tủi ro trung bình: Áp dụng các điều kiện vay thận trọng hơn, yêu cầu đảm bảo tài sản hoặc các gói tín dụng đặc biệt với lãi suất vừa phải
©_ Nhóm rủi ro cao: Hạn chế cho vay hoặc chỉ cung cấp tín dụng dưới hình thức bảo lãnh tai sản để giảm thiểu rủi ro cho ngân hàng
e Chính sách tín dụng dựa trên giới tính: Ngân hàng có thể phát triển các gói tín
dụng dành riêng cho phụ nữ, với các điều kiện vay linh hoạt hơn (lãi suất thấp hơn, thời gian trả góp dài hơn) đề hỗ trợ họ vượt qua những khó khăn về tài chính, đồng thời đảm bảo tỷ lệ nợ xấu giảm
2 Marketing mục tiêu cho nhóm khách hàng có thu nhập cao:
Bài toán: Xác định tiềm năng của nhóm khách hàng có thu nhập cao nhưng không có khoản vay hiện tại hoặc những khách hàng có thu nhập cao và thường xuyên sử dụng các dịch vụ tài chính
18
Trang 23High income with Nc 4 1 40 0 1 0.02
High Income with Nc 70 1 68 0 1 0.92 High Income with Nc 74 1 61 1 0 0.92
Hình 2: Marketing mục tiêu cho nhóm khách hàng có thu nhập cao
Kết luận:
e Tỉ lệ khách hàng: Số lượng khách hàng có thu nhập cao thường xuyên sử dụng dich vu (Frequent Financial User) chiém khoảng 1⁄4 tông số khách hàng của ngân hàng, cụ thể là 27.49% Trong khi đó khách hàng có thu nhập tốt nhưng chưa vay von lan nao (High Income with No Current Loan) chiém tỉ lệ rất nhỏ, chỉ 0.15% trong tong số khách hàng Điều này chứng tỏ lượng khách hàng ngân hàng phục vụ thường xuyên là những người có mức thu nhập trung bình, chưa có nhiều sản phẩm hướng đến đối tượng có mức lương cao
19
Trang 24e©_ Dặc điểm khách hàng: Khách hàng thuộc nhóm Frequent Financial User có độ tuổi trung bình từ 68 đến 76, chủ yếu là người lớn tuổi, và tỷ lệ nam/nữ tương đối cân bằng Khách hàng thuộc nhóm High Income with No Current Loan đều là người có
độ tuổi khá cao (từ 48 đến 84) Nhìn chung, đa số khách hàng có thu nhập cao đều
ở độ tuôi khá cao, hưu trí
e Sự phân bố khách hang: Frequent Financial User phan bé réng rai 6 nhiều quận, với số lượng khách hàng và tỷ lệ phần trăm trong tông số khách hàng khác nhau High Income with No Current Loan có số lượng khách hàng rất nhỏ và không có sự phân bé rong rai
Dé xuat:
e Frequent Financial User là nhóm khách hàng trung thành có tiềm năng lớn Ngân hàng nên tập trung vào việc phát triển sản phẩm và dịch vụ cho nhóm này Có thể
triển khai các chương trình khuyến mãi, ưu đãi đặc biệt, chương trình hậu mãi tri ân
khách hàng hoặc dịch vụ khách hàng cao cấp đề giữ chân khách hàng và khuyến khích họ sử dụng dịch vụ cho vay
® Mặc dù High Income with No Current Loan chiém ty 1é rất nhỏ, đây là nhóm khách hàng có thu nhập cao và có khả năng vay vốn lớn Ngân hàng nên có những chiến lược đặc biệt để tiếp cận và thuyết phục nhóm này, như cung cấp các sản phâm vay ưu tiên hoặc ưu đãi cho khách hàng mới
® Ngoài ra, ngân hàng có thể phân tích thêm để hiểu nhu cầu và thói quen tài chính của nhóm tuôi khá cao các nhóm khách hàng này, từ đó thiết kế các sản phẩm vay phù hợp với đặc điểm và nhu cầu của họ, cũng như nghiên cứu các khu vực có tỷ lệ khách hàng cao để mở rộng hoạt động marketing và phát triển dich vu
3 Phan tich danh muc cho vay:
Bài toán: Phân tích hiệu suất danh mục cho vay của ngân hàng trên các khu vực và phân khúc khách hàng khác nhau thông qua tỷ lệ thành công và tỷ lệ vỡ nợ theo các nhóm khu vực khác nhau Từ đó, xác định các yếu tô ảnh hưởng đến hiệu suất cho vay
20
Trang 25®_ Tỉ lệ nợ xấu trung bình trên toàn hệ thống ngân hàng là 15%, nhưng có những khu vực tỉ lệ này cao bất thường, xap xi 30%
®_ Độ tuôi trung bình của khách hàng vay trên toàn vùng là khoảng 39-44 tuôi, với sự phân bồ giới tính tương đối cân bằng ở hầu hết các vùng, ngoại trừ east Bohemia
có tỷ lệ nữ khách hàng thấp hơn, west Bohemia có tỷ lệ khách hàng nữ cao hơn
Đề xuất:
e© Tăng cường kiểm soát rủi ro và quản lý nợ xấu:
©_ Tập trung vào việc cải thiện quy trình đánh giá tín dụng và quản lý rủi ro tại các vùng có tý lệ nợ xấu cao Cân nhắc việc tăng cường các biện pháp đảm
bảo vay hoặc yêu cầu thông tin tài chính chi tiết hơn từ khách hàng để giảm
thiểu rủi ro nợ xấu
©_ Ngân hàng có thê triển khai các chương trình hỗ trợ tài chính hoặc tư vẫn quản lý tài chính đề giúp khách hàng cải thiện tình hình tài chính và duy trì khả năng thanh toán
e©_ Dánh giá lại chiến lược cho vay tại các vùng: Xem xét điều chỉnh các chiến lược cho vay cho các vùng có tổng số khoản vay thấp Bên cạnh đó, cần tập trung vào
21
Trang 26các vùng có tý lệ thành công cao Có thê xem xét việc tăng cường quảng bá các sản phẩm vay và dịch vụ tài chính tại các vùng này
e© Tối ưu hóa sản phẩm vay dựa trên nhu cầu khách hàng: Dựa trên dữ liệu độ tuổi khách hàng và giới tính, ngân hàng có thê cân nhắc phát triển các sản phẩm vay phù hợp với nhu cầu cụ thê của các nhóm khách hàng khác nhau
4 Theo dõi việc trả nợ vay:
Bài toán: Theo dõi và cải thiện ty lệ hoàn trả khoản vay, xác định những khách hàng thường xuyên thanh toán trễ hoặc không thanh toán Từ đó, xây dựng các chiến lược dé cai thiện tý lệ hoàn trả, chăng hạn nhự nhắc nhở tự động hoặc đàm phán lại các kế hoạch thanh toán
account_id missed_count late_count risk_level recommended_mea: future_loan_plan
2 42 0 High Risk payment plan reneg: high rate, short durat
19 22 0 Medium Risk auto reminder dightly higher rate, s
25 3 0 Low Risk NULL lower rate, other ince
38 1 0 Low Risk NULL lower rate, other ince
Hinh 4: Theo dõi việc trả nợ vay và đề xuất giải pháp
Kết luận:
e© Rủúi ro cao: khách hàng bỏ lỡ nhiều hơn 30 lần thanh toán hoặc có khoản vay bị trễ
ngày đáo hạn trên l0 ngày
e© Rủi ro trung bình: khách hàng bỏ lỡ từ 11 đến 30 lần thanh toán hoặc có khoản
vay bị trễ ngày đáo hạn không quá 10 ngày
e© Rủi ro thấp: khách hàng bỏ lỡ từ I đến 10 lần thanh toán và không thanh toán trễ
ngày đáo hạn
e Tat ca các tài khoan déu cé ‘late count’ là 0, mặc dù có những khoản thanh toán bị nhỡ, nhưng không có khoản nào thanh toán trễ
22
Trang 27va Medium risk
De xuat:
®_ Một số phương pháp giúp cải thiện tình hình thanh toán:
© High risk: đàm phán lại lịch thanh toán (cung cấp các tùy chọn thanh toán linh hoạt hoặc gia hạn thời hạn nêu cần) và đưa vào hệ thống nhắc nhở thanh toán tự động
Medium risk: đưa vào hệ thống nhắc nhở thanh toán tự động
Cải thiện hệ thống theo dõi lịch trình thanh toán nợ của khách hàng, kịp thời nhắc nhở khi quá hạn thanh toán từ 4 ngày trở lên
e®_ Điều chỉnh kế hoạch cho vay tương lai cho các khách hàng có rủi ro trong việc thanh toán:
© High risk: lãi suất cao hơn, thời hạn vay ngắn, yêu cầu có tai san thé chap cho khoản vay và phải theo dõi lịch thanh toán chặt chẽ Xét duyệt kỹ hơn
và áp dụng các biện pháp theo dõi đặc biệt, nhắc nhở thường xuyên hoặc cân nhắc không tiếp tục cho vay nếu rủi ro quá cao
Medium risk: ap dung 1a suat cho vay cao hơn một chút, theo dõi lịch thanh
toán và có thê cung cấp dịch vụ tư vấn tài chính đề đề xuất lịch thanh toán
linh hoạt hỗ trợ khách hàng trả nợ đúng hạn
Low risk: áp dụng một số ưu đãi như giảm lãi suất hoặc tặng quà nếu khách
hàng thanh toán đúng hạn để khuyến khích khách hàng tiếp tục thanh toán đúng hạn, đầy đủ
5 Tối ưu hóa phê duyệt khoản vay:
Bài toán: Tối ưu hóa quy trình phê duyệt khoản vay bằng cách xác định các yếu tổ (ví dụ: mức thu nhập, tình trạng việc làm, lịch sử tín dụng) tương quan với việc hoàn trả khoản vay thành công Sử dụng những yếu tổ này đề tỉnh chỉnh các tiêu chí phê duyệt khoản vay
23
Trang 28® Tổng số khoản vay thành công là 751, trong khi số khoản vay không thành công là
76, điều này nhân mạnh rằng một tỷ lệ tương đôi nhỏ các khoản vay vỡ nợ
e Các yếu tô chính ảnh hưởng đến khả năng hoàn trả thành công khoản vay: loan amount (số tiền vay), loan payment (khoản thanh toán nợ/lần)
©_ Việc phê duyệt các khoản vay lớn làm tăng nguy cơ vỡ nợ
©_ Số tiền thanh toán lớn hơn có tỷ lệ vỡ nợ cao hơn
® Ngoài ra có các yếu tô về khu vực:
e Mức lương trung bình: Khách hàng từ các quận có thu nhập cao hơn có nhiều khả năng trả nợ thành công hơn
Trang 29o_ Tỷ lệ thất nghiệp: Tỷ lệ tăng trưởng thất nghiệp trung bình cao hơn một chút đối với các khoản vay thành công (27,14%) so với các khoản vay không
thành công (24,86%) Tuy nhiên, đối với các khoản vay thành công, tỷ lệ thất
nghiệp có sự giảm xuống nhiều hơn (-6,07%) so với các khoản vay không thành công (-0,34%) Mặc dù các quận có tỷ lệ tăng trưởng thất nghiệp cao vẫn có các khoản vay thành công, nhưng sẽ an toàn hơn nếu ưu tiên các quận
có tỷ lệ thất nghiệp đang giảm hoặc ôn định
o Ty lệ tội phạm: Tỷ lệ tăng trưởng tội phạm trung bình tương tự giữa các khoản vay thành công (4,71%) và không thành công (3,82%), nhưng các khoản vay thành công có xu hướng xảy ra ở các quận có tỷ lệ tăng trưởng tội phạm thấp hon (-24,87% min_crime_growth_rate)
Đề xuất: Đề tôi ưu hóa tiêu chí phê duyệt các khoản vay:
6
Áp dụng các tiêu chí chặt chế hơn đối với các khoản vay lớn hơn hoặc giới hạn mức
cho vay đối với một sô hồ sơ nhất định dé giảm thiêu rủi ro, đồng thời chú trọng
hơn vào thu nhập của khách hàng
Cung cấp các kế hoạch trả nợ linh hoạt hoặc các khoản thanh toán hàng tháng nhỏ hơn
Ưu tiên những người nộp đơn từ các khu vực có mức lương cao có thê làm giảm nguy co vo ng
Thời hạn vay ngắn hơn có thể an toàn hơn, đặc biệt đối với những khách hàng có
Tủi ro cao hơn
Cần tính đến rủi ro cấp quận (tỷ lệ thất nghiệp và tội phạm tăng) đặc biệt đối với các
khoản vay lớn hơn
Cơ hội bán chéo (Cross-Selling) và bán thêm (Ủpselling):
Bài toán: Xác định lịch sử thanh toán và số dư tài khoản của khách hàng, phân loại các nhóm khách hàng có thể quan tâm đến các sản phẩm khác của ngân hàng Từ đó, tập trung
25
Trang 30chào bán sản phâm phù hợp với từng nhóm nhằm tăng doanh thu bán hàng và cung cấp dịch vụ
account_id insurance_offer household_offer investment_offer credit_card_offer
2 NULL Offer home improver NULL Offer credit card
2 NULL Offer home improver NULL Offer credit card
9 NULL NULL NULL Offer credit card
15 NULL Offer home improver NULL Offer credit card
18 NULL NULL Offer investment proc Offer credit card
23 NULL Offer home improver Offer investment proc Offer credit card
26 NULL Offer home improver NULL Offer credit card
27 NULL Offer home improver NULL Offer credit card
33 NULL Offer home improver Offer investment proc NULL
Hinh 6: Co héi ban chéo (Cross-Selling) va ban thém (Upselling)
Kết luận:
e_ 615 khách hàng đã từng thanh toán bảo hiểm
e 3999 khach hang đã từng thanh toán hộ gia đình
e 1111 khách hàng có số dư trung bình của khách hàng > 50.000
Trang 31e©_ Trong dài hạn: Khai thác thêm những khách hàng tiềm năng chưa mua bảo hiểm Trong ngắn hạn không tập trung đây mạnh vì việc làm này đòi hỏi phải giáo dục (educate) thị trường, điều này được xem là một thách thức lớn
7 Tác động của những thay đổi kinh tế - xã hội đến tình trạng vỡ nợ:
Bài toán: Đánh giá cách những thay đổi trong các chỉ sô kinh tế - xã hội (ví dụ: tỷ lệ thất
nghiệp, mức lương trung bình, tý lệ tội phạm) ảnh hưởng đến tình trạng vỡ nợ
Hình 7: lác động của các yếu tô kinh tế - xã hội đến tỷ lệ võ nợ
e© Những khu vực giàu có hơn với mức lương trung bình cao hơn thường có rủi ro
vỡ nợ thấp hơn và ngược lại
Đề xuất:
® Đưa ra lãi suất điều chỉnh theo rủi ro: Người vay ở những quận có nguy cơ cao
sẽ phải chịu lãi suất cao hơn một chút đê bù đắp cho rủi ro vỡ nợ gia tang Dua ra các ưu đãi như giảm lãi suât hoặc giảm gia cho người vay ở các quận có mức độ rủi
27
Trang 32ro thấp để khuyến khích việc vay có trách nhiệm và giữ chân những khách hang
trung thành
®_ Đa dạng hóa các hình thức cho vay: Đối với các quận có rủi ro vỡ nợ cao, cung cấp các khoản vay vi mô hoặc các khoản vay ngắn hạn thay vì các khoản vay lớn, dài hạn Thực hiện cơ cấu trả nợ linh hoạt cho người vay ở các vùng kinh tế có nhiều biến động như cho phép người vay điều chỉnh lịch trả nợ dựa trên những thay đổi trong hoàn cảnh kinh tế của họ (ví dụ: tạm thời giảm các khoản thanh toán trong
thời gian thất nghiệp)
® Giám sát hành vi của người vay sau khi phê duyệt khoản vay: Thực hiện giám sát thường xuyên hành vi của người đi vay (ví dụ: thay đôi lương đột ngột, tăng chi tiêu) và đưa ra các biện pháp can thiệp kịp thời (ví dụ: đưa ra các phương an tai cap vốn hoặc tư vấn tài chính) cho những người có dấu hiệu căng thẳng về tài chính trước khi họ vỡ nợ
8 Phan tich Gia tri vong doi khach hang (Customer Lifetime Value - CLV): Bài toán: Tính CLV bằng cách phân tích số lượng và tần suất giao dich, các khoản trả nợ vay và việc sử dụng thẻ tín dụng Từ đó, đưa ra Chương trình khách hàng thân thiết (Loyalty Program), lãi suất cho vay tốt hơn hoặc các sản phẩm tài chính được cá nhân hóa phù hợp
để tăng độ tương tác và lợi nhuận cho ngân hàng
CLV = total_loan_amount * 0.4 — bad_debt * 0.5 + total_credit_card_transactions * 0.3 +
total_transaction_volume * 0.2 + avg_salary * 0.1
e Total loan amount (40%): Khoan vay la nguén thu nhap chinh cho ngan hang, do
đó chúng được tính trọng số cao nhất Khách hàng có khoản vay lớn hơn được coi
là có giá trị tiềm năng cao
® Total credi card transactions (30%): Hoạt động thẻ tín dụng tạo ra doanh thu cho ngân hàng và phản ánh mức độ tương tác của khách hàng với các sản phẩm
28
Trang 33® Total transaction volume (20%): Khối lượng giao dịch cao hơn thường tương quan
với khách hàng có giá trị hơn, nhưng đây không phải là nguồn thu chính nên chiếm
trọng sô không cao
e Avg salary (10%): Thu nhập của khách hàng thể hiện hoạt động tài chính trong tương lai nhưng được tính trọng số ít hơn vì đây là một yếu tổ gián tiếp so với các giao dịch hoặc khoản vay thực tế
® Bad_ debts (—50%): Nợ xấu là một yếu tố rủi ro, khách hàng có khoản vay chưa trả
sẽ làm giảm đáng kê lợi nhuận và ảnh hưởng đến hiệu quả hoạt động của ngân hàng
Do đó, nợ xâu có trọng sô âm
e CLV 4m: Sy xuat hiện CLV âm cho thấy ngân hàng chịu rủi ro hoặc thua lỗ từ các khách hàng này Điều này có thê là do khoản nợ xấu cao, với trọng số (-50%), làm giảm mạnh giá trị của họ đối với ngân hàng
e Giá trịNULL: Các giá trị NULL có thể là do thiếu đữ liệu đầu vào (ví dụ: không có
thông tin về khoản vay, không có giao dịch thẻ tín dụng hoặc nợ xấu), dẫn đến việc không thê tính CLV cho những khách hàng này
29