Luận văn này được nghiên cứu với mục đích là ứng dụng mô hình phân tích sống sót trong việc xây dựng mô hình chấm điểm tín dụng tại ngân hàng TMCP Ngoại Thương Việt Nam tại TPHCM..
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC KINH TẾ TP HỒ CHÍ MINH
PHAN XUÂN VINH
ỨNG DỤNG MÔ HÌNH PHÂN TÍCH SỐNG SÓT TRONG ĐO LƯỜNG RỦI RO TÍN DỤNG KHÁCH HÀNG CÁ NHÂN TẠI NGÂN HÀNG
TMCP NGOẠI THƯƠNG VIỆT NAM TẠI TPHCM
LUẬN VĂN THẠC SĨ KINH TẾ
TP HỒ CHÍ MINH - NĂM 2017
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC KINH TẾ TP HỒ CHÍ MINH
PHAN XUÂN VINH
ỨNG DỤNG MÔ HÌNH PHÂN TÍCH SỐNG SÓT TRONG ĐO LƯỜNG RỦI RO TÍN DỤNG KHÁCH HÀNG CÁ NHÂN TẠI NGÂN HÀNG
TMCP NGOẠI THƯƠNG VIỆT NAM TẠI TPHCM
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “Ứng dụng mô hình phân tích sống sót trong đo lường rủi ro tín dụng khách hàng cá nhân tại Ngân hàng TMCP Ngoại Thương Việt Nam tại TPHCM’’ là công trình nghiên cứu của chính cá nhân tôi Nội dung được đúc kết từ quá trình học tập và các kết quả nghiên cứu thực tiễn trong thời gian qua
Số liệu sử dụng là trung thực và có nguồn gốc trích dẫn rõ ràng Luận văn được thực hiện dưới sự hướng dẫn khoa học của PGS.TS Trầm Thị Xuân Hương–Giảng viên Trường Đại Học Kinh Tế Thành Phố Hồ Chí Minh
TP Hồ Chí Minh, ngày 29 tháng 9 năm 2017
Học viên
Trang 4DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT
Basel: Uỷ ban về giám sát ngân hàng
BIDV: Ngân hàng thương mại cổ phần Đầu Tư và Phát Triển Việt Nam
NH TMCP: Ngân hàng thương mại cổ phần
KM: mô hình Kaplan-Meier
Vietinbank: Ngân hàng thương mại cổ phần Công Thương Việt Nam Vietcombank: Ngân hàng thương mại cổ phần Ngoại Thương Việt Nam
Trang 5MỤC LỤC
LỜI CAM ĐOAN i
DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT ii
Chương 1: GIỚI THIỆU 1
1.1 Lý do chọn đề tài: 1
1.2 Mục tiêu nghiên cứu của đề tài: 2
1.3 Đối tượng nghiên cứu và phương pháp nghiên cứu: 2
1.3.1 Đối tượng nghiên cứu 2
1.3.2 Phương pháp nghiên cứu 2
1.4 Kết cấu đề tài 2
1.5 Ý nghĩa khoa học của đề tài 3
Chương 2 LÝ THUYẾT MÔ HÌNH PHÂN TÍCH SỐNG SÓT TRONG ĐO LƯỜNG RỦI RO TÍN DỤNG 4
2.1 Lý thuyết chung về rủi ro tín dụng ngân hàng 4
2.1.1 Định nghĩa rủi ro 4
2.1.2 Rủi ro tín dụng 4
2.2 Phân tích rủi ro tín dụng 6
2.2.1 Các hệ thống chuyên gia 6
2.2.2 Phân tích phần bù rủi ro 7
2.2.3 Phương pháp thống kê và kinh tế lượng 7
2.2.4 Các hệ thống kết hợp 8
2.2.5 Các phương pháp đo lường rủi ro tín dụng 8
2.3 Mô hình chấm điểm trong đo lường rủi ro tín dụng 9
2.3.1 Tổng quan về mô hình chấm điểm tín dụng 9
Trang 62.3.2 Các mô hình chấm điểm tín dụng 10
2.4 Mô hình phân tích sống sót 14
2.4.1 Giới thiệu 14
2.4.2 Lý thuyết mô hình phân tích sống sót 15
2.4.2.1 Dữ liệu bị cắt (censored data) 16
2.4.2.2 Dữ liệu bị chặn (truncated data) 18
2.4.3 Các loại mô hình phân tích sống sót 18
2.4.3.1 Mô hình Kaplan – Meier 19
2.4.3.2 Mô hình tham số 21
2.4.3.3 Hàm gia tốc thời gian thất bại (Accelerated failure time) 22
2.4.3.4 Hàm tỷ lệ nguy cơ đầy đủ tham số (fully parametric proportional hazards model) 23
2.4.3.5 Mô hình Cox (Cox Proportional hazards model) 23
2.5 Các nghiên cứu trước đây 24
Chương 3: ĐO LƯỜNG RỦI RO TÍN DỤNG CỦA KHÁCH HÀNG CÁ NHÂN TẠI VIETCOMBANK 30
3.1 Sơ lược Vietcombank và tình hình hoạt động kinh doanh 30
3.1.1 Lịch sử của Vietcombank 30
3.1.2 Tình hình hoạt động kinh doanh và cho vay cá nhân tại Vietcombank 31
3.2 Thực trạng đo lường rủi ro tín dụng của khách hàng cá nhân tại Vietcombank 34
3.3 Nhận xét mô hình chấm điểm tín dụng của Vietcombank 35
3.3.1 Những điểm tích cực 35
3.3.2 Những điểm chưa đạt được 36
3.3.3 Sự cần thiết của mô hình phân tích sống sót 37
Trang 7Chương 4: XÂY DỰNG MÔ HÌNH PHÂN TÍCH SỐNG SÓT ĐO LƯỜNG
RỦI RO TÍN DỤNG VÀ KẾT QUẢ NGHIÊN CỨU 39
4.1 Lựa chọn biến sử dụng trong mô hình 39
4.5 Xây dựng mô hình phân tích sống sót 48
4.5.1 Phương pháp nghiên cứu và các bước xây dựng mô hình 48
4.5.2 Mô hình ước lượng tổng quát 48
4.5.3 Kiểm định giả định của mô hình hồi quy COX 50
4.5.3.1 Kiểm định biến liên tục 50
4.5.3.2 Kiểm định các biến phân loại 51
4.6 Mô hình phân tích sống sót đề xuất 53
4.6.1 Mô hình thứ nhất 53
4.6.2 Mô hình thứ hai (mô hình đề nghị): 53
4.7 Kết quả nghiên cứu: 55
4.7.1 Hàm nguy cơ cơ sở: 55
4.7.2 Đối với các biến có ý nghĩa trong mô hình đề xuất 55
4.7.2.1 Biến số tiền được duyệt vay và thu nhập 55
4.7.2.2 Biến DTI 56
4.7.2.3 Biến giới tính 56
4.7.2.4 Biến Sản phẩm 56
Chương 5: KẾT LUẬN VÀ KHUYẾN NGHỊ 58
5.1 Kết luận 58
5.1.1 Kết luận 58
5.1.2 Minh hoạ ứng dụng mô hình nghiên cứu 58
5.2 Khuyến nghị 60
5.3 Hạn chế và hướng các nghiên cứu tiếp theo 61
Phụ lục 1: Danh mục tài liệu tham khảo 63
Trang 8Phụ lục 2 kết quả mô hình nghiên cứu 66
Trang 9DANH MUC BẢNG
Bảng 2.1: so sánh các mô hình mô hình chấm điểm 11
Bảng 2.2 : Các nghiên cứu chấm điểm tín dụng 24
Bảng 4.1: Tên biến và định nghĩa các biến 40
Bảng 4.2 : mô tả các biến liên tục 44
Bảng 4.3 Thống kê tỷ lệ nợ xấu các nhóm 46
Bảng 4.4: Tóm tắt các quan sát 48
Bảng 4.5: kết qủa mô hình hồi quy COX tổng quát 49
Bảng 4.6: kết qủa mô hình hồi quy COX thứ nhất 53
Bảng 4.7: kết qủa mô hình hồi quy COX đề nghị 54
Trang 10DANH MỤC HÌNH, BIỂU ĐỒ
Hình 2.1: Minh hoạ về các loại quan sát 17
Hình 2.2 thể hiện ước lượng hàm Kaplan Meier 20
Biểu đồ 3.1: Thể hiện tổng tài sản và khoản mục cho vay ứng trước KH qua các năm 31
Biểu đồ 3.2: Thể hiện tổng thu nhập và thu nhập từ lãi vay 32
Biểu đồ 3.3: thể hiện Dư nợ vay cá nhân, hộ kinh doanh của các ngân hàng BIDV, Vietinbank và Vietcombank 33
Biểu đồ 4.1: thống kê các biến phân loại 45
Biểu đồ 4.2: đồ thị thể hiện phần dư riêng phần của các biến liên tục 50
Biểu đồ 4.3: Plot log minus log của biến phân loại theo thời gian 51
Biểu đồ 4.1: Thể hiện hàm nguy cơ cơ sở 55
Biểu đồ 5.1: hàm nguy cơ đối với người vay thứ nhất 59
Biểu đồ 5.2: hàm nguy cơ đối với người vay thứ hai 59
Trang 11Chương 1: GIỚI THIỆU 1.1 Lý do chọn đề tài:
Hoạt động tín dụng là hoạt động truyền thống và đem lại lợi nhuận cao nhất cho ngân hàng Tại Việt Nam, nguồn thu từ hoạt động tín dụng luôn chiếm hơn 80%
nguồn thu của ngân hàng thương mại Lợi nhuận cao thì sẽ có rủi ro lớn, đặc biệt
hơn khi ngân hàng chủ yếu là cho vay Rủi ro này không những chỉ ảnh hưởng đến ngân hàng cho vay mà còn có thể ảnh hưởng xấu đến toàn bộ nên kinh tế đang phát triển tại Việt Nam Trong nghiệp vụ tín dụng hiện tại, các ngân hàng đều chia thành hai mảng là tín dụng bán buôn và tín dụng bán lẻ Theo quy định tại Vietcombank, tín dụng bán buôn là việc cấp tín dụng cho các tổ chức, doanh nghiệp lớn có doanh thu hơn 100 tỷ trong năm Tín dụng bán lẻ là việc ngân hàng tập trung cho vay đối với các doanh nghiệp nhỏ và vừa và các cá nhân vay vốn Trong những năm gần đây, tất cả các ngân hàng thương mại đều bắt đầu tập trung chuyển dịch dòng vốn vay về thị trường bán lẻ Bởi vì, thị trường bán lẻ có biên độ lợi nhuận cao, có tính
an toàn cao hơn cho vay bán buôn Trong việc cho vay giữa doanh nghiệp nhỏ và vừa và cá nhân, thì cho vay cá nhân lại có nhiều ưu điểm hơn Mục đích cho vay bán lẻ thì tương đối đơn giản, không phức tạp kiểm soát sau vay Thêm nữa, rủi ro trong cho vay tiêu dùng cá nhân không tập trung, đồng thời nhờ số lượng người vay lớn, theo quy luật số đông ngân hàng dễ dàng tính toán phần bù rủi ro lãi suất khi áp lãi suất vay Như đã đề cập, với sự phát triển trong cho vay cá nhân, việc cần có một
mô hình chấm điểm tín dụng, xếp hạng tín dụng phù hợp là cần thiết Nó hỗ trợ việc đảm bảo an toàn cho ngân hàng đồng thời giúp ngân hàng quyết định cho vay nhanh chóng để phục vụ khách hàng Trước những yêu cầu đó, có rất nhiều bài viết khoa học nghiên cứu để tìm ra mô hình phù hợp, trong đó mô hình được sử dụng rộng rãi nhất là mô hình hồi quy Logistic Mô hình Logistic có nhiều ưu điểm, tuy nhiên mô hình có sự khuyết điểm là không xem xét các dữ liệu bị cắt Các dữ liệu bị cắt, bản thân dữ liệu vẫn mang những thông tin tác động đến kết quả nghiên cứu Với sự phát triển của kỹ thuật thống kê, mô hình phân tích sống sót được Giáo Sư Cox phát triển vào năm 1972, trước đây được sử dụng chủ yếu trong y khoa Đến năm 1992, Narian đã được sử dụng mô hình Cox trong việc xây dựng mô hình chấm điểm tín
Trang 12dụng, mà nó bổ sung được điểm thiếu sót của mô hình Logistic Đến năm 2000 Thomas và Stepanova đã được kiểm chứng so sánh với các mô hình truyền thống và chứng minh rằng mô hình Cox dự báo xác suất vỡ nợ tốt hơn so với mình Logistic Tuy nhiên, ở Việt Nam mô hình phân tích sống sót vẫn thật sự chưa được phổ biến trong việc xây dựng mô hình chấm điểm tín dụng Luận văn này được nghiên cứu với mục đích là ứng dụng mô hình phân tích sống sót trong việc xây dựng mô hình
chấm điểm tín dụng tại ngân hàng TMCP Ngoại Thương Việt Nam tại TPHCM 1.2 Mục tiêu nghiên cứu của đề tài:
Đề tài tập trung nghiên cứu hai mục tiêu chính đó là:
1-Xây dựng mô hình phân tích sống sót
2- Ứng dụng mô hình phân tích sống sót trong đo lường rủi ro tín dụng
1.3 Đối tượng nghiên cứu và phương pháp nghiên cứu:
1.3.1 Đối tượng nghiên cứu
Đối tượng nghiên cứu là mô hình phân tích sống sót trong vay tiêu dùng cá nhân, cụ thể là xác suất vỡ nợ của khách hàng cá nhân Đối tượng khảo sát chính là
những khách hàng vay tiêu dùng tại TPHCM
1.3.2 Phương pháp nghiên cứu
Tác giả sử dụng nghiên cứu định lượng, thống kê mô tả các biến và sử dụng
mô hình phân tích sống sót để ước lượng mô hình
Tổng số mẫu được thu thập là 2756 người vay vốn khác nhau tại ngân hàng TMCP Ngoại Thương Việt Nam tại thành phố Hồ Chí Minh trong khoảng thời gian từ 7/2012 đến tháng 8/2015
1.4 Kết cấu đề tài
Đề tài bao gồm 5 chương chính được thể hiện như sau:
Chương 1: Giới Thiệu
Chương 2: Lý thuyết mô hình phân tích sống sót trong đo lường rủi ro tín dụng
Chương 3: Đo lường rủi ro tín dụng của khách hàng cá nhân tại vietcombank Chương 4: Xây dựng mô hình phân tích sống sót đo lường rủi ro tín dụng và kết quả nghiên cứu
Trang 13Chương 5: Kết luận và khuyến nghị
1.5 Ý nghĩa khoa học của đề tài
Kết quả nghiên cứu của đề tài sẽ góp thêm cơ sở khoa học cho các tổ chức tài chính, và các cá nhân liên quan, đặc biệt là NH TMCP Ngoại Thương Việt Nam trong quá trình hoạt động kinh doanh và quản lý rủi ro của mình Kết quả nghiên cứu còn là tài liệu tham khảo cho các chủ thể tham gia vào quá trình chấm điểm tín dụng cũng như cho những nghiên cứu liên quan đến chấm điểm tín dụng cá nhân
Tóm tắt chương
Trong chương này, tác giả giới thiệu về đề tài nghiên cứu và nguyên nhân sử dụng
mô hình phân tích sống sót trong việc ước lượng xác suất vỡ nợ của một khách hàng
cá nhân Tác giả cũng chỉ ra được hai mục tiêu trọng tâm của bài là: Xây dựng mô hình phân tích sống sót và ứng dụng mô hình phân tích sống sót trong đo lường rủi
ro tín dụng, thông qua các dữ liệu được thu thập trong thực tiễn
Trang 14Chương 2 LÝ THUYẾT MÔ HÌNH PHÂN TÍCH SỐNG SÓT TRONG
ĐO LƯỜNG RỦI RO TÍN DỤNG 2.1 Lý thuyết chung về rủi ro tín dụng ngân hàng
2.1.1 Định nghĩa rủi ro
Theo định nghĩa truyền thống rủi ro là những sự kiện xảy ra có thể làm cho mất mát tài sản hay làm phát sinh một khoản nợ Định nghĩa về rủi ro hiện đại bao hàm nghĩa rộng hơn và không chỉ tính đến rủi ro tài chính và còn bao gồm cả những rủi ro liên quan đến những mục tiêu hoạt động và mục tiêu chiến lược Rủi ro là khả năng những sự kiện chưa chắc chắn trong tương lai sẽ làm cho chủ thể không đạt được những mục tiêu chiến lược và mục tiêu hoạt động, cũng như chi phí cơ hội của việc làm mất những cơ hội thị trường
Chấp nhận rủi ro là trung tâm của hoạt động ngân hàng Các ngân hàng cần phải đánh giá các cơ hội kinh doanh dựa trên mối quan hệ rủi ro-lợi ích nhằm tìm ra những cơ hội đạt được những lợi ích xứng đáng với mức rủi ro chấp nhận Ngân hàng sẽ hoạt động tốt nếu mức rủi ro mà ngân hàng gánh chịu là hợp lý và kiểm soát được và nằm trong phạm vi khả năng các nguồn lực tài chính và năng lực tín dụng của ngân hàng Đối với ngân hàng, các tài sản chủ yếu là các khoản tiền gửi tại các ngân hàng nước ngoài và các khoản cho vay khách hàng cần phải có mức độ thanh khoản cần thiết để bảo đảm thanh toán cho các khoản tiền gửi của khách hàng, chi phí hoạt động, và các khoản lỗ, đồng thời vẫn tạo ra một khoản lợi nhuận
đủ lớn đẻ có được tỷ lệ lợi nhuận trên vốn chủ sở hữu hợp lý (cẩm nang quản lý rủi
ro của Vietcombank)
2.1.2 Rủi ro tín dụng
Bất chấp tầm quan trọng của những nguồn rủi ro khác trong ngân hàng, rủi
ro lớn nhất đối mặt với hầu hết các ngân hàng và các định chế tài chính là rủi ro tín dụng
Rủi ro tín dụng là vấn đề trọng yếu đối với người cho vay (Brian và Collen, 1997) Thật ra, rủi ro tín dụng là nguyên nhân đầu tiên cho sự phá sản của đa số các định chế tài chính trong thập kỷ qua Do vậy, có rất nhiều nghiên cứu từ các phân tích trong 2 thập kỷ qua với sự phát triển những kỹ thuật phân tích rủi ro tín dụng
Trang 15Rủi ro tín dụng cũng là một trong những rủi ro lâu đời mà các ngân hàng cũng như các định chế tài chính phải đối mặt trước đó, ít nhất từ năm 1800 trước công nguyên Rủi ro vỡ nợ của người đi vay – đối với lãi suất và/hoặc nợ gốc- có thể gây
ra tổn thất vốn cho ngân hàng dẫn đến phá sản Quản trị loại rủi ro này bằng cách chọn và quan sát người đi vay và bằng cách tạo ra một danh mục các tiền cho vay
đa dạng luôn luôn là một trong những thách thức trong vận hành một định chế tài chính Rủi ro tín dụng phát sinh bất cứ lúc nào khi ngân hàng mở rộng, cam kết, đầu
tư hoặc những phát sinh khác mà ngân hàng tài trợ thông qua những thỏa thuận bằng hợp đồng tiềm ẩn hoặc thực sự, thể hiện trên hoặc ngoài bảng cân đối kế toán (Cục kiểm soát tiền tệ của ngân hàng Quốc Gia Hoa Kỳ, 1999)
Theo Ủy ban Basel (Basel,2000), rủi ro tín dụng có thể được định nghĩa là: Khả năng mà người đi vay ngân hàng hoặc đối tác sẽ không trả được nợ theo các điều khoản đã thỏa thuận
Mục tiêu của quản trị rủi ro là là tăng tỷ lệ thu hồi nợ của ngân hàng bằng cách duy trì phát sinh rủi ro tín dụng trong giới hạn phù hợp Quản trị rủi ro tín dụng cũng cần xử lý cho toàn bộ các danh mục Quan hệ giữa rủi ro tín dụng và các rủi ro khác cũng nên được xem xét song song Quản trị hiệu quả của rủi ro tín dụng
là một phần quan trọng của phương pháp toàn diện đối với quản trị rủi ro và là điều quan trọng đối với thành công dài hạn của bất kỳ ngân hàng nào
Đối với hầu hết ngân hàng, và bất chấp các nguồn phát sinh rủi ro tín dụng
có tồn tại ở nhiều hoạt động ở ngân hàng, có thể hiện trên hoặc ngoài bảng cân đối
kế toán hoặc không, các khoản tiền cho vay được xem là nguồn rủi ro tín dụng chính, dù cho đâu đó các nguồn rủi ro tín dụng khác vẫn tồn tại Mức độ rủi ro tín dụng được phát hiện tăng dần trong nhiều công cụ tài chính chẳng hạn các giao dịch ngoại hối, các hợp đồng tương lai tài chính, hoán đổi, trái phiếu, cổ phần, quyền chọn, và sự mở rộng các cam kết và đảm bảo, và thanh toán các giao dịch (Basel, 2000)
Phấn lớn các nhà nghiên cứu đề cập đến rủi ro tín dụng và rủi ro vỡ nợ thường có ý nghĩa tương tự nhau nhưng có một khác biệt nhỏ trong định nghĩa Ở đây, rủi ro tín dụng là: rủi ro của các tổn thất thông qua sự không thanh toán được
Trang 16các nghĩa vụ tài chính Trong khi đó rủi ro vỡ nợ là: rủi ro mà chủ thể phát hành sẽ không thực hiện đầy đủ các nghĩa vụ tài chính của mình đối với nhà đầu tư/chủ nợ theo các điều khỏan bắt buộc Trong thuật ngữ này, rủi ro tín dụng thường ám chỉ đến người đi vay là người có khả năng hoàn trả một tiền cho vay có một mức độ tổn thất tiềm ẩn, trong khi đó rủi ro vỡ nợ thường liên quan đến người cho vay là người
có thể không thanh toán Vì thế, người ta có thể nói rằng không có sự khác biệt lớn giữa hai loại rủi ro này, chúng có thể cùng được định nghĩa như sau: rủi ro tín dụng/vỡ nợ là rủi ro mà các nghĩa vụ tài chính của người đi vay trong một thỏa thuận sẽ không được thực hiện thỏa đáng
2.2 Phân tích rủi ro tín dụng
Nhiều định chế tài chính sử dụng một số công cụ để xác định rủi ro tín dụng Theo Sathye và các cộng sự (2003) thì những công cụ này có thề được chia thành 4 nhóm chính: (i) các hệ thống chuyên gia; (ii) phân tích phần bù rủi ro; (iii) Phương pháp thống kê kinh tế lượng; (iv) các hệ thống kết hợp Trong đó, phương pháp phân tích phần bù, phương pháp thống kê và hệ thống kết hợp sẽ lượng hoá độ rủi
ro tín dụng
2.2.1 Các hệ thống chuyên gia
Các hệ thống chuyên gia (hoặc hệ thống truyền thống) là một hình thức kinh điển của phân tích tín dụng phụ thuộc và sự phán xét chủ quan của người thẩm định tín dụng Trong hệ thống này, đối với một số lý do kinh nghiệm của người làm công tác thẩm định lâu năm (hay còn gọi là các chuyên gia phê duyệt) là quan trọng: (i) Người chuyên gia phê duyệt tín dụng tuân theo các giới hạn của quy định ngân hàng; (ii) Người phê duyệt tín dụng là điểm gốc của quy luật ngón tay cái; (iii) ngân hàng dựa vào những chuyên gia phê duyệt kinh nghiệm để thực hiện phần lớn các vấn đề quan trọng như hiểu xu hướng ngành, đánh giá sự độ đáng tin cậy về khả năng trả nợ của người đi vay, hoặc thiết kế cấu trúc tín dụng mà theo đó ngân hàng
sẽ cho vay
Người cho vay nhận đơn đề nghị vay theo mẫu đã được thiết kễ sẵn và một danh sách kiểm tra/ chứng từ cần cung cấp do ngân hàng đưa ra Sau đó, đơn đề nghị và chứng từ được phân tích và đánh giá bởi người phê duyệt Nếu tiền cho vay
Trang 17được chấp nhận bởi một chuyên gia hay hệ thống hội đồng tín dụng (tuỳ theo từng hạn mức phê duyệt cụ thể của từng tổ chức tín dụng) thì số tiền cho vay được giải ngân thông qua các bộ phận khác tại ngân hàng Kỹ thuật thông thường nhất của loại này là phân tích 6Cs
Tuy nhiên, hệ thống chuyên gia dĩ nhiên có điểm yếu Trước hết, đó là sự chủ quan; ra quyết định phụ thuộc và người thẩm định có thể dễ bị ảnh hưởng bên ngoài như các quan hệ xã hội và quan hệ cá nhân Thứ hai, sự thi hành những hệ thống này thì không công bằng, vì thế sự thành công hay thất bại của hệ thống phụ thuộc vào kinh nghiệm và sự thực hiện của người thẩm định tín dụng Ví dụ, một số người thẩm định có tài phân tích rủi ro tín dụng hiệu quả và những người khác thì không có Ngoài ra, các hệ thống chuyên gia thì khá tốn chi phí Ví dụ, việc chuẩn
bị và thực hiện của những hệ thống này yêu cầu nhân viên/cấp lãnh đạo có năng lực
và kinh nghiệm Thêm vào đó, các hệ thống chuyên gia có liên quan đến hệ thống quan liêu của hoạt động kinh doanh và nó gây ra lãng phí thời gian ra quyết định Vì thế, để khắc phục những bất lợi này, nhìn chung các nhà kinh tế tranh luận rằng tốt nhất nên áp dụng các hệ thống khách quan không phụ thuộc vào phán quyết chủ quan của người cho vay
2.2.2 Phân tích phần bù rủi ro
Phần bù rủi ro trong phân tích tín dụng được định nghĩa là phần chênh lệch giữa lợi tức lãi suất từ khoản vay của ngân hàng cho khách hàng vay và khoảng lãi suất phi rủi ro Phương pháp này có thể thực hiện tốt đối với các khách hàng mà chúng được đánh giá bởi một đơn vị xếp hạng tín dụng Cách tính phần bù là xác suất của việc hoàn trả nợ có thể đạt được bằng cách so sánh giữa lãi suất ngân hàng
và lãi suất của chính phủ ‘phi rủi ro’ theo sau:
(1+r) P= 1 + iTrong đó; P là xác suất hoàn trả nợ, i là lãi suất cho vay, và r = lãi suất phi rủi ro
2.2.3 Phương pháp thống kê và kinh tế lượng
Kinh tế lượng là bộ phận của kinh tế học nghiên cứu quan hệ toán học giữa các biến số tài chính và kinh tế để dự báo hành vi của các biến số kinh tế Kinh tế lượng cung cấp một cơ sở khoa học cho phân tích tín dụng, mặc dù không có cơ sở
Trang 18lý thuyết về tín dụng Công cụ quan trọng nhất của kinh tế lượng là phân tích hồi quy và phân tích rời rạc Kỹ thuật kinh tế lượng chủ yếu đòi hỏi việc lập mô hình xác suất vỡ nợ, có thể hiểu là làm lượng hoá rủi ro tín dụng Xác suất này được sử dụng như là một biến phụ thuộc mà biến đổi của nó được giải thích bởi một bộ các biến độc lập Các kỹ thuật kinh tế lượng khác gồm phân tích rời rạc tuyến tính và phức hợp, hồi quy đa biến, phân tích logit và phân tích probit Các kỹ thuật này sẽ được sử dụng để thiết kế các mô hình đo lường rủi ro tín dụng, và được giới thiệu phần sau trong chương này.
2.2.4 Các hệ thống kết hợp
Như đã đề cập phần trước đây, kinh tế lượng chịu đựng một cơ sở lý thuyết không hoàn thiện đối với việc phân tích rủi ro tín dụng vì các giải pháp kinh tế lượng chỉ cung cấp một quan hệ thống kê giữa biến phụ thuộc và một số biến giải thích Quan hệ này xảy ra như là kết quả trong các mô hình không bao gồm các lý thuyết tài chính đã biết như lý thuyết quyền chọn và bảo hiểm Vì thế, các hệ thống kết hợp khắc phục sự thiếu hụt này bằng cách kết hợp lý thuyết tài chính và thống
kê kinh tế Ngoài ra, có một sự phê bình các mô hình đa biến sử dụng dữ liệu liệu quá khứ từ các báo cáo tài chính để tính toán xác suất vỡ nợ Ví dụ của những hệ thống này là các mô hình tử suất và tần số vỡ nợ kỳ vọng Thông thường các hệ thống kết hợp sẽ được sử dụng để thẩm định đối với các khách hàng là tổ chức lớn,
số tiền vay nhiều, cần phải có một sự cẩn trọng và xem xét kỹ càng
2.2.5 Các phương pháp đo lường rủi ro tín dụng
Đo lường rủi ro tín dụng là một thuật ngữ để chỉ việc xác định mức độ rủi ro tín dụng của một người vay cụ thể thông qua việc xác định các biến số (hay còn gọi
là các nhân tố) ảnh hưởng đến mức độ rủi ro tín dụng
Có 2 phương pháp đo lường rủi ro tín dụng đã được nghiên cứu là:
Các phương pháp định tính trong đó mô hình phổ biến nhất là 6Cs (Character; Capacity; Cash; Collateral; Condition; Control);
Các phương pháp định lượng thông thường là các mô hình chấm điểm tín dụng (Credit Score Models) Trong bài viết này, tác giả chú trọng vào các mô hình
định lượng, vốn được sử dụng rất nhiều trong các các khoản vay cá nhân
Trang 192.3 Mô hình chấm điểm trong đo lường rủi ro tín dụng
2.3.1 Tổng quan về mô hình chấm điểm tín dụng
Mô hình chấm điểm tín dụng là một trong những mô hình đo lường tín dụng (de Vaney và Lytton 2005) Theo BIS (BIS, 2000), chấm điểm tín dụng được định nghĩa như là :
Một mô hình ước lượng rủi ro tín dụng của người vay, dựa vào dữ liệu lịch sử và kỹ thuật thống kê Nó là một quá trình quy ra định lượng cho từng đơn vị đo lường, để chấm điểm, làm đại diện cho kết quả hành vi của người vay có thể xảy ra trong tương lai
Khi đó, mô hình chấm điểm tín dụng là kỹ thuật thống kê và hệ thống toán học được sử dụng để hỗ trợ quyết định cấp tín dụng, mục tiêu chính của các mô hình này là tối đa hoá việc đo lường rủi ro (Papanyan, 2003) Thomas và các cộng sự (2002) chỉ ra rằng mô hình chấm điểm tín dụng thật sự không ước lượng khả năng thanh toán nợ của người đề nghị vay, bởi vì nó không phải là thuộc tính của người vay, đúng hơn đó là sự đo lường của người cho vay, và do vậy mô hình chấm điểm tín dụng phản ánh các tình huống của người vay và góc nhìn của người cho vay về các mong muốn của tình huống kinh tế xảy ra trong tương lai
Có 2 loại chính trong kỹ thuật chấm điểm tín dụng Đầu tiên là chấm điểm người vay, được dùng cho việc chấm điểm người vay mới Thứ hai, là chấm điểm hành vi được dùng để đo lường người cho vay hiện tại (Banasik và Crook , 2005) Không kể đến hình thức nào được sử dụng, một lượng lớn mẫu trong quá khứ thường được thu thập để xác định ra các đặc tính mà mẫu này đại diện cho khoản tín dụng tốt hay xấu
Thoạt đầu, các mô hình thống kê chấm điểm được giới thiệu bởi Fisher (1936) trong việc cố gắng phân biệt giữa hai quần thể cây irít bằng việc đo lường kích cỡ của cây David Durand (1941) là người đầu tiên ứng dụng phương pháp đó trong vào việc phân biệt khoản nợ tốt và nợ xấu Sau đó nhiều công ty tín dụng đã xây dựng hình thức sơ khai của việc chấm điểm tín dụng bằng nguyên lý thống kê,
và chính các mô hình này đã hỗ trợ các tổ chức tín dụng ra quyết định cấp tín dụng Sự kiện đánh dấu tầm quan trọng của mô hình chấm điểm tín dụng là việc thông qua
Trang 20đạo luật Cơ Hội Tín Dụng Ngang Bằng ở Mỹ năm 1975-1976, nội dung chủ yếu là cấm sự phân biệt đối xử trong việc cấp tín dụng trừ khi được chứng minh dựa trên
cơ sở Thống kê
Qua đó, việc quan trọng để xây dựng mô hình chấm điểm tín dụng là phải có một cơ số mẫu lớn để tiến hành các kỹ thuật thống kê Nên mô hình chấm điểm tín dụng thường được áp dụng trong việc đánh giá các khoản vay cá nhân và các khoản vay dành cho doanh nghiệp vừa và nhỏ
2.3.2 Các mô hình chấm điểm tín dụng
Khi sử dụng phương pháp chấm điểm tín dụng, điều chắc chắn rằng tổ chức tín dụng phải hiểu phương pháp và kết quả cuối cùng của mô hình áp dụng Tính đến thời điểm hiện tại, mô hình chấm điểm tín dụng được chia làm ba phương pháp: (1) phương pháp tham số (parametric Statistical Approaches), (2) phương pháp phi tham số (Non Parametric Statistical approaches), (3) Cách tiếp cận mới (new Approaches)
(1) Phương pháp tham số: là phương pháp dùng kỹ thuật phân tích hồi quy
để phân biệt giữa khoản vay tốt và khoản vay xấu bằng cách sư dụng mẫu trong tổng thể những người vay (Bramma, 1999) Đây là phương pháp xây dựng mô hình chấm điểm đầu tiên và đến giờ vẫn được xem là phương pháp hiệu quả nhất Cách tiếp cận này có thể nhận ra và loại trừ các biến không có tác động, và đảm bảo rằng các biến quan trọng vẫn được giữ lại trong mô hình (Thomas và cộng sự 2002) Có bốn phương pháp chủ yếu được sử dụng: Mô hình hồi quy tuyến tính, mô hình logit,
mô hình probit, và mô hình biệt thức
Trong bốn phương pháp thì mô hình logit và probit được xem là thông dụng
và được sử dụng rất rộng rãi trong việc xây dựng mô hình chấm điểm tín dụng Với các mô hình biệt thức thì nổi tiếng đó là phương pháp Altman (1968) với mô hình chỉ số Z
(2) Phương pháp phi tham số: Các phương pháp tham số được nêu trên thì sẽ đặt ra giả định về hàm phân phối của các biến tham số trong mô hình theo các lý thuyết phân phối xác suất tham số Tuy nhiên, cách tiếp cận phi tham số không dựa hoàn toàn vào các lý thuyết phân phối xác suất Có thể coi cách tiếp cận phi tham số
Trang 21là cách tiếp cận không thông qua phân phối xác suất Do đó, nó có thể dễ dàng xử lý các dữ liệu bị mất, hiện tượng đa cộng tuyến giữa các biến, một ưu điểm nếu so với phương pháp tham số Với phương pháp phi tham số, chúng ta có thể chia thành 2 loại phương pháp: phương pháp đồng thời và phương pháp liên tục Các phương pháp phi tham số có thể kể ra như: mô hình láng giềng gần, phương pháp mạng thần kinh, hệ thống chuyên gia, v…v Tuy nhiên, việc áp dụng phương pháp này có khuyết điểm là phức tạp và không phân tích một mẫu quá lớn
(3) Cách tiếp cận mới: qua các phương pháp trên, các phương pháp tiếp cận mới được xem như là sự bổ sung cho các khuyết điểm của 2 phương pháp tham số
và phi tham số Các tiếp cận mới này đều sử dụng các mô hình của các chuyên ngành khác để ứng dụng phát triển cho mô hình chấm điểm tín dụng Có thể coi là một sự sáng tạo trong khoa học để hoàn thiện hơn, ba phương pháp mới này là: phân tích sống sót (survival Analysis), mô hình mạng bayesian (bayesian networks),
mô hình xác suất dạng đồ thị (Graphical models)
Bảng 2.1: so sánh các mô hình mô hình chấm điểm
Xác suất tuyến tính -Dễ hiểu và dễ sử dụng
-Xử lý được các mẫu lớn
- Ước lượng xác suất lớn khoảng [0,1]
thuật toán phức tạp
- Nó phụ thuộc hoàn toàn vào phân phối tương quan
Trang 22- Có kết quả tốt bằng nhau giữ các nhóm
- Nó bao hàm các giới hạn thống kê
Cây phân loại
- Xem xét những vấn đề phức tạp
- Xử lý với nhiều biến
- Rất khó để hiểu
Thuật toán K – láng giềng
gần
- Phần thặng dư được gán một giá trị cho từng lớp thay cho quyết định nhị phân
- Có kết quả tốt
- Rất nhạy với sự xuất hiện của các tham số không liên quan
- Ra kết quả lâu
Quy hoạch tuyến tính
- Dễ dàng chấm điểm vấn
đề với số lượng biến lớn
- Bao hàm được các sai số
- Tỷ lệ dự đoán thấp
- Ra kết quả lâu
Mạng thần kinh
- Xử lý các vấn đề mà có chứa nhiều tham số
- Xác định sai lầm loại 1 tốt hơn các mô hình khác
- Ra kết quả lâu
- Khó xác định mô hình cho ra quyết định như thế nào
Thuật giải duy truyền
- Bớt nhạy để ra kết quả tối ưu
- Hàm ước lượng không cần tuyến tính
- Không có lý thuyết nền cho quá trình ước lượng
- Rất khó sử dụng trong việc dự đoán
Phân tích sống sót
- Xử lý được các dữ liệu
bị cắt
- Nó tính toán được xác suất tại thời điểm này khác với xác suất tại thời điểm khác
- Cần giả định các tương quan giữa các người vay khác nhau là bất biến qua thời gian
Nguồn: Tác giả tổng hợp
Trang 23Khi một mẫu được đưa vào mô hình chấm điểm tín dụng thì nó sẽ được phân loại: là tốt hoặc xấu Asch (1995) định nghĩa một khoản vay tốt là không bị quá hạn quá 30 ngày và không bị hơn 2 lần trong vòng 4 năm đầu tiên Trong khi đó, khoản nợ xấu được định nghĩa là quá hạn từ 60 ngày trở lên Tuy nhiên, khoản nợ xấu cũng có thể liên quan tới một số sự kiện xảy ra của đối tượng vay chẳng hạn như phá sản Nên, một khoản vay là tốt hay xấu nó còn phụ thuộc vào đó là loại sản phẩm vay, đối tượng vay Ví dụ, tài khoản thấu chi thì không cố định tháng phải trả nhất định Vì vậy, quan trọng nhất là phải xác định được thế nào là khoản nợ xấu hay tốt đối với một sản phẩm cụ thể ta mới có thể đưa vào mô hình để xây dựng Tại Việt Nam, con số ngày được thay đổi, một khoản vay được xem là nợ xấu khi
nó được xếp loại nợ nhóm 3 (khoản vay quá hạn hơn 90 ngày, hoặc khoản vay phải xin cơ cấu thay đổi lịch trả nợ)
Một khi, định nghĩa của một khoản vay được xác định, kỹ thuật thống kê và toán học sẽ được sử dụng Phần lớn các kỹ thuật đều cho kết quả tốt trong việc phân loại khoản vay và khả năng chấm điểm tín dụng Rất nhiều nghiên cứu đã so sánh các kỹ thuật tính toán và chỉ ra rằng các kỹ thuật cho ra sai biệt nhỏ trong khả năng phân loại và một số nghiên cứu thì chỉ ra rằng kỹ thuật mạng thần kinh lại tốt hơn các kỹ thuật khác trong việc dự đoán
Một số nghiên cứu khác thì chỉ ra kỹ thuật phân tích sống sót lại có nhiều điểm lợi và do vậy nó được sử dụng nhiều hơn là khi ta so sánh với mô hình Logistic Trong đó, ưu điểm lớn nhất của mô hình này là xử lý được các dữ liệu bị cắt, tối ưu hoá được dữ liệu đưa vào nghiên cứu Đồng thời, mô hình này tính toán được xác suất vỡ nợ theo thời gian của người đi vay Điều này là rất phù hợp với các nhà thiết kế sản phẩm vay cá nhân vì thông thường các khoản vay cá nhân có thời gian vay là trung dài hạn Và cuối cùng, mô hình này dễ tính toán ít yêu cầu đòi hỏi về điều kiện của các biến độc lập đưa vào mô hình nhưng kết quả mô hình được chứng minh là có ý nghĩa tương đương với các mô hình Log và Probit Cụ thể về lý thuyết mô hình được trình bày ở phần sau
Trang 242.4 Mô hình phân tích sống sót
2.4.1 Giới thiệu
Mô hình phân tích sống sót là mô hình thông kê phân tích các dữ liệu mà biến kết quả là thời gian sẽ xảy ra sự kiện, tùy vào từng nghiên cứu cụ thể ta có thể gọi là thời gian thất bại, thời gian sống sót hoặc thời gian sự kiện Mộ hình phân tích sống sót sử dụng trong rất nhiều lĩnh vực khác nhau như ngành y, dược và kỹ thuật Trong nghiên cứu dược, khoảng thời gian sử dụng thuốc cho đến lúc bệnh nhân chết đi được mô hình hóa, tương tự trong kỹ thuật là thời gian thất bại v v
Ứng dụng của mô hình phân tích sống sót trong đo lường rủi ro tín dụng đã được trình bày lần đầu bởi Narain (1992) Được phát triển hơn bởi Thomas và các cộng sự (1999) Sự kiện được quan tâm ở đây là thời điểm vỡ nợ Narain đã áp dụng
mô hình gia tốc mũ của y học vào dữ liệu vay cá nhân Tác giả Narain đã phát hiện
ra rằng mô hình ước lượng số lần thất bại đạt kết quả tốt trong từng khoảng thời gian Kế đến, Ông trình bày về việc quyết định cấp tín dụng có thể được cũng cố thông qua mô hình phân tích sống sót, ông dùng phép so sánh mô hình phân tích sống sót đối với mô hình hồi quy đa biến Cuối cùng, tác giả đã kết luận rằng mô hình phân tích sóng sót có thể sử dụng trong hoạt động cấp tín dụng với các biến dự đoán đưa vào mô hình và thời điểm xảy ra vỡ nợ là điều cần nghiên cứu
Thomas và cộng sự (1999) đã làm phép so sánh thông qua các mô hình hàm mũ, Weibull và mô hình Cox so với mô hình hồi quy logistic Tác giả nhận ra rằng
mô hình phân tích sống sót hoàn toàn cho ra kết quả tương đồng và đôi khi có những ưu điểm nổi trội hơn cách tiếp cận phân tích hồi quy Logistic truyền thống
Đến năm 2001, tác giả Stepanova và Thomas đưa ra công trình nghiên cứu
về việc sử dụng mô hình phân tích sống sót của giáo sư Cox trong phân tích dữ liệu tiêu dùng cá nhân Các tác giả sử dụng mô hình Cox mở rộng trong phân tích dự báo, đồng thời sử dụng đường cong ROC (receiver operating characteristic) để xem xét sự khác biệt giữ mô hình Cox và hồi quy Logistic truyền thống:
Dự báo về việc tất toán khoản vay của khách hàng tại các kỳ hạn khác nhau thì cả 2 mô hình Cox và Logistic đều cho kết quả tương đối tương đồng
Trang 25Dự báo về việc khoản vay bị quá hạn thì trong năm thứ nhất, cả 2 mô hình đều có kết quả dự báo giống nhau Tuy nhiên, sự khác biệt đến trong năm thứ 2 và thứ 3, mô hình Cox cho thấy kết quả dự đoán của mô hình chính xác hơn mô hình Logistic truyền thống
Thông qua các nghiên cứu, mô hình Cox hay phân tích sống sót có những ưu điểm trong sử dụng việc đo lường tín dụng cá nhân như sau:
Thứ nhất, mô hình phân tích sống sót vẫn chấp nhận và sử dụng các biến bị cắt vào phân tích, điều này là không thể khi ta sử dụng mô hình Logistic Lượng thông tin của mô hình phân tích sống sót sẽ nhiều hơn so với mô hình Logistic
Thứ hai, mô hình phân tích sống sót cho phép dự đoán xác suất vỡ nợ tại từng mốc thời điểm của người vay, và kết quả của mô hình được các tác giả Thomas, Stepanova và các tác giả khác chứng minh rằng là chính xác hơn so với
2.4.2 Lý thuyết mô hình phân tích sống sót
Giả định rằng T là khoảng thời gian trước khi xuất hiện sự vỡ nợ của người vay Hàm ngẫu nhiên T có thể được mô phỏng thành ba cách truyền thống (theo Kalbfeisch và prentice, Lemis) thông qua các hàm như sau:
Cách thứ nhất: Hàm phân phối F(t) (distribution Function) diễn tả xác suất khoảng thời gian xảy ra biến cố T nhỏ hơn hoặc bằng thời điểm t (thời điểm xảy ra biến cố) tức là hàm xác suất một cá nhân xảy ra biến cố, ta có:
𝐹(𝑡) = 𝑃 (𝑇 ≤ 𝑡) (1) Từ đây, ta có hàm sống sót S(t) (survival function), tức xác suất khoảng thời gian xảy ra sự kiện lớn hơn thời điểm t, nói cách khác là:
𝑆(𝑡) = 1 − 𝐹(𝑡) (2) Cách thứ hai là thông qua hàm phân phối tích lỹ f(t) (Density function) Đây
là xác suất thời gian xảy ra sự kiện tại một thời điểm xác định, được cho như sau:
Trang 26𝑓(𝑡) = lim
∆𝑡↓0
𝑃𝑟𝑜𝑏(𝑡≤𝑇≤𝑡+∆𝑡)
∆𝑡 (5) Cách cuối cùng là diễn giải thông qua hàm nguy cơ h(t) (hazard Function) Hàm này diễn tả: nếu một người có thể tiếp tục còn trả nợ (hay sống sót) tới thời điểm t thì xác suất người này xảy ra tình trạng vỡ nợ (xảy ra sự kiện) tại ngay thời điểm t, được cho như sau:
ℎ(𝑡) = 𝑓(𝑡)
1 − 𝐹(𝑡) =
𝑓(𝑡)𝑆(𝑡)Như đã đề cập tại các phần trước, ưu điểm của mô hình phân tích sống sót sẽ xem xét được các loại dữ liệu bị thiếu như dữ liệu bị cắt (Censored Data) và dữ liệu
bị chặn (truncated data)
2.4.2.1 Dữ liệu bị cắt (censored data)
Một tập dữ liệu lý tưởng khi nó chứa tất cả người có thời điểm bắt đầu vay vốn và thời điểm kết thúc (xảy ra sự kiện) quan sát được trong khoảng thời gian nghiên cứu, tức khoảng thời gian “sống sót” được xác định Nếu thời điểm kết thúc không xuất hiện trong chuỗi dữ liệu ta gọi dữ liệu bị cắt phải Trong phân tích sống sót, đây là loại dữ liệu rất hay gặp phải khi ta ước lượng hàm sống sót hay hàm nguy cơ, theo Thomas và các cộng sự (1999) Dữ liệu bị cắt xuất hiện bởi vì ta thu thập quan sát dữ liệu trong một thời gian có hạn, và thông thường không phải lúc nào ta cũng quan sát được tất cả mọi người bị vỡ nợ Với một mẫu thường có 2 lý
do giải thích việc dữ liệu bị cắt phải
+ Thời điểm xảy ra sự kiện của một người không quan sát được trong thời gian nghiên cứu Người này vẫn tiếp tục trả được nợ tại thời điểm ta kết thúc nghiên cứu
+ Người được nghiên cứu trả nợ trước hạn, hoặc một lý do nào đó họ rời khỏi tập quan sát
Ví dụ: trong hình dưới là dữ liệu quan sát các khách hàng, thời gian nghiên cứu từ t=0 đến t=3, có 3 người trong bộ dữ liệu, xin được gọi là các quan sát:
Trang 271-quan sát thứ nhất là dữ liệu bị cắt: người vay đã rời khỏi tập quan sát trong thời gian nghiên cứu
2- quan sát thứ hai là một dữ liệu bị cắt: vì thời điểm người vay bị nợ xấu không nằm trong giai đoạn nghiên cứu
3- quan sát thứ ba là một quan sát không bị cắt: vì thời điểm bắt đầu vay cho tới khi bị nợ xấu đều nằm trong giai đoạn nghiên cứu
Hình 2.1: Minh hoạ về các loại quan sát
Nguồn: R.man, Survival analysis in credit scoring, 2014
Đối với hồi quy logisgic để ước lượng xác suất vỡ nợ trong 1 năm, thì các quan sát phải tồn tại ít nhất là 1 năm Phân tích sóng sót ước lượng hàm sống sót xuyên suốt khoảng thời gian mà ta quan sát được trọn vẹn Nếu đối tượng nghiên cứu, mà người đó rời bỏ khỏi danh mục vay, thì đối tượng đó sẽ bị loại bỏ do đó số lượng quan sát trong tập dữ liệu sẽ giảm đi đáng kể Vì vậy, việc mô hình bao phải gồm tất cả quan sát là điều rất quan trọng, nó phải bao gồm cả các quan sát bị cắt, các quan sát rời bỏ hoặc tiếp tục sống sót trong danh mục trong giai đoạn nghiên cứu
Một giả thiết quan trọng trong việc sử dụng dữ liệu bị cắt là tại thời điểm ta không quan sát được dữ liệu (censoring) thì nó không cung cấp thông tin cần thiết cho nghiên cứu tại thời điểm không quan sát được (non-informative Censoring) Giả thiết này phát biểu rằng các quan sát bị cắt thì có cùng mức độ rủi ro vỡ nợ giống
Trang 28như những quan sát còn sống và quan sát được Hoặc nói cách khác, các quan sát rời khỏi danh mục thì được lý giải bởi các lý do không liên quan tới vấn đề cần nghiên cứu Trong luận văn này, việc áp dụng giả thiết này là điều bắt buộc Các đối tượng nghiên cứu trong danh mục tại một thời điểm bất kỳ đều đại diện cho tất cả các đối tượng khác tại cùng thời điểm
2.4.2.2 Dữ liệu bị chặn (truncated data)
Dữ liệu bị chặn là một loại bị mất dữ liệu khác, trong đó dữ liệu bị chặn trái
là hay gặp phải nhất
Một ví dụ trong y khoa, đó là thời gian tử vong của những cư dân lớn tuổi trong cộng đồng những người nghỉ hưu Thời gian từ lúc một người bước vào độ tuổi nghỉ hưu cho đến lúc chết được nghiên cứu Chỉ những người có một độ tuổi nhất định mới được vào cộng đồng trên Những người chết trước tuổi này không thể quan sát Như vậy, chúng ta đã bỏ qua các quan sát những người đã nghỉ hưu đã tử vong nhưng chưa đạt đến tuổi để chọn mẫu quan sát, tuy nhiên về định nghĩa họ vẫn
là người lớn tuổi trong công đồng người nghỉ hưu
Thông thường sẽ có sự nhầm lẫn giữa dữ liệu bị cắt và dữ liệu bị chặn Nói một cách chặt chẽ, dữ liệu bị cắt là trường hợp khi các quan sát được cho rằng sẽ bị
vỡ nợ trong một thời gian nhất định nhưng thời điểm chính xác diễn ra thì không ta
có thông tin Dữ liệu bị chặn là khi quan sát không nằm trong bộ dữ liệu bởi vì chúng không quan sát được Việc hợp nhất các dữ liệu bị chặn sẽ không được đưa vào nghiên cứu trong luận văn này
2.4.3 Các loại mô hình phân tích sống sót
Để mô hình hóa các dữ liệu phân tích, có rất nhiều mô hình có thể áp dụng Trong các phần tiếp theo, tác giả sẽ giới thiệu các mô hình phổ biến như phi tham
số, bán tham số và đầu đủ tham số Theo đó, mô hình Kaplan-Meier là mô hình phi tham số, mô hình gia tốc thời gian mô hình tỷ lệ nguy cơ (proportional Hazards models) là mô hình đầy đủ tham số và cuối cùng là mô hình bán tham số Cox (proportional hazards)
Trang 292.4.3.1 Mô hình Kaplan – Meier
Trong trường hợp dữ liệu bị cắt, nếu ta ước lượng sẽ không cho ra kết quả tốt Để xác định hàm phân phối cho các dữ liệu này, ta có thể áp dụng kỹ thuật Kaplan-Meier (sau đây gọi tắt là ước lượng KM) Ước lượng KM ước lượng hàm phân phối trung vị sống sót (The median Survival Distribution function) Ưu điểm của Kaplan-Meier là đưa các dữ liệu bị cắt vào tính toán Nó là giới hạn của ước lượng bảng sống sót khi các khoảng thời gian được chia nhỏ sao cho nhiều nhất một quan sát khác biệt xuất hiện trong một khoảng thời gian
Giả sử r cá nhân trải qua các sự kiện trong một mẫu quan sát Cho các thời điểm xảy ra sự kiện là 0 ≤ t(1) ≤ t(2) ≤…≤ t(r) ≤ ∞ Đặt ni là số cá nhân trong tình trạng rủi ro (quan sát được và vẫn còn tồn tại) trước thời điểm ti Và đặt di là số các quan sát chết (xảy ra sự kiện) tại thời điểm ti Hàm ước lượng sống sót S(t) theo KM được định nghĩa như sau:
𝐶𝐼[𝑆(𝑡)] = 𝐾𝑀(𝑡) ∗ 𝑒±𝑧𝛼 2⁄ ∗𝑠𝑒[Λ 𝐾𝑀 ̂ ] (𝑡)
Trong đó:
d(x) là số sự kiện xảy ra tại thời điểm x, d(x) ≥ 0
n(x) là số đối tượng đang gặp rủi ro tại thời điểm x,
Λ𝐾𝑀̂ là ước lượng không chệch của tỷ lệ nguy cơ tích lũy tại t (𝑡)
dN(x) là số quan sát xảy ra sự kiện xuất hiện trong khoảng [x; x+ ∆t]
Y(x) là số đối tượng rủi ro tại thời điểm x,
Trang 30w(x) là số quan sát bị cắt tại thời điểm x,
Lưu ý rằng hàm ước lượng KM là một hàm bậc thang, không có sự thay đổi giữa việc người thứ nhất vỡ nợ và người thứ hai vỡ nợ, cũng như tại thời điểm xuất hiện việc dữ liệu bị cắt, nó chỉ thay đổi tại các thời điểm xảy ra sự kiện Ước lượng sống sót KM được trình bày tại bảng … X tại trục hoàn là thời điểm xảy ra sự kiện
và O là thời điểm xuất hiện tượng cắt dữ liệu
Hình 2.2 thể hiện ước lượng hàm Kaplan Meier
Nguồn: R.man, Survival analysis in credit scoring, 2014
Ước lượng KM trong trường hợp dùng để mô tả sự kiện vỡ nợ, khi đó njbằng với số người vay trong danh mục và dj là số các quan sát bị vỡ nợ tại thời điểm
j Khi sử dụng mô hình ước lượng này để xử lý vấn đề, mục tiêu là phải hiểu được
nj thay đổi như thế nào khi đặt trong mối liên quan đến việc cắt dữ liệu và chặn dữ liệu Ví dụ, nếu như một người vay rời khỏi danh mục, điều đó sẽ tác động vào số lượng nguy cơ nhưng không tác động vào các quan sát đã bị vỡ nợ Tương tự như việc một số người bắt đầu bước vào danh mục vào thời điểm t, thì họ sẽ được thiết lập vào mô hình rủi ro tại thời điểm t+1
Ước lượng KM cũng được sử dụng cho các biến phân tầng Khái niệm này
ám chỉ việc chia mẫu thành hai hay nhiều nhóm theo một số tiêu chuẩn Ví dụ như
Trang 31theo mục đích vay vốn: vay thế chấp hoặc khác Việc vẽ đồ thị ước lượng KM cho các nhóm khác nhau giúp chúng ta có cái nhìn trực quan hơn, dễ nhận biết nhóm này có xác suất sống sót cao hơn
Mô hình ước lượng KM có một số ưu điểm chính, đầu tiên là rất dễ tính toán Hơn nữa là khả năng hợp nhất các nhân tố phân tầng để tính các xác suất sống sót cho các nhóm khác nhau Khuyết điểm của ước lượng KM là nó chỉ ước lượng mô
tả là chủ yếu và chưa kiểm soát được các đồng tham số Thêm nữa là không làm sáng tỏ nguyên nhân khi so sánh rủi ro giữ các nhóm
2.4.3.2 Mô hình tham số
Mặc dù ước lượng KM là một công cụ dễ sử dụng để ước lượng hàm sống sót, đôi khi chúng ta muốn mô hình có nhiều thông tin hơn Một trong giải pháp là sử dụng mô hình tham số Đồ thị hàm phân phối ước lượng sống sót phổ biến là hàm mũ, Weibull và phân phối log-logistic Để ước lượng S(t), ước lượng maximum likelihood được sử dụng
Hàm phân phố mũ với tham số 𝜆 được cho như sau:
𝐹(𝑡) = 1 − 𝑒−𝜆𝑡𝑓(𝑡) = 𝜆𝑒−𝜆𝑡ℎ(𝑡) = 𝜆 Hàm phân phối Weibull với tham số cân bằng 𝜆 và tham số định dạng k được cho bởi
𝐹(𝑡) = 1 − 𝑒−(𝜆𝑡)𝑘𝑓(𝑡) = 𝑘𝜆𝑘𝑡𝑘−1𝑒−(𝜆𝑡)
ℎ(𝑡) = 𝑘𝜆𝑘𝑡𝑘−1Đưa dữ liệu vào phân phối tham số có một số ưu điểm Thứ nhất, hàm sống sót S(t) và hàm phân phối tích lũy h(t) được hiệu chỉnh đầy đủ Việc sử dụng các hàm ước lượng này dễ dàng để tính các hàm phân phối tích lũy nghịch đảo và các kiểm định sự khác nhau giữ các tham số sẽ chính xác hơn
Trang 322.4.3.3 Hàm gia tốc thời gian thất bại (Accelerated failure time)
Hàm gia tốc thời gian thất bại (gọi tắt là AFT) đưa ra giả thiết rằng có sự tác động của các đồng tham số trong việc gia tăng hoặc giảm đi thời gian dẫn tới việc xảy ra sự kiện của một quan sát thông qua một số hằng số, theo Kalbfleisch và Prentice (1980) Hàm AFT phát biểu rằng mối quan hệ giữa 2 hàm sống sót S1(t) và
S2(t) được cho bởi:
S1(t) = S2(ct), tất cả t ≥ 0 và hằng số c >0
Hàm AFT bao hàm cả việc tỷ lệ sống sót của tập hợp 1 thì gấp c lần so với tập hợp 2 Khi chúng ta có các biến giải thích cho thời điểm xảy ra tình trạng vỡ nợ, thì mô hình AFT được sử dụng Mô hình AFT dự đoán được thời gian xảy ra sự kiện và do có sự tác động của các đồng tham số nên thời gian thất bại được nhân lên qua một số hằng số Như vậy, việc tác động của các biến giải thích lên thời gian sống sót sẽ được đo lường Điều này đưa đến sự sáng tỏ của các tham số ước lượng, vởi các tham số trong mô hình sẽ đo lường sự ảnh hưởng của đồng tham số lên giá trị trung bình thời gian sống sót
Hàm AFT đơn giản nhất giả định các đồng tham số không phụ thuộc vào thời gian, được cho như sau:
𝑆(𝑡) = 𝑆0(𝜓(𝑧)𝑡) = 𝑆0(exp(𝛽𝑥) 𝑡) ℎ(𝑡) = 𝜓(𝑧)ℎ0(𝑡𝜓(𝑧)) Trong đó, 𝜓(𝑧) là hằng số tỷ lệ và là một hàm của đồng tham số z thông qua
nó thời gian sống sẽ bị giảm đi Thông thường 𝜓(𝑧)được giả định là log linear 𝜓(𝑧)
= exp(𝛽𝑥)và 𝑆0 và ℎ0 được gọi là hàm sống sót cơ sở hay hàm tỷ lệ nguy cơ cơ sở (tức là khi không có sự tác động của đồng tham số)
Giải thích cho 𝜓(𝑧)cũng rất đơn giản Ví dụ, một người có hằng số tỷ lệ 𝜓(𝑧)=2, thời hạn của khoản vay sẽ được ước lượng nhanh gấp 2 lần so với hàm cơ
sở Kết quả là thời gian được ước lượng để cho người đó vỡ nợ sẽ còn một nữa so với thời gian cơ sở Tuy nhiên, tỷ lệ nguy cơ thì không cao hơn gấp 2 lần, tỷ lệ nguy
cơ sẽ được giải thích trong hàm nguy cơ ở phần sau
Trang 332.4.3.4 Hàm tỷ lệ nguy cơ đầy đủ tham số (fully parametric proportional
hazards model)
Theo sau mô hình AFT, mô hình tỷ lệ nguy cơ (PH models gọi tắt là mô hình PH) được sử dụng trong nghiên cứu sống sót Giáo sư Cox (1972) mô tả mô hình lần đầu trong JRSSB năm 1972 và bấy giờ là một bài báo học thuật về thống kê được nhắc lại nhiều nhất Trái ngược với mô hình AFT, mô hình PH ước lượng tỷ lệ nguy cơ Mô hình PH được xây dựng gồm 2 phần: Hàm tỷ lệ nguy cơ cơ sở (The baseline hazard Function) mô tả tỷ lệ nguy cơ thay đổ theo thời gian tính từ hàm cơ
sở Hàm cơ sở là hàm mà hàm các đồng tham số bằng không Sự tác động của các tham số mô tả sự thay đổi tỷ lê nguy cơ thông qua tác động của hàm mũ chứa các đồng tham số Mô hình PH được cho như sau:
ℎ(𝑡|𝑥) = ℎ0(𝑡) exp(𝛽1𝑥1+ 𝛽2𝑥2+ ⋯ + 𝛽𝑝𝑥𝑝) = ℎ0(𝑡) exp(𝛽′𝑥)
𝑙𝑜𝑔ℎ(𝑡|𝑥) = 𝑙𝑜𝑔ℎ0(𝑡) + 𝛽1𝑥1+ 𝛽2𝑥2+ ⋯ + 𝛽𝑘𝑥𝑘Trong đó h0 là hàm nguy cơ cơ sở có thể chấp nhận bất kỳ dạng nào và hàm mũ exp(𝛽′𝑥) ám chỉ đến những rủi ro liên quan hoặc có thể xem như là hàm nguy
cơ bổ sung
Các mô hình tham số có thể sử dụng kiểm định Likelihood raito hoặc AIC (Akaike năm 1974) để so sánh tìm ra mô hình tốt nhất
2.4.3.5 Mô hình Cox (Cox Proportional hazards model)
Nói một cách tổng quát, nếu mô hình PH được sử dụng thì mô hình Cox được sử dụng Mô hình Cox gần như tương tự mô hình tỷ lệ nguy cơ đầy đủ tham số cho trong phương trình ở phần trên Bằng cách sử dụng ước lượng partial likelihood, giáo sư Cox (1975) chỉ ra rằng tham số β có thể được ước lượng mà không cần quan tâm tới hàm nguy cơ cơ sở và do đó mô hình Cox được gọi là mô hình bán tham số Mô hình này dùng các dữ liệu sự kiện được phân hạng và thời gian bị cắt thay thế cho thời điểm thực tế
Sự khác biệt giữ mô hình hồi quy COX và mô hình hồi quy PH thông thường rằng mô hình COX không cần bất kỳ giả thiết nào cho hàm nguy cơ cơ sở h0(t) Đây
là phần phi tham số của mô hình Mô hình đặt giả định cho phần tham số, là các biến làm tác động đến tỷ lệ nguy cơ Bởi vì điều này, mô hình COX giống như mô
Trang 34hình bán tham số và mô hình này ước lượng rủi ro tương đối (relative risk) thay thế cho rủi ro tuyệt đối (Absolute risk) Vì không có giả thiết nào đặt ra cho hàm cơ sở nên mô hình này rất dễ để xử lý số liệu
Để mô hình COX có ý nghĩa thì giả định của tỷ lệ nguy cơ phải được tuân thủ Giả định này phát biểu rằng rủi ro dẫn tới vỡ nợ của các nhóm khác nhau là hằng số qua thời gian Bản chất của giả định này nghĩa là sự tác động của các đồng tham số là không thay đổi tại mọi thời điểm Ví dụ, tại thời điểm ban đầu nhóm quan sát 1 có độ rủi ro cao gấp 2 lần so với nhóm quan sát 2, thì độ rủi ro của nhóm
1 sẽ cao gấp 2 lần nhóm 2 tại mọi thời điểm
Để kiểm định giả định của mô hình COX, tác giả dùng hai loại đồ thị điểm
để kiểm định cho 2 loại biến: biến liên tục và biến phân loại Đối với biến liên tục, tác giả sẽ dùng đồ thị scatter cho phần dư riêng phần (hay còn gọi là Schoenfeld residuals) theo thời gian; các phần dư trong đồ thị phải thể hiện ngẫu nhiên không theo một quy luật nào Đối với biến phân loại; tác giả sử dụng đồ thị Log minus Log; theo đó các nhóm sẽ không được cắt nhau và có vẽ như song song
2.5 Các nghiên cứu trước đây
Bảng dưới đây thể hiện một số nghiên cứu chấm điểm tín dụng cá nhân tiêu dùng tại các nước trên thế giới và tại Việt Nam và mô hình nghiên cứu được áp
dụng, đặc biệt các nghiên cứu sử dụng mô hình phân tích sống sót để nghiên cứu:
Bảng 2.2 : Các nghiên cứu chấm điểm tín dụng
phân tích
Kết quả của nghiên cứu
Mô hình logit
Những khoản vay đã trải qua vài năm, thì lịch sử trả nợ của người vay là nhân tố quan
Trang 35thu nhập hàng tháng, nghề nghiệp, số người phụ thuộc, tuổi hiện tại của người vay, tỷ lệ thất nghiệp trong bang, tỷ lệ bán lẻ trên hộ gia đình trong bang, chỉ số thu nhập hiệu quả bán hàng trong bang, số tiền trung bình một hộ chi trả tiền điện thoại trong 1 bang 1 năm,
số tháng trung bình để tịch thu tài sản thế chấp, số tháng mà người vay chuộc lại tài sản sau khi bị tịch thu
trọng nhất trong việc định lượng
cư trú tại địa chỉ khai báo, thời gian sử dụng dịch vụ ngân hàng, thời gian làm việc cho một công ty
Hồi quy
đa biến, phân tích sống sót
Phân tích sống sót cộng các chiều để cung cấp cho thẻ điểm tiêu chuẩn
Mô hình Logit
Nghiên cứu làm tăng khả năng tuỳ ứng khi so sánh với mô hình đếm chuẩn
Trang 36nghiên cứu, trình độ học vấn, có hay không người vay được trả lương qua ngân hàng, thu nhập thuần hàng tháng, tổng số lượng thu nhập, tình trạng sở hữu nhà, vị trí địa lý, các khoản chi trả hàng tháng, dư nợ
thẻ tín dụng, lượng tiền cần vay, lãi suất, ngày bắt đầu hợp đồng vay
Mô hình Logistic,
mô hình phân tích sống sót
Việc sử dụng
mô hình phân tích sống sót trong chấm điểm tín dụng
Mô hình phân tích sống sót
Sử dụng mô hình phân tích sống sót từ mô hình đáng tin cậy và được duy trì cho phép người nghiên cứu xây dựng
mô hình chấm điểm tín dụng
có thể ước định
Trang 37mở tài khoản vay, thời hạn khoản vay, có sở hữu nhà hay không, mục đích vay
lợi nhuận cũng như khả năng
mã hàng hoá mua, giá hàng hoá mua, dữ liệu chi trả
Mô hình phân tích sống sót, mô hình hồi quy Logistic,
Mô hình Cox phi tham số
Đô chính xác cuả dự đoán không bị tác động bởi cách tiếp cận phân tích Mô hình phân tích sống sót đưa ra một
số lợi ích, điều này làm cho mô hình được sử dụng nhiều hơn khi so sánh với
mô hình phân tích hồi quy Baesens,
em phụ thuộc, khoản tiền chi trả thông thường, có cung cấp số điện thoại bàn hay không, giá trị bảo hiểm, loại vay, tình trạng hôn nhân, kỳ hạn vay, tình trạng sở hữu nhà ở, mục
Phương pháp thống kê
và mạng thần kinh, phân tích sống sót, mô hình hồi
Những mô hình này chịu một số lượng thiếu hụt, cách tiếp cận bằng mô hình mạng thần kinh không thể hiện kết quả tốt hơn
mô hình phân tích sống sót
Trang 38cư trú, số người phụ thuộc, phương tiện đi lại, phương tiện thông tin, chênh lệch thu nhập và chi tiêu, giá trị tài sản, giá trị khoản nợ, quan hệ với Techcombank,
uy tín trong giao dịch
Phương pháp Logit
Sử dụng mô hình Logit để phân tích dựa trên những đặc trưng của người vay tại Việt Nam Tác giả đã loại đi 2 biến thời gian công tác và uy tín trong giao dịch trong mô hình Đinh Thị
số người phụ thuộc, thời gian làm công việc hiện tại, tình trạng hôn nhân,
Phương pháp CSMs
và đường cong ROC
Nghiên cứu đưa
ra mô hình dùng trong chấm điểm xếp hạng tín dụng tại thị trường cho vay bán lẻ ở Việt Nam