Việc phân khúc dựa trên hành vi tiêu dùng của khách hàng cụ thể là các khách hàng sử dụng thẻ tín dụng, khách hàng tiền gửi và lịch sử giao dịch tiền gửi, và khách hàng tiền vay một số p
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH
-
PHẠM VĂN HẬU
PHÂN TÍCH HÀNH VI KHÁCH HÀNG HƯỚNG ĐẾN PHÂN
KHÚC THỊ TRƯỜNG TỪ DỮ LIỆU BIGDATA
TRƯỜNG HỢP CỦA SACOMBANK
LUẬN VĂN THẠC SĨ KINH TẾ
Thành Phố Hồ Chí Minh – Năm 2019
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH
-
PHẠM VĂN HẬU
PHÂN TÍCH HÀNH VI KHÁCH HÀNG HƯỚNG ĐẾN PHÂN
KHÚC THỊ TRƯỜNG TỪ DỮ LIỆU BIGDATA
TRƯỜNG HỢP CỦA SACOMBANK
Chuyên ngành: Quản trị kinh doanh
Hướng đào tạo: Hướng ứng dụng
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan rằng những nội dung tôi viết trong bài báo cáo này là do tôi thực hiện trên cơ sở tham khảo các tài liệu liên quan đến đề tài và số liệu trong bài báo cáo
là hoàn toàn trung thực Tôi xin chịu hoàn toàn trách nhiệm về lời cam đoan này
Người thực hiện đề tài
Trang 4MỤC LỤC TRANG PHỤ BÌA
LỜI CAM ĐOAN
MỤC LỤC DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
DANH MỤC CÁC BẢNG BIỂU DANH MỤC CÁC BIỂU ĐỒ
TÓM TẮT
ABSTRACT
LỜI MỞ ĐẦU 1
CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU 4
1.1 Lý do chọn đề tài 4
1.2 Mục tiêu nghiên cứu 5
1.3 Phương pháp nghiên cứu 6
1.3.1 Đối với số liệu phục vụ nghiên cứu 6
1.3.2 Các khái niệm tiếp cận trong nghiên cứu 7
1.3.3 Phạm vi nghiên cứu của luận văn 8
1.3.4 Kết cấu của luận văn 9
CHƯƠNG 2: CƠ SỞ LÝ LUẬN 10
2.1 Big Data 10
2.2 Khai phá dữ liệu (Data Mining) 10
2.3 Hành vi tiêu dùng 13
2.3.1 Định nghĩa 13
2.3.2 Hành vi tiêu dùng đƣợc phân khúc theo RFM 19
Trang 52.4 Phân khúc thị trường 20
2.4.1 Định nghĩa phân khúc thị trường 20
2.4.2 Lựa chọn thị trường mục tiêu…… 22
2.4.3 Định vị sản phẩm trên thị trường mục tiêu 24
2.5 Một số khái niệm khác 25
2.5.1 Mô hình ma trận giá trị khách hàng (Custumer Value Matrix Model… 25
2.5.2 Phương pháp RFM 26
2.5.3 Giá trị vòng đời khách hàng (Custumer Lifetime Value - CLV) 27
2.5.4 Thuật toán phân cụm (Clustering) 27
2.5.5 Thuật toán K-means 30
2.6 Quy trình nghiên cứu 31
CHƯƠNG 3: BIG DATA VÀ ỨNG DỤNG BIG DATA TẠI SACOMBANK…33 3.1 Big Data và ứng dụng của Big data trong lĩnh vực ngân hàng 33
3.1.1 Big data 33
3.1.2 Ứng dụng của Big data trong lĩnh vực ngân hàng 33
3.2 Ứng dụng big data tại Sacombank 40
3.2.1 Giới thiệu về Sacombank 40
3.2.2 Ứng dụng big data tại Sacombank 43
CHƯƠNG 4: PHÂN TÍCH DỮ LIỆU BIG DATA 46
4.1 Số liệu phục vụ nghiên cứu 46
4.2 Thông tin giao dịch khách hàng 46
4.2.1 Đối với khách hàng tiền gửi 46
Trang 64.2.2 Đối với khách hàng sử dụng thẻ tín dụng 48
4.2.3 Đối với khách hàng tiền vay 49
4.3 Phân tích hành vi và phân khúc khách hàng 51
CHƯƠNG 5: KẾT LUẬN VÀ XÂY DỰNG CHIẾN LƯỢC 58
ĐỀ XUẤT CHIẾN LƯỢC KINH DOANH 58
5.1 Chiến lược kinh doanh đề xuất theo phân khúc khách hàng 60
5.1.1 Chiến lược cho nhóm khách hàng tốt nhất (Best) 60
5.1.2 Chiến lược cho nhóm khách hàng mới (New) 65
5.2 Chiến lược phản hồi của khách hàng (feelback) 67
KẾT LUẬN 70
TÀI LIỆU THAM KHẢO
PHỤ LỤC
Trang 7DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
SACOMBANK Ngân hàng Thương Mại Cổ Phần Sài Gòn Thương
Tín
(Giá trị đóng góp của khách hàng theo thời gian)
RFM Recency, Frequency, Monatery
Trang 8DANH MỤC CÁC BẢNG BIỂU
Bảng 1.1 Thông tin khách hàng từ tháng 10/2018 đến tháng 10/2019 Bảng 2.1 Các bước trong quá trình khai thác dữ liệu
Bảng 2.2 Ứng dụng của khai thác dữ liệu
Bảng 2.3 Bảng mô tả điểm theo RFM
Bảng 2.4 Mô tả ma trận giá trị khách hàng
Bảng 2.5 Các tham số của ma trận quan hệ khách hàng
Bảng 2.6 Chuyển đổi dữ liệu
Bảng 2.7 Các phương pháp cơ bản của thuật toán phân cụm
Bảng 2.8 Các bước cơ bản của thuật toán K-means
Bảng 4.1 Thông tin loại thẻ tín dụng được sử dụng bởi khách hàng Bảng 5.1 Khung điểm xếp hạng đề xuất
Bảng 5.2 Chính sách ưu đãi đề xuất cho khách hàng sapphire
Bảng 5.3 Kế hoạch phân bổ nguồn lực cho nhóm khách hàng tốt nhất Bảng 5.4 Chiến lược đề xuất dành cho nhóm khách hàng mới
Bảng 5.5 Kế hoạch xây dựng chiến lược feelback
Trang 9DANH MỤC CÁC BIỂU ĐỒ
Biểu đồ 2.1 Quy trình khai thác dữ liệu
Biểu đồ 2.2 Mô hình ma trận giá trị khách hàng
Biểu đồ 2.3 Ví dụ về các thuật toán phâm cụm cổ điển
Biểu đồ 2.4 Ví dụ về phân cụm bằng phương pháp K-means
Biểu đồ 2.5 Quy trình nghiên cứu
Biểu đồ 3.1 Tổng tài sản của Sacombank giao đoạn 2014-2018
Biểu đồ 3.2 Tổng nguồn vốn huy động của Sacombank giao đoạn 2014-2018 Biểu đồ 3.3 Tổng cho vay khách của Sacombank giao đoạn 2014-2018
Biểu đồ 3.4 Lợi nhuận trước thuế của Sacombank giao đoạn 2014-2018
Biểu đồ 4.1 Thông tin tiền gửi theo thời gian của khách hàng
Biểu đồ 4.2 Thông tin nhóm thẻ tín dụng khách hàng quan tâm
Biểu đồ 4.4 Thông tin vay của khách hàng
Biểu đồ 4.5 Thông tin vay theo giá trị và thời gian vay
Biểu đồ 4.6 Mô hình ma trận khách hàng
Biểu đồ 4.7 Phân khúc thị trường dựa vào mô hình RFM
Biểu đồ 4.8 Thông tin vay vốn theo nhóm phân khúc khách hàng
Biểu đồ 4.9 Phân khúc thị trường và mối quan hệ với khách hàng
Biểu đồ 4.10 Thông tin phân khúc thị trường theo dịch vụ tham gia và số dư nợ thẻ
Trang 10TÓM TẮT
Đề tài “Phân tích hành vi khách hàng hướng đến phân khúc thị trường từ dữ liệu bigdata: Trường hợp của Sacombank” với mục đích phân tích hành vi khách hàng, đặc điểm lựa chọn dịch vụ của khách hàng, việc phân tích hành vi khách hàng
từ nguồn dữ liệu big data Điều này không những góp phần vào việc xác định lại phân khúc thị trường để ngân hàng có hướng tiếp cận phù hợp, trên cơ sở để phát triển thêm vào các dịch vụ hướng đến phục vụ khách hàng một cách hiệu quả nhằm giữ chân khách hàng cũ, hạn chế sự rời dịch vụ của khách hàng và tạo tiếng vang lôi kéo khách hàng mới
Đề tài áp dụng vào mô hình CLV (customer lifetime value) - giá trị đóng góp của khách hàng theo thời gian để tính RFM (Recency, Frequency, Monetary) trước khi hướng đến phân khúc thị trường Việc phân khúc dựa trên hành vi tiêu dùng của khách hàng cụ thể là các khách hàng sử dụng thẻ tín dụng, khách hàng tiền gửi và lịch sử giao dịch tiền gửi, và khách hàng tiền vay một số phương pháp phân cụm (cluster) và phân cụm theo RFM (thời gian mua hàng gần nhất, tần suất giao dịch của khách hàng tổng giá trị giao dịch dựa trên nguồn dữ liệu big data của Sacombank)
Việc nghiên cứu này được ban lãnh đạo phía ngân hàng kỳ vọng rất lớn, vì kết quả nghiên cứu từ tài nguyên dữ liệu là việc làm thực tế, giúp Sacombank phân khúc
hệ khách hàng của mình thành từng nhóm từ đó có các giải pháp chiến lược hướng vào từng phân khúc khách hàng cụ thể và các chiến lược được đề xuất từ nghiên cứu
là một áp dụng chính thức cho năm 2020
Trang 12LỜI MỞ ĐẦU
Nền kinh tế thế giới nói chung và thị trường kinh tế Việt Nam nói riêng trong những năm vừa qua đều có sự chuyển dịch mạnh mẽ, ảnh hưởng không nhỏ đến các đối tượng kinh tế và ngành Ngân hàng cũng không phải là trường hợp ngoại lệ mà điển hình là hoạt động của các Ngân hàng thương mại Nguồn thu lãi từ tín dụng được biết đến như là kim chỉ nam hoạt động của Ngân hàng thương mại, tuy nhiên những năm gần đây khi nhắc đến tổng lợi nhuận sau thuế của Ngân hàng thương mại thì không thể không kể đến nguồn thu từ hoạt động dịch vụ, đặc biệt là sự tăng trưởng vượt bậc của mảng bancassurance
Theo nhận định của các chuyên gia kinh tế, nhờ tín dụng tăng trưởng mạnh nên không chỉ thu nhập lãi thuần, mà nguồn thu từ các hoạt động dịch vụ của ngân hàng cũng đã cải thiện rõ nét trong năm qua Điều này minh chứng rằng, lợi nhuận sau thuế của các ngân hàng thương mại đang giảm dần sự phụ thuộc vào hoạt động tín dụng nhờ nỗ lực đẩy mạnh nguồn thu từ dịch vụ, tuy nguồn thu từ dịch vụ có những bước chuyển mình rõ rệt, nhưng hoạt động chính của ngành ngân hàng nước
ta hiện nay vẫn phụ thuộc nhiều vào hoạt động tín dụng, nhất là đối với các ngân hàng nhỏ Chính vì lý do này, các ngân hàng cần chú trọng đẩy mạnh hơn nữa việc phát triển dịch vụ trên nền tảng công nghệ số, công nghiệp 4.0 để phân tán rủi ro Để giải đáp bài toán về chuyển đổi cơ cấu nguồn thu, các ngân hàng cần quan tâm và chú trọng hơn nữa trong việc đưa ra các giải pháp tài chính hiệu quả, đa dạng hóa sản phẩm dịch vụ
Dữ liệu khách hàng hay “customer data” được coi là tài sản, nguồn thông tin
vô giá đối với mọi công ty thuộc nhiều lĩnh vực kinh doanh khác nhau Việc triển khai các quy trình khai thác, dự án nghiên cứu phân tích dữ liệu khách hàng với mục đích tìm hiểu, nắm bắt mong muốn, nhu cầu thầm kín của khách hàng và chuyển nó thành những giá trị cụ thể thông qua từng chiến lược, kế hoạch hoạt động chính là chìa khóa cạnh tranh của mỗi tổ chức ngày nay Đặc biệt so với 10 năm trước đây, thì hiện tại với sự phát triển của khoa học công nghệ, kỹ thuật qua đó nâng cao khả năng
Trang 13của các công ty trong việc tiếp cận gần hơn với khách hàng, tiếp cận gần hơn với mỗi
dữ liệu chứa đựng thông tin về sở thích, hành vi của khách hàng
Tuy nhiên để đạt được các mục tiêu đề ra khi sử dụng dữ liệu khách hàng, hỗ trợ những chiến lược kinh doanh một cách hiệu quả thì không phải là điều đơn giãn hay dễ dàng, mà nó chứa đựng muôn vàng thách thức, khó khăn khác nhau thậm chí
cả rủi ro, ví dụ trường hợp công ty bị tin tặc tấn công hệ thống mạng, hệ thống dữ liệu, bị rò rỉ, đánh cắp dữ liệu là thông tin cá nhân của khách hàng “Hãy tiến gần hơn đến với các khách hàng của bạn, gần đến nổi bạn có thể nói cho họ biết họ cần gì trước khi họ nhận ra.” – Steve Jobs Câu nói của Steve Jobs càng thích hợp để nói về khuynh hướng tiếp cận khách hàng ngày nay của đa số các công ty Trong thị trường cạnh tranh khóc liệt hiện tại, việc chủ động tìm kiếm và xác định, lôi kéo khách hàng tiềm năng bằng những chiến lược marketing, chiến lược sản phẩm thích hợp sẽ giúp một công ty có cơ hội vượt lên trên đối thủ của mình Dĩ nhiên để thực hiện mục đích trên, công ty phải biết được khách hàng mình cần thu hút là ai, khách hàng nào sẽ đem lại giá trị lợi nhuận, khách hàng nào có thể mua sản phẩm dịch vụ, tất cả thông tin có được phải dựa trên nguồn dữ liệu lớn (hay còn gọi là big data) mà công ty sẽ được thu thập, quản lý và phân tích
Đã có nhiều công trình nghiên cứu rất thành công trong việc sử dụng Big Data
để phân tích mức độ tiêu dùng của khách hàng Tuy nhiên, điểm chung của các nghiên cứu này đều chỉ ra rằng Big Data luôn cho phép tổ chức kinh doanh thao tác quản lý các tập dữ liệu cực kỳ lớn và phức tạp mà không một ứng dụng xử lý dữ liệu truyền thống nào có thể hỗ trợ
Theo Forbes, 87% các công ty coi Big Data sẽ tạo ra những thay đổi lớn cho ngành công nghiệp của chính mình cho đến cuối thập kỷ thứ 2 của thế kỷ 21 Ngay
cả bản thân các công ty cũng có chung một suy nghĩ rằng nếu không chú trọng trong công tác phân tích dữ liệu lớn và đưa ra các chiến lược cụ thể dựa trên phân tích thực nghiệm sẽ khiến công ty rơi vào tình trạng kinh doanh bất ổn định
Ngày nay, hầu hết các tổ chức ngân hàng, dịch vụ tài chính và bảo hiểm đang
nỗ lực để áp dụng một cách tiếp cận mới theo hướng khai thác dữ liệu để phát triển
Trang 14và đổi mới các dịch vụ mà họ cung cấp cho khách hàng Giống như hầu hết các ngành công nghiệp khác phân tích dữ liệu lớn (big data analytics) sẽ là một trong những thay đổi lớn, quan trọng trong cuộc chiến giữa các tổ chức cùng ngành
Mặc dù nhiều tổ chức ngân hàng, dịch vụ tài chính và bảo hiểm đang thay đổi cách thức khai thác dữ liệu bằng cách thu thập một khối lượng dữ liệu khổng lồ và tiến hành phân tích, nhưng đó chỉ là những bước tổng quát, những bước riêng lẻ ở từng giai đoạn trong quy trình khai thác dữ liệu big data Trong tất các trường hợp, các dự án big data được hình thành đều hướng đến mục tiêu ban đầu là trả lời cho câu hỏi: “những dữ liệu này có thể giúp chúng ta giải quyết các vấn đề kinh doanh như thế nào?”
Khi khối lượng khách hàng tăng lên, nó ảnh hưởng đáng kể đến mức độ, khả năng cung cấp dịch vụ của từng tổ chức Thực tiễn cho thấy việc phân tích dữ liệu hiện tại đã đơn giản hóa quá trình theo dõi và đánh giá khách hàng tín dụng của các ngân hàng và các tổ chức tài chính, dựa trên khối lượng dữ liệu như thông tin, hồ sơ
cá nhân và các thông tin bảo mật khác Nhưng với sự giúp đỡ của big data, các ngân hàng có thể khai thác để liên tục theo dõi hành vi của khách hàng trong thời gian thực, xác định các nguồn dữ liệu cần thiết để thu thập phục vụ cho việc đưa ra giải pháp
Trang 15CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN
CỨU 1.1 Lý do chọn đề tài
Nhu cầu ngày càng cao của khách hàng là bài toán thách thức cần lời giải đáp của doanh nghiệp nói chung và ngành ngân hàng nói riêng Điều này đòi hỏi ngân hàng hay doanh nghiệp phải thay đổi chiến lược phát triển theo hướng đa dạng hóa tiện ích của các dòng sản phẩm, dịch vụ và chú trọng công tác chăm sóc khách hàng Thực tiễn chỉ ra rằng nguồn dữ liệu hiện hữu của một tổ chức kinh doanh là một tài nguyên quan trọng, việc phân tích nguồn tài nguyên này phần nào giúp việc đơn giản hóa quá trình giám sát và tìm hiểu nhu cầu khách hàng một cách hiệu quả Với nguồn
dữ liệu lớn sẵn có, cụ thể là nguồn số liệu từ big data (tạm dịch là dữ liệu lớn), các ngân hàng có thể tự khai thác thông tin để tiếp tục theo dõi hành vi tiêu dùng của khách hàng trong tương lai, từ đó đưa ra chiến lược, chính sách phù hợp Quá trình theo dõi đánh giá hồ sơ khách hàng dựa vào thông tin hiện có hoặc đặc điểm khách hàng sẽ giúp ngân hàng giảm thiểu được rủi ro đến mức nhỏ nhất Điều này góp phần trong khai thác hiệu quả đối tượng khách hang, đảm bảo vị thế cạnh tranh trên thị trường
Ngân hàng Thương Mại Cổ Phần Sài Gòn Thương Tín (Sacombank) được biết đến là một trong những ngân hàng thương mại nằm trong top đầu của hệ thống Ngân hàng Việt Nam Với lịch sử 28 năm thành lập và phát triển, Sacombank tiếp tục giữ vững chiến lược phát triển là ngân hàng bán lẻ với mục tiêu rõ ràng “kinh doanh hiệu quả - hoạt động an toàn – tăng trưởng bền vững” phù hợp trong bối cảnh nền kinh tế thị trường đầy khó khăn Sacombank không ngừng nỗ lực trong việc đẩy mạnh phát triển công nghệ số, nâng cao chất lượng dịch vụ, đa dạng hóa sản phẩm với tính bảo mật cao, cung cấp các giải pháp tài chính hiệu quả, chuyên nghiệp hóa công tác chăm sóc khách hàng Bên cạnh những cơ hội phát triển, Sacombank cũng phải đối mặt với nhiều bài toán thách thức của thị trường Mức độ cạnh tranh ngày càng gay gắt giữa các ngân hàng là một trong những thách thức đầu tiên và đầy khó khăn mà không chỉ Sacombank phải tìm cách giải quyết Đặc biệt, sự liên kết và sát nhập giữa Ngân hàng
Trang 16ngoại với Ngân hàng nội sẽ gây thêm nhiều khó khăn hơn trong việc cạnh tranh, bởi
sự liên kết này sẽ chiếm ưu thế hơn với sản phẩm dịch vụ có chất lượng cao, kinh nghiệm chuyên nghiệp, năng lực quản trị tốt và mạng lưới toàn cầu cùng sự am hiểu đặc thù kinh tế tại địa phương Hai là, nhu cầu của khách hàng ngày một tăng cao, đòi hỏi Ngân hàng phải đáp ứng thường xuyên việc tối ưu hóa các sản phẩm dịch vụ, nâng cao chất lượng dịch vụ, quy trình, thủ tục đơn giải, nhanh chóng và hướng về mục tiêu chất lượng trong kinh doanh
Trong những năm gần đây, Sacombank đã chi ra một khoảng không nhỏ đầu
tư hệ thống lưu trữ dữ liệu Đến thời điểm hiện tại, nguồn dữ liệu lưu trữ trong các data warehouse đã trở thành một nguồn big data Tuy nhiên việc khai thác dữ liệu từ nguồn big data đang là bài toán không dễ cho các bộ phận có liên quan Để ngân hàng hiểu hơn về hành vi khách hàng, đặc điểm lựa chọn dịch vụ của khách hàng, việc phân tích hành vi khách hàng từ nguồn dữ liệu big data là cực kỳ quan trọng Điều này không những góp phần vào việc xác định lại phân khúc thị trường để ngân hàng
có hướng tiếp cận phù hợp, trên cơ sở để phát triển thêm vào các dịch vụ hướng đến phục vụ khách hàng một cách hiệu quả nhằm giữ chân khách hàng cũ, hạn chế sự rời dịch vụ của khách hàng và tạo tiếng vang lôi kéo khách hàng mới Đây là lý do nghiên
cứu của đề tài sẽ hướng đến chủ đề “Phân tích hành vi khách hàng hướng đến phân
khúc thị trường từ dữ liệu big data: Trường hợp của Sacombank” Đề tài này có thể
nói rằng, là việc làm mới trong lĩnh vực nghiên cứu tại ngân hàng Việc nghiên cứu này rất được ban lãnh đạo phía ngân hàng kỳ vọng, vì kết quả nghiên cứu từ tài nguyên
dữ liệu là việc làm thực tế Các chiến lược được đề xuất từ nghiên cứu là một áp dụng chính thức cho năm 2020
1.2 Mục tiêu nghiên cứu
Phân tích hành vi tiêu dùng thông qua lịch sử giao dịch của khách hàng tham tham gia dịch vụ tiền gửi, sử dụng thẻ và tiền vay từ đó hướng đến thực hiện phân khúc thị trường theo các nhóm tiêu dùng
Trang 17Phát triển các giải pháp kinh doanh hạn chế rủi ro rời dịch vụ của khách hàng, tăng cường các chiến lược kinh doanh giúp giữ chân khách hàng hiện tại, khai thác khách hàng mới
1.3 Phương pháp nghiên cứu
1.3.1 Đối với số liệu phục vụ nghiên cứu
Nguồn dữ liệu phục vụ nghiên cứu luận văn được chiết xuất từ nguồn dữ liệu Big Data của ngân hàng Nguồn này được chứa trong các hệ thống lưu trữ của Sacombank Việc xuất dữ liệu là dựa vào thống core T24 (hệ thống lõi của ngân hàng sacombank), CRM (hệ thống thu thập và quản lý thông tin khách hàng), mis (data warehouse), portal Đây là những nguồn dữ liệu cực kỳ quan trọng bởi độ tin cậy lớn và ghi lại chính xác hành vi tiêu dùng của khách hàng trong quá trình tham gia giao dịch cũng như sử dụng sản phẩm dịch vụ của Sacombank Mặc dù số liệu không thuộc dạng khảo sát, tuy nhiên việc sử dụng nguồn dữ liệu Big Data này được xem như là một
xu hướng mới trong việc nghiên cứu các vấn đề kinh tế trong kỷ nguyên công nghệ thông tin phát triển Nguồn tài nguyên từ Big Data phản ánh một cách trung thực nhất
về hành vi và lịch sử tiêu dùng của khách hàng theo thời gian Qua đó, kết quả của quá trình nghiên cứu sẽ mang độ tin cậy cao hơn Tuy nhiên, nguồn tài nguyên này được cung cấp từ phía Ngân hàng nên cần có tính bảo mật cao, nên nghiên cứu này tác giả đề xuất phần dữ liệu sẽ không được công bố rộng rãi
Số liệu được tập hợp từ các nguồn khác nhau theo loại khách hàng, trong đó
có khách hàng sử dụng thẻ tín dụng, khách hàng tiền gửi và lịch sử giao dịch tiền gửi,
và khách hàng tiền vay Để hạn chế những thông tin nhiễu, các khách hàng được chọn đưa vào nghiên cứu có thời gian tham gia dịch vụ trên 12 tháng Thời gian nghiên cứu của số liệu đối với khách hàng là 12 tháng, tính từ ngày 01/10/2018 đến ngày 30/10/2019 Thời gian đưa vào nghiên cứu mỗi mã khách hàng có nhiều dòng thông tin, nói cách khác mỗi một dòng là một giao dịch của khách hàng Việc xác định số lần giao dịch của mỗi khách hàng dựa vào mã khách hàng thống kê từ hệ thống báo cáo Các đối tượng khách hàng trong nghiên cứu là khách hàng có tham gia giao dịch
Trang 18trong thời gian nghiên cứu trên, công cụ được sử dụng hỗ trợ phục vụ phân tích là SPSS Modeler 18 Thông tin các nhóm khách hàng có thể thấy ở bảng 1.1
4.642
Khách hàng tiền vay 2.349 dòng là số dòng giao dịch
trực tiếp với ngân hàng của khách hàng
1.421
Khách hàng tiền gửi và
giao dịch tiền gửi
130.150 dòng là số dòng giao dịch tiền gửi của khách hàng với ngân hàng
59.650
Nguồn: Tổng hợp từ big data
Mặc dù theo bảng 1.1 số khách hàng tham gia các loại dịch vụ nêu trên có sự khác biệt về số lượng khách hàng Tuy nhiên một khi các nhóm khách hàng này được hợp thành một phai (được merged) số khách hàng có tham gia sử dụng thẻ tín dụng, tham gia dịch vụ tiền vay, tham gia dịch vụ tiền gửi trong thời gian nghiên cứu của
12 tháng là 1.421 khách hàng
1.3.2 Các khái niệm tiếp cận trong nghiên cứu
Khái niệm được sử dụng trong nghiêu cứu là phân khúc thị trường và giá trị đóng góp của khách hàng theo thời gian (customer lifetime value) Việc phân khúc thị trường đã được nhiều nghiên cứu trước đây thực hiện trong lĩnh vực ngân hàng (Doğan, Ayçin, & Bulut, 2018) đã thực hiện phân khúc thị trường dựa vào các khái niệm của RFM dựa trên nguồn dữ liệu big data của một công ty, trong đó R là Recency, tức là thời gian mua hàng gần nhất tính đến thời điểm nghiên cứu F là Frequency là tần suất giao dịch của khách hàng trong thời gian mà nghiên cứu đang thực hiện, chẳng hạn thời gian nghiên cứu là 6 tháng hoặc 12 tháng, tần suất giao dịch hoặc mua hàng sẽ được tính toán M là Monetary tức đo lường tổng giá trị mà khách hàng mua sắm trong khoảng thời gian nghiên cứu Tượng tự, (Khajvand & Tarokh,
Trang 192011) đã sử dụng mô hình RFM như nêu trên để hướng đến phân phúc thị trường trong lĩnh vực ngân hàng bán lẻ Sau khi xác định được từng giá trị của R, F, M, tác giả thực hiện phân thành bốn phân khúc thị trường Dựa vào RFM, Khajvad & Tarokh
đã xác định CLV của từng khách hàng
Một cách khác biệt, để đo lường giá trị đóng góp của khách hàng theo thời gian (CLV) trong lĩnh vực ngân hàng, (Kahreh, Tive, Babania, & Hesan, 2014) đã sử dụng các giá trị doanh thu và chi phí hoạt động để các định giá trị đóng của khách theo thời gian tham gia dịch vụ của khách hàng tại một ngân hàng Tuy nhiên loại số liệu sử dụng trong trường hợp này dựa vào nguồn khảo sát trực tiếp của tác giả
Ở một trường khác, (Kim, Jung, Suh, & Hwang, 2006) đã sử dụng nguồn số liệu từ big data trong lĩnh vực viễn thông với 200 biến và 16.384 dòng ghi lại hành vi giao dịch của khách hàng để xác định CLV Bước tiếp theo của việc tính toán CLV, tác giả đã hướng đến phân khúc thị trường, trong đó phương pháp phân tích cây quyết định (decision tree) được sử dụng để hướng đến nhóm các hành vi tiêu dùng
Xuất phát từ các nhận định trên, nghiên cứu của luận văn lần này sẽ áp dụng vào mô hình của (Khajvand & Tarokh, 2011) để tính RFM trước khi hướng đến phân khúc thị trường Việc tính toán CLV cũng sẽ được luận văn đề cập trong phần tiếp theo
1.3.3 Phạm vi nghiên cứu của luận văn
Nguồn dữ liệu chính là từ big data để khai thác hành vi tiêu dùng của khách hàng, thời gian nghiên cứu của số liệu đối với khách hàng là 12 tháng, tính từ ngày 01/10/2018 đến ngày 30/10/2019 Mặc dù hệ thống ngân hàng Sacombank có mặt tất
cả các vùng trong cả nước, nhưng trong nghiên cứu này, số khách hàng được nghiên cứu chỉ tập trung và khách hàng cá nhân và tham gia giao dịch tại thành phố Hồ Chí Minh
Mô hình ứng dụng trong nghiên cứu dựa vào các thuật toán Đề tài không vận dụng phương pháp định tính Việc nghiên cứu này được thực hiện dựa trên sự đề xuất của ban lãnh đạo tại ngân hàng Đây là một nghiên cứu thực tế, kết quả nghiên cứu
để cho ra các chiến lược sẽ được triển khai vào đầu năm 2020
Trang 201.3.4 Kết cấu của luận văn
Luận văn được chia làm 5 chương, với các nội dung sau:
Chương 1: Giới thiệu tổng quan về đề tài nghiên cứu
Chương 2: Cơ sở lý luận
Chương 3: Big data và ứng dụng của Big data tại Sacombank Chương 4: Phân tích dữ liệu big data
Chương 5: Kết luận và đề xuất chiến lược
Trang 21CHƯƠNG 2: CƠ SỞ LÝ LUẬN 2.1 Big Data
Dữ liệu lớn có thể bao gồm cả dữ liệu cấu trúc và không cấu trúc hay bán cấu trúc Các hoạt động được tạo lập trong hệ thống đều được Big Data ghi lại Đối với hoạt động kinh doanh, dữ liệu này sẽ ghi lại tất cả lịch sử tiêu dùng của khách hàng trong suốt thời gian giao dịch, dữ liệu này sẽ ngày càng phong phú, đa dạng hơn theo thời gian Đây là nguồn dữ liệu hữu ích mà các tổ chức có thể sử dụng trong việc truy vấn thông tin để phát triển chiến lược kinh doanh, hay tạo lập môi trường quản lý chuyên nghiệp
Hiểu được tầm quan trọng và “cơ hội kinh doanh” từ Big Data, hiện nay các ngân hàng nước ngoài đang khai thác nguồn dữ liệu để xây dựng chiến lược kinh doanh trên nhiều lĩnh vực chuyên môn và ngoài chuyên môn, từ phân tích tâm lý khách hàng đến phân tích cơ hội kinh doanh trong việc bán chéo sản phẩm hay quản
lý doanh nghiệp
Big Data đóng vai trò quan trọng trong việc truy xuất dữ liệu và hỗ trợ con người đưa ra quyết định tốt hơn với cơ hội thành công cao hơn nhiều
2.2 Khai thác dữ liệu (Data Mining)
Theo báo cáo của Markets and Markets thị trường Data Mining dự báo sẽ tăng
từ 591,2 triệu USD năm 2018 lên 1.039 triệu USD trong năm 2023 Đây chính là minh chứng cho thấy xu hướng tiếp cận Data mining phục vụ cho khai thác giá trị từ
dữ liệu ở các công ty trên toàn cầu ngày càng mạnh mẽ
Khai thác dữ liệu là một tập hợp, một hệ thống các phương pháp tính toán, thuật toán được áp dụng cho các cơ sở dữ liệu lớn và phức tạp, mục đích loại bỏ các chi tiết ngẫu nhiên, chi tiết ngoại lệ, khám phá các mẫu, mô hình, quy luật tìm ẩn, các thông tin có giá trị trong bộ dữ liệu Khai thác dữ liệu là thành quả công nghệ tiên tiến ngày ngay, là quá trình khám phá các kiến thức vô giá bằng cách phân tích khối lượng lớn dữ liệu đồng thời lưu trữ chúng ở nhiều cơ sở dữ liệu khác nhau (Data-Flair)
Trang 22Nguồn: https://bigdatauni.com
Biểu đồ 2.1 Quy trình khai thác dữ liệu
Dựa trên mô hình được trình bày tại biểu đồ 2.1 có thể phân quy trình khai thác dữ liệu thành 2 quá trình: chuẩn bị dữ liệu (data preparation) và khai thác dữ liệu (data mining) và 7 bước được mô tả chi tiết trong bảng 2.1
Bảng 2.1 Các bước trong quá trình khai thác dữ liệu
Chọn ra những dữ liệu liên quan, có giá trị phân tích
4 Chuyển đổi dữ liệu
(Transformation)
Chuyển đổi và hợp nhất dữ liệu theo các loại biến, định dạng khác nhau để phù hợp và dễ dàng cho việc phân tích
Trang 235 Khai thác dữ liệu
(Data mining)
Xây dựng các thuật toán, phương pháp, các model phân tích khác nhau nhằm mục đích phát hiện, trích xuất các thông tin hữu ích, giá trị tiềm năng từ những mẫu dữ liệu
6 Đánh giá mẫu dữ liệu
Thể hiện kết quả bằng các công cụ trực quan hóa,
sử dụng đồ thị, bảng, biểu đồ để diễn giải kết quả đến người xem
Mặt khác, dựa trên các tiêu chí đặc điểm của một tổ chức, Xin-an Lai (2009) đưa ra mô hình về quy trình khai thác dữ liệu bằng cách sử dụng mô hình phân khúc khách hàng được mô tả trong biểu đồ 2.1
Khai thác dữ liệu là một trong những lợi thế các công ty trong ngành sản xuất, kinh doanh, marketing nếu họ biết cách ứng dụng hợp lý để tăng cường hiệu quả hoạt động Các lợi ích cơ bản của khai thác dữ liệu như sau: hỗ trợ ra quyết định tự động,
hỗ trợ đưa ra dự báo chính xác, hỗ trợ giảm thiểu chi phí và hỗ trợ khả năng thấu hiểu khách hàng Đồng thời việc khai thác dữ liệu cũng được ứng dụng rộng rãi trong nhiều lĩnh vực kinh doanh và ngành nghề và được phân theo từng chức năng nhiệm
vụ
Bảng 2.2 Ứng dụng của khai thác dữ liệu Phân theo chức năng nhiệm vụ Phân theo ngành và lĩnh vực
- Phân tích và quản lý thị trường
- Phân tích bên trong công ty và quản lý
Trang 242.3 Hành vi tiêu dùng
2.3.1 Định nghĩa
Hành vi người tiêu dùng là loại hình nghiên cứu hướng đến các đối tượng là
cá nhân hoặc tổ chức và cách mà các đối tượng chủ thể trên quyết định lựa chọn và
sử dụng sản phẩm, dịch vụ để thỏa mãn nhu cầu của bản thân, cũng như sự tác động của quá trình đưa ra quyết định đó tới tâm lý số đông người tiêu dùng và xã hội Những tác nhân gây ảnh hưởng tới hành vi tiêu dùng chủ yếu là các tác động nội tại
và ngoại vi (Solomon, 2004) Điều này có thể do con người muốn trốn thoát khỏi guồng công việc thường nhật, cải thiện chất lượng sống, tự thưởng công sức (Danziger, 2004a), đẩy mạnh niềm tin vào bản thân, tìm kiếm trải nghiệm đáng nhớ, trở nên đặc biệt và độc nhất (Danziger, 2004b), thể hiện cá tính, thể hiện địa vị xã hội hoặc đáp ứng các nhu cầu tâm lý (Nia và Judith, 2000)
Một số các giả thuyết đã được đề xuất nhằm giải thích tại sao và bằng cách nào mà người tiêu dùng chọn một loại sản phẩm nhất định (Bettman, 1970; Fishben, 1963; Fishbein và Ajzen, 1975; Mitchel và Olson, 1981; Rosenberg, 1950) Trong số những nỗ lực lập ra để tạo nên số giả thuyết đó, các nhà nghiên cứu đã tập trung mạnh vào cách thức mà người tiêu dùng phát triển thái độ bản thân đối với 1 sản phẩm, vì thái độ với sản phẩm được cho rằng là mối liên kết giữa hành vi và sự chi tiêu Ví dụ
cụ thể: dựa theo nghiên cứu của Fishbein và Ajzen (1975), có hai cấu kiện quan trọng gây ảnh hưởng tới thái độ hướng tới sản phẩm: cấu trúc niềm tin và tiêu chí đánh giá (Lee và Um, 1992) Đầu tiên, một người tiêu dùng có thể sẽ tin rằng ở mỗi một sản phẩm sở hữu một vài các tính chất nhất định biết được là do tác động trực tiếp từ kinh nghiệm bản thân hoặc gián tiếp thông qua các nhân vật đại diện cho thương hiệu hoặc nguồn truyền thông công chúng Thứ hai, người tiêu dùng có thể đánh giá một sản phẩm chỉ với một số tính chất sản phẩm nhất định mà họ cảm thấy là đủ để áp đặt cho việc đưa ra quyết định mua sản phẩm Điều này cấu thành nên tiêu chí đánh giá chủ đạo cho thái độ người mua hướng tới sản phẩm Trong trường hợp như vậy, chúng ta thường hay tranh cãi rằng khách hàng đưa ra quyết định là dựa vào nền tảng nhận xét, cũng như có kiến thức về, tính chất sản phẩm (Geistfeld, và một số khác, 1977; Peter
Trang 25và Olson, 1996; Wahlers, 1982) Trong một số trường hợp, người tiêu dùng có thể so sánh giữa những lựa chọn có thể thay thế nhau tùy theo những tính chất của chúng và chọn ra thứ họ ưa thích nhất Trong một số khác, người tiêu dùng lại có thể đánh giá riêng từng lựa chọn có mặt và đi theo hướng phù hợp nhất (Stephen và Simonson, 1997)
Tiêu chí đánh giá chủ yếu có thể sẽ khách quan, như giá cả, hoặc chủ quan, như lợi ích cảm tính có từ việc sử dụng sản phẩm (Lee và Um, 1992) Tuy vậy, tiêu chí đánh giá chính lại thường chỉ được đưa ra dưới dạng ý tưởng bởi vì các xúc tác thông tin lọt vào 2 phạm trù lớn: nội tại và tác động ngoại vi (Lee và Lou, 1996; Monroe và Dodds, 1988; Peter và Olson, 1996; Rao và Monroe, 1989; Richardson và một số khác, 1994; Schelinck, 1983) Xúc tác nội tại là những tính chất có liên quan đặc thù tới một 1 sản phẩm nhất định, có thể bao gồm các tính vật lý như hình dạng, thiết kế, phong cách và nguyên, vật liệu (Lee và Lou, 1996; Ulgado và Lee, 1993) Mặt khác, xúc tác ngoại vi không được coi là một phần vật chất của sản phẩm (mặc
dù vẫn liên quan đến nó) Nghiên cứu trước đây cho thấy rằng người tiêu dùng vận dụng cả xúc tác nội tại và ngoại vi trong quá trình đánh giá sản phẩm (Lee và Lou, 1996; Monroe và Dodds, 1988; Peter và Olson, 1996; Rao và Monroe, 1989; Richardson và một số khác, 1994; Schellinck, 1983) Có một quan điểm hay được bàn đến đó là các xúc tác ngoại vi phổ biến hơn trong thực tế và có thể bao gồm thương hiệu, giá, bao bì và xuất xứ (xem vd Lee và Lou, 1996; Richardson và một
số khác, 1994) Nghiên cứu trước cũng cho rằng người tiêu dùng dễ nhận biết sự có mặt của xúc tác ngoại vi hơn nên vì thế dựa vào chúng hơn khi đánh giá sản phẩm nếu như đem so với các xúc tác nội tại (xem vd Bettman và Park, 1980; Dodds và một số khác, 1991; Han và Terpstra, 1988; Lee và Lou, 1996) Trong nghiên cứu của Richardson và một số khác năm 1994 chẳng hạn, có xem xét về sự tương quan trong
độ quan trọng giữa xúc tác nội tại và ngoại vi trong việc nhận biết về chất lượng thương hiệu trong 5 sản phẩm ở Mỹ (khoai tây cắt lát ăn liền thông thường, khoai tây cắt lát ăn chấm kem kiểu Pháp, bánh quy hạt choco, phô mai cắt lát và thạch nho)
Trang 26Kết quả cho thấy rằng giới tiêu dùng ở Mỹ nhìn nhận thương hiệu chủ yếu qua xúc tác ngoại vi gắn liền với sản phẩm thay vì do nội tại
Phần nhiều các người tiêu dùng mua sắm phụ thuộc vào thu nhập bản thân Nguồn thu của họ có thể xem như một tác nhân phân cấp xã hội là một nhân tố nội tại khác cần được cân nhắc đến bởi vì nó chỉ ra tài sản và địa vị xã hội của một con người Dubois và Duquesne vào năm 1993 đã nhận thấy rằng nguồn thu được coi là một tác nhân kìm hãm con người thỏa mãn nhu cầu tiêu thụ của họ Vai trò của giới tính tới việc mua sắm các mặt hàng đắt tiền có thể được coi là quan trọng nếu ta xét đến việc phụ nữ mua hàng xa xỉ thường xuyên hơn đàn ông, đơn giản là vì họ đi mua sắm nhiều hơn Thị trường hàng xa xỉ đang tăng trưởng một cách đáng kể, đi kèm với nhiều thay đổi to lớn về mặt hành vi người tiêu dùng
Bên cạnh đó, hành vi chi tiêu của người dùng biến đổi theo mức độ trân trọng
mà họ dành cho loại sản phẩm Một cách để phân loại sản phẩm đó là sử dụng 3 tiêu chí: Mặt hàng tìm kiếm, mặt hàng trải nghiệm và mặt hàng tín nhiệm Một mặt hàng tìm kiếm là loại hàng hóa cho phép khách hàng tìm hiểu hoặc xem xét đầy đủ các thông tin về tính chất chủ đạo của nó – như chất lượng hay sự phù hợp, trước khi thực
sự mua hàng (Brucks và một số khác, 2000; Klein, 1998; Nelson, 1970) Hàng hóa trải nghiệm không để cho khách hàng biết hoặc nhận xét đầy đủ về tính chất chủ đạo của nó trước khi thực sự mua hàng (Klein, 1998; Nelson, 1970) Một mặt hàng tín nhiệm là loại hàng mà chất lượng của nó hầu như không bao giờ có thể, hoặc rất khó
để kiểm chứng bởi người tiêu dùng thông thường: thế nên, hầu hết sản phẩm loại này thường được mua dựa vào niềm tin (Asch, 2001; Darby và Karni, 1973) Đối với các sản phẩm tín nhiệm có các tính chất sản phẩm khác với sản phẩm tìm kiếm và trải nghiệm, chẳng hạn như trang sức hoặc các thứ xa xỉ khác như lọc nước, kem chống lão hóa, người mua hàng thường không có đủ kiến thức để thẩm định chất lượng của
nó dù đã thực sự mua và dùng qua Thế nên, khách hàng sẽ hạn chế việc mua các loại mặt hàng này thông qua những mô hình bán lẻ phi cửa hàng như Internet
Có nhiều công trình nghiên cứu của nhiều tác giả xoay quanh chủ đề hành vi tiêu dùng, một cách tổng quát có thể phân tích hành vi người tiêu dùng theo hai trường
Trang 27phái chính: một là trường phái kinh tế (economic man) hay được gọi là trường phái dựa vào lí trí (rational school) và hai là trường phái dựa vào cảm xúc (emotional school)
Trường phái kinh tế cho rằng việc người tiêu dùng đưa ra quyết định dựa vào
lí trí để đáp ứng nhu cầu tối đa hóa giá trị sử dụng đối với sản phẩm dịch vụ Để làm được điều này, người tiêu dùng phải trải qua một quá trình nhận thức bao gồm các giai đoạn: xác định những thuộc tính ưu việt của sản phẩm, thu thập thông tin và thực hiện đánh giá các thuộc tính của các thương hiệu cạnh tranh trên thị trường nhằm đưa
ra lựa chọn thương hiệu tốt nhất Trường phái này chỉ phù hợp cho những sản phẩm
mà đối tượng người tiêu dùng tập trung duy nhất vào những lợi ích chức năng sản phẩm Quan điểm theo trường phái lí trí này bỏ qua lợi ích mang tính cảm xúc, thứ đóng vai trò rất quan trọng trong việc tiêu dùng một số sản phẩm nhất định, mà điển hình là các sản phẩm xa xỉ phẩm
Khác với trường phái theo lí trí, trường phái cảm xúc lại nhận định rằng, yếu
tố tác động đến hành vi người tiêu dùng cơ bản đó chính là cảm xúc Theo quan điểm này, người tiêu dùng ra đưa quyết định hoàn toàn dựa trên các tiêu chuẩn mang tính chất chủ quan của chủ thể như thị hiếu, niềm tin, ham muốn hay đơn giản chỉ là thích thú thể hiện cá tính của mình
Bên cạnh những lí thuyết cơ bản về hành vi tiêu dùng, chúng ta cũng cần phải bàn thêm khái niệm phân khúc thị trường một khái niệm tuy không mới nhưng lại có
ý nghĩa quan trọng trong thực tiễn kinh doanh của các tổ chức tài chính Phân khúc thị trường được hiểu đơn giản là chia “chiếc bánh thị trường” của một sản phẩm hay dịch vụ nào đó thành nhiều nhóm nhỏ, gọi tắt là các phân khúc, đảm bảo rằng trong cùng một phân khúc thì có hành vi tiêu dùng của các khách hàng tương tự nhau và mang tính khác biệt so với khách hàng của những phân khúc còn lại Phân khúc thị trường đóng vai trò hết sức rất quan trọng trong việc xây dựng chiến lược marketing mục tiêu để tối đa hóa lợi nhuận Đây là khâu đầu tiên phải thực hiện để xác định đâu
là thị trường mục tiêu cần tập trung nguồn lực để khai thác Một điểm cần lưu ý, người phân tích marketing chỉ đóng vai trò nhận dạng phân khúc và tiến hành phân
Trang 28tích nguồn lực sẵn có của đơn vị chọn ra phân khúc phù hợp để thực hiện chiến lược kinh doanh chứ không phải là người tạo ra bất kỳ phân khúc nào
Ngoài ra, trong bài nghiên cứu còn sử dụng Dữ liệu lớn (Big data) Dữ liệu lớn
là tập hợp dữ liệu có dung lượng vượt mức đảm đương của những ứng dụng và công
cụ truyền thống Big data thường đặc trưng và gia tăng với ba Vs:
❖ Tăng về lượng (volume)
❖ Tăng về vận tốc (velocity)
❖ Tăng về chủng loại (variety)
Giờ đây, nhiều công ty và tổ chức khác trong lĩnh vực công nghệ thông tin tiếp tục sử dụng mô hình “3V” này để định nghĩa nên Big Data Đến năm 2012, công ty Gartner bổ sung thêm rằng dữ liệu lớn ngoài ba tính chất trên thì còn phải “cần đến các dạng xử lí mới để giúp đỡ việc đưa ra quyết định, khám phá sâu vào sự vật/sự việc và tối ưu hóa các quy trình làm việc”
Dữ liệu tạo thành các kho dữ liệu lớn có thể đến từ các nguồn bao gồm các trang web, phương tiện truyền thông xã hội, ứng dụng dành cho máy tính để bàn và ứng dụng trên thiết bị di động, các thí nghiệm khoa học, và các thiết bị cảm biến ngày càng tăng và các thiết bị khác trong internet (IoT)
Khái niệm big data đi kèm với các thành phần có liên quan cho phép các tổ chức đưa dữ liệu vào sử dụng thực tế và giải quyết một số vấn đề kinh doanh, bao gồm cơ sở hạ tầng IT cần thiết để hỗ trợ big data; các phân tích áp dụng với dữ liệu; công nghệ cần thiết cho các dự án big data; các bộ kĩ năng liên quan; và các trường hợp thực tế có ý nghĩa đối với big data
Điều thực sự mang lại giá trị từ các tổ chức dữ liệu lớn là phân tích dữ liệu Nếu không có phân tích, nó chỉ là một tập dữ liệu với việc sử dụng hạn chế trong kinh doanh
Bằng cách phân tích dữ liệu lớn, các công ty có thể có những lợi ích như tăng doanh thu, dịch vụ khách hàng được cải thiện, hiệu quả cao hơn và tăng khả năng cạnh tranh
Trang 29Phân tích dữ liệu liên quan đến việc kiểm tra bộ dữ liệu để thu thập thông tin chi tiết hoặc rút ra kết luận về những gì chúng chứa, chẳng hạn như các xu hướng và
dự đoán về hoạt động trong tương lai
Bằng cách phân tích dữ liệu, các tổ chức có thể đưa ra các quyết định kinh doanh tốt hơn như khi nào và ở đâu nên chạy chiến dịch tiếp thị hoặc giới thiệu một sản phẩm hoặc dịch vụ mới
Sự phân tích có thể tham khảo các ứng dụng kinh doanh thông minh hay tiên tiến hơn, phép phân tích dự đoán như ứng dụng được các tổ chức khoa học sử dụng Loại phân tích dữ liệu cao cấp nhất là data mining, nơi các nhà phân tích đánh giá các
bộ dữ liệu lớn để xác định mối quan hệ, mô hình và xu hướng
Phân tích dữ liệu có thể bao gồm cả phân tích dữ liệu thăm dò (dùng trong trường hợp xác định các mẫu cần phân tích và mối quan hệ trong dữ liệu) và phân tích dữ liệu xác nhận (thông qua việc áp dụng các kĩ thuật dùng trong thống kê để tìm
ra giả thiết về một bộ dữ liệu nào đó có đúng hay không)
Theo cách tiếp cận khác thì phân tích dữ liệu được chia thành 2 dạng: phân tích dữ liệu định lượng (hay còn gọi là phân tích dữ liệu số, và các biến trong dữ liệu
có thể so sánh theo thống kê) so với phân tích dữ liệu định tính (chỉ tập trung vào các
dữ liệu không phải là dữ liệu số như video, hình ảnh và văn bản)
Trong thực tế, dữ liệu lớn và phân tích có thể được áp dụng trong nhiều lĩnh vực khác nhau mà điển hình là lĩnh vực kinh doanh và với nhiều trường hợp sử dụng
cụ thể khác nhau Sau đây là vài ví dụ:
Phân tích khách hàng: Các công ty có thể truy xuất thông tin dữ liệu giao
dịch của khách hàng để phân tích xu hướng nhu cầu của khách hàng thông qua đó nâng cao tính năng sản phẩm dịch vụ, cải thiện tỉ lệ chuyển đổi và quan trọng là giữ khách hàng tốt hơn
Phân tích hoạt động: Nâng cao hiệu quả hoạt động sản xuất kinh doanh và
tối ưu hóa nguồn lực (tài sản) của công ty là mục tiêu của tất cả công ty Phân tích big data có thể giúp doanh nghiệp vận hành một cách hiệu quả hơn và cải thiện hiệu suất lao dộng góp phần gia tăng lợi nhuận
Trang 30Phòng chống gian lận: Phân tích dữ liệu đóng góp một phần không nhỏ trong
việc giúp các tổ chức xác định các hoạt động mang tính chất khả nghi, và các mẫu dùng trong phân tích có thể chỉ ra hành vi gian lận và giúp doanh nghiệp có thể giảm thiểu rủi ro
Tối ưu hóa giá cả: Các công ty có thể sử dụng phân tích big data để dựa trên
kết quả phân tích xây dựng chiến lược tạo mới những sản phẩm dịch vụ mới mang nhiều tính năng từ đó tối ưu hóa giá sản phẩm và dịch vụ, góp phần làm tăng doanh thu đơn vị
2.3.2 Hành vi tiêu dùng được phân khúc theo RFM
RFM được viết tắt từ Recency, Frequency, Moneytary, ý nghĩa của từ yếu tố như sau:
Recency: Thời gian giao dịch gần nhất của khách hàng Đây là chỉ số quan
trọng để xác định thời gian tham gia giao dịch tại ngân hàng Điều này sẽ giúp ngân hàng xác định được đâu là khách hàng mới và đâu là khách hàng cũ
Frequency: đây là chỉ số xác định số tần suất giao dịch trong lĩnh vực ngân
hàng của suốt thời gian nghiên cứu Ví dụ trong nghiên cứu này, thời gian số liệu nghiên cứu là 12 tháng, tổng số lần giao dịch của khách hàng đến ngân hàng sẽ được xác định trong trường hợp này Những đối tượng khách hàng thường xuyên đến giao dịch sẽ là những đối tượng có khả năng nhiều nhất trở thành hệ khách hàng trung thành ở mức cao trong tương lai Thông tin này một phần nào đó cũng sẽ xác định được sự hài lòng của khách hàng đối với dịch vụ của đơn vị kinh doanh
Monetary: là tổng giá trị số dư của khách hàng tại ngân hàng trong thời gian
nghiên cứu Qua đó, công ty sẽ có thông tin dữ liệu để phân loại mức dư nợ hoặc số
dư nợ của khách hàng Điều này là cơ sở giúp ngân hàng xây dựng những chương trình, giải pháp chiến lược sản phẩm hoặc dịch vụ phù hợp theo khả năng thanh toán hoặc chi trả của khách hàng
Theo (Wu & Lin, 2005) đã chứng minh rằng giá trị của R và F càng cao, khách hàng càng có thể được đo lường về hành vi sử dụng dịch vụ tại ngân hàng Ngoài ra,
Trang 31giá trị M càng cao, khách hàng càng có thể được xem rằng, họ có thể có nhiều lần trong giao dịch tiêu dùng
Tất cả các khách hàng được phân tích dựa vào 3 tiêu chí: thời gian giao dịch gần nhất (R), tần suất giao dịch (F) và giá trị giao dịch (M), các tiêu chí được đánh giá theo thang điểm từ 1 năm đến 5 Chi tiết phân khúc khách hàng theo RFM được
mô tả chi tiết theo bảng 2.3
Bảng 2.3 Bảng mô tả điểm theo RFM Điểm Nhóm Recency (R) Frequency (F) Monetary (M)
1 Rời dịch vụ
(không chắc chắn)
3 Thông thường Bình thường Bình thường Bình thường
Nguồn: Wu & Lin (2005)
2.4 Phân khúc thị trường
2.4.1 Định nghĩa phân khúc thị trường
Phân khúc thị trường trong kinh doanh ngân hàng được hiểu là chia thị trường thành những đoạn khác nhau mà trong đó ứng với mỗi đoạn sẽ có một hoặc một tập hợp các sản phẩm dịch vụ nhất định cho một nhóm người nhất định Người ta gọi các đoạn phân chia đó là phân khúc thị trường, túc là một nhóm người tiêu dùng có phản ứng như nhau đối với cùng một tập hợp những kích thích của Marketing và phân khúc thị trường chính là quá trình phân chia người tiêu dùng thành nhóm trên cơ sở những điểm khác biệt như nhu cầu, về tính cách hay hành vi…
Trang 32Bản chất của Phân khúc thị trường chính là dùng những tiêu thức nhất định để phân chia thị trường tổng thể quy mô lớn, không đồng nhất, muôn hình muôn vẻ về nhu cầu thành các nhóm (đoạn, khúc) nhỏ hơn đồng chất về nhu cầu
Mục tiêu của việc phân khúc thị trường trong tiếp thị là chia thị trường thành những thị trường nhỏ hơn với những khách hàng có nhu cầu giống nhau, dễ nhận biết, nắm bắt và đáp ứng nhanh hiệu quả hơn Việc ohân khúc thị trường giúp các ngân hàng tạo ra sản phẩm dịch vụ đáp ứng nhu cầu các khách hàng cụ thể và tập trung các nguồn lực Marketing một cáh hiệu quả hơn Thông qua đó, các ngân hàng sẽ xác định được đâu là thị trường mục tiêu của mình
a Các yêu cầu cần có để phân khúc thị trường thành công:
Tính đồng nhất: Các đối tượng khách hàng trong cùng một ohân đoạn thị
trường có sự đồng nhất về nhu cầu và nhận định
Tính riêng biệt: Các phân đoạn thị trường khác nhau có những đặc điểm khác
nhau
Có thể nhận biết được: Các phân đoạn thị trường phải đo lường được và nhận
biết được
Có thể thâm nhập và hoạt động hiệu quả: Sau khi chọn được phân đoạn thị
trường thích hợp nhà kinh doanh áp dụng các biện pháp marketing và có thể thâm nhập và kinh doanh hiệu quả trong đoạn thị trường đó
Phân đoạn thị trường phải đủ lớn để sinh lợi nhuận
b Các tiêu thức dùng để phân khúc thị trường:
Những người làm Marketing ngân hàng thường tiến hành phân khúc thị trường theo các tiêu chí: Theo nhân khẩu học, nhóm nhu cầu, nhóm thu nhập, nhóm hành vi,
Trang 33còn kết hợp cả đặc điểm nhân khẩu và tâm lý học khi tiến hành phân khúc thị trường theo nhóm nhu cầu bởi nhờ đó họ xác định chính xác hơn thị trường mục tiêu
Phân khúc thị trường theo các nhóm hành vi: Tiến hành phân chia thị trường người tiêu dùng theo các nhóm đồng nhất về các đặc tính như: Lý do mua sản phẩm dịch vụ, lợi ích tìm kiếm, tính trung thành, số lương và tỷ lệ sử dụng, cường độ tiêu thụ… Các nhà Marketing cho rằng nghiên cứu về các đặc tính của hành vi ứng xử của người tiêu dùng là khởi điểm tốt nhất để hình thành các đoạn thị trường
Phân đoạn theo địa lý (quốc tịch): Chia thị trường thành những nhóm khách hàng có cùng vị trí địa lý Cách phân khúc này được sử dụng rộng rãi vì dễ thực hiện,
dễ đánh giá nhu cầu của từng khúc và dễ sử dụng các phương tiên quảng cáo Tuy nhiên, nhược điểm của các phân đoạn này là những khách hàng tiềm năng cùng ở trên một địa bàn, việc thu thập thông tin và nhu cầu của họ đôi khi cũng khác nhau đặc biệt là ở những thành phố lớn
2.4.2 Lựa chọn thị trường mục tiêu
Thị trường mục tiêu là một phân khúc thị trường chứa tập khách hàng có nhu cầu hay mong muốn mà ngân hàng có khả năng đáp ứng hoặc có thể ưu thế hơn so với đối thủ cạnh tranh Đây chính là thị trường mà ngân hàng chọn để thực hiện chiến lược Marketing của mình
Để lựa chọn được thị trường mục tiêu, các ngân hàng cần đánh giá các khúc thị trường khách nhau qua đó chọn một hay một số khúc thị trường mà ngân hàng mình có lợi thế cạnh tranh làm thị trường mục tiêu để quyết định phân phối nguồn lực Marketing tại những khúc thị trường mục tiêu này Việc đánh giá dựa trên 3 yếu tố:
Đánh giá quy mô và tăng trưởng của từng khúc thị trường, khúc thị trường
nào có qui mô và mức tăng trưởng ‘vừa sức’ Trên cơ sở đó, ngân hàng sẽ quyết định
có chọn đây là khúc thị trường mục tiêu của mình hay không?
Đánh giá mức độ hấp dẫn về cơ cấu của khúc thị trường Một số khúc thị
trường có thể có quy mô và mức tăng trưởng mong muốn nhưng lại thiếu tiềm năng sinh lời Ngân hàng cần phải xem xét các yếu tố quyết định mức độ hấp dẫn về khả
Trang 34năng sinh lời lâu dài của một khúc thị trường như: Các đối thủ cạnh tranh hiện tại, những kẻ xâm nhập tiềm ẩn, những sản phẩm thay thể, quyền thương lượng của người mua và cung ứng
Đánh giá mục tiêu và nguồn lực của ngân hàng Một số khúc thị trường hấp
dẫn có thể vẫn bị loại bỏ, nởi vì chúng không phù hợp với mục tiêu lâu dài của ngân hàng Thậm chí ngay cả khi khúc thị trường phù hợp để thành công trong khúc thị trường đó không?
Sau khi đánh giá các khúc thị trường, ngân hàng tiến hành lựa chọn thị trường mục tiêu là thị trường mà ngân hàng có lợi thế cạnh tranh Có 5 phương án lựa chọn:
Một là: Tập trung vào một khúc thị trường Thông qua Marketing tập trung,
ngân hàng sẽ dành được một vị trí vững chắc trong thị trường nhờ hiểu biết rỏ hơn những nhu cầu của khúc thị trường đó Khi tập trung mọi nguồn lực vào một khúc thị trường thì khả năng giành được vị trí dẫn đầu trong phân khúc thị trường đó là rất cao Tuy nhiên phương án này có độ rủi ro khá cao vì đến lúc nào đó thị trường này
sẽ giảm đi
Hai là: Chuyên môn hóa có chọn lọc Trong trường hợp này, ngân hàng lựa
chọn một số khúc thị trường, mỗi khúc thị trường đều có sức hấp dẫn khách quan và phù hợp với những mục tiêu và nguồn tài nguyên của mình Các thị trường đều hứa hẹn là nguồn sinh lời cho các ngân hàng Chiến lược phục vụ nhiều khúc thị trường này có ưu điểm là hạn chế rủi ro cho ngân hàng, nếu một khúc thị trường nào đó trở nên không hấp dẫn nữa thì ngân hàng vẫn có thể tiếp tục thu lợi nhuận từ những khúc thị trường khác
Ba là: Chuyên môn hóa sản phẩm ngân hàng chỉ cung cấp một số sản phẩm
dịch vụ chuyên biệt cho khúc thị trường nhất định Ưu điểm của phương án là có thể cung ứung được sản phẩm có chất lượng cao Nhưng nếu xuất hiện sản phẩm thay thế thì rủi ro sẽ cao
Bốn là: Chuyên môn hóa thị trường Các ngân hàng tập trung phục vụ nhiều
nhu cầu của một số nhóm khách hàng cụ thể, Ưu điểm là ngân hàng có thể tạo ra được
Trang 35uy tín của mình trên khúc thị trường nhưng rủi ro sẽ cao khi nhu cầu của khúc thị trường này giảm
Năm là: Phục vụ toàn bộ thị trường Có hai cách:
+ Làm marketing không phân biệt: Bỏ qua sự khác biệt về nhu cầu của các đoạn thị trường và sử dụng cùng một chính sách Marketing Sử dụng phương án này
sẽ tiết kiệm được chi phí nhờ đó ngân hàng có thể định giá thấp hơn để giành được khúc thị trường nhạy cảm với giá
+ Làm Marketing có phân biệt: Ngân hàng chọn các thị trường mục tiêu và thực hiện chiến lược marketing riêng cho mỗi thị trường mục tiêu đó Sử dụng phương
án này có khả năng tạo ra tổng mức tiêu thụ lớn nhưng chi phí kinh doanh sẽ rất cao
2.4.3 Định vị sản phẩm trên thị trường mục tiêu
Việc xác định vị thế của một sản phẩm dịch vụ được tiến hành sau khi đã xác định được phân khúc thị trường và chọn được thị trường mục tiêu Xác định vị thế được hiểu là một nổ lực để ngân hàng tạo ra và quản lý cách thức mà khách hàng trong các thị trường mục tiêu nhận thức về một sản phẩm hay dịch vụ của mình
Các bước của quá trình xác định vị thế bao gồm: Xác định các lợi thế cạnh tranh có thể làm nền tảng cho việc định vị, lựa chọn lợi thế cạnh tranh phù hợp, lựa chọn chiến lược định vị tổng thể
Xác định lợi thế cạnh tranh là việc tìm kiếm các lợi thế cạnh tranh của sản phẩm của ngân hàng so với đối thủ Không thể định vị sản phẩm mà không dựa vào một lợi thế cạnh tranh nào đó Lợi thế đó là sự khác biệt và đem lại giá trị vượt trội
so với sản phẩm của đối thủ
Lựa chọn lợi thế cạnh tranh phù hợp là phân tích để ‘lấy ra’ lợi thế cạnh tranh tối ưu Sự tối ưu không chỉ nằm ở lợi thế mạnh thực sự của yếu tố cạnh tranh, mà còn
ở sự dễ dàng nhận biết từ phía khách hàng và mức độ thuận lợi trong việc truyền thông Có những thế mạnh thức sự của sản phẩm, nhưng khách hàng rất khó cảm nhận và ngân hàng cũng rất khó truyền tải được những thế mạnh của mình cho khách hàng nhận biết
Trang 36Lựa chọn chiến lược định vị tổng thể Định vị tổng thể cho sản phẩm dịch vụ được thể hiện qua ‘tuyên ngôn giá trị’, bao gồm một ‘hỗn hợp’ lợi ích mà sản phẩm dịch vụ của ngân hàng dựa vào đó để định vị
Việc xác định và lựa chọn lợi thế cạnh tranh để định vị là vấn đề cực kỳ quan trọng Một chiến lược định vị được xem là thành công khi và chỉ khi một hoặc một vài thuộc tính khác biệt, đem lại giá trị vượt trội nào đó của sản phẩm chiếm được một vị trí rõ ràng, nhất quán và lâu bền trong tâm trí người tiêu dùng
2.5 Một số khái niệm khác
2.5.1 Mô hình ma trận giá trị khách hàng (Custumer Value Matrix Model)
Mô hình Ma trận giá trị khách hàng được giới thiệu bởi Charles Edmundson (Marcus, C, 1998) được phát triển từ phương pháp RFM cho các doanh nghiệp vừa
và nhỏ và các nhà bán lẻ, kết quả từ phương pháp RFM đưa ra một số phân khúc khách hàng và ra hướng chiến lược vào mỗi nhóm
Theo Marcu (1998) đã đề xuất tính doanh số mua trung bình cho mỗi khách hàng thay vì tổng số tiền Ma trận 2 × 2 sử dụng kết hợp giữa doanh số mua hàng trung bình và tần suất mua cho một phân khúc khách hàng Tùy thuộc vào hoạt động kinh doanh của mỗi doanh nghiệp, nên xem xét bổ sung chiến lược nào mà doanh nghiệp sẽ được áp dụng cho từng phân khúc khách hàng
Khái niệm mô hình Ma trận giá trị khách hàng hoàn toàn phù hợp cho các công
ty bán lẻ, họ có thể dễ dàng phân tích giá trị khách hàng Mỗi vị trí được kết hợp bởi
cả hai giá trị Tần số và doanh số mua trung bình và cả giá trị thời gian tham gia và
Độ dài cho các chi tiết như trong bảng 2.4
Bảng 2.4 Mô tả ma trận giá trị khách hàng
Thời gian tham gia dịch vụ &
Thời gian mua hàng gần nhất
{Length (L) and Recency (R)}
Trang 37(Quan hệ mất dần_lost relationship)
(Hình thành mối quan hệ_establishing relationship)
Nguồn: (Marcus, 1998)
2.5.2 Phương pháp RFM
Trong thị trường cạnh tranh hiện nay, khách hàng được xem là một trong những ưu tiên lớn nhất của công ty Để tạo ra sự trung thành và giữ chân khách hàng, các công ty cần xác định mối quan hệ khách hàng của họ dựa trên một số kỹ thuật Một trong số đó là ma trận quan hệ khách hàng cung cấp phân loại quản lý theo nhiều đặc điểm của bốn nhóm khác nhau giữa các công ty và khách hàng của họ thông qua hai yếu tố Độ dài và lần truy cập như được mô tả trong biểu đồ 2.2 và được giải thích trong Bảng 2.5 Tóm lại, giá trị khách hàng được đánh giá bằng ma trận giá trị khách hàng và/hoặc ma trận quan hệ khách hàng
Bảng 2.5 Các tham số của ma trận quan hệ khách hàng
1 Length (L) = Số ngày từ ngày mở mã khách hàng đầu tiên đến giao dịch gần nhất (số ngày tham gia dịch vụ tại ngân hàng)
2 Recency (R) = Số ngày giao dịch gần nhất so với thời gian hiện tại của nghiên cứu
average
Recency value
Potential Relationship
Close Relationship
Establshing Relationship
Lost Relationship
average length
average recency value
High
Trang 38Biểu đồ 2.2 Mô hình ma trận giá trị khách hàng
Ghi chú: Close Relationship (CR) = Quan hệ gần; Establishing Relationship (ER) = Hình thành mối quan hệ; Lost Relationship (LR) = Quan hệ lâu dài; Potential Relationship (PR) = Quan hệ tiềm năng
2.5.3 Giá trị vòng đời khách hàng (Custumer Lifetime Value - CLV)
Giá trị vòng đời khách hàng là giá trị của một khách hàng đóng góp cho công
ty bạn trong suốt cuộc đời họ Khách hàng trung thành là người đem lại nguồn lợi nhuận lâu dài và bền vững cho doanh nghiệp vì có giá trị vòng đời cao, nó được phát hiện sớm bởi Kotler (1974) với định nghĩa Giá trị hiện tại của dòng lợi nhuận tương lai dự kiến trong một thời gian nhất định chân trời giao dịch với khách hàng, và nhấn mạnh vào những khách hàng có lợi nhuận
Nói chung, có nhiều phương pháp khác nhau để tính toán CLV cho các tổ chức khác nhau Trong luận án này, do phân khúc dựa trên Giá trị và Thời gian truy cập trọn đời của khách hàng, Tần suất và Tiền tệ (RFM), các đặc điểm được chọn theo phương pháp này bao gồm ngày mua mới nhất, số lần mua là tần suất mua của khách hàng, tổng số tiền chi tiêu bởi khách hàng trong một năm và đếm mặt hàng liên quan đến một loạt các sản phẩm khách hàng đã mua Các đặc điểm cuối cùng được chọn dựa trên quan điểm chuyên gia Dữ liệu được chuyển đổi được hiển thị trong bảng 2.6
Bảng 2.6 chuyển đổi dữ liệu
Ngày mua cuối cùng (type: date) Lần giao dịch cuối cùng (type: number)
Tổg số tiền/tổng số dư giao dịch Tổng tiền/lần mua
2.5.4 Thuật toán phân cụm (Clustering)
Đây là một dạng thuật toán nhằm thực hiện mục tiêu đơn giản hóa dữ liệu, được sử dụng phổ biến trong việc hướng đến nhân tố hành vi tiêu dùng, phục vụ chiến lược nắm bắt nhanh phân khúc thị trường Phân tích cụm (CLUSTER) hoặc phân cụm
Trang 39(CLUSTERING) là việc phân nhóm các đối tượng có liên quan vào một nhóm đại diện bởi một biến gọi là cluster (hay còn được gọi là cụm) tương tự nhau hơn so với các nhóm (cụm) khác Đây là một trong những công việc chính của khai thác dữ liệu (data mining) Phương pháp này là một kỹ thuật phổ biến dùng trong phân tích thống
kê và được sử dụng trong nhiều lĩnh vực kinh tế-xã hội, địa lý, nghiên cứu hành vi xã hội Phân tích Cluster xuất phát điểm từ nhân khẩu học vào năm 1932 bởi Driver và Kroeber và được Zubin; Robert Tryon giới thiệu vào lĩnh vực tâm lý học lần lượt vào năm 1938 và năm 1939 Phương pháp phân tích này biết đến rộng rãi vào năm
1943 khi Cattell sử dụng vào việc phân loại lý thuyết tính cách trong tâm lý cá tính
Phân tích cụm được nghiên cứu rộng rãi như một nhánh của thống kê, với trọng tâm chính là phân tích cụm dựa trên khoảng cách Trong một số hệ thống hoặc gói phần mềm phân tích thống kê, ví dụ SPSS, S-Plus và SAS, các công cụ phân tích cụm dựa trên k-medoid, k-mean và các phương pháp khác cũng được tích hợp
Nói chung, có một số phương pháp phân cụm hiện có cũng như phát triển các phương pháp mới Dựa trên cả kiểu dữ liệu có sẵn và mục đích ứng dụng cụ thể, một trong những phương pháp này được chọn để trình bày bức tranh tương đối có tổ chức Tuy nhiên, bốn phương pháp phân cụm cơ bản chính được tóm tắt ngắn gọn trong Bảng 2.7
Bảng 2.7 Các phương pháp cơ bản của thuật toán phân cụm
1 Phân vùng
• Thích ứng tách biệt cụm độc quyền: một tập hợp n đối tượng được chia thành k phân vùng với k ≤ n
• Dựa trên khoảng cách: k tạo phân vùng ban đầu và sau
đó sử dụng phương pháp di chuyển lặp để tăng cường phân vùng bằng cách chuyển các đối tượng từ nhóm này sang nhóm khác
• Áp dụng một số phương pháp heuristic phổ biến như K-medoid hoặc K-mean (v.v.) để thể hiện trung tâm của cụm
Trang 40• Tìm các cụm dữ liệu hình cầu nhỏ đến trung bình
2 Thứ bậc
• Tạo phân rã phân cấp (nghĩa là nhiều cấp độ)
• Tiến hành theo cách tích tụ lại (agglomerative) hay phân chia ra (divisive)
• Không bao giờ có thể sửa lỗi sáp nhập hoặc chia tách
• Có thể kết hợp các kỹ thuật khác như phân cụm vi mô hoặc xem xét đối tượng liên kết trực tuyến
• Sử dụng cấu trúc dữ liệu lưới đa biến
• Thời gian xử lý nhanh (thường không phụ thuộc vào
số lượng đối tượng dữ liệu, nhưng phụ thuộc vào kích thước lưới)
Để minh họa phương pháp phân vùng và phân cấp, biểu đồ 2.3 trong đó k là
số cụm, cho một ví dụ bao gồm (a) với các tham số ban đầu khác nhau và dấu '' + '' là giá trị trung bình của các giá trị của một cụm cụ thể và (b) với mô tả của dendrogram được tạo ra bởi các đối tượng chia rẽ cùng với phương pháp phân cụm kết tụ
Biểu đồ 2.3 Ví dụ về các thuật toán phâm cụm cổ điển
A
Divisive C