Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp3Vs được coi là ba đặc trưng cơ bản n
Trang 1HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
• • • •
NGHIÊN CỨU VÀ ĐÁNH GIÁ MỨC ĐỘ SẴN SÀNG TRIẺN KHAI ỨNG DỤNG BIG DATA TRONG HOẠT ĐỘNG QUẢN TRỊ QUAN HỆ KHÁCH HÀNG TẠI NGÂN HÀNG TMCP
CÔNG THƯƠNG VIỆT NAM
TRẦN PHƯƠNG LAN
HÀ NỘI - 2018
1
Trang 2HỌC VIỆN NGÂN HÀNG KHOA HỆ THỐNG THÔNG TIN QUẢN LÝ
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
• • • •
NGHIÊN CỨU VÀ ĐÁNH GIÁ MỨC ĐỘ SẴN SÀNG TRIẺN KHAI ỨNG DỤNG BIG DATA TRONG HOẠT ĐỘNG QUẢN TRỊ QUAN HỆ KHÁCH HÀNG TẠI NGÂN HÀNG TMCP
CÔNG THƯƠNG VIỆT NAM
Giảng viên hướng dẫn: TS Phan Thanh Đức Sinh viên thực hiện: Trần Phương Lan
Mã sinh viên: 17A4040036
Lớp: HTTTB Khóa: 17 Hệ: Đại học chính quy
Hà Nội, tháng 5/2018
2
Trang 3NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN
Hai hướng nghiên cứu “Dữ liệu lớn - Big Data” và “Quản trị quan hệ khách hàng
- CRM” đều là những vấn đề đang được cộng đồng công nghệ và các nhà quản trị ngânhàng quan tâm trong thời gian gần đây
Sinh viên Phương Lan đã lựa chọn đề tài “Nghiên cứu và đánh giá mức độ sẵnsàng
triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại ngânhàng
TMCP Công Thương Việt Nam” dựa trên một nhánh nghiên cứu trong đề tài khoa họccấp Ngành Ngân hàng đang được thực hiện tại khoa Hệ thống thông tin quản lý - Họcviện Ngân hàng Khái niệm “Đánh giá mức độ sẵn sàng của dữ liệu” là một vấn đề mới
và chưa được đề cập nhiều trong các nghiên cứu tại Việt Nam Phương Lan đã có đónggóp trong các việc tổng hợp, đưa ra bộ câu hỏi tìm hiểu thực trạng và xác định bài toán
ưu tiên về dữ liệu trong hệ thống quản trị quan hệ khách hàng tại ngân hàng TMCPCông
Thương Việt Nam Trên cơ sở đó, đề tài đã xây dựng bộ tiêu chí đánh giá mức độ sẵnsàng của dữ liệu trong triển khai ứng dụng Big Data vào hoạt động quản trị quan hệkhách hàng Đề tài cũng nhận định các vấn đề về dữ liệu, đề xuất giải pháp giải quyếtcác bài toán về dữ liệu đặt ra trong triển khai ứng dụng Big Data vào hoạt động quản trịquan hệ khách hàng tại ngân hàng TMCP Công Thương Việt Nam
Sinh viên Phương Lan đã chủ động trong công việc, có khả năng tiếng anh trong
Giáo viên hướng dẫn
Phan Thanh Đức Phan Thanh Đức
i
Trang 4LỜI CAM ĐOAN
Em xin cam đoan kết quả đạt được trong báo cáo là sản phẩm nghiên cứu, tìm hiểucủa riêng cá nhân em Trong toàn bộ nội dung báo cáo, những điều được trình bày hoặc
là của cá nhân em hoặc được tổng hợp từ nhiều nguồn tài liệu Tất cả các tài liệu thamkhảo đều có xuất xứ rõ ràng và được trích dẫn hợp pháp
Em xin chịu trách nhiệm và chịu mọi hình thức kỷ luật theo quy định cho lời camđoan của mình
SINH VIÊN THỰC HIỆN
Trần Phương Lan
ii
Trang 5LỜI CẢM ƠN
Trong quá trình thực hiện đề tài “Nghiên cứu triển khai Big Data trong khai phá trithức ẩn hỗ trợ hoạt động quản trị quan hệ khách hàng tại ngân hàng TMCP CôngThương
Việt Nam” Em đã nhận được rất nhiều sự giúp đỡ từ phía Học viện Ngân hàng, thầycô
giảng viên trong khoa Hệ thống thông tin quản lý Xin gửi lời cảm ơn chân thành đếncác thầy cô
Xin bày tỏ lòng cảm ơn sâu sắc tới TS Phan Thanh Đức, trưởng khoa Hệ thốngthông tin quản lý trực thuộc Học Viện Ngân Hàng, người đã trực tiếp hướng dẫn emhoàn thành khóa luận này
Xin bày tỏ lòng biết ơn đến các anh chị cán bộ nhân viên của ngân hàng TMCPCông Thương, đặc biệt là anh Trần Hồng Thắng - Giám đốc dữ liệu kiêm trưởng phòngQuản trị thông tin quản lý, anh Bùi Quý Dương - phó phòng Quản trị thông tin quản lý,anh Phạm Tiến Toàn - chuyên viên bộ phận phân tích dữ liệu phòng Quản trị thông tinquản lý đã giúp đỡ em trong quá trình tìm hiểu thực trạng quản trị quan hệ khách hàngtại ngân hàng TMCP Công Thương Việt Nam
Xin bày tỏ lòng cảm ơn tới chị Lê Ngọc Tú (Salesforce chi nhánh Singapore) đãgiúp đỡ em tìm hiểu về cách quản lý thông tin khách hàng trên Saleforces
iii
Trang 6MỤC LỤC NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN Error! Bookmark not defined.
LỜI CAM ĐOAN ii
LỜI CẢM ƠN iii
MỤC LỤC iv
DANH MỤC HÌNH ẢNH vi
DANH MỤC BẢNG BIỂU viii
DANH MỤC TỪ VIẾT TẮT ix
MỞ ĐẦU 1
CHƯƠNG I TỔNG QUAN 3
1 Tổng quan về Big Data 3
1.1 Khái niệm Big Data 3
1.2 Đặc trưng Big Data 3
1.3 Kiến trúc Big Data 5
1.4 Một số thành phần trong công nghệ Big Data 8
2 Tổng quan ứng dụng Big Data vào hoạt động quản trị quan hệ khách hàng trong ngành dịch vụ ngân hàng 10
3 Tổng quan về mô hình năng lực trưởng thành Big Data 11
3.1 Khái niệm mô hình năng lực trưởng thành Big Data 11
3.2 Những mô hình năng lực trưởng thành Big Data tiêu biểu 12
CHƯƠNG II THỰC TRẠNG DỮ LIỆU TẠI NGÂN HÀNG TMCP CÔNG THƯƠNG VIỆT NAM 24
1, Mô hình năng lực trưởng thành dữ liệu BDBA 24
1.1 Lý thuyết xây dựng mô hình BDBA 24
1.2 Nội dung và cách thức đánh giá của mô hình BDBA 28
1.3 Kết quả đánh giá mức độ trưởng thành dữ liệu tại ngân hàng TMCP Công Thương Việt Nam 32
2 Thực trạng dữ liệu tại ngân hàng TMCP Công Thương Việt Nam 34
2.1 Thực trạng khả năng phân tích và quản lý dữ liệu tại ngân hàng TMCP Công Thương Việt Nam 35
2.2 Thực trạng khả năng phát triển và ứng dụng nền tảng công nghệ Big Data tại ngân hàng TMCP Công Thương Việt Nam 37
iv
Trang 73 Nhận định các vấn đề dữ liệu trong hoạt động quản trị quan hệ khách hàng tại
ngân hàng TMCP Công Thương Việt Nam 41
3.1 Dữ liệu khách hàng chưa đầy đủ 42
3.2 Hạ tầng công nghệ chưa phù hợp 42
Chương III ĐỀ XUẤT NÂNG CAO MỨC ĐỘ SẴN SÀNG VỀ DỮ LIỆU TRONG TRIỂN KHAI BIG DATA HỖ TRỢ HOẠT ĐỘNG QUẢN TRỊ QUAN HỆ KHÁCH HÀNG TẠI NGÂN HÀNG TMCP CÔNG THƯƠNG VIỆT NAM 45
1 Tích hợp Data Lake vào trong kiến trúc hệ thống EDW 45
1.1 Tổng quan kiến thức cơ bản về Data Lake 45
1.2 Thiết kế kiến trúc hệ thống EDW tích hợp Data Lake 46
2 Tích hợp Apache Hadoop vào trong kiến trúc hệ thống EDW 48
2.1 Tổng quan kiến thức cơ bản về Apache Hadoop 48
2.2 Thiết kế kiến trúc hệ thống EDW tích hợp Apache Hadoop 49
3 Tích hợp Hybrid Cloud Computing vào trong kiến trúc hệ thống EDW 50
3.1 Tổng quan kiến thức cơ bản về Cloud Computing 50
3.2 Thiết kế kiến trúc hệ thống EDW tích hợp Hybrid Cloud Computing 51
4 Đề xuất tái cấu trúc hệ thống EDW tích hợp nền tảng công nghệ Big Data 53
KẾT LUẬN 55
TÀI LIỆU THAM KHẢO xi
PHỤ LỤC xvi
PHỤ LỤC 1 - MÔ HÌNH BDBA BỘ CÂU HỎI ĐÁNH GIÁ MỨC ĐỘ TRƯỞNG THÀNH DỮ LIỆU xvii
PHỤ LỤC 2 - MÔ HÌNH BDBA BẢNG MA TRẬN MÔ TẢ MỨC ĐỘ TRƯỞNG THÀNH DỮ LIỆU xxx
PHỤ LỤC 3 - PHỎNG VẤN SÂU NỘI DUNG PHỎNG VẤN BỘ PHẬN PHÂN TÍCH DỮ LIỆU TẠI PHÒNG MIS CỦA NGÂN HÀNG TMCP CÔNG THƯƠNG VIỆT NAM xxxvi
v
Trang 8DANH MỤC HÌNH ẢNH
Hình 1-1 Đặc trưng Big Data [12] 4
Hình 1-2 Kiến trúc Big Data [16] 7
Hình 1-3 Ứng dụng công nghệ với từng đặc tính của Big Data[14] 8
Hình 3-1 Kết quả đánh giá mô hình IBM [47] 15
Hình 3-2 Mô hình trưởng thành Big Data của Radcliffe [48] 16
Hình 3-3 Mô hình đánh giá trưởng thành dữ liệu TDWI [49] 17
Hình 3-4 Nhân tố đánh giá của mô hình TDWI [50] 18
Hình 3-5 Kết quả đánh giá mô hình TDWI [51] 19
Hình 3-6 Kết quả đánh giá mô hình CSC [53] 21
Hình 3-7 Mô hình đánh giá năng lực trưởng thành Hortonworks[55] 22
Hình 3-8 Kết quả đánh giá mô hình Hortonworks [54] 22
Hình 1-1 Mô hình BDBA 27
Bảng 1-2 Số lượng câu hỏi từng phân vùng theo mô hình BDBA 28
Hình 1-2 Giao diện bộ câu hỏi mô hình BDBA - dạng câu hỏi chọn một đáp án 29
Hình 1-3 Giao diện câu hỏi mô hình BDBA - dạng câu hỏi chọn nhiều đáp án 29
Hình 1-4 Kết quả đánh giá mức độ trưởng thành dữ liệu theo mô hình BDBA tại phòng MIS ngân hàng TMCP Công Thương Việt Nam 33
Hình 1-5 Mô tả kết quả đánh giá mức độ trưởng thành dữ liệu tại phòng MIS ngân hàng TMCP Công Thương Việt Nam 34
Hình 2-1 Kiến trúc hệ thống EDW của ngân hàng TMCP Công Thương Việt Nam (Nguồn: Vietinbank) 38
Hình 2-2 Một số chủ đề báo cáo nghiệp vụ trên công cụ BI Launchpad [61] 39
Hình 2-3 Kết nối nguồn dữ liệu trên BI Platform với SAP Crystal Report [61] 40
Hình 2-4 Quản lý tài khoản khách hàng qua mã CIF trên hệ thống VCRM [61] 41
Hình 1-1 Khung kiến trúc tích hợp luồng dữ liệu lưu động trên Data Lake [62] 46
Hình 1-2 Đề xuất tích hợp Data Lake vào kiến trúc hệ thống EDW 47
Hình 2-1 Hệ sinh thái Apache Hadoop [63] 48
Hình 2-2 Đề xuất tích hợp Data Lake vào kiến trúc hệ thống EDW 49
vi
Trang 9Hình 3-1 Phân loại hạ tầng dịch vụ Cloud Computing (Nguồn: Antoanthongtin) 51 Hình 3-2 Đề xuất tích hợp nền tảng Hybrid Cloud vào kiến trúc hệ thống EDW 52 Hình 3-3 Đề xuất tái cấu trúc hệ thống EDW 53
vii
Trang 10DANH MỤC BẢNG BIỂU
Bảng 3-1 Mô hình phân tích năng lực trưởng thành Big Data IBM [46] 13Bảng 3-2 Mô hình trưởng thành Big Data CSC [52] 19Bảng 1-1 So sánh phân vùng đánh giá độ trưởng thành Big Data giữa các mô hìnhBDMM [41] 25Bảng 1-2 Số lượng câu hỏi từng phân vùng theo mô hình BDBA 28Bảng 2-1 Một số mảng phân quyền người dùng nghiệp vụ trong Data Mart (Nguồn:Vietinbank) 38
Trang 11Từ viết
tắt
AI Artificial Intelligence Trí tuệ nhân tạo
API Application Programming Interface Giao diện lập trình ứng dụng
ATM Automated Teller Machine Máy rút tiền tự động
BDBA Big Data of Banking Academy Mô hình trưởng thành dữ liệu của
Học viện Ngân Hàng
BDMM Big Data Maturity Model Mô hình năng lực trưởng thành Big
Data
CIF Customer Information File Mã số định danh khách hàng
COE Center of Excellence Đội ngũ trung tâm ưu tú
CRM Customer Relationship Management Hệ thống quản trị quan hệ khách
hàngCSC Credit Information Centre Trung tâm thông tin tín dụng
EDW Enterprise Data Warehouse Kho dữ liệu doanh nghiệp
ERP Enterprise Resouce Planning Hệ thống hoạch định tài nguyên
doanh nghiệpETL Extract, Transform and Load Trích xuất, Chuyển đổi, Truyền tải
EWS Early Warning System Hệ thống cảnh báo sớm rủi ro tín
dụngFPT Fund Transfer Pricing Giá chuyển vốn nội bộ
HDFS Hadoop Distributed File System Hệ thống dữ liệu phân tán
HlPPO Highest Paid Person’s Opinion Ý kiến được đánh giá cao nhất
DANH MỤC TỪ VIẾT TẮT
Trang 12IaaS Infrastructure as a Service Hạ tầng cung cấp như dịch vụ
JDBC Java Datadase Connectivity Java kết nối với cơ sở dữ liệuJSON JavaScript Object Notation Định dạng hoán vị dữ liệu nhanhLOS Loan Origination System Hệ thống khởi tạo khoản vayMIS Management Information System Hệ thống thông tin quản lý
NoSQL Non relational SQL Ngôn ngữ truy vấn không ràng
buộcOLAP Online Analytical Processing Xử lý phân tích trực tuyến
OLTP Online Transactional Processing Xử lý giao dịch trực tuyến
PaaS Platform as a Service Nen tảng cung cấp như dịch vụ
RCA Root Cause Analysis Phân tích nguyên nhân gốc
RDBMS Relational Database Management
SaaS Software as a Service Phần mềm cung cấp như dịch vụSDK Software Development Kit Bộ công cụ phát triển phân mềmSQL Structured Query Language Ngôn ngữ truy vấn có cấu trúc
VCRM VietinBank Customer Relationship
Management Hệ thống quản trị quan hệ kháchhàng của ngân hàng TMCP Công
Thương Việt Nam
XML eXtensible Markup Language Ngôn ngữ đánh dấu mở rộng
x
Trang 13Khóa luận tốt nghiệp Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị
quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam
MỞ ĐẦU
Tính cấp thiết của đề tài
Vào đầu thế kỉ 20, khi hiện tượng cung vượt quá cầu xảy ra trên quy mô ngày càngrộng lớn thì mục tiêu hàng đầu của các ngân hàng là bán được nhiều sản phẩm dịch vụtài chính nhất trong khả năng của mình Trong thời kì này, các ngân hàng chỉ đơn thuần
sử dụng các phương thức marketing cổ điển như quảng cáo truyền hình, banner, tranhảnh mang tính thông tin đại chúng
Tới giữa thế kỉ 20, khi nền kinh tế dần bước vào giai đoạn ổn định thì một vấn đềmới được đặt ra Khách hàng đang dần trở thành người nắm giữ quyền lực cao nhất bởilúc này cầu tiêu dùng vượt quá cung Khách hàng không còn ở thế bị động, họ trởthành
những “thượng đế” mà ngân hàng cần quan tâm, chăm sóc Hệ quả của sự thay đổi này
là ngân hàng hướng sự quan tâm, tìm hiểu về khách hàng: khách hàng là ai? Kháchhàng
muốn gì? Ngân hàng cần làm gì để nắm bắt những nhu cầu của khách hàng? Ngân hàngchuyển sang phân tích các thông tin về khách hàng và phân nhóm họ dựa trên các tiêuchí về độ tuổi, giới tính và các thông tin cá nhân khác Tuy nhiên những thông tin ngânhàng thu thập về khách hàng là chưa đủ Phần lớn dữ liệu khách hàng nằm bên ngoài,
cụ thể là trên các trang mạng xã hội như Facebook, Twitter, Instagram nhưng chưađược ngân hàng khai thác và phân tích triệt để
Tới giữa thập niên 80 của thế kỉ 20, khi nền kinh tế đã chuyển sang giai đoạn chínmuồi thì quá trình cung cấp dịch vụ trở nên ngày càng khó khăn hơn Việc xây dựngmối quan hệ lâu dài với khách hàng và mang lại tối đa giá trị cho khách hàng hiện tạitrở thành một trong những vấn đề được đặt lên hàng đầu hiện nay Đây cũng là nềntảng
của quản trị quan hệ khách hàng - vấn đề sẽ được nghiên cứu xuyên suốt khóa luận.Khái niệm quản trị quan hệ khách hàng (Customer Relationship Management) đã kháphổ biến nhưng tại các ngân hàng thương mại Việt Nam vẫn chưa được quan tâm đúngmức Bên cạnh đó, Big Data cũng là một khái niệm còn khá mới mẻ và xa lạ Ứng dụngcủa Big Data trải dài trên mọi lĩnh vực của đời sống, từ y tế, tài chính, giao thông đếnchính trị Theo các chuyên gia, việc áp dụng Big Data trong ngân hàng sẽ giúp ngânhàng tiết kiệm rất nhiều chi phí Không chỉ dừng lại ở đó, ứng dụng Big Data giúp ngânhàng có cái nhìn rõ nét hơn về khách hàng - những thượng đế mang lại giá trị thươnghiệu và lợi nhuận cho họ Ứng dụng Big Data giúp ngân hàng đạt được sự thỏa mãn vàtrung thành của từng khách hàng Chính vì những lý do trên, nghiên cứu và ứng dụngBig Data để giải quyết các bài toán trong hoạt động quản trị quan hệ khách hàng tại các
Trang 14Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp
Trước đây đã có một số nghiên cứu về vấn đề quản trị quan hệ khách hàng tại cácngân hàng thương mại nói riêng và hệ thống ngân hàng nói chung Tuy nhiên, khóaluận
sẽ nghiên cứu thực trạng hoạt động quản trị quan hệ khách hàng tại ngân hàng TMCPCông Thương Việt Nam và đề xuất giải pháp Big Data để giải quyết những vấn đề tồnđọng đó Em muốn mang đến một cái nhìn tổng quan hơn về Big Data trong hoạt độngquản trị quan hệ khách hàng tại ngân hàng TMCP Công Thương Việt Nam Từ nhữngquan sát trên, em quyết định chọn đề tài: “Nghiên cứu và đánh giá mức độ sẵn sàngtriển
khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàngTMCP Công Thương Việt Nam”
Mục tiêu nghiên cứu
- Tìm hiểu hoạt động thu thập, lưu trữ, xử lý, phân tích và tổ chức dữ liệu trong hoạtđộng quản trị quan hệ khách hàng tại ngân hàng TMCP Công Thương Việt Nam
- Đưa ra đánh giá định tính về thực trạng dữ liệu khách hàng trong nội tại ngân hàng
- Xác định nhu cầu hiện tại trong việc phát triển hạ tầng dữ liệu ứng dụng công nghệBig Data, chuyển đổi dữ liệu thành những actionable insight về khách hàng
- Đề xuất các biện pháp cải tiến dữ liệu và những thay đổi trong hệ thống ngân hànglõi để nâng cao hiệu suất hoạt động quản trị quan hệ khách hàng tại ngân hàngTMCP Công Thương Việt Nam
Những đóng góp của đề tài
- Đưa ra bộ câu hỏi tìm hiểu thực trạng và xác định bài toán ưu tiên về dữ liệu trong
hệ thống quản trị quan hệ khách hàng tại ngân hàng TMCP Công Thương ViệtNam
- Xây dựng bộ tiêu chí đánh giá dữ liệu trong triển khai ứng dụng Big Data vào hoạtđộng quản trị quan hệ khách hàng
- Nhận định được các vấn đề về dữ liệu, đề xuất giải pháp giải quyết các bài toán dữliệu đặt ra trong triển khai ứng dụng Big Data vào hoạt động quản trị quan hệkhách
hàng tại ngân hàng TMCP Công Thương Việt Nam
Cấu trúc bài nghiên cứu
Ngoài phần mở đầu, kết luận, tài liệu tham khảo, phụ lục, nội dung chính của khóaluận được chia làm 3 chương:
Chương I: Tổng quan
Chương II: Thực trạng dữ liệu tại ngân hàng TMCP Công Thương việt nam
Chương III: Đề xuất nâng cao mức độ sẵn sàng về dữ liệu trong triển khai Big
Trang 15Khóa luận tốt nghiệp Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị
quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam
CHƯƠNG I TỔNG QUAN
Chương I sẽ giới thiệu tổng quan lý thuyết về khái niệm Big Data, khả năng của Big Data trong khai phá các tri thức ẩn hỗ trợ hoạt động quản trị quan hệ khách hàng trong ngành dịch vụ ngân hàng Đồng thời, chương I cũng đưa ra các nghiên cứu về mô hình năng lực trưởng thành Big Data, làm
cơ sở xây dựng bộ câu hỏi phỏng vấn và là nền tảng cho việc đánh giá thực trạng triển khai Big Data ở chương II.
1 Tổng quan về Big Data
Phần đầu chương là các nghiên cứu tìm hiểu về nền tảng công nghệ và hạ tầng ứngdụng của Big Data Trong phần này, khóa luận sẽ giới thiệu một cách tổng quát kháiniệm và các tính chất đặc trưng của Big Data, khối kiến trúc tiêu biểu và các công nghệ
hỗ trợ trong triển khai ứng dụng các dự án Big Data
Big Data, hay còn gọi là Dữ liệu lớn, là khái niệm dùng để chỉ một tập những dữliệu có tính chất đặc biệt, không thể xử lý bằng các công cụ hay ứng dụng truyền thống.Theo định nghĩa trên Techopedia [1], Big Data đề cập đến các quy trình được sửdụng khi những kĩ thuật trong xử lý và khai phá dữ liệu không còn cung cấp đủ các yêucầu của tổ chức về những tri thức khai thác được từ nguồn dữ liệu khách hàng trong nội
bộ cũng như nằm bên ngoài tổ chức Những dữ liệu này là phi cấu trúc, là những sựkiện
diễn ra trong thời gian thực, yêu cầu dung lượng lưu trữ lớn và có các cách thức tiếpcận
xử lý riêng biệt, sử dụng đồng thời nhiều nền tảng phần cứng được tích hợp sẵn sàngtrong hạ tầng công nghệ của tổ chức [1] [2], dành cho các phân tích và khai phá liên tục
hỗ trợ nâng cao trải nghiệm cũng như phát triển vòng đời khách hàng [3]
Nói ngắn gọn, Big Data là thuật ngữ miêu tả một lượng lớn dữ liệu, bao gồm cócấu
trúc, bán cấu trúc và phi cấu trúc [4] [5] Nhìn chung, Big Data yêu cầu cách thức xử lýphức tạp và công nghệ lưu trữ hiện đại hơn so với hệ cơ sở dữ liệu quan hệ truyềnthống
[1] [2] [4], dữ liệu trong Big Data đến từ nhiều nguồn dưới nhiều định dạng khác nhau[6], phát sinh và liên tục thay đổi trong hoạt động giao dịch, tương tác hàng ngày giữakhách hàng với các tổ chức doanh nghiệp [7]
Trang 16Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp
3Vs được coi là ba đặc trưng cơ bản nhất của Big Data [2] [7] [5] [9] [10], tuynhiên
cùng với sự phát triển không ngừng của nền công nghệ hiện đại, những nghiên cứu vàyêu cầu về dữ liệu ngày càng tăng, hệ sinh thái Big Data ngày càng trở nên phức tạpvới
mô hình 5Vs, được công nhận là năm đặc tính cơ bản và phổ biến của nền tảng BigV
• Statistical
•Correlations
Hypothetical
Hình 1-1 Đặc trưng Big Data [12]
3Vs đại diện ba hướng phát triển nổi bật của dữ liệu và là ba thách thức lớn choviệc
quản trị nguồn dữ liệu lớn trong thời đại công nghệ mới [11] [12] Big Data yêu cầunền
tảng hạ tầng công nghệ và khối kiến trúc thông tin được thiết kế và xây dựng phù hợptrong việc triết xuất các thông tin giá trị (value), tin cậy (veracity) từ khối lượng lớn dữliệu (volume) đến từ nhiều nguồn khác nhau và có những định dạng riêng biệt (variety),với quy trình thu thập, xử lý, phân tích và khai phá có tốc độ diễn ra trong thời gianthực
(velocity) [3] [5] [12]
S Volume
Khối lượng của Big Data được tính từ đơn vị terabyte cho đến petabyte [11] [9][10], thậm chí exabyte [12] cho một khối dữ liệu Trong một số báo cáo đã thể hiện [9],với mỗi petabyte dữ liệu được thu thập và lưu trữ, 17% tổng số tổ chức doanh nghiệpsẽ
tạo thêm 2,5 texabyte dữ liệu báo cáo phụ trợ
S Velocity
Trang 17Khóa luận tốt nghiệp Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị
quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam
S Variety
Big Data là tập hợp của nhiều nguồn dữ liệu Dữ liệu có thể đến từ tổ chức doanhnghiệp như các báo cáo kinh doanh [5], các giao dịch khách hàng [7] [9] [10], cũng cóthể đến thông qua nguồn dữ liệu trên internet như lịch sử truy cập trang web của ngườidùng [2], các bài post trên mạng xã hội hoặc nguồn thông tin thu thập được từ máy mócthiết bị IoTs [5] [9] [13]
Big Data được chia thành ba kiểu dữ liệu chính: có cấu trúc, bán cấu trúc và phicấu
trúc Những dữ liệu có cấu trúc truyền thống được lưu trữ trong hệ cơ sở dữ liệu quan
hệ SQL hoặc dưới dạng bảng tính Excel [2] [5] [13] Nguồn dữ liệu bán cấu trúc và phicấu trúc được thu thập và phân tích dưới nhiều dạng: web log [3], text, audio, video [2][7] [12], graph, thông điệp thu được từ mạng xã hội, dữ liệu cảm biến [10], RFID tags,machine logs, tín hiệu GPS từ điện thoại di động [9]
hướng thị trường và các yếu tố kinh tế [12] Tính tin cậy của Big Data phụ thuộc vàonguồn gốc dữ liệu, có giá trị ảnh hưởng bởi yếu tố thời gian và sự tác động của các kĩthuật khai phá đối với các thông tin phân tích để đưa ra quyết định hành động [13]
S Value
Khác với những dữ liệu truyền thống, Big Data được xem là công nghệ mang lạicho tổ chức những giá trị gia tăng nhằm duy trì và bảo vệ lợi thế cạnh tranh [12] [9].Thay vì lưu trữ và quản trị dữ liệu khách hàng theo cách tiếp cận tổng quát, công nghệBig Data giúp tổ chức chuyên biệt hóa từng đối tượng khách hàng và lưu trữ dữ liệuđộc
lập phục vụ cho hoạt động phân tích hành vi và gia tăng trải nghiệm Mỗi khách hàngđược thiết kế một quy trình chăm sóc đặc biệt với mục đích kinh doanh khác nhau dựatrên nền tảng công nghệ tự động và liên tục thay đổi [9]
Trang 18Khóa luận tốt nghiệp Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị
quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam
Theo Mike Wasson1 [15], giải pháp Big Data trên cơ bản được ứng dụng để xử lýcác luồng công việc như: (1) Xử lý đồng thời các nguồn dữ liệu lưu trữ trên hệ thốngmáy chủ; (2) Xử lý các nguồn dữ liệu lưu động trong thời gian thực; (3) Tương tác vàthực hiện khai phá tri thức trên nhiều nguồn dữ liệu đa dạng; (4) Phân tích dự đoán vàứng dụng công nghệ học máy
Nhìn chung, hầu hết khối kiến trúc Big Data bao gồm các thành phần [15]:
từ nhiều nguồn và thuộc nhiều định dạng khác nhau
đầu vào
S Real-time Message Ingestion: Thu thập lưu trữ dữ liệu trong thời gian thật.
S Stream Processing: Tiến trình chọn lọc, tổng hợp và xử lý luồng dữ liệu lưu
động
S Analysis and Reporting: Thiết kế các mô hình dữ liệu và các khối OLAP đa
chiều, tạo lập các báo cáo phân tích
S Orchestration: Điều phối các quy trình xử lý dữ liệu.
Kiến trúc Big Data tiêu biểu, thể hiện bức tranh toàn cảnh và bao gồm hầu hết cácđường dẫn dữ liệu cơ bản cho một tổ chức kinh doanh [16] được thiết kế như hình vẽdưới đây:
Trang 19Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp
Hình 1-2 Kiến trúc Big Data [16]
Dữ liệu đến từ nhiều nguồn không đồng nhất, như nguồn dữ liệu có cấu trúc từ hệ
cơ sở dữ liệu SQL, NoSQL.; nguồn dữ liệu bán cấu trúc và phi cấu trúc đến từ các hệthống CRM, ERP, các chiến dịch, chương trình quảng cáo tiếp thị.: các nguồn dữ liệulưu trữ lịch sử truy cập của khách hàng như weblog, user click, user visit, linking page.Kiến trúc Big Data sử dụng nhiều công cụ hỗ trợ trong việc nhập/ xuất dữ liệu nguồnvào hệ thống lưu trữ như ETL, SQOOP, JDBC và các công cụ quản lý file log nhưSplunk, Scribe Quá trình xử lý và tích hợp dữ liệu trong việc lưu trữ và phân tách dữliệu thành các luồng phân tích sử dụng các nền tảng công nghệ hỗ trợ như SaaS,Hadoop,
HDFS, MapReduce, Hive, Pig, SAS, MPP Khối kiến trúc nền tảng Big Data tích hợpcác chương trình ứng dụng trong phân tích và tạo lập báo cáo về hiệu suất các hoạtđộng
kinh doanh sản xuất trong nội bộ tổ chức (ad-hoc) cũng như những nghiên cứu, tìmhiểu
Trang 20Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp
Sự ra đời và phát triển của nền tảng công nghệ Big Data nhằm mục đích giúp cáctổ
chức kinh doanh dịch vụ đạt được giá trị từ việc phân tích khối lượng lớn và đa dạngnguồn dữ liệu Big Data, với tốc độ thao tác và xử lý cao đồng thời vẫn đạt được yêucầu
Hình 1-3 Ứng dụng công nghệ với từng đặc tính của Big Data [14]
Khóa luận chỉ đưa ra thông tin tìm hiểu về những công nghệ xuất hiện trong giớihạn nội dung đề tài:
J Data Warehouse
Data Warehouse hay Enterprise Data Warehouse (EDW) được dùng để lưu trữnhững mô hình dữ liệu hoặc những dữ liệu đã được cấu trúc từ các nguồn thông tin thuthập trong tổ chức [17] [18] Data Warehouse lưu trữ dữ liệu đến từ nhiều nguồn khácnhau, được sử dụng cho việc cung cấp báo cáo và phân tích dữ liệu cho các yêu cầu đặc
tả của các đơn vị kinh doanh trong tổ chức [17] [19] Dart Mart là các thể hiện cụ thểhơn của Data Warehouse [17], được thiết kế đặc biệt dành cho một chủ đề kinh doanhhoặc một phòng ban điều hành độc lập [18]
Data Warehouse lấy dữ liệu từ Data Lake, nơi lưu trữ toàn bộ nguồn dữ liệu thôcủa
tổ chức với nhiều định dạng khác nhau [17] Data Lake là công nghệ giúp tổ chức cóthể
khai thác toàn bộ giá trị của một nguồn dữ liệu, được sử dụng chủ yếu dành cho cácphân tích dữ liệu nâng cao hoặc lấy mẫu dự đoán [19]
J NoSQL
NoSQL là thuật ngữ dùng trong hệ cơ sở dữ liệu nguồn mở phân tán [20]; xử lýnguồn dữ liệu lớn, bán cấu trúc hoặc phi cấu trúc; tăng khả năng chịu lỗi; yêu cầu truyvấn dữ liệu với tốc độ cao mà không đòi hỏi quá nhiều về năng lực phần cứng cũngnhư
tài nguyên hệ thống [21] [22]
Trang 21Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp
Family DB lưu trữ dữ liệu dưới dạng cột; (4) Graph DB lưu trữ dữ liệu dưới dạng node[20] [21] [22] Trong dó Document DB là cơ sở dữ liệu NoSQL thông dụng nhất trongquy trình xử lý nguồn dữ liệu Big Data [20]
S Hadoop
Hadoop là nền tảng công nghệ mã nguồn mở, cho phép lưu trữ và xử lý phân táncác tệp dữ liệu lớn trên các cụm máy tính [23] [24] thông qua một mô hình lập trìnhlinh
hoạt, dễ dàng mở rộng quy mô [25] Hệ sinh thái Hadoop bao gồm hai thành phầnchính:
(1) HDFS lưu trữ dữ liệu phân tán và (2) MapReduce xử lý dữ liệu phân tán [23] [24].Ngoài ra, hệ sinh thái Hadoop còn bao gồm nhiều công nghệ và các công cụ giảipháp khác, như mô hình lập trình Spark cung cấp cổng vào cho các tính toán trên bộnhớ, giao diện dòng lệnh Sqoop chuyển đổi dữ liệu giữa HDFS và RDBMS, nền tảngphát triển kịch bản Hive và Pig dành cho các hoạt động của MapReduce, [26]
S Cloud Computing
Cloud Computing theo định nghĩa của IBM [27] là việc cung cấp các tài nguyênmáy tính cho người dùng theo mục đích sử dụng thông qua kết nối Internet Nguồn tàinguyên này có thể là bất kì thứ gì liên quan đến điện toán và máy tính, ví dụ như phầnmềm, phần cứng, hạ tầng mạng cho đến các máy chủ và mạng lưới máy chủ cỡ lớn.Một
cách đơn giản, Cloud Computing là việc sử dụng các tài nguyên và ứng dụng được ảohóa thông qua môi trường Internet [28]
Cloud Computing chia thành ba loại: (1) Public Cloud lưu trữ dữ liệu người dùngtrên nền tảng internet và ủy quyền bảo mật cho nhà cung cấp dịch vụ quản lý; (2)Private
Cloud lưu trữ dữ liệu nội bộ hoặc được ủy quyền quản lý bởi một bên thứ ba, có mức
độ riêng tư và bảo mật cao; (3) Hybird Cloud kết hợp lưu trữ trên cả Public Cloud vàPrivate Cloud [27]
Cloud Computing được cung cấp theo ba loại hình dịch vụ chính: (1) IaaS cungcấp
hạ tầng máy chủ, thường dành cho các nhà phát triển phần mềm; (2) PaaS cung cấp nềntảng để triển khai phần mềm; (3) SaaS cung cấp sản phẩm ứng dụng, chủ yếu dành chongười dùng cuối [27]
S Big Data analytics
Big Data cung cấp cho tổ chức một cái nhìn toàn diện về thị trường và môi trườngphân tích mạnh mẽ [29] bao gồm:
Trang 22Khóa luận tốt nghiệp Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị
quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam
đồ thị [30], sử dụng phổ biến nhất trong việc tạo ra các báo cáo tài chính, báo cáodoanh
thu, báo cáo hàng tồn kho hay những báo cáo liên quan đến tần suất sử dụng dịch vụcủa
khách hang [29] [31] nhờ vào ứng dụng các công cụ BI
(2) Predictive Analytics, sử dụng với mục đích dự đoán xu hướng tương lai vàđiền
khuyết những trường dữ liệu còn thiếu [29] Predictive Analytics là khả năng sử dụngnhiều kĩ thuật trong khai phá nguồn dữ liệu lịch sử và đưa ra các dự đoán [30] về hành
vi khách hàng, xu hướng tiêu dùng, ưu đãi tín dụng hay các yêu cầu đầu vào dành chochuổi cung ứng.[29] Các ứng dụng hay sử dụng trong Predictive Analytics là DataMining, như Association Rule Mining hay Pattern Mining; AI; Machine Learning cùngvới các thuật toán như Classification, Clustering, Regression, Feature Selection,Forecasting,
(3) Prescriptive Analytics, sử dụng với mục đích đưa ra các giải pháp khả thi chomột bài toán cụ thể dưới sự so sánh các mức tác động của các giải pháp đến xu hướng
dự đoán trong tương lai [31] Nói cách khác, Precriptive Analytics có khả năng dự đoáncác chuỗi ảnh hưởng có thể xảy ra dựa trên các lựa chọn khác nhau trong việc đưa raquyết định [30] Các công cụ và kĩ thuật được sử dụng kết hợp như luật doanh nghiệp,các thuật toán dự đoán, Machine Learning và các thủ tục mô hình điện toán [29]
2 Tổng quan ứng dụng Big Data vào hoạt động quản trị quan hệ khách hàng
trong ngành dịch vụ ngân hàng
Một thực tiễn ứng dụng thành công công nghệ Big Data trong việc hỗ trợ khai phánguồn tri thức không tường mình về khách hàng tại Barclays, ngân hàng toàn cầu trựcthuộc công ty dịch vụ tài chính ngân hàng đa quốc gia của Anh có trụ sở đặt tại London[36] Barclays sử dụng giải pháp của Salesforce, ứng dụng myClient, dựa trên nền tảngApp Cloud Mobile, cho phép nhân viên thu thập toàn bộ thông tin về mọi hoạt độngphát sinh hàng ngày của khách hàng diễn ra trong thời gian thực, từ đó tạo lập các báocáo và phân tích nhu cầu của khách hàng để đưa ra các giải pháp phù hợp hướng tớitừng đối tượng khách hàng của Barclays MyClient được xây dựng dựa trên công nghệ
Trang 23Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp
Ứng dụng myClient dựa trên nền tảng Salesforce có khả năng ghi âm cuộc gọi và
tự động chuyển cuộc gọi thoại thành dữ liệu văn bản dưới dạng text Thời gian tạo báocáo giảm xuống còn 2 - 3 ngày nhờ ứng dụng myClient Các báo cáo được tạo tự động,thông tin được lưu giữ và mô tả lại một cách chi tiết và khách quan MyClient xác địnhcác từ khóa chính cho từng file báo cáo chuyển đổi và tự động phân nhóm khách hàngdựa trên nội dung chuyển đổi, hỗ trợ ngân hàng thiết kế các chiến lược marketing cánhân hóa với từng nhóm đối tượng khách hàng
Trong hoàn cảnh khác, ngân hàng Hoa Kỳ cũng ứng dụng nền tảng Salesforce đểcung cấp khách hàng quyền truy cập vào tất cả các kênh tương tác như máy tính cánhân,
thiết bị di động và hệ thống máy ATM tại hơn 3000 chi nhánh tại 25 tiểu bang [37]
Dữ liệu khách hàng từ mọi chi nhánh được đổ về một hệ thống chung thống nhất,
từ đó ngân hàng Hoa Kỳ thực hiện các phân tích lấy khách hàng làm trung tâm Với cơ
sở dữ liệu thống nhất, ngân hàng Hoa Kỳ có đủ dữ liệu khách hàng cần thiết cho hoạtđộng phân tích và chuyển đổi dữ liệu thô thành thông tin có ích với sự trợ giúp củacông
cụ Sales Cloud Einstein Để xây dựng mô hình dự đoán, Einstein sử dụng công cụMachine Learning và AI để thực hiện các phân tích chuyên sâu, các chiến lượcmarketing dựa trên dữ liệu về khách hàng tiềm được tích hợp sẵn có trong hệ thống.Nhờ ứng dụng Einstein, dữ liệu về các báo cáo và thông tin phân tích hành vi kháchhàng được chia sẽ dễ dàng hơn giữa các chi nhánh, hỗ trợ hoạt động chăm sóc và nângcao trải nghiệm khách hàng khi sử dụng dịch vụ và thực hiện giao dịch tại các chinhánh
của ngân hàng Hoa Kỳ [38]
3 Tổng quan về mô hình năng lực trưởng thành Big Data
Phần cuối chương giới thiệu về khái niệm mô hình năng lực trưởng thành BigData
Trong giới hạn đề tài, khóa luận sẽ chỉ đề cập đến lý thuyết về tiêu chí cũng như cáchthức đánh giá của một số mô hình tiêu biểu trong nghiên cứu đánh giá năng lực trưởngthành của Big Data
“Maturity Model”, hay Mô hình năng lực trưởng thành, được sử dụng như mộtcông
cụ đánh giá các yếu tố ảnh hưởng đến khả năng trưởng thành của tổ chức, thể hiện sựtăng trưởng về chất và lượng, làm cơ sở đánh giá và so sánh cải tiến, đưa ra các hànhđộng triển khai thích hợp để đưa tổ chức lên mức độ trưởng thành cao hơn cũng nhưnâng cao hiệu suất hoạt động trong tổ chức [39] [40]
Trang 24Khóa luận tốt nghiệp Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị
quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam
trình triển khai và phát triển công nghệ Big Data, hỗ trợ tổ chức trong việc định hướng,xác định mục tiêu và ứng dụng, khai thác giá trị của những phân tích Big Data, đồngthời tránh các rủi ro không cần thiết dẫn đến sự thất bại của dự án [39] [41] cũng nhưduy trì lợi thế cạnh tranh, đem lại nhiều giá trị hơn cho khách hàng từ những lợi ích màBig Data có thể mang lại [42]
BDMM đánh giá mức độ trưởng thành hiện tại (as-is maturity) của Big Data, địnhhướng mục tiêu phát triển kế tiếp (to-be maturity) và đưa ra các hướng dẫn giúp tổ chứcnâng mức trưởng thành lên giai đoạn cao hơn trong khoảng thời gian xác định [43]
BDMM được thiết kế với mục đích sử dụng rất linh hoạt nhưng có thể chia thành
ba nhóm cơ bản: Descriptive Model, Prescriptive Model và Comparative Model Banhóm này được coi là các giai đoạn tiến hóa trong vòng đời phát triển mô hình [44]
a) Descriptive Model
Descriptive Model thông qua việc phân tích định tính về khả năng hoạt động và nềntảng công nghệ trong tổ chức, từ đó đánh giá ước lượng mức trưởng thành trên trên tiến
độ trưởng thành trong triển khai ứng dụng Big Data [39] [44]
Một ví dụ về Descriptive Model là mô hình phân tích năng lực trưởng thành dữ liệulớn IBM, được nghiên cứu bởi Niall Betteridge1 và Chris Nott2 [39] [41] Mô hình IBMgiúp các tổ chức đánh giá khả năng hiện tại trong việc tạo ra giá trị từ các khoản đầu tưdành cho Big Data và hỗ trợ các sáng kiến kinh doanh chiến lược, cung cấp tiêu chí đánhgiá để xác định trạng thái hiện tại theo từng nhân tố kinh doanh, đồng thời đánh dấu mụctiêu trưởng thành dữ liệu mà tổ chức mong muốn [45]
Mô hình IBM là ma trận tính điểm bao gồm hàng ngang là năm cấp độ trưởng thành:
1 - Ad hoc: Tổ chức ứng dụng Big Data ở mức độ đơn giản và trong phạm vi hẹp
2 - Foundation: Tổ chức xây dựng được nền tảng Big Data cơ bản
3 - Competitive: Big Data mang lại lợi thế cạnh tranh cho tổ chức
4 - Differentiating: Big Data tạo ra sự khác biệt cho tổ chức
5 - Breakaway: Big Data gây nên sự đột phá trong tổ chức
Hàng dọc của mô hình IBM dựa trên sáu nhân tố kinh doanh: (1) Business Strategy,(2) Information, (3) Analytics, (4) Culture and Execution, (5) Architecture, (6)
Australia.
Trang 25kinh doanh Sự
mở rộng cách thức sử dụng dữ liệu dừng ở mức
tạo báo cáo hàng ngày và báo cáo tài
Tổ chức nhận ra
Big Data có thể được sử dụng trong các chiến lược kinh doanh
để tạo ra các giá
trị kinh doanh
và tỷ lệ ROI thông qua việc
mở rộng triển
Chiến lược kinh doanh sử dụng các tri thức ẩn khai phá từ dữ liệu vào trong các quy trình nghiệp vụ của tổ
chức.
Tổ chức nhận ra
lợi thế cạnh tranh khi sử dụng các tri thức ẩn về khách hàng.
Dữ liệu định hướng sự phát triển và đổi mới của các mô hình kinh doanh.
Information Tổ chức sử
dụng những dữ liệu lịch sử có cấu trúc trong nội bộ để theo dõi tình hình kinh doanh.
Thông tin được
sử dụng với mục đích quản
lý hiệu quả các nghiệp vụ trong
tổ chức.
Thông tin được ứng dụng trong cải tiến quy trình hoạt động
và tăng hiệu quả
các cam kết khách hàng.
Các thông tin liên quan trong những ngữ cảnh đặc biệt được sử
dụng như các nhân tố tạo ra sự
Thông tin được xem như tài sản chiến lược.
Analytics Các phân tích
dữ liệu giới hạn
ở mức miêu tả những sự kiện
đã xảy ra.
Các phân tích
dữ liệu được sử dụng giải thích với những người ra quyết định lý do xảy
ra các sự kiện kinh
doanh
Phân tích tri thức ẩn được sử dụng trong dự đoán tương đối những sự kiện xảy ra tại một số
quy trình hoạt động của tổ chưcs.
Các phân tích
dự đoán được sử
dụng để tối ưu hóa việc ra quyết định và lựa chọn hành động phù hợp nhất để tối đa
Các khai phá phân tích tri thức ẩn giúp tổ chức tối ưu và
tự động hóa các quy trình kinh doanh.
Culture and
Execution Các khai phá
phân tích tri thức ẩn được ứng dụng chủ yếu bởi một số nhân viên và mang lại ít sự
Tổ chức hiểu nguyên nhân xảy ra các sự kiện trong hoạt động kinh doanh, tuy nhiên văn hóa tổ
Tổ chức có thể giới hạn các quyết định kinh doanh dựa trên những phân tích tri thức ẩn khai phá để cải thiện
Những nhà ra quyết định được
cung cấp đầy đủ
nguồn tri thức
ẩn từ các phân tích dữ liệu Tổ
Tổ chức ứng dụng và phát triển các quy trình nghiệp vụ liên tục, sử dụng
phân tích tri thức ẩn với các
Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp
Governance [46] Tổ chức thực hiện tự đánh giá mức độ trưởng thành Big Data dựa trênbảng ma trận mô tả các tiêu chí IBM được xác định [45] [46]
Bảng 3-1 Mô hình phân tích năng lực trưởng thành Big Data IBM [46]
Trang 26ảnh hưởng đến hoạt động điều hành tổ chức.
chức vẫn chưa chấp nhận các giá trị tri thức ẩn
đem lại.
hiệu suất điều hành và tạo thêm nhiều giá trị mới.
hiệu quả trong tối đa hóa các lợi ích kinh doanh thu lại.
đối tượng kinh doanh chiến lược.
Architecture Tổ chức không
có khối kiến trúc thông tin toàn diện, thống nhất.
Tổ chức có nền tảng kiến trúc thông tin nhưng chưa có sự mở rộng tích hợp các nguồn dữ liệu mới hay các
khả năng phân tích nâng cao.
Các mẫu kiến trúc thông tin thực tiễn triển khai Big Data được xác định
và ứng dụng trong một số lĩnh vực cụ thể.
Kiến trúc thông tin và các tiêu chuẩn liên kế được xác định
rõ ràng cho hầu hết khối lượng
dữ liệu Các tiêu
chí về khả năng
xử lý, sự đa dạng và tính xác
thực dữ liệu được đề cao trong việc đem
Kiến trúc thông tin tập trung vào
các chiến lược kinh doanh với các thông số đặc
tả về khối lượng, vận tốc, tính đa dạng và
độ xác thực của
dữ liệu trong khả năng đem lại sự đột phá trên thị trường.
Governance Hoạt động quản
trị được thực hiện thủ công và
ít mang lại hiệu quả các hoạt động giám sát.
Tri thức và quyền sở hữu
dữ liệu được xác định và quản lý theo từng phần riêng biệt.
Các chính sách
và thủ tục được thiết lập đồng thời thực hiện quản lý, bảo vệ nguồn thông tin trọng yếu trên toàn tổ chức.
Mức độ tin cậy thông tin và các nguồn tri thức
ẩn được nhúng
và phản ánh vào
trong quy trình
ra quyết định.
Quản trị thông tin được tích hợp vào tất cả các khía cạnh của quy trình kinh doanh nghiệp vụ.
Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp
Kết quả đánh giá được thể hiện trực quan bằng sơ đồ radar, thể hiện trạng thái trưởngthành hiện tại và trạng thái mong muốn của tổ chức trong các nỗ lực đầu tư dành chocác dự án Big Data [47]
Trang 27Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp
Hình 3-1 Kết quả đánh giá mô hình IBM[47]
Điểm đánh giá mức độ trưởng thành trong mô hình IBM được tính tăng theo từngcấp độ và chấm điểm dựa trên từng nhân tố Ket quả đánh giá dựa trên sự nghiên cứu và
tự tiến hành khảo sát của từng tổ chức theo chuẩn ma trận mô tả mô hình IBM với nămcấp độ và sáu phân vùng đánh giá
b) Prescriptive Model
Prescriptive Model đưa ra các định hướng trong việc gia tăng mức độ trưởng thànhcủa công nghệ Big Data [39], chỉ ra tiến độ phát triển phù hợp với nhu cầu mong muốncủa tổ chức, đồng thời cung cấp chỉ dẫn về các biện pháp cải tiến, các hành động cụ thểtrong sự nâng cao mức độ trưởng thành Big Data [44] Prescriptive Model nhấn mạnhvào các yếu tố trong mối quan hệ với hiệu suất hoạt động nghiệp vụ, tập trung vào hướngtiếp cận ảnh hưởng tích cực đến hiệu quả kinh doanh, phát triển một lộ trình hoàn thiệntrong xây dựng và nâng cao mức độ trưởng thành Big Data trong tổ chức [40]
Mô hình trưởng thành Big Data Radcliffe là một trong những mô hình thuộc nhómPrescriptive Model Tương tự như mô hình IBM, Radcliffe cũng đánh giá Big Data theonăm cấp độ chính [48]:
1 - Catching up: Tổ chức xác định mục tiêu cho các dự án Big Data
2 - First Pilot: Tổ chức xác định cách thức tiếp cận và triển khai các dự án Big Datathử nghiệm
3 - Tactical Value: Các dự án Big Data mang về lợi nhuận cho tổ chức
4 - Strategic Leverage: Big Data được triển khai và ứng dụng trên toàn tổ chức
Trang 28Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp
5 - Optimize & Extend: Big Data đặt trong sự nghiên cứu phát triển không ngừng
và ngày càng hoàn thiện
Hình 3-2 Mô hình trưởng thành Big Data của Radcliffe [48]
Ngoài ra, trong thiết kế mô hình Radcliffe có thêm một giai đoạn cấp độ 0 - In thedark Giai đoạn này thể hiện những khó khăn và rào cản ban đầu trong nhận thức củacác tổ chức về việc thay đổi công nghệ mới và triển khai nền tảng ứng dụng Big Data.Ngoại trừ các thông tin mô tả dành cho việc tự đánh giá cấp độ trưởng thành Big Datatương tự như ở mô hình IBM, Radcliffe cung cấp thêm trong mỗi giai đoạn đề xuất vàhướng dẫn dành cho các tổ chức phát triển chiến lược Big Data lên cấp độ trưởng thànhcao hơn [48]
c) Comparative Model
Comparative Model cung cấp khả năng so sánh kết quả đánh giá mức độ trưởngthành Big Data trong tiêu chuẩn nội bộ ngành và trong sự đối chiếu với các trường hợpứng dụng thực nghiệm thành công tại các đơn vị tổ chức qua khảo sát trên thị trườngchung [44] Việc so sánh, đối chiếu phụ thuộc vào dữ liệu lịch sử lưu trữ và lượng thôngtin phản hồi về triển khai các dự án Big Data tại nhiều tổ chức khảo sát đủ để lấy mẫu
dữ liệu phân tích [39] [44] Kết quả đánh giá phản ánh trực quan mức độ trưởng thành
tổ chức, hỗ trợ việc phân tích và đưa ra đề xuất phù hợp hơn cho các dự án triển khaiBig Data trong bối cảnh của một tổ chức cụ thể
Bổ sung hơn so với Descriptive và Prescriptive Model, việc thiết kế các mô hìnhthuộc nhóm Comparative có thêm bộ câu hỏi định lượng mức độ trưởng thành Big Datatheo các tiêu chí quy định của từng mô hình Một số ví dụ về nhóm Comparative Modelnhư mô hình TDWI, mô hình CSC và mô hình Hortonworks
Trang 29Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp
Mô hình trưởng thành Big Data của TDWI chia thành năm giai đoạn [49]:
1 - Nascent: Tổ chức nhận thức được tầm quan trọng của dữ liệu
2 - Pre-adoption: Tổ chức lên kế hoạch nghiên cứu triển khai phân tích Big Data
3 - Early Adoption: Tổ chức mở rộng phạm vi cho các chiến lược về Big Data vàbắt đầu thực hiện triển khai
4 - Corporate Adoption: Tổ chức bắt đầu tiến hành phân tích Big Data và ứng dụngBig Data hỗ trợ quá trình ra quyết định
5 - Mature/Visionary: Tổ chức thực thi phân tích Big Data với hạ tầng công nghệtích hợp cao Ngân sách, chiến lược phát triển Big Data được thiết lập trên toàn tổ chức.Ngoài ra, mô hình TDWI cũng thiết kế thêm một giai đoạn phụ Chasm, đánh dấubước chuyển từ giai đoạn Early Adoption sang giai đoạn Corporate Adoption Giai đoạnnày bao gồm những rào cản và khó khăn thường gặp khi triển khai thực tế các dự án BigData như: ngân sách đầu tư cho công nghệ thông tin, chính sách về dữ liệu và văn hóadoanh nghiệp, kĩ năng xử lý và khả năng tiếp cận công nghệ mới trong phân tích cácnguồn dữ liệu từ Big Data [49] [50]
CHASM
1 NASCENT 2 PRE-ADOPTION 3 EARLY 4 CORPORATE 5 MATURE/
Hình 3-3 Mô hình đánh giá trưởng thành dữ liệu TDWI [49]
Mô hình TDWI đo lường sự trưởng thành Big Data một cách khách quan thông quaviệc đánh giá tổ chức theo nhiều nhân tố khác nhau Năm nhân tố xác định chính là (1)Organization, (2) Infrastructure, (3) Data management, (4) Analytics, (5) Governance;ngoài ra còn có các nhân tố phụ như BI Maturity, Cloud Delivery, Cloud Deployment,Outsources và một vài nhân tố khác
Trang 30Min Avg Max
Industry: Financial Services 26.
5
31 63
37 5
Corp Size: S1D-5OM 0 28 49
IndustryZSize 26
5
28.2 5
Hình 3-4 Nhân tố đánh giá của mô hình TDWI [50]
Mỗi nhân tố có mức điểm tối đa là 50 điểm, chia thành năm tiêu chí nhỏ, mỗi tiêuchí 10 điểm [50] Việc cho điểm từng tiêu chí được tiến hành trên một khung đánh giáriêng [49] Việc đánh giá được thực hiện lần lượt theo từng nhân tố, nhằm xác định thựctrạng về tổ chức, hạ tầng, quản lý dữ liệu, phân tích dữ liệu và quản trị Mỗi nhân tố sẽđược đánh giá và xếp loại theo năm giai đoạn, đồng thời chỉ ra những khó khăn tổ chứcgặp phải và giải pháp khắc phục để tiến tới giai đoạn cao hơn
Your Score: 30/50
Miniumum & Maximum Scores
Trang 31Ad Hoc Opportunistic Repeatable Managed Optimized
Đo lường tính xác thực.
Chứng minh giá
doanh.
Chiến lược cấp đơn vị kinh doanh liên kết.
Chiến lược cấp doanh nghiệp
Data Truy cập dữ liệu
thủ công Dữ
liệu
không đầy đủ.
Dữ liệu có cấu trúc đa nguồn.
Nguồn nội dung phi cấu trúc.
Chưa thiết lập quy định quản trị
và vấn đề bảo mật dữ liệu.
Sử dụng thang
đo quản lý tính kịp thời và độ xác thực dữ liệu.
Dữ liệu đa cấu trúc, truy xuất trong thời gian thực.
Ứng dụng rộng rãi các nền tảng công nghệ phù
Phần cứng/ Phần mềm được tối ưu
Khóa luận tốt nghiệp Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị
quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam
Hình 3-5 Ket quả đánh giá mô hình TDWI [51]
Ket quả đánh giá được tính toán dựa trên tổng số điểm cho toàn bộ câu trả lời Đồngthời, mô hình cung cấp bảng điểm tính toán dựa trên nguồn dữ liệu mẫu TDWI thu thậptrong quá trình khảo sát các tổ chức trong mối tương quan giữa cùng ngành dịch vụ,cùng quy mô và trên toàn thị trường kinh doanh nói chung
Mô hình trưởng thành Big Data của CSC tương tự cũng chia thành năm cấp độ [52]:
1 - Ad Hoc: Tổ chức nghiên cứu thiết lập một số nền tảng cơ bản, hướng đến xâydựng và triển khai các dự án Big Data thử nghiệm
2 - Opportunistic: Tổ chức xây dựng quy trình và đặc tả yêu cầu nghiệp vụ xác định
3 - Repeatable: Dự án Big Data có quy trình cấp vốn xác định và tổ chức thành lậpđội ngũ chuyên gia phân tích phát triển Big Data
4 - Managed: Tổ chức thiết kế các thang đo về tính xác thực của thông tin phân tích,hướng đến việc tạo ra các actionable insight và sử dụng trên phạm vi toàn tổ chức
5 - Optimized: Tổ chức tối ưu hóa trong thiết kế các mô hình phát triển liên tục củacông nghệ Big Data, sử dụng các tri thức dự đoán như một phần quan trọng trong điềuhành tổ chức
Năm phân vùng đánh giá của mô hình CSC lần lượt là (1) Intent, (2) Data, (3)Technology, (4) People và (5) Process
Bảng 3-2 Mô hình trưởng thành Big Data CSC [52]
Trang 32xuất và sử dụng
dữ liệu thủ công.
vụ cho các mục địch đặc biệt.
với các mục đích
sử dụng.
hợp với mục đích sử dụng.
hóa ở mức tự động cao.
Các kĩ năng được điều chỉnh
và phát triển bởi
sự tăng cường hỗ
trợ từ các yếu tố bên ngoài.
Hỗ trợ điều hành cho đội ngũ phân
tích Big Data, có
sự phân cấp kĩ năng phân tích.
Có đầy đủ đội ngũ chuyên gia
dấu dữ liệu, dữ liệu sử dụng hỗ trợ một phần cho
các quy trình ra
Có các quy định điều khiển và đặc tả quy trình
ra quyết định.
Có các thang đo trong đánh giá chất lượng và kết
quả các quy trình.
Các quy trình được hỗ trợ thích
hợp bởi nhân viên điều phối, công nghệ và ngân sách đầu tư.
Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp
Tương tự như mô hình TDWI, kết quả đánh giá phản ánh cấp độ sử dụng dữ liệucủa tổ chức theo năm yếu tố cấu thành Bên cạnh đó, CSC cũng đưa ra mức độ trưởngthành Big Data chung trên toàn tổ chức trong mối tương quan giữa cùng ngành dịch vụ
và trên toàn thị trường kinh doanh nói chung
quản
lý thông tin khác Thông tin liên lạc bên trong một silo thông tin luôn luôn theo chiều dọc, khiến cho hệ thống
Trang 33Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp
Hình 3-6 Kết quả đánh giá mô hình CSC [53]
Ket quả đánh giá thể hiện trực quan dưới dạng biểu đồ miền, thể hiện vị trí của tổchức trong bức tranh tổng quan về thực trạng triển khai Big Data giữa cùng ngành dịch
vụ và trên thị trường kinh doanh nói chung
Mô hình trưởng thành Big Data của Hortonworks chia thành bốn cấp độ [54]:
1 - Aware: Tổ chức nghiên cứu Big Data, có các quy trình phân tích dữ liệu lịch sử
2 - Exploring: Tổ chức khai phá các giá trị tiềm năng của Big Data dựa trên kinhnghiệm trong triển khai phát triển hệ sinh thái Hadoop
3 - Optimizing: Tổ chức tối ưu hóa hiệu năng hoạt động trong vòng đời khách hàng,vòng đời sản phẩm và vòng đời máy móc thiết bị
4 - Transforming: Dữ liệu được xem như nhân tố chính đem lại lợi nhuận và luồnggiá trị kinh doanh trong tổ chức dựa trên các thông tin dự đoán đáng tin cậy
Năm phân vùng đánh giá của mô hình Hortonworks lần lượt là (1) Sponsorship, (2)Data and Analytics, (3) Technology and Infrastructure, (4) Organiztion and Skills và (5)Process Management
Trang 34Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp
Hình 3-7Mô hình đánh giá năng lực trưởng thành Hortonworks [55]
Tương tự như TDWI và CSC, mô hình Hortonworks cũng đưa ra kết quả đánh giásau khi thực hiện khảo sát thông qua một bộ câu hỏi định lượng về năm phân vùng đánhgiá đến mức độ trưởng thành Big Data như trên hình vẽ
H VourCurrentState HH MarketCurremtState Vour 2-yr Outlook Market 2-yr Outlook
Hình 3-8 Kết quả đánh giá mô hình Hortonworks [54]
Kết quả đánh giá thể hiện trực quan dưới dạng biểu đồ cột, không chỉ phản ánh mức
độ trưởng thành Big Data hiện tại của tổ chức trong mối tương quan giữa cùng ngành
dịch vụ và trên toàn thị trường kinh doanh, mà còn phản ánh trực quan mong muốn pháttriển các dự án Big Data của tổ chức trong thời gian hai năm tiếp theo [55]
Trang 35Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp
KẾT LUẬN CHƯƠNG 1
Chương I đã làm rõ khái niệm cơ bản về Big Data và đưa ra những nghiên cứu và minh chứng thể hiện giá trị của những actionable insight mang lại thông qua việc ứng dụng Big Data vào hoạt động quản trị quan hệ khách hàng trong ngành dịch vụ ngân hàng Đồng thời, khái niệm BDMM được tiến hành tìm hiểu và đưa vào khóa luận như một nền tảng lý thuyết để xây dựng
bộ câu hỏi đánh giá mức độ trưởng thành dữ liệu trong các dự án triển khai
và nghiên cứu Big Data tại ngân hàng TMCP Công Thương Việt Nam.
Trang 36CHƯƠNG II THỰC TRẠNG DỮ LIỆU TẠI NGÂN HÀNG TMCP CÔNG THƯƠNG VIỆT NAM
Trọng tâm của chương II tập trung vào xây dựng bộ câu hỏi định lượng mức độ trưởng thành dữ liệu và ứng dụng phương pháp đánh giá trong khảo sát thực trạng triển khai tích hợp công nghệ Big Data vào kiến trúc hạ tầng thông tin của ngân hàng TMCP Công Thương Việt Nam.
Phần đầu chương là lý thuyết xây dựng mô hình năng lực trưởng thành
dữ liệu, nội dung bộ câu hỏi và kết quả thực hiện khảo sát tại ngân hàng TMCP Công Thương Việt Nam Phần tiếp theo là những phân tích về thực trạng thu thập, khai thác và tổ chức dữ liệu trong hoạt động kinh doanh nghiệp vụ cũng như các chiến lược nghiên cứu triển khai Big Data Cuối cùng
là phần nhận định các vấn đề trong quản lý, phân tích và xử lý dữ liệu tác động đến hoạt động quản trị quan hệ khách hàng tại ngân hàng TMCP Công Thương Việt Nam.
1 Mô hình năng lực trưởng thành dữ liệu BDBA
Dựa trên những nghiên cứu về mô hình BDMM, khóa luận xây dựng lý thuyết mô
tả về mô hình năng lực trưởng thành dữ liệu BDBA Big Data of Banking Academy với vai trò như một thang đo thực trạng dữ liệu và thể hiện mục tiêu chiến lược ngắnhạn trong nâng cao mức độ trưởng thành dữ liệu tại các tổ chức hoạt động kinh doanhnói chung và nghiệp vụ ngân hàng nói riêng
-Lý thuyết và cách thức đánh giá mô hình BDBA được tham khảo từ cả ba nhóm môhình Descriptive, Presrciptive và Comparative Nội dung và kiến trúc xây dựng bộ câuhỏi lấy trọng tâm dựa trên những tri thức về Big Data, kết hợp với các khái niệm
“maturity model” như Information Governance Maturity [56], Data GovernanceMaturity [57], Security Maturity [58] và đặc biệt là nhóm các mô hình trong Big DataComparative Model [53] [54] [59] Quá trình khảo sát tính thực tiễn bộ câu hỏi và lượnghóa thực trạng dữ liệu của ngân hàng TMCP Công Thương Việt Nam được thực hiện tạiphòng quản trị thông tin quản lý MIS Kết quả khảo sát được trình bày và giải thíchtrong phần cuối cùng của nội dung bộ câu hỏi đánh giá mức độ trưởng thành dữ liệu
1.1 Lý thuyết xây dựng mô hình BDBA
Trong triển khai Big Data có nhiều yếu tố ảnh hưởng đến khả năng thành công cũngnhư thất bại của dự án [10] [39] [41] [56] Dựa trên lý thuyết về BDMM, cụ thể là năm
Khóa luận tốt nghiệp Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị
quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam
Trang 37Nhân tố trường
thành BDMM Mô hình
IBM
Mô hình Radcliffe
Mô hình TDWI
Mô hình CSC
Mô hình Hortonwork
Mô hình BDBA Định
Vision &
Strategy - Intent Sponsorship
Chiến lược
Data Management Data
Phân tích
Quản trị Governance Governance Governance - Processes &
Management
Quản trị
mô hình IBM, Radcliffe, TDWI, CSC, Hortonworks1 nghiên cứu trong giới hạn đề tàikhóa luận, mô hình BDBA được thiết kế dựa trên năm nhân tố: (1) Định hướng chiếnlược, (2) Dữ liệu, (3) Tổ chức, (4) Quản trị và (5) Công nghệ thông tin
Nội dung bộ câu hỏi khảo sát được thiết kế với mục đích bổ khuyết và bao quáttoàn bộ nội dung các lĩnh vực có tầm ảnh hưởng đến chiến lược triển khai Big Data vàmức độ trưởng thành dữ liệu Các câu hỏi được điều chỉnh và tái cấu trúc để phù hợphơn trong bối cảnh thị trường và hạ tầng công nghệ thông tin tại Việt Nam, trước nhấttrong giới hạn thời gian thực hiện nghiên cứu khóa luận, mô hình BDBA sẽ tập trungvào ngành dịch vụ tài chính ngân hàng Việt Nam
Bảng 1-1 So sánh phân vùng đánh giá độ trưởng thành Big Data giữa các mô hình BDMM [41 ]
Trang 38Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp
Đầu tiên về định hướng chiến lược, cụ thể là về chiến lược và quy trình Các dự
án Big Data cần được sự ủng hộ và đầu tư của đội ngũ lãnh đạo tổ chức trong việc đặt
ra mục tiêu, xác định định mức thành công, tái cấu trúc quy trình hoạt động và đưa racâu hỏi nghiệp vụ cũng như yêu cầu triển khai công nghệ phù hợp trong bối cảnh hoạtđộng và định hướng phát triển của tổ chức Ngân quỹ cũng như các khoản đầu tư vềnguồn lực kết hợp với chính sách từ phía những nhà quản trị cấp cao trong tổ chức cầnmang lại sự ảnh hưởng và có tác động mạnh mẽ đến hiệu suất triển khai và kết quảnghiên cứu của đội dự án Big Data
Thứ hai về dữ liệu, cụ thể là về hoạt động quản lý và phân tích dữ liệu Các dự án
Big Data nhấn mạnh khả năng điều hành và xử lý đồng loạt các nguồn dữ liệu phân tándựa trên khung thời gian thực Một số nguồn dữ liệu quan trọng và là đặc trưng của BigData như tệp dữ liệu lớn (hơn 20 TB), những phân tích chuyên sâu nghiệp vụ, các biểu
đồ kết quả trực quan, dữ liệu từ mạng xã hội, dữ liệu hình ảnh, âm thanh, thông tin vị tríđịa lý, thông tin dự báo hành vi, các bản ghi lưu trữ lịch sử truy cập và xác nhận danhtích người dùng Khả năng dữ liệu của tổ chức được đánh giá dựa trên sự đa dạng trongnguồn dữ liệu thu thập và lưu trữ, các kĩ thuật phân tích và công nghệ sử dụng, mức độảnh hưởng của các tri thức khai phá từ nguồn dữ liệu thô đến hoạt động kinh doanhnghiệp vụ và quá trình ra các quyết định chiến lược trong tổ chức
Thứ ba về tổ chức, cụ thể là các vấn đề trong đào tạo con người và xây dựng văn
hóa tổ chức Các kĩ thuật xử lý, làm sạch, quản lý, thống kê và biểu diễn khối lượng lớn
dữ liệu được yêu cầu trong đào tạo và phát triển các kĩ năng dành cho nhân viên phântích, nhà khoa học dữ liệu hoặc các chuyên gia phát triển hệ thống thông tin Văn hóa tổchức cần thay đổi và thích nghi với sự phát triển công nghệ Big Data, thay đổi từ cáchtiếp cận truyền thống HiPPO1 chuyển sang định hướng dữ liệu Dữ liệu được xử lý vàphân tích hỗ trợ mọi quyết định trong hoạt động điều hành và kinh doanh sản xuất, làcông cụ hỗ trợ mọi cấp độ quản lý nhằm tăng khả năng vượt qua các rào cản thị trường
và mang lại những giá trị khác biệt cho tổ chức
Thứ tư về quản trị, việc triển khai Big Data cần quan tâm đến các vấn đề về kinh
phí và nguồn ngân sách dự trù, các chính sách liên quan đến vấn đề bảo mật và sử dụngthông tin nhạy cảm; tri thức, kinh nghiệm và kĩ năng trong triển khai ứng dụng côngnghệ Big Data; sự thay đổi trong tổ chức nhân sự và đào tạo kĩ năng nhân viên trongkhai thác và sử dụng các công cụ phân tích Big Data
trường hợp khó khăn, dựa trên các ý tưởng cá nhân đưa ra trong các cuộc họp thảo luận mở, thay vì dựa trên
nguồn
dữ liệu phân tích hay thống kê số liệu cụ thể.
Trang 39Mức độ sẵn sàng triển khai ứng dụng Big Data trong hoạt động quản trị quan hệ khách hàng tại Ngân hàng TMCP Công Thương Việt Nam Khóa luận tốt nghiệp
Cuối cùng về công nghệ thông tin, các dự án Big Data yêu cầu xây dựng nền tảng
cơ sở hạ tầng thích hợp để xử lý các nguồn dữ liệu trong Big Data, như hệ cơ sở dữ liệuNoSQL; khả năng thu thập và truy vấn các luồng dữ liệu song song, phi cấu trúc thôngquan các cụm Hadoop; sửa đổi, cải tiến khung cấu trúc Data Warehouse, Data Mart vàtái cấu trúc các thuật toán phân tích để thực hiện tích hợp, truy vấn xử lý đồng bộ cácnguồn dữ liệu mới từ Big Data Nền tảng điện toán đám mây là trọng tâm chính trongcác giải pháp công nghệ và chiến lược phát triển hạ tầng cơ sở dành cho Big Data và cácphân tích Big Data Nhìn chung, trong lĩnh vực công nghệ, tổ chức cần xây dựng khốikiến trúc thông tin thống nhất, tích hợp nhiều chương trình và công cụ phân tích nângcao, thiết kế hệ quản lý cơ sở dữ liệu phù hợp với các mục tiêu phát triển và chiến lượctriển khai Big Data ứng với từng giai đoạn và cấp độ trong ngữ cảnh phù hợp
Tổng quan mô hình BDBA được thiết kế như sơ đồ sau:
Công nghệ thông tin
Định hướng chiến
Con người Van hóa
Mức độ trưởng thành
Đầu ra
Hình 1-1 Mô hình BDBA
Cụ thể, trước khi tiến hành nghiên cứu triển khai một dự án Big Data, tổ chức cầnxác định rõ ràng mục tiêu chiến lược và mức độ ưu tiên giải quyết các bài toán nghiệp
vụ cũng như các vấn đề liên quan đến dữ liệu Đặc biệt cần xác định rõ khả năng hỗ trợ
và nguồn lực đầu tư dành cho các kế hoạch phát triển công nghệ Big Data Lượng hóamức độ trưởng thành hiện tại (as-is maturity) và ước tính điểm số hướng tới (to-bematurity) dành cho các chiến lược phát triển dữ liệu cũng như các dự án công nghệngắn
hạn thông qua bộ câu hỏi BDBA Kết quả đánh giá được xem như nguồn thông tintham
khảo hỗ trợ xây dựng đề án kinh doanh, thực thi kế hoạch hành động và triển khai dựán
Trang 40Phân vùng đánh giá Số lượng câu hỏi (câu)
Năm phân vùng đánh giá của mô hình BDBA bao gồm: (1) Định hướng chiến lược,(2) Dữ liệu, (3) Tổ chức, (4) Quản trị và (5) Công nghệ Trong đó, phân vùng Địnhhướng chiến lược chia làm hai phần: Chiến lược và Quy trình; phân vùng Dữ liệu chialàm hai phần: Quản lý và Phân tích; phân vùng Tổ chức chia làm hai phần: Con người
và Văn hóa
Mỗi phân vùng là một tập các câu hỏi1, với tổng số lượng 50 câu chia thành 5 phânvùng được thiết kế và xây dựng trên giao diện Excel
Bảng 1-2 Số lượng câu hỏi từng phân vùng theo mô hình BDBA
Có hai dạng câu hỏi: (1) Câu hỏi chọn một đáp án và (2) Câu hỏi chọn nhiều đáp
án Tổng số điểm cho từng câu hỏi là 5 điểm
Với dạng câu hỏi (1), mỗi câu được cung cấp năm đáp án lựa chọn tương đương vớinăm cấp độ trưởng thành tăng dần:
■ Đáp án a - 1 điểm - ứng với cấp độ ứng dụng Big Data đơn giản nhất;
■ Đáp án e - 5 điểm - ứng với cấp độ ứng dụng Big Data cao nhất