Dé hudng tới xây dựng một hệ thông kho dữ liệu có hiệu năng xử ly cao dé lai “Yáy đựng kho đã liệu cha ngân hàng và hệ thông báo cáo phân ích khách hàng " đã được chọn làm đề lắt luậ
Trang 1_BQ GIAO DUC VA DAO TAO TRƯỜNG ĐẠI HỌC BÁCHI KIIOA HẢ NỘI
LÊ MINH CHÂU
XÂY DỰNG KHO DỮ LIỆU ĐÂM BẢO HIEU NANG CHO NGAN HANG
VÀ TIỆ THÓNG BÁO CÁO PHIÂN TÍCII KHÁCH HÀNG
CIIUYEN NGANIL CONG NGIIE TIIGNG TIN
LUẬN VĂN THẠC SĨ KỸ THUẬT
NGƯỜI HƯỚNG DẪN KHOA HỌC
TS NGUYEN THANH HÙNG
Trang 2MỤC LỤC
TÔI CAM ĐOAN
TỎI CẢM ƠN
DANH MỤC CÁC TỪ NGỮ, KÝ HIỆU VIET TAT
DANIEMUC CAC BANG HH ng an ren
DANH MỤC CÁC HỈNH VẼ, ĐỎ THI
MỞ ĐẦU
CHUONG 1 HE THONG KHO DU LIBU
1.1 Téng quan kho đỡ liệu
12 Kiến trúc chưng của kho dữ liệu
1.3 Mô hình logic của kho dữ liệu
1.4Mö hinh dữ liệu da chiểu
1.5 Hiện trạng hệ thống kho dữ liệu trong ngân hảng, BIDV
1.5.1 Tổng quan hệ thống báo cáo trong ngân hàng
1.5.3 Kiến trúc của kho dữ liệu trong ngân hàng:
1.5.3 Đánh giá các mặt hạn chế của hệ thông kho đữ liệu hiện tại
1.5.3.1 CS12L dùng cho bai toàn kho đữ liệu
1.5.3.2 Công cụ trích lọc dữ liệu
1.5.3.3 Công cụ phân phối bảo cáo
1.5.3.4 Mô hình thiết kế kho dữ liệu
1.6 Một số giải pháp công nghệ mới về kho đữ liệu
17 Kết luận
Trang 3CHUONG 2 XAY DUNG HE THONG KHO DU LIEU DAP UNG HIBU NANG XU'LY
3.3 Mô hình tổng thẻ kho dữ liệu mới
2 4 Các thành phần của kho đữ liệu mới
Trang 43.2.1.7 Classification
3.2.1.8 Summary
9 Event (Sự kiện)
3.2.2 Tang Data Mart
3.2.2.1 Khai niệm Dala Man 3.2.2.2 Định nghia Dimension 3.2.2.3 Đặc trưng của Dimensin
3.2.2.4 Câu trúc Dimensien ccccee
3.2.2.5 Sơ để mô hình logic các Dimension chính
3.2.2.6 Dink nghia Fact 3.2.2.7 Đặc trimg nủa FaeL
3.2.3 Luỗng trích xuất xử lý đỡ liệu
Trang 53.2.3.1 Quy trình chạy BIL dữ liệu hàng ngảy:
3.2.3.2 ETL ving STAGING 3.2.3.3 ETT vimg System Of Record 3.2.3.4 E71 vig Data Mart
3.2.4 Bài toán phân tích khách hàng o
3.2.4.1 Phân tích yêu cầu
3.2.4.2 Dimension va Fact 3.2.4.3 Mô hình logie các Huyc thể
3.3 Kết quả thử nghiệm
3.3.1 Kịch bản thứ nghiệm các
3.3.2 So sánh tốc độ tray vẫn trên CSD1,
3.3.2.1 Truy vẫn và Hnh toán Irên 1 bằng đữ liệu
3.3.3.2 Truy vấn và tính toán trên 2 băng, đữ liệu
3.3.2.3 Truy vẫn và tìm kiểm theo tiêu chí phúc tạp 3.3.2.4 Kết quả tổng hợp
3.3.3 8o sánh tốc độ xủ lý của công cụ trích xuất
Hưởng phải triển trong tương lai
TÀI LIỆU THAM KHẢO
Trang 6
LOI CAM DOAN
Tôi xin cam đoan, luận văn tết nghiệp Thạc sỹ nảy là công trình nghiên cứu của ban
thân tôi đưới sự hướng dẫn của 1S Nguyễn Thanh lùng, Các kết quá trong luận văn tốt
nghiệp là trang thực, không phải sao chép toàn văn của bắt kỷ công trình nào khảo Tôi xin chịu hoàn toàn trách nhiệm về nội đưng quyền luận vin nay
Tac giả
T.ê Minh Châu
Trang 7LỜI CẢM ƠN
Luận văn được hoàn thành tại trường Đại hạc Bách khoa Hà Nội Để hoàn thành luận
văn này, tác giá đã nhận được sự chỉ bảo tận tỉnh của T3 Nguyễn Thanh Liửng, người đã truyền đạt rất nhiêu kiến thức quí báu cũng như những kinh nghiệm nghiên cửa khoa học trong suết thời gian tác giá theo học và nghiên cửu
Tác giả xin chân thành gửi lời biết en đến Ban lãnh đạo Viện Công nghệ thông tin và 'Truyền thông, Viện Dáo tạo Sau đại học và lộ môn Công nghệ phần mềm, thuộc trường Dai
học lách khoa LIá Nội đã tạo điều kiện thuận lợi trong quá trình học tập, nghiên cứu vá hoàn thành luận văn
Với năng lực hạn chế của bản thân cũng như những nguyên nhân chú quan, khách quan, luận văn không tranh khói những thiểu sót Tác giá rất mong nhận được sự góp ý cúa
quý thầy cỏ, các bạn bé va déng nghiệp dễ luận văn được hoàn thiên hơn
Tác giả
T.2 Minh Châu
Trang 8DANH MỤC CÁC TỪ NGỮ, KÝ HIỆU VIET TAT
CSDL Cơ sở dữ liệu
Staging — Vùng đệm
Enterprise Data Model ~ Mô hình dữ liệu
OLAP Khoi dữ liệu đa chiêu
Data Transformation Services = công cụ chuyên đổi dữ liệu
Exact-Transform-Load — Trích xuất, chuyên đổi, Tải
Trang 9DANH MUC CAC BANG
Bang 3.1 Định nghĩa thực thế Arragement
Bang 3.2 Định nghĩa thực thế Associalive
Bang 3.3 Dinh nghĩa thực thể Involved Party
Bang 3.4 Định nghĩa thực thể Accounting
Bang 3.5 Dinh nghia thue thé Classification
Bang 3.6 Định nghĩa thực thể Summary
Bang 3.7 Định nghĩa thực thể Eveni vvvvvsvevvtrrretrrrrrrrerrree
Bang 3.8 Bang két qua thir nghiém 1
Bang 3.9 Bang két qua thir nghiém 2
Bang 3.10 Bảng kết quả thủ ngliệm 3
Bang 3.11 Bang két quả thử nghiệm mỏ hình EL-T và E-L-T
Trang 10DANH MỤC CÁC HÌNH VẼ, ĐỎ THỊ
Hinh 1.1 Kiến trúc cơ bản của kho đữ liệu
Tình 1.2 Mô hình dữ liệu da chiểu
Hinh 1.3 Kiến trủc kho dữ liệu trong ngân hảng,
Hình 2.1 Mô hình tổng thê kho dữ liệu mới
Hình 3.2 Hệ thông DataStage mỡ rộng cầu phân engine
Tình 3.3 Mô hình xử lý của hệ thống TBM Cognos
-Hinh 2.4 Mô hình xứ lý bảo cáo tĩnh của IBMI Cog11os
Tĩnh 2.5 Mô hình phân quyén theo role cia IRM Cognos
Tinh 2.6 Mé6 hình phân quyền theo bảo cáo ctia IBM Cognos
Hinh 2.7 M6 hinh phan quyén theo Phong/Rian cia TBM Cognos
Hình 2.8 Mô hình mở rộng của hệ thống IBM Cognos
linh 2.9 Kiến trủc tổng quát của IM Banking J2ata Model
Hinh 2.10 Kiến trúc tổng quát của FSDM
Tình 2.11 Khu vực mẫu theo các mãng nghiệp vụ trong ngân hàng,
Tỉnh 2.12 Khu vực mẫu theo các mắng bảo cáo tuân (hit
Hình 3.1 Các thực thể chỉnh và quan hệ 2222 cv eccrtzrrrrirrerrree
Tĩinh 3.2 Mô hình tổng quan Arrangement
Hình 3.3 Mô hình tổng quan Associative
Hình 3.4 Mô hình tổng quan Tnvelved Parly
Hình 3.5 Mô hình tổng quan Accouifing, ocosocsessssccorcre
Tĩinh 3.6 Mô hình tổng quan Classification
Tình 3.7 Mô hình tang quan Summary
Hình 3.8 Mô hình tổng quan Event
45
46
4
Trang 11
Tlinh 3.14 BTL vung System O£ Reeord cho Involved Party Keo Hình 3.15 Quy trinh chay ETL ving System Of Record cha Involved Party 68 Tình 3.16 Quy trinh chay RTT ving System Of Record cho Involved Party Associatives 69
Hinh 3.17 Quy trình chạy ETL vùng Systemn Of Record cho Anrangginenl TỦ
linh 3.18 Quy trình chạy l7[L vừng System Of Record cho Arrangement đối với Term
Tỉnh 3.19 Sơ đô Dimensien cho ETL vùng Data Mart 73 Hinh 3.20 So dé Fact cho ETL ving Data Mart 74 Hình 3.31 Ñơ đồ mô hình logic che bai loan phan tích khách hàng ~ - T7
Hình 3.22 Kết quả của 3 lầu thực nghiệm vẻ thời gian truy vẫn dữ liệu 8Ú
Tinh 3.23 Kết quả thử nghiệm theo mé hinh EL-T và I-T-L về thời gian ảnh hưởng tới máy
Trang 12cảng trở lên quan trọng hơn bao giờ hết, Việc tô chức lưu trữ và khai thác kho dữ liệu một cách hiệu quá sẽ giúp cho các tổ chức tài chỉnh ngân hàng thực hiện tốt công tác quản trị diều hành, quân trị rủi ro, hỗ trợ ra quyết định và hoạch địh chiến lược kinh doanh
được hợp nhất tại kho dữ liệu Nhằm đấp ứng và cũng cấp thông tín một cách kịp thời, chính
xác, đông thời là nên tảng cho việc xây đựng các mg đụng phân tích đữ liệu, hễ trơ ra quyết định Do đó hiệu năng xử lý đữ liệu của kho đữ liệu trong ngân hàng cân được nâng cao dé đáp ứng được nhu câu khai thác sử dụng của tổ chức tải chính ngân hàng TTiệu năng của một
hệ thống kho dữ liệu được thẻ hiện qua một số các phương điện chỉnh như sau Tốc độ xứ lý
dữ liệu trên tập dữ liệu lớn, khả năng, mở rộng, và phát triển kho dữ liệu bao gốm về việc phat triển mô hình đỡ liệu vá hạ tầng kho dữ liệu, tùy biến theo yêu cầu khai thác và phân tích dữ
liêu của người đảng
Với thực trạng hiện nay của ngân hang chưa cỏ một hệ thống kho dữ liệu tổng thể, thống, nhất toàn hàng, chưa đáp ứng tốt về hiệu năng và tồn tại khả nhiều hạn ché Dé hudng
tới xây dựng một hệ thông kho dữ liệu có hiệu năng xử ly cao dé lai “Yáy đựng kho đã liệu
cha ngân hàng và hệ thông báo cáo phân (ích khách hàng " đã được chọn làm đề lắt luậ
cao hoe vila LO
Trong hiận văn đã liến hành nghiên cửu đánh giá hiện trạng, các hạn c
kho dữ liệu hiện lại trong ngân hàng lừ đó đưa ra những giải pháp cụ thé cho từng vấn để hạn
chế và xây dựng hệ thông kho dữ liệu mới dap img hiệu năng,
của hệ thống cũ Miột sẽ kết quả chính của luận văn có thể tóm tắt như sau:
đữ liệu, công cụ phân tích và khai thác báo cáo
b Mô hình của kho đữ Ì
Trang 13Nội dung chinh của luận văn gdm 3 chương,
Chương 1: Hệ thông kho đủ liệu
Chương 2: Xây dựng hệ thống kho dữ liệu đáp ứng hiệu năng xứ lý cho ngân hàng
Chương 3: Ấp dụng với bài toán phân lích khách hàng
Cuối cùng là kết luận và hưởng phát triển tiếp theo của dễ tài trong tương lai
Trang 14CHƯƠNG 1 HỆ THÔNG KHO DỮ TIỆE
1.1 Tổng quan kho dữ liệu
Kho đữ liệu (Dala Warehouse): là tập hợp dữ liệu Lương định (it 66 sự thay đối),
cập nhật theo thời gian, được tích hợp theo hướng chủ thẻ nhằm hỗ trợ quá trình quá trình tạo quyết định về mặt quản lý
Các đặc trưng của kho đữ liệu như sau [7]
: không phải tất cả các đữ liệu đến được tập lợp, người ta
Theo chi dé (Consistency
những dữ liệu có ích Dữ liệu được tổ chức xung quanh các chủ để chính như khách
hàng, sản phố
dịch vụ, v.v lập trung vào sự nổ hình hóa và phân tích đữ lều cho các
phân tích ra quyết định mà không tập trưng vào xử lý dữ liệu thông thướng Cung cấp cho người dùng có một cách nhin toàn diện, đây đủ về các sự kiện quanh các chủ để
Trữ liệu tích hợn (Atemicity): đữ liệu tập hợp từ nhiều nguôn khác nhau có các cơ
chế lưu trữ khác nhau: CSDL, Excel file, Flat file, v.v điều này sẽ dẫn đến việc quả trình tập hợp phải thực hiện việc làm sạch, sắp xếp, rút gọn đữ liệu nhằm đảm bão tính nhất quán
hệ thống tác nghiệp nếu như đốt với hệ thống tác nghiệp dữ liều thông thưởng chỉ lưu giá trị
hiện tại nhưng với đữ liệu trong kho đữ liệu cung cấp thông tin lịch sử lâu dải hơn Biển thời
gian cũng là một khóa chính đề đâm bảo tính duy nhật của đữ liệu
1.2 Kiên trúc chung của kho dữ liệu
Mô hình kiến trúc cơ bản [2] của kho dử liệu cơ bản gồm bến thánh phần như sat:
Dé ligu nguồn: dữ liệu từ các hệ thống kháo nhau (bao gồm dữ liệu có câu trúc và phi
cầu trúc) được tập kết lại vào một nơi duy nhất
Trang 15Khu xử lý dữ liệu: là nơi dữ liêu sẽ được làm sạch và chuyên đổi de dam bảo tỉnh nhất
quán đữ liệu trước khi đưa vào kho đích Thông thường người ta sử dụng các công cụ trích
xuất, chuyên đổi vả nạp dữ liệu (ETL)
Kho lưu trữ dữ liệu: là nơi dữ liệu được xử lý và được tập kết, lưu trữ
Người dùng cuối: là người dùng khai thác thông tin từ kho dữ liệu
hai phá dữ liệu
Kien trúc cơ băn của kho dữ liệu
Hình 1.1 Kiến trúc cơ bản của kho dữ liệu
1.3 Mô hình logic của kho dữ liệu
Sơ đồ hình sao (Star schema): một bảng sự kiện ở trung tâm được kết nổi với một
tập các bảng chiều khác nhau [3]
Sơ đồ bông tuyết (Snowflake schema): Một mở rộng của sơ đỏ hình sao trong đó
một vải cầu trúc chiều được chuân hóa thành một tập các bảng chiêu nhỏ hơn, hình thức tương
tự như bông tuyết
Sơ đồ chòm sao sự kién (Fact constellations schema): Bảng sự kiện phức chia sẻ các bảng chiều, tạo khung nhìn một tập các “ngồi sao”, nên còn được gọi sơ dé ngân hả
(galaxy schema) hoặc chòm sao sự kiện
Trang 161.4 Mô hình dữ liệu đa chiều
Day là mô hình dữ liệu xoay quanh các chủ đẻ nhằm trả lời một cách nhanh nhất các
câu hỏi trong nghiệp vụ phân tích [8] Có thể nhìn dữ liệu như là một khói trong đó mồi chiều
là một khía cạnh của bải toản giúp cho các nhà phân tích có thể nhìn thấy, đánh giá số liệu
theo nhiều chiều
Dữ liệu đa chiều
Hình 1.2 Mô hình dữ liệu đa chiều
Ở hình 1.2 khỏi dữ liêu gồm có 3 chiêu: khách hảng, sản phẩm, thời gian
1.5 Hiện trạng hệ thống kho dữ liệu trong ngân hàng BIDV
1.5.1 Téng quan hé théng báo cáo trong ngân hàng,
Từ năm 2004 đền nay ngân hàng đã trang bị hệ thông Core Banking mạnh phục vụ các
mảng kinh doanh của mình Song song với đó các hệ thống bao cáo phục vụ công tác thống,
kê, quản lý lần lượt đưa vào khai thác Tuy nhiên, các hệ thông báo cáo nảy vẫn chưa đây đủ
vả còn manh mún, nằm rời rạc ở các vị trí khác nhau Hệ thông bảo cáo rời rạc chia thảnh các nhóm cụ thể như sau:
-_ Hệ thống báo cáo tại Core banking: nằm trên hệ thống Core banking phục vụ công tác
hàng ngày của hoạt động tác nghiệp trong ngân hàng
~_ Hệ thống bảo cáo kho đữ liệu: là hệ thông báo cáo phân tích đa chiều lớn gồm hàng tram
bảo cáo dựa trên công nghệ của Microsoft
- Hang tram hệ thống báo cáo đơn lẻ do ngân hàng tự xây dưng và phát triển
Trang 171.5.2 Kiến trúc của kho dữ liệu trong ngân hàng
Hệ thông kho dữ liệu trong ngân hàng được xây dựng và duy tri từ năm 2005 đền nay, được thiết kế bởi nha thau Silverlake Hinh 1.3 mô tả hệ thống kho dữ liệu hiện tại của ngân
Hình 1.3 Kiến trúc kho dữ liệu trong ngân hàng
Hệ thông kho dữ liệu lưu trữ dữ liệu bao gồm khu vực dữ liệu nguồn (Source data) va
khu vực kho đữ liệu nằm chính trên máy chủ triển khai hệ thống Core Banking (máy chủ AS400) cỏ nghĩa là mảy chủ triên khai hệ thông Core Banking cũng đỏng thời là máy chủ xử
lý chính của kho đữ liệu, hai hệ thông trên cùng một máy chủ hệ thông tác nghiệp và hệ thông
báo cáo kho dữ liệu với cơ sở đữ liệu là DB2 được tích hợp luôn trên máy chủ Dữ liệu nguồn
hầu hết nằm chính tại máy chủ AS400 bao gồm toàn bộ dữ liệu tac nghiép ctia Core Banking,
đữ liệu từ các hệ thông khác hàu như không có Dữ liệu nguồn sẽ được tập kết tại một chỗ gọi
lả khu vực STG từ khu vực nảy dữ liệu sẽ được làm giảu, làm sạch, tổng hợp, chuẩn hóa dữ
liệu, chuẩn bị được đây vào khu vực EDM bằng cung cụ DTS, một sản phẩm trong bộ SQL
Server của Microsoft Dữ liệu sau khi đã được hợp nhất, tính toán, làm giảu, làm sạch từ khu
Trang 18
vực BDM dữ liệu sẽ được chuyển sang đạng dữ liệu da chiều (OLAP) theo các bài toàn chủ
dễ khác nhau dễ người dùng khai thác thông qua công cụ Excel I2œ liệu da chiều dược trạc
hiện Long hợp thông qua công cu DTS và được lưu trữ trên cơ sở đữ liệu SQL Server 2000
Nhu vay về tổng quan kho dữ liệu hiện tại của ngân hàng dược nhìa dưới ba góc độ về
ha tang như sau:
1.8.3 Đánh giá các mặt hạn chế cửa hệ thông khu đữ liệu hiện tại
Tác giả dã dựa vào những phương diện sau dẻ phân tích dánh giá những mặt hạn chế của kho đữ liệu luện tại trong, ngân bảng bao gdm:
- _ CSDL đừng cho bài toán kho dữ liệu
- _ Công cụ trích lọc đữ liệu
~_ Công cụ phan phổi báo cáo,
~ Mô hình thiết kế của kho dữ liệu
Từ dó dua ra hướng giải pháp mới nhằm nâng cao hiệu quả về hiệu năng xử lý của kho
dữ liệu
1.5.3.1 CSDL ding cho bai toan kho đã liệu
Cơ sở đữ liệu DE2 được tính hợp sẵn trên máy chủ AS400 được triển khai cùng với
Core banking, hệ cø sở dữ liệu này được triển khai nhằm mục đích chính cho bải toán tác nghiệp phù hợp với bài toán OL.LP của ngân hảng và câu phần kho đữ liệu được triển khai
thêm sau đó
1o vậy tồn tại bài toán tác nghiệp và bài toán xứ lý kho dữ liệu trên củng một mày chủ
Core banking điều này it nhiều làm anh hướng tới hiệu năng cúa hệ thống tác nghiệp do phải chia sẻ tài nguyên cho hệ thống kho dữ liệu Thông thường hệ thống tảo nghiệp sẽ bắt dầu
ngày lam việc mới khoảng 8h mỗi sáng nhưng hệ thông kho dữ liệu thì kết thúc muôn hơn rất
ử liệu thường bắt dâu từ 2h sáng và thường kết thúc vào 12h giờ hàng
với tông đương lượng dữ liệu xử lý vào khoảng 30GB điều này gây áp lực rất lớn lên hệ thống
Trang 19
giao dich hang ngay ciia ngân hàng và cũng gây khó khăn cho việc khai thắc phân tích số liệu phục vụ công tác quản trị diễu hành tại ngàn hang
đã gây ra áp lực rất lớn lên hệ thống TL, của ngàn hang
-_ Chí hễ trợ mô hình triển khai theo hướng ET-L hoặc H-TL cô nghĩa là mây chú cài dit
D8 chỉ làm nhiệm vụ trích xuất (ExtracÐ hoặc truyền tải (Load) cỏn chuyển di (Transfom) sẽ dược thực hiện tại nguồn hoặc dich Việc thiết kế này phụ thuộc hoàn toàn
vào hiệu năng xử lý của máy của nguồn hoặc đích Không có khả năng mở rộng về các
cụm máy chủ chỉ đẻ dừng cho việc chuyên
héu khi bai (oan dit liệu ngày cảng lăng
trưởng Do đó mô hình này cũng đã một phân ngày tài cho hệ thông xử
ngày trong ngân hàng,
mã chưa có một công cụ chuyên biệt để thực hiện việc phân phối báo cáo tới người dùng Một
số hạn chế khi sử đụng công cụ Excel cho bi Loán phân tích hiện may trong ngân hàng như sau
~_ Dữ liệu khai thác trên Exoel chỉ khai thác được hiên lập dữ liệu nhỏ và dữ liệu OLAP được lưu trên SQL server bi giới hạn dung hượng đo đó bài toán này chỉ phủ hợp với đữ
liệu vừa và nhỏ không phủ hợp với dữ liệu lớn
-_ Việc khai thác trên cáo đữ liệu chuyên để không linh hoạt gây khó khăn cho người dùng
đối với các phân tích cần lọc đữ liệu thì Txcel sẽ thực hiện việc load toàn bộ data lên Tixcel rôi mới thực hiện việc lọc điều này dẫn dến nhiều bài toán phân tích trên đữ liệu chuyên
dé không thực hiện dược đo bị giới hạn về số lượng ban ghi hién tri trên Excel tủy thuộc
từng phiên bản của Excel
~_ Dữ liệu trong kho dữ liệu mới chỉ được cúng cấp tại Hộ số chính mà chưa được phân phối trên loàn ngân hàng
- Co ché phan quyền bảo mật đối với việc khai thác báo cáo qua Ixcel cltta đảm hảo
Trang 201.8.3.4 Mô hình thiết kế kho dữ liệu
'Việc triển khai kho đữ liệu trong ngân hàng chưa có một mô hình thiết kế tầng thể để
tử đó có thể dễ dàng mở rộng và phát triển các bài toản phân tích khac nhau phuc vy nhu cau quan tri điều hành trong môi trường cạnh tranh ngày cảng mãnh liệt
Chưa có một mô hình tổng thể bao trùm các mắng phân tích rong ngân hàng nhĩ: quản
lý rủi ro, phân tích khác hàng, quân lý tai sản nợ cỏ, phân tích khách hàng trung thành dời dị,
phân tich bản chéo sản phẩm, các bài toàn về bảo cảo tuân thu, v.v hiện tại kho dữ liệu
xmới chữ dừng lại ở các bải toán phục vụ tác nghiệp lá chỉnh chưa có những mô hinh chuyên
sâu, chuyên biệt để thực hiện phát Iriển, kiểm soát các hoạt động của ngân hàng trong xu trưởng phát triển mới
1,6 Một số giải pháp cũng nghệ mới về lcho dữ liệu
Có nhiều phương thức để đánh giá các giải pháp kho dữ liệu hiện tại trên thể giới Các hãng, phân tích lớn và uy tin trên thể giới sử dụng các phân tích da chiều, dễng thời theo xu hưởng phát triển của Công nghệ thông tin như Gartners
Tuy nhiên, theo nhận định chung thi có bến yêu tố chính ảnh hưởng đến việc lựa chọn một nên tảng công nghệ kho đữ liệu thich hợp dó là: giao diện, tính năng, hỗ trợ và nên tâng,
hệ thống Các yếu tổ nay ãnh hướng trực tiếp đến thành công của một dự án triển khai và áp
dụng kho dũ liệu vào trong tổ chức/doanh nghiệp
Các giải pháp kho đữ liệu lớn trên thể giới |5| dang, theo xu hướng thay đổi dễ thích
hợp với xu hưởng phát triển của BI cũng yêu câu cảng ngày cảng phúc tạp hơn trong việc
phan Lích dữ liệu Môi số giải pháp hiện nay có liên thị trường bao gdm: Microsofi, Oracte,
TBM
Giai pháp của Microsoft: Microsoft cung cấp giải pháp kho dữ liệu khá toàn điện và day dã với cơ sở dữ liêu SQL Server 2008, hệ thông Analyze Services, là giải pháp tương đôi phố biển
Uu diễm: thân thiện, để đúng, dễ phát triển, dễ bảo trỉ
Nhược điểm:
-_ Hạn chế khi xử lý lượng đữ liệu lớn
- Phù hợp với các bải toán vừa và nhỏ
-_ Hệ thống bảo mật kém do sit dung nén tang windows
Trang 21
Giải pháp của Oracle: Oracle dược đành giá lá một trong những công ty hàng
dầu trong lĩnh vực giải pháp về kho dữ liệu với dây đủ cáo công cụ chuyên biệt cho bái loan kho đữ liệu đặc biệt với giải pháp Oracle Exadala Database Machine đã tối ru rất nhiều cho bài toán kho dữ Hiệu
tu diễm:
- Thi phan Oracle chiém trên thị trường khả lớn khoảng, 48%
- _ Tiện dụng, thuận lợi cho việc tiếp cận và phát triển
-_ Hệ thống cơ sở dữ liệu vả máy chủ kho đữ liệu dã tích hợp thành máy duy nhất
cung cấp hiệu năng xử lý tốt hơn
Nhược diểm:
-_ Thông thường khi triển khai giải pháp của Oracle sẽ tốn công súc triển khai hơn
- Chi phivé ban quyển phần mềm của Oraole cũng thưởng cao hơn các nhà cung cấp
khác, Giải pháp của IBM: được đánh giá là đơn vị cung cấp giải pháp kho đữ liệu
và phân tích sẻ liệu hàng đâu ở hầu hết các tổ chức đánh giá độc lập (cụ thể là Gartner
va Forrester) Hiện tại [BM dang cung cấp hai giải pháp chính và chuyên dụng cho bài toán khai thác, phân tích bảo cáo theo mô hình kho đữ liệu Cả hai giải pháp |1| dễu
có mô hình gần giống nhau, Data Stage lam cong cụ ETI, công cụ Cognos cho cầu phan khai thác và phân phối báo cáo, mô hình dũ liệu TM Banking Data Model Chi khác nhau phần C8DI, lưu trữ
- ISAS (IBM Smart Analytics System), sé dung appliance may ch ISAS 7710, kho
dữ liệu xây đựng trên cơ sở đữ liệu DB2 Dữ liệu đã chiều cube xây đựng trên Inforsphere warehouse gắn chặt với cơ sở đứ liệu IB2 Đây là giải pháp Hybrid
(I1 thống máy chủ có thể đùng cho cả bài toán phân tích báo cáo và giao địch)
- Netezza: sit dung theo co ché appliance; tich hợp toàn bộ phần cứng, phần mềm (hệ điều hành, cơ sở đữ liệu, v.v ) trong một thiết bị duy nhất Dây là giải pháp
chỉ dùng cho hệ thông phân tích, khai thác báo cáo
1.7 Kết luận
Nội dung chương nảy dễ cập Lới khái xiêm kho đữ hệu, kiến trúc chung cửa kho dữ liêu và một số mô hình logic thường sử dụng trong kho Ngoài ra phân chính của chương để
Trang 22
cập tới hiện trạng kho đữ liệu tại ngân hảng với các mặt hạn chế về CSDL, céng cụ trich lọc, công cụ phân phối báo cáo và mỏ hình thiết kế
Với quy mỏ ngày cảng, lớn của ngân hàng, lượng khách hang, lượng giao dịch, tân suất
giao dịch, dêu sẽ tăng với tốc độ cao, tác giá nhận thấy nhu câu cần phải có một khơ dữ liệu mới dáp ứng dược biệu nắng xử lý cho ngân hảng Bài toán quản lý nghiệp vụ ngân hảng hết súc quan trọng và không hé đơn giãn, hơn nữa lại luôn hiôn thay đổi Kho dữ liệu mới sẽ giảm
tải cho hệ thống Core Banking, hỗ trợ các bảo cáo phân tích, tông hợp cầu
cũng như cáo báo cáo phức tạp hơn trong tương lai
thường xuyên
Trang 23CHƯƠNG 2 XÂY DỰNG HỆ THỐNG KHO DỮ LIỆU ĐÁP ỨNG HIỆU NANG
pháp phân phối đữ liệu theo hướng đáp ứng yêu cầu ngày cảng đa dạng cửa nghiệp vụ ngân hàng, Thông nhất mô hình dit héu dé đảm bảo việc khai thác đữ liệu từ tất cả các nguồn hiện
có trong toàn ngân hàng,
Muc tigu chi it: v
liệu mới cản khắc phục được những hạn ché da nêu với bản phương diện cân cải tiến và bổ
sung bao gêm: hệ CSDL chuyên đựng cho bài toán kho đữ liệu, hệ thông trích lọc dữ liệu, hệ
thống phân phối báo cáo và mỗ hình thiết kế tổng thẻ cho kho đữ liệu
bạn chế đã phân tích đánh giá ở Chương 1 hệ thông kho dữ
2.2 Pham vi dé liệu đâu vào
Hệ thống kho dữ liệu mới xác định sẽ lẫy đữ liệu đầu vào lừ các nguồn s¿
~_ Các thông tin chưng (lãi suat, chỉ nhánh, .)
-_ Thông tin phần hệ kể toán
- _ Thông tin phản hệ tín dụng
-_ Thông tin phản hệ hiển gửi
- _ Thông tin phân hệ Tải trợ thương mại (phục vụ các nghiệp vụ bảo lãnh và LƠ)
Trang 243.2.5 Dữ liệu từ các kênh giao dich
-_ Hternet banking: HẦMI3
thống thánh toán song phương/đa phương,
- Hé thdng cham diém tin đụng
- Théng tin tin dung lay tr CIC
2.3 Mô hình tổng thể kho đữ liện mới
Trên cơ sở dã phân tich ở phần trước về hiện trạng, các mặt hạn chế vả một số giải
pháp hiện về kho dữ hệu có lrên thị hường, tác giả đã chọn giải pháp của TPM với Netzzza
để xây dựng lại hệ thông kho dữ liệu mới trơng ngân hàng,
Trang 25
“Mồ hình tổng quan hệ thắng kho đã liệu mới
Hình 2.1 Mô hình tổng thể kho dữ liệu mới
Trong hình 2.1 là mô hình tổng thể của kho dữ liệu mới với các phân sau:
- Hé thong Source Data: bao gồm toản bộ hệ thông nguôn của ngân hàng từ Core banking,
ATM system (DB2/AS400), Cadencies, Payments (Oracle), Treasury sysem (sysbase),
VY
- Hệ thong may cht IBM Netezza được sử dụng với các khu vực lưu trữ:
6 Khu vực STG: dữ liệu thô được tập kết lại từ các nguồn khác nhau thông qua công cụ trích
loc dit ligu IBM DataStage
o Khu vue SOR (System of Record): linh hồn của kho dữ liệu bao gồm tang Atomic va
Summary được thiết kế theo chuẩn của IBM Banking Data Model
o Khu vực Datamart: dữ liệu được tập trung theo từng chủ đẻ phân tích
~_ Hệ thống khai thác và phân phổi báo cảo tập trung IBM Cognos
~ Hệthống người dùng cuỗi: sử dụng khai thác, phân tich bảo cảo qua công cụ IBM Cognos
2.4 Các thành phần của kho dữ liệu mới
2.4.1 Cơ sở dữ liệu
IBM Netezza là một hệ thống máy chủ chuyên dụng dùng cho bai toán kho đữ liệu
hoan chỉnh (Data warehouse Appliance) phần mềm cơ sở dữ liệu và phần cứng được tích hợp cùng một mảy tăng hiệu năng tôi đa cho bải toán truy xuất dữ liệu lớn
Một số đặc điểm nổi bật của IBM Netezza:
Trang 26-_ Hệ thông IBM Netezza hoạt động trong mỏi trường Active- Standby Có hai máy chủ
(hos©) một máy chủ active và một máy chủ standby dùng trong trường hợp máy chú chỉnh
bị sự cố Thời gian downtime nhô khoảng mười phút
~_ TRM Nelezza có kiến Irúc đặc biết với những phân cứng chuyên biệt để xử lý dữ Hệu một
cách thông minh nhằm tăng tốc độ truy vẫn đữ liệu Tốc độ quét đữ liệu có thế lên 145TBđr, tốc độ load dữ liệu tôi thiéu 2TB/hr
~ Hệ thống dễ đảng mở rộng quy mỗ với việc tích hợp các cụm máy chủ thành một khổi duy
nhất
- Vide quản trị hệ thông đơn giản, không tổn nguồn lực cho người quản trị, các tham số tablespace, đồspaoe, physical log sizing, page/block sizing, extent sizing và các câu hình cho table được thực hiện hởi hệ thống mt cach le dng và trong suốt với người sử đụng, -_ Hệ thống tuân thủ việc tăng tốc phân tích bằng cách tập trung xử lý tại kho dữ liệu thay vì
xử lý tại máy chủ khai thác bảo cáo Có nghĩa là dữ liệu đã được phân tích trích xuất từ đưới máy chủ Netezza trước khi được hiến thị trên công cụ khai thác báo cáo
-_ Việc tối ưu hệ thống được tự động xử lý trong suốt với người đừng,
iệc thực nghiệm đễ kiếm chúng về tắc độ của Nelerxa sẽ được thực hiện & phan sau
một cách hiệu năng nhất trong quá trình chuyển đôi
Hệ thống dể dàng thục hiện việc thiết kế các *flow Jobs” theo các cơ chế khác nhau theo năng lục của hệ thống nguồn va dich cụ thể cáo luông dữ Nêu có thể được thiết kế nhục
sau
-_ EL-T: Việc transform thực hiện tại máy chủ nguồn
-_ E-LT: Việc transform Ihuực liệu tại máy chủ đích
thủ cài BTT, đây chính là một điểm nỗi bật của hệ thông DataStage với kiến trúc này đã đâm bảo giâm lãi được rất nhiều ảnh thưởng của quá trình tổng hợp đữ liệu đây vào kho đữ liệu tới hệ thẳng nguồn và hệ thông
địch bằng việc xử lý những tính toán phức tạp trên hệ thống Trngine của máy chủ IETL và
có khả năng mở rộng theo các mô hình khác nhau theo nhu cẩu về năng lực xử lý đối với
dờ liệu Việc thiét kế theo mô hình H-i
bệ thông nguôn và hệ thông dịch dặc biệt dồi với bài toán kho dữ liệu trong ngân hang sẽ
-T: Viée transform thue hiện độc lập lại các máy:
Trang 27Công cụ có khả năng thu thập dữ liệu với các nguồn dữ liệu kẻ cả có câu trúc và không
có cầu trúc: các tập tin văn bản, cầu trúc dữ liệu phức tạp trong XML, các hệ thông Enterprise Resource Planning (ERP) nhu SAP va PeopleSoft, hau nhu bat ky cơ sở dữ liệu nảo (DB2, SQLSERVER, Oracle, Teradata, v.v bao gém ca co sé dit liéu phan ving), ket ndi với các
công cụ đông bộ dữ liệu thời gian thực như Change Data Capture, ket noi véi cac kién tric
luướng dịch vụ (SOA-Service Oriented Architectural)
Cho phép giải quyết các vẫn đề liên quan đền xử lý khối lượng dữ liệu lớn với hiệu
năng cao bằng cách tận dụng khả năng xử lý song song của nên tảng phần cửng Triển khai được trên nên máy chủ lớn (Maimframe)
Cho phép thực thi các “job” một cách song song trên nhiều CPU, cỏ nghĩa lả việc thiết
kể các job được chạy trên tài nguyên của một máy tính đơn hoặc tận dụng các tính năng của
nên tảng song song như cluster, GRID Computing hay kién trac MPP (Masive Parallel
Processing)
Dé dang cho việc mở rộng mô hình triển khai khi dữ liệu ngày càng lớn và số lượng
Jobs xử lỷ dữ liệu tăng lên sau đây là vi dụ về một mô hình triển khai của hệ thống IBM DataStage với phản mở rộng có thẻ thêm vảo
‘ ' ' Engine
Trang 28Hình 2.2 Hệ thống DataS(awe mở rộng câu phần engine Trong Ilinh 2.2 ISM DataStage System 1a hé thang ETL chính được bố sung một hoặc nhiều các Engine dée ap dé tang hiệu năng xứ lý của toàn hệ thông HIL,
2.4.3 Hệ thông bao cáo tập trung
Hé thang phan phdi, khai thac bio cao lap trang TBM Cognos Business Intelligence 1a
mét cong cu BI duve dinh gid hang dau trên thế giới bởi các tổ chức đảnh giá độc lập như
(Gartner va Forrester)
Cognos Business Intelligence cung cap hé théng bao cao cho phép ngân hang khai thác
dữ liệu Lừ nhiều nguồn khác nhau và phân lich/sit dung cée dit ligu di thanh cdc nguéu théng
tin có ý nghĩa nhằm hỗ trợ việc ra quyết định một cách chính xác và hiện qua
Congos là giải pháp BỊ cho những ứng dụng tạo bản báo cáo, dự báo, các phân tích giả lập và quân lý hiệu năng của ngân hàng (balanoe scorecar4, simulation and Forecasting)
Ngoài ra, Cognos Bĩ còn giúp cho ngắn hàng lập những kế hoạch chiến lược, hiểu và quản lý
được nguồn tài chính và quân lý được các hoạt động kinh đoanh của ngân hàng,
Cognos là một sản phẩm cung cấp toàn bộ các chức năng Bï trong một câu trúc don nhất trên web để đàng cho người sử đụng, Khững chức năng của bộ phân mém nay được chia
ra theo từng module bao gêm báo cáo nhiều chiều, phân tích, quản lý các sự kiện vả kết nói
dữ liệu từ nhiều nguồn khác nhau Người đừng dễ dang sử dụng các chúc năng này trên trang
Web mà không cần phải cải dặt trên từng máy dơn riêng lẻ Ngoài những tiện lợi trên, người
dùng cỏn có thể sử dụng chức năng truy xuất những bảo cáo trên thiết bị đi đông (mobile)
thông qua chúc răng Cognos mobile
Một sỏ đặc trung cơ bản nói bật của IBM Cogaos khi triển khai sẽ dáp ứng dược về liệu năng xử lý của công cụ phân phối và khai thác báo cáo giải quyết vấn đẻ còn lrạn chế ở
hè thống cũ như dễ cập bên dưới
Trang 292.4.3.1 Mô hình xử lý
Metric Packages {over DOM)
R
Data Mart FM Packages
(over Dom)
B
Data Mart ‘Dynamic Cube
Data Warehouse IRM Cognos
Hình 2.3 Mô hình xử lý của hệ thong IBM Cognos
Hệ thông IBM Cognos sti dung cả hai phương thức đẻ cung cắp khả năng khai thác dữ
liệu trên hệ thông báo cáo, bao gồm:
- Framework Manager package: két néi voi ving dit liéu Data Mart thong qua cơ chế
Dynamic Query Mode (DQM) dé tan dụng năng lực xử lý trên máy chủ 64 bịt
- Dynamic Cube: cung cap khả năng xử lý dữ liệu nhanh trên một khói lượng dữ liệu lớn
(Tetrabytes), dữ liêu được lưu trữ (cache) trên bộ nhớ (RAM) và cho phép khả năng sử
dụng lại giữa các người dùng Ngoài ra, Dynamie Cube cho phép khả năng lựa chọn thông
minh các bảng Faet tổng hợp tủy theo mức độ chỉ tiết thông tin cho người dùng, từ đó nhằm giảm tải của hệ thông một cách thông mình dựa vảo thao tác phân tich của người dùng Dynamic Cube yéu cau mét service nam trén hé thong IBM Cognos thực thi vả tài
nguyên tuong tmg (RAM)
Trang 30Mô hình xử lý cho các báo cáo tĩnh
Data Warehouse
Hinh 2.4 M6 hinh xử lý báo cáo tĩnh cia IBM Cognos
Cae bao cao tinh str dung Framework Manager package trien khai trén hé thong IBM Cognos Các Data Mart được bồ trí trong các FM package déc lap dé phuc vu các bao cao
độc lập Đối với các báo cáo sử dụng nhiều Data Mart cé thé tap hop trong mét FM package
Mô hình xử lý cho các báo cáo kéo thả
Đối với các bảo cáo kéo thả, sử dụng kết hợp hai dạng Cube của IBM Cognos, bao
gồm:
- Framework Manager package: cho cac Data Mart lớn hoặc các Data Mart có tần suất sử
- Dynamic Cube package: cho các Data Mart nhỏ vả cỏ tần suất sử dụng thường xuyên
2.4.3.2 Mô hình phân quyền
Phân quyền theo Role
Trang 31
hay xem tio aa Fone bee ec
áp lan bài de {eer se Rep ames
Trp pwatowd Stade, ansted,
“ha thie Cogn ten Workspace, Workspace ge
FT ree X4
căm Authors Sytem Adjinistrator
Teme ont ronv sens Bidvcomim,
Hình 2 M6 hinh phan quyén theo role cia IBM Cognos
Phân quyền theo nhóm quyền (Role) được chia thảnh 3 nhỏm quyên sau
~_ Consumer: lả người sử dụng cuối của hệ thông IBM Cognos, cho phép khai thác các báo
cáo đã xây dựng trên hệ thông đề khai thác thông tin dự án MIS
- Author: la người sử dụng có khả năng sử dụng các công cụ tạo bao cao trén IBM Cognos
để chủ động xây dựng các báo cáo cho riêng mình, và cho phòng ban cia minh Author
có thê sử dụng các công cụ chính sau:
Cognos Workspace: céng cu tao cac dashboard
Cognos Workspace Advanced: céng cu tao cic bao cdo vả phân tích cơ ban,
Report Studio: công cụ tạo báo cáo phức tạp
System Administrator: là quản trị hệ thông nhằm quản tri hé thong IBM Cognos Chite
năng nảy chủ yêu dành cho phòng IT
Trang 32Phân quyền theo Báo cáo
—— Bio Got LTD User
o— Thẻ
Hình 2.6 Mô hình phân quyền theo báo cáo của IBM Cognos
Người sử dụng thuộc khối kinh doanh nảo được xem các báo cáo của khói mình Chính
sách phân quyên có thẻ cho phép một người dùng cỏ thẻ xem nhiều bảo cáo, của nhiều thư mục khác nhau
Trang 33Phân quyền theo Phòng ban
Hình 2.7 Mô hình phân quyền theo Phòng/Ban của IBM Cognos
Người sử dụng ở phòng ban nào được xem dữ liệu báo cáo ở phòng ban đó
Thông tin về phân quyền người sử dụng theo phỏng ban được khai báo vả quản lý trên
man hinh quản lý tham số, cho phép khả năng phân quyền linh hoạt vẻ việc phân quyền
Trang 34
Tình 2.8 Mô hình mở rộng của hệ thống TRM Cognos
-_ Hệ thông ISM Cognos có thể tích hợp, tương thích với nhiền hệ thẳng nser đảm bảo có một théng user duy nhất, hiện tại ngân hang dang dùng hệ thông Active Directory Server
đễ xác thực user truy cập
- Hệ thống IBM Coenos có cơ chế trích lọc dữ liệu thỏng mình có thể tình toản trực tiếp tại
máy chủ của Cognos dựa vào gác Engine ropơri sorver hoặc tính toán lừ đưới nguồn rối
mới dura [én Web base hién thi Tinh năng này đã giải quyết triệt để vẫn để dùng Excel để
+hai thác dữ liệu đối với hệ thống kho đữ liệu eiL
-_ Tập trung được toản bộ hệ thông báo cáo của toản ngân hàng tại một nơi điền này giúp người dùng chỉ cần vào một nơi đề khai thác đữ liệu Người đùng có thể tự tạo baa cáo khai thác và phân tích theo mong muốn của mình không cẩn cần sự can thiệp của kỹ thuật -_ Hệ thống co thể kết nói tới nhiều nguồn dữ liệu bao gồm các loại cơ sở dữ liệu thông thưởng, như Oracle, I3B2, Sysbase, Netezza, v.v mà còn kết nói dược với dữ liệu da
chiêu (OT.AP)
2.4.4 Mô hình thiết kế
IBM Banking Data Warehouse (GDW) la mot sản phẩm cia IBM cung cap mét nên
tảng thiết kế vá bảo trì các mô hình dữ liệu trong kho dử liệu, nó được thiết kế một cách tối
ưu đẻ lưu trữ các yếu tổ cần thiết về dữ liệu dễ hỗ trợ cho những, như càu kinh doanh dây thánh thức của tổ clưức [4] Một số điểm mạnh của 3DW giúp triển khai thành công Bussiness
Trieligenee như sau
- _ Cung cáp một nẻn táng chung, thông nhất vẻ kiến trúc
-_ Cung cấp các mỗ hình dựa vào kinh nghiệm triển khai trên toàn thể giới với nhiều hơn
S00 khách hàng lớn của TRM
- Hỗ trợ kỹ thuật và phương pháp kỹ thuật để phát triển các dự án cụ thể cho các bài toán
phan lích kinh đoanh trong ngần hàng,
-_ Tư vân, đảo tạo và thay đối cách thức quản lý để đạt được lợi nhuận lớn nhát
Trang 35IBM Banking Data Model
mm
Hình 2.9 Kiến trúc tổng quát của IBM Banking Data Model Kien tric ctia IBM Banking Data Model bao gém bén thành phân chính như sau:
Financial Services Data Model (FSDM): m6 hinh kinh doanh tổng quát
Analytical Requirements: phan tich yéu cau nghiép vu
Application Solution Template (ASTs): cac bé chi tiéu co san
Data Warehouse Model: mô hình dữ liệu thực thẻ
Trang 362.4.4.1 Mô hình kinh doanh tổng quát
FSDM hỗ trợ vả cung cấp mô hình kinh đoanh tổng quát cho Ngân hảng Cung cấp
các nguyên tắc, phương thức phân loại dữ liệu phổ biến mả IBM đã triển khai và thu thập qua các dự án trên toàn thể giới về mảng Tài chính - Ngân hàng dùng đề phát triển các dự an Data
Warehouse va cac du án triển khai hệ thong quan tri va giao dich
Cầu trúc của FSDM được câu tạo từ 9 vùng khác nhau toàn bộ dữ liệu của tỏ chức tải chính ngân hàng sẽ được mô hình hóa vả tô chức lại theo chuân của kho dữ liệu và được tập ket theo 9 ving như Hinh 2.5 sau đây:
'Hình 2.10 Kiến trúc tổng quát của FESDM
~_ Involved Party (TP): Vùng lưu trữ toàn bộ thông tin liên quan tới những tổ chức, cả nhân, v.v mà cỏ quan hệ với ngân hàng
-_ Classifications (CL): Vùng lưu trữ vẻ phân loại theo các thực thể khác nhau vi dụ: Involved Party khách hàng cá nhân thì phân loại của thực thể nảy là nam, nữ, other, V.V
- Arrangement (AR): Lả mỏi quan hệ hợp tác giữa các Involved Party
- Product (PD): La nhiing san phẩm, dịch vu mà ngân hàng cung cap cho cac Involved
Party lién quan
- Location (LO): La khu vực mà lưu thông tin vẻ địa chỉ hoặc khu vực kinh doanh liên
quan tới một Involved Party
- Condition (CD): La yéu cau cu thé lién quan dén cách thức kinh doanh của các tổ chức
tài chính được thực hiện với các thành phân liên quan tới quan hệ kinh doanh của ngân
hàng
- Event (EV): Mot su kiện, hành động của ngân hàng liên quan tới hoạt động kinh doanh:
ctia minh
Trang 37- Resource Item (RI): Bat ky m6t tai sn nao liên quan tới quả trình hoạt động kinh doanh của ngân hảng,
- Business Direction Item (BD): MéL clién lược kinh doanh ngắn liễn với hoại động của
ngân hàng với Involved Pary
Sau dây lả một ví dụ liên quan tới 9 khu vực cơ bản của vũng FSDML
Ca nhần
Involved Party (IP) Thuée vé mét gidi tinh nao dé theo phan loai 14
Ngôi nhà
Resource Tlem (RT) Theo mét chién luge kinh đoanh là
Business Direction Hem | Nha thu nhgp thap
(BD)
Một số diễm nổi bật của FSIM:
-_ Giúp định đanh các khái niệm đề tránh việc chồng chéo thông tín vả tái sử đụng thông tin
- Givp tạo điều kiện thu thập đữ liệu nhanh hơn và chính xác hơn giúp giảm thời gian thu
thập yêu cầu của dự án
-_ Cung cáp một phiên băn duy nhất và tông hợp về mặt phân loại và tổ chức thông tin dễ cỏ thể clua sẻ giữa các hệ thống với nhau
~_ Cung cấp một góc nhìn kinh doanh giúp cho việc chuyển đổi và tích hợp mô hình dữ liệu
Trang 382.4.4.2 Phân tích yêu cầu nghiệp vụ
Khối nảy cung cap một nên tảng giúp định nghĩa và thu thập các yêu cầu nghiệp vụ một cách
để dàng Là nơi định nghĩa các dữ liệu cho bải toán phân tích vả bảo cáo chính là kết quả dau
ra của kho dữ liệu Một só đặc điểm của ting Analytical Requirements
~_ Cung cập các mâu bảo cáo, mảng phân tích kinh doanh được chia thành các khu vực khác nhau liên quan tới từng mảng nghiệp vụ ba gồm mảng sau Asset & Liability Management,
Profitability, Regular Compliance, Relationship Marketing, Risk Management, Wealth
Management cho phép cac Ngân hàng có thẻ định nghĩa các bài toán vả có các khái niệm
cũng như yêu cầu ban đầu nhanh hơn
[Tre mania std aire rate ath ran vada
Hình 2.11 Khu vực mẫu theo các mảng nghiệp vu trong ngân hàng
- Trong nhom Asset & Liability Management (Quan ly tai sản nợ có) trong Hình 2.6 mồ tả
vé cac bai toan nghiép vụ nhỏ hơn với hơn 20 bài toán khác nhau từ đỏ giúp cho việc thu
thập yêu câu từ nghiệp vụ để dàng hon
~ Đổi với các bài toản nghiệp vụ thì số lượng template vả chỉ tiêu của IBM cung cap đáp
ứng 80% yêu cầu nghiệp vụ cho các ngân hàng đã triển khai phần còn lại là do đặc thù
kinh doanh riêng của môi ngân hàng và do ngân hàng chỉnh sửa để phủ hợp với hoạt động kinh doanh của ngân hàng
Trang 39
- Cung cap khả năng tải liệu hóa giải pháp kho dữ liệu nhanh hơn và giảm thời gian thu thập
và phân tích trong giai đoạn xác định và thu thập yêu cầu
2.4.4.3 Các bộ chỉ tiêu có sẵn
Khối này định nghĩa vả hỗ trợ cung cấp các tham số đầu vảo cho các hệ thống, công cụ tỉnh toán các chỉ tiêu rủi ro đảnh cho các yêu cầu vẻ bảo cáo tuân thủ
- Cung cap hon 50 mau cho việc thu thập các yêu câu tuân thủ
~_ Giúp tải liệu hóa ngôn ngữ sử dụng trong ứmg dung
~_ Giúp xác định những gì mà mô hình có thể hỗ trợ cung cấp đữ liệu cho các tham số của
Hình 2.12 Khu vực mẫu theo các mảng báo cáo tuân thủ
~ Trên Hinh 27 mô tả về mẫu thu thập yêu cầu đầu vảo cho bài toán tuân thủ theo Basel 2
Từ dữ liệu đầu vào cho các bải toán tuân thủ nảy ngân hàng xác định những mô hình đữ liệu phủ hợp với ngân hàng của minh đẻ triển khai theo bảo cảo tuân thủ
2.4.4.4 Mô hình thực thể dữ liệu
Tại Hình 2.1 Mô hình tổng thể kho dữ liệu mới phần Data Warehose Model bao gom
SoR (System of Record) cụ thẻ hỏa mô hình dữ liêu của ngân hảng theo 9 thực thẻ đã mô tả
ở phan FSDM và mô hình cho phân bảo cáo phân tích đầu ra của khối Phân tích yêu cau nghiệp vụ Như vậy Data Warehouse Model chính là khung nhìn tổng quát nhất từ yêu câu
Trang 40bài toán tới báo cáo dầu ra dược cụ thể hỏa bằng, mô hình thực thể đữ liệu Mô hình này có
cac dic tring như mỏ †ả bền dưới
Cấu trúc thực thể chưng
Mô hình TIDW được sử dựng bởi các tô chức tài chính để xây dựng kho đữ liệu Nó được thiết kế đặc biệt để thúc đẩy các câu trúc chung linh hoạt có khả năng chống lại sự thay dỗi cơ sỡ dữ liệu nhiều hơn Điều này lả do cach chuân hỏa trong mỏ hình đữ liệu dược tổ chức Hầu hết các bd sung trong tương lai cho hệ thông kho dữ liệu sẽ tạo nên các thực thể mới, chứ không, phải là các thuộc tính bổ sung cho các thực thể hiện có Kgoài các tính nắng,
‘i 1g
4 trị đó Tuy nhiên, hệ thông:
trên, thay đối đôi với các giá Irị Khuộc lính nguồn có nhiều khả năng dan dén cac hang bo si
tạ gúc dữ liệu phủ lại không được thiết kế để truy cập đữ liệu trực tiếp vị thông tin được
Em trữ theo cách bình thường, việc truy cập có thế đẫn đến thẻi gian đáp mg tiêu chuẩn thập
hơn Lớp này được sử đụng như là nên tăng hm giữt giữa các hệ thông nguồn, và nguễn của các luông dữ liệu hạ lưu và mục tiêu của các kết quả của các ứng dụng, được quan tâm trong
toàn tổ chức,
Các khóa đại diện
Khi cội hiên quan đến nghiệp vụ được sử dụng làm khỏa chính, chúng thường được gọi
là các khóa thông minh hoặo tự nhiên Ví dụ: nều người dùng cung cấp cho mỗi khách hàng một số khách hàng duy nhất, giả trị đó có thể tự nhiên phục vụ như là khỏa chính cho bảng
khỏa dại diện vi chúng dược thay thể cho các phim thông mình, hoặc các phím mủ vỉ người
dùng không nhìn thấy chúng hoặc cân phải xem chúng
Lợi ích chính của việc sử dụng các khỏa dại diện là
- Dé dang tich hợp các phím câu trúc nguồn khác nhau
-_ Khóa nước ngoài nhỏ hơn trong các thực thê con
~_ Nhỏ và dễ đàng hơn dễ quân lý các chỉ mục, lâm chơ bảng kết hợp hiệu quả hơn
-_ Không để bị thay dỗi hệ thống hoạt động trong các định nghĩa hoặc nội dung,
- Cae phim nảy không bao giờ dược cập nhật, vì diễu này sẽ làm thay déi câu trúc bên dưới
của mô hình