1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn xây dựng kho dữ liệu Đảm bảo hiệu năng cho ngân hàng và hệ thống báo cáo phân tích khách hàng

85 4 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây dựng kho dữ liệu đảm bảo hiệu năng cho ngân hàng và hệ thống báo cáo phân tích khách hàng
Tác giả Lê Minh Châu
Người hướng dẫn TS. Nguyễn Thanh Hùng
Trường học Trường Đại Học Bách Khoa Hà Nội
Chuyên ngành Công Nghệ Thông Tin
Thể loại luận văn thạc sĩ
Thành phố Hà Nội
Định dạng
Số trang 85
Dung lượng 2,48 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Dé hudng tới xây dựng một hệ thông kho dữ liệu có hiệu năng xử ly cao dé lai “Yáy đựng kho đã liệu cha ngân hàng và hệ thông báo cáo phân ích khách hàng " đã được chọn làm đề lắt luậ

Trang 1

_BQ GIAO DUC VA DAO TAO TRƯỜNG ĐẠI HỌC BÁCHI KIIOA HẢ NỘI

LÊ MINH CHÂU

XÂY DỰNG KHO DỮ LIỆU ĐÂM BẢO HIEU NANG CHO NGAN HANG

VÀ TIỆ THÓNG BÁO CÁO PHIÂN TÍCII KHÁCH HÀNG

CIIUYEN NGANIL CONG NGIIE TIIGNG TIN

LUẬN VĂN THẠC SĨ KỸ THUẬT

NGƯỜI HƯỚNG DẪN KHOA HỌC

TS NGUYEN THANH HÙNG

Trang 2

MỤC LỤC

TÔI CAM ĐOAN

TỎI CẢM ƠN

DANH MỤC CÁC TỪ NGỮ, KÝ HIỆU VIET TAT

DANIEMUC CAC BANG HH ng an ren

DANH MỤC CÁC HỈNH VẼ, ĐỎ THI

MỞ ĐẦU

CHUONG 1 HE THONG KHO DU LIBU

1.1 Téng quan kho đỡ liệu

12 Kiến trúc chưng của kho dữ liệu

1.3 Mô hình logic của kho dữ liệu

1.4Mö hinh dữ liệu da chiểu

1.5 Hiện trạng hệ thống kho dữ liệu trong ngân hảng, BIDV

1.5.1 Tổng quan hệ thống báo cáo trong ngân hàng

1.5.3 Kiến trúc của kho dữ liệu trong ngân hàng:

1.5.3 Đánh giá các mặt hạn chế của hệ thông kho đữ liệu hiện tại

1.5.3.1 CS12L dùng cho bai toàn kho đữ liệu

1.5.3.2 Công cụ trích lọc dữ liệu

1.5.3.3 Công cụ phân phối bảo cáo

1.5.3.4 Mô hình thiết kế kho dữ liệu

1.6 Một số giải pháp công nghệ mới về kho đữ liệu

17 Kết luận

Trang 3

CHUONG 2 XAY DUNG HE THONG KHO DU LIEU DAP UNG HIBU NANG XU'LY

3.3 Mô hình tổng thẻ kho dữ liệu mới

2 4 Các thành phần của kho đữ liệu mới

Trang 4

3.2.1.7 Classification

3.2.1.8 Summary

9 Event (Sự kiện)

3.2.2 Tang Data Mart

3.2.2.1 Khai niệm Dala Man 3.2.2.2 Định nghia Dimension 3.2.2.3 Đặc trưng của Dimensin

3.2.2.4 Câu trúc Dimensien ccccee

3.2.2.5 Sơ để mô hình logic các Dimension chính

3.2.2.6 Dink nghia Fact 3.2.2.7 Đặc trimg nủa FaeL

3.2.3 Luỗng trích xuất xử lý đỡ liệu

Trang 5

3.2.3.1 Quy trình chạy BIL dữ liệu hàng ngảy:

3.2.3.2 ETL ving STAGING 3.2.3.3 ETT vimg System Of Record 3.2.3.4 E71 vig Data Mart

3.2.4 Bài toán phân tích khách hàng o

3.2.4.1 Phân tích yêu cầu

3.2.4.2 Dimension va Fact 3.2.4.3 Mô hình logie các Huyc thể

3.3 Kết quả thử nghiệm

3.3.1 Kịch bản thứ nghiệm các

3.3.2 So sánh tốc độ tray vẫn trên CSD1,

3.3.2.1 Truy vẫn và Hnh toán Irên 1 bằng đữ liệu

3.3.3.2 Truy vấn và tính toán trên 2 băng, đữ liệu

3.3.2.3 Truy vẫn và tìm kiểm theo tiêu chí phúc tạp 3.3.2.4 Kết quả tổng hợp

3.3.3 8o sánh tốc độ xủ lý của công cụ trích xuất

Hưởng phải triển trong tương lai

TÀI LIỆU THAM KHẢO

Trang 6

LOI CAM DOAN

Tôi xin cam đoan, luận văn tết nghiệp Thạc sỹ nảy là công trình nghiên cứu của ban

thân tôi đưới sự hướng dẫn của 1S Nguyễn Thanh lùng, Các kết quá trong luận văn tốt

nghiệp là trang thực, không phải sao chép toàn văn của bắt kỷ công trình nào khảo Tôi xin chịu hoàn toàn trách nhiệm về nội đưng quyền luận vin nay

Tac giả

T.ê Minh Châu

Trang 7

LỜI CẢM ƠN

Luận văn được hoàn thành tại trường Đại hạc Bách khoa Hà Nội Để hoàn thành luận

văn này, tác giá đã nhận được sự chỉ bảo tận tỉnh của T3 Nguyễn Thanh Liửng, người đã truyền đạt rất nhiêu kiến thức quí báu cũng như những kinh nghiệm nghiên cửa khoa học trong suết thời gian tác giá theo học và nghiên cửu

Tác giả xin chân thành gửi lời biết en đến Ban lãnh đạo Viện Công nghệ thông tin và 'Truyền thông, Viện Dáo tạo Sau đại học và lộ môn Công nghệ phần mềm, thuộc trường Dai

học lách khoa LIá Nội đã tạo điều kiện thuận lợi trong quá trình học tập, nghiên cứu vá hoàn thành luận văn

Với năng lực hạn chế của bản thân cũng như những nguyên nhân chú quan, khách quan, luận văn không tranh khói những thiểu sót Tác giá rất mong nhận được sự góp ý cúa

quý thầy cỏ, các bạn bé va déng nghiệp dễ luận văn được hoàn thiên hơn

Tác giả

T.2 Minh Châu

Trang 8

DANH MỤC CÁC TỪ NGỮ, KÝ HIỆU VIET TAT

CSDL Cơ sở dữ liệu

Staging — Vùng đệm

Enterprise Data Model ~ Mô hình dữ liệu

OLAP Khoi dữ liệu đa chiêu

Data Transformation Services = công cụ chuyên đổi dữ liệu

Exact-Transform-Load — Trích xuất, chuyên đổi, Tải

Trang 9

DANH MUC CAC BANG

Bang 3.1 Định nghĩa thực thế Arragement

Bang 3.2 Định nghĩa thực thế Associalive

Bang 3.3 Dinh nghĩa thực thể Involved Party

Bang 3.4 Định nghĩa thực thể Accounting

Bang 3.5 Dinh nghia thue thé Classification

Bang 3.6 Định nghĩa thực thể Summary

Bang 3.7 Định nghĩa thực thể Eveni vvvvvsvevvtrrretrrrrrrrerrree

Bang 3.8 Bang két qua thir nghiém 1

Bang 3.9 Bang két qua thir nghiém 2

Bang 3.10 Bảng kết quả thủ ngliệm 3

Bang 3.11 Bang két quả thử nghiệm mỏ hình EL-T và E-L-T

Trang 10

DANH MỤC CÁC HÌNH VẼ, ĐỎ THỊ

Hinh 1.1 Kiến trúc cơ bản của kho đữ liệu

Tình 1.2 Mô hình dữ liệu da chiểu

Hinh 1.3 Kiến trủc kho dữ liệu trong ngân hảng,

Hình 2.1 Mô hình tổng thê kho dữ liệu mới

Hình 3.2 Hệ thông DataStage mỡ rộng cầu phân engine

Tình 3.3 Mô hình xử lý của hệ thống TBM Cognos

-Hinh 2.4 Mô hình xứ lý bảo cáo tĩnh của IBMI Cog11os

Tĩnh 2.5 Mô hình phân quyén theo role cia IRM Cognos

Tinh 2.6 Mé6 hình phân quyền theo bảo cáo ctia IBM Cognos

Hinh 2.7 M6 hinh phan quyén theo Phong/Rian cia TBM Cognos

Hình 2.8 Mô hình mở rộng của hệ thống IBM Cognos

linh 2.9 Kiến trủc tổng quát của IM Banking J2ata Model

Hinh 2.10 Kiến trúc tổng quát của FSDM

Tình 2.11 Khu vực mẫu theo các mãng nghiệp vụ trong ngân hàng,

Tỉnh 2.12 Khu vực mẫu theo các mắng bảo cáo tuân (hit

Hình 3.1 Các thực thể chỉnh và quan hệ 2222 cv eccrtzrrrrirrerrree

Tĩinh 3.2 Mô hình tổng quan Arrangement

Hình 3.3 Mô hình tổng quan Associative

Hình 3.4 Mô hình tổng quan Tnvelved Parly

Hình 3.5 Mô hình tổng quan Accouifing, ocosocsessssccorcre

Tĩinh 3.6 Mô hình tổng quan Classification

Tình 3.7 Mô hình tang quan Summary

Hình 3.8 Mô hình tổng quan Event

45

46

4

Trang 11

Tlinh 3.14 BTL vung System O£ Reeord cho Involved Party Keo Hình 3.15 Quy trinh chay ETL ving System Of Record cha Involved Party 68 Tình 3.16 Quy trinh chay RTT ving System Of Record cho Involved Party Associatives 69

Hinh 3.17 Quy trình chạy ETL vùng Systemn Of Record cho Anrangginenl TỦ

linh 3.18 Quy trình chạy l7[L vừng System Of Record cho Arrangement đối với Term

Tỉnh 3.19 Sơ đô Dimensien cho ETL vùng Data Mart 73 Hinh 3.20 So dé Fact cho ETL ving Data Mart 74 Hình 3.31 Ñơ đồ mô hình logic che bai loan phan tích khách hàng ~ - T7

Hình 3.22 Kết quả của 3 lầu thực nghiệm vẻ thời gian truy vẫn dữ liệu 8Ú

Tinh 3.23 Kết quả thử nghiệm theo mé hinh EL-T và I-T-L về thời gian ảnh hưởng tới máy

Trang 12

cảng trở lên quan trọng hơn bao giờ hết, Việc tô chức lưu trữ và khai thác kho dữ liệu một cách hiệu quá sẽ giúp cho các tổ chức tài chỉnh ngân hàng thực hiện tốt công tác quản trị diều hành, quân trị rủi ro, hỗ trợ ra quyết định và hoạch địh chiến lược kinh doanh

được hợp nhất tại kho dữ liệu Nhằm đấp ứng và cũng cấp thông tín một cách kịp thời, chính

xác, đông thời là nên tảng cho việc xây đựng các mg đụng phân tích đữ liệu, hễ trơ ra quyết định Do đó hiệu năng xử lý đữ liệu của kho đữ liệu trong ngân hàng cân được nâng cao dé đáp ứng được nhu câu khai thác sử dụng của tổ chức tải chính ngân hàng TTiệu năng của một

hệ thống kho dữ liệu được thẻ hiện qua một số các phương điện chỉnh như sau Tốc độ xứ lý

dữ liệu trên tập dữ liệu lớn, khả năng, mở rộng, và phát triển kho dữ liệu bao gốm về việc phat triển mô hình đỡ liệu vá hạ tầng kho dữ liệu, tùy biến theo yêu cầu khai thác và phân tích dữ

liêu của người đảng

Với thực trạng hiện nay của ngân hang chưa cỏ một hệ thống kho dữ liệu tổng thể, thống, nhất toàn hàng, chưa đáp ứng tốt về hiệu năng và tồn tại khả nhiều hạn ché Dé hudng

tới xây dựng một hệ thông kho dữ liệu có hiệu năng xử ly cao dé lai “Yáy đựng kho đã liệu

cha ngân hàng và hệ thông báo cáo phân (ích khách hàng " đã được chọn làm đề lắt luậ

cao hoe vila LO

Trong hiận văn đã liến hành nghiên cửu đánh giá hiện trạng, các hạn c

kho dữ liệu hiện lại trong ngân hàng lừ đó đưa ra những giải pháp cụ thé cho từng vấn để hạn

chế và xây dựng hệ thông kho dữ liệu mới dap img hiệu năng,

của hệ thống cũ Miột sẽ kết quả chính của luận văn có thể tóm tắt như sau:

đữ liệu, công cụ phân tích và khai thác báo cáo

b Mô hình của kho đữ Ì

Trang 13

Nội dung chinh của luận văn gdm 3 chương,

Chương 1: Hệ thông kho đủ liệu

Chương 2: Xây dựng hệ thống kho dữ liệu đáp ứng hiệu năng xứ lý cho ngân hàng

Chương 3: Ấp dụng với bài toán phân lích khách hàng

Cuối cùng là kết luận và hưởng phát triển tiếp theo của dễ tài trong tương lai

Trang 14

CHƯƠNG 1 HỆ THÔNG KHO DỮ TIỆE

1.1 Tổng quan kho dữ liệu

Kho đữ liệu (Dala Warehouse): là tập hợp dữ liệu Lương định (it 66 sự thay đối),

cập nhật theo thời gian, được tích hợp theo hướng chủ thẻ nhằm hỗ trợ quá trình quá trình tạo quyết định về mặt quản lý

Các đặc trưng của kho đữ liệu như sau [7]

: không phải tất cả các đữ liệu đến được tập lợp, người ta

Theo chi dé (Consistency

những dữ liệu có ích Dữ liệu được tổ chức xung quanh các chủ để chính như khách

hàng, sản phố

dịch vụ, v.v lập trung vào sự nổ hình hóa và phân tích đữ lều cho các

phân tích ra quyết định mà không tập trưng vào xử lý dữ liệu thông thướng Cung cấp cho người dùng có một cách nhin toàn diện, đây đủ về các sự kiện quanh các chủ để

Trữ liệu tích hợn (Atemicity): đữ liệu tập hợp từ nhiều nguôn khác nhau có các cơ

chế lưu trữ khác nhau: CSDL, Excel file, Flat file, v.v điều này sẽ dẫn đến việc quả trình tập hợp phải thực hiện việc làm sạch, sắp xếp, rút gọn đữ liệu nhằm đảm bão tính nhất quán

hệ thống tác nghiệp nếu như đốt với hệ thống tác nghiệp dữ liều thông thưởng chỉ lưu giá trị

hiện tại nhưng với đữ liệu trong kho đữ liệu cung cấp thông tin lịch sử lâu dải hơn Biển thời

gian cũng là một khóa chính đề đâm bảo tính duy nhật của đữ liệu

1.2 Kiên trúc chung của kho dữ liệu

Mô hình kiến trúc cơ bản [2] của kho dử liệu cơ bản gồm bến thánh phần như sat:

Dé ligu nguồn: dữ liệu từ các hệ thống kháo nhau (bao gồm dữ liệu có câu trúc và phi

cầu trúc) được tập kết lại vào một nơi duy nhất

Trang 15

Khu xử lý dữ liệu: là nơi dữ liêu sẽ được làm sạch và chuyên đổi de dam bảo tỉnh nhất

quán đữ liệu trước khi đưa vào kho đích Thông thường người ta sử dụng các công cụ trích

xuất, chuyên đổi vả nạp dữ liệu (ETL)

Kho lưu trữ dữ liệu: là nơi dữ liệu được xử lý và được tập kết, lưu trữ

Người dùng cuối: là người dùng khai thác thông tin từ kho dữ liệu

hai phá dữ liệu

Kien trúc cơ băn của kho dữ liệu

Hình 1.1 Kiến trúc cơ bản của kho dữ liệu

1.3 Mô hình logic của kho dữ liệu

Sơ đồ hình sao (Star schema): một bảng sự kiện ở trung tâm được kết nổi với một

tập các bảng chiều khác nhau [3]

Sơ đồ bông tuyết (Snowflake schema): Một mở rộng của sơ đỏ hình sao trong đó

một vải cầu trúc chiều được chuân hóa thành một tập các bảng chiêu nhỏ hơn, hình thức tương

tự như bông tuyết

Sơ đồ chòm sao sự kién (Fact constellations schema): Bảng sự kiện phức chia sẻ các bảng chiều, tạo khung nhìn một tập các “ngồi sao”, nên còn được gọi sơ dé ngân hả

(galaxy schema) hoặc chòm sao sự kiện

Trang 16

1.4 Mô hình dữ liệu đa chiều

Day là mô hình dữ liệu xoay quanh các chủ đẻ nhằm trả lời một cách nhanh nhất các

câu hỏi trong nghiệp vụ phân tích [8] Có thể nhìn dữ liệu như là một khói trong đó mồi chiều

là một khía cạnh của bải toản giúp cho các nhà phân tích có thể nhìn thấy, đánh giá số liệu

theo nhiều chiều

Dữ liệu đa chiều

Hình 1.2 Mô hình dữ liệu đa chiều

Ở hình 1.2 khỏi dữ liêu gồm có 3 chiêu: khách hảng, sản phẩm, thời gian

1.5 Hiện trạng hệ thống kho dữ liệu trong ngân hàng BIDV

1.5.1 Téng quan hé théng báo cáo trong ngân hàng,

Từ năm 2004 đền nay ngân hàng đã trang bị hệ thông Core Banking mạnh phục vụ các

mảng kinh doanh của mình Song song với đó các hệ thống bao cáo phục vụ công tác thống,

kê, quản lý lần lượt đưa vào khai thác Tuy nhiên, các hệ thông báo cáo nảy vẫn chưa đây đủ

vả còn manh mún, nằm rời rạc ở các vị trí khác nhau Hệ thông bảo cáo rời rạc chia thảnh các nhóm cụ thể như sau:

-_ Hệ thống báo cáo tại Core banking: nằm trên hệ thống Core banking phục vụ công tác

hàng ngày của hoạt động tác nghiệp trong ngân hàng

~_ Hệ thống bảo cáo kho đữ liệu: là hệ thông báo cáo phân tích đa chiều lớn gồm hàng tram

bảo cáo dựa trên công nghệ của Microsoft

- Hang tram hệ thống báo cáo đơn lẻ do ngân hàng tự xây dưng và phát triển

Trang 17

1.5.2 Kiến trúc của kho dữ liệu trong ngân hàng

Hệ thông kho dữ liệu trong ngân hàng được xây dựng và duy tri từ năm 2005 đền nay, được thiết kế bởi nha thau Silverlake Hinh 1.3 mô tả hệ thống kho dữ liệu hiện tại của ngân

Hình 1.3 Kiến trúc kho dữ liệu trong ngân hàng

Hệ thông kho dữ liệu lưu trữ dữ liệu bao gồm khu vực dữ liệu nguồn (Source data) va

khu vực kho đữ liệu nằm chính trên máy chủ triển khai hệ thống Core Banking (máy chủ AS400) cỏ nghĩa là mảy chủ triên khai hệ thông Core Banking cũng đỏng thời là máy chủ xử

lý chính của kho đữ liệu, hai hệ thông trên cùng một máy chủ hệ thông tác nghiệp và hệ thông

báo cáo kho dữ liệu với cơ sở đữ liệu là DB2 được tích hợp luôn trên máy chủ Dữ liệu nguồn

hầu hết nằm chính tại máy chủ AS400 bao gồm toàn bộ dữ liệu tac nghiép ctia Core Banking,

đữ liệu từ các hệ thông khác hàu như không có Dữ liệu nguồn sẽ được tập kết tại một chỗ gọi

lả khu vực STG từ khu vực nảy dữ liệu sẽ được làm giảu, làm sạch, tổng hợp, chuẩn hóa dữ

liệu, chuẩn bị được đây vào khu vực EDM bằng cung cụ DTS, một sản phẩm trong bộ SQL

Server của Microsoft Dữ liệu sau khi đã được hợp nhất, tính toán, làm giảu, làm sạch từ khu

Trang 18

vực BDM dữ liệu sẽ được chuyển sang đạng dữ liệu da chiều (OLAP) theo các bài toàn chủ

dễ khác nhau dễ người dùng khai thác thông qua công cụ Excel I2œ liệu da chiều dược trạc

hiện Long hợp thông qua công cu DTS và được lưu trữ trên cơ sở đữ liệu SQL Server 2000

Nhu vay về tổng quan kho dữ liệu hiện tại của ngân hàng dược nhìa dưới ba góc độ về

ha tang như sau:

1.8.3 Đánh giá các mặt hạn chế cửa hệ thông khu đữ liệu hiện tại

Tác giả dã dựa vào những phương diện sau dẻ phân tích dánh giá những mặt hạn chế của kho đữ liệu luện tại trong, ngân bảng bao gdm:

- _ CSDL đừng cho bài toán kho dữ liệu

- _ Công cụ trích lọc đữ liệu

~_ Công cụ phan phổi báo cáo,

~ Mô hình thiết kế của kho dữ liệu

Từ dó dua ra hướng giải pháp mới nhằm nâng cao hiệu quả về hiệu năng xử lý của kho

dữ liệu

1.5.3.1 CSDL ding cho bai toan kho đã liệu

Cơ sở đữ liệu DE2 được tính hợp sẵn trên máy chủ AS400 được triển khai cùng với

Core banking, hệ cø sở dữ liệu này được triển khai nhằm mục đích chính cho bải toán tác nghiệp phù hợp với bài toán OL.LP của ngân hảng và câu phần kho đữ liệu được triển khai

thêm sau đó

1o vậy tồn tại bài toán tác nghiệp và bài toán xứ lý kho dữ liệu trên củng một mày chủ

Core banking điều này it nhiều làm anh hướng tới hiệu năng cúa hệ thống tác nghiệp do phải chia sẻ tài nguyên cho hệ thống kho dữ liệu Thông thường hệ thống tảo nghiệp sẽ bắt dầu

ngày lam việc mới khoảng 8h mỗi sáng nhưng hệ thông kho dữ liệu thì kết thúc muôn hơn rất

ử liệu thường bắt dâu từ 2h sáng và thường kết thúc vào 12h giờ hàng

với tông đương lượng dữ liệu xử lý vào khoảng 30GB điều này gây áp lực rất lớn lên hệ thống

Trang 19

giao dich hang ngay ciia ngân hàng và cũng gây khó khăn cho việc khai thắc phân tích số liệu phục vụ công tác quản trị diễu hành tại ngàn hang

đã gây ra áp lực rất lớn lên hệ thống TL, của ngàn hang

-_ Chí hễ trợ mô hình triển khai theo hướng ET-L hoặc H-TL cô nghĩa là mây chú cài dit

D8 chỉ làm nhiệm vụ trích xuất (ExtracÐ hoặc truyền tải (Load) cỏn chuyển di (Transfom) sẽ dược thực hiện tại nguồn hoặc dich Việc thiết kế này phụ thuộc hoàn toàn

vào hiệu năng xử lý của máy của nguồn hoặc đích Không có khả năng mở rộng về các

cụm máy chủ chỉ đẻ dừng cho việc chuyên

héu khi bai (oan dit liệu ngày cảng lăng

trưởng Do đó mô hình này cũng đã một phân ngày tài cho hệ thông xử

ngày trong ngân hàng,

mã chưa có một công cụ chuyên biệt để thực hiện việc phân phối báo cáo tới người dùng Một

số hạn chế khi sử đụng công cụ Excel cho bi Loán phân tích hiện may trong ngân hàng như sau

~_ Dữ liệu khai thác trên Exoel chỉ khai thác được hiên lập dữ liệu nhỏ và dữ liệu OLAP được lưu trên SQL server bi giới hạn dung hượng đo đó bài toán này chỉ phủ hợp với đữ

liệu vừa và nhỏ không phủ hợp với dữ liệu lớn

-_ Việc khai thác trên cáo đữ liệu chuyên để không linh hoạt gây khó khăn cho người dùng

đối với các phân tích cần lọc đữ liệu thì Txcel sẽ thực hiện việc load toàn bộ data lên Tixcel rôi mới thực hiện việc lọc điều này dẫn dến nhiều bài toán phân tích trên đữ liệu chuyên

dé không thực hiện dược đo bị giới hạn về số lượng ban ghi hién tri trên Excel tủy thuộc

từng phiên bản của Excel

~_ Dữ liệu trong kho dữ liệu mới chỉ được cúng cấp tại Hộ số chính mà chưa được phân phối trên loàn ngân hàng

- Co ché phan quyền bảo mật đối với việc khai thác báo cáo qua Ixcel cltta đảm hảo

Trang 20

1.8.3.4 Mô hình thiết kế kho dữ liệu

'Việc triển khai kho đữ liệu trong ngân hàng chưa có một mô hình thiết kế tầng thể để

tử đó có thể dễ dàng mở rộng và phát triển các bài toản phân tích khac nhau phuc vy nhu cau quan tri điều hành trong môi trường cạnh tranh ngày cảng mãnh liệt

Chưa có một mô hình tổng thể bao trùm các mắng phân tích rong ngân hàng nhĩ: quản

lý rủi ro, phân tích khác hàng, quân lý tai sản nợ cỏ, phân tích khách hàng trung thành dời dị,

phân tich bản chéo sản phẩm, các bài toàn về bảo cảo tuân thu, v.v hiện tại kho dữ liệu

xmới chữ dừng lại ở các bải toán phục vụ tác nghiệp lá chỉnh chưa có những mô hinh chuyên

sâu, chuyên biệt để thực hiện phát Iriển, kiểm soát các hoạt động của ngân hàng trong xu trưởng phát triển mới

1,6 Một số giải pháp cũng nghệ mới về lcho dữ liệu

Có nhiều phương thức để đánh giá các giải pháp kho dữ liệu hiện tại trên thể giới Các hãng, phân tích lớn và uy tin trên thể giới sử dụng các phân tích da chiều, dễng thời theo xu hưởng phát triển của Công nghệ thông tin như Gartners

Tuy nhiên, theo nhận định chung thi có bến yêu tố chính ảnh hưởng đến việc lựa chọn một nên tảng công nghệ kho đữ liệu thich hợp dó là: giao diện, tính năng, hỗ trợ và nên tâng,

hệ thống Các yếu tổ nay ãnh hướng trực tiếp đến thành công của một dự án triển khai và áp

dụng kho dũ liệu vào trong tổ chức/doanh nghiệp

Các giải pháp kho đữ liệu lớn trên thể giới |5| dang, theo xu hướng thay đổi dễ thích

hợp với xu hưởng phát triển của BI cũng yêu câu cảng ngày cảng phúc tạp hơn trong việc

phan Lích dữ liệu Môi số giải pháp hiện nay có liên thị trường bao gdm: Microsofi, Oracte,

TBM

Giai pháp của Microsoft: Microsoft cung cấp giải pháp kho dữ liệu khá toàn điện và day dã với cơ sở dữ liêu SQL Server 2008, hệ thông Analyze Services, là giải pháp tương đôi phố biển

Uu diễm: thân thiện, để đúng, dễ phát triển, dễ bảo trỉ

Nhược điểm:

-_ Hạn chế khi xử lý lượng đữ liệu lớn

- Phù hợp với các bải toán vừa và nhỏ

-_ Hệ thống bảo mật kém do sit dung nén tang windows

Trang 21

Giải pháp của Oracle: Oracle dược đành giá lá một trong những công ty hàng

dầu trong lĩnh vực giải pháp về kho dữ liệu với dây đủ cáo công cụ chuyên biệt cho bái loan kho đữ liệu đặc biệt với giải pháp Oracle Exadala Database Machine đã tối ru rất nhiều cho bài toán kho dữ Hiệu

tu diễm:

- Thi phan Oracle chiém trên thị trường khả lớn khoảng, 48%

- _ Tiện dụng, thuận lợi cho việc tiếp cận và phát triển

-_ Hệ thống cơ sở dữ liệu vả máy chủ kho đữ liệu dã tích hợp thành máy duy nhất

cung cấp hiệu năng xử lý tốt hơn

Nhược diểm:

-_ Thông thường khi triển khai giải pháp của Oracle sẽ tốn công súc triển khai hơn

- Chi phivé ban quyển phần mềm của Oraole cũng thưởng cao hơn các nhà cung cấp

khác, Giải pháp của IBM: được đánh giá là đơn vị cung cấp giải pháp kho đữ liệu

và phân tích sẻ liệu hàng đâu ở hầu hết các tổ chức đánh giá độc lập (cụ thể là Gartner

va Forrester) Hiện tại [BM dang cung cấp hai giải pháp chính và chuyên dụng cho bài toán khai thác, phân tích bảo cáo theo mô hình kho đữ liệu Cả hai giải pháp |1| dễu

có mô hình gần giống nhau, Data Stage lam cong cụ ETI, công cụ Cognos cho cầu phan khai thác và phân phối báo cáo, mô hình dũ liệu TM Banking Data Model Chi khác nhau phần C8DI, lưu trữ

- ISAS (IBM Smart Analytics System), sé dung appliance may ch ISAS 7710, kho

dữ liệu xây đựng trên cơ sở đữ liệu DB2 Dữ liệu đã chiều cube xây đựng trên Inforsphere warehouse gắn chặt với cơ sở đứ liệu IB2 Đây là giải pháp Hybrid

(I1 thống máy chủ có thể đùng cho cả bài toán phân tích báo cáo và giao địch)

- Netezza: sit dung theo co ché appliance; tich hợp toàn bộ phần cứng, phần mềm (hệ điều hành, cơ sở đữ liệu, v.v ) trong một thiết bị duy nhất Dây là giải pháp

chỉ dùng cho hệ thông phân tích, khai thác báo cáo

1.7 Kết luận

Nội dung chương nảy dễ cập Lới khái xiêm kho đữ hệu, kiến trúc chung cửa kho dữ liêu và một số mô hình logic thường sử dụng trong kho Ngoài ra phân chính của chương để

Trang 22

cập tới hiện trạng kho đữ liệu tại ngân hảng với các mặt hạn chế về CSDL, céng cụ trich lọc, công cụ phân phối báo cáo và mỏ hình thiết kế

Với quy mỏ ngày cảng, lớn của ngân hàng, lượng khách hang, lượng giao dịch, tân suất

giao dịch, dêu sẽ tăng với tốc độ cao, tác giá nhận thấy nhu câu cần phải có một khơ dữ liệu mới dáp ứng dược biệu nắng xử lý cho ngân hảng Bài toán quản lý nghiệp vụ ngân hảng hết súc quan trọng và không hé đơn giãn, hơn nữa lại luôn hiôn thay đổi Kho dữ liệu mới sẽ giảm

tải cho hệ thống Core Banking, hỗ trợ các bảo cáo phân tích, tông hợp cầu

cũng như cáo báo cáo phức tạp hơn trong tương lai

thường xuyên

Trang 23

CHƯƠNG 2 XÂY DỰNG HỆ THỐNG KHO DỮ LIỆU ĐÁP ỨNG HIỆU NANG

pháp phân phối đữ liệu theo hướng đáp ứng yêu cầu ngày cảng đa dạng cửa nghiệp vụ ngân hàng, Thông nhất mô hình dit héu dé đảm bảo việc khai thác đữ liệu từ tất cả các nguồn hiện

có trong toàn ngân hàng,

Muc tigu chi it: v

liệu mới cản khắc phục được những hạn ché da nêu với bản phương diện cân cải tiến và bổ

sung bao gêm: hệ CSDL chuyên đựng cho bài toán kho đữ liệu, hệ thông trích lọc dữ liệu, hệ

thống phân phối báo cáo và mỗ hình thiết kế tổng thẻ cho kho đữ liệu

bạn chế đã phân tích đánh giá ở Chương 1 hệ thông kho dữ

2.2 Pham vi dé liệu đâu vào

Hệ thống kho dữ liệu mới xác định sẽ lẫy đữ liệu đầu vào lừ các nguồn s¿

~_ Các thông tin chưng (lãi suat, chỉ nhánh, .)

-_ Thông tin phần hệ kể toán

- _ Thông tin phản hệ tín dụng

-_ Thông tin phản hệ hiển gửi

- _ Thông tin phân hệ Tải trợ thương mại (phục vụ các nghiệp vụ bảo lãnh và LƠ)

Trang 24

3.2.5 Dữ liệu từ các kênh giao dich

-_ Hternet banking: HẦMI3

thống thánh toán song phương/đa phương,

- Hé thdng cham diém tin đụng

- Théng tin tin dung lay tr CIC

2.3 Mô hình tổng thể kho đữ liện mới

Trên cơ sở dã phân tich ở phần trước về hiện trạng, các mặt hạn chế vả một số giải

pháp hiện về kho dữ hệu có lrên thị hường, tác giả đã chọn giải pháp của TPM với Netzzza

để xây dựng lại hệ thông kho dữ liệu mới trơng ngân hàng,

Trang 25

“Mồ hình tổng quan hệ thắng kho đã liệu mới

Hình 2.1 Mô hình tổng thể kho dữ liệu mới

Trong hình 2.1 là mô hình tổng thể của kho dữ liệu mới với các phân sau:

- Hé thong Source Data: bao gồm toản bộ hệ thông nguôn của ngân hàng từ Core banking,

ATM system (DB2/AS400), Cadencies, Payments (Oracle), Treasury sysem (sysbase),

VY

- Hệ thong may cht IBM Netezza được sử dụng với các khu vực lưu trữ:

6 Khu vực STG: dữ liệu thô được tập kết lại từ các nguồn khác nhau thông qua công cụ trích

loc dit ligu IBM DataStage

o Khu vue SOR (System of Record): linh hồn của kho dữ liệu bao gồm tang Atomic va

Summary được thiết kế theo chuẩn của IBM Banking Data Model

o Khu vực Datamart: dữ liệu được tập trung theo từng chủ đẻ phân tích

~_ Hệ thống khai thác và phân phổi báo cảo tập trung IBM Cognos

~ Hệthống người dùng cuỗi: sử dụng khai thác, phân tich bảo cảo qua công cụ IBM Cognos

2.4 Các thành phần của kho dữ liệu mới

2.4.1 Cơ sở dữ liệu

IBM Netezza là một hệ thống máy chủ chuyên dụng dùng cho bai toán kho đữ liệu

hoan chỉnh (Data warehouse Appliance) phần mềm cơ sở dữ liệu và phần cứng được tích hợp cùng một mảy tăng hiệu năng tôi đa cho bải toán truy xuất dữ liệu lớn

Một số đặc điểm nổi bật của IBM Netezza:

Trang 26

-_ Hệ thông IBM Netezza hoạt động trong mỏi trường Active- Standby Có hai máy chủ

(hos©) một máy chủ active và một máy chủ standby dùng trong trường hợp máy chú chỉnh

bị sự cố Thời gian downtime nhô khoảng mười phút

~_ TRM Nelezza có kiến Irúc đặc biết với những phân cứng chuyên biệt để xử lý dữ Hệu một

cách thông minh nhằm tăng tốc độ truy vẫn đữ liệu Tốc độ quét đữ liệu có thế lên 145TBđr, tốc độ load dữ liệu tôi thiéu 2TB/hr

~ Hệ thống dễ đảng mở rộng quy mỗ với việc tích hợp các cụm máy chủ thành một khổi duy

nhất

- Vide quản trị hệ thông đơn giản, không tổn nguồn lực cho người quản trị, các tham số tablespace, đồspaoe, physical log sizing, page/block sizing, extent sizing và các câu hình cho table được thực hiện hởi hệ thống mt cach le dng và trong suốt với người sử đụng, -_ Hệ thống tuân thủ việc tăng tốc phân tích bằng cách tập trung xử lý tại kho dữ liệu thay vì

xử lý tại máy chủ khai thác bảo cáo Có nghĩa là dữ liệu đã được phân tích trích xuất từ đưới máy chủ Netezza trước khi được hiến thị trên công cụ khai thác báo cáo

-_ Việc tối ưu hệ thống được tự động xử lý trong suốt với người đừng,

iệc thực nghiệm đễ kiếm chúng về tắc độ của Nelerxa sẽ được thực hiện & phan sau

một cách hiệu năng nhất trong quá trình chuyển đôi

Hệ thống dể dàng thục hiện việc thiết kế các *flow Jobs” theo các cơ chế khác nhau theo năng lục của hệ thống nguồn va dich cụ thể cáo luông dữ Nêu có thể được thiết kế nhục

sau

-_ EL-T: Việc transform thực hiện tại máy chủ nguồn

-_ E-LT: Việc transform Ihuực liệu tại máy chủ đích

thủ cài BTT, đây chính là một điểm nỗi bật của hệ thông DataStage với kiến trúc này đã đâm bảo giâm lãi được rất nhiều ảnh thưởng của quá trình tổng hợp đữ liệu đây vào kho đữ liệu tới hệ thẳng nguồn và hệ thông

địch bằng việc xử lý những tính toán phức tạp trên hệ thống Trngine của máy chủ IETL và

có khả năng mở rộng theo các mô hình khác nhau theo nhu cẩu về năng lực xử lý đối với

dờ liệu Việc thiét kế theo mô hình H-i

bệ thông nguôn và hệ thông dịch dặc biệt dồi với bài toán kho dữ liệu trong ngân hang sẽ

-T: Viée transform thue hiện độc lập lại các máy:

Trang 27

Công cụ có khả năng thu thập dữ liệu với các nguồn dữ liệu kẻ cả có câu trúc và không

có cầu trúc: các tập tin văn bản, cầu trúc dữ liệu phức tạp trong XML, các hệ thông Enterprise Resource Planning (ERP) nhu SAP va PeopleSoft, hau nhu bat ky cơ sở dữ liệu nảo (DB2, SQLSERVER, Oracle, Teradata, v.v bao gém ca co sé dit liéu phan ving), ket ndi với các

công cụ đông bộ dữ liệu thời gian thực như Change Data Capture, ket noi véi cac kién tric

luướng dịch vụ (SOA-Service Oriented Architectural)

Cho phép giải quyết các vẫn đề liên quan đền xử lý khối lượng dữ liệu lớn với hiệu

năng cao bằng cách tận dụng khả năng xử lý song song của nên tảng phần cửng Triển khai được trên nên máy chủ lớn (Maimframe)

Cho phép thực thi các “job” một cách song song trên nhiều CPU, cỏ nghĩa lả việc thiết

kể các job được chạy trên tài nguyên của một máy tính đơn hoặc tận dụng các tính năng của

nên tảng song song như cluster, GRID Computing hay kién trac MPP (Masive Parallel

Processing)

Dé dang cho việc mở rộng mô hình triển khai khi dữ liệu ngày càng lớn và số lượng

Jobs xử lỷ dữ liệu tăng lên sau đây là vi dụ về một mô hình triển khai của hệ thống IBM DataStage với phản mở rộng có thẻ thêm vảo

‘ ' ' Engine

Trang 28

Hình 2.2 Hệ thống DataS(awe mở rộng câu phần engine Trong Ilinh 2.2 ISM DataStage System 1a hé thang ETL chính được bố sung một hoặc nhiều các Engine dée ap dé tang hiệu năng xứ lý của toàn hệ thông HIL,

2.4.3 Hệ thông bao cáo tập trung

Hé thang phan phdi, khai thac bio cao lap trang TBM Cognos Business Intelligence 1a

mét cong cu BI duve dinh gid hang dau trên thế giới bởi các tổ chức đảnh giá độc lập như

(Gartner va Forrester)

Cognos Business Intelligence cung cap hé théng bao cao cho phép ngân hang khai thác

dữ liệu Lừ nhiều nguồn khác nhau và phân lich/sit dung cée dit ligu di thanh cdc nguéu théng

tin có ý nghĩa nhằm hỗ trợ việc ra quyết định một cách chính xác và hiện qua

Congos là giải pháp BỊ cho những ứng dụng tạo bản báo cáo, dự báo, các phân tích giả lập và quân lý hiệu năng của ngân hàng (balanoe scorecar4, simulation and Forecasting)

Ngoài ra, Cognos Bĩ còn giúp cho ngắn hàng lập những kế hoạch chiến lược, hiểu và quản lý

được nguồn tài chính và quân lý được các hoạt động kinh đoanh của ngân hàng,

Cognos là một sản phẩm cung cấp toàn bộ các chức năng Bï trong một câu trúc don nhất trên web để đàng cho người sử đụng, Khững chức năng của bộ phân mém nay được chia

ra theo từng module bao gêm báo cáo nhiều chiều, phân tích, quản lý các sự kiện vả kết nói

dữ liệu từ nhiều nguồn khác nhau Người đừng dễ dang sử dụng các chúc năng này trên trang

Web mà không cần phải cải dặt trên từng máy dơn riêng lẻ Ngoài những tiện lợi trên, người

dùng cỏn có thể sử dụng chức năng truy xuất những bảo cáo trên thiết bị đi đông (mobile)

thông qua chúc răng Cognos mobile

Một sỏ đặc trung cơ bản nói bật của IBM Cogaos khi triển khai sẽ dáp ứng dược về liệu năng xử lý của công cụ phân phối và khai thác báo cáo giải quyết vấn đẻ còn lrạn chế ở

hè thống cũ như dễ cập bên dưới

Trang 29

2.4.3.1 Mô hình xử lý

Metric Packages {over DOM)

R

Data Mart FM Packages

(over Dom)

B

Data Mart ‘Dynamic Cube

Data Warehouse IRM Cognos

Hình 2.3 Mô hình xử lý của hệ thong IBM Cognos

Hệ thông IBM Cognos sti dung cả hai phương thức đẻ cung cắp khả năng khai thác dữ

liệu trên hệ thông báo cáo, bao gồm:

- Framework Manager package: két néi voi ving dit liéu Data Mart thong qua cơ chế

Dynamic Query Mode (DQM) dé tan dụng năng lực xử lý trên máy chủ 64 bịt

- Dynamic Cube: cung cap khả năng xử lý dữ liệu nhanh trên một khói lượng dữ liệu lớn

(Tetrabytes), dữ liêu được lưu trữ (cache) trên bộ nhớ (RAM) và cho phép khả năng sử

dụng lại giữa các người dùng Ngoài ra, Dynamie Cube cho phép khả năng lựa chọn thông

minh các bảng Faet tổng hợp tủy theo mức độ chỉ tiết thông tin cho người dùng, từ đó nhằm giảm tải của hệ thông một cách thông mình dựa vảo thao tác phân tich của người dùng Dynamic Cube yéu cau mét service nam trén hé thong IBM Cognos thực thi vả tài

nguyên tuong tmg (RAM)

Trang 30

Mô hình xử lý cho các báo cáo tĩnh

Data Warehouse

Hinh 2.4 M6 hinh xử lý báo cáo tĩnh cia IBM Cognos

Cae bao cao tinh str dung Framework Manager package trien khai trén hé thong IBM Cognos Các Data Mart được bồ trí trong các FM package déc lap dé phuc vu các bao cao

độc lập Đối với các báo cáo sử dụng nhiều Data Mart cé thé tap hop trong mét FM package

Mô hình xử lý cho các báo cáo kéo thả

Đối với các bảo cáo kéo thả, sử dụng kết hợp hai dạng Cube của IBM Cognos, bao

gồm:

- Framework Manager package: cho cac Data Mart lớn hoặc các Data Mart có tần suất sử

- Dynamic Cube package: cho các Data Mart nhỏ vả cỏ tần suất sử dụng thường xuyên

2.4.3.2 Mô hình phân quyền

Phân quyền theo Role

Trang 31

hay xem tio aa Fone bee ec

áp lan bài de {eer se Rep ames

Trp pwatowd Stade, ansted,

“ha thie Cogn ten Workspace, Workspace ge

FT ree X4

căm Authors Sytem Adjinistrator

Teme ont ronv sens Bidvcomim,

Hình 2 M6 hinh phan quyén theo role cia IBM Cognos

Phân quyền theo nhóm quyền (Role) được chia thảnh 3 nhỏm quyên sau

~_ Consumer: lả người sử dụng cuối của hệ thông IBM Cognos, cho phép khai thác các báo

cáo đã xây dựng trên hệ thông đề khai thác thông tin dự án MIS

- Author: la người sử dụng có khả năng sử dụng các công cụ tạo bao cao trén IBM Cognos

để chủ động xây dựng các báo cáo cho riêng mình, và cho phòng ban cia minh Author

có thê sử dụng các công cụ chính sau:

Cognos Workspace: céng cu tao cac dashboard

Cognos Workspace Advanced: céng cu tao cic bao cdo vả phân tích cơ ban,

Report Studio: công cụ tạo báo cáo phức tạp

System Administrator: là quản trị hệ thông nhằm quản tri hé thong IBM Cognos Chite

năng nảy chủ yêu dành cho phòng IT

Trang 32

Phân quyền theo Báo cáo

—— Bio Got LTD User

o— Thẻ

Hình 2.6 Mô hình phân quyền theo báo cáo của IBM Cognos

Người sử dụng thuộc khối kinh doanh nảo được xem các báo cáo của khói mình Chính

sách phân quyên có thẻ cho phép một người dùng cỏ thẻ xem nhiều bảo cáo, của nhiều thư mục khác nhau

Trang 33

Phân quyền theo Phòng ban

Hình 2.7 Mô hình phân quyền theo Phòng/Ban của IBM Cognos

Người sử dụng ở phòng ban nào được xem dữ liệu báo cáo ở phòng ban đó

Thông tin về phân quyền người sử dụng theo phỏng ban được khai báo vả quản lý trên

man hinh quản lý tham số, cho phép khả năng phân quyền linh hoạt vẻ việc phân quyền

Trang 34

Tình 2.8 Mô hình mở rộng của hệ thống TRM Cognos

-_ Hệ thông ISM Cognos có thể tích hợp, tương thích với nhiền hệ thẳng nser đảm bảo có một théng user duy nhất, hiện tại ngân hang dang dùng hệ thông Active Directory Server

đễ xác thực user truy cập

- Hệ thống IBM Coenos có cơ chế trích lọc dữ liệu thỏng mình có thể tình toản trực tiếp tại

máy chủ của Cognos dựa vào gác Engine ropơri sorver hoặc tính toán lừ đưới nguồn rối

mới dura [én Web base hién thi Tinh năng này đã giải quyết triệt để vẫn để dùng Excel để

+hai thác dữ liệu đối với hệ thống kho đữ liệu eiL

-_ Tập trung được toản bộ hệ thông báo cáo của toản ngân hàng tại một nơi điền này giúp người dùng chỉ cần vào một nơi đề khai thác đữ liệu Người đùng có thể tự tạo baa cáo khai thác và phân tích theo mong muốn của mình không cẩn cần sự can thiệp của kỹ thuật -_ Hệ thống co thể kết nói tới nhiều nguồn dữ liệu bao gồm các loại cơ sở dữ liệu thông thưởng, như Oracle, I3B2, Sysbase, Netezza, v.v mà còn kết nói dược với dữ liệu da

chiêu (OT.AP)

2.4.4 Mô hình thiết kế

IBM Banking Data Warehouse (GDW) la mot sản phẩm cia IBM cung cap mét nên

tảng thiết kế vá bảo trì các mô hình dữ liệu trong kho dử liệu, nó được thiết kế một cách tối

ưu đẻ lưu trữ các yếu tổ cần thiết về dữ liệu dễ hỗ trợ cho những, như càu kinh doanh dây thánh thức của tổ clưức [4] Một số điểm mạnh của 3DW giúp triển khai thành công Bussiness

Trieligenee như sau

- _ Cung cáp một nẻn táng chung, thông nhất vẻ kiến trúc

-_ Cung cấp các mỗ hình dựa vào kinh nghiệm triển khai trên toàn thể giới với nhiều hơn

S00 khách hàng lớn của TRM

- Hỗ trợ kỹ thuật và phương pháp kỹ thuật để phát triển các dự án cụ thể cho các bài toán

phan lích kinh đoanh trong ngần hàng,

-_ Tư vân, đảo tạo và thay đối cách thức quản lý để đạt được lợi nhuận lớn nhát

Trang 35

IBM Banking Data Model

mm

Hình 2.9 Kiến trúc tổng quát của IBM Banking Data Model Kien tric ctia IBM Banking Data Model bao gém bén thành phân chính như sau:

Financial Services Data Model (FSDM): m6 hinh kinh doanh tổng quát

Analytical Requirements: phan tich yéu cau nghiép vu

Application Solution Template (ASTs): cac bé chi tiéu co san

Data Warehouse Model: mô hình dữ liệu thực thẻ

Trang 36

2.4.4.1 Mô hình kinh doanh tổng quát

FSDM hỗ trợ vả cung cấp mô hình kinh đoanh tổng quát cho Ngân hảng Cung cấp

các nguyên tắc, phương thức phân loại dữ liệu phổ biến mả IBM đã triển khai và thu thập qua các dự án trên toàn thể giới về mảng Tài chính - Ngân hàng dùng đề phát triển các dự an Data

Warehouse va cac du án triển khai hệ thong quan tri va giao dich

Cầu trúc của FSDM được câu tạo từ 9 vùng khác nhau toàn bộ dữ liệu của tỏ chức tải chính ngân hàng sẽ được mô hình hóa vả tô chức lại theo chuân của kho dữ liệu và được tập ket theo 9 ving như Hinh 2.5 sau đây:

'Hình 2.10 Kiến trúc tổng quát của FESDM

~_ Involved Party (TP): Vùng lưu trữ toàn bộ thông tin liên quan tới những tổ chức, cả nhân, v.v mà cỏ quan hệ với ngân hàng

-_ Classifications (CL): Vùng lưu trữ vẻ phân loại theo các thực thể khác nhau vi dụ: Involved Party khách hàng cá nhân thì phân loại của thực thể nảy là nam, nữ, other, V.V

- Arrangement (AR): Lả mỏi quan hệ hợp tác giữa các Involved Party

- Product (PD): La nhiing san phẩm, dịch vu mà ngân hàng cung cap cho cac Involved

Party lién quan

- Location (LO): La khu vực mà lưu thông tin vẻ địa chỉ hoặc khu vực kinh doanh liên

quan tới một Involved Party

- Condition (CD): La yéu cau cu thé lién quan dén cách thức kinh doanh của các tổ chức

tài chính được thực hiện với các thành phân liên quan tới quan hệ kinh doanh của ngân

hàng

- Event (EV): Mot su kiện, hành động của ngân hàng liên quan tới hoạt động kinh doanh:

ctia minh

Trang 37

- Resource Item (RI): Bat ky m6t tai sn nao liên quan tới quả trình hoạt động kinh doanh của ngân hảng,

- Business Direction Item (BD): MéL clién lược kinh doanh ngắn liễn với hoại động của

ngân hàng với Involved Pary

Sau dây lả một ví dụ liên quan tới 9 khu vực cơ bản của vũng FSDML

Ca nhần

Involved Party (IP) Thuée vé mét gidi tinh nao dé theo phan loai 14

Ngôi nhà

Resource Tlem (RT) Theo mét chién luge kinh đoanh là

Business Direction Hem | Nha thu nhgp thap

(BD)

Một số diễm nổi bật của FSIM:

-_ Giúp định đanh các khái niệm đề tránh việc chồng chéo thông tín vả tái sử đụng thông tin

- Givp tạo điều kiện thu thập đữ liệu nhanh hơn và chính xác hơn giúp giảm thời gian thu

thập yêu cầu của dự án

-_ Cung cáp một phiên băn duy nhất và tông hợp về mặt phân loại và tổ chức thông tin dễ cỏ thể clua sẻ giữa các hệ thống với nhau

~_ Cung cấp một góc nhìn kinh doanh giúp cho việc chuyển đổi và tích hợp mô hình dữ liệu

Trang 38

2.4.4.2 Phân tích yêu cầu nghiệp vụ

Khối nảy cung cap một nên tảng giúp định nghĩa và thu thập các yêu cầu nghiệp vụ một cách

để dàng Là nơi định nghĩa các dữ liệu cho bải toán phân tích vả bảo cáo chính là kết quả dau

ra của kho dữ liệu Một só đặc điểm của ting Analytical Requirements

~_ Cung cập các mâu bảo cáo, mảng phân tích kinh doanh được chia thành các khu vực khác nhau liên quan tới từng mảng nghiệp vụ ba gồm mảng sau Asset & Liability Management,

Profitability, Regular Compliance, Relationship Marketing, Risk Management, Wealth

Management cho phép cac Ngân hàng có thẻ định nghĩa các bài toán vả có các khái niệm

cũng như yêu cầu ban đầu nhanh hơn

[Tre mania std aire rate ath ran vada

Hình 2.11 Khu vực mẫu theo các mảng nghiệp vu trong ngân hàng

- Trong nhom Asset & Liability Management (Quan ly tai sản nợ có) trong Hình 2.6 mồ tả

vé cac bai toan nghiép vụ nhỏ hơn với hơn 20 bài toán khác nhau từ đỏ giúp cho việc thu

thập yêu câu từ nghiệp vụ để dàng hon

~ Đổi với các bài toản nghiệp vụ thì số lượng template vả chỉ tiêu của IBM cung cap đáp

ứng 80% yêu cầu nghiệp vụ cho các ngân hàng đã triển khai phần còn lại là do đặc thù

kinh doanh riêng của môi ngân hàng và do ngân hàng chỉnh sửa để phủ hợp với hoạt động kinh doanh của ngân hàng

Trang 39

- Cung cap khả năng tải liệu hóa giải pháp kho dữ liệu nhanh hơn và giảm thời gian thu thập

và phân tích trong giai đoạn xác định và thu thập yêu cầu

2.4.4.3 Các bộ chỉ tiêu có sẵn

Khối này định nghĩa vả hỗ trợ cung cấp các tham số đầu vảo cho các hệ thống, công cụ tỉnh toán các chỉ tiêu rủi ro đảnh cho các yêu cầu vẻ bảo cáo tuân thủ

- Cung cap hon 50 mau cho việc thu thập các yêu câu tuân thủ

~_ Giúp tải liệu hóa ngôn ngữ sử dụng trong ứmg dung

~_ Giúp xác định những gì mà mô hình có thể hỗ trợ cung cấp đữ liệu cho các tham số của

Hình 2.12 Khu vực mẫu theo các mảng báo cáo tuân thủ

~ Trên Hinh 27 mô tả về mẫu thu thập yêu cầu đầu vảo cho bài toán tuân thủ theo Basel 2

Từ dữ liệu đầu vào cho các bải toán tuân thủ nảy ngân hàng xác định những mô hình đữ liệu phủ hợp với ngân hàng của minh đẻ triển khai theo bảo cảo tuân thủ

2.4.4.4 Mô hình thực thể dữ liệu

Tại Hình 2.1 Mô hình tổng thể kho dữ liệu mới phần Data Warehose Model bao gom

SoR (System of Record) cụ thẻ hỏa mô hình dữ liêu của ngân hảng theo 9 thực thẻ đã mô tả

ở phan FSDM và mô hình cho phân bảo cáo phân tích đầu ra của khối Phân tích yêu cau nghiệp vụ Như vậy Data Warehouse Model chính là khung nhìn tổng quát nhất từ yêu câu

Trang 40

bài toán tới báo cáo dầu ra dược cụ thể hỏa bằng, mô hình thực thể đữ liệu Mô hình này có

cac dic tring như mỏ †ả bền dưới

Cấu trúc thực thể chưng

Mô hình TIDW được sử dựng bởi các tô chức tài chính để xây dựng kho đữ liệu Nó được thiết kế đặc biệt để thúc đẩy các câu trúc chung linh hoạt có khả năng chống lại sự thay dỗi cơ sỡ dữ liệu nhiều hơn Điều này lả do cach chuân hỏa trong mỏ hình đữ liệu dược tổ chức Hầu hết các bd sung trong tương lai cho hệ thông kho dữ liệu sẽ tạo nên các thực thể mới, chứ không, phải là các thuộc tính bổ sung cho các thực thể hiện có Kgoài các tính nắng,

‘i 1g

4 trị đó Tuy nhiên, hệ thông:

trên, thay đối đôi với các giá Irị Khuộc lính nguồn có nhiều khả năng dan dén cac hang bo si

tạ gúc dữ liệu phủ lại không được thiết kế để truy cập đữ liệu trực tiếp vị thông tin được

Em trữ theo cách bình thường, việc truy cập có thế đẫn đến thẻi gian đáp mg tiêu chuẩn thập

hơn Lớp này được sử đụng như là nên tăng hm giữt giữa các hệ thông nguồn, và nguễn của các luông dữ liệu hạ lưu và mục tiêu của các kết quả của các ứng dụng, được quan tâm trong

toàn tổ chức,

Các khóa đại diện

Khi cội hiên quan đến nghiệp vụ được sử dụng làm khỏa chính, chúng thường được gọi

là các khóa thông minh hoặo tự nhiên Ví dụ: nều người dùng cung cấp cho mỗi khách hàng một số khách hàng duy nhất, giả trị đó có thể tự nhiên phục vụ như là khỏa chính cho bảng

khỏa dại diện vi chúng dược thay thể cho các phim thông mình, hoặc các phím mủ vỉ người

dùng không nhìn thấy chúng hoặc cân phải xem chúng

Lợi ích chính của việc sử dụng các khỏa dại diện là

- Dé dang tich hợp các phím câu trúc nguồn khác nhau

-_ Khóa nước ngoài nhỏ hơn trong các thực thê con

~_ Nhỏ và dễ đàng hơn dễ quân lý các chỉ mục, lâm chơ bảng kết hợp hiệu quả hơn

-_ Không để bị thay dỗi hệ thống hoạt động trong các định nghĩa hoặc nội dung,

- Cae phim nảy không bao giờ dược cập nhật, vì diễu này sẽ làm thay déi câu trúc bên dưới

của mô hình

Ngày đăng: 09/06/2025, 12:25

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w