ĐẠI HỌC QUỐC GIA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN LÊ MẠNH TUẤN NGHIÊN CỨU BÀI TOÁN XÂY DỰNGKHO DỮ LIỆU VÀ HỆ THỐNG HỖ TRỢ RA QUYẾT ĐỊNHTẠI NGÂN HÀNG NÔNG NGHIỆP VÀ PHÁT TRIỂN NÔNG THÔN
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN
LÊ MẠNH TUẤN
NGHIÊN CỨU BÀI TOÁN XÂY DỰNGKHO DỮ LIỆU VÀ HỆ THỐNG HỖ TRỢ RA QUYẾT ĐỊNHTẠI NGÂN HÀNG NÔNG NGHIỆP VÀ PHÁT
TRIỂN NÔNG THÔN VIỆT NAM
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Hà Nội - 2015
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN
LÊ MẠNH TUẤN
NGHIÊN CỨU BÀI TOÁN XÂY DỰNGKHO DỮ LIỆU VÀ HỆ THỐNG
HỖ TRỢ RA QUYẾT ĐỊNHTẠI NGÂN HÀNG NÔNG NGHIỆP
VÀ PHÁT TRIỂN NÔNG THÔN VIỆT NAM
Ngành: Công nghệ thông tin
Chuyên ngành: Quản lý hệ thống thông tin
Mã số: Chuyên ngành đào tạo thí điểm
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC:PGS TS Nguyễn Đình Hóa
Hà Nội - 2015
Trang 3LỜI CAM ĐOAN
Tôi xin am đoan đ y là ông trình nghiên u a riêng tôi
C số liệu kết lu n đ đ a ra trong lu n v n là trung th
ó nguồn gố r ràng
T giả lu n v n
Lê Mạnh Tuấn
Trang 4LỜI CẢM N
Để hoàn thành đ hoàn thành đ ông trình nghiên u này ngoài s nỗ
l a ản th n t giả n nh n đ s gi p đ rất lớn t PGS.TS Nguyễn Đình Hóa, ng i đã luôn quan t m tr h nhiệm và nhiệt tình h ớng n gi p đ động viên
t giả trong qu trình th hiện nghiên u a mình T giả xin g i l i ảm n h n thành tới PGS.TS Nguyễn Đình Hóa
T giả ng xin tr n trọng ảm n thầy ô trong Viện Cộng nghệ thông tin – Đại họ Quố Gia Hà Nội ạn đồng nghiệp lãnh đạo và n ộ nh n viên Ng n hàng Nông nghiệp và ph t triển Nông thôn Việt Nam và ạn lớp Cao họ CIO2 đã
gi p đ t giả trong suốt th i gian họ t p và nghiên u lu n v n a mình
Để đạt đ nh ng kết quả nghiên u tốt h n trong t ng lai t giả rất mong tiếp t nh n đ s h ớng n gi p đ a nhà huyên môn a thầy ô trong Viện Công nghệ thông tin – Đại họ Quố Gia Hà Nội về ph ng ph p lu n
h th tiếp n khoa họ và h p lý
T giả lu n v n
Lê Mạnh Tuấn
Trang 5MỤC LỤC
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT 8
DANH MỤC CÁC HÌNH VẼ ĐỒ THỊ 8
DANH MỤC CÁC BẢNG, BIỂU 9
PHẦN MỞ ĐẦU 1
CHƯƠNG I GIỚI THIỆU VỀ DW&BI 3
1.1 Các khái niệm ản 3
1.1.1 Data Warehouse và BI là gì? 3
1.1.2 C đặ tr ng về mặt d liệu c a một hệ thống DW&BI 4
1.1.3 Phân biệt gi a hệ thống OLTP và hệ thống DSS 4
1.2 C ph ng ph p lu n xây d ng hệ thống DW&BI 5
1.2.1 Ph ng ph p lu n Top-down 6
1.2.2 Ph ng ph p lu n Bottom-up 6
1.2.3 Ph ng ph p lu n Spiral 6
1.2.4 Ưu/Nh điểm c a t ng ph ng ph p 7
1.2.5 C sở l a chọn ph ng ph p lu n 8
1.3 Thiết kế logic một hệ thống DW&BI 8
1.3.1 Phạm vi công việ và ph ng ph p th c hiện 8
1.3.2 Thiết kế tổng thể 9
1.4 Thiết kế chi tiết t ng thành phần 11
1.4.1 Thiết kế Data Warehouse (Kho d liệu t p trung) 11
1.4.2 Thiết kế metadata 19
1.4.3 Thiết kế tầng khai thác và phân tích thông tin 20
CHƯƠNG II BÀI TOÁN ĐẦU TƯ PHÁT TRIỂN HỆ THỐNG HỖ TRỢ RA QUYẾT ĐỊNH TẠI NGÂN HÀNG NÔNG NGHIỆP VÀ PHÁT TRIỂN NÔNG THÔN VIỆT NAM 22
2.1 Bối cảnh xây d ng d án 22
2.1.1 Xu h ớng xây d ng DW&BI 22
2.1.2 Hiện trạng hệ thống CNTT tại Ngân hàng Nông nghiệp 22
2.2 Đ nh gi về hệ thống báo cáo (MIS) hiện tại 24
2.3 S cần thiết phải đầu t 24
2.3 M tiêu đầu t 25
2.3.1 M c tiêu chung 25
2.3.2 M c tiêu c thể 25
2.4 Yêu cầu n ng l c s bộ c a hệ thống 26
2.5 Yêu cầu về các thiết bị phần c ng 27
2.6 Quan điểm th c hiện d án 27
2.7 D kiến quy mô đầu t 28
2.8 Thiết kế s ộ 28
2.8.1 Mô hình tổng thể 28
2.8.2 Thiết kế mô hình v t lý c a hệ thống 31
2.8.3 Giải pháp tích h p hệ thống 31
2.8.4 Giải ph p đồng bộ d liệu 32
CHƯƠNG III ĐỀ XUẤT DỰ ÁN XÂY DỰNG KHO DỮ LIỆU VÀ HỆ THỐNG HỖ TRỢ RA QUYẾT ĐỊNH 33
3.1 C n l a chọn giải pháp xây d ng DW&BI 33
3.2 Phân tích l a chọn giải pháp 33
Trang 63.2.1 Giải pháp DW&BI c a IBM 34
3.2.2 Giải pháp DW&BI c a Oracle 36
3.2.3 Giải pháp DW&BI c a SAP 38
3.2.4 Đ nh gi về tính n ng a ba giải pháp 44
3.3 Giải ph p đ c l a chọn 45
3.4 D trù kinh phí và nguồn vốn đầu t 46
3.4.1 C n l p tổng m đầu t 46
3.4 2 Chi phí mua sắm và triển khai 46
3.4.3 Các chi phí quản lý 47
3.4.4 Chi phí d phòng 47
3.4.5 Tổng m đầu t 47
KẾT LUẬN 48
TÀI LIỆU THAM KHẢO 49
PHỤ LỤC 50
PHỤ LỤC 1: Danh sách báo cáo Phân theo nghiệp v tại NHNo 50
PHỤ LỤC 2: Bảng đ nh gi yêu ầu ch n ng đối với ng i s d ng cuối 52
PHỤ LỤC 3: Bảng đ nh gi yêu ầu ch n ng đối với ng i quản trị và v n hành 54
PHỤ LỤC 4: Bảng đ nh gi yêu ầu ch n ng đối với ng i phát triển/ xây d ng và triển khai 56
Trang 7DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
1 BOE Sản phẩm BI a SAP - Business Object
5 DW&BI Data warehouse & Business Intelligence
6 ETL Thu th p làm sạ h và tí h h p liệu (Extraction
– Transformation - Loading)
7 IBM Công tyInternational Business Machines
7 NHNo Ng n hàng Nông nghiệp và ph t triển Nông thôn
Việt Nam
8 OLTP Hệ thống x lý giao ị h tr tuyến (OnLine
Transaction Processing)
9 ORACLE Công ty Oracle
11 SAP Công ty phần mềm đa quố gia Đ (Systems
Applications and Products)
Hình 1.6: Snowflake S hema (CSDL hình ông tuyết) 21
Hình 2.1: Mô hình o o hiện tại a Ng n hàng Nông nghiệp 32 Hình 2.2: thông tin theo đối t ng ng i s ng 34 Hình 2.3: Mô hình thiết kế tổng thể hệ thống DW&BI 38 Hình 2.4: Thiết kế mô hình v t lý hệ thống DW&BI 39
Trang 8Bảng 3.1: Chi phí trang thiết ị phần ng a giải ph p IBM 43 Bảng 3.2: Chi phí phần mềm tiêu huẩn a giải ph p IBM 43 Bảng 3.3: Chi phí đào tạo và triển khai a giải ph p IBM 44
Bảng 3.5: Chi phí trang thiết ị phần ng a giải ph p Ora le 45 Bảng 3.6: Chi phí phần mềm tiêu huẩn a giải ph p Ora le 45 Bảng 3.7: Chi phí đào tạo và triển khai a giải ph p Ora le 46
Bảng 3.9: Chi phí trang thiết ị phần ng a giải ph p SAP 49 Bảng 3.10: Chi phí phần mềm tiêu huẩn a giải ph p SAP 51 Bảng 3.11: Chi phí đào tạo và triển khai a giải ph p SAP 52
Bảng 3.15: So s nh tổng hi phí a a giải ph p 54 Bảng 3.16: D trù tổng hi phí mua sắm và triển khai 54
Trang 9PHẦN MỞ ĐẦU
Cơ sở khoa học và thực tiễn của đề tài
Trong nền kinh tế hiện nay thông tin là yếu tố sống n đối với ất kỳ oanh nghiệpnào.Việ nắm ắt thông tin gi p ho oanh nghiệp hoạ h định hiến
l kinh oanh ho mình một h hính x
Trong nh ng n m gần đ y ông nghệ kho liệu ra đ i đ p ng đ nhu ầu quản lý l u tr thông tin ó khối l ng lớn và ó khả n ng khai th liệu đa hiều
và theo hiều s u nhằm hỗ tr việ ra quyết định a nhà quản lý
Nguồn d liệu đối với các t p đoàn công nghệ, tài chính, ngân hàng là vô cùng lớn Xây d ng một kho d liệu cho phép rút trích tài nguyên, tính toán theo yêu cầu đểcung cấp các báo cáo d a vào c sở d liệu hoạt động ph c v sản xuất, kinh doanh trở nên thông minh h n, t ng thêm chất l ng và tính linh hoạt c a việc phân tích kinh doanh có chất l ng cao và ổn định
Đối với oanh nghiệp n ớ ngoài họ đã p ng kho liệu trong quản lý
ph n tí h liệu và đã ho thấy hiệu quả to lớn gi p í h ho việ hoạ h định hiến
l kinh oanh ng nh nghiên u ph t triển ng ng ph n tí h liệu
Tại Ng n hàng Nông nghiệp và ph t triển Nông thôn Việt Nam (NHNo) việ
x y ng kho liệu và hệ thống hỗ tr ra quyết định là rất ần thiết Kho liệu sẽ thu th p liệu t hệ thống nghiệp v ung ấp thông tin h u í h cho các nhà quản lý ó thể ó nh ng thông tin hính x nhanh hóng hỗ tr ho việ ra quyết định kịp th i và ó l i nhất ho hoạt động tín ng a NHNo Ngoài ra kho liệu
c n hỗ tr trong công việ quản trị r i ro tín ng – một vấn đề hết s quan trọng trong ối ảnh khó kh n hiện tại a ng n hàng
Xuất ph t t nhu ầu th tế tại NHNo lu n v n nghiên u ài to n x y ng kho liệu và hệ thống hỗ tr ra quyết định (DW&BI) tại Ng n hàng Nông nghiệp và
ph t triển Nông thôn Việt Nam với mong muốn đ a ra một n khả thi nhằm x y
ng kho liệu hoàn hỉnh hỗ tr ho việ quản lý và ra quyết định tại NHNo
Mục tiêu đề tài
X y ng n khả thi để triển khai kho liệu và hệ thống hỗ tr ra quyết định đ p ng yêu ầu nghiệp v thông minh tại NHNo
Phạm vi và đối tượng của đề tài:
- Đối t ng nghiên u: Kho liệu và hệ thống hỗ tr ra quyết định ho hoạt động nghiệp v ng n hàng tại NHNo
- Phạm vi p ng: đề tài đ p ng tại NHNo
Kết quả của đề tài
Trang 10Một nghiên u n khả thi x y ng Kho liệu và hệ thống hỗ tr ra quyết định tại Ng n hàng Nông nghiệp và ph t triển Nông thôn Việt Nam trình ày đầy đ
sở ph ng ph p lu n l a họn giải ph p ớ x y ng thiết kế hệ thống DW&BI ng nh tổng m đầu t ho n
Kết cấu của đề tài
Đề tài đ kết ấu gồm 3 phần ( h ng) hính trong đó:
Phần mở đầu:
Giới thiệu yêu ầu kh h quan h quan sở th tiễn nghiên u và x y
ng đề tài
Chương I: Giới thiệu về DW&BI
Nội ung hính a h ng này trình ầy kh i niệm ản về kho liệu
Đ a ra m tiêu đầu t yêu ầu n ng l s ộ a hệ thống
Đ a ra ản thiết kế logi ản thiết kế v t lý để x y ng kho liệu và hệ thống hỗ tr ra quyết định
Chương III:Đề xuất dự án xây dựng kho dữ liệu và hệ thống hỗ trợ ra quyết định
Đ a ra n để ph n tí h l a họn giải ph p đồng th i ph n tí h hi tiết
về a giải ph p phổ iến đ ng đầu về DW&BI qua đó khuyến nghị giải ph p kỹ thu t ông nghệ s ng trong n và trù tổng kinh phí a n
Phần kết luận: Kết luận tổng thể về luận văn
Đ a ra nh ng điều làm đ nh ng điều h a làm đ và h ớng ph t triển
a lu n v n
Trang 11CHƯ NG I GIỚI THIỆU VỀ DW&BI
Ch ng này đ a ra kh i niệm ản về Data Warehouse và BI T đó tìm ra
ph ng ph p phù h p để x y ng DW&BI tại Ng n hàng Nông nghiệp
1.1 Các khái niệm cơ bản
1.1.1 Data Warehouse và BI là gì?
Data Warehouse (viết tắt là DW n gọi là Kho D Liệu) là hệ thống t p trung liệu nhằm m đí h khai th ph n tí h thông tin và hỗ tr quyết định với đặ
tr ng về mặt liệu là: tí h h p h ớng h đề tí h l y theo th i gian và ất iến
Business Intelligence (viết tắt là BI) là tầng ng ng khai th liệu và ph n
tí h thông tin t nguồn liệu kh nhau mà tiêu iểu trong đó hính là DW với thiết kế CSDL đa hiều (OLAP) Tầng ng ng BI này ao gồm liệu meta ata h ng trình ng ng ông phần mềm… nhằm m đí h đ a kết quả o o ph n tí h nghiệp v … đến tr tiếp ng i ùng uối (nh ng
Trang 12- Data Warehouse (Kho d liệu t p trung): bao gồm CSDL tích h p và các
CSDL ch đề
- BI:tầng ng d ng khai thác và phân tích thông tin hỗ tr quyết định; các
end-user t ng tác với hệ thống qua tầng BI này
- Administration: Metadata và quản trị hệ thống
reports
information
knowledge CSDL tích hợp
CSDL chủ đề
CSDL chủ đề
CSDL chủ đề Files
h ớng h đề tí h l y theo th i gian ất iến
- Tích hợp (Integrated): D liệu a DW đ t p h p về t nguồn
kh nhau nh CSDL a hệ thống t nghiệp file tài liệu …
- Hướng chủ đề (Subject-Oriented): D liệu a DW đ tổ h và l u
tr theo h đề nghiệp v mà ng i khai th quan t m
- Tích lũy theo thời gian (Time-Variant): D liệu l u tr ó tính hất lị h
s theo ng th i gian tính t một th i điểm trong qu kh ho đến hiện tại và liệu sẽ ph t sinh trong t ng lai
- Bất biến (Non-Volatile): D liệu đã đ a vào trong DW nói hung ở ạng
read-only và rất hiếm khi thay đổi (không up ate không elete) DW hính là nh ng CSDL đ thiết kế ho m đí h Khai th và Ph n tí h thông tin (query truy vấn) h không phải m p nh t (up ate elete)
nh trong CSDL a ng ng t nghiệp
1.1.3 Phân biệt giữa hệ thống OLTP và hệ thống DSS
- OLTP (OnLine Transa tion Pro essing): Hệ thống x lý giao ị h tr tuyến Đặ tr ng a ng ng OLTP là t v t động ghi hép
Trang 13liệu để x lý nghiệp v a một tổ h nh ghi nh n đ n đặt hàng hoặ giao ị h ng n.C t v này th ng đọ hoặ p nh t một vài ng liệu a trên kho hính a h ng Nh ng t v đó ó ấu tr đ lặp lại ao gồm giao ị h ngắn tối giản và t h iệt yêu ầu liệu hi tiết
và mới nhất C sở liệu t nghiệp ó kí h th ớ t vài tr m mega yte đến hàng giga yte và hỉ l u tr liệu hiện hành (v ng đ i liệu ngắn) C sở liệu ó tính nhất qu n khả n ng ph hồi ao
- DSS (De ision Support System): Hệ thống hỗ tr quyết định
Phạm vi d liệu 30 - 60 ngày Tí h l y theo th i gian
Tổ ch c d liệu Theo h ng trình ng
d ng
Theo th i gian, theo ch
đề Quy mô d liệu Nhỏ đến lớn Lớn đến rất lớn
Nguồn d liệu D liệu tác nghiệp, d liệu
bên trong
D liệu tác nghiệp, d liệu bên trong, bên ngoài Hoạt động X lý t động lên d liệu Phân tích trên d liệu
Bảng 1.1: Phân biệt gi a hệ thống OLTP và DSS
1.2 Các phương pháp luận xây dựng hệ thống DW&BI
Có nhiều ph ng ph p tiếp n đã đ s ng và phổ iến trên thế giới Nh ng thông ng nhất là 3 ph ng ph p sau:
- Business-Wi e Data Warehouse (hay n gọi là Top-down)
- Indepen ent Data Marts (hay n gọi là Bottom-up)
- Inter onne te Data Marts (hay n gọi là Spiral)
Trang 14Hình 1.3: C ph ng ph p lu n xây d ng DW&BI
1.2.1 Phương pháp luận Top-down
X y ng kho liệu theo ph ng ph p lu n Top- own là x y ng kho liệu “đầy đ ” x y ng ngay và một lần kho liệu đ p ng đ tất ả hoặ phần lớn nh ng nhu ầu khai th thông tin ph n tí h và l p o hiến l a mọi đối
t ng s ng Một lần thiết kế ho toàn ộ hệ thống và th hiện x y ng toàn ộ
nh thiết kế
1.2.2 Phương pháp luận Bottom-up
Ph ng ph p Bottom-up x y ng t ng kho liệu ho mỗi h đề riêng iệt
và độ l p đ p ng đ nhu ầu khai th thông tin ph n tí h và l p o hiến
l a một hoặ một số ph ng an thể trong tổ h / oanh nghiệp Với mỗi h
đề thông tin nghiệp v ph t sinh là một lần thiết kế và x y ng riêng iệt
1.2.3 Phương pháp luận Spiral
Ph ng ph p Spiral là ph ng ph p x y ng ần t ng kho liệu ho mỗi
ch đề a trên mô hình xo y trôn ố mỗi kho liệu h đề ó khả n ng tí h h p lại thành một Kho liệu đầy đ
Sau khi ph n tí h nghiệp v m tổng thể a toàn ộ oanh nghiệp liệt kê anh
s h h đề thông tin ần x y ng kho Sau đó sẽ thiết kế và x y ng ần ho
t ng kho h đề a trên thiết kế tổng thể a toàn tổ h / oanh nghiệp Th t a việ x y ng các kho h đề sẽ đ a trên tính quan trọng a nghiệp v và tính
hiệu quả
Trang 151.2.4 Ưu/Nhược điểm của từng phương pháp
D ới đ y là ảng ph n tí h nh ng u điểm và nh điểm a t ng ph ng
đ nhu ầu về thông tin nghiệp v tổng h p a mọi đối t ng s ng
- R i ro ao o th i gian th hiện
n l u (2-4 n m) và hi phí an đầu rất lớn và nghiệp v ị thay đổi ngay trong quá trình triển khai
- Chi phí an đầu ho việ
x y ng t ng kho liệu thấp
- Không đ p ng đ nhu ầu khai
th thông tin m tổng thể a tổ
h / oanh nghiệp
- D liệu ị th a nhiều o đó tính nhất qu n không ao
- Chi phí ảo trì v n hành hàng
n m lớn
- Chi phí ho việ “tí h h p” thành một hệ thống tổng thể là rất lớn
- Cần th i gian ho việ ph n tí h tổng thể trong giai đoạn đầu a
Bảng 1.2: Ưu nh điểm c a ph ng ph p x y ng DW&BI
Trang 161.2.5 Cơ sở lựa chọn phương pháp luận
Việ l a họn ph ng ph p tiếp n để x y ng một hệ thống Kho liệu là một quyết định quan trọng Ngoài việ a vào nh ng ph n tí h u điểm nh điểm
nh đã nêu ở trên quyết định l a họn ần a trên yếu tố kh nh :
- Nhu ầu khai th thông tin ph n tí h l p o o hiến l a t ng loại đối t ng s ng - m độ u tiên đối với t ng loại đối t ng và t ng loại yêu ầu
- Kiến tr hạ tầng / sở v t hất hiện tại
- Kinh phí
- Công nghệ
- Khả n ng hỗ tr ung ấp ị h v a đối tác
- Khả n ng a đội ng nội tại (ng i s ng và nh n viên kĩ thu t)
Thông th ng oanh nghiệp / tổ h ó quy mô v a và nhỏ và ó nghiệp
v ổn định hay họn ph ng ph p tiếp n Top-Down (hay Business-Wide Data Warehouse) Với oanh nghiệp và tổ h lớn ó nhiều ph ng an hi nh nh kh nhau và ó nhu ầu khai th thông tin rộng lớn a ng i s ng ên ngoài th ng họn ph ng ph p tiếp n Spiral (hay Inter onne te Data Marts).Ph ng ph p
In epen ent Data Marts rất ít đ s ng Đối với ng n hàng và tổ h tài hính lớn nên họn theo ph ng ph p tiếp n Spiral
1.3 Thiết kế logic một hệ thống DW&BI
1.3.1 Phạm vi công việc và phương pháp thực hiện
1.3.1.1 Phạm vi công việc
Thiết kế logi đ a ra mô hình tổng thể và hi tiết thành phần a hệ thống
nh ng ở m logi ( h a gắn với ông nghệ thể) mô tả ấu tr a ảng liệu quan hệ liệu gi a ảng quan hệ gi a thành phần trong hệ thống … với m tiêu là hệ thống sẽ đ p ng đ nhu ầu thông tin a ng i ùng đã x định ở giai đoạn khảo s t và ph n tí h
Đầu vào của giai đoạn thiết kế logic là ộ tài liệu kết quả a nh ng giai đoạn
tr ớ : Khảo s t Ph n tí h Nh ng tài liệu đầu vào hính ho giai đoạn thiết kế logi
ao gồm:
- B o o khảo sát:
Hiện trạng a việ ung ấp thông tin
C nhu ầu thông tin trong t ng lai
Hiện trạng liệu nguồn
Hiện trạng hạ tầng thông tin
- Tài liệu ph n tí h
Trang 17 M độ đ p ng nhu ầu thông tin: về nội ung và về ph ng
Nội ung ông việ a giai đoạn thiết kế logi :
- Thiết kế mô hình tổng thể a hệ thống (ở m logi h a gắn với ông nghệ thể)
- Thiết kế hi tiết t ng thành phần (ở m logi h a gắn với ông nghệ thể
C kết quả a giai đoạn thiết kế logi :
- Tài liệu thiết kế logi a hệ thống với nội ung hính
- Thiết kế CSDL trung huyển ( DSA nguồn và DSA đí h)
- Thiết kế Meta ata
- Thiết kế tiến trình ETL:
Chuyển liệu t Data Sour e sang DSA
Chuyển liệu t DSA sang EM
Chuyển liệu t EM sang DM
- Thiết kế tầng khai thác và phân tích thông tin
Thiết kế CSDL đa hiều (OLAP)
Thiết kế tầng liệu ng i ùng (En _User Layer)
1.3.2 Thiết kế tổng thể
1.3.2.1 Mô hình logic tổng thể của hệ thống
Tùy theo t ng n thể mô hình logi tổng thể ó thể kh nhau nh ng
nhìn hung một hệ thống DW và BI điển hình sẽ đ thể hiện nh hình 1.4 ới đ y:
Trang 18DSA đích CSDL tác nghiệp
DSA nguồn
DSA nguồn
DSA nguồn
Cổng giao tiếp
user
End-Administration (Metadata và Quản trị hệ thống)
Hình 1.4: Mô hình logic tổng thể hệ thống DW&BI
1.3.2.2 Dữ liệu nguồn (Data source)
D liệu nguồn là đầu vào a toàn ộ hệ thống DW ao gồm một anh s h nguồn liệu đ l a họn để đ a vào kho liệu t p trung D liệu nguồn điển hình a DW là CSDL t nghiệp ên trong tổ h ung ấp số liệu hi tiết về giao ị h ph t sinh hàng ngày; CSDL này ó thể đ x y ng trên ông nghệ kh nhau (Ora le SQL Server Foxpro …)
Ngoài ra liệu nguồn ho DW ng ó thể ở ạng file (text xml ex el
…); ó thể là liệu nguồn ên ngoài tổ h (CSDL a tổ h liên kết quan nhà n ớ …)
1.3.2.3 Kho dữ liệutập trung (Data Warehouse)
Kho liệu tí h h plà thành phần trung t m a hệ thống là n i l u tr liệu
t p trung t nguồn về DW bao gồm một tập hợp các CSDL quan hệđ thiết kế
nhằm đảm ảo l u tr khối l ng lớn liệu đồng th i đ p ng tốt nhất nhu ầu tra u khai th liệu Trong DW có các CSDL sau:
- DSA: CSDL trung huyển h a liệu tạm th i a một phiên huyển liệu ph v ông việ x lý làm sạ h tr ớ khi đ a vào CSDL hính DSA ó hai loại:
DSA nguồn: h a liệu t ng ng với một nguồn thể ở ạng 1:1 về nội ung và ấu tr phạm vi liệu là một phiên
DSA đí h: h a liệu tổng h p t DSA nguồn phạm vi liệu là một phiên ấu tr DSA ở ạng thu n tiện ho việ huyển đổi liệu vào CSDL tí h h p
Trang 19- EM: CSDL tí h h p h a liệu a toàn ộ nguồn đó là liệu
đã đ x lý làm sạ h và tí h h p EM ần đảm ảo ung ấp đ liệu
1.3.2.4 BI: Tầng ứng dụng khai thác và phân tích thông tin
BI là một môi tr ng thu n tiện để ng i ùng nghiệp v làm việ với hệ thống ho phép ng i ùng h động khai th ph n tí h tạo o o hia sẻ thông tin … Thành phần BI này ao gồm:
- Lớp liệu nghiệp v : thu t ng /tên gọi ành ho ng i ùng nghiệp
v mỗi thu t ng t ng ng với tr ng liệu trong DM
- N i h a kết quả phân tích, báo cáo
- Meta ata: l u thông tin về nguồn liệu thông tin a CSDL thành phần trong kho liệu t p trung; thông tin quản lý tiến trình ETL
- C ông quản trị v n hành hệ thống (quản trị v n hành tiến trình
jo t động ông việ a kup/re overy…)
1.4 Thiết kế chi tiết từng thành phần
1.4.1.Thiết kế Data Warehouse (Kho dữ liệu tập trung)
1.4.1.1 Các mô hình CSDL trong thiết kế Data Warehouse
Trong thiết kế logi DW ó hai loại mô hình CSDL th ng đ s ng đó
là: mô hình sao và mô hình bông tuyết:
Star Schema (CSDL hình sao): là CSDL quan hệ đ thiết kế logi ạng hình
sao bao gồm một ảng liệu hi tiết ở vị trí trung t m quan hệ với ảng liệu anh m xung quanh (kiểu 1:N) Mỗi ảng anh m đều là ảng uy nhất a
Trang 20nh nh không ó quan hệ với ảng anh m nào kh Ví trong mô hình star sau
đ y ảng liệu trung t m thể hiện sản l ng và oanh số ảng anh m xung quanh là: kh h hàng sản phẩm kênh ph n phối th i gian M tiêu a mô hình sao
là truy vấn liệu đ nhanh nhất; hấp nh n th a liệu ở ảng anh m
Bán hàng (số lượng, tiền)
Kênh phân phối Sản phẩm
Thời gian Khách hàng
N N
1 1
(Fact Table) (Dimension Table)
Hình 1.5: Star Schema (CSDL hình sao)
Snowflake Schema (CSDL hình bông tuyết): là CSDL hình sao nh ng đã đ
huẩn hóa thành ạng huẩn 3: mỗi ảng anh m đ t h thành ảng anh
m ph n ấp (nếu ó) để đảm ảo không th a liệu Trong ví ới đ y
nh nh ảng Khách Hàng đã đ t h thành ảng ph n ấp M tiêu a mô hình
ông tuyết là kế th a việ truy vấn nhanh a mô hình sao; không để a th a liệu
Bán hàng (số lượng, tiền)
Kênh phân phối Sản phẩm
Thời gian Khách hàng
N N
1 1
(Fact Table) (Dimension Table)
Quốc gia 1 N
Loại hình
1
N Khu vực 1 N
1
N Khối
Hình 1.6: Snowflake Schema (CSDL hình bông tuyết)
1.4.1.2 Một số thuật ngữ thường dùng
Dimension Table (bảng Dimension): là ảng anh m trong CSDL hình sao
hoặ ông tuyết l u tr thông tin về đối t ng nh : kh h hàng sản phẩm th i gian … C tr ng a ảng imension ao gồm:
- Primary key: kiểu số (ví : id sản phẩm)
Trang 21- C tr ng thông tin thuộ tính (ví : mã sản phẩm, tên sản phẩm mã
h ng loại tên h ng loại …)
- Trong mô hình sao imension ta le n ó thêm tr ng sau:
C tr ng thông tin tổng h p (aggregate ata): gi trị tổng
h p và tính sẵn (ví : tổng số lượng, tổng tiền, số lượng lớn
nhất, số lượng nhỏ nhất, số lượng trung bình,…)
C tr ng thông tin n xuất ( erive ata): gi trị đ tính theo ông th a trên tr ng thông tin tổng h p đã ó
Fact Table (bảng Fact hay còn gọi là Master Table): là ảng trung t m trong
CSDL hình sao hoặ ông tuyết l u tr liệu hi tiết về giao ị h ph t sinh Trong ảng fa t tất ả tr ng đều ó kiểu liệu là kiểu số (hoặ kiểu ngày)
- C tr ng thông tin ph t sinh: kiểu số (ví Số lượng, Doanh thu, )
Slave Table: ảng liệu hi tiết ó quan hệ 1:1 với ảng fa t (Master Table),
ùng để l u tr ng liệu không phải kiểu số C tr ng a Slave Ta le ao gồm:
- Primary key: kiểu số (th ng trùng tên tr ng và ùng kiểu liệu với Primary Key a ảng fa t) ng đồng th i đóng vai tr Foreign Key trong quan hệ 1:1 với ảng fa t
- C tr ng thông tin không phải kiểu số (Ví : ghi chú, mô tả giao
dịch …)
- (Slave Ta le không ùng Foreign Key đến ảng imension)
Surrogate Key (khóa giả): là tr ng kiểu số ùng để làm Primary Key ho
ảng imension hoặ ảng fa t trong tr ng h p Primary Key gố a ảng này không phải là kiểu số hoặ là key tổ h p a nhiều tr ng
Measure (hay còn gọi là Fact): là nh ng thông tin ó thể đo l ng đ mỗi
measure t ng ng với một tr ng thông tin ph t sinh trong ảng fa t nh : Số lượng,
Doanh số,
Dimension (hay còn gọi là Chiều): là nh ng hiều tổng h p ph n tí h về
measure ví : chiều sản phẩm, chiều thời gian,…; thông tin về imension đ l u ở
ta le emension; trong liệu hi tiết ph t sinh imension hính là tr ng Foregn
Key a ảng fa t Dimension ao gồm một t p thuộ tính (attribute) đi kèm ví : imension Khách hàng ao gồm thuộ tính sau: mã khách hàng, tên khách
Trang 22hàng, mã quận huyện, tên quận huyện, mã tỉnh thành, tên tỉnh thành, mã loại hình, tên loại hình…
Level: ấp độ tổng h p liệu ên trong một imension; một level ao gồm
thuộ tính ngang ấp a một imension khi tổng h p liệu thì thuộ tính này ở
ùng một nhóm Ví : trong imension Khách hàng có 4 level sau:
- level Kh h hàng ao gồm 2 thuộ tính: mã khách hàng, tên khách hàng
- level Tỉnh thành ao gồm 2 thuộ tính: mã tỉnh thành tên tỉnh thành
- level Qu n huyện ao gồm 2 thuộ tính: mã qu n huyện tên qu n huyện
- level Loại hình ao gồm 2 thuộ tính: mã loại hình tên loại hình
Hierarchy: là một t p level ó quan hệ ph n ấp ên trong một imension;
trong một imension ó thể ó nhiều hiearar hy Hiearar hy là n để th hiện thao t trên liệu tổng h p: tổng h p lên (roll-up) hoặ hi tiết xuống ( rill-down)
Ví : trong dimension Khách Hàng, có 2 hierarchy sau:
- hieararchy Khách hàng - địa hỉ là: Khách hàng<<Ph ng/xã<<Qu n/huyện<<Tỉnh/thành
- hieararchy Khách hàng - loại hình là: Khách hàng<<Loại hình
- Thông tin: mỗi thông tin là một ảng số liệu với 2 thành phần:
- Phần measure: ột gi trị ằng số ( on số nghiệp v : sản l ng oanh thu …)
- Phần imension: ột thể hiện hiều ph n tí h (nh : sản phẩm th i gian …)
- Chủ đề thông tin: là t p h p thông tin ó hung phần measure
- Ví : h đề thông tin Sản Lượng Xuất Nhập Khẩu ao gồm o o về
sản l ng xuất nh p khẩu ( ùng là thông tin về sản l ng) nh ng mỗi o
o ó hiều ph n tí h kh nhau: quố gia hàng hóa hi …
1.4.1.3 Data Mart (DM): các CSDL chủ đề
Data Mart là CSDL đ thiết kế theo mô hình sao (nh đã nêu ở m a.) h a liệu về một h đề thông tin x định ph v một lớp đối t ng ng i ùng thể Trong một Kho liệu t p trung (DW) ó thể ó nhiều DM mỗi DM t ng ng với một h đề thông tin
D a trên kết quả đã ó t giai đoạn khảo s t và ph n tí h về nhu ầu thông tin a trên việ ph n tí h khả n ng ung ấp nh ng thông tin ó thể lấy ra t liệu nguồn (mặ ù ng i ùng h a yêu ầu) ớ để thiết kế DM ao gồm:
- X định danh sách các chủ đề thông tin mà hệ thống cần đáp ứng Mỗi h
đề thông tin ần ó nội ung sau:
Trang 23 C measure: gi trị số (nh ng on số nghiệp v nh : Số
lượng bán, Giá trị bán thể hiện h đề Tình Hình Bán Hàng)
C imension: hiều ph n tí h thông tin (ví : sản phẩm
a hàng th i gian …)
- Với mỗi h đề thiết kế một DM:
Vẽ s đồ th thể quan hệ (ERD mô hình sao)
- Với ảng fa t: th ng hia partition theo hiều th i gian (t là hia theo
tr ng FK link sang ảng imension th i gian)
- Với ảng imension lớn ó s t ng tr ởng liệu: hia partition theo
tr ng ó nhu ầu tìm kiếm h yếu (nếu x định đ )
Thiết kế giải ph p phi huẩn:
- Làm th a liệu để t ng tố độ th hiện u lệnh truy vấn ví : mview trong Oracle
Hình 1.7 d ới đ y là một ví về ERD a một Data Mart trong đó ó ảng
fa t DOANH_SO với 2 measure là Số lượng, Doanh số và 4 dimension là Thời gian,
Cửa hàng, Khách hàng, Sản phẩm:
Trang 24Hình 1.7: Ví d về Data Mart
1.4.1.4 Enterprise Model (EM): CSDL tích hợp
Enterprise Mo el là CSDL đ thiết kế theo mô hình ông tuyết (nh đã nêu ở
m a.) h a liệu tí h h p a tất ả h đề thông tin mà hệ thống ần đ p
ng ung ấp liệu ho tất ả Data Mart Trong một Kho liệu t p trung (DW) hỉ ó một EM nh ng ên trong EM này ó thể ó một hoặ nhiều ảng
fa t.D a trên ản thiết kế logi Data Mart đã ó ớ để thiết kế EM ao gồm:
- Ph n tí h ản thiết kế logi DM đã ó
- Chuẩn hóa và tí h h p ảng imension:
Mỗi DM ó một t p h p ảng imension mỗi ảng này ần đ huẩn hóa (t h ảng) thành ảng quan hệ theo ạng huẩn 3 để không ị th a liệu
Sau khi huẩn hóa nh ng ảng anh m nào t ng đ ng nhau ( ùng ý nghĩa nghiệp v ùng primary key …) thì tí h h p thành một ảng (primary key là hung tr ng thuộ tính là h p t hai ảng); nh ng ảng imension n lại đ gi nguyên ấu tr và nếu ó quan hệ thì tạo Foreign Key với ảng imension kh
- Tí h h p ảng fa t: Mỗi DM ó một ảng fa t mỗi ảng fa t ao gồm một số hoặ tất ả tr ng thông tin a một loại liệu nghiệp v thể
(ví : liệu hóa đơn bán hàng) Nh ng ảng fa t nào l u thông tin về
cùng một loại liệu (và ùng primary key) thì tí h h p thành một ảng
Trang 25(primary key là hung foreign key và tr ng measure là h p t hai ảng); nh ng ảng fa t n lại đ gi nguyên ấu tr
- Tí h h p ảng slave (nếu ó): t ng t và đi kèm với ảng fa t
- Vẽ s đồ th thể quan hệ (ERD mô hình ông tuyết ó thể ó nhiều ảng fact)
- Thiết kế ảng imension theo ạng huẩn 3
Hình 1.8 là một ví về ERD a một Enterprise Mo el trong đó ó 2 ảng
fact là Công nợ và Sản lượng doanh thu
Sản lượng doanh thu
Cửa hàng
Sản phẩm Thời gian
Khách hàng Công nợ
Chủng loại Tháng
Quý Năm
Hình 1.8: Ví d về Enterprise Model
Trang 261.4.1.5 Data Staging Area (DSA): CSDL trung chuyển
Data Staging Area (DSA) là một t p CSDL đóng vai tr trung huyển liệu gi a nguồn liệu với EM DSA là môi tr ng liệu trung gian l u tr tạm
th i liệu để x lý làm sạ h và tí h h p tr ớ khi đ a vào EM DSA chỉ l u tr tạm
th i a một phiên khi x lý xong thì xóa đi để huẩn ị x lý ho phiên tiếp theo Có hai loại DSA ao gồm:
- DSA đí h:là CSDL ó ấu tr t ng đ ng với EM (CSDL hình ông tuyết) là n i h a liệu kết quả uối ùng a giai đoạn x lý làm sạ h
và tí h h p tr ớ khi đ a vào EM Chỉ ó một DSA đí h
- DSA nguồn:là CSDL ó ấu tr t ng đ ng với liệu nguồn (mô hình CSDL quan hệ thông th ng) và h a liệu nguyên ản a nguồn (sau
đó mới x lý làm sạ h).Có nhiều DSA nguồn: ng với mỗi liệu nguồn
ần một DSA nguồn
C ớ th hiện thiết kế DSA
- Thiết kế DSA đí h ( a trên ản thiết kế EM đã ó):
Vẽ s đồ ERD ho DSA đí h giống với ERD a EM (nên tạo ảng trùng tên với ảng t ng ng trong EM)
Thiết kế ảng imension ảng fa t ảng slave giống nh trong EM
Thiết kế in ex: t ng nh in ex EM
- Thiết kế DSA nguồn:
Ph n tí h s đồ ERD a CSDL nguồn để nắm đ mối quan hệ liệu
gi a ảng liệu nguồn
Ph n tí h mối quan hệ liệu gi a ảng liệu nguồn với ảng trong DSA đí h t đó x định anh s h ảng tr ng sẽ đ a vào DSA nguồn
Vẽ s đồ ERD ho DSA nguồn ( a trên kết quả ph n tí h)
Thiết kế ảng ho DSA nguồn: ấu tr ảng a DSA nguồn
t ng đ ng với ấu tr ảng a CSDL nguồn (t ng đ ng về kiểu liệu a tr ng về primary key foreign key)
Thiết kế in ex trên tr ng Primary Key Foreign Key
1.4.1.6 Extraction - Transformation - Loading (ETL): Thu thập, làm sạch
Trang 27qua thành phần kh nhau và đến đí h ( DM) gi p ho liệu a hệ thống
DW đ p nh t định kỳ Trên th tế tình huống huyển đổi liệu t nguồn đến kho t p trung là rất đa ạng ph tạp … và vì thế ETL ng ó thể rất đa ạng và
ph tạp D ới đ y hỉ là một h hia t h ông đoạn x lý ên trong một tiến trình ETL theo đó oi ả hệ thống DW hỉ ó một tiến trình ETL và nó ao gồm ông đoạn x lý sau:
- Thu thập dữ liệu (Extraction): là ông đoạn khai th và đ a liệu t
nguồn vào CSDL trung huyển ( DSA nguồn) h a x lý gì đối với liệu
- Làm sạch và tích hợp (Transformation): là ộng đoạn ph tạp nhất x lý
liệu tại CSDL trung huyển x lý ao gồm:
Làm sạ h: huẩn hóa hoặ loại ỏ liệu không h p lệ không toàn vẹn
Tí h h p: tí h h p liệu t nhiều DSA nguồn về một DSA đí h tí h h p ảng liệu t ng đ ng nhau thành một ảng
- Loading (load dữ liệu): là ông đoạn loa liệu đã đ x lý t DSA
đí h sang EM hoặ t EM sang các DM
C n vào tài liệu khảo s t và ph n tí h về liệu nguồn n vào ản thiết
kế logi thành phần đã ó ( DM EM DSA đí h DSA nguồn) thiết kế tiến trình ETL theo ớ sau:
- Thiết kế h n ng huyển liệu vào kho t p trung (DW):
T EM sang DM
T DSA đí h sang EM
T DSA nguồn sang DSA đí h
- Thiết kế h n ng Thu th p liệu t nguồn vào DSA nguồn
- Thiết kế h n ng Làm sạ h ổ sung liệu (Làm sạ h ổ sung liệu tại DSA nguồn và Làm sạ h ổ sung liệu tại DSA đí h)
1.4.2 Thiết kế metadata
Meta ata là lớp liệu l u tr thông tin mô tả về hính thành phần a
DW Th hất việ thiết kế meta ata ho DW là thiết kế một CSDL quan hệ để l u
tr loại liệu sau:
- Cấu tr và ý nghĩa a t ng CSDL trong DW (Data Sour e DSA EM DM): mô tả về ảng tr ng ý nghĩa ngiệp v
- Quan hệ tham hiếu gi a tr ng ảng a CSDL kh nhau
- D liệu nghiệp v a en -user: gi trị số (measure) hiều thông tin ( imension) thuộ tính đi kèm (attri ute) ph n ấp (hiearar hy)
Trang 28- D liệu quản lý tiến trình ETL: liệu về t ng ông đoạn huyển đổi phiên th hiện …
- D liệu về tầng khai th và ph n tí h thông tin: ấu tr và ý nghĩa đ n
vị a lớp liệu tham hiếu; anh m kết quả đầu ra ( o o ph n
tí h) anh s h user và quyền truy p
1.4.3 Thiết kế tầng khai thác và phân tích thông tin
1.4.3.1 Thiết kế CSDL đa chiều với OLAP
Nhìn hung m đí h h ớng đến a việ thiết kế DW là ra đ DM Về mặt logi DM đ thiết kế theo ý t ởng đa hiều với ảng anh m ( hiều) xoay quanh ảng liệu hi tiết về giao ị h ph t sinh; kiểu thiết kế này
gi p đ p ng nhanh và linh hoạt nhu ầu thông tin đang ạng đa hiều a ng i ùng Nh ng về ản hất l u tr liệu DM v n là một t p ảng liệu quan hệ ( ảng với 2 hiều ng và ột) để đ a ra đ o o đa hiều ần th hiện
u lệnh truy vấn (SQL) để join ảng với nhau.Để tạo s thu n tiện và h động ho ng i ùng uối đồng th i t ng tố độ đ p ng nhu ầu thông tin ần tạo thêm một lớp liệu n a ở ạng tính to n sẵn và gần g i h n với nhu ầu thông tin a ng i ùng lớp liệu đó hính là OLAP
OLAP là tầng liệu phía trên DM ó ấu tr l u tr đặ iệt (không s
ng ảng quan hệ thông th ng) để l u tr liệu đa hiều ở ạng tính to n sẵn liệu này rất gần với nhu ầu thông tin a ng i ùng.Với OLAP ng i ùng hỉ ần họn và lấy ra thông tin mình ần ( imension measure) để
th hiện việ o o và ph n tí h vì thông tin này đã đ tính to n sẵn trong OLAP.OLAP đ tổ h thành OLAP u e (Khối liệu đa hiều) mỗi OLAP
u e ph v một nhóm nhu ầu thông tin a ng i ùng T ng ng với một h đề thông tin (DM) ó thể tạo ra nhiều OLAP u e Ngoài ra tùy thuộ nhu ầu ph n tí h thông tin ng ó thể tạo ra một OLAP u e t DM kh nhau.C n vào việ
ph n tí h nhu ầu thông tin a ng i ùng n ản thiết kế DM thiết kế tầng liệu OLAP theo ớ sau:
- X định anh s h OLAP u e a trên nhóm nhu ầu thông tin đã iết
- Thiết kế t ng OLAP u e:
Trang 291.4.3.2 Thiết kế tầng khai thác và phân tích thông tin
Tầng khai th và ph n tí h thông tin là môi tr ng thu n tiện và an toàn để
ng i ùng t ng t với hệ thống môi tr ng này ao gồm thành phần sau:
- Lớp liệu tham hiếu: Là một ấu tr l u tr x định mối quan hệ tham hiếu gi a thu t ng nghiệp v ( a ng i ùng uối) với đối t ng liệu tin họ ( ảng tr ng) Lớp này đóng vai tr ầu nối để
ng i ùng uối ó thể khai th đ liệu a CSDL trong DW ằng h l a họn và kéo thả thông tin nghiệp v mình ần thay vì việ viết u lệnh truy vấn SQL
- Lớp thông tin kết quả: Là t p h p file kết quả o o ph n tí h … a
ng i ùng và đ l u tại th m x định
- C ông khai th và ph n tí h thông tin: Là h ng trình ng ng
để ng i ùng ph n tí h l p o o và hia sẻ thông tin
- Cổng thông tin:Là giao iện để ng i ùng truy p hệ thống và lấy thông tin kết quả.Ví : we portal ms offi e …
Trang 30CHƯ NG II BÀI TOÁN ĐẦU TƯ PHÁT TRIỂN HỆ THỐNG HỖ TRỢ
RA QUYẾT ĐỊNH TẠI NGÂN HÀNG NÔNG NGHIỆP VÀ PHÁT
TRIỂN NÔNG THÔN VIỆT NAM
Phần này ph n tí h ối ảnh định h ớng ph t triển CNTT aNgân hàng Nông nghiệp; đ nh gi hiện trạng hạ tầng kỹ thu t ng nh ng ng CNTT tại Ngân hàng Nông nghiệp; ph n tí h nhu ầu yêu ầu ần thiết đối với Kho liệu và hệ thống hỗ
tr ra quyết định t đó nêu t s ần thiết phải đầu t x y ng Kho liệu tại Ng n hàng Nông nghiệp D a trên yêu ầu đối với Kho liệu đã ph n tí h nêu ra m tiêu đầu t a n đồng th i đ a ra thiết kế s ộ a hệ thống
2.1 Bối cảnh xây dựng dự án
2.1.1 Xu hướng xây dựng DW&BI
Nhu ầu mở rộng và ph t triển giải ph p Data Warehouse và Business Intelligen e sẽ ngày àng lớn mạnh nhất là trong ối ảnh kinh tế xã hội nh hiện tại
sẽ uộ tổ h tài hính/ng n hàng/ oanh nghiệp phải tối u hóa hoạt động
a mình và đ a ra quyết định nhanh hóng hính x Tại Việt Nam rất nhiều
Ng n hàng lớn đã và đang x y ng DW&BI Ví :
- Tháng 4/2011, Ngân hàng Ng n hàng TMCP Sài G n Th ng Tín (Sa om ank) là ng n hàng TMCP Việt Nam đầu tiên hính th ông ố triển khai thành ông n DW&BI trên nền tảng ông nghệ Ora le hạy trên hệ thống m y h Ora le Exa ata
- Th ng 09/2013 VietinBank và liên anh ETC & Te h Mahin ra đã ký kết
h p đồng gói thầu Mua sắm và triển khai giải ph p Kho liệu oanh nghiệp EDW tại VietinBank
- Th ng 10/2013 FSS đã ký h p đồng với Ng n hàng Đầu t và Ph t triển Việt Nam ung ấp Hệ thống Data warehous trên nền tảng IBM Data Mo el
ho n Triển khai hệ thống B o o thống kê t p trung
2.1.2 Hiện trạng hệ thống CNTT tại Ngân hàng Nông nghiệp
T n m 2009 Ng n hàng Nông nghiệp đã ắt đầu h trọng đầu t x y ng hệ thống CNTT Đến nay Trung t m CNTT a Ng n hàng Nông nghiệp đang quản lý 7
Trang 31Đ t h ra t hệ thống IPCAS2 Oracle Server 2012 INTERNET
và IPCAS2 Hàng tháng, quý, các chi nh nh sẽ lấy o o t ng ng tổng h p hỉnh s a theo m u iểu ó sẵn Sau đấy g i o o lên ho Ban tr thuộ
Tr sở hính C Ban lại tổng h p liệu a tất ả hi nh nh sau đấy g i o
o lên ho Ch tị h hội đồng quản trị và Ban gi m đố
CHỦ TỊCH HĐQT, BAN GIÁM ĐỐC
CÁC BAN TRỰC THUỘC TRỤ SỞ
MẠNG LƯỚI CHI NHÁNH
Hình 2.1: Mô hình báo cáo hiện tại c a Ngân hàng Nông nghiệp
Trang 322.2 Đánh giá về hệ thống báo cáo (MIS) hiện tại
Hệ thống MIS là một hệ thống thông tin o o hiện tại mới hỉ tí h h p h yếu nguồn liệu t hệ thống CoreBank Ngoài ra n nhiều nguồn liệu h a đ tí h
h p nh liệu về Thẻ Internet Banking Thu ng n s h nhà n ớ
Hệ thống MIS hiện tại đ p ng nhu ầu n ản về o o quản trị và o o tu n
th ung ấp loại o o theo quy định hoạt động kinh oanh a Agri ank NHNN; Cung ấp đ một số o o ph n tính nh Nguồn vốn D n lãi suất ình
qu n tỷ lệ an toàn vốn khả n ng hi trả…; Cung ấp o o động về hoạt động kinh oanh a Agri ank
Hệ thống MIS hiện tại x lý l ng liệu lớn h n rất nhiều so với ng n hàng
kh D liệu hiện tại khoảng 36TB t ng tr ởn liệu trong 9 th ng đầu n m khoảng 9TB
Thiếu kiến tr v ng hắ mô hình liệu phù h p(DataMo el) nên khả n ng đ p
ng o o ph n tí h theo hiều s u n hạn hế C hế và ông tí h h p liệu ETL n thiếu Tốn th i gian ho việ đối hiếu và ph t triển o o Chất l ng liệu h a đ nhất qu n Nhiều hệ thống ung ấp liệu và o o không đ đồng ộ
Thiếu o o quản lý ấp ao và ph n tí h ó gi trị thể là hệ thống Mis
h a ó o o ph n tí h với nhiều tiêu hí đan xen ph n tí h o hoặ là
nh ng o o ần kết h p với nguồn liệu ên ngoài Nh ng ph n tí h kiểu
“what - if” ( tình huống nào ó thể xảy ra với t ng tình huống thể) ví nh nếu
t ng lãi suất thêm 1% thì tổng n tiền vay sẽ t ng hay giảm so với n m ngo i
2.3 Sự cần thiết phải đầu tư
Qua đ nh gi s ộ về các ng ng và hệ thống o o hiện tại a Ngân hàng Nông nghiệp ó thể nh n thấy:
- Hệ thống o o hiện tại là một hệ thống mang tính giải ph p tình thế nhằm giảm tải ho hệ thống t nghiệp
- Thiếu kiến tr v ng hắ mô hình liệu phù h p
- Thiếu o o quản lý ấp ao và ph n tí h ó gi trị
Trong khi đó Ng n hàng Nông nghiệp là một tổ h tín ng lớn ó m độ t ng
tr ởng liệu ao ùng với đó là mong muốn đ khai th s u h n vào liệu để
ó thể ra nh ng quyết định hính x nhất Việ x y ng DW&BI là nhu ầu ấp thiết a Ng n hàng Nông nghiệp DW&BI sẽ ung ấp một h ớng tiếp n liệu tốt
h n triệt để h n và giảm thiểu xung đột ng nh hạn hế s xuống ấp trong môi
tr ng hoạt động hiện tại a Ng n hàng Nông nghiệp