1. Trang chủ
  2. » Thể loại khác

NGHIÊN CỨU BÀI TOÁN XÂY DỰNGKHO DỮ LIỆU VÀ HỆ THỐNG HỖ TRỢ RA QUYẾT ĐỊNHTẠI NGÂN HÀNG NN VÀ PT NÔNG THÔN VIỆT NAM LUẬN VĂN THẠC SĨ

64 5 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 64
Dung lượng 1,43 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

ĐẠI HỌC QUỐC GIA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN LÊ MẠNH TUẤN NGHIÊN CỨU BÀI TOÁN XÂY DỰNGKHO DỮ LIỆU VÀ HỆ THỐNG HỖ TRỢ RA QUYẾT ĐỊNHTẠI NGÂN HÀNG NÔNG NGHIỆP VÀ PHÁT TRIỂN NÔNG THÔN

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI

VIỆN CÔNG NGHỆ THÔNG TIN

LÊ MẠNH TUẤN

NGHIÊN CỨU BÀI TOÁN XÂY DỰNGKHO DỮ LIỆU VÀ HỆ THỐNG HỖ TRỢ RA QUYẾT ĐỊNHTẠI NGÂN HÀNG NÔNG NGHIỆP VÀ PHÁT

TRIỂN NÔNG THÔN VIỆT NAM

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

Hà Nội - 2015

Trang 2

ĐẠI HỌC QUỐC GIA HÀ NỘI

VIỆN CÔNG NGHỆ THÔNG TIN

LÊ MẠNH TUẤN

NGHIÊN CỨU BÀI TOÁN XÂY DỰNGKHO DỮ LIỆU VÀ HỆ THỐNG

HỖ TRỢ RA QUYẾT ĐỊNHTẠI NGÂN HÀNG NÔNG NGHIỆP

VÀ PHÁT TRIỂN NÔNG THÔN VIỆT NAM

Ngành: Công nghệ thông tin

Chuyên ngành: Quản lý hệ thống thông tin

Mã số: Chuyên ngành đào tạo thí điểm

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC:PGS TS Nguyễn Đình Hóa

Hà Nội - 2015

Trang 3

LỜI CAM ĐOAN

Tôi xin am đoan đ y là ông trình nghiên u a riêng tôi

C số liệu kết lu n đ đ a ra trong lu n v n là trung th

ó nguồn gố r ràng

T giả lu n v n

Lê Mạnh Tuấn

Trang 4

LỜI CẢM N

Để hoàn thành đ hoàn thành đ ông trình nghiên u này ngoài s nỗ

l a ản th n t giả n nh n đ s gi p đ rất lớn t PGS.TS Nguyễn Đình Hóa, ng i đã luôn quan t m tr h nhiệm và nhiệt tình h ớng n gi p đ động viên

t giả trong qu trình th hiện nghiên u a mình T giả xin g i l i ảm n h n thành tới PGS.TS Nguyễn Đình Hóa

T giả ng xin tr n trọng ảm n thầy ô trong Viện Cộng nghệ thông tin – Đại họ Quố Gia Hà Nội ạn đồng nghiệp lãnh đạo và n ộ nh n viên Ng n hàng Nông nghiệp và ph t triển Nông thôn Việt Nam và ạn lớp Cao họ CIO2 đã

gi p đ t giả trong suốt th i gian họ t p và nghiên u lu n v n a mình

Để đạt đ nh ng kết quả nghiên u tốt h n trong t ng lai t giả rất mong tiếp t nh n đ s h ớng n gi p đ a nhà huyên môn a thầy ô trong Viện Công nghệ thông tin – Đại họ Quố Gia Hà Nội về ph ng ph p lu n

h th tiếp n khoa họ và h p lý

T giả lu n v n

Lê Mạnh Tuấn

Trang 5

MỤC LỤC

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT 8

DANH MỤC CÁC HÌNH VẼ ĐỒ THỊ 8

DANH MỤC CÁC BẢNG, BIỂU 9

PHẦN MỞ ĐẦU 1

CHƯƠNG I GIỚI THIỆU VỀ DW&BI 3

1.1 Các khái niệm ản 3

1.1.1 Data Warehouse và BI là gì? 3

1.1.2 C đặ tr ng về mặt d liệu c a một hệ thống DW&BI 4

1.1.3 Phân biệt gi a hệ thống OLTP và hệ thống DSS 4

1.2 C ph ng ph p lu n xây d ng hệ thống DW&BI 5

1.2.1 Ph ng ph p lu n Top-down 6

1.2.2 Ph ng ph p lu n Bottom-up 6

1.2.3 Ph ng ph p lu n Spiral 6

1.2.4 Ưu/Nh điểm c a t ng ph ng ph p 7

1.2.5 C sở l a chọn ph ng ph p lu n 8

1.3 Thiết kế logic một hệ thống DW&BI 8

1.3.1 Phạm vi công việ và ph ng ph p th c hiện 8

1.3.2 Thiết kế tổng thể 9

1.4 Thiết kế chi tiết t ng thành phần 11

1.4.1 Thiết kế Data Warehouse (Kho d liệu t p trung) 11

1.4.2 Thiết kế metadata 19

1.4.3 Thiết kế tầng khai thác và phân tích thông tin 20

CHƯƠNG II BÀI TOÁN ĐẦU TƯ PHÁT TRIỂN HỆ THỐNG HỖ TRỢ RA QUYẾT ĐỊNH TẠI NGÂN HÀNG NÔNG NGHIỆP VÀ PHÁT TRIỂN NÔNG THÔN VIỆT NAM 22

2.1 Bối cảnh xây d ng d án 22

2.1.1 Xu h ớng xây d ng DW&BI 22

2.1.2 Hiện trạng hệ thống CNTT tại Ngân hàng Nông nghiệp 22

2.2 Đ nh gi về hệ thống báo cáo (MIS) hiện tại 24

2.3 S cần thiết phải đầu t 24

2.3 M tiêu đầu t 25

2.3.1 M c tiêu chung 25

2.3.2 M c tiêu c thể 25

2.4 Yêu cầu n ng l c s bộ c a hệ thống 26

2.5 Yêu cầu về các thiết bị phần c ng 27

2.6 Quan điểm th c hiện d án 27

2.7 D kiến quy mô đầu t 28

2.8 Thiết kế s ộ 28

2.8.1 Mô hình tổng thể 28

2.8.2 Thiết kế mô hình v t lý c a hệ thống 31

2.8.3 Giải pháp tích h p hệ thống 31

2.8.4 Giải ph p đồng bộ d liệu 32

CHƯƠNG III ĐỀ XUẤT DỰ ÁN XÂY DỰNG KHO DỮ LIỆU VÀ HỆ THỐNG HỖ TRỢ RA QUYẾT ĐỊNH 33

3.1 C n l a chọn giải pháp xây d ng DW&BI 33

3.2 Phân tích l a chọn giải pháp 33

Trang 6

3.2.1 Giải pháp DW&BI c a IBM 34

3.2.2 Giải pháp DW&BI c a Oracle 36

3.2.3 Giải pháp DW&BI c a SAP 38

3.2.4 Đ nh gi về tính n ng a ba giải pháp 44

3.3 Giải ph p đ c l a chọn 45

3.4 D trù kinh phí và nguồn vốn đầu t 46

3.4.1 C n l p tổng m đầu t 46

3.4 2 Chi phí mua sắm và triển khai 46

3.4.3 Các chi phí quản lý 47

3.4.4 Chi phí d phòng 47

3.4.5 Tổng m đầu t 47

KẾT LUẬN 48

TÀI LIỆU THAM KHẢO 49

PHỤ LỤC 50

PHỤ LỤC 1: Danh sách báo cáo Phân theo nghiệp v tại NHNo 50

PHỤ LỤC 2: Bảng đ nh gi yêu ầu ch n ng đối với ng i s d ng cuối 52

PHỤ LỤC 3: Bảng đ nh gi yêu ầu ch n ng đối với ng i quản trị và v n hành 54

PHỤ LỤC 4: Bảng đ nh gi yêu ầu ch n ng đối với ng i phát triển/ xây d ng và triển khai 56

Trang 7

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT

1 BOE Sản phẩm BI a SAP - Business Object

5 DW&BI Data warehouse & Business Intelligence

6 ETL Thu th p làm sạ h và tí h h p liệu (Extraction

– Transformation - Loading)

7 IBM Công tyInternational Business Machines

7 NHNo Ng n hàng Nông nghiệp và ph t triển Nông thôn

Việt Nam

8 OLTP Hệ thống x lý giao ị h tr tuyến (OnLine

Transaction Processing)

9 ORACLE Công ty Oracle

11 SAP Công ty phần mềm đa quố gia Đ (Systems

Applications and Products)

Hình 1.6: Snowflake S hema (CSDL hình ông tuyết) 21

Hình 2.1: Mô hình o o hiện tại a Ng n hàng Nông nghiệp 32 Hình 2.2: thông tin theo đối t ng ng i s ng 34 Hình 2.3: Mô hình thiết kế tổng thể hệ thống DW&BI 38 Hình 2.4: Thiết kế mô hình v t lý hệ thống DW&BI 39

Trang 8

Bảng 3.1: Chi phí trang thiết ị phần ng a giải ph p IBM 43 Bảng 3.2: Chi phí phần mềm tiêu huẩn a giải ph p IBM 43 Bảng 3.3: Chi phí đào tạo và triển khai a giải ph p IBM 44

Bảng 3.5: Chi phí trang thiết ị phần ng a giải ph p Ora le 45 Bảng 3.6: Chi phí phần mềm tiêu huẩn a giải ph p Ora le 45 Bảng 3.7: Chi phí đào tạo và triển khai a giải ph p Ora le 46

Bảng 3.9: Chi phí trang thiết ị phần ng a giải ph p SAP 49 Bảng 3.10: Chi phí phần mềm tiêu huẩn a giải ph p SAP 51 Bảng 3.11: Chi phí đào tạo và triển khai a giải ph p SAP 52

Bảng 3.15: So s nh tổng hi phí a a giải ph p 54 Bảng 3.16: D trù tổng hi phí mua sắm và triển khai 54

Trang 9

PHẦN MỞ ĐẦU

Cơ sở khoa học và thực tiễn của đề tài

Trong nền kinh tế hiện nay thông tin là yếu tố sống n đối với ất kỳ oanh nghiệpnào.Việ nắm ắt thông tin gi p ho oanh nghiệp hoạ h định hiến

l kinh oanh ho mình một h hính x

Trong nh ng n m gần đ y ông nghệ kho liệu ra đ i đ p ng đ nhu ầu quản lý l u tr thông tin ó khối l ng lớn và ó khả n ng khai th liệu đa hiều

và theo hiều s u nhằm hỗ tr việ ra quyết định a nhà quản lý

Nguồn d liệu đối với các t p đoàn công nghệ, tài chính, ngân hàng là vô cùng lớn Xây d ng một kho d liệu cho phép rút trích tài nguyên, tính toán theo yêu cầu đểcung cấp các báo cáo d a vào c sở d liệu hoạt động ph c v sản xuất, kinh doanh trở nên thông minh h n, t ng thêm chất l ng và tính linh hoạt c a việc phân tích kinh doanh có chất l ng cao và ổn định

Đối với oanh nghiệp n ớ ngoài họ đã p ng kho liệu trong quản lý

ph n tí h liệu và đã ho thấy hiệu quả to lớn gi p í h ho việ hoạ h định hiến

l kinh oanh ng nh nghiên u ph t triển ng ng ph n tí h liệu

Tại Ng n hàng Nông nghiệp và ph t triển Nông thôn Việt Nam (NHNo) việ

x y ng kho liệu và hệ thống hỗ tr ra quyết định là rất ần thiết Kho liệu sẽ thu th p liệu t hệ thống nghiệp v ung ấp thông tin h u í h cho các nhà quản lý ó thể ó nh ng thông tin hính x nhanh hóng hỗ tr ho việ ra quyết định kịp th i và ó l i nhất ho hoạt động tín ng a NHNo Ngoài ra kho liệu

c n hỗ tr trong công việ quản trị r i ro tín ng – một vấn đề hết s quan trọng trong ối ảnh khó kh n hiện tại a ng n hàng

Xuất ph t t nhu ầu th tế tại NHNo lu n v n nghiên u ài to n x y ng kho liệu và hệ thống hỗ tr ra quyết định (DW&BI) tại Ng n hàng Nông nghiệp và

ph t triển Nông thôn Việt Nam với mong muốn đ a ra một n khả thi nhằm x y

ng kho liệu hoàn hỉnh hỗ tr ho việ quản lý và ra quyết định tại NHNo

Mục tiêu đề tài

X y ng n khả thi để triển khai kho liệu và hệ thống hỗ tr ra quyết định đ p ng yêu ầu nghiệp v thông minh tại NHNo

Phạm vi và đối tượng của đề tài:

- Đối t ng nghiên u: Kho liệu và hệ thống hỗ tr ra quyết định ho hoạt động nghiệp v ng n hàng tại NHNo

- Phạm vi p ng: đề tài đ p ng tại NHNo

Kết quả của đề tài

Trang 10

Một nghiên u n khả thi x y ng Kho liệu và hệ thống hỗ tr ra quyết định tại Ng n hàng Nông nghiệp và ph t triển Nông thôn Việt Nam trình ày đầy đ

sở ph ng ph p lu n l a họn giải ph p ớ x y ng thiết kế hệ thống DW&BI ng nh tổng m đầu t ho n

Kết cấu của đề tài

Đề tài đ kết ấu gồm 3 phần ( h ng) hính trong đó:

Phần mở đầu:

Giới thiệu yêu ầu kh h quan h quan sở th tiễn nghiên u và x y

ng đề tài

Chương I: Giới thiệu về DW&BI

Nội ung hính a h ng này trình ầy kh i niệm ản về kho liệu

Đ a ra m tiêu đầu t yêu ầu n ng l s ộ a hệ thống

Đ a ra ản thiết kế logi ản thiết kế v t lý để x y ng kho liệu và hệ thống hỗ tr ra quyết định

Chương III:Đề xuất dự án xây dựng kho dữ liệu và hệ thống hỗ trợ ra quyết định

Đ a ra n để ph n tí h l a họn giải ph p đồng th i ph n tí h hi tiết

về a giải ph p phổ iến đ ng đầu về DW&BI qua đó khuyến nghị giải ph p kỹ thu t ông nghệ s ng trong n và trù tổng kinh phí a n

Phần kết luận: Kết luận tổng thể về luận văn

Đ a ra nh ng điều làm đ nh ng điều h a làm đ và h ớng ph t triển

a lu n v n

Trang 11

CHƯ NG I GIỚI THIỆU VỀ DW&BI

Ch ng này đ a ra kh i niệm ản về Data Warehouse và BI T đó tìm ra

ph ng ph p phù h p để x y ng DW&BI tại Ng n hàng Nông nghiệp

1.1 Các khái niệm cơ bản

1.1.1 Data Warehouse và BI là gì?

Data Warehouse (viết tắt là DW n gọi là Kho D Liệu) là hệ thống t p trung liệu nhằm m đí h khai th ph n tí h thông tin và hỗ tr quyết định với đặ

tr ng về mặt liệu là: tí h h p h ớng h đề tí h l y theo th i gian và ất iến

Business Intelligence (viết tắt là BI) là tầng ng ng khai th liệu và ph n

tí h thông tin t nguồn liệu kh nhau mà tiêu iểu trong đó hính là DW với thiết kế CSDL đa hiều (OLAP) Tầng ng ng BI này ao gồm liệu meta ata h ng trình ng ng ông phần mềm… nhằm m đí h đ a kết quả o o ph n tí h nghiệp v … đến tr tiếp ng i ùng uối (nh ng

Trang 12

- Data Warehouse (Kho d liệu t p trung): bao gồm CSDL tích h p và các

CSDL ch đề

- BI:tầng ng d ng khai thác và phân tích thông tin hỗ tr quyết định; các

end-user t ng tác với hệ thống qua tầng BI này

- Administration: Metadata và quản trị hệ thống

reports

information

knowledge CSDL tích hợp

CSDL chủ đề

CSDL chủ đề

CSDL chủ đề Files

h ớng h đề tí h l y theo th i gian ất iến

- Tích hợp (Integrated): D liệu a DW đ t p h p về t nguồn

kh nhau nh CSDL a hệ thống t nghiệp file tài liệu …

- Hướng chủ đề (Subject-Oriented): D liệu a DW đ tổ h và l u

tr theo h đề nghiệp v mà ng i khai th quan t m

- Tích lũy theo thời gian (Time-Variant): D liệu l u tr ó tính hất lị h

s theo ng th i gian tính t một th i điểm trong qu kh ho đến hiện tại và liệu sẽ ph t sinh trong t ng lai

- Bất biến (Non-Volatile): D liệu đã đ a vào trong DW nói hung ở ạng

read-only và rất hiếm khi thay đổi (không up ate không elete) DW hính là nh ng CSDL đ thiết kế ho m đí h Khai th và Ph n tí h thông tin (query truy vấn) h không phải m p nh t (up ate elete)

nh trong CSDL a ng ng t nghiệp

1.1.3 Phân biệt giữa hệ thống OLTP và hệ thống DSS

- OLTP (OnLine Transa tion Pro essing): Hệ thống x lý giao ị h tr tuyến Đặ tr ng a ng ng OLTP là t v t động ghi hép

Trang 13

liệu để x lý nghiệp v a một tổ h nh ghi nh n đ n đặt hàng hoặ giao ị h ng n.C t v này th ng đọ hoặ p nh t một vài ng liệu a trên kho hính a h ng Nh ng t v đó ó ấu tr đ lặp lại ao gồm giao ị h ngắn tối giản và t h iệt yêu ầu liệu hi tiết

và mới nhất C sở liệu t nghiệp ó kí h th ớ t vài tr m mega yte đến hàng giga yte và hỉ l u tr liệu hiện hành (v ng đ i liệu ngắn) C sở liệu ó tính nhất qu n khả n ng ph hồi ao

- DSS (De ision Support System): Hệ thống hỗ tr quyết định

Phạm vi d liệu 30 - 60 ngày Tí h l y theo th i gian

Tổ ch c d liệu Theo h ng trình ng

d ng

Theo th i gian, theo ch

đề Quy mô d liệu Nhỏ đến lớn Lớn đến rất lớn

Nguồn d liệu D liệu tác nghiệp, d liệu

bên trong

D liệu tác nghiệp, d liệu bên trong, bên ngoài Hoạt động X lý t động lên d liệu Phân tích trên d liệu

Bảng 1.1: Phân biệt gi a hệ thống OLTP và DSS

1.2 Các phương pháp luận xây dựng hệ thống DW&BI

Có nhiều ph ng ph p tiếp n đã đ s ng và phổ iến trên thế giới Nh ng thông ng nhất là 3 ph ng ph p sau:

- Business-Wi e Data Warehouse (hay n gọi là Top-down)

- Indepen ent Data Marts (hay n gọi là Bottom-up)

- Inter onne te Data Marts (hay n gọi là Spiral)

Trang 14

Hình 1.3: C ph ng ph p lu n xây d ng DW&BI

1.2.1 Phương pháp luận Top-down

X y ng kho liệu theo ph ng ph p lu n Top- own là x y ng kho liệu “đầy đ ” x y ng ngay và một lần kho liệu đ p ng đ tất ả hoặ phần lớn nh ng nhu ầu khai th thông tin ph n tí h và l p o hiến l a mọi đối

t ng s ng Một lần thiết kế ho toàn ộ hệ thống và th hiện x y ng toàn ộ

nh thiết kế

1.2.2 Phương pháp luận Bottom-up

Ph ng ph p Bottom-up x y ng t ng kho liệu ho mỗi h đề riêng iệt

và độ l p đ p ng đ nhu ầu khai th thông tin ph n tí h và l p o hiến

l a một hoặ một số ph ng an thể trong tổ h / oanh nghiệp Với mỗi h

đề thông tin nghiệp v ph t sinh là một lần thiết kế và x y ng riêng iệt

1.2.3 Phương pháp luận Spiral

Ph ng ph p Spiral là ph ng ph p x y ng ần t ng kho liệu ho mỗi

ch đề a trên mô hình xo y trôn ố mỗi kho liệu h đề ó khả n ng tí h h p lại thành một Kho liệu đầy đ

Sau khi ph n tí h nghiệp v m tổng thể a toàn ộ oanh nghiệp liệt kê anh

s h h đề thông tin ần x y ng kho Sau đó sẽ thiết kế và x y ng ần ho

t ng kho h đề a trên thiết kế tổng thể a toàn tổ h / oanh nghiệp Th t a việ x y ng các kho h đề sẽ đ a trên tính quan trọng a nghiệp v và tính

hiệu quả

Trang 15

1.2.4 Ưu/Nhược điểm của từng phương pháp

D ới đ y là ảng ph n tí h nh ng u điểm và nh điểm a t ng ph ng

đ nhu ầu về thông tin nghiệp v tổng h p a mọi đối t ng s ng

- R i ro ao o th i gian th hiện

n l u (2-4 n m) và hi phí an đầu rất lớn và nghiệp v ị thay đổi ngay trong quá trình triển khai

- Chi phí an đầu ho việ

x y ng t ng kho liệu thấp

- Không đ p ng đ nhu ầu khai

th thông tin m tổng thể a tổ

h / oanh nghiệp

- D liệu ị th a nhiều o đó tính nhất qu n không ao

- Chi phí ảo trì v n hành hàng

n m lớn

- Chi phí ho việ “tí h h p” thành một hệ thống tổng thể là rất lớn

- Cần th i gian ho việ ph n tí h tổng thể trong giai đoạn đầu a

Bảng 1.2: Ưu nh điểm c a ph ng ph p x y ng DW&BI

Trang 16

1.2.5 Cơ sở lựa chọn phương pháp luận

Việ l a họn ph ng ph p tiếp n để x y ng một hệ thống Kho liệu là một quyết định quan trọng Ngoài việ a vào nh ng ph n tí h u điểm nh điểm

nh đã nêu ở trên quyết định l a họn ần a trên yếu tố kh nh :

- Nhu ầu khai th thông tin ph n tí h l p o o hiến l a t ng loại đối t ng s ng - m độ u tiên đối với t ng loại đối t ng và t ng loại yêu ầu

- Kiến tr hạ tầng / sở v t hất hiện tại

- Kinh phí

- Công nghệ

- Khả n ng hỗ tr ung ấp ị h v a đối tác

- Khả n ng a đội ng nội tại (ng i s ng và nh n viên kĩ thu t)

Thông th ng oanh nghiệp / tổ h ó quy mô v a và nhỏ và ó nghiệp

v ổn định hay họn ph ng ph p tiếp n Top-Down (hay Business-Wide Data Warehouse) Với oanh nghiệp và tổ h lớn ó nhiều ph ng an hi nh nh kh nhau và ó nhu ầu khai th thông tin rộng lớn a ng i s ng ên ngoài th ng họn ph ng ph p tiếp n Spiral (hay Inter onne te Data Marts).Ph ng ph p

In epen ent Data Marts rất ít đ s ng Đối với ng n hàng và tổ h tài hính lớn nên họn theo ph ng ph p tiếp n Spiral

1.3 Thiết kế logic một hệ thống DW&BI

1.3.1 Phạm vi công việc và phương pháp thực hiện

1.3.1.1 Phạm vi công việc

Thiết kế logi đ a ra mô hình tổng thể và hi tiết thành phần a hệ thống

nh ng ở m logi ( h a gắn với ông nghệ thể) mô tả ấu tr a ảng liệu quan hệ liệu gi a ảng quan hệ gi a thành phần trong hệ thống … với m tiêu là hệ thống sẽ đ p ng đ nhu ầu thông tin a ng i ùng đã x định ở giai đoạn khảo s t và ph n tí h

Đầu vào của giai đoạn thiết kế logic là ộ tài liệu kết quả a nh ng giai đoạn

tr ớ : Khảo s t Ph n tí h Nh ng tài liệu đầu vào hính ho giai đoạn thiết kế logi

ao gồm:

- B o o khảo sát:

 Hiện trạng a việ ung ấp thông tin

 C nhu ầu thông tin trong t ng lai

 Hiện trạng liệu nguồn

 Hiện trạng hạ tầng thông tin

- Tài liệu ph n tí h

Trang 17

 M độ đ p ng nhu ầu thông tin: về nội ung và về ph ng

Nội ung ông việ a giai đoạn thiết kế logi :

- Thiết kế mô hình tổng thể a hệ thống (ở m logi h a gắn với ông nghệ thể)

- Thiết kế hi tiết t ng thành phần (ở m logi h a gắn với ông nghệ thể

C kết quả a giai đoạn thiết kế logi :

- Tài liệu thiết kế logi a hệ thống với nội ung hính

- Thiết kế CSDL trung huyển ( DSA nguồn và DSA đí h)

- Thiết kế Meta ata

- Thiết kế tiến trình ETL:

 Chuyển liệu t Data Sour e sang DSA

 Chuyển liệu t DSA sang EM

 Chuyển liệu t EM sang DM

- Thiết kế tầng khai thác và phân tích thông tin

 Thiết kế CSDL đa hiều (OLAP)

 Thiết kế tầng liệu ng i ùng (En _User Layer)

1.3.2 Thiết kế tổng thể

1.3.2.1 Mô hình logic tổng thể của hệ thống

Tùy theo t ng n thể mô hình logi tổng thể ó thể kh nhau nh ng

nhìn hung một hệ thống DW và BI điển hình sẽ đ thể hiện nh hình 1.4 ới đ y:

Trang 18

DSA đích CSDL tác nghiệp

DSA nguồn

DSA nguồn

DSA nguồn

Cổng giao tiếp

user

End-Administration (Metadata và Quản trị hệ thống)

Hình 1.4: Mô hình logic tổng thể hệ thống DW&BI

1.3.2.2 Dữ liệu nguồn (Data source)

D liệu nguồn là đầu vào a toàn ộ hệ thống DW ao gồm một anh s h nguồn liệu đ l a họn để đ a vào kho liệu t p trung D liệu nguồn điển hình a DW là CSDL t nghiệp ên trong tổ h ung ấp số liệu hi tiết về giao ị h ph t sinh hàng ngày; CSDL này ó thể đ x y ng trên ông nghệ kh nhau (Ora le SQL Server Foxpro …)

Ngoài ra liệu nguồn ho DW ng ó thể ở ạng file (text xml ex el

…); ó thể là liệu nguồn ên ngoài tổ h (CSDL a tổ h liên kết quan nhà n ớ …)

1.3.2.3 Kho dữ liệutập trung (Data Warehouse)

Kho liệu tí h h plà thành phần trung t m a hệ thống là n i l u tr liệu

t p trung t nguồn về DW bao gồm một tập hợp các CSDL quan hệđ thiết kế

nhằm đảm ảo l u tr khối l ng lớn liệu đồng th i đ p ng tốt nhất nhu ầu tra u khai th liệu Trong DW có các CSDL sau:

- DSA: CSDL trung huyển h a liệu tạm th i a một phiên huyển liệu ph v ông việ x lý làm sạ h tr ớ khi đ a vào CSDL hính DSA ó hai loại:

 DSA nguồn: h a liệu t ng ng với một nguồn thể ở ạng 1:1 về nội ung và ấu tr phạm vi liệu là một phiên

 DSA đí h: h a liệu tổng h p t DSA nguồn phạm vi liệu là một phiên ấu tr DSA ở ạng thu n tiện ho việ huyển đổi liệu vào CSDL tí h h p

Trang 19

- EM: CSDL tí h h p h a liệu a toàn ộ nguồn đó là liệu

đã đ x lý làm sạ h và tí h h p EM ần đảm ảo ung ấp đ liệu

1.3.2.4 BI: Tầng ứng dụng khai thác và phân tích thông tin

BI là một môi tr ng thu n tiện để ng i ùng nghiệp v làm việ với hệ thống ho phép ng i ùng h động khai th ph n tí h tạo o o hia sẻ thông tin … Thành phần BI này ao gồm:

- Lớp liệu nghiệp v : thu t ng /tên gọi ành ho ng i ùng nghiệp

v mỗi thu t ng t ng ng với tr ng liệu trong DM

- N i h a kết quả phân tích, báo cáo

- Meta ata: l u thông tin về nguồn liệu thông tin a CSDL thành phần trong kho liệu t p trung; thông tin quản lý tiến trình ETL

- C ông quản trị v n hành hệ thống (quản trị v n hành tiến trình

jo t động ông việ a kup/re overy…)

1.4 Thiết kế chi tiết từng thành phần

1.4.1.Thiết kế Data Warehouse (Kho dữ liệu tập trung)

1.4.1.1 Các mô hình CSDL trong thiết kế Data Warehouse

Trong thiết kế logi DW ó hai loại mô hình CSDL th ng đ s ng đó

là: mô hình sao và mô hình bông tuyết:

Star Schema (CSDL hình sao): là CSDL quan hệ đ thiết kế logi ạng hình

sao bao gồm một ảng liệu hi tiết ở vị trí trung t m quan hệ với ảng liệu anh m xung quanh (kiểu 1:N) Mỗi ảng anh m đều là ảng uy nhất a

Trang 20

nh nh không ó quan hệ với ảng anh m nào kh Ví trong mô hình star sau

đ y ảng liệu trung t m thể hiện sản l ng và oanh số ảng anh m xung quanh là: kh h hàng sản phẩm kênh ph n phối th i gian M tiêu a mô hình sao

là truy vấn liệu đ nhanh nhất; hấp nh n th a liệu ở ảng anh m

Bán hàng (số lượng, tiền)

Kênh phân phối Sản phẩm

Thời gian Khách hàng

N N

1 1

(Fact Table) (Dimension Table)

Hình 1.5: Star Schema (CSDL hình sao)

Snowflake Schema (CSDL hình bông tuyết): là CSDL hình sao nh ng đã đ

huẩn hóa thành ạng huẩn 3: mỗi ảng anh m đ t h thành ảng anh

m ph n ấp (nếu ó) để đảm ảo không th a liệu Trong ví ới đ y

nh nh ảng Khách Hàng đã đ t h thành ảng ph n ấp M tiêu a mô hình

ông tuyết là kế th a việ truy vấn nhanh a mô hình sao; không để a th a liệu

Bán hàng (số lượng, tiền)

Kênh phân phối Sản phẩm

Thời gian Khách hàng

N N

1 1

(Fact Table) (Dimension Table)

Quốc gia 1 N

Loại hình

1

N Khu vực 1 N

1

N Khối

Hình 1.6: Snowflake Schema (CSDL hình bông tuyết)

1.4.1.2 Một số thuật ngữ thường dùng

Dimension Table (bảng Dimension): là ảng anh m trong CSDL hình sao

hoặ ông tuyết l u tr thông tin về đối t ng nh : kh h hàng sản phẩm th i gian … C tr ng a ảng imension ao gồm:

- Primary key: kiểu số (ví : id sản phẩm)

Trang 21

- C tr ng thông tin thuộ tính (ví : mã sản phẩm, tên sản phẩm mã

h ng loại tên h ng loại …)

- Trong mô hình sao imension ta le n ó thêm tr ng sau:

 C tr ng thông tin tổng h p (aggregate ata): gi trị tổng

h p và tính sẵn (ví : tổng số lượng, tổng tiền, số lượng lớn

nhất, số lượng nhỏ nhất, số lượng trung bình,…)

 C tr ng thông tin n xuất ( erive ata): gi trị đ tính theo ông th a trên tr ng thông tin tổng h p đã ó

Fact Table (bảng Fact hay còn gọi là Master Table): là ảng trung t m trong

CSDL hình sao hoặ ông tuyết l u tr liệu hi tiết về giao ị h ph t sinh Trong ảng fa t tất ả tr ng đều ó kiểu liệu là kiểu số (hoặ kiểu ngày)

- C tr ng thông tin ph t sinh: kiểu số (ví Số lượng, Doanh thu, )

Slave Table: ảng liệu hi tiết ó quan hệ 1:1 với ảng fa t (Master Table),

ùng để l u tr ng liệu không phải kiểu số C tr ng a Slave Ta le ao gồm:

- Primary key: kiểu số (th ng trùng tên tr ng và ùng kiểu liệu với Primary Key a ảng fa t) ng đồng th i đóng vai tr Foreign Key trong quan hệ 1:1 với ảng fa t

- C tr ng thông tin không phải kiểu số (Ví : ghi chú, mô tả giao

dịch …)

- (Slave Ta le không ùng Foreign Key đến ảng imension)

Surrogate Key (khóa giả): là tr ng kiểu số ùng để làm Primary Key ho

ảng imension hoặ ảng fa t trong tr ng h p Primary Key gố a ảng này không phải là kiểu số hoặ là key tổ h p a nhiều tr ng

Measure (hay còn gọi là Fact): là nh ng thông tin ó thể đo l ng đ mỗi

measure t ng ng với một tr ng thông tin ph t sinh trong ảng fa t nh : Số lượng,

Doanh số,

Dimension (hay còn gọi là Chiều): là nh ng hiều tổng h p ph n tí h về

measure ví : chiều sản phẩm, chiều thời gian,…; thông tin về imension đ l u ở

ta le emension; trong liệu hi tiết ph t sinh imension hính là tr ng Foregn

Key a ảng fa t Dimension ao gồm một t p thuộ tính (attribute) đi kèm ví : imension Khách hàng ao gồm thuộ tính sau: mã khách hàng, tên khách

Trang 22

hàng, mã quận huyện, tên quận huyện, mã tỉnh thành, tên tỉnh thành, mã loại hình, tên loại hình…

Level: ấp độ tổng h p liệu ên trong một imension; một level ao gồm

thuộ tính ngang ấp a một imension khi tổng h p liệu thì thuộ tính này ở

ùng một nhóm Ví : trong imension Khách hàng có 4 level sau:

- level Kh h hàng ao gồm 2 thuộ tính: mã khách hàng, tên khách hàng

- level Tỉnh thành ao gồm 2 thuộ tính: mã tỉnh thành tên tỉnh thành

- level Qu n huyện ao gồm 2 thuộ tính: mã qu n huyện tên qu n huyện

- level Loại hình ao gồm 2 thuộ tính: mã loại hình tên loại hình

Hierarchy: là một t p level ó quan hệ ph n ấp ên trong một imension;

trong một imension ó thể ó nhiều hiearar hy Hiearar hy là n để th hiện thao t trên liệu tổng h p: tổng h p lên (roll-up) hoặ hi tiết xuống ( rill-down)

Ví : trong dimension Khách Hàng, có 2 hierarchy sau:

- hieararchy Khách hàng - địa hỉ là: Khách hàng<<Ph ng/xã<<Qu n/huyện<<Tỉnh/thành

- hieararchy Khách hàng - loại hình là: Khách hàng<<Loại hình

- Thông tin: mỗi thông tin là một ảng số liệu với 2 thành phần:

- Phần measure: ột gi trị ằng số ( on số nghiệp v : sản l ng oanh thu …)

- Phần imension: ột thể hiện hiều ph n tí h (nh : sản phẩm th i gian …)

- Chủ đề thông tin: là t p h p thông tin ó hung phần measure

- Ví : h đề thông tin Sản Lượng Xuất Nhập Khẩu ao gồm o o về

sản l ng xuất nh p khẩu ( ùng là thông tin về sản l ng) nh ng mỗi o

o ó hiều ph n tí h kh nhau: quố gia hàng hóa hi …

1.4.1.3 Data Mart (DM): các CSDL chủ đề

Data Mart là CSDL đ thiết kế theo mô hình sao (nh đã nêu ở m a.) h a liệu về một h đề thông tin x định ph v một lớp đối t ng ng i ùng thể Trong một Kho liệu t p trung (DW) ó thể ó nhiều DM mỗi DM t ng ng với một h đề thông tin

D a trên kết quả đã ó t giai đoạn khảo s t và ph n tí h về nhu ầu thông tin a trên việ ph n tí h khả n ng ung ấp nh ng thông tin ó thể lấy ra t liệu nguồn (mặ ù ng i ùng h a yêu ầu) ớ để thiết kế DM ao gồm:

- X định danh sách các chủ đề thông tin mà hệ thống cần đáp ứng Mỗi h

đề thông tin ần ó nội ung sau:

Trang 23

C measure: gi trị số (nh ng on số nghiệp v nh : Số

lượng bán, Giá trị bán thể hiện h đề Tình Hình Bán Hàng)

 C imension: hiều ph n tí h thông tin (ví : sản phẩm

a hàng th i gian …)

- Với mỗi h đề thiết kế một DM:

 Vẽ s đồ th thể quan hệ (ERD mô hình sao)

- Với ảng fa t: th ng hia partition theo hiều th i gian (t là hia theo

tr ng FK link sang ảng imension th i gian)

- Với ảng imension lớn ó s t ng tr ởng liệu: hia partition theo

tr ng ó nhu ầu tìm kiếm h yếu (nếu x định đ )

Thiết kế giải ph p phi huẩn:

- Làm th a liệu để t ng tố độ th hiện u lệnh truy vấn ví : mview trong Oracle

Hình 1.7 d ới đ y là một ví về ERD a một Data Mart trong đó ó ảng

fa t DOANH_SO với 2 measure là Số lượng, Doanh số và 4 dimension là Thời gian,

Cửa hàng, Khách hàng, Sản phẩm:

Trang 24

Hình 1.7: Ví d về Data Mart

1.4.1.4 Enterprise Model (EM): CSDL tích hợp

Enterprise Mo el là CSDL đ thiết kế theo mô hình ông tuyết (nh đã nêu ở

m a.) h a liệu tí h h p a tất ả h đề thông tin mà hệ thống ần đ p

ng ung ấp liệu ho tất ả Data Mart Trong một Kho liệu t p trung (DW) hỉ ó một EM nh ng ên trong EM này ó thể ó một hoặ nhiều ảng

fa t.D a trên ản thiết kế logi Data Mart đã ó ớ để thiết kế EM ao gồm:

- Ph n tí h ản thiết kế logi DM đã ó

- Chuẩn hóa và tí h h p ảng imension:

 Mỗi DM ó một t p h p ảng imension mỗi ảng này ần đ huẩn hóa (t h ảng) thành ảng quan hệ theo ạng huẩn 3 để không ị th a liệu

 Sau khi huẩn hóa nh ng ảng anh m nào t ng đ ng nhau ( ùng ý nghĩa nghiệp v ùng primary key …) thì tí h h p thành một ảng (primary key là hung tr ng thuộ tính là h p t hai ảng); nh ng ảng imension n lại đ gi nguyên ấu tr và nếu ó quan hệ thì tạo Foreign Key với ảng imension kh

- Tí h h p ảng fa t: Mỗi DM ó một ảng fa t mỗi ảng fa t ao gồm một số hoặ tất ả tr ng thông tin a một loại liệu nghiệp v thể

(ví : liệu hóa đơn bán hàng) Nh ng ảng fa t nào l u thông tin về

cùng một loại liệu (và ùng primary key) thì tí h h p thành một ảng

Trang 25

(primary key là hung foreign key và tr ng measure là h p t hai ảng); nh ng ảng fa t n lại đ gi nguyên ấu tr

- Tí h h p ảng slave (nếu ó): t ng t và đi kèm với ảng fa t

- Vẽ s đồ th thể quan hệ (ERD mô hình ông tuyết ó thể ó nhiều ảng fact)

- Thiết kế ảng imension theo ạng huẩn 3

Hình 1.8 là một ví về ERD a một Enterprise Mo el trong đó ó 2 ảng

fact là Công nợ và Sản lượng doanh thu

Sản lượng doanh thu

Cửa hàng

Sản phẩm Thời gian

Khách hàng Công nợ

Chủng loại Tháng

Quý Năm

Hình 1.8: Ví d về Enterprise Model

Trang 26

1.4.1.5 Data Staging Area (DSA): CSDL trung chuyển

Data Staging Area (DSA) là một t p CSDL đóng vai tr trung huyển liệu gi a nguồn liệu với EM DSA là môi tr ng liệu trung gian l u tr tạm

th i liệu để x lý làm sạ h và tí h h p tr ớ khi đ a vào EM DSA chỉ l u tr tạm

th i a một phiên khi x lý xong thì xóa đi để huẩn ị x lý ho phiên tiếp theo Có hai loại DSA ao gồm:

- DSA đí h:là CSDL ó ấu tr t ng đ ng với EM (CSDL hình ông tuyết) là n i h a liệu kết quả uối ùng a giai đoạn x lý làm sạ h

và tí h h p tr ớ khi đ a vào EM Chỉ ó một DSA đí h

- DSA nguồn:là CSDL ó ấu tr t ng đ ng với liệu nguồn (mô hình CSDL quan hệ thông th ng) và h a liệu nguyên ản a nguồn (sau

đó mới x lý làm sạ h).Có nhiều DSA nguồn: ng với mỗi liệu nguồn

ần một DSA nguồn

C ớ th hiện thiết kế DSA

- Thiết kế DSA đí h ( a trên ản thiết kế EM đã ó):

 Vẽ s đồ ERD ho DSA đí h giống với ERD a EM (nên tạo ảng trùng tên với ảng t ng ng trong EM)

 Thiết kế ảng imension ảng fa t ảng slave giống nh trong EM

 Thiết kế in ex: t ng nh in ex EM

- Thiết kế DSA nguồn:

 Ph n tí h s đồ ERD a CSDL nguồn để nắm đ mối quan hệ liệu

gi a ảng liệu nguồn

 Ph n tí h mối quan hệ liệu gi a ảng liệu nguồn với ảng trong DSA đí h t đó x định anh s h ảng tr ng sẽ đ a vào DSA nguồn

 Vẽ s đồ ERD ho DSA nguồn ( a trên kết quả ph n tí h)

 Thiết kế ảng ho DSA nguồn: ấu tr ảng a DSA nguồn

t ng đ ng với ấu tr ảng a CSDL nguồn (t ng đ ng về kiểu liệu a tr ng về primary key foreign key)

 Thiết kế in ex trên tr ng Primary Key Foreign Key

1.4.1.6 Extraction - Transformation - Loading (ETL): Thu thập, làm sạch

Trang 27

qua thành phần kh nhau và đến đí h ( DM) gi p ho liệu a hệ thống

DW đ p nh t định kỳ Trên th tế tình huống huyển đổi liệu t nguồn đến kho t p trung là rất đa ạng ph tạp … và vì thế ETL ng ó thể rất đa ạng và

ph tạp D ới đ y hỉ là một h hia t h ông đoạn x lý ên trong một tiến trình ETL theo đó oi ả hệ thống DW hỉ ó một tiến trình ETL và nó ao gồm ông đoạn x lý sau:

- Thu thập dữ liệu (Extraction): là ông đoạn khai th và đ a liệu t

nguồn vào CSDL trung huyển ( DSA nguồn) h a x lý gì đối với liệu

- Làm sạch và tích hợp (Transformation): là ộng đoạn ph tạp nhất x lý

liệu tại CSDL trung huyển x lý ao gồm:

 Làm sạ h: huẩn hóa hoặ loại ỏ liệu không h p lệ không toàn vẹn

 Tí h h p: tí h h p liệu t nhiều DSA nguồn về một DSA đí h tí h h p ảng liệu t ng đ ng nhau thành một ảng

- Loading (load dữ liệu): là ông đoạn loa liệu đã đ x lý t DSA

đí h sang EM hoặ t EM sang các DM

C n vào tài liệu khảo s t và ph n tí h về liệu nguồn n vào ản thiết

kế logi thành phần đã ó ( DM EM DSA đí h DSA nguồn) thiết kế tiến trình ETL theo ớ sau:

- Thiết kế h n ng huyển liệu vào kho t p trung (DW):

 T EM sang DM

 T DSA đí h sang EM

 T DSA nguồn sang DSA đí h

- Thiết kế h n ng Thu th p liệu t nguồn vào DSA nguồn

- Thiết kế h n ng Làm sạ h ổ sung liệu (Làm sạ h ổ sung liệu tại DSA nguồn và Làm sạ h ổ sung liệu tại DSA đí h)

1.4.2 Thiết kế metadata

Meta ata là lớp liệu l u tr thông tin mô tả về hính thành phần a

DW Th hất việ thiết kế meta ata ho DW là thiết kế một CSDL quan hệ để l u

tr loại liệu sau:

- Cấu tr và ý nghĩa a t ng CSDL trong DW (Data Sour e DSA EM DM): mô tả về ảng tr ng ý nghĩa ngiệp v

- Quan hệ tham hiếu gi a tr ng ảng a CSDL kh nhau

- D liệu nghiệp v a en -user: gi trị số (measure) hiều thông tin ( imension) thuộ tính đi kèm (attri ute) ph n ấp (hiearar hy)

Trang 28

- D liệu quản lý tiến trình ETL: liệu về t ng ông đoạn huyển đổi phiên th hiện …

- D liệu về tầng khai th và ph n tí h thông tin: ấu tr và ý nghĩa đ n

vị a lớp liệu tham hiếu; anh m kết quả đầu ra ( o o ph n

tí h) anh s h user và quyền truy p

1.4.3 Thiết kế tầng khai thác và phân tích thông tin

1.4.3.1 Thiết kế CSDL đa chiều với OLAP

Nhìn hung m đí h h ớng đến a việ thiết kế DW là ra đ DM Về mặt logi DM đ thiết kế theo ý t ởng đa hiều với ảng anh m ( hiều) xoay quanh ảng liệu hi tiết về giao ị h ph t sinh; kiểu thiết kế này

gi p đ p ng nhanh và linh hoạt nhu ầu thông tin đang ạng đa hiều a ng i ùng Nh ng về ản hất l u tr liệu DM v n là một t p ảng liệu quan hệ ( ảng với 2 hiều ng và ột) để đ a ra đ o o đa hiều ần th hiện

u lệnh truy vấn (SQL) để join ảng với nhau.Để tạo s thu n tiện và h động ho ng i ùng uối đồng th i t ng tố độ đ p ng nhu ầu thông tin ần tạo thêm một lớp liệu n a ở ạng tính to n sẵn và gần g i h n với nhu ầu thông tin a ng i ùng lớp liệu đó hính là OLAP

OLAP là tầng liệu phía trên DM ó ấu tr l u tr đặ iệt (không s

ng ảng quan hệ thông th ng) để l u tr liệu đa hiều ở ạng tính to n sẵn liệu này rất gần với nhu ầu thông tin a ng i ùng.Với OLAP ng i ùng hỉ ần họn và lấy ra thông tin mình ần ( imension measure) để

th hiện việ o o và ph n tí h vì thông tin này đã đ tính to n sẵn trong OLAP.OLAP đ tổ h thành OLAP u e (Khối liệu đa hiều) mỗi OLAP

u e ph v một nhóm nhu ầu thông tin a ng i ùng T ng ng với một h đề thông tin (DM) ó thể tạo ra nhiều OLAP u e Ngoài ra tùy thuộ nhu ầu ph n tí h thông tin ng ó thể tạo ra một OLAP u e t DM kh nhau.C n vào việ

ph n tí h nhu ầu thông tin a ng i ùng n ản thiết kế DM thiết kế tầng liệu OLAP theo ớ sau:

- X định anh s h OLAP u e a trên nhóm nhu ầu thông tin đã iết

- Thiết kế t ng OLAP u e:

Trang 29

1.4.3.2 Thiết kế tầng khai thác và phân tích thông tin

Tầng khai th và ph n tí h thông tin là môi tr ng thu n tiện và an toàn để

ng i ùng t ng t với hệ thống môi tr ng này ao gồm thành phần sau:

- Lớp liệu tham hiếu: Là một ấu tr l u tr x định mối quan hệ tham hiếu gi a thu t ng nghiệp v ( a ng i ùng uối) với đối t ng liệu tin họ ( ảng tr ng) Lớp này đóng vai tr ầu nối để

ng i ùng uối ó thể khai th đ liệu a CSDL trong DW ằng h l a họn và kéo thả thông tin nghiệp v mình ần thay vì việ viết u lệnh truy vấn SQL

- Lớp thông tin kết quả: Là t p h p file kết quả o o ph n tí h … a

ng i ùng và đ l u tại th m x định

- C ông khai th và ph n tí h thông tin: Là h ng trình ng ng

để ng i ùng ph n tí h l p o o và hia sẻ thông tin

- Cổng thông tin:Là giao iện để ng i ùng truy p hệ thống và lấy thông tin kết quả.Ví : we portal ms offi e …

Trang 30

CHƯ NG II BÀI TOÁN ĐẦU TƯ PHÁT TRIỂN HỆ THỐNG HỖ TRỢ

RA QUYẾT ĐỊNH TẠI NGÂN HÀNG NÔNG NGHIỆP VÀ PHÁT

TRIỂN NÔNG THÔN VIỆT NAM

Phần này ph n tí h ối ảnh định h ớng ph t triển CNTT aNgân hàng Nông nghiệp; đ nh gi hiện trạng hạ tầng kỹ thu t ng nh ng ng CNTT tại Ngân hàng Nông nghiệp; ph n tí h nhu ầu yêu ầu ần thiết đối với Kho liệu và hệ thống hỗ

tr ra quyết định t đó nêu t s ần thiết phải đầu t x y ng Kho liệu tại Ng n hàng Nông nghiệp D a trên yêu ầu đối với Kho liệu đã ph n tí h nêu ra m tiêu đầu t a n đồng th i đ a ra thiết kế s ộ a hệ thống

2.1 Bối cảnh xây dựng dự án

2.1.1 Xu hướng xây dựng DW&BI

Nhu ầu mở rộng và ph t triển giải ph p Data Warehouse và Business Intelligen e sẽ ngày àng lớn mạnh nhất là trong ối ảnh kinh tế xã hội nh hiện tại

sẽ uộ tổ h tài hính/ng n hàng/ oanh nghiệp phải tối u hóa hoạt động

a mình và đ a ra quyết định nhanh hóng hính x Tại Việt Nam rất nhiều

Ng n hàng lớn đã và đang x y ng DW&BI Ví :

- Tháng 4/2011, Ngân hàng Ng n hàng TMCP Sài G n Th ng Tín (Sa om ank) là ng n hàng TMCP Việt Nam đầu tiên hính th ông ố triển khai thành ông n DW&BI trên nền tảng ông nghệ Ora le hạy trên hệ thống m y h Ora le Exa ata

- Th ng 09/2013 VietinBank và liên anh ETC & Te h Mahin ra đã ký kết

h p đồng gói thầu Mua sắm và triển khai giải ph p Kho liệu oanh nghiệp EDW tại VietinBank

- Th ng 10/2013 FSS đã ký h p đồng với Ng n hàng Đầu t và Ph t triển Việt Nam ung ấp Hệ thống Data warehous trên nền tảng IBM Data Mo el

ho n Triển khai hệ thống B o o thống kê t p trung

2.1.2 Hiện trạng hệ thống CNTT tại Ngân hàng Nông nghiệp

T n m 2009 Ng n hàng Nông nghiệp đã ắt đầu h trọng đầu t x y ng hệ thống CNTT Đến nay Trung t m CNTT a Ng n hàng Nông nghiệp đang quản lý 7

Trang 31

Đ t h ra t hệ thống IPCAS2 Oracle Server 2012 INTERNET

và IPCAS2 Hàng tháng, quý, các chi nh nh sẽ lấy o o t ng ng tổng h p hỉnh s a theo m u iểu ó sẵn Sau đấy g i o o lên ho Ban tr thuộ

Tr sở hính C Ban lại tổng h p liệu a tất ả hi nh nh sau đấy g i o

o lên ho Ch tị h hội đồng quản trị và Ban gi m đố

CHỦ TỊCH HĐQT, BAN GIÁM ĐỐC

CÁC BAN TRỰC THUỘC TRỤ SỞ

MẠNG LƯỚI CHI NHÁNH

Hình 2.1: Mô hình báo cáo hiện tại c a Ngân hàng Nông nghiệp

Trang 32

2.2 Đánh giá về hệ thống báo cáo (MIS) hiện tại

Hệ thống MIS là một hệ thống thông tin o o hiện tại mới hỉ tí h h p h yếu nguồn liệu t hệ thống CoreBank Ngoài ra n nhiều nguồn liệu h a đ tí h

h p nh liệu về Thẻ Internet Banking Thu ng n s h nhà n ớ

Hệ thống MIS hiện tại đ p ng nhu ầu n ản về o o quản trị và o o tu n

th ung ấp loại o o theo quy định hoạt động kinh oanh a Agri ank NHNN; Cung ấp đ một số o o ph n tính nh Nguồn vốn D n lãi suất ình

qu n tỷ lệ an toàn vốn khả n ng hi trả…; Cung ấp o o động về hoạt động kinh oanh a Agri ank

Hệ thống MIS hiện tại x lý l ng liệu lớn h n rất nhiều so với ng n hàng

kh D liệu hiện tại khoảng 36TB t ng tr ởn liệu trong 9 th ng đầu n m khoảng 9TB

Thiếu kiến tr v ng hắ mô hình liệu phù h p(DataMo el) nên khả n ng đ p

ng o o ph n tí h theo hiều s u n hạn hế C hế và ông tí h h p liệu ETL n thiếu Tốn th i gian ho việ đối hiếu và ph t triển o o Chất l ng liệu h a đ nhất qu n Nhiều hệ thống ung ấp liệu và o o không đ đồng ộ

Thiếu o o quản lý ấp ao và ph n tí h ó gi trị thể là hệ thống Mis

h a ó o o ph n tí h với nhiều tiêu hí đan xen ph n tí h o hoặ là

nh ng o o ần kết h p với nguồn liệu ên ngoài Nh ng ph n tí h kiểu

“what - if” ( tình huống nào ó thể xảy ra với t ng tình huống thể) ví nh nếu

t ng lãi suất thêm 1% thì tổng n tiền vay sẽ t ng hay giảm so với n m ngo i

2.3 Sự cần thiết phải đầu tư

Qua đ nh gi s ộ về các ng ng và hệ thống o o hiện tại a Ngân hàng Nông nghiệp ó thể nh n thấy:

- Hệ thống o o hiện tại là một hệ thống mang tính giải ph p tình thế nhằm giảm tải ho hệ thống t nghiệp

- Thiếu kiến tr v ng hắ mô hình liệu phù h p

- Thiếu o o quản lý ấp ao và ph n tí h ó gi trị

Trong khi đó Ng n hàng Nông nghiệp là một tổ h tín ng lớn ó m độ t ng

tr ởng liệu ao ùng với đó là mong muốn đ khai th s u h n vào liệu để

ó thể ra nh ng quyết định hính x nhất Việ x y ng DW&BI là nhu ầu ấp thiết a Ng n hàng Nông nghiệp DW&BI sẽ ung ấp một h ớng tiếp n liệu tốt

h n triệt để h n và giảm thiểu xung đột ng nh hạn hế s xuống ấp trong môi

tr ng hoạt động hiện tại a Ng n hàng Nông nghiệp

Ngày đăng: 10/06/2021, 03:02

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w