Do đó,cần phải có một hệ thống nhằm tích hợp dữ liệu từ các phần mềm đótạo thành một cơ sở dữ liệu “đồng nhất”, nhằm xây dựng chươngtrình tổng hợp số liệu để báo cáo, thống kê giúp cho n
Trang 1MỞ ĐẦU
1 Lý do chọn đề tài
Việc ứng dụng công nghệ thông tin nói chung và việc ứngdụng kho dữ liệu nói riêng vào hoạt động của các doanh nghiệp đãgóp phần thành công trong sự phát triển của họ Các ngành đã ápdụng rộng rãi công nghệ thông tin cũng như việc áp dụng kho dữliệu ngày càng nhiều và phần nào đã đạt được những thành côngnhất định của riêng mình
Đối với Bưu chính Việt Nam nói chung và Bưu điện QuảngBình nói riêng đã áp dụng hầu hết hệ thống tin học vào quy trình sảnxuất Nhưng do đặc trưng riêng của từng chương trình vì vậy cơ sở
dữ liệu không đồng nhất với nhau, do đó tạo nên sự rời rạc có sở dữliệu của các chương trình Do đó rất khó khăn khi tập hợp dữ liệu đểbáo cáo, tổng hợp, thống kê hàng tháng cũng như hàng năm Do đó,cần phải có một hệ thống nhằm tích hợp dữ liệu từ các phần mềm đótạo thành một cơ sở dữ liệu “đồng nhất”, nhằm xây dựng chươngtrình tổng hợp số liệu để báo cáo, thống kê giúp cho những ngườiquản lý thấy được tình hình sản xuất, kinh doanh của đơn vị diễn ranhằm có những điều chỉnh về chính sách, phương hướng, kế hoạch
để đạt hiệu quả cao trong hoạt động sản xuất, kinh doanh của đơn vị.Trước thực tế đó và được sự đồng ý của PGS TS Nguyễn
Thanh Bình, tôi chọn đề tài “Nghiên cứu giải pháp tích hợp CSDL các phần mềm Bưu chính hỗ trợ thống kê, báo cáo tại Bưu điện Quảng Bình” và mục đích đầu tiên là sử dụng tại Bưu điện Quảng
Bình
Trang 22 Mục đích nghiên cứu
- Xây dựng kho dữ liệu tổng hợp của các phần mềm bưu chínhnhằm báo cáo, thống kê hiệu quả sản xuất kinh doanh (số lượng,doanh thu,…), để kịp thời điều chỉnh nhanh chóng phương pháp làmviệc và chăm sóc khách hàng để đạt hiệu quả
- Nâng cao hiệu quả kinh doanh, đủ sức cạnh tranh với cácdoanh nghiệp khác
- Tạo tiền đề để phát triển để phát triển các ứng dụng khác
3 Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu của đề tài
+ Các CSDL, quy trình sản xuất đang thực hiện tại Bưu điệnQuảng Bình
+ Các công cụ lập trình, các hệ cơ sở dữ liệu liên quan đến đềtài (Kho dữ liệu, tích hợp dữ liệu)
4 Phương pháp nghiên cứu
- Phương pháp nghiên cứu lý luận.
- Phương pháp nghiên cứu thực tiễn.
- Phương pháp nghiên cứu tài liệu.
5 Ý nghĩa khoa học và thực tiễn của đề tài
6 Bố cục của luận văn
Báo cáo của luận văn được được tổ chức thành ba chươngchính
Chương 1 Cơ sở lý thuyết
2
Trang 3Chương 2 Giải pháp tích hợp các CSDL tại Bưu điện QuảngBình
Chương 3 Phát triển ứng dụng
Trang 4CHƯƠNG 1
CƠ SỞ LÝ THUYẾT
1 KHO DỮ LIỆU
1.1 Khái niệm
Theo W.H.Inmon, một nhà kiến trúc hàng đầu của việc xây
dựng kho dữ liệu, thì kho dữ liệu được định nghĩa như một “tập hợp
dữ liệu định hướng theo chủ đề, tích hợp, có tính ổn định, thay đổi theo thời gian hỗ trợ cho xử lý thực hiện quyết định quản trị”.
Các đặc tính của kho dữ liệu
Một kho dữ liệu có thể được coi là một hệ thống thông tin vớinhững đặc tính:
- Là một cơ sở dữ liệu được thiết kế có nhiệm vụ phân tích,
- Chứa các bảng dữ liệu có kích thước lớn
- Một câu hỏi thường trả về một tập kết quả liên quan đếntoàn bộ bảng và các liên kết nhiều bảng
1.2 Cách thức xây dựng kho dữ liệu
a Thiết kế kho dữ liệu
Kho dữ liệu, mục tiêu là hỗ trợ quyết định cho các nhà quản lý.Tính chi tiết và riêng lẻ của các mẩu tin thì ít quan trọng hơn dữ liệu
có tính lịch sử, tổng kết và hợp nhất Kho dữ liệu hỗ trợ các truy vấn
4
Trang 5phức tạp với thời gian hồi đáp nhanh, các truy vấn phức tạp có thểtruy xuất hàng triệu mẩu tin và thực hiện nhiều lần các thao tác quét,kết và tổng hợp Đối với kho dữ liệu, số lượng truy vấn đưa vào vàthời gian hồi đáp quan trọng hơn số lượng giao dịch đưa vào
b Cấu trúc kho dữ liệu
Hình 1.3 Kiến trúc kho dữ liệu
1.3 Các vấn đề liên quan đến kho dữ liệu
2 TÍCH HỢP DỮ LIỆU
2.1 Khái niệm
Tích hợp dữ liệu là quá trình tổng hợp có sự lựa chọn dữ liệu
từ các nguồn khác nhau sau đó kết hợp lại thành một tập hợp thôngtin chính xác, chất lượng và nhất quán tiếp tục chuẩn hóa, làm sạchtạo thành kho dữ liệu để cung cấp người dùng với một cái nhìnthống nhất của các dữ liệu này
Trang 6OOB DMS ORACLE
DATA SERVER
Hình 1.4 Mô hình tích hợp dữ liệu
2.2 Các phương pháp tích hợp dữ liệu
a Tích hợp dữ liệu bằng phương pháp thủ công
Quan sát một CSDL và mã nguồn của nó và tìm thấy một sốtrường dữ liệu cần trích xuất
b Tích hợp dữ liệu bằng phương pháp bán tự động
c Tích hợp dữ liệu bằng phương pháp tự động
Phương pháp ETL - trích xuất, biến đổi và tải
3 XÂY DỰNG KHO DỮ LIỆU, TÍCH HỢP DỮ LIỆU
Trang 7Hình 1.8 Các dịch vụ của SQL Server 2005
MSSQL 2005 có 4 dịch vụ lớn: Database Engine,IntergrationService, Reporting service, Analysis Services
3.2 Xây dựng kho dữ liệu trong SQL Server để lưu trữ thông tin
Nguồn dữ liệu cho kho dữ liệu có thể bao gồm nhiều nguồnkhác nhau Chúng ta sẽ dùng dịch vụ SSIS để xây dựng tiến trìnhETL để lấy dữ liệu từ hệ thống nguồn và đẩy vào kho dữ liệu
Trang 8Hình 1.9 Mô hình xây dựng kho dữ liệu
3.3 Tích hợp dữ liệu trong SQL Server
- Sử dụng SQL Server Integration Service(SSIS)
- Sử dụng SQL Server Analysis Service (SSAS)
Trang 94.2 Phân cấp và phân loại địa chỉ
4.3 Cấu trúc và nguyên tắc xây dựng mã Bưu chính
a Cấu trúc
b Nguyên tắc xây dựng mã Bưu chính
4.4 Danh sách chi tiết mã địa chỉ Bưu chính tỉnh Quảng Bình
Trang 105.1 Giới thiệu về Bưu điện Quảng Bình
Bưu điện Quảng Bình là đơn vị thành viên của Tổng công tyBưu chính Việt Nam (VNPOST), kinh doanh nhiều ngành nghềtrong đó chủ yếu là dịch vụ Chuyển phát Bưu chính và Tài chínhBưu chính Hiện nay, các dịch vụ Bưu chính đã được tin học hóahoàn toàn
5.2 Các CSDL hiện đang ứng dụng tại Bưu điện tỉnh Quảng Bình
Hiện tại Bưu điện tỉnh Quảng Bình có khoảng 10 hệ thốngphần mềm tin học được triển khai để khai thác quản lý dịch vụ vàđiều hành sản xuất kinh doanh, các hệ thống này sử dụng hệ quản trịCSDL SQL server để tổ chức lưu trữ dữ liệu
Xét về tổ chức kiến trúc dữ liệu các chương trình tin học Bưuchính, có thể chia làm 3 loại:
+ Loại 1: CSDL đặt tại cục bộ sau đó được truyền lên CSDLtập trung ở tỉnh, rồi truyền ra Tổng công ty
+ Loại 2: CSDL đặt tập trung tại tỉnh, rồi truyền đi Tổng côngty
+ Loại 3: CSDL đặt tại Tổng công ty
Mô hình các CSDL đang triển khai tại Bưu điện tỉnh QuảngBình được trình bày tại hình dưới:
10
Trang 11Hình 2.1 Mô hình CSDL hiện tại của Bưu điện Quảng Bình
6 MÔ TẢ BÀI TOÁN TÍCH HỢP
6.1 Mô tả bài toán
Như đã trình bày ở mô hình các CSDL đang triển khai tại Bưuđiện Quảng Bình, các bưu cục giao dịch nằm rãi rác khắc nơi trênđịa bàn tỉnh, tại Bưu cục có nhiều chương trình tin học ứng dụng,mỗi chương trình tin học ứng dụng khai thác, quản lý một dịch vụđều có một CSDL chứa đựng dữ liệu khách hàng riêng, sau đó đượctruyền về Trung tâm tỉnh nhưng cũng là riêng lẻ Các trường trongcác CSDL thiết kế không đồng bộ và nhiều thuộc tính khác nhau Dovậy, vấn đề phát sinh là:
“Làm thế nào để tổng hợp tất cả các dữ liệu từ các dịch vụ riêng lẻ thành một dữ liệu thống nhất, để từ đó phát triển các hệ thống ứng dụng khác, chẳng hạn như chương trình từ nguồn dữ liệu
Trang 12đó trích xuất nhằm thống kê và báo cáo cần thiết để hỗ trợ công tác điều hành tại đơn vị”
Các CSDL riêng lẻ sẽ được trích rút dữ liệu thông qua hệ thống
“trích rút, tích hợp dữ liệu” sau đó dữ liệu này sẽ được tải vào kho
dữ liệu được thiết kế sẵn
12
Trang 138 PHÂN TÍCH VÀ THIẾT KẾ GIẢI PHÁP TÍCH HỢP 8.1 Phân tích các CSDL cần tích hợp
Cơ sở dữ liệu của các chương trình quản lý khai thác dịch vụchủ yếu là SQL server 2000, 2005 và 2008 Trong phạm vi đề tài,chúng ta xem xét hai nhóm dịch vụ chính:
+ Nhóm dịch vụ Chuyển phát
+ Nhóm dịch vụ Tài chính Bưu chính
a Nhóm dịch vụ chuyển phát Bưu chính
+ Chuyển phát nhanh EMS
Mô hình ứng dụng của chương trình tin học EMS được trìnhbày tại hình sau:
b Nhóm dịch vụ tài chính Bưu chính
+ Chuyển tiền (CT2003)
Mô hình ứng dụng của chương trình tin học CT2003 được trìnhbày tại hình dưới:
Trang 148.2 Tổ chức CSDL tại kho dữ liệu
Tại kho dữ liệu, các khách hàng có thông tin đầy đủ tại cácCSDL riêng lẻ sẽ được lưu trữ trong một CSDL mới Từ CSDL này
ta sẽ tiến hành áp dụng các thuật toán trên đó để thống kê và báocáo
Trang 15Hình 2.8 Mô hình chi tiết trích rút dữ liệu
Việc trích rút phải đảm bảo không phá vỡ CSDL riêng lẻ hiệntại và phải phân biệt được dữ liệu nào đã được trích rút Dữ liệu có
từ trước, và mới phát sinh cũng phải được trích rút
Dữ liệu tại các bảng trong các CSDL riêng lẻ sẽ được chuyểnvào các bảng trương ứng trong kho dữ liệu
b Xử lý dữ liệu
Tích hợp dữ liệu khách hàng có thể nói là tương đối phức tạp,trong phạm vi ứng dụng cho một doanh nghiệp, xử lý dữ liệu đượcthực hiện bằng phương pháp bán tự động
Việc xử lý gán mã Bưu chính tại các Bưu cục cho dữ liệukhách hàng được trình bày tại hình:
Trang 16Hình 2.9 Lưu đồ gán mã BC huyện cho dữ liệu khách hàng
9 TẠI KHO DỮ LIỆU, CSDL ĐƯỢC CÀI ĐẶT NHƯ SAU
16
Trang 17Hinh 2.11 Sơ đồ quan hệ giữa các bảng
Trang 18CHƯƠNG 3
PHÁT TRIỂN ỨNG DỤNG
10 MÔ TẢ HỆ THỐNG ỨNG DỤNG
10.1 Mô tả bài toán
Dữ liệu khách hàng phát sinh hàng tháng tại Bưu cục (PO) sẽ
có trong CSDL của mỗi Bưu cục đó Sau đó mỗi Bưu cục này tựthống kê và báo cáo doanh thu riêng tại mỗi Bưu cục (Client) Đồngthời dữ liệu này sẽ được truyền tự động lên máy chủ (Server) và tạimỗi Server có thể thống kê chung hoặc riêng lẻ của tất cả các Bưucục trực thuộc tỉnh
Căn cứ doanh thu, sản lượng của mỗi Bưu cục để nhanh chónghoạch định đường lối chăm sóc khách hàng và đưa ra phương hướngkinh doanh mới
Kết xuất những báo cáo theo quy định nghiệp vụ
10.2 Xác định yêu cầu của hệ thống
Mục tiêu của hệ thống là xây dựng nên một chương trình chămsóc khách đáp ứng các yêu cầu sau đây:
Xây dựng một chương trình cài đặt trên các máy Client vàServer tại Bưu cục và tại Bưu điện tỉnh
Cho phép người dùng chỉnh sửa các thông tin
Đưa ra các báo cáo thống kê định kỳ hay đột xuất
Hệ thống cung cấp các thông tin hỗ trợ cho chuyên viênthống kê biến động về doanh thu của từng Bưu cục hay toàn tỉnh, để
từ đó tham mưu Lãnh đạo đưa ra những chính sách phù hợp
Hệ thống cung cấp các biểu mẫu báo cáo nghệp vụ dùngcho tại Bưu cục và cấp cao hơn
18
Trang 19Ưu điểm của hệ thống là giúp cho các Bưu cục và cấp cao hơnquản lý doanh thu thông qua phần mềm.
Cấu trúc của CSDL đó bao gồm hàng trăm trường (Field) và
dữ liệu là rất lớn Do đó trong quá trình trích rút dữ liệu phải đảmbảo không phá vỡ CSDL riêng lẻ hiện tại và phải phân biệt được dữliệu nào đã được trích rút, cộng thêm CSDL mới được trích rút phảiđảm bảo được tính toàn vẹn của thông tin trong các bảng (Table)
Do vậy, sau khi trích rút và tích hợp CSDL mới đã được bóctách để có những thông tin cần thiết để khai thác nhưng bên cạnh đóCSDL mới vẫn bảo đảm, toàn vẹn mọi thuộc tính và thông tin nhưtrên CSDL cũ
CSDL mới khi được tích hợp, nó bao gồm các thông tin củacác CSDL đã được trích rút và các thông tin trên các CSDL đó đượcgắn kết với nhau bởi những quan hệ nhất định
Để thấy rõ được, chúng ta xem bảng thống kê sau đây:
Trang 2012.2 Đánh giá kết quả
Qua thử nghiệm, chúng tôi rút ra được bảng thống kê/so sánhnhư sau:
20
Trang 21Qua ứng dụng cho thấy những kết quả đạt được sau đây:
Dữ liệu đầu vào bao gồm các CSDL với dung lượng rất lớn.Nhưng qua chương trình thì đã trích rút và tích hợp lại thành CSDLmới, cần thiết có độ phức tạp thấp hơn nhưng vẫn đảm bảo đầy đủthông tin
Các chức năng hệ thống hoạt động theo đúng yêu cầu đặt ra,tích hợp tất các dữ liệu dịch vụ Bưu chính về kho dữ liệu Chươngtrình đã triển khai áp dụng thực tế tại các Bưu cục và Bưu điện tỉnhQuảng Bình bước đầu mang lại những kết quả như mong đợi.Xây dựng được chương trình thống kê và báo cáo doanh thu đãthay thế được cách làm thủ công trước đây mỗi tháng, mỗi quý cácBưu điện huyện, thị lập file excel để quản lý Chương trình trích
Trang 22xuất ra các báo cáo dưới dạng Exel để dễ quản lý và báo cáo lên lãnhđạo đơn vị Các chức năng của phần mềm trả về các biểu thống kê
và báo cáo tương đối chính xác Qua đó làm cho Giao dịch viên tạicác Bưu cục kiểm soát được doanh thu và báo cáo chính xác, nắmbắt được số lượng khách hàng để phân ra các đối tượng khách hàng
để kịp thời có kế hoạch chăm sóc khách hàng
Mặt khác Lãnh đạo đơn vị nắm bắt được kết quả kinh doanhcủa từng Bưu cục và trên toàn đơn vị Qua đó nhằm đánh giá kếtquả, hiệu quả kinh doanh để kịp thời chấn chỉnh và điều phối hoạtđộng kinh doanh phù hợp
3.3.3 Minh họa ứng dụng
22
Trang 23KẾT LUẬN
1 Kết quả đạt được
Đề tài đã tìm hiểu cơ sở lý thuyết về kho dữ liệu, tích hợp dữliệu, đặc biệt là hệ quản trị CSDL SQL server, qua đó có thể ứngdụng trong việc tổ chức lại việc lưu trữ của doanh nghiệp Từ cở sở
lý thuyết đó, chúng tôi đã đề xuất giải pháp tích hợp các CSDL cầnthiết tạo thành kho dữ liệu thống nhất và triển khai xây dựng ứngdụng hỗ trợ trong các hoạt động kinh doanh của đơn vị Hệ thốnghoạt động tốt đúng theo yêu cầu đề ra và bước đầu áp dụng tại cácBưu cục của các đơn vị tại Bưu điện tỉnh Quảng Bình đạt kết quảkhả quan được Lãnh đạo đánh giá cao về lợi ích và thuận lợi cho cán
bộ công nhân viên của đơn vị
3 Hướng phát triển
Mặc dù bước đầu đã áp dụng thành công những vấn đề nêu ra.Tuy nhiên, để có thể hoàn thiện tốt hơn, đề tài cần nghiên cứu bổsung thêm các nội dung sau:
- Cần phải tích hợp CSDL thành một thể thống nhất để khaithác và ứng dụng thêm nhiều ứng dụng khác nhau và tiện ích hơn
Trang 24- Xây dựng hoàn thiện hệ thống tích hợp dữ liệu.
- Nghiên cứu khả năng tích hợp dữ liệu khách hàng từ nhiềunguồn, đặc biệt từ nguồn Internet nhằm phát triển hoạt động kinhdoanh cho doanh nghiệp
24