Mục tiêu Việc xây dựng kho dữ liệu cho ITTTT tổng hợp KTXII phải đảm bảo được các yêu cầu cơ bản: * Xác định đây đủ nội dung thông tín tổng hợp KTXII * Chuẩn hoá hệ thống chỉ tiêu, h
Trang 11
ĐẠI HỌC QUỐC GIÁ HÀ NỘI
TRUONG DAL HQC CONG NGHỆ
Nguyễn Thị Thu Hằng
XÂY DỰNG KHO DỮ LIỆU CHO HE THONG
TONG HOP THONG TIN KINH TE - XA HỘI
Ngành: Công nghệ thông tin Chuyên ngành: Hệ thông thông tin
M& s6: 60.48.05
LUAN VAN THAC SI
NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS Nguyễn Tuệ
Hà Nội — 2009
Trang 2
2
LỚI CAM O'N
Đầu tiên, tôi xin gửi lời cắm on sâu sắc nhất tới TS Nguyễn Tuệ, người hướng dẫn khoa học, đã tận tỉnh chỉ bão, giúp đố tôi thực hiện luận vin
'Lôi xin chân thành cảm ơn 13 Nguyễn Văn Hùng, người tao điều kiên và
giúp đỡ tôi tim hiểu thực tế bải toán để hoàn thành luận văn
Tôi xin chân thành cảm ơn các thầy cô trường Dại học Công nghệ, Dại học Quốc gia Hà Nội đã giảng day và truyền đat kiến thức cho tôi
Cuối cùng tôi xin cảm ơn những người thân và các bạn bẻ dồng nghiệp đã
chia sé, giúp đỡ tôi hoàn thành luận văn nảy
Mặc dù dã hết sức cổ gắng với tất cả sự nỗ lực cửa bản thân, nhưng chắc luận văn vẫn còn những thiểu sót Kính mong nhận dược những ý kiến đóng góp
của quý Thấy, Cô và bạn bẻ đẳng nghiệp
"Tôi xin chân thành cảm ưn!
Hà Nội, ngày 30/11/2009
Toe vién thực hiện
Nguyễn Thị Thư Hằng
Trang 33
LỚI CAM ĐOAN
Tôi xin cam đoan luận văn “Xây dựng kho dữ bệu cho Hệ thống tổng hợp
thông tin kinh tế - xã hột” là công trình nghiên cửu của riêng tôi, không sao
chép của bất kỳ ai Nội dung của luận án dược trình bảy tử những kiến thức
tổng hợp của cá nhân, tông hợp từ các nguễn tải liệu có xuất xứ rồ rằng và
trích dẫn hợp pháp Kết quả nghiên cứu được trình bày trong luận văn này
chưa từng được công bề tại bất kỳ công trình nào khác
Tôi xin chịu hoàn toàn trách nhiệm, và nếu sai, tôi xin chịu mọi hình thức ký luật theo quy định
4à Nội, ngày 30 tháng 11 năm 2009
Học viên thực hiện
Nguyễn Thị Thu Hằng
Trang 44
MỤC LỤC LỠI CAM ON
LOI CAM DOAN
MUc LUC -
BẰNG CÁC KY HIBU VÀ TY VET TAT
DANH MUC HINH VE VA BANG BIEU
MÔ ĐẦU
CHUONG 1-LY THUYẾT XÂY DUNG KHO DU LIEU
1.1 Các khái niệm cơ bản về kho đữ liệu
1.1.1 Kho dit liu — dala warehouse
1.1.2 Các loại đữ liệu trong Data Warehouse
1.2.1 Các giai doạn thiết kế kho dữ liệu 16
CHƯƠNG 2—MÔ TẢ, ĐÁNH GIÁ, PHÂN TÍCH QUY TRÌNH NGHIỆP VỤ
2.1 Quy trình xác định, tạo lập, lưu trữ, cung cấp thông tin tổng hợp KTXII 22 2.1.1 Quy trình xác định, tạo lập và lưu trữ thông tin tổng hợp KTXH tại
2.1.2 Quy trình cung cấp vả tổ chức khai thác thông tin tống hợp KTXH tại
2.2 Quy trình cung cấp và tổ chức khai thác thông tin tổng hợp KTXH: 24
2.2.1 Xác định nội dung và các hình thức cung cấp, khai thác thông tỉn 24 2.2.2 Cung cấp thông tin tới các địa chỉ cần thiết qua đường truyền mạng 25 2.2.3 Cung cấp thông tin tổng hợp K'1XH phục vụ công tác điều hành quan
2.3 Qui trình thực hiện chế dộ thang Lin báo cáo 26
2.3.1 Quy trình nghiện vụ tổng quát 26
2.3.2 Quy trình làm báo cáo tại tại Dộ Xây dựng 26
2.4.2 Hệ thống chỉ tiêu tổng hợp ‘chung của Ba iy Dung 29
2.4.3 Hệ thống chỉ tiêu tổng hợp của các dơn vị 43 CHUONG 3 - XAY DUNG KHO DU LIRU THU NGHIEM
3.1 Gidi thiéu ong cu OLAP trong SQL Server 2005
3.1.1 Gidi thiéu OLAP
3.1.2 Giới thiệu địch vụ OLAP của Microsoft SQL Server
Trang 55
3.1.5 Mô hình kiến trúc của địch vụ OLAP 60 3.2 Thiết kế cơ sở đữ liệu
3.2.2 Thiết kế các chiều lưu trữ dữ liệu
3.3 Cài đặt kho dữ liệu thử nghiệm
3.3.1 Khởi tạo và cải đặt DrojeeL
3.3.2 Khai thác kho đữ liệu
Trang 66
BẢNG CÁC KÝ HIỆU VẢ TỪ VIẾT TAT
BMSL Biểu mẫu số liệu
DW Data Warchouse Kho dữ liệu
EDM Enterprise Data Model Mô hinh dữ liệu mức xí
nghiệp
liệu
KTXH Kinh tế - Xã hội
OLAP On-Line Analytical Processing Xử lý phân tích trực tuyến
SA Subjcet Arca Vùng chủ để
Trang 7Hình 1.1 — Mô phỏng sơ đồ hình sao của một CDSL 18
Hình 1.2 Mô phỏng sơ để tuyết rơi (mở rộng của sơ đỗ hình sao) 19
Hình 1.3 — Mô phống các chiều trong kinh doanh 20
Hình 2.1 — Quy trình xác định, tạo lập, lưu trữ thông tin cấp sở “
TRnh 2.2 — Quy trình thu thập số liệu tại cấp Bộ 24 Hình 2.3 — Mô hình tạo bảo cáo ở văn phòng Bộ XD
TRnh 2.4— Mô hình tế chức đữ liệu của Hệ thống tại cấp BA 28
Hình 3.1 — Mối quan hệ của nhiều loại công nghệ trong Analysis Services
Tĩnh 3.2 Kiến trúc địch vụ OLAP $6
Hình 3.6 Mô hình kiến trúc của địch vụ OLAP
Hình 3.7 — Kiến trúc thành phan Server 62
Hình3.8 Kiến trúc thành phan Client khe
Hình 3.9 —Mé hinh Data Mart cua hệ thông TH KT-XH 66 Tình 3.10 — Khung nhin dit ligu cia Data Mart hé théng
TRnh 3.11 — Cấu trúc khối (cube) TII KTXII cube 67
Hình 3.12 — Két qua trién khai project ‘TH_K'IXH trong, Analysis Service 68
Tinh 3.13 — Báo cáo về tỉnh hình thực hiện quản lý quy hoạch phát triển vật
liệu xây đựng trong phạm vị cả nước của Vụ Vật liệu xây dựng từ năm 2000
đến 2008 69
Hình 3.14 — Báo cáo quan lý quy hoạch phát triển vật liệu xây đựng trong
phạm vi cả nước của Vụ Vật liệu xây dựng từ năm 2000 đến 2008 sử dụng
Hình 3.15 — Đảo cáo sản lượng XI măng các loại tử nắm 2000 dén 2008 — sử
Trang 88
TRnh 3.16 — Báo cáo sẵn lượng sẵn xuất Cát xây dựng của doang nghiệp quốc
đoanh từ năm 2000 đến 2008, so sánh số liệu thực và số liệu ước 72
Trang 9ọ
MỞ ĐẦU
Thể ký 21 lá thời đại của nền kinh tế trí thức Miọi hoại động của chúng ta muốn đạt hiệu quả cao, giảnh được thắng lợi trong thế cạnh tranh gay gắt thì nhất thiết phải có những phương pháp để có được những thông tin, tri thức
cần thiết một cách nhanh vả chính xác
Việc áp dụng công nghệ thông Im vào thực tiễn sắn xuất nghiệp vụ dã mang
lại những hiệu quả và lợi ích to lớn Công nghệ ngày cảng được phát triển, hoàn thiện hơn để đáp ứng những yêu cầu ngày càng cao của thực tế nghiền cứu, quản lý sản xuất và nghiệp vụ Sự mở rộng qui mô áp đụng từ những ứng đụng đơn lẻ đến các hệ thông thông tin cỡ lớn đã dẫn đến những thành công
vượt bậc trong nghiệp vụ Các hệ thông thông tin tử chỗ chỉ giải quyết những
xử lý công việc hàng ngày nay dã tiến tới đáp ứng được những yêu chu ở mức
độ cao hơn Các nhà quản lý điêu hành không những biết được công việc
dang diễn ra như thế nào mà còn biết cải gì sẽ xây ra sau đó, có nghĩa là thông tin mang tính phân tích và hệ thống thông tin có khả năng hỗ trợ quyết định
Hiện nay, phương pháp xây dựng kho dữ liệu đã phát triển cả về lý thuyết
cũng như thực tế Lý thuyết xây dựng kho dữ liều đã được hình thành rõ nói
bên cạnh đỏ các nhà cung cấp phần mềm cũng đã đưa ra các công cụ để xây đựng, lưu trữ, duy tri và phát triển kho dữ liệu Một kho đữ liệu có thể giúp đỡ
các nhà quản lý, các doanh nghiệp có khả năng quản lý đỡ liệu, khai thác
thông tin để đưa ra những quyết định nhanh chóng và phủ hợp
Quá trình tìm hiểu thực tế việc tin học hóa quán lý hành chính nhà nước cho
thấy việc tổng hợp và quản lý các thông tin về kinh tế - xã hội hàng ngày, để cung cấp thông tin cho “quá trinh phân tích, hoạch định chiến lược và hỗ trợ
ra quyết dịnh” là một nhu oầu bức thiết của những người quản lý, là thách thức, bải toán thực tế dang được tìm hướng piải quyết
Đề tài này dựa trên những lý thuyết, phương pháp luận, công cụ xây đựng kho
đữ liêu, từ đó triển khai xây dựng một khe dữ liêu thực tế, nhằm hướng tới giải quyết yêu cầu của bài toán nói trên Luân văn gồm 3 chương:
Chương 1: Lý thuyết xây dựng kho dữ liệu Chương này trình bảy những
khái niệm cô đọng nhất về Data warehouse và các bước thiết kế kho dữ liệu
cho Hệ thống
Chương 2 Mô tả, đánh giá, phân Lich quy trình nghiệp vụ của Hệ thắng Tổng
hợp thông tin kinh tế - xã hội phục vụ điều hành cho Dộ Xây Dựng
Chương 3 Xây dung kho đỡ liêu thứ nghiệm Chương này trinh bảy việc
xây dựng kho đữ liệu thử nghiệm dựa trên SQI Server 200%
Trang 1010
Giới thiệu bài toàn Xây dựng kho dữ liệu cho Hệ thống tổng hợp thông
tin kinh tế - xã hội
Tổng hợp Kinh tế - Xã hội (KTXH) là một hệ thống thông tin dược xây dựng nhằm góp phan tin hoc hỏa quản lý hành chính nhà nước “Thông tin tổng hợp
KTXIT' được hiểu là thông tin phản ánh các điễn biến về KTXI1 đã được tổng hợp từ các hiện tượng KTXII phát sinh ở các đơn vị kinh tế cơ sở để phục vụ công tác chỉ đạo điều hành trong hệ thống các cơ quan hành chính nhà mước
Don vị kinh tế cơ sở gồm: Cơ quan nhà nước, đơn vị sự nghiệp, đơn vị thuộc
lực lượng vũ trang nhân đân, tổ chức chính trị, tổ chức chính trị - xã hội, tổ chức chỉnh trị xã hội - nghề nghiệp, tổ chức xã hội, tổ chức xã hội - nghề nghiệp, đoanh nghiệp vả các đơn vị trực thuộc doanh nghiệp thuộc mọi thành
phần kinh tế, hợp tác xã, tổ hợp tác, hộ kinh doanh cá thể, hộ gia đỉnh, cá nhân, các tổ chức khác của Việt Nam ở trong nước, ở nước ngoài và tổ chức,
cá nhân nước ngoài hoạt động trên lãnh thỗ Việt Nam
Quá trình tim hidu thực tế cho thấy mỗi Uy ban nhân dân tính hoặc các bệ,
ngành đều có nhu cầu nắm bắt, tổng hợp và quần lý các thông tin về kinh tế -
xã hội hàng ngày, để cung cấp thông tin cho “quá trình phân tích, hoạch định chiến lược và hễ trợ ra quyết định”
Hệ thống Tổng hợp thông tin kinh tế xã hội đã được tim hiểu, khảo sát vả
triển khải thử tại nhiều địa phương như Thanh Hóa, Hà Nam, Lạng Sơn các bộ ngành như bộ Xây dựng Từ khảo sát thực tế đã chỉ ra những bất cẤp
trong việc thu thập và lưu trữ thông trm kinh tẾ - xã hội hàng ngày của các UBND, các bộ các ngành Việc thu thập thông in thi công, thông tin được
lưu trong các file tài liệu rời rạc hoặc những CSDL riêng biệt, gầy khó khăn
cho việc tổng hợp số liệu, thống kê số liệu, đẫn đến việc phân tích thông tin,
hỗ trợ các quyết định chiến lược của các cấp lãnh đạo chưa thực sự nhanh chóng va hiệu quả
Để giải quyết những bắt cập và đáp ứng nhu cầu thực tế, đã có nhiều để án cụ thé được đưa ra xem xét, một trong số các để án giải quyết những hạn chế nêu trên là xảy dựng kho dữ liện Khôi lượng công việc rất lớn, có phạm vi rộng
và thời gian thực hiện khéo đải Do vậy, bài toán trong luận án nay sẽ tim
hiểu, đi sâu và xây dựng kho đữ liêu cho HTTT tổng hợp KTXH phục vụ điều
hành của Bộ Xây Dựng
HLT tổng hợp KTXH phục vụ điều hành quản lý tại Hộ XI) có nhiệm vụ xác định, tạo lập, lưu trữ, xử lý và quản lý các thông tin tẵng hợp liên quan
đến tắt lĩnh vực hoại dộng KTXH như kinh tế tẳng hợp, kinh tế ngành,
tổ chức cán bộ, của Bộ XD, từ đó hình thánh các kho đữ liệu về các số liệu
chỉ tiêu tổng hợp KTXHI và các thông tin bdo cáo, nhằm:
Trang 11
HH
** Cung cấp thông tin tổng hợp phục vụ chỉ đạo điêu hành của lãnh đạo, các
hoạt động chuyên môn, nghiệp vụ của các bộ phận và các chuyên viên lại
văn phòng Bộ XI2, tại các cục, vụ, viên, và các dơn vị trực thuộc Bộ XI)
(kŠ cả các sở XD thuộc các tỉnh/ thành phố trong cá nước)
** Phục vụ việc thực hiện chế độ thông tin báo cáo từ các đơn vị lên văn
phòng Hộ X2 và từ Bộ lên Chính phủ
Mục tiêu
Việc xây dựng kho dữ liệu cho ITTTT tổng hợp KTXII phải đảm bảo được
các yêu cầu cơ bản:
* Xác định đây đủ nội dung thông tín tổng hợp KTXII
* Chuẩn hoá hệ thống chỉ tiêu, hệ thống mẫu biểu số liệu (AMSL), thống nhật các loại số liệu, các thông tin danh mục dùng chung:
** Có khả năng trích lọc, chuyển đổi, kết xuất, tích hop dif Liéu tir cde CSDL chuyên ngành của các đơn vị (nêu có) vào Kho dữ liệu thông tin tống hợp
KTXH
“TA u trữ, quản lý toản bộ các số liệu chỉ tiểu, dữ liệu báo cáo của các dơn vi cấp cục, vụ, viện và của Dộ, bình thành các kho đữ Hiệu về sẽ liệu chỉ tiêu,
vỀ cáo thông tin bảo cáo, được phân loại một cách có hệ thống và thống
nhất Các kho đữ liệu sẽ được tổ chức theo mô hình thông nhất để có thể
tích hợp chúng với nhau một cách thuận tiện va dé dang
% Trên cơ sở các kho đữ liệu về thông tin tổng hợp KTXII, tổ chức các hình
thức khai thác thông tin dưới dạng thông tin kết xuất theo khuôn dạng dịnh
sẵn và các đạng thông tin kết xuất động theo yêu cầu, cung cấp các công
cụ thống kê, phân tích, dự báo liên quan đến các lĩnh vực KTXH để hỗ trợ
ra quyết định, xuất bản thông tin lên
Bai toán sẽ đi tìm hiểu và phân tích các quy trình xác đinh, tạo lắp, lưu trữ vả
khai thác thông tin trong hệ thông tổng hợp K'TXH, tìm hiểu các loại,
liệu được lưu trữ dễ từ đó Ay dung cơ sở đữ liệu cho kho dữ liệu
iéu dit
Công cụ sử dụng trong việc xây dựng kho dữ liệu được sử dụng trong bài toán
là hệ quân trị co sé dit ligu Microsoft SQL Server 2005
Trang 1212
CHƯƠNG 1 - LÝ THUYÉT XÂY DỰNG KHO DỮ LIỆU
1.1 Các khái niệm cơ bân về kho dữ liệu
1.1.1 Kho đữ liệu — đata warehouse
1.1.1.1 Định nghia kho dit ligu — data warehouse
Kho dit ligu (Data Warehouse - DW) la tuyén tip các cơ sở dữ liệu tích hợp,
hướng chủ để, được thiết kế để hỗ trợ cho chức năng trợ giúp quyết định, mả
mỗi đơn vị đữ liệu dều liên quan tới một khoảng thời gian cụ thể
Công nghệ “Kho đữ liệu” (Data Warehouse Technology) la tap cdc phương pháp, kỹ thuật và các công cụ có thể kết hợp, hỗ trợ nhau để cung cấp thông
tin cho người sử đụng trên cơ sở tích hợp từ nhiều nguồn dữ liệu, nhiều môi
trường khác nhau (Theo John Ladley)
Công nghệ DW ra đời nhằm đáp ứng mọi yêu cầu về thông tin của người sử dụng, hỗ trợ để các nhân viên của "tổ chức" thực hiên tốt, hiệu quả công việc của minh, như có những quyết định hợp lý, nhanh và bán được nhiều hang
hơn, năng sẵn cao hơn, thu dược lợi nhuận cao hơn, v.v Giúp cho tổ chức xác định, quản lý và diều bành các dự án, các nghiệp vụ một cách hiệu quá vả
chính xác, ngoài ra DW tích hợp đữ liệu và các siêu dữ liệu từ nhiều nguồn
khác nhau
Kho dữ liên thường rất lớn tới hàng trăm GB hay thâm chi hang Terabyte
Kho dữ liệu được xây dựng để tiện lợi cho việc truy cập theo nhiều nguồn, nhiều kiểu dữ liệu nhau sao cho có thê kết hợp được cả những ứng dụng
của các công nghệ biện đại vả kế thừa được từ những hệ thống đã có sẵn từ
trước [1]
1.1.1.2 Dặc tính của kho dữ liệu
Tữ liệu trong DW có những đặc Lính cơ bản sau
+* Hướng chú đề (Object Oriented)
Dữ liệu được tập hợp, phân lớp, lưu trữ và xử lý theo từng chủ để, để dễ đảng xác định được những thông tín cân thiết trong từng hoạt động Các dữ
liệu của mỗi chủ dễ chính trong tổ chức được liên kết với các khóa dại điện
và đưa vào củng một vị trí
+# Tích hợp (Inteprated)
Một tê chức có rất nhiều đữ liệu từ nhiều hệ thống khác nhau Dữ liêu tập hợp trong kho dữ liệu được thu thập từ nhiều nguồn và trôn ghép với nhau tạo thành một thể thing nhất Việc hợp nhất các dữ liêu nảy trở thành một
Trang 133
tập hợp dữ liệu có nghĩa cho việc phân tích là rất khó khăn Dữ liệu tích
hợp phải đâm bảo tính nhất quán, đôi khi chấp nhận sự dư thừa dữ liệu để tăng hiệu quả của các truy vấn
*+ Tính 6n định, không biến động (nen- volatility)
Dữ liệu wong DW là đữ liệu chỉ dọc và chỉ có thể dược kiểm tra, không
được sửa đổi bởi người sử dụng đầu cuối Nó chỉ cho phép thực hiện hai thao tác cơ bản: nạp đữ liệu vào kho và truy cập vào vào các vùng trong
DW
Tỉnh không biến động thể hiện ở chỗ: Dữ liệu được lưu trữ lâu dai trong
kho dữ liệu Mặc dù có thêm dữ liệu mới nhập vào nhưng dữ liệu cũ trong,
kho vẫn không bị xoá, điều đó cho phép cung cấp thông tin về một khoảng thời gian đài, cung cấp đủ số liệu cần thiết cho các mô hình nghiệp vụ phân
tích, dự bảo, từ đó có được những quyết định hợp lý, phủ hợp với các qui luật tiến hoá cũa tự nhiên
+#* Tính thời gian cụ thể
Một kho dữ liệu bao hàm một khỗi lượng lớn dữ liệu lịch sử Dữ liệu được
Iưu trữ thành một loạt các bản sao, mỗi bản sao phản ảnh những giá trị của
đữ liêu tại một thời điểm nhất đính, thể hiên một khung nhìn của một vùng
chủ để trong một giai đoạn Do vậy, DW cho phép khôi phục lại đỡ liệu lich sử và so sánh một cách chỉnh xác các giai doạn khác nhau Yếu tố thời
gian đóng vai trỏ như một phần của khóa để đảm bảo tính đơn nhất của mỗi ban ghỉ và cung cấp đặc trưng về thời gian cho dữ liệu
Dữ liệu trong kho đữ liệu tác nghiệp cần phải chính xác ở chính thời điểm
truy cập, còn ớ DW chỉ cần có hiệu lực trong khoáng thời gian nảo đó, trong khoảng Š đến 10 năm hoặc lâu hơn Dữ liệu của CSDL tác nghiệp
thường sau một khoảng thời gian nhất định thì sẽ trở thành đữ liệu lịch sử
và chúng sẽ được chuyển thành kho đữ liệu Dỏ chính là những dữ liệu hợp
lý về những chủ điểm cần lưu trữ
1.1.1.3 Các yêu cầu chức năng của kho đữ liệu
*+ Khả năng cân bằng (scalable) : Kho đữ liệu có khả năng lưu trữ và quản lý
một số lượng khổng lỗ các giao địch vả đữ liệu tổng hợp Kho đữ liệu có
thể lớn lên theo thời gian, có thêm dữ liệu mới hoặc giữ lại dữ liêu lịch sử
cho một thời gian đải mà không bị quá tãi, vẫn đâm bão tính ổn định hoại
động
+* Khả năng quần trị (manageable): Kho dữ liệu có kh năng quán trị việc tạo
quyết định
Trang 1414
“# Khả năng sẵn sàng (avaiable) : Kho đữ liệu luôn sẵn sảng bất kỳ khi nảo
cân
+ Khả nắng mở rộng (oxtensible): Thực hiện 1 cách đỗ đảng khi Ihêm các
loại đữ liệu mới, đữ Hệu kết hợp và dữ liệu tổng hợp và kho đữ liệu
** Khả năng mềm dẻo (Flexible): hễ trợ nhiều cách truy nhập dữ liệu chỉ tiết,
đữ liệu tổng hợp theo phân tích nhiều chiêu
*+ Khả năng tích hợp (integrated): kho dữ liệu phải có khả năng tích hợp đầy
đủ với các hệ thông sẵn có, môi trưởng tác nghiệp Do vay, có thể tai dữ
liêu từ nhiều nguồn
** Khả năng truy cập sử dụng được (Accessible): Kho đữ liệu phải có khả
năng Iruy cập sử dụng dược, từ các công cụ mềm dẽo lới phạm vi rong rai
người sử đụng,
* Khả năng tin cậy (Reliable): dữ liệu tấi từ nhiều nguồn khác nbau phải
được hợp nhất, chuẩn hóa bảo đấm tính toàn vẹn đữ liệu và hợp lệ tại một
thời điểm bắt kỳ
1.1.1.4 Kho dữ liệu cục bộ - Datanmart
Kho đữ liệu cục bộ (Datamart — DM) là CSDL có những đặc điểm giống với
kho dữ liệu nhưng với quy mê nhỏ hơn và lưu trữ đữ liệu về một lĩnh vực, một chuyên ngành Datamart là kho đữ liệu hướng chủ để Các Datamart có
thé dược hình thành tử một tập cơn đữ liệu của kho dữ liệu hoặc cũng có thể
lập va sau khi xây dưng xong, các đatamart có thể dược
ới nhau tạo thành kho đữ liệu Vì vậy có thế xây dung
g việc xây dựng các Datamart hay ngược lại xây dựng
dược xây dung di
diện vật lí, thường được lưu trữ trên một scrver riêng, trong một mạng cục bộ phục vụ cho một nhóm người nhất định Đôi khi datamart một cách dơn giần
với công nghệ OLAP tạo ra các quan hệ theo đạng hỉnh sao đặc biệt hoặc
những siêu khối (hypercube) dữ liệu cho việc phân tích của một nhóm người
có cùng mỗi quan tâm trên một phạm vì đữ liệu [2]
Có thể chia ra làm 2 loại: Datamart độc lập và Datamart phụ thuộc
Trang 15l
1.1.2 Các loại dữ liệu trong Data Warehouse
1.1.2.1 Dữ liệu nghiện vụ
Dữ liêu nghiệp vụ (Business data - BD) là đữ liêu dùng để vận hành và quản
lý một doanh nghiệp hoặc một tổ chức Nó phản ánh những hoạt động của
đoanh nghiệp và những đối tượng trong thế giới thực như là khách hàng, địa diém, sén phẩm v.v Nó dược tạo ra và sử dụng bởi các hệ thông xử lý giao
tác cũng như các hệ thống hỗ trợ quyết định
1.1.2.2 Siêu dữ liệu (Metadata)
Metadata là dữ liệu về đữ liệu được sử dụng trong DW (hay gọi là siêu dữ
liệu) trả lời các câu hỏi ai, cái gì, khi nào, tại sao, như thể nào về dữ liệu Nó
dược sử dụng cho việc xây dựng, duy trì, quân lí và sử dung DW Metadata la
một trong những phương điện quan trọng nhất của DW
++ Siêu đữ liệu nghiệp vu (Business Metadata): Chita dung những thông tin
khiến chơ người sử dụng dễ dàng hiểu được khung cảnh của thông tia
được lưu trữ rong DW
+® Siêu đữ liệu kĩ thuật (Technical Moladata): Chứa đựng những thông trn về
dữ liệu trong IDW của những người thiết kế và quản trị khi tiến hành công
việc phát triển và quân lí
** Siêu dữ liệu tac nghiép ( Operational Metadata)
Metadata hỗ trợ trực tiếp cho người sử đụng giúp họ có thể hiểu dược nội
dung và tìm thấy được dữ liệu cần thiết Trong thực tế khả năng kết hợp của
công cụ trích lọc dữ liệu và Meladata côn rất kém Do đó cần phải Lạo ra
những giao diện đùng Mietadata cho người sử dụng
Moladata định nghĩa nội dung và vị trí cúa đữ liệu trong DW, mỗi quan hệ giữa cơ sở dữ liệu tác nghiệp với DW và các khung nhin đữ liệu của DW có
thể truy nhập được bởi công cụ của người sử dụng đầu cuối Người sử đụng đầu cuối cần đến Metadata khi cần đến những định nghĩa dữ liệu hay các vùng chú thể
TẤU cả ác thành phần của DW đều cần và có thể lấy dữ liệu từ Metsdata Metadata duoc lưu trữ ở khu vực trung lâm Meladata có thể xuất hiện theo nhiều khuôn đạng và có thể trong suốt
Trang 161.2 Thiết kế kho đữ liệu
1.2.1 Các giai đoạn thiết kế kho đữ liệu
Có nhiều phương pháp thiết kế kho dữ liệu, mặc đủ khác nhau nhưng nhìn chung các phương pháp đều chứa một số công việc cơ bản cho việc thiết kế
kho dữ liệu gồm các giai đoạn sau: [2]
+È Xác định mé hinh nghiép vu (Defining the business model)
Phân tích các định hưởng chiến lược để rút ra các quá trình nghiệp vụ được
thực hiện trong kho dữ liệu Các yêu cầu nghiệp vụ phải được phân tích, xác định vả tải liệu hóa đơn vị đo vá chiều nghiệp vụ (businesss measures
và business demensions) cho mỗi quá trình nghiệp vụ
+’ Xac dinh mé hinh logic (Defining the logical model)
Dung ky thuật đồ họa để thể thiện các định nghĩa, đặc điểm và mỗi quan hệ của dữ liệu trong nghiệp vụ, hoặc khái niệm chuyên môn, nhằm mục dích
mô tä hệ thống cho người sử dụng cưối Thông thường phương pháp này
ding chuẩn 3NF
+ð Xác định m6 hinh Demensional (Defining the demensional model)
Mô hình nghiệp vụ được chuyển thành mô hình Iemensional, lược để các
bang và thuộc tính của bảng được định nghĩ, liên kết giữa các bảng dược tạo dựng vả nguồn của kho dữ liêu dược xác dịnh
+* Xác dịnh mô hình vật ly (Defining the physical model)
Mồ hình Demensional được chuyển thành mô hình vật lý, bao gồm các khai báo về định nghĩa kiểu dữ liệu của các thuộc tính, khích thước dự tính,
chiến lược tạo chỉ mục (Index) và lưu trữ dữ liệu
1.2.2 Mô hình dữ liệu
Mô hình DW được phát sinh từ một mô hình đữ liệu tổng thể (mô hình dữ
ligu mite xi nghiép) (Enterprise Data Model - IDM) Mét EDM 1i mét bire
tranh tổng thể mã các mô hình khác có thể hoạt đông trên đó Nó được tổ chức thành các vùng theo cha diém, Subject Area - SA [a phân chính của sự
chia nhỗ các công việc
Tếu một tổ chức không có sẵn EDM thích hợp, EDM cũ dược phép dùng tiếp
và bỗ sung các SA mới
An duoc quan tâm dap ứng như cầu người sử dụng
Để bắt dầu việc thiết lập một mô hỉnh, cần quan tâm tới khung nhìn tại vị tri hiện tại và trong tương lai sắp tới Vị trí hiện tại có nghĩa là mô tả và hiểu
những dữ liệu được chứa Irong những hệ thống kế thừa (nguồn kế thừa) Nếu
Trang 17Mô hình dữ liệu DW có tính chủ để, phụ thuộc vào công việc nghiệp vụ vả
các vin dé nay sinh Mô hình dữ liệu của DW có thể thiết lập theo
4 So dé hinh sao (Slar Schema)
4 Sơ dỗ Luyết rơi (SaowlDake)
“ Mé hinh da chiéu (Multiple Dimension)
1.2.2.1 So dé hinh sao (Star Schema)
So dé hình sao được đưa ra lần đầu tiên béi Dr Ralph Kimbali nhy 14 mét lựa
chọn thiết kế cơ sở dữ liệu cho DW Nó được gọi là sơ đỗ hình sao bởi vì các
sự kiện nằm ở trung tâm của mô hình và dược bao quanh bởi các phạm vi liên
quan, rất piống với các diễm của một ngôi sao Sơ dỗ hình sao cho phép một
hệ thống đối tượng có thể kết nỗi với nhiều đối tượng khác Mô hình này thể hiện cách nhìn của người sử dụng về nhiều vẫn đề trong tác nghiệp
‘Trong so đồ hình sao, dữ liêu được xác định và phân loại theo 2 kiểu:
s* Các sự kiện được tổ chức thành bảng Fact
Bang Iact chứa các thông tin cơ sở ở mức giao tác ở trong nghiệp vụ mà các ứng dụng cần thiết Ví dy, khi phân tích dữ liệu kinh doanh thì cần những đữ liệu về những mặt hàng đã bán được trong các giao địch bán
hàng về số lượng, chủng loại, giá thành, v v Những đữ liệu này déu dược
lưu ở bảng Fact của kho đữ liệu Tuy nhiên, trước khi các đữ liêu này được
đưa vào kho dữ liệu thì cần phải chọn một trường đữ liệu nào đó thường sử
dung trong các chiều phân tích để tham chiểu (xem như khoá ngoại trong,
các quan hệ liên kết) vả sau đó đưa vào bảng các chiều Các sự kiện là các
đại lượng số của công việc Các bảng Fact thường rất lớn, chửa hàng triệu
déng ma phan lớn là số
** Phạm vị, hay các chiều của đữ liệu, được tổ chức thành các bảng Dimension
Bảng I2imension, ngược lại, thường là tương đổi nhô so với các báng Eact,
chứa các thông tin mô tả Đó là các bộ lọc hoặc các ràng buộc của những,
sự kiện & bang Fact Bang Dimension chira cáo dữ liệu cần thiết cho việc thực hiện các giao lác nghiệp vụ theo một chiều, hay phạm vi nào đó, Ví
dụ, trong ứng dụng phân tích kinh doanh, bảng Dimension bao gồm: thời
gian, vũng bản hàng, loại sân phẩm, VV
Trang 18Hinh 1.1 Mé6 phéng so 46 hirh sao ota mét CDSL
Ưu diễm của sơ đồ hình sau
“© HG tro rat da dang các cầu truy vấn vả xử lý khá hiệu quả những câu truy
van dé
*+ Phù hợp với thói quen của người sử dụng nhận và sử dụng dữ liệu, nên dữ liệu được hiểu trực quan hơn
So dé nay rất trực quan, dễ sử dụng, thể hiện khung nhỉn da chiều của dữ
liệu dùng ngữ nghĩa của cơ sở đữ liệu quan hệ Khóa của bắng sự kiện
được tạo bởi những khóa của các bảng chứa thông tin theo lừng phạm vì
Wimension Table) Tat cả các khóa đều được xác định với cùng một chuân
đặt Lên
1.2.2.2 So dé tuyét roi (Snowflake)
So đồ hình tuyết rơi là một sự mở rông của sơ dé hình sao tại đó mỗi cánh sao
không phải là một bảng Dimension mà là nhiều bằng
Trong dang sơ đổ này, mỗi bảng theo chiều của sơ đỗ hình sao được chuẩn hỏa hơn Sơ đồ hình tuyết rơi cải thiện năng suất truy vấn, tối thiểu không
gian dĩa cần thiết để lưu trữ đữ liệu vả cải thiện năng suất nhờ việc chỉ phải kết hợp những bảng có kích thước nhỏ hơn thay vì phải kết hợp những bảng,
có kich thước lớn lại không chuẩn hóa
Nó cũng làm tăng tính linh hoạt của các ứng dụng bởi sự chuẩn hóa và ít mang ban chất theo chiều hơn Nó làm tăng số lượng các bảng và làm tăng
tính phúc tạp của một vải truy vấn cần có sự tham chiều tới nhiều báng,
Trang 19
qua thời gian”
Những người thiết kế kho dữ liệu thường lắng nghe cần thận những từ đó và
họ thêm vào những nhấn mạnh đặc biệt của họ như: “Chúng đói kinh doanh
các sửn phẩm trong nhiều thị trường khác nhau, và chúng lôi đánh giá hiệu
quã thực hiện của chúng tôi qua thời gian”
Một cách trực quan, việc kinh doanh như một khối (cube) dữ liệu, với các
nhãn trên mỗi cạnh của khối Các điểm bên trong khối là các giao điểm của các cạnh Với mô tả kinh đoanh ở trên, các cạnh của khối là Săn phẩm, Thị
trường, và Thời gian Ilầu hết mọi người đều có thể nhanh chóng hiểu và tưởng tượng rằng các điểm bên trong khối là các độ đo hiệu quả kinh doanh
mà được kết hợp giữa các giá trị Sản phẩm, Thị trường và Thời gian
Trang 20Sin phim Thời gian
“Thị trường |
Hình 1.3 - Mô phỏng các chiều trong kinh doanh
Một khối dữ liệu {datacube) thì không nhất thiết phải có cấu trúc 3 chiều (3-
D), nhưng về cơ bản là có thể có N chiều (N-D) Những cạnh của khối được
gọi là các chiều (dimensions), ma đó là các mặt hoặc các thực thể ứng với
những khía cạnh mà tổ chức muốn ghi nhận Mỗi chiều có thể kết hợp với
một bảng chiều (dimension table) nhằm mô tả cho chiều đó Ví dụ, một bảng chiều của Sản phẩm có thể chứa những thuộc tính như Ma_sanpham, Mo ta,
Ten sanpham, Loai §P mà có thể được chỉ ra bởi nhà quản trị hoặc các nhà phân tích dữ liệu Với những chiều không được phân loại, như là Thời
gian, hệ thông kho dữ liêu sẽ có thể tự động phát sinh tương ứng với bảng chiều (dimension table) dựa trên loại dữ liệu Cần nói thêm rằng, chiều Thời
gian trên thực tế có ý nghĩa đặc biết đối với việc hỗ trợ quyết định cho các
khuynh hướng phân tích Thường thì nó được mong muốn cỏ môt vài tri thức
gắn liền với lịch và những mặt khác của chiều thời gian
Hơn nữa, một khối dữ liệu trong kho dữ liệu phần lớn được xây dựng để đo hiệu quả của công ty Do đó môt mô hình dữ liêu đa chiều đặc thù được tổ
chức xung quanh một chủ đề mà được thể hiên bởi một bảng sự kiên (fact
table) của nhiều độ đo số học (là các đối tượng của phần tích) Ví dụ, một
bảng sự kiện có thể chứa số mặt hàng bán, thu nhập, tồn kho, ngân sach, Mỗi độ đo số học phụ thuộc vào một tập các chiều cung cấp ngữ cảnh cho độ
đo đó Vì thể, các chiều kết hop với nhau được xem như xác định duy nhất độ
đo, là một giá trị trong không gian đa chiều Ví dụ như một kết hợp của Sản
phẩm Thời gian, Thị trường vào 1 thời điểm là một đô đo duy nhất so với các kết hợp khác
Các chiều được phân cấp theo loại Ví dụ như: chiều Thời gian có thể được mô
tả bởi các thuộc tính như Năm, Quỷ, Tháng và Ngày Mặt khác, các thuộc tinh
của một chiều có thể được tổ chức vào một lưới mà chỉ ra một phần trật tự của
chiều Vì thể, cũng với chiều Thời gian có thể được tổ chức thành Năm, Quý,
Tháng, Tuần và Ngày Với sự sắp xếp này, chiều Thời gian không cỏn phân cấp vi có những tuần trong năm có thể thuộc về nhiều tháng khác nhau
Vi vậy, nếu mỗi chiều chứa nhiều mức trừu tượng, dữ liêu có thể được xem từ
nhiều khung nhìn linh đông khác nhau Một số thao tác điển hình của khối dữ
Trang 2121
liệu như roll-up (ling mirc dé trừu tượng), drill-down (giảm mức đệ trừu
tượng hoặc tăng mức chỉ tiếU, slice and dice (chọn và chiếu), và pivot (định
hướng lại khung nhìn đa chiêu của đỡ liệu), cho phép tương tác truy vẫn vả
phân tích dữ liệu rất tiện lợi Những thao tác đó được biết như Xử lý phân tích tne tuyén (On-Line Analytical Processing — OLAP)
Những nhà ra quyết định thường có những câu hỏi có dang như “tính toán va xếp hạng tổng số lượng hảng hoá bản được theo mỗi quốc gia (hoặc theo mỗi năm)” Họ cũng muốn so sánh hai độ đo số học như số lượng hàng bán và
ngân sách được tổng hợp bởi cùng các chiều Như vậy, một đặc tính để phần
biệt của mô hình dữ Hệu đa chiều là nó nhắn mạnh sự tổng hợp của các độ do
bởi một hoặc nhiều chiều, mả đó là một trong những thao tác chính yếu để
tăng tốc độ xử lý truy vấn [1]
Trang 222
CHUONG 2- M6 TA, BANH GIA, PHAN TICH QUY
TRINH NGHIEP VU CUA HE THONG TONG HOP
KINH TE - XA HOI
2.1 Quy trink xác định, tạo lập, lưu trữ, cang cấp thông tìn tổng hợp
XIXI
Các quy trình được thiết lập ở trong phân này sử dụng tải liệu [3]
Quy trình nảy được thực hiện tại (Ất cả các cơ quan cấp số XD, các đơn vị
trực thuộc vả tại văn phòng Bộ XD Bây là quy trình đóng vai trỏ trọng tâm,
có nhiệm vụ tạo nguồn đữ liệu cho kho đữ liệu Quy trinh được chia thành hai quy trình cơn:
+* Quy trình xác định, tạo lập và lưu trữ thông tin ting hop KTXII tai các
là các sở XD của các tỉnh/ thành phố va các đơn vị trực thuộc Bộ XD như các
'tlỗng Công ‡y (công ty), ede đơn vị sự nghiệp như Viện, Trường, Trung
tâm,
Các đơn vị trực thuộc lưu trữ các số liệu phục vụ điều hành tại các đơn vị và
gửi đữ liệu về TT THDL tại Bộ XD
2.1.1 Quy trình xác định, tạo lập và lưu trữ thông tin tổng hợp KTXIH tại các đem vị trực thuộc Bộ XD
Dữ liệu tại cấp sở được lấy trực tiếp từ CSDL tổng hợp của cấp huyện và các
sở ngành khác thông qua các kết nổi trục tiếp Nguồn đữ liệu cung cấp cho sở cỏn do sự thu thập của các phỏng chuyên ngành thông qua các cuộc khảo sát
và pác thông tin từ các doanh nghiệp,
Các chuyên viên của các phòng chuyên ngành có trách nhiệm thu thập số liệu
từ các nguồn đã mô tả để tạo ra các số liệu tổng hợp của sở quản lý Cũng như cấp huyện, có hai loại số liệu tổng hợp: chưa được xác nhận và đã được xác nhận Cho đến khi có số liệu được xác nhận cần phải coi số liêu tổng hợp
chưa dược xác nhân có giá trị phục vụ diều hành của đơn vị vả gửi lên trung, tâm tổng hợp dữ liệu tỉnh, VP Bộ XD.
Trang 23ngành i tông hợp
SDL TH ofp
tuyện tị
Hình 2.1 Quy trình xác định, tạo lập, lưa trữ thông tin cấp sở
2.1.2 Quy trình cung cấp và tổ chức khai thác thông tin tông hợp
KTXI tại các đơn vị trực thuộc Bộ XD
Số liệu tổng hợp tại Trung Tam tổng hop dữ liệu Bộ XD được lấy trực liếp từ
các kho đữ liệu tổng hợp tại các sở XD, các Tổng Công ty (công ty), các don
vị Viện, Trường, Trung tâm trực thuộc Bộ thông qua truyền số liệu (hoặc
đồng bộ hoá dữ liệu) Dồng thời số liệu còn được thu thập từ chính các phòng chuyên môn trong VP Hộ XD vả các nguồn khác
Trước đây, số liệu không được thu thập trực tiếp mà phải thông qua các báo
cáo Để thực hiện lưu trữ số liệu tổng hợp phục vụ điều hành, Bộ XD cần phải
ban hành các quy định và sửa đổi mẫu thu thập số liệu
Nguồn cung cấp số liễu tổng hợp đáng kế cho kho đữ liệu tổng hợp của Độ
XD xuất phát từ các sở XD lại các tỉnh/thành phế TIiện tại, các sở XD của
các tính“thành phố đã triển khai IITTT TII KTXII cấp tỉnh và hệ thống chỉ tiêu tổng hợp của sở XD đã được chuẩn hóa theo hệ thống chỉ tiêu tống hợp chung của tỉnh
Trang 24Hình 22 Quy trình thu thập số liệu tại cấp Bộ
2.2 Quy trình cung cấp và tô chức khai thác thông tìn téng hep
KTXIT
Cung cấp và tế chức khai thác thông tin theo yêu cầu của các đối tượng người
sử dụng là chức năng chứng tỏ tính hiệu quả cũng như mức độ thực hiện thành công các mục tiêu và yêu cầu của kho đữ liệu
Quy trình (chức năng) này được thực hiện tại tắt cả các cơ quan cấp sở, đơn vị
trực thuộc và tại VP Bộ XD nhằm thoả mãn các nhu cầu về thông tin tổng hợp KIXH phục vụ điểu hành quản lý của lãnh đạo cơ quan, đội ngũ cản bệ,
chuyên viên của cơ quan và của lãnh dạo Bộ XD Đối với mỗi loại dối tượng,
người sử đụng và tại từng cơ quan, cách thức, hình thức khai thác vá nội dung
théng tin khai thác cần được phân tích cụ thể
2.2.1 Xác định nội dưng và các hình thức cung cấp, khai thác thông tin
s#* Hình 2.1, 2.2 ỡ mục trên đã phân loại các dối tượng sử dụng vả cáo dịa chỉ
cần cung cấp thông tim
% Déi voi mỗi loại đối tượng người sở dụng, cần xác định
"Ndi dung thông tin cần khai thác
Trang 2525
" Các hình thức, các khuơn dạng tĩnh, khuơn dạng động khai thác thơng
un
= Dinh ky khai thac thong tin
2.2.2 Cung cấp thơng tin tới các địa chỉ cần thiết qua đường truyền
ac don vi true thude BG XD (Cue, Vu Vin, trường, ) cung cấp
théng tin téng hợp KTXH cho kho đữ liệu của Bộ XD
2.2.3 Cung cấp thơng tin tổng hợp KTXIH phục vụ cơng tác điều hành
quản lý
Các Kho dữ liệu thơng tin tổng hợp KTXH của các cơ quan và của Bộ nhằm cung cấp thơng tin tổng hợp KTXH phục vụ nhu cầu khai thác chung:
+ Cung cấp thơng tin tổng hợp KTXH phục vụ điều hành quản lý cho các đối
tượng người sử dụng cĩ liên quan trong hệ thống cơ quan quản lý hảnh
chính
“© Phuc vụ việc tra cứu, xem, m, sà chép các báo cáo của các cơ quan cân sử gửi Bộ XD và báo cáa của Bộ XD gửi Chính phủ
ø tra cứu, tìm kiếm sổ liệu chỉ tiểu cĩ trong ốc kho dữ liệu
theo tiểu thức, từ đĩ cĩ thể in, sao chép các số liệu đĩ
$# Phục vụ việ
tơng hợp K
s#* ao lập các biểu đồ, đồ thị phục vụ cho các phân tích K1XH
#* Cung cấp các cơng cụ thơng kê, phân tích, dự báo liên quan đến các lĩnh
vực KT%XH đề hỗ trợ ra quyết định
Tội dung thơng tin tổng hop KTXH vé co ban cé thé bao gam
+ Báo cáo dinh kỷ
" Phân thco thời gian và kỳ bảo cáo
" Phân theo cơ quan báo cáo
" Phân theo lĩnh vực/ngành
s* Báo cáo nhanh, bảo cáo đột xuất, khơng định kỳ
s* Số liệu chỉ tiêu tổng hợp KTXH
Trang 2626
"= _'1ra cửu số liệu chỉ tiêu theo tiêu thức
"_ Lập các bằng số liệu dộng (chọn dòng chỉ liêu và cột số liệu)
"Lập các biểu đồ, đồ thị
2.3 Qui trình thực hiện chỗ độ thông tin báo cáa
2.3.1 Quy trinh nghiệp vụ tông quát
Nhìn chung, quy trình lập báo cáo gồm các bước sau đây:
+#* Bước 1 Xác định nội dung, yêu cầu báo cáo Bước này do cơ quan yêu cầu
báo cáo chuẩn bị Xuất phát từ nhu câu thông tin phục vụ sông tác quan ly,
diểu hành, các cơ quan chủ thể quản lý quy dịnh c
các đôi tượng thuộc phạm vi quản lý, trong đó quy định rõ nội dung, yêu cầu và thời gian báo cáo
lộ báo cáo dỗi với
# Dước 2; Chuẩn bị dự thảo báo cáo: Dước này do cơ quan báo cáo thực
hiện Sau khi nhận được yêu cầu bao cáo, đơn vi lập báo cáo (thường giao cho bộ phận Lông hợp) tổ chức thu thập thông tin, nắm bắt tình hình (66 thé
dã được tích lấy trong quả trình công tác), tỉnh toản, phân tích tổng hợp
thông tin và xây dựng dự thảo báo cáo
ước 3: Lay ý kiến tham gia Sau khi hoàn thánh bản dự thảo báo cáo, bộ
phận xây dựng báo cáo gửi lấy ý kiến tham gia của lãnh đạo cơ quan, các
bệ phận chuyên môn khác và hoàn chính lại bản đự thảo
bước 4: Irình người có thắm quyển ký ban hành Trong bước nảy, báo cao
có thể phải bổ sung sửa đổi thea yêu cầu của người ký báo cáo
+* Bước 5: Phát hành và lưu báo cáo Sau khi được người có thẩm quyền ky,
gửi cho Cơ quan yêu cầu báo cáo và các cơ quan, đơn vị liên quan, ding
thời được lưu trữ tại cơ quan lập báo cáo
2.3.2 Quy trình làm báo cáo tại tại Bộ Xây dựng
Ba phan Tổng hợp của Văn phỏng tạo bảo cáo dự thảo dựa trên dữ liệu tổng
hợp từ các đơn vị khác gửi đến Trung tâm tích hợp dữ liệu, tuỷ thco hình thức
báo cáa mà quy trình phê duyệt báo cáo sẽ khác nhau
4 Đối với bảo cáo tuần, đột xuất thì sau khi phòng tổng hợp làm báo cáo dự
thảo sẽ gửi lên cho Chánh văn phỏng phề duyệt, ký và ban hành báo cáo
+#* Đôi với báo cáo tháng sau khi phòng Tông hợp dự thảo báo cáo và lấy ý
kiến của Chánh văn phỏng, trên cơ sở ý kiện đó phòng Tổng hợp sẽ chỉnh
sửa lại bảo cáo và trinh lên cho Lãnh dạo Độ phụ trách tổng hợp xem xét
lại lần cuối, ký báo cáo và ban hành
s* Đối với báo cáo quý, 6 tháng, 9 tháng, năm quy trình cũng gần giống như
bảo cáo tháng, báo cáo sau khi dược phòng tổng hợp dự thảo sẽ được trình
Trang 2727
lên ban lãnh đạo Bộ để lấy ý kiến, dựa vào đó phỏng Tổng hợp sẽ chỉnh
sửa báo sáo trước khi Irình lên Lãnh đạo Bộ XD phê duyệt lần cuối và ký
báo cáo cho ban hành
# Đối với báo cáo chưyên đề, sau khi các đơn vị pửi các báo cáo chuyên đề
về VP Bộ, phòng Tổng hợp sẽ dự thảo báo cáo và gửi lên cho Chánh văn
phòng phụ trách tổng hợp để lấy ý kiến; sau khi hoàn chỉnh báo cáo, phỏng,
Téng hợp sẽ trình lên ban Lãnh đạo Bộ XD phê duyệt, ký báo cáo và cho
Phing Téng hợp Xin ý kiến Làn Bảo Cầu Dự
thuậc VP HỆXG Thảo Kho số Hệu
Trang 282.4 Mô tả thong tin dit liệu
2.4.1 Mô bình dữ liệu
Bài toán xây dựng kho dữ liệu tổng hợp cấp Hệ tại trung tâm tổng hop dữ liệu
nhằm mục Liêu lưu trữ các thư viện danh mục chỉ tiêu, danh mục địa ban, đanh mục đơn vị, toàn Bộ, các số liệu tổng hợp cứa cấp sở, số liệu tổng hợp
của các đơn vị trực thuộc, số liệu tổng hợp do các phòng ban trong VP Hộ
XD, các Cục Vu, Viên và các đơn vị trực thuộc Hộ thu thập và cung cấp
Kho dữ liệu này lưu nhiều nguồn dữ liệu tổng hợp gửi từ các sở và các đơn vị
trực thuộc Khi làm cdc bao cdo lang hyp, phòng tổng hợp của văn phòng Dộ
XD có thể chọn nhiều phương án lựa chọn các chỉ tiêu theo số liệu của các sở
XD, các Cục, Vụ, Viện, đồng thời lưu các chỉ tiên kế hoạch các kỳ báo cáo
của Bộ Ngoài ra còn hưu các báo cáo tổng hợp từ các đơn vị gửi tới và các
bảo cáo do chỉnh Bệ XI) tạo ra
Hình 2.4 Mộ hình tổ chúc đít liệu của Hệ thông tại cắp Bộ
hư vậy, tổ chức lưu trữ dữ liệu trong hệ thống 'THKTXII phục vụ điều hành
Bô XD vừa phân tán vừa tập trung:
© Tai mdi đơn vị đều có một kho dữ liệu phục vụ công tác điều hành của đơn
vị, thí dụ các C§DL của các sở XD đã được xây dựng trong phần mềm
dùng chung đã triển khai tai cap tinh (2005),
s* Dồng thời dữ liệu tổng hợp của các đơn vị được chuyển vào kho dữ liệu
dùng chưng của Bộ XD tại TT TH DL Việc đưa dữ liệu tẳng hợp cúa các
don vi vảo kho đỡ liêu dùng chung của Bộ XD giải quyết được các khó
Trang 2929
khăn hiện thời: tránh được tệ nạn cát cứ dữ liệu băng cách cung cấp dữ liệu
trực tiếp từ TT THDL cho các don vi can; dé dang lao ra các phân tích, so
sánh các dơn vị với nhau; tạo ra các báo cáo liên ngành hỗ trợ cho công tác
điều hành của Bộ XD và các đơn vị, Ngoài ra việc lưu trữ tập trung tại
TT THDL cén có một ưu điểm là hỗ trợ bảo quản dữ liệu tổng hợp của Hệ
thống tốt hơn
2.4.2 Hệ thống chỉ tiêu tổng hợp chung của Bộ Xây Dựng
"Trong tổng hợp thông tin KTXII, hệ thống chỉ tiêu tổng hợp đóng vai trỏ hết sức quan trọng Chỉ có thông qua ede số liệu của các chỉ tiêu tổng hợp mới có thể đưa ra các quyết định phục vụ cho công tác điều hành ở mọi cấp Chính vì
lẽ đó, cần xây đựng và chuẩn hóa hệ thống các chỉ tiêu tổng hợp chung cho
Bồ
THện tại, Bộ XD chưa có hệ thống chỉ tiêu tổng hợp chung cho toàn ngành mà
chỉ có các chỉ tiêu tổng hợp phục vụ riêng cho các đơn vị cấp Vụ, Viện và VP
Bộ thông qua các báo cáo tổng hợp của các đơn vị cấp sở gửi lên Bộ XD Do
đó Bộ XD chưa có được một CSDL lưu trữ số liệu của các chỉ tiêu tổng hợp
để phục vụ cho công tác điều hành tại cấp Bộ
2.4.2.1 Giới thiệu các báo cáo
Tiộ XD không chuẩn hóa hệ thống chỉ tiêu tổng hợp dùng chung cho các đơn
vị trực thuộc Bộ mà chuẩn hóa các báo cáo Công việc nảy không cho phép
Bộ có được các kho sế liệu tổng hợp đùng chung cho Bộ vả các đơn vị trực
thuộc Đến năm 2005 cơ sở đữ liệu Báo cáo của Bộ Xây dựng dã lưu trữ dược
2100 báo cáo tương dương 2,5 GB
Các chỉ tiêu tổng hợp còn bị lẫn lộn với các thuộc tính quản ly trong các CSDL chuyên ngành như “Quản lý các dự án đầu tư”, “Quản lý các để tải nghiên cứu khoa học”, “Kế toán chủ đầu tư” Có thể xây ra thông kê chồng
chéo, ví dụ, sẵn lượng xi măng có chỉ tiêu tổng hợp cho các sở XD đẳng thời
có chỉ tiêu pho cdc nha may xi mang và nhất định nha may xi măng do phải
trên địa bản nào đó Có rất nhiễu chỉ tiêu tổng hợp xuất hiện trong các bảo cáo
của các đơn vị khác nhau, tuy nhiên không, thể xác định được tính đúng đắn
khi phải so sánh giữa chúng
Tăng oáo báo cáo đã được chuẩn hóa dưới dạng được phân tích để tiến đến xây dựng một hệ thống các chỉ tiêu TH cho Bộ XD.
Trang 30‘Tinh hinh thực hiện đầu tư từ nguồn
vến ngân sách nha nước nằm
Giá trị sản xuất kinh đoanh tháng
Bao cáo tình hình thực hiện Công
tác quy hoạch xây dựng đô thị vả khu công nghiệp tháng đầu năm
Sở XD
Tảo cáo tỉnh hình thực hiện các dự
an cấp thoát nước và vệ sinh môi
trường tháng đầu năm
Sở XD
THện trạng, sẵn xuất sử dụng nước trong tỉnh, thành phổ tháng đầu
Trang 3131
tháng đầu năm Kê
TƯớc thực hiện các chỉ tiểu chủ yếu Các dơn vị xây lắn & San xuất
lã tháng đầu năm áp dụng cho vật liệu xây dựng
các đơn vị xây lắp & San xuất vật
liệu xây đựng
Tự kiến giá trị sản xuất vả doanh Các đơn vị xây lắp
thu xây lấp tháng đầu năm (áp
dung cho các don vi cé thi céng các
céng trinh)
Ước thực hiện các chỉ tiêu chủ yếu Các đơn vị Xuất bản, Báo chỉ
15 tháng đầu năm áp dụng cho
các đơn vị Xuất bản, Dáo chí
16 6 Ước thực hiện giá trị sản phẩm vật Các đơn vị sản xuất vật liệu
liệu xây dựng tháng năm xây dựng, sở XT)
7 Ước thực hiện vến đầu tư xây dựng Sở XD, các don vị thi công
24 | Cấp phép cho nhà thầu nước ngoài
IV Quân ly aha ở
25 | Quỹ nhà ở, hình thức sở hữu nhả, Xây dựng lại
Trang 3232
cấp quản lý nhà ở, cấp quyển sử dụng, Chính sách đối với người có
"Trong luận án sẽ sứ dụng các chỉ tiêu tổng hop trong các báo cáo để xây dựng minh họa một hệ thống các chí tiêu tổng hợp cho Bộ XD Việc sử dụng hệ thống các chỉ tiêu tổng hợp này hay không côn phụ thuộc vào các cơ quan có
thâm quyền của Bộ XD quyết định
Có thể mô tả sơ qua hệ thống chỉ tiêu tổng hợp nảy như sau
* Hệ thống chỉ tiêu tống hợp được chia thành các nhóm theo ngành và mã
hóa nhóm ngành
+» Iiệ thống nảy gồm khoảng 300 chỉ tiêu tổng hợp đủ để mô tả đữ liệu của
kho dữ liệu TH KTXH
4+ Hệ thống chí tiêu dược mã hóa có tỉnh đến việc thêm các ngành mới, nhỏm
mới thuộc một ngành va thêm các chỉ tiêu cụ thể mới đến cấp n tùy ý
CT01 |CT01.1 Giá trị 5X xây lắp Triệu | Sở XD, các Sở XD, Vụ
đồng | đơn vị xây Xây
Trang 3333
- Ngoài Quốc doanh
- Doanh nghiện dẫu tư nước ngoài
- Ngoài Quốc doanh
- Doanh nghiệp đầu tư nước ngoài
C101.3 Tổng số nệp ngân sách Triệu | Sở XD, Vu Kê
- Ngoài Quốc daanh
- Doanh nghiệp đầu tư nước ngoài
CT01 4 Giá trị Tư vẫn XD Triệu [Sc XD, Vụ Kế
Trang 3434
Trong dé
- Quấc doanh
- Ngoải Quốc doanh
- Doanh nghiệp dầu tư nước ngoải
hoặc các KẾ hoạch
đơn vị trực Thống kê
thuộc Bộ
XD CT01.6 1 GTSX xây lắp (kể ộ KL | Triệu
do bên A cấp vat tr) đơng
Trang 35đồng |Tổng CT hoạch
và các đơn Thống kê,
VỊ trực Vụ Kimh tế,
thuộc Hệ — tải chính CT01.10 Tỷ suất lợi nhuận/Doanh | Triệu |Tổng CT Vu Kế
vi trực Thống kê,
thuộc Hệ Vu Kinh té,
tai chinh CT01.11 Tỷ suất lợi nhuậntổng tài | Triệu |Sở XD, Vụ Kế
và các dơn Thống kế,
vị trực Vụ Kinh tế,
thuộc Bộ — tàichính
CT01.12 Tý suất lợi nhuận sau thuế | Triệu | Sở XD, Vu Kế
Trang 36CT01.13.2 Đầu tư mua sắm TSŒP | Triệu
dung cho SX thông qua XDCB đồng
CT01.13.3 Đầu tư sửa chữa lớn | triệu
CT01.13.6 Phân chia theo lĩnh vực Triệu
- Các dự án phát triển nhà CT01.13.7 Tổng số dự án Dự án
Trang 37- Ngoài Quốc doanh
- Doanh nghiệp đầu tư nước ngoài