1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn xây dựng kho dữ liệu cho hệ thống tổng hợp thông tin kinh tế xã hội

74 1 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Xây Dựng Kho Dữ Liệu Cho Hệ Thống Tổng Hợp Thông Tin Kinh Tế Xã Hội
Tác giả Nguyễn Thị Thu Hằng
Người hướng dẫn TS. Nguyễn Tuệ
Trường học Đại học Công nghệ, Đại học Quốc gia Hà Nội
Chuyên ngành Công nghệ Thông tin
Thể loại Luận văn Thạc sĩ
Năm xuất bản 2009
Thành phố Hà Nội
Định dạng
Số trang 74
Dung lượng 1,41 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Mục tiêu Việc xây dựng kho dữ liệu cho ITTTT tổng hợp KTXII phải đảm bảo được các yêu cầu cơ bản: * Xác định đây đủ nội dung thông tín tổng hợp KTXII * Chuẩn hoá hệ thống chỉ tiêu, h

Trang 1

1

ĐẠI HỌC QUỐC GIÁ HÀ NỘI

TRUONG DAL HQC CONG NGHỆ

Nguyễn Thị Thu Hằng

XÂY DỰNG KHO DỮ LIỆU CHO HE THONG

TONG HOP THONG TIN KINH TE - XA HỘI

Ngành: Công nghệ thông tin Chuyên ngành: Hệ thông thông tin

M& s6: 60.48.05

LUAN VAN THAC SI

NGƯỜI HƯỚNG DẪN KHOA HỌC:

TS Nguyễn Tuệ

Hà Nội — 2009

Trang 2

2

LỚI CAM O'N

Đầu tiên, tôi xin gửi lời cắm on sâu sắc nhất tới TS Nguyễn Tuệ, người hướng dẫn khoa học, đã tận tỉnh chỉ bão, giúp đố tôi thực hiện luận vin

'Lôi xin chân thành cảm ơn 13 Nguyễn Văn Hùng, người tao điều kiên và

giúp đỡ tôi tim hiểu thực tế bải toán để hoàn thành luận văn

Tôi xin chân thành cảm ơn các thầy cô trường Dại học Công nghệ, Dại học Quốc gia Hà Nội đã giảng day và truyền đat kiến thức cho tôi

Cuối cùng tôi xin cảm ơn những người thân và các bạn bẻ dồng nghiệp đã

chia sé, giúp đỡ tôi hoàn thành luận văn nảy

Mặc dù dã hết sức cổ gắng với tất cả sự nỗ lực cửa bản thân, nhưng chắc luận văn vẫn còn những thiểu sót Kính mong nhận dược những ý kiến đóng góp

của quý Thấy, Cô và bạn bẻ đẳng nghiệp

"Tôi xin chân thành cảm ưn!

Hà Nội, ngày 30/11/2009

Toe vién thực hiện

Nguyễn Thị Thư Hằng

Trang 3

3

LỚI CAM ĐOAN

Tôi xin cam đoan luận văn “Xây dựng kho dữ bệu cho Hệ thống tổng hợp

thông tin kinh tế - xã hột” là công trình nghiên cửu của riêng tôi, không sao

chép của bất kỳ ai Nội dung của luận án dược trình bảy tử những kiến thức

tổng hợp của cá nhân, tông hợp từ các nguễn tải liệu có xuất xứ rồ rằng và

trích dẫn hợp pháp Kết quả nghiên cứu được trình bày trong luận văn này

chưa từng được công bề tại bất kỳ công trình nào khác

Tôi xin chịu hoàn toàn trách nhiệm, và nếu sai, tôi xin chịu mọi hình thức ký luật theo quy định

4à Nội, ngày 30 tháng 11 năm 2009

Học viên thực hiện

Nguyễn Thị Thu Hằng

Trang 4

4

MỤC LỤC LỠI CAM ON

LOI CAM DOAN

MUc LUC -

BẰNG CÁC KY HIBU VÀ TY VET TAT

DANH MUC HINH VE VA BANG BIEU

MÔ ĐẦU

CHUONG 1-LY THUYẾT XÂY DUNG KHO DU LIEU

1.1 Các khái niệm cơ bản về kho đữ liệu

1.1.1 Kho dit liu — dala warehouse

1.1.2 Các loại đữ liệu trong Data Warehouse

1.2.1 Các giai doạn thiết kế kho dữ liệu 16

CHƯƠNG 2—MÔ TẢ, ĐÁNH GIÁ, PHÂN TÍCH QUY TRÌNH NGHIỆP VỤ

2.1 Quy trình xác định, tạo lập, lưu trữ, cung cấp thông tin tổng hợp KTXII 22 2.1.1 Quy trình xác định, tạo lập và lưu trữ thông tin tổng hợp KTXH tại

2.1.2 Quy trình cung cấp vả tổ chức khai thác thông tin tống hợp KTXH tại

2.2 Quy trình cung cấp và tổ chức khai thác thông tin tổng hợp KTXH: 24

2.2.1 Xác định nội dung và các hình thức cung cấp, khai thác thông tỉn 24 2.2.2 Cung cấp thông tin tới các địa chỉ cần thiết qua đường truyền mạng 25 2.2.3 Cung cấp thông tin tổng hợp K'1XH phục vụ công tác điều hành quan

2.3 Qui trình thực hiện chế dộ thang Lin báo cáo 26

2.3.1 Quy trình nghiện vụ tổng quát 26

2.3.2 Quy trình làm báo cáo tại tại Dộ Xây dựng 26

2.4.2 Hệ thống chỉ tiêu tổng hợp ‘chung của Ba iy Dung 29

2.4.3 Hệ thống chỉ tiêu tổng hợp của các dơn vị 43 CHUONG 3 - XAY DUNG KHO DU LIRU THU NGHIEM

3.1 Gidi thiéu ong cu OLAP trong SQL Server 2005

3.1.1 Gidi thiéu OLAP

3.1.2 Giới thiệu địch vụ OLAP của Microsoft SQL Server

Trang 5

5

3.1.5 Mô hình kiến trúc của địch vụ OLAP 60 3.2 Thiết kế cơ sở đữ liệu

3.2.2 Thiết kế các chiều lưu trữ dữ liệu

3.3 Cài đặt kho dữ liệu thử nghiệm

3.3.1 Khởi tạo và cải đặt DrojeeL

3.3.2 Khai thác kho đữ liệu

Trang 6

6

BẢNG CÁC KÝ HIỆU VẢ TỪ VIẾT TAT

BMSL Biểu mẫu số liệu

DW Data Warchouse Kho dữ liệu

EDM Enterprise Data Model Mô hinh dữ liệu mức xí

nghiệp

liệu

KTXH Kinh tế - Xã hội

OLAP On-Line Analytical Processing Xử lý phân tích trực tuyến

SA Subjcet Arca Vùng chủ để

Trang 7

Hình 1.1 — Mô phỏng sơ đồ hình sao của một CDSL 18

Hình 1.2 Mô phỏng sơ để tuyết rơi (mở rộng của sơ đỗ hình sao) 19

Hình 1.3 — Mô phống các chiều trong kinh doanh 20

Hình 2.1 — Quy trình xác định, tạo lập, lưu trữ thông tin cấp sở “

TRnh 2.2 — Quy trình thu thập số liệu tại cấp Bộ 24 Hình 2.3 — Mô hình tạo bảo cáo ở văn phòng Bộ XD

TRnh 2.4— Mô hình tế chức đữ liệu của Hệ thống tại cấp BA 28

Hình 3.1 — Mối quan hệ của nhiều loại công nghệ trong Analysis Services

Tĩnh 3.2 Kiến trúc địch vụ OLAP $6

Hình 3.6 Mô hình kiến trúc của địch vụ OLAP

Hình 3.7 — Kiến trúc thành phan Server 62

Hình3.8 Kiến trúc thành phan Client khe

Hình 3.9 —Mé hinh Data Mart cua hệ thông TH KT-XH 66 Tình 3.10 — Khung nhin dit ligu cia Data Mart hé théng

TRnh 3.11 — Cấu trúc khối (cube) TII KTXII cube 67

Hình 3.12 — Két qua trién khai project ‘TH_K'IXH trong, Analysis Service 68

Tinh 3.13 — Báo cáo về tỉnh hình thực hiện quản lý quy hoạch phát triển vật

liệu xây đựng trong phạm vị cả nước của Vụ Vật liệu xây dựng từ năm 2000

đến 2008 69

Hình 3.14 — Báo cáo quan lý quy hoạch phát triển vật liệu xây đựng trong

phạm vi cả nước của Vụ Vật liệu xây dựng từ năm 2000 đến 2008 sử dụng

Hình 3.15 — Đảo cáo sản lượng XI măng các loại tử nắm 2000 dén 2008 — sử

Trang 8

8

TRnh 3.16 — Báo cáo sẵn lượng sẵn xuất Cát xây dựng của doang nghiệp quốc

đoanh từ năm 2000 đến 2008, so sánh số liệu thực và số liệu ước 72

Trang 9

MỞ ĐẦU

Thể ký 21 lá thời đại của nền kinh tế trí thức Miọi hoại động của chúng ta muốn đạt hiệu quả cao, giảnh được thắng lợi trong thế cạnh tranh gay gắt thì nhất thiết phải có những phương pháp để có được những thông tin, tri thức

cần thiết một cách nhanh vả chính xác

Việc áp dụng công nghệ thông Im vào thực tiễn sắn xuất nghiệp vụ dã mang

lại những hiệu quả và lợi ích to lớn Công nghệ ngày cảng được phát triển, hoàn thiện hơn để đáp ứng những yêu cầu ngày càng cao của thực tế nghiền cứu, quản lý sản xuất và nghiệp vụ Sự mở rộng qui mô áp đụng từ những ứng đụng đơn lẻ đến các hệ thông thông tin cỡ lớn đã dẫn đến những thành công

vượt bậc trong nghiệp vụ Các hệ thông thông tin tử chỗ chỉ giải quyết những

xử lý công việc hàng ngày nay dã tiến tới đáp ứng được những yêu chu ở mức

độ cao hơn Các nhà quản lý điêu hành không những biết được công việc

dang diễn ra như thế nào mà còn biết cải gì sẽ xây ra sau đó, có nghĩa là thông tin mang tính phân tích và hệ thống thông tin có khả năng hỗ trợ quyết định

Hiện nay, phương pháp xây dựng kho dữ liệu đã phát triển cả về lý thuyết

cũng như thực tế Lý thuyết xây dựng kho dữ liều đã được hình thành rõ nói

bên cạnh đỏ các nhà cung cấp phần mềm cũng đã đưa ra các công cụ để xây đựng, lưu trữ, duy tri và phát triển kho dữ liệu Một kho đữ liệu có thể giúp đỡ

các nhà quản lý, các doanh nghiệp có khả năng quản lý đỡ liệu, khai thác

thông tin để đưa ra những quyết định nhanh chóng và phủ hợp

Quá trình tìm hiểu thực tế việc tin học hóa quán lý hành chính nhà nước cho

thấy việc tổng hợp và quản lý các thông tin về kinh tế - xã hội hàng ngày, để cung cấp thông tin cho “quá trinh phân tích, hoạch định chiến lược và hỗ trợ

ra quyết dịnh” là một nhu oầu bức thiết của những người quản lý, là thách thức, bải toán thực tế dang được tìm hướng piải quyết

Đề tài này dựa trên những lý thuyết, phương pháp luận, công cụ xây đựng kho

đữ liêu, từ đó triển khai xây dựng một khe dữ liêu thực tế, nhằm hướng tới giải quyết yêu cầu của bài toán nói trên Luân văn gồm 3 chương:

Chương 1: Lý thuyết xây dựng kho dữ liệu Chương này trình bảy những

khái niệm cô đọng nhất về Data warehouse và các bước thiết kế kho dữ liệu

cho Hệ thống

Chương 2 Mô tả, đánh giá, phân Lich quy trình nghiệp vụ của Hệ thắng Tổng

hợp thông tin kinh tế - xã hội phục vụ điều hành cho Dộ Xây Dựng

Chương 3 Xây dung kho đỡ liêu thứ nghiệm Chương này trinh bảy việc

xây dựng kho đữ liệu thử nghiệm dựa trên SQI Server 200%

Trang 10

10

Giới thiệu bài toàn Xây dựng kho dữ liệu cho Hệ thống tổng hợp thông

tin kinh tế - xã hội

Tổng hợp Kinh tế - Xã hội (KTXH) là một hệ thống thông tin dược xây dựng nhằm góp phan tin hoc hỏa quản lý hành chính nhà nước “Thông tin tổng hợp

KTXIT' được hiểu là thông tin phản ánh các điễn biến về KTXI1 đã được tổng hợp từ các hiện tượng KTXII phát sinh ở các đơn vị kinh tế cơ sở để phục vụ công tác chỉ đạo điều hành trong hệ thống các cơ quan hành chính nhà mước

Don vị kinh tế cơ sở gồm: Cơ quan nhà nước, đơn vị sự nghiệp, đơn vị thuộc

lực lượng vũ trang nhân đân, tổ chức chính trị, tổ chức chính trị - xã hội, tổ chức chỉnh trị xã hội - nghề nghiệp, tổ chức xã hội, tổ chức xã hội - nghề nghiệp, đoanh nghiệp vả các đơn vị trực thuộc doanh nghiệp thuộc mọi thành

phần kinh tế, hợp tác xã, tổ hợp tác, hộ kinh doanh cá thể, hộ gia đỉnh, cá nhân, các tổ chức khác của Việt Nam ở trong nước, ở nước ngoài và tổ chức,

cá nhân nước ngoài hoạt động trên lãnh thỗ Việt Nam

Quá trình tim hidu thực tế cho thấy mỗi Uy ban nhân dân tính hoặc các bệ,

ngành đều có nhu cầu nắm bắt, tổng hợp và quần lý các thông tin về kinh tế -

xã hội hàng ngày, để cung cấp thông tin cho “quá trình phân tích, hoạch định chiến lược và hễ trợ ra quyết định”

Hệ thống Tổng hợp thông tin kinh tế xã hội đã được tim hiểu, khảo sát vả

triển khải thử tại nhiều địa phương như Thanh Hóa, Hà Nam, Lạng Sơn các bộ ngành như bộ Xây dựng Từ khảo sát thực tế đã chỉ ra những bất cẤp

trong việc thu thập và lưu trữ thông trm kinh tẾ - xã hội hàng ngày của các UBND, các bộ các ngành Việc thu thập thông in thi công, thông tin được

lưu trong các file tài liệu rời rạc hoặc những CSDL riêng biệt, gầy khó khăn

cho việc tổng hợp số liệu, thống kê số liệu, đẫn đến việc phân tích thông tin,

hỗ trợ các quyết định chiến lược của các cấp lãnh đạo chưa thực sự nhanh chóng va hiệu quả

Để giải quyết những bắt cập và đáp ứng nhu cầu thực tế, đã có nhiều để án cụ thé được đưa ra xem xét, một trong số các để án giải quyết những hạn chế nêu trên là xảy dựng kho dữ liện Khôi lượng công việc rất lớn, có phạm vi rộng

và thời gian thực hiện khéo đải Do vậy, bài toán trong luận án nay sẽ tim

hiểu, đi sâu và xây dựng kho đữ liêu cho HTTT tổng hợp KTXH phục vụ điều

hành của Bộ Xây Dựng

HLT tổng hợp KTXH phục vụ điều hành quản lý tại Hộ XI) có nhiệm vụ xác định, tạo lập, lưu trữ, xử lý và quản lý các thông tin tẵng hợp liên quan

đến tắt lĩnh vực hoại dộng KTXH như kinh tế tẳng hợp, kinh tế ngành,

tổ chức cán bộ, của Bộ XD, từ đó hình thánh các kho đữ liệu về các số liệu

chỉ tiêu tổng hợp KTXHI và các thông tin bdo cáo, nhằm:

Trang 11

HH

** Cung cấp thông tin tổng hợp phục vụ chỉ đạo điêu hành của lãnh đạo, các

hoạt động chuyên môn, nghiệp vụ của các bộ phận và các chuyên viên lại

văn phòng Bộ XI2, tại các cục, vụ, viên, và các dơn vị trực thuộc Bộ XI)

(kŠ cả các sở XD thuộc các tỉnh/ thành phố trong cá nước)

** Phục vụ việc thực hiện chế độ thông tin báo cáo từ các đơn vị lên văn

phòng Hộ X2 và từ Bộ lên Chính phủ

Mục tiêu

Việc xây dựng kho dữ liệu cho ITTTT tổng hợp KTXII phải đảm bảo được

các yêu cầu cơ bản:

* Xác định đây đủ nội dung thông tín tổng hợp KTXII

* Chuẩn hoá hệ thống chỉ tiêu, hệ thống mẫu biểu số liệu (AMSL), thống nhật các loại số liệu, các thông tin danh mục dùng chung:

** Có khả năng trích lọc, chuyển đổi, kết xuất, tích hop dif Liéu tir cde CSDL chuyên ngành của các đơn vị (nêu có) vào Kho dữ liệu thông tin tống hợp

KTXH

“TA u trữ, quản lý toản bộ các số liệu chỉ tiểu, dữ liệu báo cáo của các dơn vi cấp cục, vụ, viện và của Dộ, bình thành các kho đữ Hiệu về sẽ liệu chỉ tiêu,

vỀ cáo thông tin bảo cáo, được phân loại một cách có hệ thống và thống

nhất Các kho đữ liệu sẽ được tổ chức theo mô hình thông nhất để có thể

tích hợp chúng với nhau một cách thuận tiện va dé dang

% Trên cơ sở các kho đữ liệu về thông tin tổng hợp KTXII, tổ chức các hình

thức khai thác thông tin dưới dạng thông tin kết xuất theo khuôn dạng dịnh

sẵn và các đạng thông tin kết xuất động theo yêu cầu, cung cấp các công

cụ thống kê, phân tích, dự báo liên quan đến các lĩnh vực KTXH để hỗ trợ

ra quyết định, xuất bản thông tin lên

Bai toán sẽ đi tìm hiểu và phân tích các quy trình xác đinh, tạo lắp, lưu trữ vả

khai thác thông tin trong hệ thông tổng hợp K'TXH, tìm hiểu các loại,

liệu được lưu trữ dễ từ đó Ay dung cơ sở đữ liệu cho kho dữ liệu

iéu dit

Công cụ sử dụng trong việc xây dựng kho dữ liệu được sử dụng trong bài toán

là hệ quân trị co sé dit ligu Microsoft SQL Server 2005

Trang 12

12

CHƯƠNG 1 - LÝ THUYÉT XÂY DỰNG KHO DỮ LIỆU

1.1 Các khái niệm cơ bân về kho dữ liệu

1.1.1 Kho đữ liệu — đata warehouse

1.1.1.1 Định nghia kho dit ligu — data warehouse

Kho dit ligu (Data Warehouse - DW) la tuyén tip các cơ sở dữ liệu tích hợp,

hướng chủ để, được thiết kế để hỗ trợ cho chức năng trợ giúp quyết định, mả

mỗi đơn vị đữ liệu dều liên quan tới một khoảng thời gian cụ thể

Công nghệ “Kho đữ liệu” (Data Warehouse Technology) la tap cdc phương pháp, kỹ thuật và các công cụ có thể kết hợp, hỗ trợ nhau để cung cấp thông

tin cho người sử đụng trên cơ sở tích hợp từ nhiều nguồn dữ liệu, nhiều môi

trường khác nhau (Theo John Ladley)

Công nghệ DW ra đời nhằm đáp ứng mọi yêu cầu về thông tin của người sử dụng, hỗ trợ để các nhân viên của "tổ chức" thực hiên tốt, hiệu quả công việc của minh, như có những quyết định hợp lý, nhanh và bán được nhiều hang

hơn, năng sẵn cao hơn, thu dược lợi nhuận cao hơn, v.v Giúp cho tổ chức xác định, quản lý và diều bành các dự án, các nghiệp vụ một cách hiệu quá vả

chính xác, ngoài ra DW tích hợp đữ liệu và các siêu dữ liệu từ nhiều nguồn

khác nhau

Kho dữ liên thường rất lớn tới hàng trăm GB hay thâm chi hang Terabyte

Kho dữ liệu được xây dựng để tiện lợi cho việc truy cập theo nhiều nguồn, nhiều kiểu dữ liệu nhau sao cho có thê kết hợp được cả những ứng dụng

của các công nghệ biện đại vả kế thừa được từ những hệ thống đã có sẵn từ

trước [1]

1.1.1.2 Dặc tính của kho dữ liệu

Tữ liệu trong DW có những đặc Lính cơ bản sau

+* Hướng chú đề (Object Oriented)

Dữ liệu được tập hợp, phân lớp, lưu trữ và xử lý theo từng chủ để, để dễ đảng xác định được những thông tín cân thiết trong từng hoạt động Các dữ

liệu của mỗi chủ dễ chính trong tổ chức được liên kết với các khóa dại điện

và đưa vào củng một vị trí

+# Tích hợp (Inteprated)

Một tê chức có rất nhiều đữ liệu từ nhiều hệ thống khác nhau Dữ liêu tập hợp trong kho dữ liệu được thu thập từ nhiều nguồn và trôn ghép với nhau tạo thành một thể thing nhất Việc hợp nhất các dữ liêu nảy trở thành một

Trang 13

3

tập hợp dữ liệu có nghĩa cho việc phân tích là rất khó khăn Dữ liệu tích

hợp phải đâm bảo tính nhất quán, đôi khi chấp nhận sự dư thừa dữ liệu để tăng hiệu quả của các truy vấn

*+ Tính 6n định, không biến động (nen- volatility)

Dữ liệu wong DW là đữ liệu chỉ dọc và chỉ có thể dược kiểm tra, không

được sửa đổi bởi người sử dụng đầu cuối Nó chỉ cho phép thực hiện hai thao tác cơ bản: nạp đữ liệu vào kho và truy cập vào vào các vùng trong

DW

Tỉnh không biến động thể hiện ở chỗ: Dữ liệu được lưu trữ lâu dai trong

kho dữ liệu Mặc dù có thêm dữ liệu mới nhập vào nhưng dữ liệu cũ trong,

kho vẫn không bị xoá, điều đó cho phép cung cấp thông tin về một khoảng thời gian đài, cung cấp đủ số liệu cần thiết cho các mô hình nghiệp vụ phân

tích, dự bảo, từ đó có được những quyết định hợp lý, phủ hợp với các qui luật tiến hoá cũa tự nhiên

+#* Tính thời gian cụ thể

Một kho dữ liệu bao hàm một khỗi lượng lớn dữ liệu lịch sử Dữ liệu được

Iưu trữ thành một loạt các bản sao, mỗi bản sao phản ảnh những giá trị của

đữ liêu tại một thời điểm nhất đính, thể hiên một khung nhìn của một vùng

chủ để trong một giai đoạn Do vậy, DW cho phép khôi phục lại đỡ liệu lich sử và so sánh một cách chỉnh xác các giai doạn khác nhau Yếu tố thời

gian đóng vai trỏ như một phần của khóa để đảm bảo tính đơn nhất của mỗi ban ghỉ và cung cấp đặc trưng về thời gian cho dữ liệu

Dữ liệu trong kho đữ liệu tác nghiệp cần phải chính xác ở chính thời điểm

truy cập, còn ớ DW chỉ cần có hiệu lực trong khoáng thời gian nảo đó, trong khoảng Š đến 10 năm hoặc lâu hơn Dữ liệu của CSDL tác nghiệp

thường sau một khoảng thời gian nhất định thì sẽ trở thành đữ liệu lịch sử

và chúng sẽ được chuyển thành kho đữ liệu Dỏ chính là những dữ liệu hợp

lý về những chủ điểm cần lưu trữ

1.1.1.3 Các yêu cầu chức năng của kho đữ liệu

*+ Khả năng cân bằng (scalable) : Kho đữ liệu có khả năng lưu trữ và quản lý

một số lượng khổng lỗ các giao địch vả đữ liệu tổng hợp Kho đữ liệu có

thể lớn lên theo thời gian, có thêm dữ liệu mới hoặc giữ lại dữ liêu lịch sử

cho một thời gian đải mà không bị quá tãi, vẫn đâm bão tính ổn định hoại

động

+* Khả năng quần trị (manageable): Kho dữ liệu có kh năng quán trị việc tạo

quyết định

Trang 14

14

“# Khả năng sẵn sàng (avaiable) : Kho đữ liệu luôn sẵn sảng bất kỳ khi nảo

cân

+ Khả nắng mở rộng (oxtensible): Thực hiện 1 cách đỗ đảng khi Ihêm các

loại đữ liệu mới, đữ Hệu kết hợp và dữ liệu tổng hợp và kho đữ liệu

** Khả năng mềm dẻo (Flexible): hễ trợ nhiều cách truy nhập dữ liệu chỉ tiết,

đữ liệu tổng hợp theo phân tích nhiều chiêu

*+ Khả năng tích hợp (integrated): kho dữ liệu phải có khả năng tích hợp đầy

đủ với các hệ thông sẵn có, môi trưởng tác nghiệp Do vay, có thể tai dữ

liêu từ nhiều nguồn

** Khả năng truy cập sử dụng được (Accessible): Kho đữ liệu phải có khả

năng Iruy cập sử dụng dược, từ các công cụ mềm dẽo lới phạm vi rong rai

người sử đụng,

* Khả năng tin cậy (Reliable): dữ liệu tấi từ nhiều nguồn khác nbau phải

được hợp nhất, chuẩn hóa bảo đấm tính toàn vẹn đữ liệu và hợp lệ tại một

thời điểm bắt kỳ

1.1.1.4 Kho dữ liệu cục bộ - Datanmart

Kho đữ liệu cục bộ (Datamart — DM) là CSDL có những đặc điểm giống với

kho dữ liệu nhưng với quy mê nhỏ hơn và lưu trữ đữ liệu về một lĩnh vực, một chuyên ngành Datamart là kho đữ liệu hướng chủ để Các Datamart có

thé dược hình thành tử một tập cơn đữ liệu của kho dữ liệu hoặc cũng có thể

lập va sau khi xây dưng xong, các đatamart có thể dược

ới nhau tạo thành kho đữ liệu Vì vậy có thế xây dung

g việc xây dựng các Datamart hay ngược lại xây dựng

dược xây dung di

diện vật lí, thường được lưu trữ trên một scrver riêng, trong một mạng cục bộ phục vụ cho một nhóm người nhất định Đôi khi datamart một cách dơn giần

với công nghệ OLAP tạo ra các quan hệ theo đạng hỉnh sao đặc biệt hoặc

những siêu khối (hypercube) dữ liệu cho việc phân tích của một nhóm người

có cùng mỗi quan tâm trên một phạm vì đữ liệu [2]

Có thể chia ra làm 2 loại: Datamart độc lập và Datamart phụ thuộc

Trang 15

l

1.1.2 Các loại dữ liệu trong Data Warehouse

1.1.2.1 Dữ liệu nghiện vụ

Dữ liêu nghiệp vụ (Business data - BD) là đữ liêu dùng để vận hành và quản

lý một doanh nghiệp hoặc một tổ chức Nó phản ánh những hoạt động của

đoanh nghiệp và những đối tượng trong thế giới thực như là khách hàng, địa diém, sén phẩm v.v Nó dược tạo ra và sử dụng bởi các hệ thông xử lý giao

tác cũng như các hệ thống hỗ trợ quyết định

1.1.2.2 Siêu dữ liệu (Metadata)

Metadata là dữ liệu về đữ liệu được sử dụng trong DW (hay gọi là siêu dữ

liệu) trả lời các câu hỏi ai, cái gì, khi nào, tại sao, như thể nào về dữ liệu Nó

dược sử dụng cho việc xây dựng, duy trì, quân lí và sử dung DW Metadata la

một trong những phương điện quan trọng nhất của DW

++ Siêu đữ liệu nghiệp vu (Business Metadata): Chita dung những thông tin

khiến chơ người sử dụng dễ dàng hiểu được khung cảnh của thông tia

được lưu trữ rong DW

+® Siêu đữ liệu kĩ thuật (Technical Moladata): Chứa đựng những thông trn về

dữ liệu trong IDW của những người thiết kế và quản trị khi tiến hành công

việc phát triển và quân lí

** Siêu dữ liệu tac nghiép ( Operational Metadata)

Metadata hỗ trợ trực tiếp cho người sử đụng giúp họ có thể hiểu dược nội

dung và tìm thấy được dữ liệu cần thiết Trong thực tế khả năng kết hợp của

công cụ trích lọc dữ liệu và Meladata côn rất kém Do đó cần phải Lạo ra

những giao diện đùng Mietadata cho người sử dụng

Moladata định nghĩa nội dung và vị trí cúa đữ liệu trong DW, mỗi quan hệ giữa cơ sở dữ liệu tác nghiệp với DW và các khung nhin đữ liệu của DW có

thể truy nhập được bởi công cụ của người sử dụng đầu cuối Người sử đụng đầu cuối cần đến Metadata khi cần đến những định nghĩa dữ liệu hay các vùng chú thể

TẤU cả ác thành phần của DW đều cần và có thể lấy dữ liệu từ Metsdata Metadata duoc lưu trữ ở khu vực trung lâm Meladata có thể xuất hiện theo nhiều khuôn đạng và có thể trong suốt

Trang 16

1.2 Thiết kế kho đữ liệu

1.2.1 Các giai đoạn thiết kế kho đữ liệu

Có nhiều phương pháp thiết kế kho dữ liệu, mặc đủ khác nhau nhưng nhìn chung các phương pháp đều chứa một số công việc cơ bản cho việc thiết kế

kho dữ liệu gồm các giai đoạn sau: [2]

+È Xác định mé hinh nghiép vu (Defining the business model)

Phân tích các định hưởng chiến lược để rút ra các quá trình nghiệp vụ được

thực hiện trong kho dữ liệu Các yêu cầu nghiệp vụ phải được phân tích, xác định vả tải liệu hóa đơn vị đo vá chiều nghiệp vụ (businesss measures

và business demensions) cho mỗi quá trình nghiệp vụ

+’ Xac dinh mé hinh logic (Defining the logical model)

Dung ky thuật đồ họa để thể thiện các định nghĩa, đặc điểm và mỗi quan hệ của dữ liệu trong nghiệp vụ, hoặc khái niệm chuyên môn, nhằm mục dích

mô tä hệ thống cho người sử dụng cưối Thông thường phương pháp này

ding chuẩn 3NF

+ð Xác định m6 hinh Demensional (Defining the demensional model)

Mô hình nghiệp vụ được chuyển thành mô hình Iemensional, lược để các

bang và thuộc tính của bảng được định nghĩ, liên kết giữa các bảng dược tạo dựng vả nguồn của kho dữ liêu dược xác dịnh

+* Xác dịnh mô hình vật ly (Defining the physical model)

Mồ hình Demensional được chuyển thành mô hình vật lý, bao gồm các khai báo về định nghĩa kiểu dữ liệu của các thuộc tính, khích thước dự tính,

chiến lược tạo chỉ mục (Index) và lưu trữ dữ liệu

1.2.2 Mô hình dữ liệu

Mô hình DW được phát sinh từ một mô hình đữ liệu tổng thể (mô hình dữ

ligu mite xi nghiép) (Enterprise Data Model - IDM) Mét EDM 1i mét bire

tranh tổng thể mã các mô hình khác có thể hoạt đông trên đó Nó được tổ chức thành các vùng theo cha diém, Subject Area - SA [a phân chính của sự

chia nhỗ các công việc

Tếu một tổ chức không có sẵn EDM thích hợp, EDM cũ dược phép dùng tiếp

và bỗ sung các SA mới

An duoc quan tâm dap ứng như cầu người sử dụng

Để bắt dầu việc thiết lập một mô hỉnh, cần quan tâm tới khung nhìn tại vị tri hiện tại và trong tương lai sắp tới Vị trí hiện tại có nghĩa là mô tả và hiểu

những dữ liệu được chứa Irong những hệ thống kế thừa (nguồn kế thừa) Nếu

Trang 17

Mô hình dữ liệu DW có tính chủ để, phụ thuộc vào công việc nghiệp vụ vả

các vin dé nay sinh Mô hình dữ liệu của DW có thể thiết lập theo

4 So dé hinh sao (Slar Schema)

4 Sơ dỗ Luyết rơi (SaowlDake)

“ Mé hinh da chiéu (Multiple Dimension)

1.2.2.1 So dé hinh sao (Star Schema)

So dé hình sao được đưa ra lần đầu tiên béi Dr Ralph Kimbali nhy 14 mét lựa

chọn thiết kế cơ sở dữ liệu cho DW Nó được gọi là sơ đỗ hình sao bởi vì các

sự kiện nằm ở trung tâm của mô hình và dược bao quanh bởi các phạm vi liên

quan, rất piống với các diễm của một ngôi sao Sơ dỗ hình sao cho phép một

hệ thống đối tượng có thể kết nỗi với nhiều đối tượng khác Mô hình này thể hiện cách nhìn của người sử dụng về nhiều vẫn đề trong tác nghiệp

‘Trong so đồ hình sao, dữ liêu được xác định và phân loại theo 2 kiểu:

s* Các sự kiện được tổ chức thành bảng Fact

Bang Iact chứa các thông tin cơ sở ở mức giao tác ở trong nghiệp vụ mà các ứng dụng cần thiết Ví dy, khi phân tích dữ liệu kinh doanh thì cần những đữ liệu về những mặt hàng đã bán được trong các giao địch bán

hàng về số lượng, chủng loại, giá thành, v v Những đữ liệu này déu dược

lưu ở bảng Fact của kho đữ liệu Tuy nhiên, trước khi các đữ liêu này được

đưa vào kho dữ liệu thì cần phải chọn một trường đữ liệu nào đó thường sử

dung trong các chiều phân tích để tham chiểu (xem như khoá ngoại trong,

các quan hệ liên kết) vả sau đó đưa vào bảng các chiều Các sự kiện là các

đại lượng số của công việc Các bảng Fact thường rất lớn, chửa hàng triệu

déng ma phan lớn là số

** Phạm vị, hay các chiều của đữ liệu, được tổ chức thành các bảng Dimension

Bảng I2imension, ngược lại, thường là tương đổi nhô so với các báng Eact,

chứa các thông tin mô tả Đó là các bộ lọc hoặc các ràng buộc của những,

sự kiện & bang Fact Bang Dimension chira cáo dữ liệu cần thiết cho việc thực hiện các giao lác nghiệp vụ theo một chiều, hay phạm vi nào đó, Ví

dụ, trong ứng dụng phân tích kinh doanh, bảng Dimension bao gồm: thời

gian, vũng bản hàng, loại sân phẩm, VV

Trang 18

Hinh 1.1 Mé6 phéng so 46 hirh sao ota mét CDSL

Ưu diễm của sơ đồ hình sau

“© HG tro rat da dang các cầu truy vấn vả xử lý khá hiệu quả những câu truy

van dé

*+ Phù hợp với thói quen của người sử dụng nhận và sử dụng dữ liệu, nên dữ liệu được hiểu trực quan hơn

So dé nay rất trực quan, dễ sử dụng, thể hiện khung nhỉn da chiều của dữ

liệu dùng ngữ nghĩa của cơ sở đữ liệu quan hệ Khóa của bắng sự kiện

được tạo bởi những khóa của các bảng chứa thông tin theo lừng phạm vì

Wimension Table) Tat cả các khóa đều được xác định với cùng một chuân

đặt Lên

1.2.2.2 So dé tuyét roi (Snowflake)

So đồ hình tuyết rơi là một sự mở rông của sơ dé hình sao tại đó mỗi cánh sao

không phải là một bảng Dimension mà là nhiều bằng

Trong dang sơ đổ này, mỗi bảng theo chiều của sơ đỗ hình sao được chuẩn hỏa hơn Sơ đồ hình tuyết rơi cải thiện năng suất truy vấn, tối thiểu không

gian dĩa cần thiết để lưu trữ đữ liệu vả cải thiện năng suất nhờ việc chỉ phải kết hợp những bảng có kích thước nhỏ hơn thay vì phải kết hợp những bảng,

có kich thước lớn lại không chuẩn hóa

Nó cũng làm tăng tính linh hoạt của các ứng dụng bởi sự chuẩn hóa và ít mang ban chất theo chiều hơn Nó làm tăng số lượng các bảng và làm tăng

tính phúc tạp của một vải truy vấn cần có sự tham chiều tới nhiều báng,

Trang 19

qua thời gian”

Những người thiết kế kho dữ liệu thường lắng nghe cần thận những từ đó và

họ thêm vào những nhấn mạnh đặc biệt của họ như: “Chúng đói kinh doanh

các sửn phẩm trong nhiều thị trường khác nhau, và chúng lôi đánh giá hiệu

quã thực hiện của chúng tôi qua thời gian”

Một cách trực quan, việc kinh doanh như một khối (cube) dữ liệu, với các

nhãn trên mỗi cạnh của khối Các điểm bên trong khối là các giao điểm của các cạnh Với mô tả kinh đoanh ở trên, các cạnh của khối là Săn phẩm, Thị

trường, và Thời gian Ilầu hết mọi người đều có thể nhanh chóng hiểu và tưởng tượng rằng các điểm bên trong khối là các độ đo hiệu quả kinh doanh

mà được kết hợp giữa các giá trị Sản phẩm, Thị trường và Thời gian

Trang 20

Sin phim Thời gian

“Thị trường |

Hình 1.3 - Mô phỏng các chiều trong kinh doanh

Một khối dữ liệu {datacube) thì không nhất thiết phải có cấu trúc 3 chiều (3-

D), nhưng về cơ bản là có thể có N chiều (N-D) Những cạnh của khối được

gọi là các chiều (dimensions), ma đó là các mặt hoặc các thực thể ứng với

những khía cạnh mà tổ chức muốn ghi nhận Mỗi chiều có thể kết hợp với

một bảng chiều (dimension table) nhằm mô tả cho chiều đó Ví dụ, một bảng chiều của Sản phẩm có thể chứa những thuộc tính như Ma_sanpham, Mo ta,

Ten sanpham, Loai §P mà có thể được chỉ ra bởi nhà quản trị hoặc các nhà phân tích dữ liệu Với những chiều không được phân loại, như là Thời

gian, hệ thông kho dữ liêu sẽ có thể tự động phát sinh tương ứng với bảng chiều (dimension table) dựa trên loại dữ liệu Cần nói thêm rằng, chiều Thời

gian trên thực tế có ý nghĩa đặc biết đối với việc hỗ trợ quyết định cho các

khuynh hướng phân tích Thường thì nó được mong muốn cỏ môt vài tri thức

gắn liền với lịch và những mặt khác của chiều thời gian

Hơn nữa, một khối dữ liệu trong kho dữ liệu phần lớn được xây dựng để đo hiệu quả của công ty Do đó môt mô hình dữ liêu đa chiều đặc thù được tổ

chức xung quanh một chủ đề mà được thể hiên bởi một bảng sự kiên (fact

table) của nhiều độ đo số học (là các đối tượng của phần tích) Ví dụ, một

bảng sự kiện có thể chứa số mặt hàng bán, thu nhập, tồn kho, ngân sach, Mỗi độ đo số học phụ thuộc vào một tập các chiều cung cấp ngữ cảnh cho độ

đo đó Vì thể, các chiều kết hop với nhau được xem như xác định duy nhất độ

đo, là một giá trị trong không gian đa chiều Ví dụ như một kết hợp của Sản

phẩm Thời gian, Thị trường vào 1 thời điểm là một đô đo duy nhất so với các kết hợp khác

Các chiều được phân cấp theo loại Ví dụ như: chiều Thời gian có thể được mô

tả bởi các thuộc tính như Năm, Quỷ, Tháng và Ngày Mặt khác, các thuộc tinh

của một chiều có thể được tổ chức vào một lưới mà chỉ ra một phần trật tự của

chiều Vì thể, cũng với chiều Thời gian có thể được tổ chức thành Năm, Quý,

Tháng, Tuần và Ngày Với sự sắp xếp này, chiều Thời gian không cỏn phân cấp vi có những tuần trong năm có thể thuộc về nhiều tháng khác nhau

Vi vậy, nếu mỗi chiều chứa nhiều mức trừu tượng, dữ liêu có thể được xem từ

nhiều khung nhìn linh đông khác nhau Một số thao tác điển hình của khối dữ

Trang 21

21

liệu như roll-up (ling mirc dé trừu tượng), drill-down (giảm mức đệ trừu

tượng hoặc tăng mức chỉ tiếU, slice and dice (chọn và chiếu), và pivot (định

hướng lại khung nhìn đa chiêu của đỡ liệu), cho phép tương tác truy vẫn vả

phân tích dữ liệu rất tiện lợi Những thao tác đó được biết như Xử lý phân tích tne tuyén (On-Line Analytical Processing — OLAP)

Những nhà ra quyết định thường có những câu hỏi có dang như “tính toán va xếp hạng tổng số lượng hảng hoá bản được theo mỗi quốc gia (hoặc theo mỗi năm)” Họ cũng muốn so sánh hai độ đo số học như số lượng hàng bán và

ngân sách được tổng hợp bởi cùng các chiều Như vậy, một đặc tính để phần

biệt của mô hình dữ Hệu đa chiều là nó nhắn mạnh sự tổng hợp của các độ do

bởi một hoặc nhiều chiều, mả đó là một trong những thao tác chính yếu để

tăng tốc độ xử lý truy vấn [1]

Trang 22

2

CHUONG 2- M6 TA, BANH GIA, PHAN TICH QUY

TRINH NGHIEP VU CUA HE THONG TONG HOP

KINH TE - XA HOI

2.1 Quy trink xác định, tạo lập, lưu trữ, cang cấp thông tìn tổng hợp

XIXI

Các quy trình được thiết lập ở trong phân này sử dụng tải liệu [3]

Quy trình nảy được thực hiện tại (Ất cả các cơ quan cấp số XD, các đơn vị

trực thuộc vả tại văn phòng Bộ XD Bây là quy trình đóng vai trỏ trọng tâm,

có nhiệm vụ tạo nguồn đữ liệu cho kho đữ liệu Quy trinh được chia thành hai quy trình cơn:

+* Quy trình xác định, tạo lập và lưu trữ thông tin ting hop KTXII tai các

là các sở XD của các tỉnh/ thành phố va các đơn vị trực thuộc Bộ XD như các

'tlỗng Công ‡y (công ty), ede đơn vị sự nghiệp như Viện, Trường, Trung

tâm,

Các đơn vị trực thuộc lưu trữ các số liệu phục vụ điều hành tại các đơn vị và

gửi đữ liệu về TT THDL tại Bộ XD

2.1.1 Quy trình xác định, tạo lập và lưu trữ thông tin tổng hợp KTXIH tại các đem vị trực thuộc Bộ XD

Dữ liệu tại cấp sở được lấy trực tiếp từ CSDL tổng hợp của cấp huyện và các

sở ngành khác thông qua các kết nổi trục tiếp Nguồn đữ liệu cung cấp cho sở cỏn do sự thu thập của các phỏng chuyên ngành thông qua các cuộc khảo sát

và pác thông tin từ các doanh nghiệp,

Các chuyên viên của các phòng chuyên ngành có trách nhiệm thu thập số liệu

từ các nguồn đã mô tả để tạo ra các số liệu tổng hợp của sở quản lý Cũng như cấp huyện, có hai loại số liệu tổng hợp: chưa được xác nhận và đã được xác nhận Cho đến khi có số liệu được xác nhận cần phải coi số liêu tổng hợp

chưa dược xác nhân có giá trị phục vụ diều hành của đơn vị vả gửi lên trung, tâm tổng hợp dữ liệu tỉnh, VP Bộ XD.

Trang 23

ngành i tông hợp

SDL TH ofp

tuyện tị

Hình 2.1 Quy trình xác định, tạo lập, lưa trữ thông tin cấp sở

2.1.2 Quy trình cung cấp và tổ chức khai thác thông tin tông hợp

KTXI tại các đơn vị trực thuộc Bộ XD

Số liệu tổng hợp tại Trung Tam tổng hop dữ liệu Bộ XD được lấy trực liếp từ

các kho đữ liệu tổng hợp tại các sở XD, các Tổng Công ty (công ty), các don

vị Viện, Trường, Trung tâm trực thuộc Bộ thông qua truyền số liệu (hoặc

đồng bộ hoá dữ liệu) Dồng thời số liệu còn được thu thập từ chính các phòng chuyên môn trong VP Hộ XD vả các nguồn khác

Trước đây, số liệu không được thu thập trực tiếp mà phải thông qua các báo

cáo Để thực hiện lưu trữ số liệu tổng hợp phục vụ điều hành, Bộ XD cần phải

ban hành các quy định và sửa đổi mẫu thu thập số liệu

Nguồn cung cấp số liễu tổng hợp đáng kế cho kho đữ liệu tổng hợp của Độ

XD xuất phát từ các sở XD lại các tỉnh/thành phế TIiện tại, các sở XD của

các tính“thành phố đã triển khai IITTT TII KTXII cấp tỉnh và hệ thống chỉ tiêu tổng hợp của sở XD đã được chuẩn hóa theo hệ thống chỉ tiêu tống hợp chung của tỉnh

Trang 24

Hình 22 Quy trình thu thập số liệu tại cấp Bộ

2.2 Quy trình cung cấp và tô chức khai thác thông tìn téng hep

KTXIT

Cung cấp và tế chức khai thác thông tin theo yêu cầu của các đối tượng người

sử dụng là chức năng chứng tỏ tính hiệu quả cũng như mức độ thực hiện thành công các mục tiêu và yêu cầu của kho đữ liệu

Quy trình (chức năng) này được thực hiện tại tắt cả các cơ quan cấp sở, đơn vị

trực thuộc và tại VP Bộ XD nhằm thoả mãn các nhu cầu về thông tin tổng hợp KIXH phục vụ điểu hành quản lý của lãnh đạo cơ quan, đội ngũ cản bệ,

chuyên viên của cơ quan và của lãnh dạo Bộ XD Đối với mỗi loại dối tượng,

người sử đụng và tại từng cơ quan, cách thức, hình thức khai thác vá nội dung

théng tin khai thác cần được phân tích cụ thể

2.2.1 Xác định nội dưng và các hình thức cung cấp, khai thác thông tin

s#* Hình 2.1, 2.2 ỡ mục trên đã phân loại các dối tượng sử dụng vả cáo dịa chỉ

cần cung cấp thông tim

% Déi voi mỗi loại đối tượng người sở dụng, cần xác định

"Ndi dung thông tin cần khai thác

Trang 25

25

" Các hình thức, các khuơn dạng tĩnh, khuơn dạng động khai thác thơng

un

= Dinh ky khai thac thong tin

2.2.2 Cung cấp thơng tin tới các địa chỉ cần thiết qua đường truyền

ac don vi true thude BG XD (Cue, Vu Vin, trường, ) cung cấp

théng tin téng hợp KTXH cho kho đữ liệu của Bộ XD

2.2.3 Cung cấp thơng tin tổng hợp KTXIH phục vụ cơng tác điều hành

quản lý

Các Kho dữ liệu thơng tin tổng hợp KTXH của các cơ quan và của Bộ nhằm cung cấp thơng tin tổng hợp KTXH phục vụ nhu cầu khai thác chung:

+ Cung cấp thơng tin tổng hợp KTXH phục vụ điều hành quản lý cho các đối

tượng người sử dụng cĩ liên quan trong hệ thống cơ quan quản lý hảnh

chính

“© Phuc vụ việc tra cứu, xem, m, sà chép các báo cáo của các cơ quan cân sử gửi Bộ XD và báo cáa của Bộ XD gửi Chính phủ

ø tra cứu, tìm kiếm sổ liệu chỉ tiểu cĩ trong ốc kho dữ liệu

theo tiểu thức, từ đĩ cĩ thể in, sao chép các số liệu đĩ

$# Phục vụ việ

tơng hợp K

s#* ao lập các biểu đồ, đồ thị phục vụ cho các phân tích K1XH

#* Cung cấp các cơng cụ thơng kê, phân tích, dự báo liên quan đến các lĩnh

vực KT%XH đề hỗ trợ ra quyết định

Tội dung thơng tin tổng hop KTXH vé co ban cé thé bao gam

+ Báo cáo dinh kỷ

" Phân thco thời gian và kỳ bảo cáo

" Phân theo cơ quan báo cáo

" Phân theo lĩnh vực/ngành

s* Báo cáo nhanh, bảo cáo đột xuất, khơng định kỳ

s* Số liệu chỉ tiêu tổng hợp KTXH

Trang 26

26

"= _'1ra cửu số liệu chỉ tiêu theo tiêu thức

"_ Lập các bằng số liệu dộng (chọn dòng chỉ liêu và cột số liệu)

"Lập các biểu đồ, đồ thị

2.3 Qui trình thực hiện chỗ độ thông tin báo cáa

2.3.1 Quy trinh nghiệp vụ tông quát

Nhìn chung, quy trình lập báo cáo gồm các bước sau đây:

+#* Bước 1 Xác định nội dung, yêu cầu báo cáo Bước này do cơ quan yêu cầu

báo cáo chuẩn bị Xuất phát từ nhu câu thông tin phục vụ sông tác quan ly,

diểu hành, các cơ quan chủ thể quản lý quy dịnh c

các đôi tượng thuộc phạm vi quản lý, trong đó quy định rõ nội dung, yêu cầu và thời gian báo cáo

lộ báo cáo dỗi với

# Dước 2; Chuẩn bị dự thảo báo cáo: Dước này do cơ quan báo cáo thực

hiện Sau khi nhận được yêu cầu bao cáo, đơn vi lập báo cáo (thường giao cho bộ phận Lông hợp) tổ chức thu thập thông tin, nắm bắt tình hình (66 thé

dã được tích lấy trong quả trình công tác), tỉnh toản, phân tích tổng hợp

thông tin và xây dựng dự thảo báo cáo

ước 3: Lay ý kiến tham gia Sau khi hoàn thánh bản dự thảo báo cáo, bộ

phận xây dựng báo cáo gửi lấy ý kiến tham gia của lãnh đạo cơ quan, các

bệ phận chuyên môn khác và hoàn chính lại bản đự thảo

bước 4: Irình người có thắm quyển ký ban hành Trong bước nảy, báo cao

có thể phải bổ sung sửa đổi thea yêu cầu của người ký báo cáo

+* Bước 5: Phát hành và lưu báo cáo Sau khi được người có thẩm quyền ky,

gửi cho Cơ quan yêu cầu báo cáo và các cơ quan, đơn vị liên quan, ding

thời được lưu trữ tại cơ quan lập báo cáo

2.3.2 Quy trình làm báo cáo tại tại Bộ Xây dựng

Ba phan Tổng hợp của Văn phỏng tạo bảo cáo dự thảo dựa trên dữ liệu tổng

hợp từ các đơn vị khác gửi đến Trung tâm tích hợp dữ liệu, tuỷ thco hình thức

báo cáa mà quy trình phê duyệt báo cáo sẽ khác nhau

4 Đối với bảo cáo tuần, đột xuất thì sau khi phòng tổng hợp làm báo cáo dự

thảo sẽ gửi lên cho Chánh văn phỏng phề duyệt, ký và ban hành báo cáo

+#* Đôi với báo cáo tháng sau khi phòng Tông hợp dự thảo báo cáo và lấy ý

kiến của Chánh văn phỏng, trên cơ sở ý kiện đó phòng Tổng hợp sẽ chỉnh

sửa lại bảo cáo và trinh lên cho Lãnh dạo Độ phụ trách tổng hợp xem xét

lại lần cuối, ký báo cáo và ban hành

s* Đối với báo cáo quý, 6 tháng, 9 tháng, năm quy trình cũng gần giống như

bảo cáo tháng, báo cáo sau khi dược phòng tổng hợp dự thảo sẽ được trình

Trang 27

27

lên ban lãnh đạo Bộ để lấy ý kiến, dựa vào đó phỏng Tổng hợp sẽ chỉnh

sửa báo sáo trước khi Irình lên Lãnh đạo Bộ XD phê duyệt lần cuối và ký

báo cáo cho ban hành

# Đối với báo cáo chưyên đề, sau khi các đơn vị pửi các báo cáo chuyên đề

về VP Bộ, phòng Tổng hợp sẽ dự thảo báo cáo và gửi lên cho Chánh văn

phòng phụ trách tổng hợp để lấy ý kiến; sau khi hoàn chỉnh báo cáo, phỏng,

Téng hợp sẽ trình lên ban Lãnh đạo Bộ XD phê duyệt, ký báo cáo và cho

Phing Téng hợp Xin ý kiến Làn Bảo Cầu Dự

thuậc VP HỆXG Thảo Kho số Hệu

Trang 28

2.4 Mô tả thong tin dit liệu

2.4.1 Mô bình dữ liệu

Bài toán xây dựng kho dữ liệu tổng hợp cấp Hệ tại trung tâm tổng hop dữ liệu

nhằm mục Liêu lưu trữ các thư viện danh mục chỉ tiêu, danh mục địa ban, đanh mục đơn vị, toàn Bộ, các số liệu tổng hợp cứa cấp sở, số liệu tổng hợp

của các đơn vị trực thuộc, số liệu tổng hợp do các phòng ban trong VP Hộ

XD, các Cục Vu, Viên và các đơn vị trực thuộc Hộ thu thập và cung cấp

Kho dữ liệu này lưu nhiều nguồn dữ liệu tổng hợp gửi từ các sở và các đơn vị

trực thuộc Khi làm cdc bao cdo lang hyp, phòng tổng hợp của văn phòng Dộ

XD có thể chọn nhiều phương án lựa chọn các chỉ tiêu theo số liệu của các sở

XD, các Cục, Vụ, Viện, đồng thời lưu các chỉ tiên kế hoạch các kỳ báo cáo

của Bộ Ngoài ra còn hưu các báo cáo tổng hợp từ các đơn vị gửi tới và các

bảo cáo do chỉnh Bệ XI) tạo ra

Hình 2.4 Mộ hình tổ chúc đít liệu của Hệ thông tại cắp Bộ

hư vậy, tổ chức lưu trữ dữ liệu trong hệ thống 'THKTXII phục vụ điều hành

Bô XD vừa phân tán vừa tập trung:

© Tai mdi đơn vị đều có một kho dữ liệu phục vụ công tác điều hành của đơn

vị, thí dụ các C§DL của các sở XD đã được xây dựng trong phần mềm

dùng chung đã triển khai tai cap tinh (2005),

s* Dồng thời dữ liệu tổng hợp của các đơn vị được chuyển vào kho dữ liệu

dùng chưng của Bộ XD tại TT TH DL Việc đưa dữ liệu tẳng hợp cúa các

don vi vảo kho đỡ liêu dùng chung của Bộ XD giải quyết được các khó

Trang 29

29

khăn hiện thời: tránh được tệ nạn cát cứ dữ liệu băng cách cung cấp dữ liệu

trực tiếp từ TT THDL cho các don vi can; dé dang lao ra các phân tích, so

sánh các dơn vị với nhau; tạo ra các báo cáo liên ngành hỗ trợ cho công tác

điều hành của Bộ XD và các đơn vị, Ngoài ra việc lưu trữ tập trung tại

TT THDL cén có một ưu điểm là hỗ trợ bảo quản dữ liệu tổng hợp của Hệ

thống tốt hơn

2.4.2 Hệ thống chỉ tiêu tổng hợp chung của Bộ Xây Dựng

"Trong tổng hợp thông tin KTXII, hệ thống chỉ tiêu tổng hợp đóng vai trỏ hết sức quan trọng Chỉ có thông qua ede số liệu của các chỉ tiêu tổng hợp mới có thể đưa ra các quyết định phục vụ cho công tác điều hành ở mọi cấp Chính vì

lẽ đó, cần xây đựng và chuẩn hóa hệ thống các chỉ tiêu tổng hợp chung cho

Bồ

THện tại, Bộ XD chưa có hệ thống chỉ tiêu tổng hợp chung cho toàn ngành mà

chỉ có các chỉ tiêu tổng hợp phục vụ riêng cho các đơn vị cấp Vụ, Viện và VP

Bộ thông qua các báo cáo tổng hợp của các đơn vị cấp sở gửi lên Bộ XD Do

đó Bộ XD chưa có được một CSDL lưu trữ số liệu của các chỉ tiêu tổng hợp

để phục vụ cho công tác điều hành tại cấp Bộ

2.4.2.1 Giới thiệu các báo cáo

Tiộ XD không chuẩn hóa hệ thống chỉ tiêu tổng hợp dùng chung cho các đơn

vị trực thuộc Bộ mà chuẩn hóa các báo cáo Công việc nảy không cho phép

Bộ có được các kho sế liệu tổng hợp đùng chung cho Bộ vả các đơn vị trực

thuộc Đến năm 2005 cơ sở đữ liệu Báo cáo của Bộ Xây dựng dã lưu trữ dược

2100 báo cáo tương dương 2,5 GB

Các chỉ tiêu tổng hợp còn bị lẫn lộn với các thuộc tính quản ly trong các CSDL chuyên ngành như “Quản lý các dự án đầu tư”, “Quản lý các để tải nghiên cứu khoa học”, “Kế toán chủ đầu tư” Có thể xây ra thông kê chồng

chéo, ví dụ, sẵn lượng xi măng có chỉ tiêu tổng hợp cho các sở XD đẳng thời

có chỉ tiêu pho cdc nha may xi mang và nhất định nha may xi măng do phải

trên địa bản nào đó Có rất nhiễu chỉ tiêu tổng hợp xuất hiện trong các bảo cáo

của các đơn vị khác nhau, tuy nhiên không, thể xác định được tính đúng đắn

khi phải so sánh giữa chúng

Tăng oáo báo cáo đã được chuẩn hóa dưới dạng được phân tích để tiến đến xây dựng một hệ thống các chỉ tiêu TH cho Bộ XD.

Trang 30

‘Tinh hinh thực hiện đầu tư từ nguồn

vến ngân sách nha nước nằm

Giá trị sản xuất kinh đoanh tháng

Bao cáo tình hình thực hiện Công

tác quy hoạch xây dựng đô thị vả khu công nghiệp tháng đầu năm

Sở XD

Tảo cáo tỉnh hình thực hiện các dự

an cấp thoát nước và vệ sinh môi

trường tháng đầu năm

Sở XD

THện trạng, sẵn xuất sử dụng nước trong tỉnh, thành phổ tháng đầu

Trang 31

31

tháng đầu năm Kê

TƯớc thực hiện các chỉ tiểu chủ yếu Các dơn vị xây lắn & San xuất

lã tháng đầu năm áp dụng cho vật liệu xây dựng

các đơn vị xây lắp & San xuất vật

liệu xây đựng

Tự kiến giá trị sản xuất vả doanh Các đơn vị xây lắp

thu xây lấp tháng đầu năm (áp

dung cho các don vi cé thi céng các

céng trinh)

Ước thực hiện các chỉ tiêu chủ yếu Các đơn vị Xuất bản, Báo chỉ

15 tháng đầu năm áp dụng cho

các đơn vị Xuất bản, Dáo chí

16 6 Ước thực hiện giá trị sản phẩm vật Các đơn vị sản xuất vật liệu

liệu xây dựng tháng năm xây dựng, sở XT)

7 Ước thực hiện vến đầu tư xây dựng Sở XD, các don vị thi công

24 | Cấp phép cho nhà thầu nước ngoài

IV Quân ly aha ở

25 | Quỹ nhà ở, hình thức sở hữu nhả, Xây dựng lại

Trang 32

32

cấp quản lý nhà ở, cấp quyển sử dụng, Chính sách đối với người có

"Trong luận án sẽ sứ dụng các chỉ tiêu tổng hop trong các báo cáo để xây dựng minh họa một hệ thống các chí tiêu tổng hợp cho Bộ XD Việc sử dụng hệ thống các chỉ tiêu tổng hợp này hay không côn phụ thuộc vào các cơ quan có

thâm quyền của Bộ XD quyết định

Có thể mô tả sơ qua hệ thống chỉ tiêu tổng hợp nảy như sau

* Hệ thống chỉ tiêu tống hợp được chia thành các nhóm theo ngành và mã

hóa nhóm ngành

+» Iiệ thống nảy gồm khoảng 300 chỉ tiêu tổng hợp đủ để mô tả đữ liệu của

kho dữ liệu TH KTXH

4+ Hệ thống chí tiêu dược mã hóa có tỉnh đến việc thêm các ngành mới, nhỏm

mới thuộc một ngành va thêm các chỉ tiêu cụ thể mới đến cấp n tùy ý

CT01 |CT01.1 Giá trị 5X xây lắp Triệu | Sở XD, các Sở XD, Vụ

đồng | đơn vị xây Xây

Trang 33

33

- Ngoài Quốc doanh

- Doanh nghiện dẫu tư nước ngoài

- Ngoài Quốc doanh

- Doanh nghiệp đầu tư nước ngoài

C101.3 Tổng số nệp ngân sách Triệu | Sở XD, Vu Kê

- Ngoài Quốc daanh

- Doanh nghiệp đầu tư nước ngoài

CT01 4 Giá trị Tư vẫn XD Triệu [Sc XD, Vụ Kế

Trang 34

34

Trong dé

- Quấc doanh

- Ngoải Quốc doanh

- Doanh nghiệp dầu tư nước ngoải

hoặc các KẾ hoạch

đơn vị trực Thống kê

thuộc Bộ

XD CT01.6 1 GTSX xây lắp (kể ộ KL | Triệu

do bên A cấp vat tr) đơng

Trang 35

đồng |Tổng CT hoạch

và các đơn Thống kê,

VỊ trực Vụ Kimh tế,

thuộc Hệ — tải chính CT01.10 Tỷ suất lợi nhuận/Doanh | Triệu |Tổng CT Vu Kế

vi trực Thống kê,

thuộc Hệ Vu Kinh té,

tai chinh CT01.11 Tỷ suất lợi nhuậntổng tài | Triệu |Sở XD, Vụ Kế

và các dơn Thống kế,

vị trực Vụ Kinh tế,

thuộc Bộ — tàichính

CT01.12 Tý suất lợi nhuận sau thuế | Triệu | Sở XD, Vu Kế

Trang 36

CT01.13.2 Đầu tư mua sắm TSŒP | Triệu

dung cho SX thông qua XDCB đồng

CT01.13.3 Đầu tư sửa chữa lớn | triệu

CT01.13.6 Phân chia theo lĩnh vực Triệu

- Các dự án phát triển nhà CT01.13.7 Tổng số dự án Dự án

Trang 37

- Ngoài Quốc doanh

- Doanh nghiệp đầu tư nước ngoài

Ngày đăng: 21/05/2025, 20:53

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1, Lé Hoang Diing, OLAP (On-line Analytical Processing). tr. 2 — 13 Sách, tạp chí
Tiêu đề: OLAP (On-line Analytical Processing)
Tác giả: Lé Hoang Diing
2. Đăng Văn Ninh (2004), Yay dung kho dit liéu (Data Warehouse), tr. 6, 17, 37 — 42, Luận văn thạc sĩ Công nghệ Thông tin, trường Đại học Công Nghệ Hà Nội Sách, tạp chí
Tiêu đề: Yay dung kho dit liésu (Data Warehouse)
Tác giả: Đăng Văn Ninh
Nhà XB: Trường Đại học Công Nghệ Hà Nội
Năm: 2004
3. Van phòng Bộ Xây dựng (2006), tài liêu hướng dẫn "Giải pháp kha thi Hé thong thông tin tông hợp kinh tế- xã hội phục vụ điều hành Bộ XD", tr. 12~21,37—35Tiếng Anh Sách, tạp chí
Tiêu đề: Giải pháp kha thi Hé thong thông tin tông hợp kinh tế- xã hội phục vụ điều hành Bộ XD
Tác giả: Van phòng Bộ Xây dựng
Năm: 2006
4. Barry Devlin (1997), Data Warehouse from Architecture to Implementation, Addision, pp. 42 - 55 Sách, tạp chí
Tiêu đề: Data Warehouse from Architecture to Implementation
Tác giả: Barry Devlin
Nhà XB: Addision
Năm: 1997
5. Vincent Rainardi (2008), Building a Data Warehouse with examples in SQL. Server, Apress, pp. 71 — 75, 329 —413 Sách, tạp chí
Tiêu đề: Building a Data Warehouse with examples in SQL
Tác giả: Vincent Rainardi
Nhà XB: Apress
Năm: 2008
6. W.H Inmon (2002), Building a Data Warehouse, John Wiley & Sons, pp. 81-113Internet Sách, tạp chí
Tiêu đề: Building a Data Warehouse
Tác giả: W.H Inmon
Nhà XB: John Wiley & Sons
Năm: 2002
7. MSDN — SQL Server Help Center, Analysis Services Tutorials, http://msdn. microsoft. com/en-us/library/ms 166552%28SQL.90%29. aspx 8. WebMediaBrands Corporate Info, An Introduction to OLAP in SOL Server Sách, tạp chí
Tiêu đề: Analysis Services Tutorials

HÌNH ẢNH LIÊN QUAN

Hình  1.2—  Mô  phòng  sơ  đồ  tuyết  rơi  (mở  rộng  của  sơ  đồ  hình  sao) - Luận văn xây dựng kho dữ liệu cho hệ thống tổng hợp thông tin kinh tế xã hội
nh 1.2— Mô phòng sơ đồ tuyết rơi (mở rộng của sơ đồ hình sao) (Trang 19)
Hình  2.1.  Quy  trình  xác  định,  tạo  lập,  lưa  trữ.  thông  tin  cấp  sở - Luận văn xây dựng kho dữ liệu cho hệ thống tổng hợp thông tin kinh tế xã hội
nh 2.1. Quy trình xác định, tạo lập, lưa trữ. thông tin cấp sở (Trang 23)
Hình  22.  Quy  trình  thu  thập  số  liệu  tại  cấp  Bộ - Luận văn xây dựng kho dữ liệu cho hệ thống tổng hợp thông tin kinh tế xã hội
nh 22. Quy trình thu thập số liệu tại cấp Bộ (Trang 24)
Hình  3.1  Mối  quan  hệ  của  nhiều  loại  công  nghệ  trong  Analysis  Services  (dịch - Luận văn xây dựng kho dữ liệu cho hệ thống tổng hợp thông tin kinh tế xã hội
nh 3.1 Mối quan hệ của nhiều loại công nghệ trong Analysis Services (dịch (Trang 55)
Hình  3.2  Kiến  trúc  dịch  vụ  OLAP - Luận văn xây dựng kho dữ liệu cho hệ thống tổng hợp thông tin kinh tế xã hội
nh 3.2 Kiến trúc dịch vụ OLAP (Trang 56)
Hình  quan  hệ,  thì  không  cân  thiết. - Luận văn xây dựng kho dữ liệu cho hệ thống tổng hợp thông tin kinh tế xã hội
nh quan hệ, thì không cân thiết (Trang 57)
Hình  3.4  Mô  hình  Relation  OLAP - Luận văn xây dựng kho dữ liệu cho hệ thống tổng hợp thông tin kinh tế xã hội
nh 3.4 Mô hình Relation OLAP (Trang 58)
Hình  3.5  Mô  hình  Hybird  OLAP  Lợi  ích  của  việc  lưu  trữ  trong.  cấu  trúc  HOLAP  là - Luận văn xây dựng kho dữ liệu cho hệ thống tổng hợp thông tin kinh tế xã hội
nh 3.5 Mô hình Hybird OLAP Lợi ích của việc lưu trữ trong. cấu trúc HOLAP là (Trang 59)
Hình  3.6  Mô  hình  kiến  trúc  của  địch  vụ  OLAP - Luận văn xây dựng kho dữ liệu cho hệ thống tổng hợp thông tin kinh tế xã hội
nh 3.6 Mô hình kiến trúc của địch vụ OLAP (Trang 61)
Hình  3.7  Kiến  trúc  thành  phần  Server - Luận văn xây dựng kho dữ liệu cho hệ thống tổng hợp thông tin kinh tế xã hội
nh 3.7 Kiến trúc thành phần Server (Trang 62)
Hình  3.8  Kiến  trúc  thành  phần  Client - Luận văn xây dựng kho dữ liệu cho hệ thống tổng hợp thông tin kinh tế xã hội
nh 3.8 Kiến trúc thành phần Client (Trang 63)
Mục  trên,  ta  xác  định  được  3  bảng  chiều  sau:  Date,  Norm  và  Area - Luận văn xây dựng kho dữ liệu cho hệ thống tổng hợp thông tin kinh tế xã hội
c trên, ta xác định được 3 bảng chiều sau: Date, Norm và Area (Trang 65)
Hình  3.11  Cấu  trúc  khối  (cube)  TH_KTXH.cube - Luận văn xây dựng kho dữ liệu cho hệ thống tổng hợp thông tin kinh tế xã hội
nh 3.11 Cấu trúc khối (cube) TH_KTXH.cube (Trang 67)
Hình  3.10  Khung  nhìn  dữ  liệu  của  Data  Mart  hệ  thông - Luận văn xây dựng kho dữ liệu cho hệ thống tổng hợp thông tin kinh tế xã hội
nh 3.10 Khung nhìn dữ liệu của Data Mart hệ thông (Trang 67)
Hình  3.15  -  Báo  cáo  sản  lượng  Xi  măng  các  loại  từ  năm  2000  đến  2008  —  sử  dung  dich  vu  Reporting  Services - Luận văn xây dựng kho dữ liệu cho hệ thống tổng hợp thông tin kinh tế xã hội
nh 3.15 - Báo cáo sản lượng Xi măng các loại từ năm 2000 đến 2008 — sử dung dich vu Reporting Services (Trang 71)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm