Tiến trình– Các tài liệu kĩ thuật, phân ra các module – Xác lập các chuẩn hóa – Cải tiến phương thức phân phối công việc • Các công cụ phần mềm và tài liệu hướng dẫn • Phương thức kho d
Trang 1Chương 7: Phương thức xây
dựng kho dữ liệu
Trang 3Tiến trình
– Các tài liệu kĩ thuật, phân ra các module
– Xác lập các chuẩn hóa
– Cải tiến phương thức phân phối công việc
• Các công cụ phần mềm và tài liệu hướng dẫn
• Phương thức kho dữ liệu
– Các tác vụ và phân phối công việc để xây dựng kho dữ liệu và cài đặt
Trang 4lượng và sự đầy đủ của dữ liệu
– Đinh nghĩa việc quản lí tác vụ
– Tối ưu hóa các tác vụ
Trang 6TàI liệu và công cụ hỗ trợ
Trang 7Phương pháp luận
• Tập trung vào phạm vi của ứng dụng
• Quản lí được các rủi ro
• Căn cứ vào các đóng góp của người dùng
• Cung cấp các giảI pháp có thể mở rộng
• Sử dụng nhiều công nghệ khác nhau
• Nhận dạng các tác vụ với các đối tượng và định nghĩa rõ ràng
• Đưa các tác vụ vào trong các tiến trình, nhóm tiến trình theo giai đoạn
Trang 9Phase 2 Task1 Phase 2 Task2 Phase 2 Task3 Process 1
Process 2
Trang 10Các tiến trình
• Tập kết dính các tác vụ để thực hiện các mục tiêu
• Tập các kĩ năng chung
• Dự án có thể chuyển giao
• Đa số là trùng lặp, một số thì lệ thuộc vào tiến trình trước
Trang 11Các tiến trình
Business Requirements Definition
Data Acquisition
Data Quality Warehouse Administration
Metadata Management
Data Access Database Design and Build
Documentation
Testing Training Transition Post-Implementation Support
Architecture
Trang 12Định nghĩa các yêu cầu kinh doanh
• Định nghĩa các yêu cầu
• Phân lớp các vùng
• Khởi tạo các kế hoạch cài đặt
• Cung cấp sự khởi đầu tập trung vào việc tiến hành xây dựng hệ thống cho công ty
• Xác định các yêu cầu về thông tin
• Các yêu cầu về mô hình
Trang 13Thu thập dữ liệu
• Xác định, chiết, chuyển đổi, và chuyển tải dữliệu nguồn
• Xem xét dữ liệu bên trong và bên ngoài
• Chuyển dời dữ liệu giữa nguồn và đích
• Thực hiện phân tích kết nối giữa dữ liệu
nguồn và các đối tượng csdl đích
• Định nghĩa việc thu thập lần đầu và kế hoạch làm tươi dữ liệu
• Định nghĩa các yêu cầu về công cụ
• Xây dựng, test, và thực hiện các module nạp
dữ liệu
Trang 14Kiến trúc
• Định rõ các nền tảng kĩ thuật
• Thiết kế kiến trúc kho dữ liệu
• Tích hợp các thành phần kiến trúc cho mục đích khả biến và mềm dẻo
• Xác định môi trường CSDL, phân tán hay tập trung
• Định nghĩa các môi trường phát triển, test,
huấn luyện, và sản xuất
• Cấu hình nền Configure the platform
• Thực hiện việc tính dung lượng CSDL
• Xem xét việc làm sạch đĩa
Trang 15Chất lượng của dữ liệu
của dữ liệu
• Phát triển một chiến lược để:
– Làm sạch dữ liệu
– Các chức năng đảm bảo tính toàn vẹn của dữ liệu
– Các chức năng quản lí chất lượng của dữ liệu
• Xác định các luật kinh doanh:
– Làm sạch dữ liệu
– Xử lí các lỗi
• Các yêu cầu cho việc tạo ra các công cụ kiểm tra
chất lượng của dữ liệu
• Xây dựng, test, và thực hiện các module cho việc tạo
và kiểm chứng chất lượng dữ liệu
Trang 16Bảo trì kho dữ liệu
• Định rõ một chiến lược bảo trì kho dữ liệu
– Quản lý cấu hình
– Quản lý kho dữ liệu
– Sự quản lí và chi phối dữ liệu
• Định nghĩa dòng công việc quản lí kdl và các yêu cầu về công cụ
• Xây dựng, test, và thực hiện các module cho việc bảo trì kho dữ liệu
• Quản lý việc truy cập dữ liệu và giám sát
• Tự động hóa các tác vụ quản lý kdl
Trang 17Các loại siêu dữ liệu
• Định nghĩa chiến lược cho việc tạo và quản lísiêu dữ liệu
• Định nghĩa các kiểu siêu dữ liệu
• Chỉ rõ các yêu cầu cho lưu trữ siêu dữ liệu đáp ứng các yêu cầu quản lí việc tích hợp vàtruy cập
• Khởi tạo các khung nhìn kĩ thuật và kinh
doanh cho siêu dữ liệu
• Phát triển các module cho việc nắm bắt, kết nối và truy cập siêu dữ liệu
Trang 18Truy cập dữ liệu
• Nhận diện, chọn lựa và thiết kế các công cụ quản lí việc truy cập của người dùng
• Xác định các yêu cầu của kiểu giao diện, các cấu trúc câu hỏi, các báo cáo, và các loại người dùng
việc truy cập
• Thiết kế và phát triển các đối tượng truy cập dữ liệu
– Câu hỏi và báo cáo
– Catalogs
– Chiều và các phân cấp
Trang 19Thiết kế và xây dựng cs dữ liệu
• Hỗ trợ các yêu cầu dữ liệu
• Thiết kế CSDL nhằm mục đích cung cấp các truy cập có hiệu quả
• Tạo và phê chuẩn các mô hình logic và vật lí
• Tạo lập các đối tượng CSDL quan hệ và đa chiều
• Ước lược các phân đoạn, các đoạn, và việc sắp xếp
• Nhận diện các khóa và chỉ mục
• Xây dựng và cài đặt các đối tượng csdl
Trang 20Lập tài liệu
• Cung cấp các văn bản có thể cung cấp các thông tin:
– Từ điển thuật ngữ Glossary
– Tài liệu cho người dùng và tài liệu kĩ thuật User and technical documentation
– Trợ giúp trực tuyến Online help
– Hướng dẫn tham khảo siêu dữ liệu
– Tham cứu sự quản lí kdl
– Hướng dẫn các tính năng mới
Trang 21• Phát triển một chiến lược để test hệ thống
• Tạo lập các kế hoạch , kịch bản cho việc test
Trang 22Huấn luyện
• Định nghĩa các yêu cầu
– Về kĩ thuật Technical
– Của người dùng cuối End user
– Của yêu cầu kinh doanh
• Nhận diện các cá nhân cho việc huấn luyện
• Tạo lập khung thời gian cho việc huấn luyện
• Thiết kế và phát triển các tài liệu
• Tập trung vào việc huấn luyện sử dụng các công cụ hỗ trợ hoạt động của kho dữ liệu
Trang 23Chuyển giao
• Định nghĩa các tác vụ cho việc chuyển giao sử dụng kdl
• Chuyển giao các chức năng và module
• Phát triển kế hoạch cài đặt
• Chuẩn bị môi trường bảo trì
• Chuẩn bị môi trường cho việc sử dụng kho dữ liệu
Trang 24Hỗ trợ hậu thực thi
• Ước lượng và khảo sát việc sử dụng kdl
• Giám sát việc sử dụng kdl
• Làm tươI kdl
• Giám sát và phản hồi các vấn đề xảy ra
• Điều khiển thực hiện test
• Có trách nhiệm chuyển giao sản phẩm
• Ước lượng và khảo sát các giải pháp thực thi
Trang 25Increment I Proof of Concept
Increment II through N
Trang 26Hướng tăng tiến
Trang 27Phát triển tăng tiến
cho việc tăng trưởng,
tiến hoá của kdl
PGM/PJM Project and Program Management
ETA Enterprise Technical Architecture
ETA Enterprise Technical Architecture
Definition Analysis Design Build Transition to Production
Discovery
Incremental Development
Trang 28PGM/PJM Project and Program Management
ETA Enterprise Technical Architecture
ETA Enterprise Technical Architecture
Definition Analysis Design Build Transition to Production Discovery
Incremental Development
Trang 29• Định nghĩa các chiến lược quản lí
sự tăng tiến của kho dữ liệu
• Định nghĩa siêu dữ liệu, truy cập,
và test và kế hoạch huấn luyện
Strategy
PGM/PJM Project and Program Management
PGM/PJM Project and Program Management
ETA Enterprise Technical Architecture
ETA Enterprise Technical Architecture
Definition Analysis Design Build
Transition to Production Discovery
Incremental Development
Trang 30Phân tích
• Thu thập các yêu cầu về thông tin
• Hoàn thành các mô hình kdl và đa
• Lập các báo cáo về việc truy cập
các yêu cầu về truy cập dữ liệu
• Phân tích các kế hoạch test
Strategy
PGM/PJM Project and Program Management
PGM/PJM Project and Program Management
ETA Enterprise Technical Architecture
ETA Enterprise Technical Architecture
Definition Analysis Design Build Transition to Production Discovery
Incremental Development
Trang 31Thiết kế
kế
và làm tươi dữ liệu trong kdl
đặt phần cứng và phần mềm
dữ liệu
tham khảo và huấn luyện người dùng
Strategy
PGM/PJM Project and Program Management
PGM/PJM Project and Program Management
ETA Enterprise Technical Architecture
ETA Enterprise Technical Architecture
Definition
Analysis Design
Build
Transition to Production
Discovery
Incremental Development
Trang 32Xây dựng
• Ánh xạ dữ liệu nguồn vào csdl vật
lý
• Mã hóa các modules
• Tích hợp kiến trúc tăng tiến với kiến
trúc kinh doanh của xí nghiệp
• Xây dựng các module quản lí chất
PGM/PJM Project and Program Management
ETA Enterprise Technical Architecture
ETA Enterprise Technical Architecture
Trang 33PGM/PJM Project and Program Management
ETA Enterprise Technical Architecture
ETA Enterprise Technical Architecture
Trang 34• Lập tài liệu cho các
kinh nghiệm và các bài
PGM/PJM Project and Program Management
ETA Enterprise Technical Architecture
ETA Enterprise Technical Architecture
Definition
Analysis Design
Build
Transition to Production
Discovery
Incremental Development
Trang 35Các tác vụ và sự thực thi
Task Id Task Name
A Strategy
A.RD.EXEC Business Requirements Definition
Warehouse
Requirements
Warehouse
Trang 36Các tác vụ và sự thực thi
• The project team: chức năng và trách nhiệm
• Các chức năng chung
– Phân tích, quản trị csdl, lập trình, và test
– Các chức năng đặc biệt của kdl
– Kiến trúc kdl, kiến trúc siêu dữ liệu, quản trịchất lượng dữ liệu, quản trị kdl