Data Warehouse
Trang 1Data Warehouse
C¸c kh¸i niÖm c¬ b¶n
Trang 2Néi dung
Nhµ kho d÷ liÖu lµ g×?
So s¸nh kh¸c nhau gi÷a OLTP vµ DW
Ph¹m vi, kiÓu cña DW vµ vÞ trÝ cña ODS
Data mart (chî d÷ liÖu)
KiÕn tróc DW
C¸c thµnh phÇn chÝnh cña DW
Trang 3Hình dung một Nhà kho dữ liệu
Chất lượng dữ liệu cao
Thường được lưu trong một
hệ quản trị CSDL quan hệ
Dễ dàng truy cập bởi các
công cụ theo yêu cầu khai thác của người sử dụng
Trang 4Nhà kho dữ liệu là gì?
Một Nhà kho d ữ liệu là một hệ thống qu ả n lý tập hợp các d ữ liệu hướng chủ đề, tích
hợp, phụ thuộc thời gian, b t bi n ấ ế , được thiết kế để phục vụ cho các hệ trợ giúp
quyết định
Trang 5Hướng chủ đề
chung ví dụ là khách hàng, s ả n phẩm, Thị trư ờng.v v
Hệ thống OLTP Data Warehouse
Tiền vay Tiết kiệm
Phát hành séc
Trang 6TÝch hîp
D÷ liÖu ®îc ®a vµo theo mét c¸ch thèng nhÊt
C¸c HT ®iÒu hµnh Data Warehouse
Mr J Smith Joe Smith Smith, Joseph
J Smith
Mr J Smith
Database A Database B Database C Database D
bal-on-hand balance
curr_bal cash_avail
balance
Database A Database B Database C Database D
Trang 7B t bi n ấ ế
Dữ liệu trong kho d ữ liệu không được sửa đổi.
Định nghĩa này chỉ mang tính lý thuyết và đã thay
đổi trong thực tế.
Cập nhật Xoá Thêm Tra cứu Truy vấn
Các hệ thống điều hành
Data Warehouse
Truyền tải dữ liệu
Trang 8Truyền tải, làm tươi và cập nhật dữ liệu
Truyền tải ban đầu
tháng
Trang 9Phụ thuộc thời gian
D ữ liệu trong kho d ữ liệu được lưu tr ữ một cách đặc thù trong một chu kỳ thời gian
Không sửa đổi
được
HT điều hành Data Warehouse
60-90 days Không có phần
tử thời gian Sửa đổi được
Trang 10đọc và ghi Dữ liệu hiện thời Tính trước
Điều hành và báo cáo
Warehouse
500 GB đến 2 TB Nội bộ và cả bên ngoài Chỉ đọc
Dữ liệu lịch sử Không tính trước được Phân tích, dự báo, khai khá
Trang 11Mäi møc
Trang 13C¸c kiÓu Nhµ kho d÷ liÖu chÝnh
XÝ nghiÖp (Data Warehouse)
Phßng ban (Data Mart)
Ph©n tÝch (OLAP)
KÕt xuÊt th«ng tin
Trang 14Kho d÷ liÖu ®iÒu hµnh (ODS) vµ Warehouse
HT ®iÒu hµnh
Trang 15Data Marts
Bao gồm các tập con của dữ liệu WH
Mang tính địa phương hoá
Dùng cho các hỗ trợ quyết định cụ thể theo:
Khu vực địa lý
Chức năng nghiệp vụ
Giảm
Yêu cầu cho một DWH
Lưu lượng truyền dữ liệu qua mạng
Trang 16Data Mart
Kiểu phụ thuộc: Dữ liệu được cung cấp từ một DWH
Kiểu độc lập: Dữ liệu được cung cấp từ các nguồn nội bộ và bên ngoài
HTđiều
hành
Data Warehouse Data Mart
Phụ thuộc Phụ thuộc
Độc lập
Trang 17KiÕn tróc kho d÷ liÖu
Kho d÷ liÖu
(xÝ nghiÖp)
Data Warehouse Chî d÷ liÖu (phßng ban)
Data Warehouse truy vÊn, c«ng cô OLAP
Data Warehouse øng dông D÷ liÖu tµi s¶n (legacy)
D÷ liÖu
(xÝ nghiÖp)
Data Warehouse Chî d÷ liÖu (phßng ban)
Data Warehouse Khai ph¸ D÷ liÖu
C¸c nguån
Trang 18C¸c thµnh phÇn cña kho d ÷ liÖu
phÇn Mçi thµnh phÇn cã thÓ ®îc xö lý bëi mét hay nhiÒu m¶ng phÇn cøng hoÆc phÇn mÒm
hoÆc tõ ®iÓn C¸c catalog nµy ®îc qu¶n lý víi c¸c c«ng cô siªu
Trang 19Các thành phần của kho dữ liệu
Dữ liệu
Dữ liệu
Dữ liệu Tác nghiệp
Kết xuất Biến đổi
Di chuyển
Data Warehouse Siêu dữ liệu
Các công cụ OLAP
Các công
cụ SQL, các ứng dụng
Lưu trữ
Trang 20Tóm tắt
Những đặc trưng chính của DW
Phân biệt DW với OLTP
Phạm vi, kiểu và kiến trúc DW
ODS và DM
Kiến trúc DW
Các thành phần chính
Trang 21Hướng chủ đề, tích hợp, phụ thuộc thời gian và
không bị phá huỷ có phải là định nghĩa để xác định một Data Warehouse?
Có
Không
Trang 22Cã ph¶i OLTP hç trî cho c¸c nhu cÇu nghiÖp vô cô thÓ cßn DWH hç trî cho nhu cÇu ph©n tÝch?
Cã
Kh«ng
Trang 23Truyền tải dữ liệu theo khối, truy vấn tuỳ biến và dữ liệu lịch sử là đặc trưng của kiểu CSDL nào?
Điều hành
DWH