Trắc nghiệm, bài giảng pptx các môn chuyên ngành Y dược và các ngành khác hay nhất có tại “tài liệu ngành Y dược hay nhất”; https://123doc.net/users/home/user_home.php?use_id=7046916. Slide bài giảng môn data ware house ppt dành cho sinh viên chuyên ngành công nghệ - kỹ thuật và các ngành khác. Trong bộ sưu tập có trắc nghiệm kèm đáp án chi tiết các môn, giúp sinh viên tự ôn tập và học tập tốt môn data ware house bậc cao đẳng đại học chuyên ngành công nghệ - kỹ thuật và các ngành khác
Trang 2Kiến trúc 3 tầng của hệ hỗ trợ quyết địnhInformation Sources Data Warehouse
Server (Tier 1)
OLAP Servers (Tier 2)
Clients (Tier 3)
Data Marts
Data Warehouse
Trang 3 OLAP: Online Analytical Processing
Mục tiêu của OLAP: Hỗ trợ các truy vấn đặc biệt cho phân tích kinh doanh
◦ Tổng hợp, phân tích thực hiện trên khối lượng lớn dữ liệu (đa chiều) → hỗ trợ quyết định:
Các công cụ phục vụ người dùng (Frontend) trong Data Warehouse
Khung nhìn đa chiều (Multidimensional view ) là nền tảng cho OLAP
Trang 4 On-Line Transaction Processing (OLTP):
– Công nghệ được dùng để thực hiện các cập nhật trên các hệ thống giao dịch hay tác nghiệp
On-Line Analytical Processing (OLAP):
– Kỹ thuật được dùng để thực hiện các phân tích phức tạp
của dữ liệu trong data warehouse
Trang 6 Finance: Lập ngân sách, dự toán kinh phí, phân tích hoạt động tài…
Sales: Phân tích bán hàng và dự báo doanh số bán Marketing: Phân tích thị trường, khách hàng, khuyến mãi…
Manufacturing: Hỗ trợ lập kế hoạch sản xuất, phân tích lỗi
…
Trang 8 Khung nhìn đa chiều là nền tảng cho OLAP
Các độ đo (Measures): Dữ liệu số cần theo dõi, được tinh toán
Các chiều (Dimensions): Các tham số định nghĩa một giao dịch (xác định giá trị của độ đo)
Mô hình hóa chiều là kỹ thuật cho việc cấu trúc
dữ liệu quanh các khái niệm kinh doanh
Các mô hình chiều: mô tả các độ đo và chiều
Trang 9 Chiều có các thuộc tính
Các chiều có thể được tổ chức phân cấp
◦ Ví dụ: Chiều Time: days → weeks → quarters
◦ Chiều Product: product → product line → brand
Trang 10CS 336 10
District Region Total
Brand Manufacturer Total
Trang 11sale prodId storeId amt
Trang 1203/22/21 12
dimensions = 3
Multi-dimensional cube: Fact table view:
sale prodId storeId date amt
Trang 1310 34 56 32 12 56
Country
roll-up to week roll-up to brand roll-up to region
Trang 1403/22/21 14
Ví dụ: Lược đồ STAR với 3 chiều
Trang 16 Được phân loại theo kiến trúc sử dụng để lưu trữ và xử lý dữ liệu đa chiều
Các loại chính:
Multi-dimensional OLAP (MOLAP)
Relational OLAP (ROLAP)
Hybrid OLAP (HOLAP)
16
Trang 17 Sử dụng MDDBMS để lưu trữ và phân tích
Data structures: Array technology + các kỹ thuật lưu trữ hiệu quả
để tối thiểu không gian lưu trữ
Một số vấn đề phát sinh với MOLAP:
◦ Chỉ có một số lượng hạn chế của dữ liệu có thể được lưu trữ và phân tích hiệu quả
◦ Việc phân tích bị giới hạn vì dữ liệu được thiết kế theo những yêu cầu định trước y/c tập các kỹ năng và cung cụ để tạo và duy trì
Trang 1803/22/21 18
Trang 19 ROLAP : fastest-growing type của OLAP tools.
ROLAP hỗ trợ các RDBMS thông qua sử dụng metadata
layer( tránh được yêu cầu tạo cấu trúc dữ liệu đa chiều tĩnh)
Cho phép tạo nhiều multi-dimensional views từ two-dimensional relation.
Trang 20 HOLAP: Phân phối dữ liệu trực tiếp từ DBMS hoặc theo MOLAP server đến desktop (hay local server) ở dạng data cube (được stored, analyzed và
maintained cục bộ)
Trang 21 Slice (cắt lát)
Dice (vạch ô)
Drill Down: Lấy thông tin chi tiết
Rollup: Tổng hợp, giảm chiều
Pivote (Rolate): Slice và rolate
Trang 2203/22/21 22
Trang 28Toys $0.75 Clothing $4.6 Cosmetics $1.5
Products
Store s1 Store s2 Store s1 Electronics $5.2 $8.9
Toys $1.9 $0.75 Clothing $2.3 $4.6 Cosmetics $1.1 $1.5 Store s2 Electronics
Toys Clothing
($ millions)
d1
Sales ($ millions)
Time
Sales
Slicing &
Pivoting
Trang 29Slicing & Pivoting
Trang 30 Ưu điểm của SQL:
◦ Chuẩn quốc tế
◦ Độc lập với DBMS
◦ Dễ học, dễ hiểu, phi thủ tục
◦ …
Để cải tiến khả năng tổng hợp dữ liệu, chuẩn SQL cmở rộng chức năng
GROUP BY với ROLLUP và CUBE (chuẩn 99)
Trang 31 Tính toán khôi hợp của mỗi tập con các thuộc tính
Ví dụ:
select item-name, color, size, sum(number)
from sales
group by cube(item-name, color, size)
Hợp của 8 nhóm khác nhau của quan hệ sales:
Trang 32 Hàm grouping() có thể được áp dụng trên một thuộc tính
◦ Trả về 1 nếu giá trị là null (cho all),
◦ Trả về 0: Các trường hợp khác
select item-name, color, size , sum( number ),
grouping( item-name ) as item-name-flag ,
grouping( color ) as color-flag ,
grouping( size ) as size-flag ,
from sales
group by cube( item-name, color, size )
Có thể sử dụng hàm decode() trong mệnh đề select để thay thế giá trị null bởi All
◦ Ví dụ: decode( grouping(item-name), 1, ‘all’, item-name)
Trang 33 Rollup: Phát sinh hợp trên mọi tiền tố của danh sách thuộc tính
{ (item-name, color, size), (item-name, color), (item-name), ( ) }
Rollup có thể được dùng để phát sinh tổng hợp ở đa mức của một phân cấp
Ví dụ: Giả sử table itemcategory(item-name, category) : Loại mặt
Trang 3403/22/21 34