1. Trang chủ
  2. » Giáo Dục - Đào Tạo

GIỚI THIỆU về OLAP (online analytical processing) (DATA WARE HOUSE SLIDE)

35 142 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 35
Dung lượng 3,58 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Trắc nghiệm, bài giảng pptx các môn chuyên ngành Y dược và các ngành khác hay nhất có tại “tài liệu ngành Y dược hay nhất”; https://123doc.net/users/home/user_home.php?use_id=7046916. Slide bài giảng môn data ware house ppt dành cho sinh viên chuyên ngành công nghệ - kỹ thuật và các ngành khác. Trong bộ sưu tập có trắc nghiệm kèm đáp án chi tiết các môn, giúp sinh viên tự ôn tập và học tập tốt môn data ware house bậc cao đẳng đại học chuyên ngành công nghệ - kỹ thuật và các ngành khác

Trang 2

Kiến trúc 3 tầng của hệ hỗ trợ quyết địnhInformation Sources Data Warehouse

Server (Tier 1)

OLAP Servers (Tier 2)

Clients (Tier 3)

Data Marts

Data Warehouse

Trang 3

 OLAP: Online Analytical Processing

 Mục tiêu của OLAP: Hỗ trợ các truy vấn đặc biệt cho phân tích kinh doanh

Tổng hợp, phân tích thực hiện trên khối lượng lớn dữ liệu (đa chiều) hỗ trợ quyết định:

Các công cụ phục vụ người dùng (Frontend) trong Data Warehouse

 Khung nhìn đa chiều (Multidimensional view ) là nền tảng cho OLAP

Trang 4

 On-Line Transaction Processing (OLTP):

– Công nghệ được dùng để thực hiện các cập nhật trên các hệ thống giao dịch hay tác nghiệp

 On-Line Analytical Processing (OLAP):

– Kỹ thuật được dùng để thực hiện các phân tích phức tạp

của dữ liệu trong data warehouse

Trang 6

 Finance: Lập ngân sách, dự toán kinh phí, phân tích hoạt động tài…

 Sales: Phân tích bán hàng và dự báo doanh số bán Marketing: Phân tích thị trường, khách hàng, khuyến mãi…

 Manufacturing: Hỗ trợ lập kế hoạch sản xuất, phân tích lỗi

Trang 8

 Khung nhìn đa chiều là nền tảng cho OLAP

 Các độ đo (Measures): Dữ liệu số cần theo dõi, được tinh toán

 Các chiều (Dimensions): Các tham số định nghĩa một giao dịch (xác định giá trị của độ đo)

 Mô hình hóa chiều là kỹ thuật cho việc cấu trúc

dữ liệu quanh các khái niệm kinh doanh

 Các mô hình chiều: mô tả các độ đo và chiều

Trang 9

 Chiều có các thuộc tính

 Các chiều có thể được tổ chức phân cấp

◦ Ví dụ: Chiều Time: days → weeks → quarters

◦ Chiều Product: product → product line → brand

Trang 10

CS 336 10

District Region Total

Brand Manufacturer Total

Trang 11

sale prodId storeId amt

Trang 12

03/22/21 12

dimensions = 3

Multi-dimensional cube: Fact table view:

sale prodId storeId date amt

Trang 13

10 34 56 32 12 56

Country

roll-up to week roll-up to brand roll-up to region

Trang 14

03/22/21 14

Ví dụ: Lược đồ STAR với 3 chiều

Trang 16

 Được phân loại theo kiến trúc sử dụng để lưu trữ và xử lý dữ liệu đa chiều

 Các loại chính:

Multi-dimensional OLAP (MOLAP)

Relational OLAP (ROLAP)

Hybrid OLAP (HOLAP)

16

Trang 17

 Sử dụng MDDBMS để lưu trữ và phân tích

 Data structures: Array technology + các kỹ thuật lưu trữ hiệu quả

để tối thiểu không gian lưu trữ

 Một số vấn đề phát sinh với MOLAP:

◦ Chỉ có một số lượng hạn chế của dữ liệu có thể được lưu trữ và phân tích hiệu quả

◦ Việc phân tích bị giới hạn vì dữ liệu được thiết kế theo những yêu cầu định trước y/c tập các kỹ năng và cung cụ để tạo và duy trì

Trang 18

03/22/21 18

Trang 19

 ROLAP : fastest-growing type của OLAP tools.

 ROLAP hỗ trợ các RDBMS thông qua sử dụng metadata

layer( tránh được yêu cầu tạo cấu trúc dữ liệu đa chiều tĩnh)

 Cho phép tạo nhiều multi-dimensional views từ two-dimensional relation.

Trang 20

 HOLAP: Phân phối dữ liệu trực tiếp từ DBMS hoặc theo MOLAP server đến desktop (hay local server) ở dạng data cube (được stored, analyzed và

maintained cục bộ)

Trang 21

 Slice (cắt lát)

 Dice (vạch ô)

 Drill Down: Lấy thông tin chi tiết

 Rollup: Tổng hợp, giảm chiều

 Pivote (Rolate): Slice và rolate

Trang 22

03/22/21 22

Trang 28

Toys $0.75 Clothing $4.6 Cosmetics $1.5

Products

Store s1 Store s2 Store s1 Electronics $5.2 $8.9

Toys $1.9 $0.75 Clothing $2.3 $4.6 Cosmetics $1.1 $1.5 Store s2 Electronics

Toys Clothing

($ millions)

d1

Sales ($ millions)

Time

Sales

Slicing &

Pivoting

Trang 29

Slicing & Pivoting

Trang 30

 Ưu điểm của SQL:

◦ Chuẩn quốc tế

◦ Độc lập với DBMS

◦ Dễ học, dễ hiểu, phi thủ tục

◦ …

 Để cải tiến khả năng tổng hợp dữ liệu, chuẩn SQL cmở rộng chức năng

GROUP BY với ROLLUP và CUBE (chuẩn 99)

Trang 31

 Tính toán khôi hợp của mỗi tập con các thuộc tính

 Ví dụ:

select item-name, color, size, sum(number)

from sales

group by cube(item-name, color, size)

Hợp của 8 nhóm khác nhau của quan hệ sales:

Trang 32

 Hàm grouping() có thể được áp dụng trên một thuộc tính

◦ Trả về 1 nếu giá trị là null (cho all),

◦ Trả về 0: Các trường hợp khác

select item-name, color, size , sum( number ),

grouping( item-name ) as item-name-flag ,

grouping( color ) as color-flag ,

grouping( size ) as size-flag ,

from sales

group by cube( item-name, color, size )

 Có thể sử dụng hàm decode() trong mệnh đề select để thay thế giá trị null bởi All

◦ Ví dụ: decode( grouping(item-name), 1, ‘all’, item-name)

Trang 33

Rollup: Phát sinh hợp trên mọi tiền tố của danh sách thuộc tính

{ (item-name, color, size), (item-name, color), (item-name), ( ) }

 Rollup có thể được dùng để phát sinh tổng hợp ở đa mức của một phân cấp

Ví dụ: Giả sử table itemcategory(item-name, category) : Loại mặt

Trang 34

03/22/21 34

Ngày đăng: 22/03/2021, 20:28

TỪ KHÓA LIÊN QUAN

w