1. Trang chủ
  2. » Giáo Dục - Đào Tạo

ĐẠI CƯƠNG DATA WARE HOUSE (DATA WARE HOUSE SLIDE)

27 31 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 27
Dung lượng 1,24 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Trắc nghiệm, bài giảng pptx các môn chuyên ngành Y dược và các ngành khác hay nhất có tại “tài liệu ngành Y dược hay nhất”; https://123doc.net/users/home/user_home.php?use_id=7046916. Slide bài giảng môn data ware house ppt dành cho sinh viên chuyên ngành công nghệ - kỹ thuật và các ngành khác. Trong bộ sưu tập có trắc nghiệm kèm đáp án chi tiết các môn, giúp sinh viên tự ôn tập và học tập tốt môn data ware house bậc cao đẳng đại học chuyên ngành công nghệ - kỹ thuật và các ngành khác

Trang 1

- Thuyết trình và báo cáo chuyên đề: 20%

- Kiểm ta cuối kỳ: 50%

- Điểm cộng

Trang 2

CHAPTER 1: GIỚI THIỆU

Trang 3

CHAPTER 1: GIỚI THIỆU

Trang 4

 Công nghệ thông tin được áp dụng trong hầu

Trang 5

Khách hàng nào mang lại lợi nhuận cao/thấp nhất ?

Khách hàng nào mang lại lợi nhuận cao/thấp nhất ?

Những mặt hàng nào khách hàng cần mua?

Những mặt hàng nào khách hàng cần mua?

Những tác động nào khi có sp/dv mới?

Kênh phân phối

nào hiệu quả nhất?

Kênh phân phối

nào hiệu quả nhất?

MộT NHÀ SảN XUấT MUÔN

BIếT…

Trang 6

VấN Đề:

 Không tìm thấy dữ liệu cần thiết

 DL nằm rải rác trên mạng

 Nhiều phiên bản, nhiệu dạng thức khác nhau

o Khó hiểu thông tin tìm được, không dể dàng sử dụng được cho việc ra quyết định

 Dữ liệu có nhiều, nhưng không phục vụ tốt cho người ra quyết định về chiến lược và mục tiêu kinh doanh

 Phải cần đến chuyên gia

 Phải chuyển sang dạng khác

Trang 7

DATA WAREHOUSE LÀ GÌ?

Một sự lưu trữ dữ liệu thống nhất, đầy đủ,

riêng lẻ từ nhiều nguồn khác nhau, khả dụng cho người dùng cuối, theo cách mà có thể

hiểu, dùng được cho một ngữ cảnh cụ thể

[Barry Devlin]

Trang 8

DATA WAREHOUSE LÀ GÌ?

8

W H Inmon

Một data warehouse là một tập dữ liệu hỗ

việc ra quyết định quản lý:

 Hướng chủ thể (subject-oriented)

 Tích hợp (integrated)

 Biến thời gian (time-variant)

 Bền vững (non-volatile)

Trang 9

CÁC ĐặC ĐIểM CủA DW

 Thiết kế cho các công việc phân tích

 Thiết kế cho một nhóm nhỏ người

dùng (decision makers)

 Chỉ đọc

 Cập nhập theo giai đoạn: chỉ thêm dữ liệu

 Dữ liệu lịch sử theo chiều thời gian

 Các câu hỏi trả về các tập kết quả lớn,

đa kết nối.

 Toàn cục

Trang 10

 Cho phép phân tích trực tuyến dữ liệu

 Thăm dò sự tương tác dữ liệu

 Cung cấp các giao diện đa dạng cho người dùng

 Cung cấp khả năng phân tích dữ liệu phức tạp bằng phương thức đơn giản

Trang 11

YÊU CầU CủA Hệ Hỗ TRợ QUYếT ĐịNH

 Khung nhìn dữ liệu đa chiều

 Hỗ trợ phân cấp dữ liệu, và khả năng đi sâu vào chi tiết

 Trả lời nhanh các câu hỏi

Trang 12

 Tập trung vào việc mô hình hóa và phân tích

dữ liệu cho các nhà đưa ra quyết định, mà không tập trung vào các hoạt động hay các

xử lý giao dịch hàng ngày

 Cung cấp một khung nhìn đơn giản và súc tích xung quanh các sự kiện của các chủ thể

Trang 13

TÍCH HợP (INTEGRATED)

liệu từ các nguồn dữ liệu hỗn tạp, đa bộ

 Cơ sở dữ liệu quan hệ (relational

databases), flat files, các bảng ghi toàn tác trực tuyến.

liệu được áp dụng

 Đảm bảo sự đồng nhất trong các quy ước tên, cấu trúc mã hóa, các đơn vị đo thuộc tính, … giữa các nguồn khác nhau

 Ví dụ như: Hotel price: currency, tax, breakfast

covered,

 Khi dữ liệu được chuyển đến kho dữ liệu, nó

sẽ được chuyển đổi

Trang 14

TIME VARIANT

 Yêu cầu quan trọng cho kho dữ liệu là phạm vi về thời gian dài hơn so với các hệ thống tác nghiệp.

 Cơ sở dữ liệu tác nghiệp: dữ liệu có giá trị hiện thời

 Dữ liệu của kho dữ liệu: cung cấp thông tin lịch sử (ví dụ như, 5-10 năm trước)

 Yếu tố thời gian được lưu trữ trong CSDL

Data Time

01/97

02/97

03/97

Data for January

Data for February

Data for March

Trang 15

 Là một lưu trữ vật lý của dữ liệu được chuyển đổi từ môi trường tác nghiệp

 DW không có các DELETE, UPDATE (như

torng hệ tác nghiệp) mà chỉ có thao tác

INSERT

 Không yêu cầu các cơ chế xử lý giao dịch, phục hồi

và điều khiển tương tranh

 Chỉ yêu cầu hai thao tác trong truy cập dữ liệu:

Nạp dữ liệu và truy cập dữ liệu.

Trang 16

16

Trang 17

Three-Tier Decision Support Systems

Information Sources Data Warehouse

Server (Tier 1)

OLAP Servers (Tier 2)

Clients (Tier 3)

refresh etc.

Data Marts

Data Warehouse

Trang 18

MÔ HÌNH Dữ LIệU ĐA CHIềU (MULTIDEMENSIONAL DATA MODEL)

 Được đề xuất cho mô hình phân tích (không sử dụng cho

hệ thống CSDL tác nghiệp)

 Sử dụng cho các công cụ xử lý phân tích trực tuyến (OLAP:

on-line analytical processing)

18

Trang 19

MÔ HÌNH Dữ LIệU ĐA CHIềU (MULTIDEMENSIONAL DATA MODEL)

Trang 20

KHO Dữ LIệU VÀ CÁC CSDL

Xử lý giao dịch trực tuyến OLTP (on-line transaction processing)

 Tác vụ chính của các hệ RDBMS truyền thống

 Các thao tác hàng ngày: mua, kiểm kê, kế toán,…

Xử lý phân tích trực tuyến OLAP (on-line analytical processing)

 Là tác vụ chính của hệ thống data warehouse

 Phân tích dữ liệu và đưa ra quyết định

Các đặc tiểm khác nhau (OLTP vs OLAP):

Trang 21

Han : Dat

a Cub es 21

CÁC PHÉP TOÁN OLAP TIÊU BIỂU

 Roll up (drill-up): summarize data

by climbing up hierarchy or by dimension reduction

 Drill down (roll down): reverse of roll-up

from higher level summary to lower level summary or

detailed data, or introducing new dimensions

 Slice and dice:

project and select

Trang 22

ch 22, 20 21 22

THREE DATA WAREHOUSE MODELS

Trang 23

ch 22, 20 21 23

THREE DATA WAREHOUSE MODELS

Trang 24

 Dependent Data Mart:

• Chứa những dữ liệu được lấy từ Data Warehouse,

những dữ liệu này sẽ được trích lọc và tinh chế, tích hợp

lại ở mức cao hơn để phục vụ một chủ đề nhất định của

Datamart

o Independent Data Marts:

Data mart độc lập được xây dựng trước DW, dữ liệu

được trực tiếp lấy từ các nguồn khác nhau

24

DEPENDENT DATA MART & INDEPENDENT DATA

MARTS

Trang 25

ch 22, 20 21

DATA WAREHOUSE BACK-END TOOLS AND

Trang 26

ch 22, 20 21 26

CÁC KIểU ỨNG DụNG CủA DATA

 Phân tích đa chiều (multidimensional analysis)

 Hỗ trợ các thao tác xử lý phân tích dữ liệu trực tuyến (OLAP operations),…

 Data mining

 Khai thác tri thức từ các mẫu ẩn

Ngày đăng: 22/03/2021, 20:28

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w