Trắc nghiệm, bài giảng pptx các môn chuyên ngành Y dược và các ngành khác hay nhất có tại “tài liệu ngành Y dược hay nhất”; https://123doc.net/users/home/user_home.php?use_id=7046916. Slide bài giảng môn data ware house ppt dành cho sinh viên chuyên ngành công nghệ - kỹ thuật và các ngành khác. Trong bộ sưu tập có trắc nghiệm kèm đáp án chi tiết các môn, giúp sinh viên tự ôn tập và học tập tốt môn data ware house bậc cao đẳng đại học chuyên ngành công nghệ - kỹ thuật và các ngành khác
Trang 1- Thuyết trình và báo cáo chuyên đề: 20%
- Kiểm ta cuối kỳ: 50%
- Điểm cộng
Trang 2CHAPTER 1: GIỚI THIỆU
Trang 3CHAPTER 1: GIỚI THIỆU
Trang 4 Công nghệ thông tin được áp dụng trong hầu
Trang 5Khách hàng nào mang lại lợi nhuận cao/thấp nhất ?
Khách hàng nào mang lại lợi nhuận cao/thấp nhất ?
Những mặt hàng nào khách hàng cần mua?
Những mặt hàng nào khách hàng cần mua?
Những tác động nào khi có sp/dv mới?
Kênh phân phối
nào hiệu quả nhất?
Kênh phân phối
nào hiệu quả nhất?
MộT NHÀ SảN XUấT MUÔN
BIếT…
Trang 6VấN Đề:
Không tìm thấy dữ liệu cần thiết
DL nằm rải rác trên mạng
Nhiều phiên bản, nhiệu dạng thức khác nhau
o Khó hiểu thông tin tìm được, không dể dàng sử dụng được cho việc ra quyết định
Dữ liệu có nhiều, nhưng không phục vụ tốt cho người ra quyết định về chiến lược và mục tiêu kinh doanh
Phải cần đến chuyên gia
Phải chuyển sang dạng khác
Trang 7DATA WAREHOUSE LÀ GÌ?
Một sự lưu trữ dữ liệu thống nhất, đầy đủ,
riêng lẻ từ nhiều nguồn khác nhau, khả dụng cho người dùng cuối, theo cách mà có thể
hiểu, dùng được cho một ngữ cảnh cụ thể
[Barry Devlin]
Trang 8DATA WAREHOUSE LÀ GÌ?
8
W H Inmon
Một data warehouse là một tập dữ liệu hỗ
việc ra quyết định quản lý:
Hướng chủ thể (subject-oriented)
Tích hợp (integrated)
Biến thời gian (time-variant)
Bền vững (non-volatile)
Trang 9CÁC ĐặC ĐIểM CủA DW
Thiết kế cho các công việc phân tích
Thiết kế cho một nhóm nhỏ người
dùng (decision makers)
Chỉ đọc
Cập nhập theo giai đoạn: chỉ thêm dữ liệu
Dữ liệu lịch sử theo chiều thời gian
Các câu hỏi trả về các tập kết quả lớn,
đa kết nối.
Toàn cục
Trang 10 Cho phép phân tích trực tuyến dữ liệu
Thăm dò sự tương tác dữ liệu
Cung cấp các giao diện đa dạng cho người dùng
Cung cấp khả năng phân tích dữ liệu phức tạp bằng phương thức đơn giản
Trang 11YÊU CầU CủA Hệ Hỗ TRợ QUYếT ĐịNH
Khung nhìn dữ liệu đa chiều
Hỗ trợ phân cấp dữ liệu, và khả năng đi sâu vào chi tiết
Trả lời nhanh các câu hỏi
Trang 12 Tập trung vào việc mô hình hóa và phân tích
dữ liệu cho các nhà đưa ra quyết định, mà không tập trung vào các hoạt động hay các
xử lý giao dịch hàng ngày
Cung cấp một khung nhìn đơn giản và súc tích xung quanh các sự kiện của các chủ thể
Trang 13TÍCH HợP (INTEGRATED)
liệu từ các nguồn dữ liệu hỗn tạp, đa bộ
Cơ sở dữ liệu quan hệ (relational
databases), flat files, các bảng ghi toàn tác trực tuyến.
liệu được áp dụng
Đảm bảo sự đồng nhất trong các quy ước tên, cấu trúc mã hóa, các đơn vị đo thuộc tính, … giữa các nguồn khác nhau
Ví dụ như: Hotel price: currency, tax, breakfast
covered,
Khi dữ liệu được chuyển đến kho dữ liệu, nó
sẽ được chuyển đổi
Trang 14TIME VARIANT
Yêu cầu quan trọng cho kho dữ liệu là phạm vi về thời gian dài hơn so với các hệ thống tác nghiệp.
Cơ sở dữ liệu tác nghiệp: dữ liệu có giá trị hiện thời
Dữ liệu của kho dữ liệu: cung cấp thông tin lịch sử (ví dụ như, 5-10 năm trước)
Yếu tố thời gian được lưu trữ trong CSDL
Data Time
01/97
02/97
03/97
Data for January
Data for February
Data for March
Trang 15 Là một lưu trữ vật lý của dữ liệu được chuyển đổi từ môi trường tác nghiệp
DW không có các DELETE, UPDATE (như
torng hệ tác nghiệp) mà chỉ có thao tác
INSERT
Không yêu cầu các cơ chế xử lý giao dịch, phục hồi
và điều khiển tương tranh
Chỉ yêu cầu hai thao tác trong truy cập dữ liệu:
Nạp dữ liệu và truy cập dữ liệu.
Trang 1616
Trang 17Three-Tier Decision Support Systems
Information Sources Data Warehouse
Server (Tier 1)
OLAP Servers (Tier 2)
Clients (Tier 3)
refresh etc.
Data Marts
Data Warehouse
Trang 18MÔ HÌNH Dữ LIệU ĐA CHIềU (MULTIDEMENSIONAL DATA MODEL)
Được đề xuất cho mô hình phân tích (không sử dụng cho
hệ thống CSDL tác nghiệp)
Sử dụng cho các công cụ xử lý phân tích trực tuyến (OLAP:
on-line analytical processing)
18
Trang 19MÔ HÌNH Dữ LIệU ĐA CHIềU (MULTIDEMENSIONAL DATA MODEL)
Trang 20KHO Dữ LIệU VÀ CÁC CSDL
Xử lý giao dịch trực tuyến OLTP (on-line transaction processing)
Tác vụ chính của các hệ RDBMS truyền thống
Các thao tác hàng ngày: mua, kiểm kê, kế toán,…
Xử lý phân tích trực tuyến OLAP (on-line analytical processing)
Là tác vụ chính của hệ thống data warehouse
Phân tích dữ liệu và đưa ra quyết định
Các đặc tiểm khác nhau (OLTP vs OLAP):
Trang 21Han : Dat
a Cub es 21
CÁC PHÉP TOÁN OLAP TIÊU BIỂU
Roll up (drill-up): summarize data
by climbing up hierarchy or by dimension reduction
Drill down (roll down): reverse of roll-up
from higher level summary to lower level summary or
detailed data, or introducing new dimensions
Slice and dice:
project and select
Trang 22ch 22, 20 21 22
THREE DATA WAREHOUSE MODELS
Trang 23ch 22, 20 21 23
THREE DATA WAREHOUSE MODELS
Trang 24 Dependent Data Mart:
• Chứa những dữ liệu được lấy từ Data Warehouse,
những dữ liệu này sẽ được trích lọc và tinh chế, tích hợp
lại ở mức cao hơn để phục vụ một chủ đề nhất định của
Datamart
o Independent Data Marts:
Data mart độc lập được xây dựng trước DW, dữ liệu
được trực tiếp lấy từ các nguồn khác nhau
24
DEPENDENT DATA MART & INDEPENDENT DATA
MARTS
Trang 25ch 22, 20 21
DATA WAREHOUSE BACK-END TOOLS AND
Trang 26ch 22, 20 21 26
CÁC KIểU ỨNG DụNG CủA DATA
Phân tích đa chiều (multidimensional analysis)
Hỗ trợ các thao tác xử lý phân tích dữ liệu trực tuyến (OLAP operations),…
Data mining
Khai thác tri thức từ các mẫu ẩn