Hệ thống BI đơn giảnDataWarehouse: Chứa dữ liệu tổng hợp của doanh nghiệp.. Các công cụ hỗ trợ BIKho dữ liệu Data warehousing Hệ thống hoạch định nguồn lực doanh nghiệp Enterprise r
Trang 1TÌM HIỂU VỀ BI - DATAWAREHOUSE - OLAP
& CÔNG CỤ MÃ NGUỒN MỞ JASPERSOFT
Trang 2Nhóm 11
BI (Business Intelligene)
Trình bày: 1041040 – Hoàng Thị Hằng
Trang 3Nguồn tham khảo:
Trang 5Lịch sử phát triển của BI
Trong một bài báo 1950, nhà nghiên cứu IBM Hans
Peter Luhn đã sử dụng thuật ngữ kinh doanh thông minh
Kinh doanh thông minh bắt đầu phát triển vào những năm 1960 và phát triển trong suốt những năm 1980
Cuối năm 1990 thuật ngữ này được sử dụng phổ biến
6/27/14
Nhóm 11
5
Trang 7Hệ thống BI đơn giản
DataWarehouse: Chứa dữ liệu tổng
hợp của doanh nghiệp
Data Minning: các kỹ thuật khai phá
dữ liệu và phát hiện tri thức như:
phân loại, phân nhóm,
Bussiness Analyst: những chiến
lược kinh doanh của công ty
6/27/14
Nhóm 11
7
Trang 8Lợi ích của BI
BI làm tăng khả năng kiểm soát thông tin của doanh
nghiệp một cách chính xác, hiệu quả
BI giúp cho các doanh nghiệp sử dụng thông tin một
cách hiệu quả, chính xác để thích ứng với môi trường thay đổi liên tục và cạnh tranh khốc liệt trong kinh doanh
Ra các quyết định kinh doanh hiệu quả hơn
6/27/14
Nhóm 11
8
Trang 9Các công cụ hỗ trợ BI
Kho dữ liệu (Data warehousing)
Hệ thống hoạch định nguồn lực doanh nghiệp (Enterprise resource planning (ERP) systems)
Công nghệ truy vấn và lập báo cáo (Query and report writing technologies)
6/27/14
Nhóm 11
9
Trang 10Các công cụ hổ trợ BI (tt)
Công cụ khai phá và phân tích dữ liệu (Data mining
and analytics tools)
Hệ thống hỗ trợ ra quyết định (Decision support
Trang 11Các hoạt động chính của BI
Hỗ trợ quyết định (decision support)
Truy vấn và báo cáo (query and reporting)
Phân tích xử lý trực tuyến (online
analytical processing (OLAP))
6/27/14
Nhóm 11
11
Trang 13Ứng dụng BI như thế nào?
Ở mức hệ thống BI là khâu cuối cùng của các giải
pháp ERP, CRM…
BI vừa là đầu ra cuối cùng của các hệ thống ERP,
CRM… vừa là đầu vào cho chính các hệ thống này
BI có thể triển khai trên những dữ liệu phi cấu trúc được tồn tại ở nhiều loại như những tờ trình, báo cáo tổng kết của một cá nhân , một bộ phận, các email chào hàng hay phàn nàn của khách hàng…
6/27/14
Nhóm 11
13
Trang 14BI dành cho ai?
Rất nhiều người dùng có thể hưởng lợi từ
BI
Ban quản trị (Executives)
Người ra quyết định kinh doanh
(Business Decision Makers)
Trang 15Nhóm 11
Data Warehouse (DWH)
Trình bày: 1041042 – Võ Thị Khánh Hằng
Trang 1717
Nhóm 11 http://www.scribd.com/thoct_nc/d/60930216-TỔNG-QUAN-VỀ-DATA WAREHOUSE
Trang 18Các đặc trưng chính
Dữ liệu hướng theo chủ đề (subject - oriented)
Dữ liệu tích hợp (integrated)
Dữ liệu theo thời gian (time – variant)
Dữ liệu ổn định (non – updatable/ nonvolatile)
6/27/14
Nhóm 11 DATA WAREHOUSE
http://www.scribd.com/thoct_nc/d/60930216-TỔNG-QUAN-VỀ-18
Trang 19Dữ liệu hướng theo chủ đề
Tổ chức xung quanh chủ đề chính: khách hàng
(customer), sản phẩm (product), bán hàng (sales)
Tập trung vào mô hình hóa và phân tích dữ liệu.
Cung cấp khung nhìn toàn vẹn, đơn giản và đầy đủ về các sự kiện quanh các chủ đề
6/27/14
Nhóm 11 DATA WAREHOUSE
http://www.scribd.com/thoct_nc/d/60930216-TỔNG-QUAN-VỀ-19
Trang 20Dữ liệu tích hợp
Tích hợp dữ liệu từ các nguồn hỗn tạp, đa bộ.
Các kỹ thuật làm sạch và tích hợp dữ liệu
được áp dụng:
Đảm bảo sự đồng nhất trong qui ước tên, cấu trúc
mã hóa, các đơn vị đo, thuộc tính … giữa các nguồn khác nhau
6/27/14
Nhóm 11 DATA WAREHOUSE
http://www.scribd.com/thoct_nc/d/60930216-TỔNG-QUAN-VỀ-20
Trang 21Dữ liệu theo thời gian
Phạm vi về thời gian dài hơn so với các hệ
thống tác nghiệp (VD 5-10 năm trước)
Yếu tố thời gian được lưu trong CSDL.
6/27/14
Nhóm 11 DATA WAREHOUSE
http://www.scribd.com/thoct_nc/d/60930216-TỔNG-QUAN-VỀ-21
Trang 22Dữ liệu ổn định
Không thường xuyên sửa đổi dữ liệu (các giao
tác).
Những dữ liệu lỗi thời sẽ bị loại bỏ, thay thế
bằng dữ liệu mới (refresh) một cách định kỳ.
2 giao tác quan trọng: nạp và truy cập dữ liệu.
6/27/14
Nhóm 11 DATA WAREHOUSE
http://www.scribd.com/thoct_nc/d/60930216-TỔNG-QUAN-VỀ-22
Trang 23Mục tiêu của DWH
Truy cập dễ dàng
Thông tin lưu trữ phải trực quan và dễ hiểu đối với
người dùng
Tốc độ truy cập DWH phải nhanh
Thông tin nhất quán
Dữ liệu có cùng tên, bắt buộc phải cùng chỉ đến
một thực thể
Nếu dữ liệu chỉ đến các thực thể khác nhau, chúng phải được đặt tên khác nhau
6/27/14 Nhóm 11 http://hp-aptech.edu.vn/forums/p/15567/27177.aspx#27177
23
Trang 24Mục tiêu của DWH
Thích nghi với thay đổi
Khi có thay đổi mới, dữ liệu cũ trong data vẫn phải
được bảo tồn tính đúng đắn
Bảo mật
Đảm bảo thông tin không bị lộ ra ngoài.
6/27/14 Nhóm 11 http://hp-aptech.edu.vn/forums/p/15567/27177.aspx#27177
24
Trang 25Mục tiêu của DWH
Hổ trợ ra quyết định
Dựa vào thông tin để từ đó đưa ra những giải pháp
kinh doanh đạt kết quả tốt nhất
Dễ dàng xây dựng các report
Xây dựng các cube không tốn quá nhiều công sức.
6/27/14 Nhóm 11 http://hp-aptech.edu.vn/forums/p/15567/27177.aspx#27177
25
Trang 27Nguồn dữ liệu
Bao gồm từ rất nhiều nguồn khác nhau và có
cấu trúc dữ liệu khác nhau:
Dữ liệu từ hệ thống tác nghiệp
Dữ liệu từ hệ thống phân tích
Dữ liệu từ bên ngoài
Trước khi đưa vào kho dữ liệu cần phải chuyển đổi
và tích hợp dữ liệu
Nhóm 11 Building the Data Warehouse 1st edition Copyright 1992 by
W.H.Inmon 27
Trang 28Khu vực xử lý
Dữ liệu được sử dụng các kỹ thuật làm sạch và
chuyển đổi để đảm bảo tính nhất quán dữ liệu trước khi đưa vào kho dữ liệu đích.
Thường xử dụng các công cụ trích xuất,
chuyển đổi và nạp dữ liệu (ETL)
6/27/14
Nhóm 11 Building the Data Warehouse 1st edition Copyright 1992 by
W.H.Inmon 28
Trang 29Kho dữ liệu
Là cơ sở dữ liệu được tổ chức lại theo mô hình
hình sao hay mô hình bông tuyết.
Mô hình được phi chuẩn hóa, chấp nhận sự dư
thừa dữ liệu trong lưu trữ mô hình dữ liệu đơn giản truy vấn dễ dàng và tốc độ xử lý nhanh
6/27/14
Nhóm 11 Building the Data Warehouse 1st edition Copyright 1992 by
W.H.Inmon 29
Trang 30Kho dữ liệu
Kho dữ liệu còn chứa các dữ liệu khác:
Siêu dữ liệu: định nghĩa nên các thành phần của
kho dữ liệu, cách thức dữ liệu được tải vào kho dữ liệu, lưu lại quá trình hoạt động của kho dữ liệu
Bảng sự kiện tổng hợp: lưu trữ các dữ liệu tính
toán được nhằm trả lời một cách nhanh nhất các câu hỏi của người dùng đưa ra
6/27/14
Nhóm 11 Building the Data Warehouse 1st edition Copyright 1992 by
W.H.Inmon 30
Trang 31Ứng dụng của DWH
Quản trị doanh nghiệp thông minh (BI)
Giúp người quản lý có cái nhìn tổng quan và đầy
đủ về công việc kinh doanh của doanh nghiệp
Đưa ra các quyết định nhanh chóng và hợp lý thông qua các báo cáo tổng hợp, các kỹ thuật phân tích dữ liệu từ kho dữ liệu
6/27/14
Nhóm 11
31
Trang 32Ứng dụng của DWH
Quản lý mối quan hệ khách hàng:
Đồng nhất khách hàng
Quản lý việc cho phép
Phân đoạn khách hàng theo các nhóm tiêu chí
Trang 34Xu hướng tương lai của DWH
Dữ liệu phi cấu trúc
Trang 35Nhóm 11
OLAP
Trình bày: 1041042 – Võ Thị Khánh Hằng
Trang 37Khái niệm
OLAP (Online Analytical Processing) là một
kỹ thuật sử dụng các thể hiện dữ liệu đa chiều
gọi là các khối (cube) nhằm cung cấp khả năng
truy xuất nhanh đến dữ liệu của kho dữ liệu
6/27/14
Nhóm 11
37
Trang 38Mô hình dữ liệu đa chiều
Là mô hình dữ liệu xoay quanh các chủ để
nhằm trả lời một cách nhanh nhất các câu hỏi trong nghiệp vụ của người quản lý.
Dữ liệu được tổ chức như là một khối, trong
đó mỗi chiều là một chủ đề trong nghiệp vụ
6/27/14
Nhóm 11
38
Trang 39Mô hình dữ liệu đa chiều (tt)
Trang 40Mô hình dữ liệu đa chiều (tt)
Trang 41Nhóm 11
41
Trang 42Mô hình dữ liệu đa chiều (tt)
6/27/14
Nhóm 11
42
Trang 43Mô hình dữ liệu đa chiều (tt)
6/27/14
Nhóm 11
43
Trang 44Đặc điểm của OLAP
Là một phần của kho dữ liệu.
Cung cấp các báo cáo, phân tích tiền tính toán,
Trang 45Đặc điểm của OLAP (tt)
Thăm dò sự tương tác dữ liệu
Cung cấp các giao diện đa dạng cho người
dùng
Cung cấp khả năng phân tích dữ liệu phức tạp
bằng phương thức đơn giản
6/27/14
Nhóm 11
45
Trang 46Lợi ích của OLAP
Cung cấp mô hình dữ liệu đa chiều trực quan.
Cung cấp một ngôn ngữ truy vấn phân tích, cung cấp sức mạnh để khám phá các mối quan hệ trong dữ liệu kinh doanh phức tạp
Dữ liệu được tính toán trước đối tác với các truy vấn
thường xuyên nhằm làm cho thời gian trả lời nhanh nhất
6/27/14
Nhóm 11
46
Trang 47Lợi ích của OLAP(tt)
Cung cấp các công cụ mạnh giúp người dùng tạo ra
các khung nhìn mới của dữ liệu
Hỗ trợ tạo mô hình chức năng để dự báo, phân tích xu
thế phát triển và phân tích thống kê
Tìm kiếm và hiển thị dữ liệu dưới dạng biểu đồ,
không gian 2D, 3D,…
6/27/14
Nhóm 11
47
Trang 49Mô hình MOLAP
Lưu trữ dữ liệu cơ sở và thông tin
tổng hợp trong các khối
Dữ liệu được tìm thấy tại điểm
giao của các chiều
Trang 50Mô hình ROLAP
Lưu trữ dữ liệu cơ sở và thông
tin tổng hợp trong các bảng quan hệ
Trang 51Mô hình ROLAP(tt)
Có 2 kiểu mô hình dữ liệu:
Lược đồ hình sao(star): mỗi một chiều chỉ được
xây dựng từ một bảng chiều
6/27/14
Nhóm 11
51
Trang 54So sánh giữa các mô hình
MOLAP ROLAP HOLAP
Số chiều >2 2 >2
Lưu trữ dữ liệu cơ sở Khối Bảng quan hệ Bảng quan hệ
Lưu trữ thông tin
tổng hợp Khối Bảng quan hệ Bảng quan hệHiệu suất thực hiện
truy vấn Nhanh nhất Chậm nhất NhanhTiêu thụ không gian
lưu trữ Nhiều Thấp Trung bìnhChi phí bảo trì Cao Thấp Trung bình
Trang 55Nhóm 11
Công cụ mã nguồn mở Jasper Soft
Trình bày: 1041112 – Hà Thiên Quan
1041342 – Đinh Thị Huệ
Trang 56Jasper Soft là gì?
6/27/14
Nhóm 11
56
JasperSoft là một công cụ mã nguồn mở
BI được sử dụng rộng rãi nhất trên thế giới.
Trang 58 Năm 2006 : thêm tính năng JasperSoft OLAP, tất
cả được tích hợp thành JasperSoft BI Suite.
Trang 59 Phi lợi nhuận.
Bán lẻ.
Tiện ích.
Trang 64Nhóm 11
Thank you for listen!