1. Trang chủ
  2. » Công Nghệ Thông Tin

TÌM HIỂU VỀ BI - DATAWAREHOUSE - OLAP & CÔNG CỤ MÃ NGUỒN MỞ JASPERSOFT doc

64 3,2K 14
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Tìm Hiểu Về Bi - Datawarehouse - Olap & Công Cụ Mã Nguồn Mở Jaspersoft
Tác giả Hoàng Thị Hằng, Võ Thị Khánh Hằng, Hà Thiên Quan, Đinh Thị Huệ
Người hướng dẫn Hoàng Thị Hằng
Trường học Trường Đại Học Kinh Tế Quốc Dân
Chuyên ngành Kinh Tế
Thể loại bài tập lớn
Năm xuất bản 2023
Thành phố Hà Nội
Định dạng
Số trang 64
Dung lượng 1,01 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Hệ thống BI đơn giảnDataWarehouse: Chứa dữ liệu tổng hợp của doanh nghiệp.. Các công cụ hỗ trợ BIKho dữ liệu Data warehousing  Hệ thống hoạch định nguồn lực doanh nghiệp Enterprise r

Trang 1

TÌM HIỂU VỀ BI - DATAWAREHOUSE - OLAP

& CÔNG CỤ MÃ NGUỒN MỞ JASPERSOFT

Trang 2

Nhóm 11

BI (Business Intelligene)

Trình bày: 1041040 – Hoàng Thị Hằng

Trang 3

Nguồn tham khảo:

Trang 5

Lịch sử phát triển của BI

Trong một bài báo 1950, nhà nghiên cứu IBM Hans

Peter Luhn đã sử dụng thuật ngữ kinh doanh thông minh

Kinh doanh thông minh bắt đầu phát triển vào những năm 1960 và phát triển trong suốt những năm 1980

Cuối năm 1990 thuật ngữ này được sử dụng phổ biến

6/27/14

Nhóm 11

5

Trang 7

Hệ thống BI đơn giản

DataWarehouse: Chứa dữ liệu tổng

hợp của doanh nghiệp

Data Minning: các kỹ thuật khai phá

dữ liệu và phát hiện tri thức như:

phân loại, phân nhóm,

Bussiness Analyst: những chiến

lược kinh doanh của công ty

6/27/14

Nhóm 11

7

Trang 8

Lợi ích của BI

BI làm tăng khả năng kiểm soát thông tin của doanh

nghiệp một cách chính xác, hiệu quả

BI giúp cho các doanh nghiệp sử dụng thông tin một

cách hiệu quả, chính xác để thích ứng với môi trường thay đổi liên tục và cạnh tranh khốc liệt trong kinh doanh

Ra các quyết định kinh doanh hiệu quả hơn

6/27/14

Nhóm 11

8

Trang 9

Các công cụ hỗ trợ BI

Kho dữ liệu (Data warehousing)

 Hệ thống hoạch định nguồn lực doanh nghiệp (Enterprise resource planning (ERP) systems)

 Công nghệ truy vấn và lập báo cáo (Query and report writing technologies)

6/27/14

Nhóm 11

9

Trang 10

Các công cụ hổ trợ BI (tt)

Công cụ khai phá và phân tích dữ liệu (Data mining

and analytics tools)

Hệ thống hỗ trợ ra quyết định (Decision support

Trang 11

Các hoạt động chính của BI

 Hỗ trợ quyết định (decision support)

 Truy vấn và báo cáo (query and reporting)

 Phân tích xử lý trực tuyến (online

analytical processing (OLAP))

6/27/14

Nhóm 11

11

Trang 13

Ứng dụng BI như thế nào?

Ở mức hệ thống BI là khâu cuối cùng của các giải

pháp ERP, CRM…

BI vừa là đầu ra cuối cùng của các hệ thống ERP,

CRM… vừa là đầu vào cho chính các hệ thống này

BI có thể triển khai trên những dữ liệu phi cấu trúc được tồn tại ở nhiều loại như những tờ trình, báo cáo tổng kết của một cá nhân , một bộ phận, các email chào hàng hay phàn nàn của khách hàng…

6/27/14

Nhóm 11

13

Trang 14

BI dành cho ai?

 Rất nhiều người dùng có thể hưởng lợi từ

BI

 Ban quản trị (Executives)

 Người ra quyết định kinh doanh

(Business Decision Makers)

Trang 15

Nhóm 11

Data Warehouse (DWH)

Trình bày: 1041042 – Võ Thị Khánh Hằng

Trang 17

17

Nhóm 11 http://www.scribd.com/thoct_nc/d/60930216-TỔNG-QUAN-VỀ-DATA WAREHOUSE

Trang 18

Các đặc trưng chính

 Dữ liệu hướng theo chủ đề (subject - oriented)

 Dữ liệu tích hợp (integrated)

 Dữ liệu theo thời gian (time – variant)

 Dữ liệu ổn định (non – updatable/ nonvolatile)

6/27/14

Nhóm 11 DATA WAREHOUSE

http://www.scribd.com/thoct_nc/d/60930216-TỔNG-QUAN-VỀ-18

Trang 19

Dữ liệu hướng theo chủ đề

Tổ chức xung quanh chủ đề chính: khách hàng

(customer), sản phẩm (product), bán hàng (sales)

Tập trung vào mô hình hóa và phân tích dữ liệu.

Cung cấp khung nhìn toàn vẹn, đơn giản và đầy đủ về các sự kiện quanh các chủ đề

6/27/14

Nhóm 11 DATA WAREHOUSE

http://www.scribd.com/thoct_nc/d/60930216-TỔNG-QUAN-VỀ-19

Trang 20

Dữ liệu tích hợp

 Tích hợp dữ liệu từ các nguồn hỗn tạp, đa bộ.

 Các kỹ thuật làm sạch và tích hợp dữ liệu

được áp dụng:

 Đảm bảo sự đồng nhất trong qui ước tên, cấu trúc

mã hóa, các đơn vị đo, thuộc tính … giữa các nguồn khác nhau

6/27/14

Nhóm 11 DATA WAREHOUSE

http://www.scribd.com/thoct_nc/d/60930216-TỔNG-QUAN-VỀ-20

Trang 21

Dữ liệu theo thời gian

 Phạm vi về thời gian dài hơn so với các hệ

thống tác nghiệp (VD 5-10 năm trước)

 Yếu tố thời gian được lưu trong CSDL.

6/27/14

Nhóm 11 DATA WAREHOUSE

http://www.scribd.com/thoct_nc/d/60930216-TỔNG-QUAN-VỀ-21

Trang 22

Dữ liệu ổn định

 Không thường xuyên sửa đổi dữ liệu (các giao

tác).

 Những dữ liệu lỗi thời sẽ bị loại bỏ, thay thế

bằng dữ liệu mới (refresh) một cách định kỳ.

 2 giao tác quan trọng: nạp và truy cập dữ liệu.

6/27/14

Nhóm 11 DATA WAREHOUSE

http://www.scribd.com/thoct_nc/d/60930216-TỔNG-QUAN-VỀ-22

Trang 23

Mục tiêu của DWH

 Truy cập dễ dàng

 Thông tin lưu trữ phải trực quan và dễ hiểu đối với

người dùng

 Tốc độ truy cập DWH phải nhanh

 Thông tin nhất quán

 Dữ liệu có cùng tên, bắt buộc phải cùng chỉ đến

một thực thể

 Nếu dữ liệu chỉ đến các thực thể khác nhau, chúng phải được đặt tên khác nhau

6/27/14 Nhóm 11 http://hp-aptech.edu.vn/forums/p/15567/27177.aspx#27177

23

Trang 24

Mục tiêu của DWH

 Thích nghi với thay đổi

 Khi có thay đổi mới, dữ liệu cũ trong data vẫn phải

được bảo tồn tính đúng đắn

 Bảo mật

 Đảm bảo thông tin không bị lộ ra ngoài.

6/27/14 Nhóm 11 http://hp-aptech.edu.vn/forums/p/15567/27177.aspx#27177

24

Trang 25

Mục tiêu của DWH

 Hổ trợ ra quyết định

 Dựa vào thông tin để từ đó đưa ra những giải pháp

kinh doanh đạt kết quả tốt nhất

 Dễ dàng xây dựng các report

 Xây dựng các cube không tốn quá nhiều công sức.

6/27/14 Nhóm 11 http://hp-aptech.edu.vn/forums/p/15567/27177.aspx#27177

25

Trang 27

Nguồn dữ liệu

 Bao gồm từ rất nhiều nguồn khác nhau và có

cấu trúc dữ liệu khác nhau:

 Dữ liệu từ hệ thống tác nghiệp

 Dữ liệu từ hệ thống phân tích

 Dữ liệu từ bên ngoài

 Trước khi đưa vào kho dữ liệu cần phải chuyển đổi

và tích hợp dữ liệu

Nhóm 11 Building the Data Warehouse 1st edition Copyright 1992 by

W.H.Inmon 27

Trang 28

Khu vực xử lý

 Dữ liệu được sử dụng các kỹ thuật làm sạch và

chuyển đổi để đảm bảo tính nhất quán dữ liệu trước khi đưa vào kho dữ liệu đích.

 Thường xử dụng các công cụ trích xuất,

chuyển đổi và nạp dữ liệu (ETL)

6/27/14

Nhóm 11 Building the Data Warehouse 1st edition Copyright 1992 by

W.H.Inmon 28

Trang 29

Kho dữ liệu

 Là cơ sở dữ liệu được tổ chức lại theo mô hình

hình sao hay mô hình bông tuyết.

 Mô hình được phi chuẩn hóa, chấp nhận sự dư

thừa dữ liệu trong lưu trữ  mô hình dữ liệu đơn giản  truy vấn dễ dàng và tốc độ xử lý nhanh

6/27/14

Nhóm 11 Building the Data Warehouse 1st edition Copyright 1992 by

W.H.Inmon 29

Trang 30

Kho dữ liệu

 Kho dữ liệu còn chứa các dữ liệu khác:

 Siêu dữ liệu: định nghĩa nên các thành phần của

kho dữ liệu, cách thức dữ liệu được tải vào kho dữ liệu, lưu lại quá trình hoạt động của kho dữ liệu

 Bảng sự kiện tổng hợp: lưu trữ các dữ liệu tính

toán được nhằm trả lời một cách nhanh nhất các câu hỏi của người dùng đưa ra

6/27/14

Nhóm 11 Building the Data Warehouse 1st edition Copyright 1992 by

W.H.Inmon 30

Trang 31

Ứng dụng của DWH

 Quản trị doanh nghiệp thông minh (BI)

 Giúp người quản lý có cái nhìn tổng quan và đầy

đủ về công việc kinh doanh của doanh nghiệp

 Đưa ra các quyết định nhanh chóng và hợp lý thông qua các báo cáo tổng hợp, các kỹ thuật phân tích dữ liệu từ kho dữ liệu

6/27/14

Nhóm 11

31

Trang 32

Ứng dụng của DWH

 Quản lý mối quan hệ khách hàng:

 Đồng nhất khách hàng

 Quản lý việc cho phép

 Phân đoạn khách hàng theo các nhóm tiêu chí

Trang 34

Xu hướng tương lai của DWH

 Dữ liệu phi cấu trúc

Trang 35

Nhóm 11

OLAP

Trình bày: 1041042 – Võ Thị Khánh Hằng

Trang 37

Khái niệm

 OLAP (Online Analytical Processing) là một

kỹ thuật sử dụng các thể hiện dữ liệu đa chiều

gọi là các khối (cube) nhằm cung cấp khả năng

truy xuất nhanh đến dữ liệu của kho dữ liệu

6/27/14

Nhóm 11

37

Trang 38

Mô hình dữ liệu đa chiều

 Là mô hình dữ liệu xoay quanh các chủ để

nhằm trả lời một cách nhanh nhất các câu hỏi trong nghiệp vụ của người quản lý.

 Dữ liệu được tổ chức như là một khối, trong

đó mỗi chiều là một chủ đề trong nghiệp vụ

6/27/14

Nhóm 11

38

Trang 39

Mô hình dữ liệu đa chiều (tt)

Trang 40

Mô hình dữ liệu đa chiều (tt)

Trang 41

Nhóm 11

41

Trang 42

Mô hình dữ liệu đa chiều (tt)

6/27/14

Nhóm 11

42

Trang 43

Mô hình dữ liệu đa chiều (tt)

6/27/14

Nhóm 11

43

Trang 44

Đặc điểm của OLAP

 Là một phần của kho dữ liệu.

 Cung cấp các báo cáo, phân tích tiền tính toán,

Trang 45

Đặc điểm của OLAP (tt)

 Thăm dò sự tương tác dữ liệu

 Cung cấp các giao diện đa dạng cho người

dùng

 Cung cấp khả năng phân tích dữ liệu phức tạp

bằng phương thức đơn giản

6/27/14

Nhóm 11

45

Trang 46

Lợi ích của OLAP

Cung cấp mô hình dữ liệu đa chiều trực quan.

Cung cấp một ngôn ngữ truy vấn phân tích, cung cấp sức mạnh để khám phá các mối quan hệ trong dữ liệu kinh doanh phức tạp

Dữ liệu được tính toán trước đối tác với các truy vấn

thường xuyên nhằm làm cho thời gian trả lời nhanh nhất

6/27/14

Nhóm 11

46

Trang 47

Lợi ích của OLAP(tt)

Cung cấp các công cụ mạnh giúp người dùng tạo ra

các khung nhìn mới của dữ liệu

Hỗ trợ tạo mô hình chức năng để dự báo, phân tích xu

thế phát triển và phân tích thống kê

Tìm kiếm và hiển thị dữ liệu dưới dạng biểu đồ,

không gian 2D, 3D,…

6/27/14

Nhóm 11

47

Trang 49

Mô hình MOLAP

Lưu trữ dữ liệu cơ sở và thông tin

tổng hợp trong các khối

 Dữ liệu được tìm thấy tại điểm

giao của các chiều

Trang 50

Mô hình ROLAP

Lưu trữ dữ liệu cơ sở và thông

tin tổng hợp trong các bảng quan hệ

Trang 51

Mô hình ROLAP(tt)

 Có 2 kiểu mô hình dữ liệu:

 Lược đồ hình sao(star): mỗi một chiều chỉ được

xây dựng từ một bảng chiều

6/27/14

Nhóm 11

51

Trang 54

So sánh giữa các mô hình

MOLAP ROLAP HOLAP

Số chiều >2 2 >2

Lưu trữ dữ liệu cơ sở Khối Bảng quan hệ Bảng quan hệ

Lưu trữ thông tin

tổng hợp Khối Bảng quan hệ Bảng quan hệHiệu suất thực hiện

truy vấn Nhanh nhất Chậm nhất NhanhTiêu thụ không gian

lưu trữ Nhiều Thấp Trung bìnhChi phí bảo trì Cao Thấp Trung bình

Trang 55

Nhóm 11

Công cụ mã nguồn mở Jasper Soft

Trình bày: 1041112 – Hà Thiên Quan

1041342 – Đinh Thị Huệ

Trang 56

Jasper Soft là gì?

6/27/14

Nhóm 11

56

 JasperSoft là một công cụ mã nguồn mở

BI được sử dụng rộng rãi nhất trên thế giới.

Trang 58

 Năm 2006 : thêm tính năng JasperSoft OLAP, tất

cả được tích hợp thành JasperSoft BI Suite.

Trang 59

 Phi lợi nhuận.

 Bán lẻ.

 Tiện ích.

Trang 64

Nhóm 11

Thank you for listen!

Ngày đăng: 26/06/2014, 23:21

TỪ KHÓA LIÊN QUAN

w