1. Trang chủ
  2. » Công Nghệ Thông Tin

XÂY DỰNG DASHBOARD VỚI POWER BI PHẦN 1

11 8 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 11
Dung lượng 2,88 MB
File đính kèm XAY DUNG DASHBOARD VOI POWER BI PART 1.rar (3 MB)

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Cđây là một tài liệu cực hay về cách xây dựng dashboard trong business intelligence với Power Bi. Tài liệu này sẽ hướng dẫn cách các bạng phân biệt giữa dashboard và report, các nhập dự liệu vào Power Bi cách tạo mô hình đồng thời cách sử dụng Query để transform dữ liệu. Tài liệu hay nhất về Power Bi cần đọc.

Trang 1

CHAPTER 1: SỰ KHÁC BIỆT GIỮA REPORT VÀ DASHBOARD

Trong ngành business intelligence thì thuật ngữ report dùng để mô tả một cơ chế

để chia sẻ thông tin với người dùng Có 3 loại report trong BI: dashboards, static reports, and interac- tive reports

• Dashboard chỉ hiển thị những thông tin mà người dùng mong muốn để qua đó

họ có thể đưa ra được quyết định cuối cùng Vì vậy xây dựng dashboard phải liên quan chặt chẽ với việc nắm bắt mong muốn của người dùng Các thông tin hiển thị trên dashboard thường được gọi là Key Performance Indicators (KPI) Dựa vào KPI chúng ta có thể đánh giá được các chỉ số chính trong kinh doanh là thành công hay thất bại

• Static report: là những báo cáo thường quy của cac công ty Trong static report các thông tin rất chi tiết giúp người dùng đào sâu vào một chủ đề nào đó Thông thường người dùng có thể tiếp cận với static report từ dashboard

• Interactive report: là một báo cáo giống như static report nhưng được trình bày với tính trực quan và dynamic cao Người dùng thường có thể tương tác với dữ liệu trong interactive report Dashboard thường trình bày nhiều chủ đề hoặc nhiều nguồn dữ liệu thì interactive report chỉ trình bày một chủ đề nhất định hoặc từ một nguồn dữ liệu nhất định Static report hiện nay dần được thay bằng interactive report

Power BI cho phép chúng ta xây dựng dashboard và interactive reports

Xác định thông tin nào cần đưa vào dashboard

Bước đầu tiên để xác định thông tin nào cần đưa vào dashboard là chúng ta phải phỏng vấn, nói chuyện với người sử dụng cuối để có thể biết thông tin nào cần đưa vào dashboard

Sau đó chúng ta lên kế hoạch xây dựng dashboard bằng cách đặt ra các câu hỏi:

• Chỉ số nào cần?

Trang 2

• Giá trị nào để trình bày các chỉ số đó?

• Tìm nguồn dữ liệu ở đâu để trình bày thông tin chính xác?

Sau đó dựa trên những thông tin có được từ các cuộc gặp mặt với người sử dụng chúng ta có thể đưa ra các metrics

Giả sử chúng ta xác định được các metrics sau:

• Sum of revenue

• Sum of units

• Sum of usage

• Sum of subscribers

• Sum of revenue target

• Sum of units target

• Sum of usage target

• Sum of subscribers target

• Revenue percentage of total

• Count of potential new customers

• New customer acquisition stage

ứng với mỗi metric trên chúng ta cần trình bày các chỉ số này với hai chỉ số khác là

• Variance-to-target

• Year-over-year growth, as a percentage

Tiếp theo chúng ta cần xác định xem cần phân tích các chỉ số này theo biến số nào Ví dụ chúng ta cần phân tích theo:

• Region (country, region, state, city)

• Product

• Time (year, month, fiscal year, fiscal month, current month, past 12 months)

Thu thập và chuẩn bị dữ liệu

Trước hết chúng ta cần lên trang web của Power Bi và tải Power BI destop về máy

và cài đặt

Trang 3

Chúng ta có thể thay đổi khung cửa sổ hiển thị của PBI từ 16:9 sang 4:3.

Chúng ta có thể kiểm tra một số Features mới mà PBI sắp cập nhật

Chúng ta có thể stick vào các ô để sử dụng thử các features này Lưu ý rằng các preview feature này thường không được hỗ trợ bởi PBI và nó chỉ dùng để chạy thử do đó nó không thể cập nhật được Sau khi đã cài đặt PBI Destop chúng ta bắt đầu quá trình nhập dữ liệu vào PBI PBI cho phép chúng ta nhập dữ liệu từ nhiều nguồn khác nhau Ví dụ chúng ta có dữ liệu từ Azure SQL database, chúng ta làm như sau để nhập dữ liệu vào PBI:

Trang 4

Chọn Get Data chọn More

Chọn Azure SQL database Connect

Trang 5

Có hai chế độ connect là Import và DirectQuery

Import mode cho phép chúng ta tải dữ liệu từ database vào máy tính Nhờ vào cơ chế VertiPaq

compression của PBI mà dữ liệu có thể tải không giới hạn dòng vào PBI Tuy nhiên nếu số lượng dòng quá lớn mà bộ nhớ máy tính của bạn có giới hạn thì máy tính của bạn cũng không thể đọc hết được dữ liệu Khi dữ liệu trong database thay đổi thì dữ liệu trong PBI không tự động thay đổi Muốn nó cập nhật thì chúng ta phải nhấn nút refesh và dự liệu sẽ tải vào máy một lần nữa.

DirectQuery mode cho phép chúng ta kết nối trực tiếp dữ liệu với database Với cách này dữ liệu của chúng ta luôn được cập nhật theo thời gian thực Một lợi điểm khác của mode này là chúng ta không cần

sử dụng bộ nhớ máy tính do đó với máy tính cấu hình thấp chúng ta vẫn có thể chạy tốt PBI Tuy nhiên với mode kết nối này tốc độ xử lý tùy thuộc hoàn toàn vào cơ sở dữ liệu do đó khi làm dashboard hay phân tích với PBI thì kết quả có thể trả lại rất chậm Một khuyến cáo là chúng ta nên sử dụng Import mode thay vì DirectQuery.

Sau đó chúng ta chọn tên server name của database và click OK.

Sau đó mỗi người dùng nhập username và password được admin cấp để connect với database.

Trang 6

Sau khi tiếp cận database thì chúng ta có thể chọn các bảng trong database để nhập vào PBI.

Trước khi load data vào PBI chúng ta cũng có thể transform nó sử dụng Power BI Query Power BI Query

có chức năng như quy trình ETL nghĩa là chuyển đổi và làm sạch số liệu trước khi tải vào PBI Trong Power BI Query chúng ta có thể thực hiện các lệnh chuyển đổi đơn giản như unpivot table, thay đổi tên,

bỏ cột, bỏ hàng v.v Power BI Query dùng ngôn ngữ M để viết các câu script chuyển đổi dữ liệu.

Sau khi load dữ liệu chúng ta sẽ có giao diện PBI như sau

Trang 7

Chúng ta chỉ cần click chọn các biến bên phải là PBI tự độ tạo chart cho dữ liệu

Để có thể biểu diễn được dữ liệu, chúng ta cần phải xây dựng model cho dữ liệu trước PBI sử dụng phương pháp SSAS multidimensional engine để xây dựng model Phương pháp xây dựng model là theo phương pháp star scheme hoặc snowflake scheme của Ralph Kimball, thường được sử dụng trong datawarehouse

Trong star scheme chúng ta có một bảng trung tâm gọi là bảng fact table Fact table là bảng chứa thông tin về chỉ số chính mà chúng ta đo lường Trong ví dụ trên bảng Invoice chính là bảng fact table Các bảng chứa các thuộc tính liên quan đến bảng fact gọi là bảng dimension Ở đây chúng ta có bảng calendar, bảng

Trang 8

product, geography là các bảng dimension Ngoài bảng trên chúng ta có bảng device không phải là bảng dimension của invoice nhưng lại là bảng dimension của product Như vậy model trong ví dụ này là snowflake scheme chứ không phải là star scheme

Tạo cột ngày tháng năm từ cột tháng năm

Giả sử chúng ta có cột calendaryearmonth có giá trị ví dụ như 201701

Chúng ta click vào tab Edit Queries để vào Power BI Query Tools

Trang 9

Chúng ta chọn cột calendaryearmonth và chọn Add Column chọn Custom Column Trong cửa sổ Custom Column chúng ta điền vào công thức

Chúng ta dùng hàm Number.ToText để chuyển cột calendaryearmonth thành dạng date đồng thời thêm day là 01 vào calendardaymonth

Cột Date vừa tạo ra có dạng YYYYMMDD và trong ô định dạng của nó vẫn là Any Chúng ta cần phải chuyển nó sang định dạng Date

Sau khi đã chuyển định dạng xong chúng ta cần chọn Close & Apply

Trang 10

Tính ngày tài chính từ ngày dương lịch trong năm

Giả sử chúng ta có bảng Calendar dimension gồm các cột ngày và các cột fiscal year, fiscal month và fiscal day

Chúng ta cũng có bảng fact table có cột ngày dương lịch

Chúng ta muốn từ ngày dương lịch tính ngày fiscal date cho các ngày dương lịch này Trong bảng fact table chúng ta tạo cột FiscalDate với công thức sau:

Trong công thức này vì các bảng đã được tạo relationship rồi nên chúng ta có thể dùng hàm RELATED để nối FyYear từ bảng calendar sang bảng fact table, nối FyMonth từ bảng calendar sang bảng fact table và 1 là ngày cho fiscal date

Trang 11

Kết quả là được bảng dưới đây

Tính ngày cuối cùng của bộ dữ liệu

Giả sử chúng ta có bảng fact table với cột fiscal date và chúng ta muốn biết ngày cuối cùng của bảng fact table là ngày nào

Chúng ta tạo mesure với công thức sau:

Ngày đăng: 21/07/2022, 14:57

w