Và cũng mong thầy sẽ tạo điều kiện cho em được hoàn thành môn học này đồng thời trong kỳ tới em sẽ cố hoàn thành các bài tập và những câu hỏi thầy đưa ra Cuối cùng, em cảm ơn thầy Nguyễn
Trang 1
BÁO CÁO CÁ NHÂN
KHO DỮ LIỆU VÀ KINH DOANH THÔNG MINH
Giáo viên hướng dẫn: Th.S Nguyễn Danh Tú
Sinh viên : Hà Văn Học
Lớp : Hệ thống thông tin K63 - 01
MSSV : 20180264
Hà Nội, 29/11/21
Trang 2Phần I.Kết quả thực hành 4
Thực hành 1: ETL dữ liệu trong trong Excel 4
1.1 Sắp xếp và lọc dữ liệu 4
Thực hành 2: 9
Thực hành 2.1: PIVOT 9
Thực hành 2.2: Tùy chỉnh đồ thị (CHART) 10
Thực hành 3 13
Thực hành 3.1: Xây dựng Dashboard trên Excel 13
Thực hành 3.2: Xây dựng dashboard trên dữ liệu 14
Thực hành 4: Power Query 15
Thực hành 5 17
Thực hành 5.1: Power Query & Dash 17
Thực hành 5.2: Xây dựng Dashboard trên Google Data Studio 19
Thực hành 6 21
Thực hành 6.1: Xây dựng Dashboard trên Power BI 21
Thực hành 6.2: Dashboard 3.0 22
Thực hành 7: Tìm hiểu các tính năng trên Power BI 23
Phần II.Kết quả thu được, đánh giá và góp ý cho môn học 24
Tài liệu tham khảo 28
Trang 3TỰ ĐÁNH GIÁ BÁO CÁO CÁ NHÂN
Dưới sự hướng dẫn của thầy Nguyễn Danh Tú và sự giúp đỡ của các bạn, em đã hoàn
thành và nộp các bài tập hàng tuần Qua các buổi học tập và thực hành thì bài báo cáo này có đầy
đủ các bài tập được giao Quá trình khi làm vẫn nhiều cái thiếu xót và bất cập, mong thầy và các bạn thông cảm cho em
Trong quá trình học và thực hành thì những câu hỏi thầy đưa ra đều bổ ích nhưng thay vào
đó em lại không chú tâm vào những câu hỏi như vậy, dẫn đến việc thiếu kiến thức về những bài học đấy Và cũng mong thầy sẽ tạo điều kiện cho em được hoàn thành môn học này đồng thời trong kỳ tới em sẽ cố hoàn thành các bài tập và những câu hỏi thầy đưa ra
Cuối cùng, em cảm ơn thầy Nguyễn Danh Tú đã hướng dẫn em học và hành trong môn học “Kho dữ liệu và kinh doanh thông minh” giúp em hiểu hơn về môn học và những hiệu quả mang tính thực tiễn qua những bài thực hành và bài tập lớn
Trong quá trình học, em đã có được sự cố gắng và nghiêm túc với môn học và dưới đây là đánh giá về bản thân em trong môn học
*Lý thuyết :
- Hiểu được Kho dữ liệu – Thông minh kinh doanh trong đời sống và những ứng dụng của
nó trong các ngành nghề và lĩnh vực liên quan
- Một số kiến thức của từng bài học chưa thể nắm hết được, nhưng trong quá trình thực hành em đã cố gắng để cải thiện và hoàn thành bài tập
- Đã áp dụng được một số những lý thuyết vào trong công việc và làm những bài thực hành
- Khó khăn trong việc phân tích đâu là chiều dữ kiện (Dimansion) hay các dữ kiện (Fact)
Trang 4Hình 1.1.2.Nhân viên bộ phận kho có hộ khẩu tại Hà Nội để lên lịch trực tết
Trang 5Hình 1.1.3.Nhân viên bộ phận kho
Hình 1.1.4.Nhân viên cần xác minh lại hộ khẩu
Hình 1.1.5.Nhân viên chưa có thông tin CMND
Trang 6Hình 1.1.6.Nhân viên có thu nhập từ 8 đến 10 triệu
1.2 Chọn dữ liệu nâng cao
Hình 1.2.1 Chọn dữ liệu nâng cao
Hình 1.2.2 Chọn dữ liệu nâng cao
Trang 71.3 Transpose và Toán tử cộng dữ liệu
Hình 1.3 Toán tử cộng dữ liệu
1.4 Sao chép dữ liệu nâng cao
Hình 1.4.1 Coppy paste
Hình 1.4.2 Coppy từ nguồn khác
Trang 81.5.Tạo xác thực dữ liệu khi nhập vào (Data Validation)
Hình 1.5.1 Merge cell
Hình 1.5.2 Data Validation
1.6.Phát hiện dữ liệu qua các định dạng có điều kiện
Trang 9Hình 1.6.1 Định dạng có điều kiện cơ bản
Hình 1.6.2 Định dạng có điều kiện nâng cao
Thực hành 2:
Thực hành 2.1: PIVOT
Hình 2.1.1 Thực hành PIVOT Table trên Excel
Trang 10Thực hành 2.2: Tùy chỉnh đồ thị (CHART)
Hình 2.2.1 a) Xử lý dữ liệu để vẽ được đồ thị
b) Làm việc với dữ liệu (Data) c) Làm việc với mẫu đồ thị (Chart Layout) d) Làm việc với Layout
Hình 2.2.2 a) Làm đồ thị trong 60s (với Pilot Table)
b) Cập nhật dữ liệu trên đồ thị
Hình 2.2.3 Vẽ đồ thị Phương trình bậc 3: y = x3
Trang 11Hình 2.2.4 Vẽ đồ thị từ phương trình: y1= -x2+16x+36 và y2= x+72
Trang 12Hình 2.2.7 Vẽ lại đồ thị với số liệu có sẵn
Hình 2 2.8 Làm báo cáo dữ liệu bán hàng
Trang 14Thực hành 3.2: Xây dựng dashboard trên dữ liệu
Hình 3.2.1 Dashboard trên dữ liệu
Hình 3.2.2 Xác định Dimension và Fact
Reqirement: Phân tích doanh thu của doanh nghiệp từ nhiều yếu tố ảnh hưởng
Dim: Dòng sản phẩm, thời gian, vận chuyển, loại giao dịch và khu vực
Fact: Doanh thu
Trang 15Thông tin đọc được trong Dashboard:
Báo cáo cho ta thấy hầu hết các giao dịch được thiết lập đều thuộc vào phân loại Medium Từ
đó cho ta thấy được nhu cầu của khách hàng để đưa ra các hướng kinh doanh mới hiệu quả trong tương lai
Ở bảng báo cáo này ta có thể thấy khách hàng ở USA có nhu cầu mua sắm chiếm tỉ trọng hơn hẳn các quốc gia còn lại Có thể do thu nhập bình quân đầu người nhỉnh hơn nên nhu cầu sản phẩm khá lớn Từ đó, ta sẽ đưa ra các ưu đãi chiến lược chất lượng phù hợp với tâm lý và yêu cầu của khách hàng để có thể tăng doanh thu cho doanh nghiệp
Với tình trạng vận chuyển, ta có thể thấy hầu hết đơn hàng đều được giao thành công Tuy nhiên phải tìm hiểu vấn đề của các đơn hàng bị huỷ hay vận chuyển muộn là do đâu ví dụ như tình hình thời tiết, vị trí địa lý… để đưa ra các biện pháp cải thiện hơn nâng cao chất lượng đơn hàng
và có được sự hài lòng của khách hàng
Báo cáo cho ta thấy hầu hết các giao dịch được thiết lập đều thuộc vào phân loại Medium Từ
đó cho ta thấy được nhu cầu của khách hàng để đưa ra các hướng kinh doanh mới hiệu quả trong tương lai
Thực hành 4: Power Query
Hình 4.1 Tranform data
Trang 16Hình 4.2 Extract Data
Trang 18
Hình 5.1.2 Dashboard
Phân tích:
*Biểu đồ đường xu hướng và doanh thu theo loại sản phẩm:
- Trong 4 năm qua, xe đạp thu được doanh thu là lớn nhất Phụ kiện có xu hướng
tăng doanh thu ->tiếp tục mở rộng hay thu hẹp quy mô sản phẩm
-Top 4 khách hàng tiềm năng để có những ưu đãi giảm giá cho khách hàng
*Biểu đồ doanh thu theo thời gian:
Đến năm 2020, nhân viên Lan Anh có tổng doanh thu bán hàng là lớn nhất, thể hiện
dõ nhất vào 3 tháng cuối năm đó => có những khen thưởng, khích lệ nhân viên
*Biểu đồ phí ship trung bình và thời gian giao hàng trung bình:
- Hình thức vận chuyển bằng xe tải đóng gói hộp ngoại cỡ có phí ship trung bình là
lớn nhất, hình thức vận chuyển bằng máy bay đóng gói thùng lớn có phí ship trung
bình là nhỏ nhất
- Hình thức vận chuyển bằng máy bay với mức độ ưu tiên thấp có số ngày giao cao
nhất
*Biểu đồ doanh thu theo khu vực và số ngày giao theo khu vực:
- Nghệ An có doanh thu thu được là lớn nhất, thấp nhất là Yên Bái
- Số ngày giao hàng trung bình ở Yên Bái là cao nhất, thấp nhất là ở Hải Dương
Trang 19Thực hành 5.2: Xây dựng Dashboard trên Google Data Studio
Start testing Google Data Studio
Hình 5.2.1 Dashboard Candidates
Hình 5.2.2 Dashboard Geography
Trang 20Hình 5.2.3 Dashboard Charts and Score Cards
Hình 5.2.4 Filters and Sorting in DataTable, Scorecard, GeoMap and Charts
Trang 21Thực hành 6
Thực hành 6.1: Xây dựng Dashboard trên Power BI
Hình 6.1.1 Dashboard trên Power BI
Hình 6.1.2 Dashboard trên Power BI
Trang 22Thực hành 6.2: Dashboard 3.0
Hình 6.2.1 Dashboard 3.0 trên dữ liệu
Phân tích:
Chủ đề: Tình hình doanh thu sản phẩm ở các quốc gia
Mục đích: Sự khác biệt lượng mua giữa các dòng sản phẩm
Sự thay đổi từng dòng sản phẩm theo thời gian
- Doanh thu bán hàng tăng mạnh vào năm 2004 và tụt giảm vào năm 2005
- Hầu hết các dòng sản phẩm đều được mua vào những tháng cuối năm 10,11
Lượng sale theo từng dealsize của từng dòng sản phẩm
- Medium luôn chiếm doanh số cao nhất ở hầu hết các khu vực và các dòng sản phẩm
- Motocycles size large chiếm cao nhất ở CA, NY
Lượng sale tập trung những khu vực phát triển nhất thế giới
Tỷ trọng của Classic Cars cao nhất
- Các dòng sản phẩm được phân phối rộng và tạo được độ ưa chuộng
Trang 23Thực hành 7: Tìm hiểu các tính năng trên Power BI
Trang 24Hình 7.4 Funnel Chart & Column Chart
Phần II.Kết quả thu được, đánh giá và góp ý cho môn học
1 Kết quả thu được:
Thực hành tuần 1: ETL dữ liệu
Các tổ chức cần cả ETL để kết nối dữ liệu lại với nhau, đảm bảo độ chính xác cho dữ liệu để làm báo cáo
Cải thiện năng suất của các chuyên gia dữ liệu vì nó mã hóa và tái sử dụng các quy trình di chuyển dữ liệu mà không yêu cầu các kỹ năng kỹ thuật để viết mã hoặc tập lệnh
Giúp người dùng doanh nghiệp dễ dàng phân tích và báo cáo về dữ liệu liên quan đến các sáng kiến của họ
Kiến thức thu được:
Nắm được cách ETL (tiền xử lý dữ liệu) để dữ liệu được chính xác, không bị dư thừa, phù hợp với yêu cầu của người sử dụng
Biết được cách định dạng dữ liệu có điều kiện
Sắp xếp: Sắp xếp dữ liệu theo 1 tiêu chí, nhiều tiêu chí, sắp xếp theo giá trị, theo màu, sắp xếp dữ liệu theo yêu cầu đặc thù, v.v
Lọc dữ liệu: Lọc dữ liệu theo 1 tiêu chí, theo nhiều tiêu chí, theo yêu cầu đặc thù: control&check, v.v
Trang 25Thực hành tuần 2: Pivot table
Pivot table là một trong những công cụ thống kê dữ liệu mạnh mẽ trong Excel, đặc biệt hiệu quả khi cần thống kê nhanh để báo cáo với những lợi ích vượt trội như:
- Thống kê dữ liệu siêu tốc
- Thao tác đơn giản, dễ sử dụng
- Kiểm soát được dữ liệu một cách chi tiết nhất
Kiến thức thu được:
Làm quen với Pivot Table:
Cách dùng Pivot Table trong Excel để thống kê dữ liệu, Tạo báo cáo tổng hợp bằng Pivot với các thành phần, làm mới dữ liêu, lấy dữ liêu chi tiết từ báo cáo, định dạng dữ liêu trên PivotTable, thêm các cột/dòng tổng hợp, tùy chỉnh báo cáo dạng cổ điển, tùy chỉnh công thức tính (count, sum,), nhóm các loại dữ liêu (dạng ngày tháng, dạng, số), thu gọn dữ liệu theo nhu cầu sử dụng và từ đó làm báo cáo
Các kiến thức nâng cao hơn như: Tiền xử lý dữ liệu, bổ sung các cột dữ liệu để làm báo tổng hợp
Tùy chỉnh vẽ đồ thị:
∙ Cách xử lý dữ liệu để vẽ được đồ thị
∙ Làm việc với dữ liệu(data)
∙ Làm việc với mẫu đồ thị (Chart Layout)
∙ Làm đồ thị với Pivot Table
∙ Cập nhật dữ liệu trên đồ thị khi bảng thay đổi
Làm báo cáo trên dữ liệu bán hàng: Cách làm việc với các mẫu biểu đồ trong excel
Thực hành tuần 3: Xây dựng Dashboard trên Excel và dữ liệu
- Bảng điều khiển Excel là một bảng trực quan (hầu hết, nhưng không phải lúc nào cũng cần thiết) giúp người quản lý và lãnh đạo doanh nghiệp theo dõi KPI hoặc số liệu chính
và đưa ra quyết định dựa trên nó Nó chứa các biểu đồ ,bảng ,khung nhìn được hỗ trợ bởi dữ liệu
- Bảng điều khiển thường được gọi là báo cáo, tuy nhiên, không phải tất cả các báo cáo đều là bảng điều khiển
Kiến thức thu được:
- Xây dựng Dashboard trên excel:
- Biết cách làm một báo cáo tổng hợp, phân tích kết quả thu được từ Dashboard
Trang 26- Xác định được các chiều (DIM), các các yếu tố phân tích (FACT)
Thực hành tuần 4: Power Query
Power Query được tích hợp sẵn trong Power BI Desktop, giúp cho việc chuẩn bị dữ liệu, truy vấn dữ liệu từ nhiều nguồn, về mặt chức năng Power Query trong Excel và Power Query trong Power BI Desktop giống nhau tới 99%
ETL dữ liệu với Power Query:
- Cách phân tích dữ liệu trong Excel, sắp xếp, lọc dữ liệu,v.v
- Chuyển đổi Dữ liệu Excel sang Bảng Excel để đưa nó vào Power Query Định hình dữ liệu (như loại bỏ cột, thay đổi kiểu dữ liêu, ̣ tính toán)
- Load dữ liệu về excel
- Lấy dữ liệu từ Google Sheet
ETL dữ liệu trên Power Query, sau đó thống kê dữ liệu cần bằng Pivot Table:
Thực hành tuần 5: Power Query & Dash
Sử dụng Power Query:
- Tùy chỉnh xem dashbroard theo từng tùy chọn
- Kết hợp được với Power Pivot để xây dựng dasgboard
Xây dựng dashboard trên google data studio:
Google Data Studio là một dịch vụ tạo các báo cáo trực quan, tương tác Data Studio cho phép nhập dữ liệu từ nhiều hệ thống khác nhau như BigQuery, Google Analytics, Google Sheets, YouTube, …
- Giải pháp để trình bày dữ liệu tuyệt vời và nhanh chóng
- Tạo ra dashboard giàu thông tin, dễ đọc, dễ chia sẻ và hoàn toàn có thể tùy chỉnh
- Dễ dàng truy cập và chia sẻ dữ liệu
Thực hành tuần 6: Xây dựng Dashboard trên Power BI
Power BI là một giải pháp phân tích kinh doanh cho phép bạn trực quan hóa dữ liệu (visualization) và chia sẻ những hiểu biết sâu sắc (insights) trong tổ chức của bạn hoặc nhúng những báo cáo Dashboard này vào ứng dụng hoặc trang web của công ty bạn
Các công cụ của power BI:
- Kết nối và chuyển đổi dữ liệu một cách dễ dàng: Có thể truy cập dữ liệu từ hàng trăm nguồn được hỗ trợ tại chỗ trên nền tảng Power BI như Excel, hệ CSDL, Api,
- Trực quan khám phá và phân tích dữ liệu nâng cao bằng hình ảnh tiện ích: Power BI tạo
ấn tượng mạnh bởi việc dễ sử dụng
Kiến thức thu được sau thực hành:
Trang 27 Nắm được những kiến thức cơ bản về Power BI: cách kết nối, chuyển đổi dữ liệu trên Power BI, phân tích dữ liệu bằng hình ảnh, làm báo cáo trên Dashboard,
Biết cách tạo một Dashborad trên Power BI và từ đó tựu làm một Dashboard 3.0 và phân tích
Thực hành tuần 7: Tìm hiểu các tính năng trên Power BI
Kiến thức thu được sau khi thực hành:
Cách làm báo cáo trên Google Data Studio: thêm biểu đồ vào báo cáo, thêm điều khiển tương tác ( lựa chọn thời gian hiển thị, bộ lọc,v.v.), thêm chữ, vẽ đường và hình khối vào báo cáo, thêm nguồn dữ liệu vào báo cáo, mở bảng chủ đề và bố cục, chỉnh sửa loại biểu đồ, v.v
II Đánh giá và góp ý cho môn học:
Đánh giá cho môn học:
- Môn học có tính thực tế và thời đại
- Môn học đã cho tiếp cận được những dữ liệu minh họa tuy không phải là lón nhưng đủ để hiểu
được sự khổng lồ của dữ liệu, và đó có thể sẽ là những bước làm quen ban đầu cho tương lai, đặc biệt là những bạn theo hướng Data Analysis
- Môn học yêu cầu những kiến thức căn bản rất chắc ( Cơ sở dữ liệu, cấu trúc dữ liệu và giải
thuật, …)
- Môn học yêu cầu sự nhanh nhạy trong việc tiếp thu và sử dụng các công cụ phân tích như Exel,
Power BI, Google Data Studio
Các quy trình này rất quan trọng cần xem xét trong môi trường kinh doanh cạnh tranh ngày nay
vì chúng mang lại thực tiễn quản lý dữ liệu tốt nhất chỉ có thể mang lại kết quả tích cực
Các công cụ thông minh kinh doanh (BI) thực hiện một công việc tuyệt vời trong việc truy cập
cơ sở dữ liệu quan hệ Ngày xưa, phần lớn dữ liệu của một công ty bị khóa trong các ứng dụng độc quyền hoặc cây nhà lá vườn mà các công cụ BI không thể truy cập trực tiếp, điều này yêu cầu trích xuất dữ liệu vào cơ sở dữ liệu quan hệ thường là kho dữ liệu Hiện tại, hầu hết - nếu không phải là hầu hết - các hệ thống hoạt động của một công ty sử dụng cơ sở dữ liệu quan hệ,
Trang 28cho phép BI truy cập trực tiếp vào dữ liệu đó Ngày nay có rất nhiều lời bàn tán về BI hoạt động,
đó là khi mọi người truy cập trực tiếp vào các hệ thống hoạt động đó bằng các công cụ BI của
họ Trong những trường hợp đó, một kho dữ liệu là không cần thiết
Và cái yếu tố cần chú trọng đến là có nên tích hợp kho dữ liệu vào kinh doanh thông minh không
? Thì đây là sự cần thiết Vì thông thường, dữ liệu được trải rộng trên nhiều ứng dụng với các định nghĩa và dữ liệu tham chiếu khác nhau nên các dữ liệu tham chiếu này sẽ không có sẵn cho các truy vấn thời gian thực mà không có kho dữ liệu Ta thấy Kinh doanh thông minh và Kho
dữ liệu gần như đồng nghĩa với nhau Chúng ta không thể làm điều này mà không có cách khác:
để phân tích kịp thời dữ liệu lịch sử khổng lồ, chúng ta phải tổ chức, tổng hợp và tóm tắt nó ở một định dạng cụ thể trong một kho dữ liệu
Tài liệu tham khảo
[1] https://www.youtube.com/channel/UCluw5rxM-bKFoZ-ZV1ZH3PQ
[2].https://www.youtube.com/watch?v=1qGsjmmHiu8&list=PLlRtt3cDxl4Xsb69w4TrebEVQJ GerYVSB&index=8
[3].https://www.youtube.com/watch?v=BsXliHbOFDM&list=PLmd91OWgLVSLy87GfZCR74 BG1nhO7ER0s
[4].https://www.youtube.com/watch?v=H84UJn1CiWo&list=PL6Omre3duO-OGTAMuFuDOS8wMuuxmyaiX&index=3
[5].https://drive.google.com/file/d/1vknxSOOmLuq0NNzYY4gEhhSTONwZ3hUe/view?fbclid=I wAR2-Eiyv05X-oVNMDBmx2pINWYG0oGnNIHsS043DHHBcgHsPEi15I59Y32o
[6] https://www.datapine.com/blog/data-warehousing-and-business-intelligence-architecture/