1. Trang chủ
  2. » Công Nghệ Thông Tin

IUH - Báo cáo Các hệ thống thông minh Doanh nghiệp - Ứng dụng các phần mềm vào xử lý dữ liệu lớn

37 1 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng dụng các phần mềm vào xử lý dữ liệu lớn
Tác giả Thái Văn Sơn, Trần Minh Duy, Trần Tuấn Sang, Mai Hoàng Tuấn
Người hướng dẫn Ths Nguyễn Trần Kỹ
Trường học Trường Đại học Công nghiệp Thành phố Hồ Chí Minh
Chuyên ngành Các hệ thống thông minh doanh nghiệp
Thể loại Báo cáo bài tập
Năm xuất bản 2025
Thành phố Thành phố Hồ Chí Minh
Định dạng
Số trang 37
Dung lượng 6,95 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

  • I. Power BI (4)
    • 1. Load, xử lý và trình bày dữ liệu là file Excel (4)
    • 2. Load, xử lý và trình bày dữ liệu là file Access (0)
    • 3. Load, xử lý và trình bày dữ liệu là SQL Server (11)
    • 4. Load, xử lý và trình bày dữ liệu là DataWarehouse (15)
    • 5. Load, xử lý và trình bày dữ liệu lấy từ web (19)
    • 1. Các bước thực hiện (24)

Nội dung

IUH - Báo cáo Các hệ thống thông minh Doanh nghiệp - Ứng dụng các phần mềm vào xử lý dữ liệu lớn IUH - Báo cáo Các hệ thống thông minh Doanh nghiệp - Ứng dụng các phần mềm vào xử lý dữ liệu lớn IUH - Báo cáo Các hệ thống thông minh Doanh nghiệp - Ứng dụng các phần mềm vào xử lý dữ liệu lớn IUH - Báo cáo Các hệ thống thông minh Doanh nghiệp - Ứng dụng các phần mềm vào xử lý dữ liệu lớn IUH - Báo cáo Các hệ thống thông minh Doanh nghiệp - Ứng dụng các phần mềm vào xử lý dữ liệu lớn

Power BI

Load, xử lý và trình bày dữ liệu là file Excel

Xác định nơi tập trung doanh thu, ai/nhóm khách hàng đóng góp lớn, xu hướng theo thời gian ra sao và thị trường nào mang lại doanh thu chủ lực là nền tảng để tối ưu ngân sách và kế hoạch hàng hóa Thông tin này cho phép nhận diện các nguồn doanh thu chính, đánh giá mức đóng góp của từng nhóm khách hàng, và theo dõi diễn biến thị trường theo từng giai đoạn để điều chỉnh chiến lược bán hàng và tồn kho Các bước thực hiện bao gồm thu thập dữ liệu doanh thu theo khu vực và khách hàng, phân tích mức đóng góp và xu hướng, xác định thị trường chủ lực, phân bổ ngân sách và nguồn lực cho từng kênh, xây dựng kế hoạch hàng hóa dựa trên dự báo nhu cầu, sau đó theo dõi kết quả và điều chỉnh kịp thời.

Sau đó tiến hành trực quan hóa c Kết quả

Nhìn vào biểu đồ, thành phố Rialto ghi nhận doanh thu cao nhất, cho thấy đây là thị trường tiềm năng cần ưu tiên nguồn lực cho các hoạt động marketing và phân phối nhằm tối ưu hóa doanh thu và hiệu quả kinh doanh.

Khách hàng Jesse Hill mang lại doanh thu cao nhất, cho thấy tín hiệu về một tệp khách hàng giá trị đang tồn tại và có tiềm năng mở rộng Để tận dụng cơ hội này, cần triển khai chiến lược mở rộng nhóm đối tượng tương tự (lookalike) dựa trên đặc điểm và hành vi của Jesse Hill nhằm tăng trưởng doanh thu từ các khách hàng có đặc điểm tương tự Quá trình này đòi hỏi phân tích dữ liệu khách hàng hiện có để xác định các yếu tố dẫn đến giá trị cao, tối ưu hóa ngân sách quảng cáo và cải thiện mức độ phù hợp của nội dung với nhóm khách hàng tiềm năng Thực hiện các bước thử nghiệm A/B và tối ưu hóa liên tục sẽ giúp nhận diện cơ hội mở rộng hiệu quả và gia tăng lợi tức cho chiến lược tiếp thị.

Doanh thu tổng thể đang có xu hướng giảm mạnh, chủ yếu do số lượng khách hàng giảm từ khoảng 800 xuống dưới 600 người Đây là tín hiệu cảnh báo cho doanh nghiệp về sự suy giảm hoạt động và tác động trực tiếp đến lợi nhuận Để khắc phục, cần triển khai ngay các chính sách thu hút khách hàng mới và tăng cường giữ chân khách hàng hiện tại, từ tối ưu trải nghiệm người dùng, cải thiện chương trình khuyến mãi cho khách hàng thân thiết đến nâng cao chất lượng chăm sóc khách hàng Việc tập trung vào chiến lược tăng trưởng khách hàng sẽ giúp hồi phục doanh thu và tăng cường hiệu quả kinh doanh trong ngắn hạn lẫn dài hạn.

Ngoài ra, top 10 sản phẩm bán chạy nên được đầu tư thêm về quảng bá, tồn kho và ưu đãi để tối đa hóa lợi nhuận a Nguồn dữ liệu

Database mẫu Access: NorthWind b Bài toán

Phân tích kết quả kinh doanh tháng 9 của cửa hàng c Các bước thực hiện:

Vào get data, chọn access database, connect

Transform data: Đổi tên cột dễ đọc

Thêm cột Tổng tiền = số lượng * đơn giá Định dạng lại Ngày đặt và Ngày giao

• Giá trị trung bình mỗi đơn:

Sau đó mô hình hóa:

Card: Tổng doanh thu, số đơn hàng, trung bình mỗi đơn

Line Chart: Doanh thu theo ngày (OrderDate)

Stacked Bar Chart: Doanh thu theo thành phố (dùng Customers[City]) d Kết quả Đánh giá:

• Doanh thu: $46,230 trong khoảng 25 ngày

• Doanh thu cao nhất vào khoảng ngày 11 (~$6.1K)

• Doanh thu thấp nhất vào các ngày 6, 21 và 25

Manchester, Tacoma và Atlanta là các thị trường trọng điểm, đóng góp hơn 60% tổng doanh thu Trong khi đó, Redmond và St Louis có doanh thu thấp, vì vậy cần đánh giá và điều chỉnh chiến lược bán hàng tại hai thị trường này để tối ưu hiệu quả kinh doanh.

3 Load, xử lý và trình bày dữ liệu là SQL Server a Bài toán Đánh giá kết quả kinh doanh của công ty thương mại bán xe đạp và phụ kiện giai đoạn 2011-

Vào getdata chọn SQL Server

Xóa các cột không cần thiết ở SaleOrderDetail, giữ lại:

• SalesOrderID :khóa chính liên kết với Header

• ProductID : khóa liên kết Product

Xóa các cột không cần thiết ở Sales.SalesTerritory, giữ lại:

• Group: nhóm lục địa (North America, Europe, Pacific)

Xóa các cột không cần thiết ở Product, giữ lại:

Xóa các cột mô tả ở Production.ProductSubcategory và Production.ProductCategory:

Kiểm tra lại quan hệ các bảng:

Tạo quan hệ cho SalesOrderDetail và Product: d Kết quả

• Doanh thu đạt đỉnh vào các tháng 3,5 và 10 mùa cao điểm bán hàng (mùa hè, nhu cầu xe đạp tăng)

• Giảm mạnh vào các tháng 2,4 và 11, có thể do yếu tố vận chuyển hoặc thị trường bã hòa

• Sản phẩm có tính thời vụ, cần tối ưu tồn kho và chiến dịch quảng cáo theo mùa

• Bikes là Sản phẩm chủ lực – chiếm phần lớn doanh thu(86.17%)

Phần lớn doanh thu đến từ Bắc Mỹ, khu vực cốt lõi mang lại nguồn thu ổn định, sau đó là thị trường châu Âu Úc được xem là thị trường tiềm năng, chiếm khoảng 10% doanh thu và có thể tăng cường đầu tư để thúc đẩy tăng trưởng ở khu vực này.

4 Load, xử lý và trình bày dữ liệu là DataWarehouse a Bài toán

Doanh thu đến từ đâu, nhóm nào lãi nhiều nhất, xu hướng theo thời gian ra sao, và thị trường nào mạnh b Các bước thực hiện

Để vẽ biểu đồ như trên, ta cần một datawarehouse nhỏ chứa dữ liệu phục vụ phân tích Dữ liệu từ datawarehouse được đẩy vào Power BI để trực quan hóa và phân tích Cần xác định server và nguồn datawarehouse để lấy dữ liệu chính xác, sau đó thiết lập kết nối và nhập dữ liệu vào Power BI để tạo báo cáo và biểu đồ hiệu quả.

Tạo measure để tính lợi nhuận

Vẽ biểu đồ cột để tìm hiểu doanh thu đến từ nhóm nào cao nhất Ta sẽ biểu diễn doanh thu trên loại sản phẩm

Ta thấy được doanh thu từ xe đạp là cao nhất

Để xác định chi tiết nhóm nào trong loại xe đạp mang lại lợi nhuận cao nhất, chúng ta thực hiện phân tích lợi nhuận theo từng nhóm sản phẩm Ta biểu diễn biểu đồ cột ngược lợi nhuận trên từng nhóm sản phẩm nhằm so sánh hiệu quả kinh doanh và nhận diện nhóm có lợi nhuận lớn nhất dựa trên dữ liệu hiện có Biểu đồ này cho thấy sự khác biệt giữa các nhóm về biên lợi nhuận và doanh số, từ đó hỗ trợ tối ưu hoá danh mục xe đạp và cải thiện chiến lược tiếp thị và SEO.

Tiếp đó ta hãy tìm hiểu thử xu hướng doanh thu theo thời gian để xem thử thời điểm nào cần cải thiện

Qua biểu đồ, ta thấy tháng 1, 2, 3 và 4 có doanh thu rất thấp, dưới 2 triệu đô mỗi tháng Để cải thiện kết quả, cần triển khai kế hoạch tồn kho cho các tháng này và áp dụng chính sách khuyến mãi nhằm tăng doanh thu.

Cuối cùng hãy xem thử thị trường nước nào là 1 thị trường mạnh là chủ lực

Phân tích thị trường cho thấy Mỹ và Úc là hai thị trường chủ lực của doanh nghiệp Vì vậy, cần phân bổ nguồn lực đầu tư vào dịch vụ khách hàng nhằm nâng cao trải nghiệm mua sắm và tăng sự trung thành của khách hàng tại hai thị trường này Việc chăm sóc khách hàng chu đáo sẽ giúp mở rộng thị phần và tối ưu hiệu quả chiến lược tiếp thị tại Mỹ và Úc.

5 Load, xử lý và trình bày dữ liệu lấy từ web a Bài toán:

To determine a publisher’s business performance, base the assessment on discount strategies and total revenue as key metrics The implementation begins with choosing the Fahasa website as the data source, enabling us to collect pricing, discount, and sales data By analyzing how different discount levels affect total revenue, we can gauge profitability and market response This approach helps identify effective promotions and pricing tactics to improve publishing success and revenue growth.

Tiếp theo là em viết code cào bằng selenium

Khi cào xong thì ra 1 bộ dữ liệu

Tranform dữ liệu Cột old price và new price đang bị dư chữ đ và bị dư số phẩy thì mình sẽ bỏ nó đi

Và sau đó chuyển thành kiểu số

Sau đó apply vào và thêm vào mesure Total Revenue

Cuối cùng vẽ ra những bảng dữ liệu sau c Kết quả:

Kim Đồng có doanh thu cao nhưng không dẫn đầu về số lượng bán; số lượng sản phẩm bán ra của Kim Đồng ít hơn, nhưng mỗi sản phẩm mang lại doanh thu cao hơn, cho thấy chiến lược định giá cao và sức mạnh của giá trị thương hiệu Ngược lại, Giáo Dục có số lượng bán cao nhất nhưng doanh thu lại đứng ở vị trí thứ tư, bởi bán được nhiều sản phẩm với mức giá thấp nên tổng doanh thu thấp Nhìn chung, hai hướng chiến lược này cho thấy cách tối ưu hoá lợi nhuận: một là tập trung vào giá trị và biên lợi nhuận nhờ định giá cao, hai là tập trung vào khối lượng bán với giá thấp để tăng thị phần và doanh thu tổng thể.

II SQL Server Data Tools - Gom nhóm

Mục tiêu: chia phân khúc khách hàng (unsupervised)

- Nhóm 1: Khách hàng vip nhưng hiện tại đang ít chi tiêu hoặc lâu rồi không chi tiêu

- Nhóm 2: Trung lưu (thu nhập trung bình, chi tiêu đều đặn)

- Nhóm 3: Cao cấp (thu nhập cao, chi tiêu cao)

Thông tin Mining Model View

Cụm 1 – “VIP ngủ quên / lapsed high-value”

• Chi tiêu: Sales Amount Sum ≈ 22k–44k, Avg Basket ≈ 333–806

• Recency: ≈ 730–786 ngày (rất lâu chưa quay lại)

Load, xử lý và trình bày dữ liệu là SQL Server

a Bài toán Đánh giá kết quả kinh doanh của công ty thương mại bán xe đạp và phụ kiện giai đoạn 2011-

Vào getdata chọn SQL Server

Xóa các cột không cần thiết ở SaleOrderDetail, giữ lại:

• SalesOrderID :khóa chính liên kết với Header

• ProductID : khóa liên kết Product

Xóa các cột không cần thiết ở Sales.SalesTerritory, giữ lại:

• Group: nhóm lục địa (North America, Europe, Pacific)

Xóa các cột không cần thiết ở Product, giữ lại:

Xóa các cột mô tả ở Production.ProductSubcategory và Production.ProductCategory:

Kiểm tra lại quan hệ các bảng:

Tạo quan hệ cho SalesOrderDetail và Product: d Kết quả

• Doanh thu đạt đỉnh vào các tháng 3,5 và 10 mùa cao điểm bán hàng (mùa hè, nhu cầu xe đạp tăng)

• Giảm mạnh vào các tháng 2,4 và 11, có thể do yếu tố vận chuyển hoặc thị trường bã hòa

• Sản phẩm có tính thời vụ, cần tối ưu tồn kho và chiến dịch quảng cáo theo mùa

• Bikes là Sản phẩm chủ lực – chiếm phần lớn doanh thu(86.17%)

Phần lớn doanh thu đến từ Bắc Mỹ, là khu vực lõi mang doanh thu ổn định, tiếp theo là châu Âu Australia được xem là thị trường tiềm năng, chiếm khoảng 10% doanh thu và có thể tăng cường đầu tư để khai thác cơ hội tăng trưởng.

Load, xử lý và trình bày dữ liệu là DataWarehouse

Doanh thu đến từ đâu, nhóm nào lãi nhiều nhất, xu hướng theo thời gian ra sao, và thị trường nào mạnh b Các bước thực hiện

Để có thể vẽ biểu đồ như hình trên, trước tiên ta cần một data warehouse nhỏ chứa dữ liệu cần phân tích Sau khi có nguồn dữ liệu, ta đẩy (load) dữ liệu từ data warehouse vào Power BI để trực quan hóa và phân tích Để kết nối và đồng bộ dữ liệu, cần nhập đúng thông tin server và nguồn dữ liệu data warehouse cần lấy.

Tạo measure để tính lợi nhuận

Vẽ biểu đồ cột để tìm hiểu doanh thu đến từ nhóm nào cao nhất Ta sẽ biểu diễn doanh thu trên loại sản phẩm

Ta thấy được doanh thu từ xe đạp là cao nhất

Để xác định chi tiết nhóm nào trong loại xe đạp mang lại lợi nhuận cao nhất, bài viết phân tích lợi nhuận theo từng nhóm sản phẩm và trình bày kết quả bằng biểu đồ cột lợi nhuận Biểu đồ này cho phép so sánh trực quan giữa các nhóm xe đạp và nhận diện nhóm sản phẩm mang lại lợi nhuận tối đa, từ đó người đọc có thể tối ưu chiến lược kinh doanh bằng cách tập trung khai thác nhóm xe đạp có lợi nhuận cao nhất.

Tiếp đó ta hãy tìm hiểu thử xu hướng doanh thu theo thời gian để xem thử thời điểm nào cần cải thiện

Nhìn vào biểu đồ, doanh thu ở tháng 1 đến tháng 4 rất thấp, dưới 2 triệu đô mỗi tháng Để cải thiện kết quả kinh doanh, cần xây dựng kế hoạch tồn kho cho các tháng này và triển khai chính sách khuyến mãi hiệu quả nhằm tăng doanh thu Việc tối ưu tồn kho kết hợp với chương trình khuyến mãi sẽ giúp kích thích khách hàng, đẩy mạnh doanh thu và nâng cao hiệu quả hoạt động trong giai đoạn này.

Cuối cùng hãy xem thử thị trường nước nào là 1 thị trường mạnh là chủ lực

Qua phân tích cho thấy thị trường chủ lực là Mỹ và Úc Vì vậy, chiến lược tăng trưởng nên phân bổ nguồn vốn đầu tư vào dịch vụ khách hàng nhằm nâng cao trải nghiệm và đáp ứng kỳ vọng của khách hàng ở hai thị trường này, từ đó tăng sự trung thành với thương hiệu và cải thiện hiệu quả giữ chân khách hàng, tối ưu hoá doanh thu và lợi nhuận.

Load, xử lý và trình bày dữ liệu lấy từ web

To determine a publisher's business performance, evaluate it using discount impact and Total Revenue as key metrics The implementation steps begin with selecting the Fahasa website as the target platform, then analyzing how discount strategies influence revenue and comparing publisher performance accordingly.

Tiếp theo là em viết code cào bằng selenium

Khi cào xong thì ra 1 bộ dữ liệu

Tranform dữ liệu Cột old price và new price đang bị dư chữ đ và bị dư số phẩy thì mình sẽ bỏ nó đi

Và sau đó chuyển thành kiểu số

Sau đó apply vào và thêm vào mesure Total Revenue

Cuối cùng vẽ ra những bảng dữ liệu sau c Kết quả:

Kim Đồng có doanh thu cao nhưng không dẫn đầu về số lượng bán; mỗi sản phẩm mang lại doanh thu cao hơn, cho thấy chiến lược định giá cao và giá trị thương hiệu mạnh Ngược lại, Giáo Dục có số lượng bán cao nhất nhưng doanh thu lại đứng ở vị trí thứ tư, cho thấy bán được rất nhiều sản phẩm với mức giá thấp nên tổng doanh thu thấp Đây là minh chứng cho chiến lược bán số lượng lớn với giá cạnh tranh và sự khác biệt trong định vị thương hiệu giữa hai đơn vị.

II SQL Server Data Tools - Gom nhóm

Mục tiêu: chia phân khúc khách hàng (unsupervised)

- Nhóm 1: Khách hàng vip nhưng hiện tại đang ít chi tiêu hoặc lâu rồi không chi tiêu

- Nhóm 2: Trung lưu (thu nhập trung bình, chi tiêu đều đặn)

- Nhóm 3: Cao cấp (thu nhập cao, chi tiêu cao).

Các bước thực hiện

Thông tin Mining Model View

Cụm 1 – “VIP ngủ quên / lapsed high-value”

• Chi tiêu: Sales Amount Sum ≈ 22k–44k, Avg Basket ≈ 333–806

• Recency: ≈ 730–786 ngày (rất lâu chưa quay lại)

Ngày đăng: 09/10/2025, 09:05

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w