1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Báo cáo kho dữ liệu thiết kế và triển khai một hệ thống kho dữ liệu (data warehouse) phục vụ cho quá trình phân tích và ra quyết Định trong một doanh nghiệp hoạt Động trong lĩnh vực bán lẻ

61 2 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Báo Cáo Kho Dữ Liệu Thiết Kế Và Triển Khai Một Hệ Thống Kho Dữ Liệu Phục Vụ Cho Quá Trình Phân Tích Và Ra Quyết Định Trong Một Doanh Nghiệp Hoạt Động Trong Lĩnh Vực Bán Lẻ
Người hướng dẫn Họ và tên giảng viên hướng dẫn
Trường học Học viện Công nghệ Bưu chính Viễn thông
Chuyên ngành Hệ thống thông tin
Thể loại Báo cáo kho dữ liệu
Năm xuất bản 2025
Thành phố Hà Nội
Định dạng
Số trang 61
Dung lượng 10,25 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

  • I. Giới thiệu (3)
    • 1.1. Mục tiêu (3)
    • 1.2. Phạm vi (3)
  • II. Yêu cầu nghiệp vụ (4)
  • III. Đặc tả chức năng (5)
    • 3.1. Đặc tả đầu vào (5)
    • 3.2. Đặc tả đầu ra (6)
  • IV. Tích hợp 2 nguồn dữ liệu làm 1 nguồn IDB (7)
    • 4.1. Chuyển các bảng quan hệ về mô hình thực thể liên kết (ER) (7)
    • 4.2. Tích hợp 2 lược đồ EER1 và EER2 thành IER (12)
    • 4.3. Tạo IDB từ IEER (14)
  • V. Xây dựng mô hình dữ liệu cho kho Data Warehouse (0)
    • 5.1. Thiết kế kho dữ liệu (0)
    • 5.2. Ý nghĩa chi tiết các bảng (0)
  • VI. Sinh dữ liệu và ánh xạ (0)
    • 5.1. Ánh xạ dữ liệu từ IDB sang các bảng trong kho (DW) (15)
    • 5.2. Sinh dữ liệu (24)

Nội dung

- Hệ thống lưu trữ dữ liệu về thành phố sinh sống của các khách hàng, cùng với đơn đặt hàng đầu tiên của khách hàng.. Để đáp ứng được nhu cầu của khách hàng, hệ thống kho dữ liệu trích l

Giới thiệu

Mục tiêu

Mục tiêu của bài tập lớn là thiết kế và triển khai hệ thống kho dữ liệu (Data Warehouse) nhằm hỗ trợ phân tích và ra quyết định trong doanh nghiệp bán lẻ Doanh nghiệp có nhiều cửa hàng phân bố khắp các thành phố và bang, với dữ liệu được lưu trữ tại hai hệ quản trị cơ sở dữ liệu riêng biệt là MS SQL Server và Oracle Hệ thống kho dữ liệu cần tích hợp hiệu quả dữ liệu từ các nguồn này, tối ưu hóa khả năng lưu trữ và hỗ trợ các thao tác phân tích dữ liệu như drill down, roll up, slice and dice, pivot, giúp nâng cao khả năng ra quyết định dựa trên dữ liệu tổng thể.

Các mục tiêu chính bao gồm:

- Thiết kế mô hình dữ liệu tích hợp từ hai hệ thống hiện có

- Xây dựng mô hình dữ liệu cho kho dữ liệu, bao gồm các bảng fact và bảng chiều

- Triển khai các khối dữ liệu nhiều chiều phục vụ OLAP

- Phát triển ứng dụng hỗ trợ người dùng thực hiện các thao tác phân tích dữ liệu

- Đảm bảo tính đúng đắn và hiệu quả của hệ thống thông qua kiểm thử thực tế

- Cung cấp tài liệu và báo cáo đầy đủ phục vụ cho việc đánh giá và bảo trì hệ thống.

Phạm vi

Bài tập lớn tập trung vào toàn bộ quá trình xây dựng hệ thống kho dữ liệu cho doanh nghiệp, bắt đầu từ phân tích yêu cầu đến cài đặt và đánh giá hệ thống Quá trình này bao gồm xác định nhu cầu doanh nghiệp, thiết kế kiến trúc kho dữ liệu phù hợp, triển khai các bước cài đặt hệ thống, và thực hiện đánh giá hiệu quả hoạt động để đảm bảo tối ưu hóa dữ liệu doanh nghiệp.

- Phân tích và tích hợp dữ liệu từ hai nguồn CSDL: Văn phòng đại diện và Bán hàng

- Thiết kế mô hình kho dữ liệu dựa trên mô hình thực thể liên kết tích hợp, bao gồm cả thiết kế lược đồ hình sao

- Xây dựng quá trình ETL: ánh xạ dữ liệu từ CSDL tích hợp sang kho dữ liệu, bao gồm sinh dữ liệu mẫu để demo

- Triển khai các khối OLAP: tính sẵn các khối và lưu trữ trên OLAP server

- Phát triển giao diện ứng dụng OLAP: hỗ trợ người dùng thực hiện các phép toán phân tích

- Kiểm thử và đánh giá hệ thống: thông qua các truy vấn thực tế từ yêu cầu nghiệp vụ

Hệ thống này được xây dựng chủ yếu để phục vụ mục đích học tập, nghiên cứu và trình diễn mô hình kho dữ liệu, không bao gồm triển khai trên môi trường thực tế hoặc tích hợp với các hệ thống ERP hiện hành của doanh nghiệp.

Yêu cầu nghiệp vụ

Doanh nghiệp bao gồm nhiều cửa hàng

- Mỗi cửa hàng nằm tại một thành phố và có nhiều cửa hàng trong một thành phố

- Mỗi thành phố có một văn phòng đại diện để quản lý tất cả các cửa hàng của thành phố đó

- Mỗi cửa hàng có một số lượng các mặt hàng với số lượng hàng khác nhau

- Doanh nghiệp lưu trữ thông tin về các khách hàng bao gồm hai loại:

- Loại thứ nhất là khách du lịch thường được dẫn đến bởi các hướng dẫn viên các đoàn du lịch

- Loại hai bao gồm những khách hàng đặt hàng qua đường bưu điện

- Hệ thống lưu trữ dữ liệu về thành phố sinh sống của các khách hàng, cùng với đơn đặt hàng đầu tiên của khách hàng

- Mỗi khách hàng chỉ sống ở một thành phố

Doanh nghiệp sẽ cố gắng cung cấp các mặt hàng trong đơn hàng của khách bằng cách lấy từ kho hàng tại thành phố nơi khách hàng sinh sống, nhằm đảm bảo giao hàng nhanh chóng và thuận tiện Trong trường hợp mặt hàng không có sẵn tại kho địa phương, công ty sẽ chuyển yêu cầu đến các kho hàng ở các thành phố khác cho đến khi đảm bảo đủ hàng để cung cấp Chính sách này giúp nâng cao trải nghiệm khách hàng và tối ưu hóa quy trình cung ứng.

Mỗi đơn đặt hàng của khách hàng có thể linh hoạt về số lượng và mặt hàng, và được xác định bởi mã số đơn hàng duy nhất Hệ thống kho dữ liệu trích xuất và lọc dữ liệu từ hai cơ sở dữ liệu hiện có để đưa vào kho dữ liệu trung tâm, hỗ trợ xử lý phân tích trực tuyến PET (OLAP) qua các thao tác như cuộn lên, cuộn xuống, chọn lựa và chiếu dữ liệu dựa trên yêu cầu của khách hàng Thiết lập một chiều thời gian cho phép hệ thống sinh ra báo cáo phân tích trực tuyến OLAP nhằm phục vụ các yêu cầu phân tích dữ liệu chính xác và nhanh chóng theo thời gian thực.

Bạn cần tìm tất cả các cửa hàng cùng với thông tin chi tiết bao gồm thành phố, bang, số điện thoại, mô tả, kích cỡ, trọng lượng và đơn giá của tất cả các mặt hàng được bán tại kho đó Điều này giúp lập danh sách đầy đủ các địa điểm kinh doanh và các sản phẩm liên quan, hỗ trợ quản lý và khảo sát thị trường hiệu quả Việc thu thập các dữ liệu này là bước quan trọng để xây dựng chiến lược kinh doanh, đồng thời đảm bảo khách hàng có thể dễ dàng tiếp cận và lựa chọn mặt hàng phù hợp.

2 Tìm tất cả các đơn đặt hàng với tên khách hàng và ngày đặt hàng được thực hiện bởi khách hàng đó

3 Tìm tất cả các cửa hàng cùng với tên thành phố và số điện thoại mà có bán các mặt hàng được đặt bởi một khách hàng nào đó

Bạn cần tìm địa chỉ văn phòng đại diện của các cửa hàng lưu kho tại các thành phố hoặc bang khác nhau, để xác định các cửa hàng có mặt hàng nhất định với số lượng vượt quá mức quy định Việc này giúp theo dõi và quản lý hiệu quả các kho hàng, đảm bảo hoạt động kinh doanh diễn ra suôn sẻ và đáp ứng yêu cầu của khách hàng nhanh chóng Sử dụng các công cụ tìm kiếm địa chỉ chính xác theo tên thành phố hoặc bang sẽ giúp bạn dễ dàng nhận diện các văn phòng đại diện phù hợp.

Đối với mỗi đơn đặt hàng của khách hàng, cần liệt kê đầy đủ các mặt hàng đã đặt kèm theo mô tả chi tiết, mã cửa hàng liên quan để dễ dàng quản lý Đồng thời, xác định tên thành phố nơi khách hàng hoặc cửa hàng hoạt động để tối ưu hoá logistics và marketing địa phương Ngoài ra, thông tin về các cửa hàng bán các mặt hàng đó cũng nên được cập nhật đầy đủ để mở rộng mạng lưới phân phối và nâng cao trải nghiệm mua sắm của khách hàng.

6 Tìm thành phố và bang mà một khách hàng nào đó sinh sống

7 Tìm mức độ tồn kho của một mặt hàng cụ thể tại tất cả các cửa hàng ở một thành phố cụ thể nào đó

8 Tìm các mặt hàng, số lượng đặt, khách hàng, cửa hàng và thành phố của một đơn đặt hàng

9 Tìm các khách hàng du lịch, khách hàng đặt theo đường bưu điện và khách hàng thuộc cả hai loại

10 Tạo Index cho cơ sở dữ liệu

Đặc tả chức năng

Đặc tả đầu vào

A data warehouse is a large, stable database designed to support extensive data analysis It consolidates information from various sources, including Microsoft SQL Server and Oracle, ensuring reliable and efficient data management for decision-making processes.

Hệ thống kho dữ liệu nhận dữ liệu từ hai nguồn cơ sở dữ liệu quan hệ riêng biệt là CSDL Văn phòng đại diện và CSDL Bán hàng Các dữ liệu này sẽ được trích xuất, chuyển đổi, tích hợp và tải vào kho dữ liệu đảm bảo tính nhất quán và sẵn sàng cho phân tích Quá trình ETL (Extract - Transform - Load) giúp tối ưu hóa dữ liệu và nâng cao hiệu quả quản trị thông tin doanh nghiệp.

1 Dữ liệu từ CSDL Văn phòng đại diện

- Khách hàng: Mã khách hàng (Mã KH), Tên khách hàng, Mã thành phố (liên kết đến Văn phòng đại diện), Ngày đặt hàng đầu tiên

- Khách hàng du lịch: Mã KH (khóa ngoại), Tên hướng dẫn viên, Thời gian tham quan

- Khách hàng bưu điện: Mã KH (khóa ngoại), Địa chỉ bưu điện, Thời gian giao dịch

2 Dữ liệu từ CSDL Bán hàng

- Văn phòng đại diện: Mã thành phố, Tên thành phố, Địa chỉ văn phòng, Bang, Thời gian hoạt động

- Cửa hàng: Mã cửa hàng, Mã thành phố (khóa ngoại), Số điện thoại, Thời gian hoạt động

- Mặt hàng: Mã mặt hàng, Mô tả, Kích cỡ, Trọng lượng, Giá, Thời gian cập nhật

- Mặt hàng được lưu trữ: Mã cửa hàng (khóa ngoại), Mã mặt hàng (khóa ngoại), Số lượng trong kho, Thời gian cập nhật

- Đơn đặt hàng: Mã đơn hàng, Ngày đặt hàng, Mã khách hàng (khóa ngoại)

- Chi tiết đơn đặt hàng (mặt hàng được đặt): Mã đơn hàng (khóa ngoại),

Mã mặt hàng (khóa ngoại), Số lượng đặt, Giá đặt, Thời gian

Các thông tin đầu vào còn bao gồm cấu trúc logic của dữ liệu để:

- Chuyển đổi sang mô hình thực thể liên kết (ER)

- Tích hợp thành IER (Integrated ER Model)

- Thiết kế các bảng chiều và bảng fact cho hệ thống kho dữ liệu

Đặc tả đầu ra

1 Các khối dữ liệu OLAP (OLAP Cubes)

● Khối dữ liệu theo dõi tồn kho mặt hàng tại các cửa hàng theo từng thành phố, thời gian, mặt hàng

● Khối dữ liệu phân tích số lượng đặt hàng, khách hàng, cửa hàng theo vùng địa lý, thời gian

● Khối dữ liệu về doanh thu, giá bán, loại khách hàng, bang/thành phố

● Hỗ trợ các phép toán OLAP như:

○ Drill down: khoan sâu theo thời gian (năm → quý → tháng), địa lý (bang → thành phố)

○ Roll up: tổng hợp dữ liệu từ chi tiết đến tổng quát

○ Slice and Dice: lọc và phân đoạn dữ liệu theo thuộc tính

○ Pivot: xoay chiều dữ liệu để trực quan hơn trong báo cáo

2 Giao diện truy vấn báo cáo

Cung cấp các báo cáo trực tuyến được hiển thị trên giao diện web:

- Báo cáo liệt kê các mặt hàng trong kho theo từng cửa hàng và thành phố

- Báo cáo thống kê các đơn hàng theo khách hàng và ngày đặt

- Báo cáo mặt hàng được đặt trong mỗi đơn hàng kèm theo thông tin cửa hàng

- Báo cáo tồn kho vượt ngưỡng theo từng mặt hàng và khu vực

- Báo cáo phân loại khách hàng: du lịch, bưu điện, hoặc cả hai

- Báo cáo tổng hợp thông tin khách hàng, cửa hàng, mặt hàng, thành phố trong từng đơn đặt hàng

3 Metadata và hệ thống quản lý truy vấn

- File metadata mô tả cấu trúc kho dữ liệu (các bảng, chiều, phép đo)

- Hệ thống lập chỉ mục giúp tối ưu truy vấn OLAP

- Kết quả các truy vấn sẽ trả về theo định dạng bảng dữ liệu hoặc biểu đồ để người dùng dễ phân tích

- Tài liệu kỹ thuật và hướng dẫn sử dụng hệ thống

- Slide trình bày trong buổi báo cáo cuối kỳ

- Mô tả cụ thể về các khối dữ liệu, quy trình ETL, cấu trúc bảng fact và dimension

Tích hợp 2 nguồn dữ liệu làm 1 nguồn IDB

Chuyển các bảng quan hệ về mô hình thực thể liên kết (ER)

- DB1: Văn phòng đại diện

Khách hàng được phân thành các loại chính gồm khách hàng du lịch và khách hàng bưu điện, dựa trên các thông tin quan trọng như mã khách hàng, hướng dẫn viên du lịch, địa chỉ bưu điện và thời gian sử dụng dịch vụ Thông tin về khách hàng bao gồm mã khách hàng, tên khách hàng, mã thành phố, và ngày đặt hàng đầu tiên, giúp quản lý dữ liệu khách hàng một cách hiệu quả và chính xác Khách hàng du lịch thường đi kèm với hướng dẫn viên du lịch và thông tin về thời gian chuyến đi, trong khi khách hàng bưu điện được xác định qua địa chỉ bưu điện và các mốc thời gian liên quan tới dịch vụ bưu chính Việc cập nhật và lưu trữ đầy đủ các dữ liệu này không những hỗ trợ công tác quản lý khách hàng mà còn nâng cao trải nghiệm khách hàng qua các dịch vụ phù hợp và chính xác hơn.

Tên bảng Loại Khoá chính KAP KAG FKA NKA

PR1 Mã KH Tên KH,

Mã Thành phố, Ngày đặt hàng đầu tiên

PR2 Mã KH Mã KH Hưỡng dẫn viên du lịch, Thời gian

PR2 Mã KH Mã KH Địa chỉ bưu điện, Thời gian

PR1 : Khách hàng -> Thực thể khách hàng

PR2: Khách hàng du lịch và Khách hàng bưu điện là con của Khách hàng

Trong lĩnh vực dịch vụ khách hàng, một khách hàng du lịch và một khách hàng bưu điện đều là những người tiêu dùng, và một khách hàng bưu điện có thể trở thành khách hàng du lịch và ngược lại, cho thấy sự linh hoạt và đa dạng trong phân khúc khách hàng.

Văn phòng đại diện (Mã Thành phố, Tên Thành phố, Địa chỉ VP, Bang, Thời gian)

Cửa hàng (Mã cửa hàng, * Mã Thành phố, Số điện thoại, Thời gian)

Mặt hàng (Mã MH, Mô tả, Kích cỡ, Trọng lượng, Giá, Thời gian)

Mặt hàng được lưu trữ (* Mã cửa hàng, * Mã MH, Số lượng trong kho, Thời gian) Đơn đặt hàng (Mã đơn, Ngày đặt hàng, Mã KH)

Mặt hàng được đặt (* Mã đơn, * Mã MH, Số lượng đặt, Giá đặt, Thời gian)

Tên quan hệ Loại Khoá chính KAP KAG FKA NKA

Tên Thành phố, Địa chỉ

Cửa hàng PR1 Mã cửa hàng

Số điện thoại, Thời gian

Mặt hàng PR1 Mã MH Mô tả,

Kích cỡ, Trọng lượng, Giá, Thời gian

Mặt hàng được lưu trữ

Số lượng trong kho, Thời gian Đơn đặt hàng

PR1 Mã đơn Ngày đặt hàng,

PR1: Văn phòng đại diện, cửa hàng, mặt hàng, đơn đặt hàng

SR1: Ánh xạ SR1 thành quan hệ hai ngôi hoặc nhiều ngôi

FKA: Ánh xạ FKA sang mối quan hệ 1 - n

Tích hợp 2 lược đồ EER1 và EER2 thành IER

Để hợp nhất các thực thể từ hai lược đồ EER1 và EER2 thành IEER, ta sử dụng quan hệ hai ngôi một cách hợp lý Lược đồ EER1 chứa tập thực thể KHÁCH HÀNG, trong khi lược đồ EER2 bao gồm tập thực thể VĂN PHÒNG ĐẠI DIỆN và ĐƠN ĐẶT HÀNG, có các thuộc tính khóa và không khóa được xác định rõ ràng Việc trộn các thực thể này giúp xây dựng một mô hình dữ liệu liên kết chặt chẽ, đảm bảo tính toàn vẹn của dữ liệu và tối ưu hóa quá trình quản lý thông tin khách hàng, đại diện văn phòng và đơn đặt hàng.

- Giải quyết xung đột ngữ nghĩa:Trường Thời gian ở các thực thể là đồng âm(homonyms): Thực hiện đổi tên thuộc tính:

Thực thể Tên thuộc tính ban đầu Tên thuộc tính sau khi thay đổi Khách hàng bưu điện Thời gian Ngày gửi đơn đầu tiên

Khách hàng du lịch Thời gian Ngày đến CH đầu tiên

Văn phòng đại diện Thời gian Ngày thành lập VP

Cửa hàng Thời gian Ngày thành lập CH

Mặt hàng Thời gian Ngày bắt đầu bán

Mặt hàng được lưu trữ Thời gian Ngày nhập hàng

Mặt hàng được đặt Thời gian Ngày đặt

- KHÁCH HÀNG chứa Mã TP và ĐƠN HÀNG chứa Mã KH => Sau khi trộn ta có lược đồ IEER tích hợp được 2 lược đồ EER1 và EER2 được IEER:

Tạo IDB từ IEER

Chuyển đổi mô hình thực thể liên kết mở rộng thành cơ sở dữ liệu tích hợp

Từ mô hình thực thể liên kết mở rộng trên, ánh xạ các thực thể và quan hệ thành các bảng trong cơ sở dữ liệu tích hợp:

- Văn Phòng Đại Diện -> Bảng VanPhongDaiDien

- Đơn Đặt Hàng -> Bảng DonHang

- Mặt Hàng Được Lưu Trữ -> Bảng MatHangDuocLuu

- Mặt Hàng Được Đặt -> Bảng MatHangDuocDat

- Khách Hàng Bưu Điện -> Bảng KhachHangBD

- Khách Hàng Du Lịch -> Bảng KhachHangDL

V SINH DỮ LIỆU VÀ ÁNH XẠ

5.1 Ánh xạ dữ liệu từ IDB sang các bảng trong kho (DW)

Thuộc tính Nguồn từ IDB Ghi chú

CustomerID KhachHang.MaKH Primary Key

Khách hàng được xác định dựa trên việc kiểm tra sự tồn tại của mã khách hàng (MaKH) trong hai bảng dữ liệu: KhachHangDL (khách hàng du lịch) và KhachHangBD (khách hàng bưu điện) Nếu mã khách hàng chỉ xuất hiện trong một trong hai bảng, hệ thống sẽ gán giá trị CustomerType là ‘Tourist’ hoặc ‘Mail’ tương ứng Phương pháp này giúp phân loại khách hàng một cách chính xác dựa trên dữ liệu tồn tại trong các bảng liên quan.

Nếu tồn tại ở cả hai bảng, gán là ‘Both’

CityID KhachHang.MaTP Tham chiếu DimCity

Ma_KH INT PRIMARY KEY,

INSERT INTO D_W.dbo.Dim_KhachHang (Ma_KH, Ma_TP, Ten_KH) SELECT Ma_KH, Ma_TP, Ten_KH

Thuộc tính Nguồn từ IDB

Ma_TP INT PRIMARY KEY,

INSERT INTO D_W.dbo.Dim_VPDD (Ma_TP, Ten_TP, Dia_chi_VP,

Bang) SELECT Ma_TP, Ten_TP, Dia_chi_VP, Bang

Thuộc tính Nguồn từ IDB

Bảng chiều cửa hàng (store), liên kết với dim_Office

Ma_CH VARCHAR(50) PRIMARY KEY,

Ngay_khai_truong DATE, CONSTRAINT FK_Store_Office FOREIGN KEY (Ma_TP)

REFERENCES Dim_VPDD(Ma_TP)

INSERT INTO D_W.dbo.Dim_CuaHang (Ma_CH, Ma_TP, SDT,

Ngay_khai_truong) SELECT Ma_CH, Ma_TP, SDT, ngay_khai_truong

Thuộc tính Nguồn từ IDB

Ma_MH INT PRIMARY KEY,

INSERT INTO D_W.dbo.Dim_MatHang (Ma_MH, MoTa, KichCo,

TrongLuong, Gia) SELECT Ma_MH, MoTa, KichCo, TrongLuong, Gia

Thuộc tính Nguồn từ IDB Ghi chú

Trích xuất từ các ngày trong

Có thể tự sinh toàn bộ thời gian từ 2020 - 2025

Ma_TG VARCHAR(50) PRIMARY KEY, thang INT, quy INT, nam INT

INSERT INTO D_W.dbo.Dim_ThoiGian (Ma_TG, thang, quy, nam) select distinct (FORMAT(ngay_dat, 'yyyy-MM')), month(ngay_dat),DATEPART(QUARTER,ngay_dat),year(ngay_da t)

Thuộc tính Nguồn từ IDB Ghi chú

StoreID Cần xử lý logic

OrderDateKey DonHang.NgayDH Gắn với DimTime

Hệ thống đặt giá theo mặt hàng và giá đặt, đồng thời ánh xạ StoreID vào bảng FactOrder dựa trên logic nghiệp vụ, trong đó mỗi đơn hàng được ưu tiên phục vụ bởi cửa hàng cùng thành phố với khách hàng Quá trình này bao gồm truy vết tồn kho tại thời điểm đặt hàng để chọn ra cửa hàng có đủ số lượng mặt hàng cần thiết, đảm bảo phục vụ nhanh chóng và chính xác.

1 Lấy MaTP (mã thành phố) của khách -> tìm tất cả cửa hàng trong thành phố đó

2 Với mỗi mặt hàng đăt, tìm cửa hàng có:

- ThoiGian (trong MatHangDuocLuu) là gần nhất trước hoặc bằng NgayDatHang

3 Chọn 1 cửa hàng phù hợp

Thuộc tính Nguồn từ IDB Ghi chú

StockDateKey MatHangDL.ThoiGian Gắn với DimTime

INSERT INTO dbo.Fact_Kho (Ma_MH, Ma_CH, Ma_TG, so_luong_ton_kho) SELECT k.Ma_MH, k.Ma_CH,

FORMAT(k.Ngay_nhap, 'yyyy-MM') AS Ma_TG,

SUM(k.So_luong) AS so_luong_ton_kho

FROM KDL.dbo.MHLuuTru AS k

GROUP BY k.Ma_MH, k.Ma_CH,

FORMAT(k.Ngay_nhap, 'yyyy-MM');

5.2 Sinh dữ liệu create database KDL; use KDL;

1 Bảng Văn phòng đại diện

Ma_TP INT NOT NULL PRIMARY KEY,

Ten_TP NVARCHAR(50) NOT NULL,

Dia_chi_VP NVARCHAR(50) NOT NULL,

Ngay_thanh_lap DATE NOT NULL

Ma_KH INT NOT NULL PRIMARY KEY,

Ten_KH VARCHAR(50) NOT NULL,

Ma_TP INT NOT NULL, sẽ được liên kết sau

Ngay_dat_hang_dau_tien DATE,

FOREIGN KEY(Ma_TP) REFERENCES VPDD(Ma_TP)

3 Bảng Khách hàng Du lịch

Ma_KH INT NOT NULL PRIMARY KEY, cũng là FK, nhưng để sau Huong_dan_vien NVARCHAR(50) NOT NULL,

FOREIGN KEY (Ma_KH) REFERENCES KhachHang(Ma_KH)

4 Bảng Khách hàng Bưu điện

Ma_KH INT NOT NULL PRIMARY KEY, cũng là FK, nhưng để sau Dia_chi_buu_dien NVARCHAR(50) NOT NULL,

FOREIGN KEY (Ma_KH) REFERENCES KhachHang( Ma_KH)

Ma_Don INT NOT NULL PRIMARY KEY,

Ngay_dat DATE NOT NULL,

Ma_KH INT NOT NULL,

FOREIGN KEY (Ma_KH) REFERENCES KhachHang(Ma_KH) );

Ma_MH INT NOT NULL PRIMARY KEY,

Ma_CH VARCHAR(50) NOT NULL PRIMARY KEY,

Ma_TP INT NOT NULL, sẽ được liên kết sau

SDT VARCHAR(50), ngay_khai_truong DATE,

FOREIGN KEY (Ma_TP) REFERENCES VPDD(Ma_TP)

8 Bảng Mặt hàng được lưu trữ

Ma_CH VARCHAR(50) NOT NULL,

Ma_MH INT NOT NULL,

So_luong INT NOT NULL,

PRIMARY KEY (Ma_CH, Ma_MH),

FOREIGN KEY (Ma_MH) REFERENCES MatHang(Ma_MH),

FOREIGN KEY (Ma_CH) REFERENCES CuaHang(Ma_CH)

9 Bảng Mặt hàng được đặt

Ma_Don INT NOT NULL,

Ma_MH INT NOT NULL,

So_luong INT NOT NULL,

PRIMARY KEY (Ma_Don, Ma_MH),

FOREIGN KEY (Ma_Don) REFERENCES DonDatHang (Ma_Don),

FOREIGN KEY (Ma_MH) REFERENCES MatHang(Ma_MH)

Bảng văn phòng đại diện (Office Table): gồm 5 văn phòng đại diện

Bảng cửa hàng (Store Table): gồm 12 cửa hàng

Bảng khách hàng (Customer Table)

Bảng khách hàng bưu điện (Post Office Customer)

Bảng khách hàng du lịch (Tourist Customer)

Bảng mặt hàng được lưu trữ (StoredItem)

Bảng đơn hàng (TheOrder): gồm 900 đơn hàng

Bảng đơn hàng được đặt (OrderedItem): gồm 1000 bản ghi

VI Xây dựng mô hình dữ liệu cho kho Data Warehouse

6.1 Thiết kế kho dữ liệu

Mô hình tổng thể của hệ thống kho dữ liệu được trình bày dưới dạng mô hình Galaxy (ngân hà), gồm hai bảng Fact chính và năm bảng Dimension liên quan, giúp tối ưu hóa quá trình phân tích và truy xuất dữ liệu một cách hiệu quả.

Cấu trúc kho dữ liệu được thiết kế như sau:

- Bảng Factdoanhthu: ghi nhận các chi tiết giao dịch mua hàng, cho phép phân tích theo nhiều chiều như khách hàng, sản phẩm, cửa hàng, thời gian

Bảng FactInventory ghi nhận lượng tồn kho tại từng cửa hàng qua các mốc thời gian khác nhau, giúp doanh nghiệp phân tích khả năng cung ứng và tối ưu hóa hoạt động điều phối hàng hóa Đây là công cụ quan trọng trong quản lý tồn kho, đảm bảo cung ứng hàng hóa liên tục đáp ứng nhu cầu khách hàng Việc theo dõi sát sao bảng FactInventory giúp nâng cao hiệu quả dự trữ kho, giảm thiểu rủi ro thiếu hụt hoặc tồn đọng hàng hóa Do đó, sử dụng bảng FactInventory là bước cần thiết trong chiến lược quản lý kho hàng hiện đại và tối ưu hóa chuỗi cung ứng.

- Các bảng Dimension dùng chung giữa hai Fact giúp chuẩn hóa dữ liệu, giảm dư thừa, và tăng tính linh hoạt trong việc kết hợp dữ liệu phân tích

6.2 Ý nghĩa chi tiết các bảng

Tên cột Kiểu dữ liệu Mô tả

OrderID int Khoá ngoại đến Đơn hàng

ProductID int Khoá ngoại đến Mặt hàng

StoreID int Khoá ngoại đến Cửa hàng

CustomerID int Khoá ngoại đến Khách hàng

OrderDateKey int Khoá ngoại đến

QuantityOrdered int Số lượng đặt

OrderedPrice decimal Giá đặt hàng

Tên cột Kiểu dữ liệu Mô tả

ProductID int Mã đặt hàng

StoreID int Mã cửa hàng

StockDateKey int Ngày ghi nhận tồn kho

QuantityInStock int Số lượng tồn trong kho tại thời điểm đó

Tên cột Kiểu dữ liệu Mô tả

CustomerType varchar Du lịch/ Bưu điện/ Cả hai

CityID int Khoá ngoại đến DimCity

Tên cột Kiểu dữ liệu Mô tả

Description varchar Mô tả sản phẩm

Tên cột Kiểu dữ liệu Mô tả

Phone varchar Số điện thoại

CityID int Khoá ngoại đến DimCity

Tên cột Kiểu dữ liệu Mô tả

OfficeAddr varchar Địa chỉ văn phòng

Tên cột Kiểu dữ liệu Mô tả

Lược đồ hình bông tuyết gồm một kho dữ liệu với cấu trúc gồm một bảng fact chính kết hợp với năm bảng chiều: chiều thời gian, chiều mặt hàng, chiều khách hàng, chiều cửa hàng và chiều văn phòng đại diện Hệ thống này giúp tổ chức dữ liệu một cách trực quan, tối ưu hóa khả năng phân tích và truy vấn dữ liệu, phù hợp với các nghiệp vụ kinh doanh và báo cáo phân tích Mô hình dữ liệu này linh hoạt, dễ mở rộng và nâng cao hiệu quả quản lý thông tin, đồng thời đảm bảo tối ưu hóa SEO với các từ khóa liên quan đến thiết kế kho dữ liệu, mô hình bông tuyết và phân tích dữ liệu doanh nghiệp.

- Các độ đo trong bảng Sales_Fact (measures):

+ tong_mat_hang: Số lượng mặt hàng ma_mat_hang bán được trong khoảng thời gian ma_thoi_gian tại văn phòng đại diện có mã ma_thanh_pho

Tổng doanh thu phản ánh tổng tiền bán của mặt hàng ma_mat_hang trong khoảng thời gian ma_thoi_gian tại văn phòng đại diện có mã ma_thanh_pho Đây là chỉ số quan trọng để đánh giá hiệu quả kinh doanh của từng mặt hàng cũng như hoạt động bán hàng của các văn phòng đại diện theo từng khu vực địa lý Việc theo dõi doanh thu giúp doanh nghiệp đưa ra các chiến lược phù hợp nhằm tối ưu hóa lợi nhuận và phát triển thị trường một cách hiệu quả.

+ dim_Time: chứa thông tin thời gian với các thuộc tính: mã thời gian (ma_thoi_gian ), tháng, quý , năm

+ dim_Item: chứa thông tin về mặt hàng với thuộc tính: mã mặt hàng (ma_mat_hang ), mô tả, kích cỡ, trọng lượng, giá

+ dim_Store: chứa thông tin về cửa hàng với các thuộc tính: mã cửa hàng (ma_cua_hang), tên thành phố, số điện thoại

+ dim_Office: chứa thông tin về văn phòng đại diện với các thuộc tính: mã thành phố (ma_thanh_pho), tên thành phố, địa chỉ văn phòng, bang

6.2 Phân cấp cho dữ liệu o Phân cấp cho chiều thời gian (dim_tgian) o Phân cấp cho dữ liệu văn phòng đại diện (dim_vphong)

VII CÀI ĐẶT CÁC KHỐI DỮ LIỆU

2 Các khối dữ liệu cần cài đặt

3 Phân cấp khối dữ liệu

Công cụ sử dụng: Visual Studio 2022

1.1 Kết nối nguồn dữ liệu (DataSource)

Vào ứng dụng Visual Code Chọn Create a new project

Tạo mới project Analysis Multidimensional Project Ở Data Sources, chọn New Data Sources

Nhập thông tin kết nối đến cơ sở dữ liệu cần tạo

1.2 Tạo DataSource View Ở Data Source View, click chuột phải chọn New Data Source View Chọn các bảng cần đưa vào

1.3 Tạo các khối dữ liệu (Cube), chiều dữ liệu (Dimension) a) Tạo Cube Ở mục Cubes, click chuột phải chọn new Cube

Bước 4: tại bước này không chọn -> net

Bước 5: Hoàn thành chọn Finish

Tương tự với các Cube còn lại b) Tạo Dimensions Ở mục Dimensions, Chọn New Dimension

VIII TẠO CÁC BÁO CÁO PHÂN TÍCH TRỰC TUYẾN

Mục tiêu: xây dựng giao diện với người dùng để demo các phép toán cơ bản của OLAP bao gồm: drill down, roll up, slice and dice, pivot

Công cụ sử dụng: Microsoft Power BI

1 Kết nối nguồn dữ liệu

Chọn getData → Database → SQL Server Analysis Services database → nhấn Connect

1) Nhập tên Server cần lấy dữ liệu và khối dữ liệu đã xây dựng sẵn → OK

2) Dữ liệu trong các khối đã xây dựng được load vào, phục vụ cho phân tích

3) Chọn loại biểu đồ thích hợp và các chiều cần phân tích để trực quan hóa

● Báo cáo phân tích kinh doanh

Doanh thu theo địa chỉ văn phòng

Doanh thu theo mã thành phố và mã khách hàng

Số lượng đã bán theo bang

Tổng tiền theo từng năm của các bang

● Câu phân tích trực tuyến trên OLAP

Xin vui lòng cung cấp danh sách các cửa hàng, bao gồm tên cửa hàng, thành phố, bang, số điện thoại, mô tả chi tiết về các mặt hàng, kích cỡ, trọng lượng và đơn giá của từng sản phẩm được bán tại kho hàng đó để tôi có thể giúp bạn tổng hợp và viết lại thành một đoạn văn phù hợp chuẩn SEO.

Nhóm đã hoàn thành việc thiết kế và nhập dữ liệu vào các bảng trong kho dữ liệu, xây dựng thành công hệ thống quản lý dữ liệu hiệu quả Các bước thực hiện bao gồm thiết kế cơ sở dữ liệu và đổ dữ liệu vào các bảng, góp phần hình thành kho dữ liệu tổng thể Quá trình này giúp nhóm xây dựng nền tảng dữ liệu vững chắc để phục vụ các phân tích và ra quyết định sau này.

- Tích hợp hai cơ sở dữ liệu thành một cơ sở dữ liệu tích hợp.

- Tận dụng các lược đồ hình sao, lược đồ bông tuyết, lược đồ hình dải thiên hà và tạo kho dữ liệu từ các lược đồ đó.

- Ánh xạ dữ liệu từ cơ sở dữ liệu tích hợp sang kho dữ liệu.

- Xây dựng các khối dữ liệu theo yêu cầu của bài toán

Quá trình làm bài tập lớn đã giúp chúng em củng cố kiến thức lý thuyết về xây dựng kho dữ liệu Chúng em đã nắm vững quy trình cơ bản để phát triển kho dữ liệu cho các bài toán thực tế, từ đó nâng cao kỹ năng ứng dụng thực tế của mình trong lĩnh vực này.

Xây dựng mô hình dữ liệu cho kho Data Warehouse

Sinh dữ liệu và ánh xạ

Ánh xạ dữ liệu từ IDB sang các bảng trong kho (DW)

Thuộc tính Nguồn từ IDB Ghi chú

CustomerID KhachHang.MaKH Primary Key

Khách hàng được xác định dựa trên việc kiểm tra sự tồn tại của MaKH trong các bảng KhachHangDL (khách hàng du lịch) và KhachHangBD (khách hàng bưu điện) Nếu MaKH chỉ xuất hiện trong một trong hai bảng này, CustomerType sẽ được gán là ‘Tourist’ hoặc ‘Mail’, tương ứng với loại khách hàng đó.

Nếu tồn tại ở cả hai bảng, gán là ‘Both’

CityID KhachHang.MaTP Tham chiếu DimCity

Ma_KH INT PRIMARY KEY,

INSERT INTO D_W.dbo.Dim_KhachHang (Ma_KH, Ma_TP, Ten_KH) SELECT Ma_KH, Ma_TP, Ten_KH

Thuộc tính Nguồn từ IDB

Ma_TP INT PRIMARY KEY,

INSERT INTO D_W.dbo.Dim_VPDD (Ma_TP, Ten_TP, Dia_chi_VP,

Bang) SELECT Ma_TP, Ten_TP, Dia_chi_VP, Bang

Thuộc tính Nguồn từ IDB

Bảng chiều cửa hàng (store), liên kết với dim_Office

Ma_CH VARCHAR(50) PRIMARY KEY,

Ngay_khai_truong DATE, CONSTRAINT FK_Store_Office FOREIGN KEY (Ma_TP)

REFERENCES Dim_VPDD(Ma_TP)

INSERT INTO D_W.dbo.Dim_CuaHang (Ma_CH, Ma_TP, SDT,

Ngay_khai_truong) SELECT Ma_CH, Ma_TP, SDT, ngay_khai_truong

Thuộc tính Nguồn từ IDB

Ma_MH INT PRIMARY KEY,

INSERT INTO D_W.dbo.Dim_MatHang (Ma_MH, MoTa, KichCo,

TrongLuong, Gia) SELECT Ma_MH, MoTa, KichCo, TrongLuong, Gia

Thuộc tính Nguồn từ IDB Ghi chú

Trích xuất từ các ngày trong

Có thể tự sinh toàn bộ thời gian từ 2020 - 2025

Ma_TG VARCHAR(50) PRIMARY KEY, thang INT, quy INT, nam INT

INSERT INTO D_W.dbo.Dim_ThoiGian (Ma_TG, thang, quy, nam) select distinct (FORMAT(ngay_dat, 'yyyy-MM')), month(ngay_dat),DATEPART(QUARTER,ngay_dat),year(ngay_da t)

Thuộc tính Nguồn từ IDB Ghi chú

StoreID Cần xử lý logic

OrderDateKey DonHang.NgayDH Gắn với DimTime

Hệ thống tự động ánh xạ StoreID vào bảng FactOrder dựa trên logic nghiệp vụ ưu tiên phục vụ khách hàng tại cửa hàng cùng thành phố Mỗi đơn hàng được chọn cửa hàng phù hợp nhất dựa trên vị trí địa lý để đảm bảo dịch vụ nhanh chóng và tiện lợi Đồng thời, hệ thống kiểm tra tồn kho tại thời điểm đặt hàng để xác định cửa hàng có đủ số lượng mặt hàng cần thiết, đảm bảo đáp ứng yêu cầu của khách hàng một cách chính xác và nhanh chóng.

1 Lấy MaTP (mã thành phố) của khách -> tìm tất cả cửa hàng trong thành phố đó

2 Với mỗi mặt hàng đăt, tìm cửa hàng có:

- ThoiGian (trong MatHangDuocLuu) là gần nhất trước hoặc bằng NgayDatHang

3 Chọn 1 cửa hàng phù hợp

Thuộc tính Nguồn từ IDB Ghi chú

StockDateKey MatHangDL.ThoiGian Gắn với DimTime

INSERT INTO dbo.Fact_Kho (Ma_MH, Ma_CH, Ma_TG, so_luong_ton_kho) SELECT k.Ma_MH, k.Ma_CH,

FORMAT(k.Ngay_nhap, 'yyyy-MM') AS Ma_TG,

SUM(k.So_luong) AS so_luong_ton_kho

FROM KDL.dbo.MHLuuTru AS k

GROUP BY k.Ma_MH, k.Ma_CH,

FORMAT(k.Ngay_nhap, 'yyyy-MM');

Sinh dữ liệu

create database KDL; use KDL;

1 Bảng Văn phòng đại diện

Ma_TP INT NOT NULL PRIMARY KEY,

Ten_TP NVARCHAR(50) NOT NULL,

Dia_chi_VP NVARCHAR(50) NOT NULL,

Ngay_thanh_lap DATE NOT NULL

Ma_KH INT NOT NULL PRIMARY KEY,

Ten_KH VARCHAR(50) NOT NULL,

Ma_TP INT NOT NULL, sẽ được liên kết sau

Ngay_dat_hang_dau_tien DATE,

FOREIGN KEY(Ma_TP) REFERENCES VPDD(Ma_TP)

3 Bảng Khách hàng Du lịch

Ma_KH INT NOT NULL PRIMARY KEY, cũng là FK, nhưng để sau Huong_dan_vien NVARCHAR(50) NOT NULL,

FOREIGN KEY (Ma_KH) REFERENCES KhachHang(Ma_KH)

4 Bảng Khách hàng Bưu điện

Ma_KH INT NOT NULL PRIMARY KEY, cũng là FK, nhưng để sau Dia_chi_buu_dien NVARCHAR(50) NOT NULL,

FOREIGN KEY (Ma_KH) REFERENCES KhachHang( Ma_KH)

Ma_Don INT NOT NULL PRIMARY KEY,

Ngay_dat DATE NOT NULL,

Ma_KH INT NOT NULL,

FOREIGN KEY (Ma_KH) REFERENCES KhachHang(Ma_KH) );

Ma_MH INT NOT NULL PRIMARY KEY,

Ma_CH VARCHAR(50) NOT NULL PRIMARY KEY,

Ma_TP INT NOT NULL, sẽ được liên kết sau

SDT VARCHAR(50), ngay_khai_truong DATE,

FOREIGN KEY (Ma_TP) REFERENCES VPDD(Ma_TP)

8 Bảng Mặt hàng được lưu trữ

Ma_CH VARCHAR(50) NOT NULL,

Ma_MH INT NOT NULL,

So_luong INT NOT NULL,

PRIMARY KEY (Ma_CH, Ma_MH),

FOREIGN KEY (Ma_MH) REFERENCES MatHang(Ma_MH),

FOREIGN KEY (Ma_CH) REFERENCES CuaHang(Ma_CH)

9 Bảng Mặt hàng được đặt

Ma_Don INT NOT NULL,

Ma_MH INT NOT NULL,

So_luong INT NOT NULL,

PRIMARY KEY (Ma_Don, Ma_MH),

FOREIGN KEY (Ma_Don) REFERENCES DonDatHang (Ma_Don),

FOREIGN KEY (Ma_MH) REFERENCES MatHang(Ma_MH)

Bảng văn phòng đại diện (Office Table): gồm 5 văn phòng đại diện

Bảng cửa hàng (Store Table): gồm 12 cửa hàng

Bảng khách hàng (Customer Table)

Bảng khách hàng bưu điện (Post Office Customer)

Bảng khách hàng du lịch (Tourist Customer)

Bảng mặt hàng được lưu trữ (StoredItem)

Bảng đơn hàng (TheOrder): gồm 900 đơn hàng

Bảng đơn hàng được đặt (OrderedItem): gồm 1000 bản ghi

VI Xây dựng mô hình dữ liệu cho kho Data Warehouse

6.1 Thiết kế kho dữ liệu

Mô hình tổng thể của hệ thống kho dữ liệu được trình bày dưới dạng mô hình Galaxy (ngân hà), giúp tối ưu hóa việc quản lý dữ liệu phức tạp Hệ thống gồm hai bảng Fact chính, cung cấp các dữ liệu trung tâm để phân tích, cùng với năm bảng Dimension liên quan, hỗ trợ phân loại và phân tích dữ liệu chi tiết hơn Mô hình Galaxy giúp cải thiện hiệu suất truy vấn và dễ dàng mở rộng trong các dự án phân tích dữ liệu lớn.

Cấu trúc kho dữ liệu được thiết kế như sau:

- Bảng Factdoanhthu: ghi nhận các chi tiết giao dịch mua hàng, cho phép phân tích theo nhiều chiều như khách hàng, sản phẩm, cửa hàng, thời gian

Bảng FactInventory là công cụ quan trọng để lưu trữ dữ liệu lượng hàng tồn kho tại từng cửa hàng theo các mốc thời gian khác nhau Đây giúp doanh nghiệp phân tích khả năng cung ứng, dự đoán xu hướng tồn kho, từ đó điều phối hàng hóa hiệu quả hơn Việc quản lý chính xác thông tin tồn kho qua bảng FactInventory là yếu tố then chốt để tối ưu hóa chuỗi cung ứng và nâng cao hiệu suất hoạt động của cửa hàng.

- Các bảng Dimension dùng chung giữa hai Fact giúp chuẩn hóa dữ liệu, giảm dư thừa, và tăng tính linh hoạt trong việc kết hợp dữ liệu phân tích

6.2 Ý nghĩa chi tiết các bảng

Tên cột Kiểu dữ liệu Mô tả

OrderID int Khoá ngoại đến Đơn hàng

ProductID int Khoá ngoại đến Mặt hàng

StoreID int Khoá ngoại đến Cửa hàng

CustomerID int Khoá ngoại đến Khách hàng

OrderDateKey int Khoá ngoại đến

QuantityOrdered int Số lượng đặt

OrderedPrice decimal Giá đặt hàng

Tên cột Kiểu dữ liệu Mô tả

ProductID int Mã đặt hàng

StoreID int Mã cửa hàng

StockDateKey int Ngày ghi nhận tồn kho

QuantityInStock int Số lượng tồn trong kho tại thời điểm đó

Tên cột Kiểu dữ liệu Mô tả

CustomerType varchar Du lịch/ Bưu điện/ Cả hai

CityID int Khoá ngoại đến DimCity

Tên cột Kiểu dữ liệu Mô tả

Description varchar Mô tả sản phẩm

Tên cột Kiểu dữ liệu Mô tả

Phone varchar Số điện thoại

CityID int Khoá ngoại đến DimCity

Tên cột Kiểu dữ liệu Mô tả

OfficeAddr varchar Địa chỉ văn phòng

Tên cột Kiểu dữ liệu Mô tả

Lược đồ hình bông tuyết là một mô hình dữ liệu gồm một bảng fact chính và năm bảng dimension theo chiều: thời gian, mặt hàng, khách hàng, cửa hàng và văn phòng đại diện Mô hình này giúp tổ chức dữ liệu một cách rõ ràng, tối ưu cho phân tích và báo cáo doanh thu, doanh số theo từng chiều dữ liệu như thời gian, sản phẩm và khách hàng Sử dụng lược đồ hình bông tuyết trong kho dữ liệu giúp cải thiện hiệu suất truy vấn và dễ dàng mở rộng hệ thống dữ liệu Đây là giải pháp lý tưởng cho các doanh nghiệp muốn xây dựng hệ thống phân tích dữ liệu linh hoạt, hiệu quả.

- Các độ đo trong bảng Sales_Fact (measures):

+ tong_mat_hang: Số lượng mặt hàng ma_mat_hang bán được trong khoảng thời gian ma_thoi_gian tại văn phòng đại diện có mã ma_thanh_pho

Tổng doanh thu là tổng số tiền bán hàng của mặt hàng ma_mat_hang trong khoảng thời gian ma_thoi_gian tại văn phòng đại diện có mã ma_thanh_pho Đây là chỉ tiêu quan trọng giúp đánh giá hiệu quả kinh doanh của từng mặt hàng và từng chi nhánh trong một khoảng thời gian cụ thể Việc nắm bắt tổng doanh thu theo thời gian và địa điểm giúp các doanh nghiệp tối ưu hóa chiến lược bán hàng và nâng cao lợi nhuận.

+ dim_Time: chứa thông tin thời gian với các thuộc tính: mã thời gian (ma_thoi_gian ), tháng, quý , năm

+ dim_Item: chứa thông tin về mặt hàng với thuộc tính: mã mặt hàng (ma_mat_hang ), mô tả, kích cỡ, trọng lượng, giá

+ dim_Store: chứa thông tin về cửa hàng với các thuộc tính: mã cửa hàng (ma_cua_hang), tên thành phố, số điện thoại

+ dim_Office: chứa thông tin về văn phòng đại diện với các thuộc tính: mã thành phố (ma_thanh_pho), tên thành phố, địa chỉ văn phòng, bang

6.2 Phân cấp cho dữ liệu o Phân cấp cho chiều thời gian (dim_tgian) o Phân cấp cho dữ liệu văn phòng đại diện (dim_vphong)

VII CÀI ĐẶT CÁC KHỐI DỮ LIỆU

2 Các khối dữ liệu cần cài đặt

3 Phân cấp khối dữ liệu

Công cụ sử dụng: Visual Studio 2022

1.1 Kết nối nguồn dữ liệu (DataSource)

Vào ứng dụng Visual Code Chọn Create a new project

Tạo mới project Analysis Multidimensional Project Ở Data Sources, chọn New Data Sources

Nhập thông tin kết nối đến cơ sở dữ liệu cần tạo

1.2 Tạo DataSource View Ở Data Source View, click chuột phải chọn New Data Source View Chọn các bảng cần đưa vào

1.3 Tạo các khối dữ liệu (Cube), chiều dữ liệu (Dimension) a) Tạo Cube Ở mục Cubes, click chuột phải chọn new Cube

Bước 4: tại bước này không chọn -> net

Bước 5: Hoàn thành chọn Finish

Tương tự với các Cube còn lại b) Tạo Dimensions Ở mục Dimensions, Chọn New Dimension

VIII TẠO CÁC BÁO CÁO PHÂN TÍCH TRỰC TUYẾN

Mục tiêu: xây dựng giao diện với người dùng để demo các phép toán cơ bản của OLAP bao gồm: drill down, roll up, slice and dice, pivot

Công cụ sử dụng: Microsoft Power BI

1 Kết nối nguồn dữ liệu

Chọn getData → Database → SQL Server Analysis Services database → nhấn Connect

1) Nhập tên Server cần lấy dữ liệu và khối dữ liệu đã xây dựng sẵn → OK

2) Dữ liệu trong các khối đã xây dựng được load vào, phục vụ cho phân tích

3) Chọn loại biểu đồ thích hợp và các chiều cần phân tích để trực quan hóa

● Báo cáo phân tích kinh doanh

Doanh thu theo địa chỉ văn phòng

Doanh thu theo mã thành phố và mã khách hàng

Số lượng đã bán theo bang

Tổng tiền theo từng năm của các bang

● Câu phân tích trực tuyến trên OLAP

Bạn đang tìm kiếm danh sách tất cả các cửa hàng, bao gồm thông tin về thành phố, bang, số điện thoại, mô tả cửa hàng, kích cỡ, trọng lượng và đơn giá của các mặt hàng được bán tại đó Thông tin này giúp dễ dàng xác định vị trí các cửa hàng theo khu vực và cung cấp đầy đủ dữ liệu về các mặt hàng để hỗ trợ quyết định mua hàng Việc nắm bắt các chi tiết như kích cỡ, trọng lượng và giá cả còn giúp khách hàng dễ dàng so sánh và lựa chọn sản phẩm phù hợp với nhu cầu của mình Tất cả các dữ liệu này đều nhằm cung cấp một cái nhìn toàn diện về các kho hàng, đảm bảo bạn có thể tiếp cận thông tin chính xác và đầy đủ để đưa ra quyết định mua sắm hiệu quả.

Nhóm đã hoàn thành việc thiết kế và nhập dữ liệu vào các bảng để hình thành kho dữ liệu Các bước công việc bao gồm thiết kế hệ thống, xử lý dữ liệu đầu vào, và xây dựng kho dữ liệu vững chắc để hỗ trợ phân tích và báo cáo hiệu quả.

- Tích hợp hai cơ sở dữ liệu thành một cơ sở dữ liệu tích hợp.

- Tận dụng các lược đồ hình sao, lược đồ bông tuyết, lược đồ hình dải thiên hà và tạo kho dữ liệu từ các lược đồ đó.

- Ánh xạ dữ liệu từ cơ sở dữ liệu tích hợp sang kho dữ liệu.

- Xây dựng các khối dữ liệu theo yêu cầu của bài toán

Quá trình làm bài tập lớn đã giúp chúng em củng cố lý thuyết và nắm được quy trình cơ bản về xây dựng kho dữ liệu cho các bài toán thực tế Việc này đã nâng cao khả năng áp dụng kiến thức vào thực tiễn và xây dựng hệ thống dữ liệu hiệu quả Các bước xây dựng kho dữ liệu trở nên rõ ràng và dễ hiểu hơn, góp phần nâng cao kỹ năng phân tích và xử lý dữ liệu lớn.

Ngày đăng: 20/05/2025, 14:44

HÌNH ẢNH LIÊN QUAN

-- 1. Bảng Văn phòng đại diện - Báo cáo kho dữ liệu thiết kế và triển khai một hệ thống kho dữ liệu (data warehouse) phục vụ cho quá trình phân tích và ra quyết Định trong một doanh nghiệp hoạt Động trong lĩnh vực bán lẻ
1. Bảng Văn phòng đại diện (Trang 25)
-- 3. Bảng Khách hàng Du lịch - Báo cáo kho dữ liệu thiết kế và triển khai một hệ thống kho dữ liệu (data warehouse) phục vụ cho quá trình phân tích và ra quyết Định trong một doanh nghiệp hoạt Động trong lĩnh vực bán lẻ
3. Bảng Khách hàng Du lịch (Trang 26)
-- 4. Bảng Khách hàng Bưu điện - Báo cáo kho dữ liệu thiết kế và triển khai một hệ thống kho dữ liệu (data warehouse) phục vụ cho quá trình phân tích và ra quyết Định trong một doanh nghiệp hoạt Động trong lĩnh vực bán lẻ
4. Bảng Khách hàng Bưu điện (Trang 27)
-- 5. Bảng Đơn đặt hàng - Báo cáo kho dữ liệu thiết kế và triển khai một hệ thống kho dữ liệu (data warehouse) phục vụ cho quá trình phân tích và ra quyết Định trong một doanh nghiệp hoạt Động trong lĩnh vực bán lẻ
5. Bảng Đơn đặt hàng (Trang 28)
-- 6. Bảng Mặt hàng - Báo cáo kho dữ liệu thiết kế và triển khai một hệ thống kho dữ liệu (data warehouse) phục vụ cho quá trình phân tích và ra quyết Định trong một doanh nghiệp hoạt Động trong lĩnh vực bán lẻ
6. Bảng Mặt hàng (Trang 29)
-- 8. Bảng Mặt hàng được lưu trữ - Báo cáo kho dữ liệu thiết kế và triển khai một hệ thống kho dữ liệu (data warehouse) phục vụ cho quá trình phân tích và ra quyết Định trong một doanh nghiệp hoạt Động trong lĩnh vực bán lẻ
8. Bảng Mặt hàng được lưu trữ (Trang 30)
-- 9. Bảng Mặt hàng được đặt - Báo cáo kho dữ liệu thiết kế và triển khai một hệ thống kho dữ liệu (data warehouse) phục vụ cho quá trình phân tích và ra quyết Định trong một doanh nghiệp hoạt Động trong lĩnh vực bán lẻ
9. Bảng Mặt hàng được đặt (Trang 31)
Bảng cửa hàng (Store Table): gồm 12 cửa hàng - Báo cáo kho dữ liệu thiết kế và triển khai một hệ thống kho dữ liệu (data warehouse) phục vụ cho quá trình phân tích và ra quyết Định trong một doanh nghiệp hoạt Động trong lĩnh vực bán lẻ
Bảng c ửa hàng (Store Table): gồm 12 cửa hàng (Trang 33)
Bảng văn phòng đại diện (Office Table): gồm 5 văn phòng đại diện - Báo cáo kho dữ liệu thiết kế và triển khai một hệ thống kho dữ liệu (data warehouse) phục vụ cho quá trình phân tích và ra quyết Định trong một doanh nghiệp hoạt Động trong lĩnh vực bán lẻ
Bảng v ăn phòng đại diện (Office Table): gồm 5 văn phòng đại diện (Trang 33)
Bảng khách hàng (Customer Table) - Báo cáo kho dữ liệu thiết kế và triển khai một hệ thống kho dữ liệu (data warehouse) phục vụ cho quá trình phân tích và ra quyết Định trong một doanh nghiệp hoạt Động trong lĩnh vực bán lẻ
Bảng kh ách hàng (Customer Table) (Trang 34)
Bảng mặt hàng ( Item) - Báo cáo kho dữ liệu thiết kế và triển khai một hệ thống kho dữ liệu (data warehouse) phục vụ cho quá trình phân tích và ra quyết Định trong một doanh nghiệp hoạt Động trong lĩnh vực bán lẻ
Bảng m ặt hàng ( Item) (Trang 36)
Bảng mặt hàng được lưu trữ (StoredItem) - Báo cáo kho dữ liệu thiết kế và triển khai một hệ thống kho dữ liệu (data warehouse) phục vụ cho quá trình phân tích và ra quyết Định trong một doanh nghiệp hoạt Động trong lĩnh vực bán lẻ
Bảng m ặt hàng được lưu trữ (StoredItem) (Trang 37)
Bảng đơn hàng (TheOrder): gồm 900 đơn hàng - Báo cáo kho dữ liệu thiết kế và triển khai một hệ thống kho dữ liệu (data warehouse) phục vụ cho quá trình phân tích và ra quyết Định trong một doanh nghiệp hoạt Động trong lĩnh vực bán lẻ
ng đơn hàng (TheOrder): gồm 900 đơn hàng (Trang 38)
Bảng đơn hàng được đặt (OrderedItem): gồm 1000 bản ghi - Báo cáo kho dữ liệu thiết kế và triển khai một hệ thống kho dữ liệu (data warehouse) phục vụ cho quá trình phân tích và ra quyết Định trong một doanh nghiệp hoạt Động trong lĩnh vực bán lẻ
ng đơn hàng được đặt (OrderedItem): gồm 1000 bản ghi (Trang 39)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w