Nội Dung:3/23/2022 3 Khái quát về phân mảnh dữ liệu • Định nghĩa,yêu cầu của phân mảnh dọc • Thông tin cần thiết của phân mảnh dọc Phân mảnh dọc Kết luận Phân mảnh hỗn hợp... Khái quát v
Trang 3Nội Dung:
3/23/2022 3
Khái quát về phân mảnh dữ liệu
• Định nghĩa,yêu cầu của phân mảnh dọc
• Thông tin cần thiết của phân mảnh dọc
Phân mảnh dọc
Kết luận Phân mảnh hỗn hợp
Trang 4Khái quát về phân
mảnh dữ liệu
Phân mảnh (fragmentation)
dữ liệu là việc chia các quan
hệ trong một cơ sở dữ liệu (CSDL) thành các quan hệ nhỏ hơn hay còn gọi là các mảnh (fragment)
3/23/2022 4
Trang 5Khái quát về phân
mảnh dữ liệu
Vị trí của phân mảnh trong thiết kế các hệ
cơ sở dữ liệu phân tán
5 3/23/2022
Trang 6Khái quát về phân
Các thông tin yêu cầu cho phân mảnh:
• Thông tin về cơ sở dữ liệu gồm tập các quan hệ, tập các phụ thuộc
• Thông tin về các ứng dụng gồm các câu truy vấn trên các quan hệ
Trang 7• Tăng mức độ hoạt động đồng thời và tăng lưu lượng hoạt động của hệ thống.
Một số hạn chế:
• Tăng chi phí truy xuất dữ liệu đến các mảnh
và tăng chi phí kết nối các mảnh
• Việc kiểm soát ngữ nghĩa, bảo đảm tính độc lập dữ liệu, toàn vẹn dữ liệu sẽ gặp khó khăn hơn
Trang 8Phân mảnh dọc
Trang 10Có hai kiểu phân mảnh dọc : Phân mảnh dọc dư thừa và
phân mảnh dọc không dư thừa.
Trang 11Ví dụ 2 : Xét quan hệ toàn cục nhân viên (EMP) mô tả mã nhân viên (MANV), tên nhân viên (TENNV), lương (LUONG), thuế thu nhập (THUE), nhà quản lý (NQL) và phòng ban
họ làm việc (PHONGBAN) như sau :
EMP(MANV, TENNV, LUONG, THUE, NQL, PHONGBAN)
Quan hệ toàn cục này được phân mảnh dọc dư thừa (thuộc tính TENNV ) như sau :
EMP1 = Π MANV, TENNV, NQL, PHONGBAN (EMP)
EMP2 = Π MANV, TENNV ,LUONG, THUE (EMP)
Trang 12Phân mảnh dọc không dư thừa redundant fragmentation):
(non-Phân mảnh dọc không dư thừa là các phân mảnh dọc không chứa thuộc tính chung không khóa nào cả.
Trang 13Ví dụ 3 : Quan hệ toàn cục :
EMP(MANV, TENNV, LUONG, THUE, NQL, PHONGBAN)
Quan hệ toàn cục này được phân mảnh dọc không dư thừa (thuộc tính ) như sau :
EMP1 = Π MANV, TENNV, NQL, PHONGBAN (EMP)
EMP2 = Π MANV, LUONG, THUE (EMP)
Phân mảnh này phản ánh lương và thuế của các nhân viên được quan lý riêng Việc tái thiết lại quan hệ EMP có thể nhận được từ :
EMP = EMP1 JNN EMP2 (với JNN là phép kết nối tự nhiên hai quan hệ).
Vì MANV là khóa của quan hệ EMP Nói chung, việc chứa khóa của quan hệ toàn
cục vào mỗi mảnh là cách tốt nhất để bảo đảm cho tính tái thiết.
Từ đó chúng ta thấy sự phân mảnh cũng thỏa tính đầy đủ và tính tách biệt.
Trang 14Phân mảnh dọc
Yêu cầu của phân mảnh dọc:
Giả sử ta có quan hệ R Tập các thuộc tính của quan hệ R:
Tập các mảnh của mảnh của R:
K là khóa của quan hệ R
• Tính đầy đủ:bất kì thuộc tính nào trong quan hệ R đều có thể tìm thấy trong mỗi mảnh con.
Trang 16Thông tin cần thiết của phân mảnh dọc
• Ma trận giá trị sử dụng thuộc tính:
Xét: Q={q1,q2, ,qq} :tập các câu truy vấn
R(A1,A2,…,An):quan hệ toàn cục
:Ma trận thuộc tính sử dụng.Với i=1,…,q và j= 1,…,n
A use q A
Trang 17Thông tin cần thiết của phân mảnh dọc
Ví dụ 4: Xét 4 câu truy vấn sau đối với quan hệ BRANCH
q1: Tìm vốn của chi nhánh theo mã chi nhánh
SELECT VON
FROM BRANCH
WHERE MACN=Value
q2: Tìm tên chi nhánh và vốn của tất cả các chi nhánh
SELECT TENCN, VON
Trang 18Thông tin cần thiết của phân mảnh dọc
Trang 19Thông tin cần thiết của phân mảnh dọc
Ma trận lực hút : Với:
Trang 20Thông tin cần thiết của phân mảnh dọc
cả hai thuộc tính này là q13 nên ta có:
Trang 21Thông tin cần thiết của phân mảnh dọc
Ta có được ma trận lực hút thuộc tính như sau:
1 2 3 4
Trang 22Phân mảnh hỗn hợp
Trong thực tế, hầu hết các trường hợp phân mảnh ngang hay phân mảnh dọc đơn giản của CSDL không thoả mãn yêu cầu người sử dụng Thường CSDL được phân mảnh dọc sau đó phân mảnh ngang, tạo ra sự phân chia theo cấu trúc cây (hình dưới) Chiến lược phân mảnh này gọi là phân đoạn lai, hay phân mảnh trộn, hay phân mảnh lồng.
Trang 23Trong ví dụ (hình trên), nó được phân hoạch
thành 2 mảnh dọc Như vậy, kết quả phân hoạch quan hệ PROJ là một tập mảnh ngang, trong đó mỗi một mảnh lại được tiếp tục phân chia thành
2 mảnh dọc.
R11 R12 R21 R22 R23
Tái xây dựng phân đoạn hỗn hợp
Trang 27Tính đúng đắn của phân mảnh hỗn hợp được đảm bảo, vì chiến lược phân mảnh này dựa theo phân mảnh ngang và phân mảnh dọc, đảm bảo tính đúng đắn như đã trình bày Để khôi phục quan hệ toàn cục trong trường hợp phân mảnh hỗn hợp, có thể bắt đầu từ các node lá của cây phân hoạch và dịch chuyển lên bằng cách thực hiện các phép kết nối và phép hợp Phân mảnh hỗn hợp đầy đủ nếu các mảnh lá và các mảnh trung gian là đầy
đủ Tương tự, có thể kiểm tra tính tách biệt của chiến lược phân mảnh hỗn hợp Tính tách biệt được đảm bảo khi các mảnh lá và mảnh trung gian cũng tách biệt
Trang 28Kết luận
• Phân mảnh dọc nói riêng và phân mảnh nói chung là một phần trong quá trình thiết kế các hệ cơ sở dữ liệu phân tán,là công việc đầu tiên phải
thực hiện.với mục đích tạo ra các đơn vị cấp phát logic,sao cho chi phí
để thực hiện truy vấn thông tin là thấp nhất
Trang 29Bài thuyết trình đến đây là kết thúc Cảm ơn các bạn đã lắng nghe.