1. Trang chủ
  2. » Giáo Dục - Đào Tạo

tiểu luận cơ sở dữ liệu phân tán đề tàiphân mảnh dọc và hỗn hợp

29 2 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 29
Dung lượng 1,22 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Nội Dung:3/23/2022 3 Khái quát về phân mảnh dữ liệu • Định nghĩa,yêu cầu của phân mảnh dọc • Thông tin cần thiết của phân mảnh dọc Phân mảnh dọc Kết luận Phân mảnh hỗn hợp... Khái quát v

Trang 3

Nội Dung:

3/23/2022 3

Khái quát về phân mảnh dữ liệu

• Định nghĩa,yêu cầu của phân mảnh dọc

• Thông tin cần thiết của phân mảnh dọc

Phân mảnh dọc

Kết luận Phân mảnh hỗn hợp

Trang 4

Khái quát về phân

mảnh dữ liệu

Phân mảnh (fragmentation)

dữ liệu là việc chia các quan

hệ trong một cơ sở dữ liệu (CSDL) thành các quan hệ nhỏ hơn hay còn gọi là các mảnh (fragment)

3/23/2022 4

Trang 5

Khái quát về phân

mảnh dữ liệu

Vị trí của phân mảnh trong thiết kế các hệ

cơ sở dữ liệu phân tán

5 3/23/2022

Trang 6

Khái quát về phân

Các thông tin yêu cầu cho phân mảnh:

• Thông tin về cơ sở dữ liệu gồm tập các quan hệ, tập các phụ thuộc

• Thông tin về các ứng dụng gồm các câu truy vấn trên các quan hệ

Trang 7

• Tăng mức độ hoạt động đồng thời và tăng lưu lượng hoạt động của hệ thống.

Một số hạn chế:

• Tăng chi phí truy xuất dữ liệu đến các mảnh

và tăng chi phí kết nối các mảnh

• Việc kiểm soát ngữ nghĩa, bảo đảm tính độc lập dữ liệu, toàn vẹn dữ liệu sẽ gặp khó khăn hơn

Trang 8

Phân mảnh dọc

Trang 10

Có hai kiểu phân mảnh dọc : Phân mảnh dọc dư thừa và

phân mảnh dọc không dư thừa.

Trang 11

Ví dụ 2 : Xét quan hệ toàn cục nhân viên (EMP) mô tả mã nhân viên (MANV), tên nhân viên (TENNV), lương (LUONG), thuế thu nhập (THUE), nhà quản lý (NQL) và phòng ban

họ làm việc (PHONGBAN) như sau :

EMP(MANV, TENNV, LUONG, THUE, NQL, PHONGBAN)

Quan hệ toàn cục này được phân mảnh dọc dư thừa (thuộc tính TENNV ) như sau :

EMP1 = Π MANV, TENNV, NQL, PHONGBAN (EMP)

EMP2 = Π MANV, TENNV ,LUONG, THUE (EMP)

Trang 12

Phân mảnh dọc không dư thừa redundant fragmentation):

(non-Phân mảnh dọc không dư thừa là các phân mảnh dọc không chứa thuộc tính chung không khóa nào cả.

Trang 13

Ví dụ 3 : Quan hệ toàn cục :

EMP(MANV, TENNV, LUONG, THUE, NQL, PHONGBAN)

Quan hệ toàn cục này được phân mảnh dọc không dư thừa (thuộc tính ) như sau :

EMP1 = Π MANV, TENNV, NQL, PHONGBAN (EMP)

EMP2 = Π MANV, LUONG, THUE (EMP)

Phân mảnh này phản ánh lương và thuế của các nhân viên được quan lý riêng Việc tái thiết lại quan hệ EMP có thể nhận được từ :

EMP = EMP1 JNN EMP2 (với JNN là phép kết nối tự nhiên hai quan hệ).

Vì MANV là khóa của quan hệ EMP Nói chung, việc chứa khóa của quan hệ toàn

cục vào mỗi mảnh là cách tốt nhất để bảo đảm cho tính tái thiết.

Từ đó chúng ta thấy sự phân mảnh cũng thỏa tính đầy đủ và tính tách biệt.

Trang 14

Phân mảnh dọc

 Yêu cầu của phân mảnh dọc:

Giả sử ta có quan hệ R Tập các thuộc tính của quan hệ R:

Tập các mảnh của mảnh của R:

K là khóa của quan hệ R

• Tính đầy đủ:bất kì thuộc tính nào trong quan hệ R đều có thể tìm thấy trong mỗi mảnh con.

Trang 16

Thông tin cần thiết của phân mảnh dọc

• Ma trận giá trị sử dụng thuộc tính:

Xét: Q={q1,q2, ,qq} :tập các câu truy vấn

R(A1,A2,…,An):quan hệ toàn cục

:Ma trận thuộc tính sử dụng.Với i=1,…,q và j= 1,…,n

A use q A

Trang 17

Thông tin cần thiết của phân mảnh dọc

Ví dụ 4: Xét 4 câu truy vấn sau đối với quan hệ BRANCH

 q1: Tìm vốn của chi nhánh theo mã chi nhánh

SELECT VON

FROM BRANCH

WHERE MACN=Value

 q2: Tìm tên chi nhánh và vốn của tất cả các chi nhánh

SELECT TENCN, VON

Trang 18

Thông tin cần thiết của phân mảnh dọc

Trang 19

Thông tin cần thiết của phân mảnh dọc

 Ma trận lực hút : Với:

Trang 20

Thông tin cần thiết của phân mảnh dọc

cả hai thuộc tính này là q13 nên ta có:

Trang 21

Thông tin cần thiết của phân mảnh dọc

Ta có được ma trận lực hút thuộc tính như sau:

1 2 3 4

Trang 22

Phân mảnh hỗn hợp

Trong thực tế, hầu hết các trường hợp phân mảnh ngang hay phân mảnh dọc đơn giản của CSDL không thoả mãn yêu cầu người sử dụng Thường CSDL được phân mảnh dọc sau đó phân mảnh ngang, tạo ra sự phân chia theo cấu trúc cây (hình dưới) Chiến lược phân mảnh này gọi là phân đoạn lai, hay phân mảnh trộn, hay phân mảnh lồng.

Trang 23

Trong ví dụ (hình trên), nó được phân hoạch

thành 2 mảnh dọc Như vậy, kết quả phân hoạch quan hệ PROJ là một tập mảnh ngang, trong đó mỗi một mảnh lại được tiếp tục phân chia thành

2 mảnh dọc.

R11 R12 R21 R22 R23

Tái xây dựng phân đoạn hỗn hợp

Trang 27

Tính đúng đắn của phân mảnh hỗn hợp được đảm bảo, vì chiến lược phân mảnh này dựa theo phân mảnh ngang và phân mảnh dọc, đảm bảo tính đúng đắn như đã trình bày Để khôi phục quan hệ toàn cục trong trường hợp phân mảnh hỗn hợp, có thể bắt đầu từ các node lá của cây phân hoạch và dịch chuyển lên bằng cách thực hiện các phép kết nối và phép hợp Phân mảnh hỗn hợp đầy đủ nếu các mảnh lá và các mảnh trung gian là đầy

đủ Tương tự, có thể kiểm tra tính tách biệt của chiến lược phân mảnh hỗn hợp Tính tách biệt được đảm bảo khi các mảnh lá và mảnh trung gian cũng tách biệt

Trang 28

Kết luận

• Phân mảnh dọc nói riêng và phân mảnh nói chung là một phần trong quá trình thiết kế các hệ cơ sở dữ liệu phân tán,là công việc đầu tiên phải

thực hiện.với mục đích tạo ra các đơn vị cấp phát logic,sao cho chi phí

để thực hiện truy vấn thông tin là thấp nhất

Trang 29

Bài thuyết trình đến đây là kết thúc Cảm ơn các bạn đã lắng nghe.

Ngày đăng: 28/03/2022, 20:07

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w