Bài thuyết trình môn Cơ sở dữ liệu phân tán Tìm hiểu phân mảnh ngang
Trang 1Bài thuyết trình môn Cơ sở dữ liệu phân tán
Tìm hiểu phân
mảnh ngang
Thực hiện: Nhóm 2
Trang 2I Phân mảnh dữ liệu
1 - Phân mảnh quan hệ là gì?
Việc chia một quan hệ thành nhiều quan hệ nhỏ hơn được gọi là phân mảnh quan hệ.
2 – Các lý do phải phân mảnh dữ liệu:
Khung nhìn hoặc đơn vị truy xuất của các ứng dụng không phải là toàn bộ quan hệ mà
thường là một mảnh.
Việc phân rã một quan hệ thành nhiều mảnh, mỗi mảnh được xử lý như một đơn vị, sẽ cho
phép thực hiện nhiều giao dịch đồng thời.
Trang 3I Phân mảnh dữ liệu ( Tiếp )
Việc phân mảnh các quan hệ sẽ cho phép thực hiện song song một câu vấn tin bằng cách chia nó ra thành một tập các câu vấn tin con hoạt tác trên các mảnh.
Nếu các ứng dụng có các khung nhìn được định nghĩa trên một quan hệ cho trước nằm tại
những vị trí khác thì có hai cách chọn lựa đơn vị phân tán:
+ hoặc là toàn bộ quan hệ
+ hoặc quan hệ được lưu ở một vị trí có chạy ứng dụng
Trang 4I Phân mảnh dữ liệu ( Tiếp )
Nhận xét : Chọn lựa thứ nhất gây ra một số lượng lớn các truy xuất không cần thiết đến dữ liệu ở
xa Chọn lựa sau sẽ gây ra nhiều vấn đề khi cập nhật và lãng phí không gian lưu trữ.
Trang 5I Phân mảnh dữ liệu ( Tiếp )
3 – Các loại phân mảnh:
Phân mảnh ngang (horizontal fragmentation)
Phân mảnh dọc (vertical fragmentation)
Phân mảnh hỗn hợp (hibrid fragmentation)
Chú ý: Quá trình phân mảnh phải được gắn liền với vấn đề cấp phát dữ liệu và bài
toán cụ thể như thế nào.
Trang 6R = R1 ∪ R2 ∪ ∪ Rk
Trang 7II Phân mảnh ngang ( Tiếp)
* Phân loại:
Có hai loại phân mảnh ngang:
Phân mảnh ngang chính (primary horizontal
fragmentation): phân mảnh ngang chính của một quan hệ được thực hiện dựa trên các vị từ được định nghĩa trên quan hệ đó.
Phân mảnh ngang dẫn xuất (derived horizontal
fragmentation): phân mảnh ngang dẫn xuất của một quan hệ được thực hiện dựa trên các vị từ được định nghĩa trên quan hệ khác.
Như vậy, trong phân mảnh ngang tập các vị từ đóng một vai
Trang 8II Phân mảnh ngang ( Tiếp)
* Thông tin về cơ sở dữ liệu:
Trong lược đồ ý niệm toàn cục, các quan hệ được kết với nhau
Trong mô hình liên kết thực thể (ER model):
Quan hệ chủ hoặc quan hệ nguồn.
Quan hệbộphận hoặc quan hệ đích.
Các hàm owner và member.
Trang 9II Phân mảnh ngang ( Tiếp)
Hình 1.1: Biểu diễn các mối liên kết giữa các quan hệ dùng các đường liên kết
Trang 10II Phân mảnh ngang ( Tiếp)
*Thông tin về ứng dụng
Các vị từ được sử dụng trong các truy vấn.
Chỉ phân tích các ứng dụng quan trọng để xác định các vị từ này.
Giả sử phân mảnh ngang quan hệ R (A1, A2, An), với Ai là thuộc tính được định nghĩa trên miền Di.
Trang 11II Phân mảnh ngang ( Tiếp)
Vị từ đơn giản (simple predicate) pj được định nghĩa trên R có dạng:
Ai θ value
θ là một trong các phép so sánh =, ≠, <, ≤, >, ≥
value được chọn từ miền trị của Ai (value € Di)
Ký hiệu Pr là tập các vị từ đơn giản được định
nghĩa trên quan hệ R Các phần tử của Pr được ký
hiệu là pj.
Trang 12II Phân mảnh ngang ( Tiếp)
Vị từ giao tối thiểu (minterm predicate) mj đối với tập các vị từ đơn giản Pr= {p1, p2, ,
pm} là một tổ hợp giao của tất cả các vị từ xuất hiện trong Pr (ở dạng thông thường hoặc
ở dạng phủ định).
mj= ᴧ p*i , 1 ≤ i ≤ m
với p*i=pi hoặc p*i= ¬pi và mj ≠ false
Gọi tập các vị từ giao tối thiểu là: M={m1,m2, ,mz}
Trang 13II Phân mảnh ngang (Tiếp)
* Các yêu cầu của việc phân mảnh
Việc phân mảnh một quan hệ tổng thể cũng phải tuân theo một số quy tắc nhất định để
khi tái thiết lại quan hệ cũ vẫn bảo đảm ngữ nghĩa của nó
Một phương pháp thiết kế các phân mảnh đúng đắn phải thỏa mãn ba tính chất sau:
Tính đầy đủ (completeness)
Tính tái thiết được (reconstruction)
Tính tách biệt (disjointness):
Trang 15II Phân mảnh ngang (Tiếp)
* Tính tái thiết được:
Nếu một quan hệ R được phân rã thành các mảnh
R1, R2, , Rk thì phải tồn tại một toán tử θ sao cho
R = θ (Ri), ∀ i
Toán tử θ thay đổi tùy theo từng loại phân mảnh
Trong thực tế khi các mảnh được phân mảnh ngang thì θ là phép hợp, phân mảnh dọc thì θ là phép nối và phân mảnh hỗn hợp thì θ là phép nửa nối
Trang 16II Phân mảnh ngang (Tiếp)
* Tính tách biệt:
Nếu một quan hệ R được phân mảnh ngang thành các quan hệ R1, R2, , Rk và mục dữ liệu
ti nằm trong mảnh Ri thì nó sẽ không nằm trong một mảnh Rk, k≠i
Tiêu chuẩn này bảo đảm các mảnh ngang phải được tách rời nhau
Nếu quan hệ được phân mảnh dọc thì thuộc tính chung phải được lặp lại trong mỗi mảnh
Do đó, trong trường hợp phân mảnh dọc tính tách biệt chỉ được định nghĩa trên các trường không phải là thuộc tính chung của quan hệ.
Trang 17III Phân mảnh ngang chính
Mảnh ngang chính được xác định bằng phép chọn trên quan hệ toàn cục
Ri= σFi (R); 1 ≤i≤n
Fi là điều kiện chọn của mảnh Ri
Nếu Fi ở dạng chuẩn giao thì nó là một vị từ giao tối thiểu mi
Tính đúng đắn của phân mảnh ngang chính: mỗi bộcủa quan hệtoàn cục được đưa vào
trong một vàchỉmột mảnh.
Trang 18III Phân mảnh ngang chính (Tiếp)
Xác định phân mảnh ngang chính của một quan hệtoàn cục là xác định một tập các vị từ chọn (selection predicate) đầy đủ và tách biệt.
Các bộ thuộc cùng một mảnh phải được tham chiếu giống nhau trong tất cả các ứng dụng.
Mảnh ngang (horizontal fragment) hoặc mảnh giao tối thiểu (minterm fragment) Ri bao gồm
tất cảcác bộcủa Rthỏa mãn vịtừgiao tối thiểu mi.
Trang 19III Phân mảnh ngang chính (Tiếp)
* Các bước thiết kế phân mảnh ngang
Bước 1 : Tìm tập các vị từ chọn Pr’ là đầy đủ và tối
thiểu.
Bước 2 : Tìm tập các vị từ giao tối thiểu có thể
được định nghĩa trên các vị từ của Pr’
Trang 20III Phân mảnh ngang chính (Tiếp)
Một vị từ đơn giản pi được gọi là thích hợp (relevant) đối với một tập Pr các vị từ đơn giản,
nếu tồn tại ít nhất hai vị từ giao tối thiểu mi và mj của Pr mà các biểu thức của chúng chỉ khác nhau ở pi (tức là mi chứa pi và mj chứa ¬pi) và tồn tại ít nhất một ứng dụng tham chiếu khác nhau đến hai mảnh fi và fj (tương ứng với mi và mj).
Trang 21III Phân mảnh ngang chính (Tiếp)
Một tập các vị từ đơn giản Pr được gọi là đầy đủ (complete) nếu và chỉ nếu bất kỳ hai bộ
nào thuộc bất kỳ mảnh giao tối thiểu nào được định nghĩa theo Pr thì bất kỳ ứng dụng nào đều tham chiếu đến hai bộ này với cùng một xác suất.
Một tập các vị từ đơn giản Pr được gọi là tối thiểu (minimal) nếu tất cả các vị từ của nó là
các vị từ thích hợp.
Cho Pr={p1, p2, , pm} là một tập các vị từ đơn giản Để cho Pr biểu diễn phân mảnh đúng đắn và hiệu quả thì Pr phải đầy đủ và tối thiểu.
Trang 22III Phân mảnh ngang chính (Tiếp)
Ví dụ: Xét cơ sở dữ liệu của một công ty máy tính được tổ chức như sau:
NHANVIEN (MANV, TENNV, CHUCVU): quan hệ này chứa dữ liệu về nhân viên của công ty
TLUONG (CHUCVU, LUONG): quan hệ này chứa dữ liệu liên quan về lương và chức vụ của nhân viên
DUAN (MADA, TENDA, NGANSACH): quan hệ này chứa dữ liệu về các dự án mà công ty đang phát triển
HOSO (MANV, MADA, NHIEMVU, THOIGIAN): quan
hệ này chứa dữ liệu về hồ sơ của nhân viên được phân công thực hiện dự án).
Trang 23III Phân mảnh ngang chính (Tiếp)
Phân tích HT Lập trình viên Phân tích HT Phân tích HT Lập trình viên
Kỹ sư điện Phân tích HT Thiết kế DL
MA
NV MA DA NHIEMVU THOI GIAN
A1 A2 A2 A3 A3 A4 A5 A6 A7
D1 D1 D2 D3 D4 D2 D2 D4 D3
Quản lý Phân tích Phân tích
Kỹ thuật Lập trình Quản lý Quản lý
Kỹ thuật Quản lý
12 34 6 12 10 6 20 36 48
Trang 24III Phân mảnh ngang chính (Tiếp)
20000 12000 28000 25000
TIENLUONG (S)
Trang 25III Phân mảnh ngang chính (Tiếp)
Trang 26Phân mảnh ngang dẫn xuất
được gọi là mảnh ngang, dựa vào sự phân mảnh ngang của một quan hệ khác (được gọi là quan hệ chủ)
Điều kiện kết
Vị từ định tính của quan hệ chủ tương ứng
Trang 27 Ví dụ
Trang 2828
Trang 29 Ví dụ: Xét lược đồ đơn giản
Trang 30Phân mảnh ngang dẫn xuất
Định nghĩa 2 quan hệ dẫn xuất
PAY1
PAY2
Trang 31Phân mảnh ngang dẫn xuất
Kết quả
Trang 32Phân mảnh ngang dẫn xuất
Phân mảnh có đặc tính nối tốt hơn
Phân mảnh được sử dụng trong nhiều ứng
dụng hơn
Trang 33Phân mảnh ngang dẫn xuất
Quan hệ thành viên (EMP)
Phép kết giữa quan hệ chủ và quan hệ thành viên