Bài giảng Cơ sở dữ liệu - Bài 5: Chuẩn hóa
Trang 1CƠ SỞ DỮ LIỆU
Bài 5:
CHUẨN HOÁ
Trang 2BÀI TOÁN THỰC TẾ
• Xử lý trường hợp phát hiện các phụ thuộc hàm không tầm thường trong một lược đồ quan hệ
• Ví dụ:
– ThoiKhoaBieu(Lớp, Môn, Gviên, Phòng, Buổi), lược
đồ có tập khoá là {L, GB, PB} Giả sử tìm thấy phụ thuộc hàm L→M
– HoaDonBH(Hdsố, Nlập, Mhang, Sluong, Dgia),
lược đồ có khoá duy nhất là HM Giả sử tìm thấy phụ thuộc hàm H→N
Trang 3– Tìm phân rã thoả các tiêu chuẩn thiết kế
– Xử lý tình huống phát sinh PTH mới
– Xử lý tình huống gặp phụ thuộc đa trị
Trang 6CƠ SỞ LÝ THUYẾT
• Định lý: Với phân rã {(XY), (XZ)}, nếu có XY hoặc
XZ thì phân rã là bảo toàn thông tin
Trang 7THỦ TỤC
• Mỗi khi tìm thấy một vi phạm dạng chuẩn,
thực hiện phân rã theo định lý trên
• Tiêu chuẩn đạt được (BTTT, dạng chuẩn cao)
• Vấn đề: BTPT
• Mong muốn
– Bảo toàn thông tin
– Bảo toàn phụ thuộc
– Đạt tối thiểu chuẩn 3
Trang 8THUẬT TOÁN
1 Phân rã chỉ gồm lược đồ gốc
2 Nếu tất cả các lược đồ con không vi phạm,
hoặc có vi phạm nhưng kết quả tách không
Trang 9M→G (MG) (HML)
Trang 10THẢO LUẬN
• Làm bài tập
Trang 12CƠ SỞ LÝ THUYẾT
• Định lý: Một phân rã đã bảo toàn phụ thuộc
sẽ bảo toàn thông tin nếu có một lược đồ con chứa khoá của lược đồ gốc
Trang 13THỦ TỤC
• Mỗi PTH phát sinh một lược đồ con
– Bảo toàn phụ thuộc (thật ra đặc trưng đầy đủ)
– Chuẩn BC
– Bổ sung lược đồ từ một khoá để BTTT
• Vấn đề
– Dư thừa lược đồ
– Quá nhiều lược đồ con có khoá tương đương nhau
• Giải quyết
– Tìm phủ tối tiểu trước
– Sát nhập lược đồ con có khoá tương đương nhau và xử
Trang 14THUẬT TOÁN
• Thay F bởi một phủ tối tiểu
• Phát sinh các lược đồ con, với các khoá thiết kế
• Với các lược đồ con có khoá tương đương
– Sát nhập
– Khử phụ thuộc bắt cầu
• Nếu chưa BTTT, bổ sung lược đồ con tạo bởi
các thuộc tính của một khoá bất kỳ
Trang 15khử thuộc tính bắc cầu A, kết quả (GH CD)
– Không bổ sung: D = {(GH CD), (AGB), (CA), (BHC)}
Trang 193NF
1 BTTT
2 ĐTĐĐ
3 3NF
Trang 20THẢO LUẬN
• Làm bài tập
Trang 21SO SÁNH 2 TIẾP CẬN
• Xét lược đồ (GLM) với F = {GM, LMG}
• Để nguyên như thế thì lược đồ (GLM) đạt chuẩn 3
nhưng không đặc trưng đầy đủ F
• Tiếp cận phân rã được lược đồ {(GM), (GL)} đạt
chuẩn BC, BTTT nhưng không BTPT
• Tiếp cận tổng hợp được lược đồ {(GM), (GLM)}
(nếu bổ sung ràng buộc tồn tại) đạt chuẩn BC, BTTT
và ĐTĐĐ
Trang 22– Tìm phân rã thoả các tiêu chuẩn thiết kế
– Xử lý tình huống phát sinh PTH mới
– Xử lý tình huống gặp phụ thuộc đa trị
Trang 23THẢO LUẬN TÌNH HUỐNG
Trang 24– Phân rã theo tiếp tập phân rã
– Phân rã theo tiếp cận tổng hợp
• Bỏ M G, thêm NM G
Trang 25– Phân rã theo tiếp tập phân rã
– Phân rã theo tiếp cận tổng hợp
• Bổ sung phụ thuộc hàm L → M
Trang 27• Bổ sung phụ thuộc đa trị L ↠ M(S)
– Thêm 2 lược đồ con {LM, SL}
– Bổ sung LM được {SMD, SL, LMG, LM}
• Các bài toán mở khi có phụ thuộc đa trị
– Phủ tối tiểu
– Điều kiện BTTT
Trang 28– Đặc trưng đầy đủ F và đạt chuẩn BC
– Gộp lại được lược đồ đầy đủ (DC có thể 3)
– Dễ dàng làm một lược đồ đầy đủ BTTT
• Với phụ thuộc đa trị, chúng ta có dạng chuẩn 4