Chương 2: Mô hình dữ liệu và các phụ thuộc dữ liệu Chương 3: Phương pháp chuẩn hóa Lược đồ CSDL Chương 4: Lý thuyết đồ thị quan hệ Chương 5: Thiết kế CSDL ở mức vật lý... Phân loạ
Trang 1ĐH CÔNG NGHỆ THÔNG TIN http://sites.google.com/site/khaiphong
Trang 2 Chương 2: Mô hình dữ liệu và các phụ thuộc dữ liệu
Chương 3: Phương pháp chuẩn hóa Lược đồ CSDL
Chương 4: Lý thuyết đồ thị quan hệ
Chương 5: Thiết kế CSDL ở mức vật lý
Trang 3 Chương 3: Phương pháp chuẩn hóa
lược đồ CSDL
1 Giới thiệu dạng chuẩn
2 Phân loại dạng chuẩn
3 Phương pháp chuẩn hóa
4 Bài tập chuẩn hóa
Trang 49912 Nguyen Thu Cong nghe thong tin Co so du lieu 8
Toan roi rac 4
9903 Nguyen A Kinh te Xac suat thong ke 5
9912 Nguyen Thu Cong nghe thong tin Tin hoc dai cuong 6
9912 Nguyen Thu Cong nghe thong tin Co so du lieu 8
9912 Nguyen Thu Cong nghe thong tin Toan roi rac 4
9903 Nguyen A Kinh te Xac suat thong ke 5
đồ?
Trang 5 Chương 3: Phương pháp chuẩn hóa LĐ CSDL
1 Giới thiệu dạng chuẩn
Nhận xét bài toán 1:
Sự trùng lắp thông tin: tăng không gian lưu trữ
thông tin bị mâu thuẫn khi cập nhật CSDL.
Chi phí kiểm tra ràng buộc toàn vẹn.
Bảo toàn thông tin.
thuộc hàm.
Trang 6QLHT(MsSV, Ten, NS, Phai, ĐC, MsLop, TenLop, MsMH,
Trang 7 Chương 3: Phương pháp chuẩn hóa LĐ CSDL
1 Giới thiệu dạng chuẩn
Xét bài toán 2: Cho thể hiện của quan hệ quản lý học tập của sinh viên
QLHT(MsSV, Ten, NS, Phai, ĐC, MsLop, TenLop, MsMH,
Trang 8QLHT(MsSV, Ten, NS, Phai, ĐC, MsLop, TenLop, MsMH,
Xóa : Giả sử sv có mã số 1108 hiện nay chỉ đăng ký học
Trang 9 Chương 3: Phương pháp chuẩn hóa LĐ CSDL
1 Giới thiệu dạng chuẩn
Xét bài toán 2: Cho thể hiện của quan hệ quản lý học tập của sinh viên
QLHT(MsSV, Ten, NS, Phai, ĐC, MsLop, TenLop, MsMH,
Thêm : vì khóa của quan hệ là {MsSV, MsMH} và {MsSV,
TenMH} không thể thêm 1 sv vào quan hệ nếu sv đó
Trang 10 Khái niệm: Một lược đồ Q đạt DC1 nếu toàn bộ
các thuộc tính của mọi bộ đều mang giá trị đơn.
Nhận xét: khi xét DC, xem DC đang xét ít nhất
đạt DC1
DC1
* Tips: Giá trị đơn là giá trị không phải kết hợp bởi
nhiều thông tin có ý nghĩa khác nhau
Ví dụ: giá trị của thuộc tính Bằng cấp:
{“Thạc sĩ”,”ĐH CNTT”}: thuộc tính mang giá trị kép
{“Thạc sĩ}: thuộc tính mang giá trị đơn
Trang 11 Chương 3: Phương pháp chuẩn hóa LĐ CSDL
2 Phân loại dạng chuẩn
Mọi thuộc tính không khóa đều phụ thuộc đầy
đủ vào các khóa của Q.
Trang 13 Chương 3: Phương pháp chuẩn hóa LĐ CSDL
2 Phân loại dạng chuẩn
Trang 15 Chương 3: Phương pháp chuẩn hóa LĐ CSDL
2 Phân loại dạng chuẩn
Mọi thuộc tính không khóa của Q đều không
phụ thuộc bắc cầu vào một khóa bất kỳ của Q.
DC3
* Tips: Thuộc tính A được gọi là phụ thuộc bắc
cầu vào tập thuộc tính X nếu tồn tại nhóm thuộc
tính Y Q+ thỏa các điều kiện sau:
X Y F+ và Y A F+
Y X
A (X Y)
Trang 16 hoặc X là siêu khóa.
hoặc A là thuộc tính khóa
DC3
* Tips: thông thường dựa trên khái niệm 2 để giảiquyết bài toán kiểm tra lược đồ Q có đạt dạng chuẩnDC3?
Trang 17 Chương 3: Phương pháp chuẩn hóa LĐ CSDL
2 Phân loại dạng chuẩn
B3: Nếu mọi pth XA Ftt với AX đều có
hoặc X là siêu khóa
hoặc A là thuộc tính khóa
Q đạt DC3 hoặc ngược lại
Trang 19 Chương 3: Phương pháp chuẩn hóa LĐ CSDL
2 Phân loại dạng chuẩn
B1: tập các khóa {AB}, {AD}, {C}
B2,3: tập pth tương đương Ftt của F có VP mộtthuộc tính:
F = (ABC ; DB ; C ABD)
Ftt = (ABC ; DB ; CA ; CB ; CD)Nhận xét:
- pth ABC : có C là thuộc tính khóa
- pth DB : có B là thuộc tính khóa
Trang 20 Khái niệm: Một lược đồ Q đạt BCK (còn gọi BC)
nếu mọi pth không hiển nhiên đều có vế tráichứa khóa
Trang 21 Chương 3: Phương pháp chuẩn hóa LĐ CSDL
2 Phân loại dạng chuẩn
Tập khóa: {SV,Thay}, {SV,MH}
B2: áp dụng thuật toán
- Xét pth SV,MHThay: có VT chứa khóa
- Xét pth Thay MH: có VT không chứa khóa
Q không đạt BC.
* Thử xét Q đạt DC3?
Trang 22 Tập khóa: {ACD}, {CE}
B2: áp dụng thuật toán
- Xét pth ACDEBI : có VT chứa khóa ACD
- Xét pth CEAD : có VT chứa khóa CE
Q đạt BC.
Trang 23 Chương 3: Phương pháp chuẩn hóa LĐ CSDL
2 Phân loại dạng chuẩn
DC2
BCK
DC3
DC1 Dạng chuẩn 4 (DC4) – tham khảo
Khái niệm: Một lược đồ Q đạt DC4 nếu:
Q đạt BCK
Với mọi phụ thuộc đa trị không hiển X >>Y được
định nghĩa trên Q thì vế trái X phải chứa 1 khóacủa Q, nghĩa là AQ+ thì XA F+
Trang 24B2: Q đạt BC? Nếu không sang B3.
B3: Q đạt DC3? Nếu không sang B4
Trang 25ĐH CÔNG NGHỆ THÔNG TIN http://sites.google.com/site/khaiphong
Trang 26N = {},M= {ABC} (Kẻ bảng xác định tập khóa)
Tập khóa: {A}, {C}
B2: xác định Q đạt BC? (tức mọi pth có VT chứa khóa)
- Xét pth BD: có VT không chứa khóa
Trang 27 Chương 2: Mô hình dữ liệu – Phụ thuộc dữ liệu
Xác định dạng chuẩn cao nhất của Q?
- Xét pth DB: vừa có VT là khóa vừa có VP có thuộc tính khóa
- Xét pth CA: có VT không là siêu khóa và VP không có thuộc tính khóa
Q không đạt DC3
B4: xác định Q đạt DC2? (tức mọi thuộc tính không khóa phụ thuộc đầy đủ vào
Trang 29 Chương 2: Mô hình dữ liệu – Phụ thuộc dữ liệu
Xác định dạng chuẩn cao nhất của các câu sau:
MaGV, MaMH Lop ;Lop, MaMH MaGV ;MaMH TenMH}
7) Q(ABCDEGTVXYZ) và F = {ABCEGDX ; GECY ; BCETD ; DVCE}
8) Q(ABCDEGRTVXYZ) và F = {EDY ; BCGZD; CGB ; ABCDEGRX ;
GRV ; DT}
9) Q(AIMNLTVXYZ) và F = {AVIXLN ; LIXT; NLI ; MNZA}
Trang 30trong 2 kết quả sau:
• Dựa trên kinh nghiệm, một cấu trúc CSDL ban đầu
gồm các quan hệ con Qi cùng các phụ thuộc dữ liệu 𝐹𝑄𝑖 định nghĩa trên các quan hệ con.
𝐶 =
𝑖=1
𝑛
(< 𝑄𝑖, 𝐹𝑄𝑖 >)
chứa tất cả các thuộc tính cần được lưu trữ và tập
Trang 31 Chương 3: Phương pháp chuẩn hóa LĐ CSDL
3 Phương pháp chuẩn hóa
CSDL kết quả cần đạt dạng chuẩn cao nhất
CSDL kết quả phải tương đương với CSDL
phân tích lúc ban đầu
Cập nhật: hạn chế tối đa sự trùng lắp thông tin trong
CSDL, giảm thông tin bị mâu thuẫn sau những lần cập nhật CSDL
Kiểm tra RBTV: tạo điều kiện thuận lợi cho việc kiểm tra
Trang 32CSDL kết quả phải tương đương với CSDL
phân tích lúc ban đầu
Bảo toàn phụ
thuộc hàm
Bảo toàn thông tin
Biểu diễn trọn vẹn
(Vừa bảo toàn PTH vừa Bảo toàn thông
tin)
Trang 33 Chương 3: Phương pháp chuẩn hóa LĐ CSDL
3 Phương pháp chuẩn hóa
Bảo toàn
phụ thuộc
hàm
Quan điểm: các thông tin được lưu trong CSDL là những
thông tin được thể hiện thông qua các phụ thuộc dữ liệu
bảo toàn phụ thuộc hàm trong khi biến đổi.
Tiêu chuẩn tương đương:
- Giả sử, C1=<Q,F> và 𝐶2 = {< 𝑄𝑖, 𝐹𝑖 >}𝑖=1𝑛 là một biến đổi từ C1
- C1 C2 nếu hai điều kiện sau được thỏa:
Trang 35 Chương 3: Phương pháp chuẩn hóa LĐ CSDL
3 Phương pháp chuẩn hóa
Quan điểm: các thông tin lưu trữ trong CSDL ban đầu
đều phải được tìm thấy đầy đủ trong CSDL kết quả.
Tiêu chuẩn tương đương:
- Giả sử, C1=<Q,F> và 𝐶2 = {< 𝑄𝑖, 𝐹𝑖 >}𝑖=1𝑛 là một biến đổi từ C1
- C1 C2 nếu hai điều kiện sau được thỏa:
𝑖=1
𝑛
𝑄𝑖 = 𝑄+ Không được xót thuộc tính
(⊳⊲ 𝑄[𝑄𝑖+]) = 𝑄 Bảo toàn thông tin lưu trữ
Bảo toàn
thông tin
Trang 36phân rã:
Cho C = {Qi} là 1 phân rã của lđqh Q có tập pth FQ
B1: Xây dựng 1 bảng 2 chiều mà các cột là các thuộc tính của Q, mỗi dòng là một
Qi trong phân rã nhận được
Mỗi ô ở dòng i cột j chứa ký hiệu:
a) ajnếu Qi có chứa thuộc tính thứ j của Q
b) bk nếu ngược lại (trong đó k là số thứ tự xuất hiện b)
B2: Biến đổi bảng dựa trên các pth có trong FQ theo qui tắc:
Trang 37 Chương 3: Phương pháp chuẩn hóa LĐ CSDL
3 Phương pháp chuẩn hóa
Tân từ: Mỗi chuyên đề (CD) có 1 tên phân biệt và có một mã số phân biệt (MSCD)
Một chuyên đề có thể được thực hiện bởi nhiều sinh viên và hạng (HG) của mỗi sinh viên trong cùng một chuyên đề là phân biệt
Bảo toàn
thông tin
Ví dụ kiểm tra bảo toàn thông tin của một phân rã C:
Trang 39T MSCD CD MSSV HG
http://sites.google.com/site/khaiphong
Chương 3: Phương pháp chuẩn hóa LĐ CSDL
3 Phương pháp chuẩn hóa
Ví dụ kiểm tra bảo toàn thông tin của một phân rã C:
C là một phân rã bảo
Trang 40A Phương pháp phân rã
B Phương pháp tổng hợp
Trang 41 Chương 3: Phương pháp chuẩn hóa LĐ CSDL
3 Phương pháp chuẩn hóa
A Phương pháp phân rã: