Bài giảng Cơ sở dữ liệu - Chương 2: Mô hình dữ liệu quan hệ cung cấp cho người học các kiến thức: Các khái niệm cơ bản, các phép toán trên đại số tập hợp, các phép toán trên đại số quan hệ. Mời các bạn cùng tham khảo nội dung chi tiết.
Trang 1CƠ SỞ DỮ LIỆU
( Databases )
Chương 2: Mô hình dữ liệu quan hệ
Trang 2Nội dung
2.1 Các khái niệm cơ bản
2.2 Các phép toán trên đại số tập hợp
2.3 các phép toán trên đại số quan hệ
Trang 3Giới thiệu
Do tiến sĩ E F Codd đưa ra
– “A Relation Model for Large Shared Data Banks”, Communications of ACM, 6/1970
Cung cấp một cấu trúc dữ liệu đơn giản và đồng bộ
– Khái niệm quan hệ
Có nền tảng lý thuyết vững chắc
– Lý thuyết tập hợp
– Oracle, DB2, SQL Server…
Trang 42.1 Các khái niệm cơ bản
1 Quan hệ (relation)
2 Thuộc tính (attribute)
3 Bộ giá trị (Tuple)
4 Lược đồ quan hệ (realation schema) và Lược đồ cơ sở
dữ liệu (database schema)
5 Thể hiện của lược đồ quan hệ
6 Khóa – Siêu khóa – Khóa dự tuyển – Khóa chính – Khóa
Trang 52.1.1 Quan hệ
Các thông tin lưu trữ trong CSDL được tổ chức thành
bảng (table) 2 chiều gọi là quan hệ
1 cột là 1 thuộc tính của nhân viên
1 dòng là 1 nhân viên
Tên quan hệ là NHANVIEN
Trang 62.1.1 Quan hệ (tt)
– Tên– Tập hợp các cột
Trang 7Các đặc trưng của quan hệ
Thứ tự các bộ trong quan hệ là không quan trọng
Thứ tự giữa các giá trị trong một bộ là quan trọng
Bộ <Nguyen, Tung, 12/08/1955, 638 NVC Q5, Nam, 40000, 5>
khác
Bộ <Nguyen, Tung, 12/08/1955, 638 NVC Q5, 40000, Nam, 5>
Trang 8Các đặc trưng của quan hệ (tt)
Mỗi giá trị trong một bộ
– Hoặc là một giá trị nguyên tố– Hoặc là một giá trị rỗng (null)
Không có bộ nào trùng nhau trong một thể hiện của quan hệ
Trang 92.1.2 Thuộc tính - Attribute
Tên các cột của quan hệ
Mô tả ý nghĩa cho các giá trị tại cột đó
Tất cả các dữ liệu trong cùng 1 một cột đều có cùng kiểu dữ liệu
Thuộc tính
Trang 102.1.3 Bộ - Tuple
Là các dòng của quan hệ ( trừ dòng tiêu đề )
Thể hiện giá trị cụ thể của các thuộc tính
Dữ liệu cụ thể của thuộc tính
<Tung, Nguyen, 12/08/1955, 638 NVC, Q5, Nam, 40000, 5>
Trang 11Không được chấp nhận
Trang 13NHANVIEN(MANV, TENNV, HONV, NS, DIACHI, GT, LUONG, PHG)
PHONGBAN(MAPHG, TENPHG, TRPHG, NG_NHANCHUC)
DIADIEM_PHG(MAPHG, DIADIEM)
THANNHAN(MA_NVIEN, TENTN, GT, NS, QUANHE)
DEAN(TENDA, MADA, DDIEM_DA, PHONG)
Trang 142.1.4 Lược đồ quan hệ (tt)
Định nghĩa hình thức lược đồ quan hệ
– Cho A1, A2, …, An là các thuộc tính – Có các miền giá trị D1, D2, …, Dn tương ứng – Ký hiệu R(A1:D1, A2:D2, …, An:Dn) là một lược đồ quan hệ
Bậc của lược đồ quan hệ
– Là số lượng thuộc tính trong lược đồ
Lực lượng của quan hệ
– Là số dòng (bộ) trong quan hệ
Ví dụ:
– NHANVIEN (MANV:integer, TENNV:string, HONV:string, NGSINH:date, DCHI:string, GT:string, LUONG:integer, DONVI:integer)
• NHANVIEN là một lược đồ bậc 8 mô tả đối tượng nhân viên
• MANV là một thuộc tính có miền giá trị là số nguyên
• TENNV là một thuộc tính có miền giá trị là chuỗi ký tự
Trang 152.1.5 Thể hiện của quan hệ
Một quan hệ r của lược đồ quan hệ R(A1, A2, …, An) ,
Trang 162.1.6 Khóa (Keys)
Siêu khóa (Super Key)
– Khóa của quan hệ R(A1, A2, A3,…, An) là tập các thuộc tính K thỏa mãn: bộ q1, q2 của R đều tồn tại thuộc tính A K sao cho q1[A] q2[A]
khóa của R
Các bộ trong quan hệ phải khác nhau từng đôi một
Trang 172.1.6 Khóa (tt)
Khóa dự tuyển – Candidate Key
– Khóa 𝐾 của quan hệ 𝑅 nếu ∄ 𝐾′ 𝐾 thì 𝐾 được gọi là khóa tối tiểu
– Có thể có nhiều khóa tối tiểu trong 1 quan hệ Những khóa tối tiểu này được gọi là khóa dự tuyển (đủ điều kiện ứng tuyển để làm khóa của quan hệ)
Trang 182.1.6 Khóa (tt)
Khóa chính (Primary Key)
– Trong số các khóa dự tuyển, khóa nào được chọn để tạo các index chi phối truy xuất đến các bộ thì được gọi
là Khóa chính
– Xét quan hệ
– Có 2 khóa (MANV) và (HONV, TENNV, NS)– Khi cài đặt quan hệ thành bảng (table)
• Chọn 1 khóa làm cơ sở để nhận biết các bộ
• Khóa được chọn gọi là khóa chính (PK - primary key)
– Các thuộc tính khóa chính phải có giá trị khác null – Các thuộc tính khóa chính thường được gạch dưới
NHANVIEN(MANV, TENNV, HONV, NS, DCHI, GT, LUONG, PHG)
NHANVIEN(MANV, TENNV, HONV, NS, DCHI, GT, LUONG, PHG)
Trang 192.1.6 Khóa (tt)
Khóa dự phòng (Alternate key)
– Là các khóa dự tuyển không được chọn làm khóachính
– Trong ví dụ:
Khóa dự phòng là: (TENNV, HONV, NSNV)
NHANVIEN(MANV, TENNV, HONV, NS, DCHI, GT, LUONG, PHG)
Trang 202.1.6 Khóa (tt)
– Một bộ trong quan hệ R, tại thuộc tính A nếu nhận mộtgiá trị từ một thuộc tính B của quan hệ S, ta gọi R thamchiếu S
– Bộ được tham chiếu phải tồn tại trước
Trang 212.1.6 Khóa (tt)
Khóa ngoại – Foreign key
– Xét 2 lược đồ R và S, gọi FK là tập thuộc tính khác rỗng của R
• FK là khóa ngoại ( Foreign Key ) của R khi các thuộc tính trong FK phải có cùng miền giá trị với các thuộc tính khóa chính của S Giá trị tại FK của một bộ t1 R
– Hoặc bằng giá trị tại khóa chính của một bộ t2 S – Hoặc bằng giá trị rỗng
Trang 232.1.6 Khóa (tt)
Nhận xét chung về Khóa của quan hệ
– Giá trị của khóa dùng để xác định một bộ cụ thể trongquan hệ
– Khóa là một đặc trưng của lược đồ quan hệ, không phụthuộc vào thể hiện quan hệ
– Khóa được xây dựng dựa vào ý nghĩa của một sốthuộc tính trong quan hệ
– Lược đồ quan hệ có thể có nhiều khóa
Trang 242.1.7 Phụ thuộc hàm
Định nghĩa:
– Quan hệ R được định nghĩa trên tập thuộc tính U ={A1…An} X, Y U là 2 tập con của U Nếu tồn tại mộtánh xạ f: X Y thì ta nói rằng X xác định hàm Y, hay Yphụ thuộc hàm vào X và ký hiệu là X Y
Trang 252.1.8 Ràng buộc toàn vẹn
RBTV (Integrity Constraint)
– Là những qui tắc, điều kiện, ràng buộc cần được thỏamãn trong một thể hiện của CSDL quan hệ
RBTV được kiểm tra khi các quan hệ có thay đổi
Trang 262.1.8 Ràng buộc toàn vẹn (tt)
Ràng buộc thực thể
– Trong một quan không được có thuộc tính nào củakhóa chính chưa giá trị null
Ràng buộc tham chiếu
– Nếu quan hệ có thuộc tính là khóa ngoại thì thuộc tính
đó phải tham chiếu được / tồn tại ở quan hệ bị thamchiếu
Trang 272.1.8 Ràng buộc toàn vẹn (tt)
Biểu diễn ràng buộc tham chiếu
Trang 282.1.9 Các phép toán cơ bản trên quan hệ
Phép thêm một bộ mới vào quan hệ
– Việc thêm một bộ giá trị mới t vào quan hệ R (A1, A2,
A3, ,An) làm cho thể hiện TR của nó tăng thêm mộtphần tử mới:
– INSERT (R; Ai1= v1, Ai2 = v2, Aim= vm)
trong đó vi Dom (Aii)– Phép thêm mới có thể không thực hiện được hoặc làm mất đi tính toàn vẹn của CSDL
• Giá trị khóa chính = null
• Bộ mới không phù hợp kiểu giá trị của thuộc tính nào đó.
• Giá trị mới thêm không thuộc miền giá trị
Trang 292.1.9 Các phép toán cơ bản …(tt)
Phép loại bỏ bộ khỏi quan hệ
– DELETE (R; Ai1=v1, Ai2=v2, …., Aim=vm) – Trong đó Aij=vj được coi như những điều kiện thỏa mã để loại bỏ một bộ ra khỏi quan hệ
– Phép loại bỏ có thể dẫn đến phá hỏng sự toàn vẹn (khi xóa
1 bộ ở quan hệ bị tham chiếu)
Phép sửa đổi giá trị của các thuộc tính
– Việc sửa dữ liệu rất cần thiết, một số hệ quản trị CSDL đưa
UPDATE (FoxPro, Dbase) – UPDATE (R; Ai1= c1, Ai2 = c2, Aim= cm; Ai1= v1, Ai2=v2,
Aim=vm).
Trong đó: Aij= cj (j = 1, 2, ., m) là điều kiện tìm kiếm bộ giá trị để sửa Aij= vj (j = 1, 2, , m) là giá trị mới của bộ
Trang 312.2 Các phép toán trên ĐS tập hợp
Tính khả hợp (Tương thích đồng nhất - Union Compatibility)
– Hai lược đồ quan hệ R(A1, A2, …, An) và S(B1, B2, …, Bn) là khả hợp nếu
• Cùng bậc n
• Và có DOM(Ai)=DOM(Bi) , 1 i n
Kết quả của , , và là một quan hệ có cùng tên thuộc tính với quan hệ đầu tiên (R)
Trang 322.2.1 Phép hợp
Cho 2 quan hệ R và S khả hợp
Phép hợp của R và S
– Ký hiệu R S– Là một quan hệ gồm các bộ thuộc R hoặc thuộc S, hoặc cả hai (các bộ trùng lắp sẽ bị bỏ)
Trang 332.2.2 Phép giao
Cho 2 quan hệ R và S khả hợp
Phép giao của R và S
– Ký hiệu R S– Là một quan hệ gồm các bộ thuộc R đồng thời thuộc S
Trang 342.2.3 Phép trừ
Cho 2 quan hệ R và S khả hợp
Phép giao của R và S
– Ký hiệu R S– Là một quan hệ gồm các bộ thuộc R và không thuộc S
Trang 35R S
Trang 36D + +
+ +
+ - -
-
-R S
Trang 372.2.5 Phép chia
cho thỏa với tất cả các bộ trong quan hệ S
tRR thỏa 2 điều kiện
• tR(Y) = t
Trang 383 1
1 1 1
1 1
Trang 392.3 Các phép toán trên ĐS quan hệ
Phép chiếu
Phép kết nối 2 quan hệ
Các phép kết nối khác.
Trang 40C 1 1 1
Trang 41Phép chiếu (tt)
Phép chiếu không có tính giao hoán
A1, A2, …, An (A1, A2, …, Am (R)) =
X,Y (R) = ? X (Y (R))
= R(A1, A2, …, An)
A1, A2, …, An (A1, A2, …, Am)
Trang 42Ví dụ
Cho biết Họ tên và Lương của các nhân viên
HONV, TENNV, LUONG (NHANVIEN)
Trang 44Ví dụ (tt)
Cho biết mã nhân viên có người thân và có tham gia
đề án
Cho biết mã nhân viên không có thân nhân nào
MANV(PHANCONG) MANV(THANNHAN)
Trang 45Ví dụ (tt)
Cho biết mã nhân viên có người thân và có tham gia
đề án
Cho biết mã nhân viên không có thân nhân nào
MANV (PHANCONG) MANV(THANNHAN)
MANV(NHANVIEN) - MANV(THANNHAN)
Trang 462.3.2 Phép chọn (Selection)
Được dùng để lấy ra các bộ của quan hệ R
Trang 472.3.2 Phép chọn (tt)
Kết quả trả về là một quan hệ
– Có cùng danh sách thuộc tính với R
– Có số bộ luôn ít hơn hoặc bằng số bộ của R
D 7 7 3 10
Trang 492.3.2 Phép chọn (tt)
Ví dụ 1: Cho biết các nhân viên ở phòng số 4
– Quan hệ: NHANVIEN(MANV, HONV, TENNV, PHG,…)– Thuộc tính: PHG
– Điều kiện: PHG=4
PHG=4 (NHANVIEN)
Trang 502.3.2 Phép chọn (tt)
Ví dụ 2: Tìm các nhân viên có lương trên 2.5tr ở
phòng 4 hoặc các nhân viên có lương trên 3tr ở phòng 5
– Quan hệ: NHANVIEN(MANV, …, LUONG, PHG, ….)– Thuộc tính: LUONG, PHG
Trang 51• Có dạng Ai Bj
• Ai là thuộc tính của R, Bj là thuộc tính của S
• Ai và Bj có cùng miền giá trị
• là phép so sánh , , , , ,
Trang 522.3.3 Phép nối (Join)
Nối theta ( theta join ) là phép nối có điều kiện
– Ký hiệu R C S– C gọi là điều kiện nối trên thuộc tính
Nối bằng ( equi join ) khi C là điều kiện so sánh bằng
Nối tự nhiên ( natural join )
• Ký hiệu R S hay R S
• R + S +
• Kết quả của phép nối equi join bỏ bớt đi 1 cột giống nhau
Trang 53C 3 6
C 3 3
Trang 54C 3 6
C 3 6
R C=S.C S
Trang 55C 3 6
C 3
S.C
3
D 1
C 3
D 1 2
Trang 562.3.4 Các phép kết nối khác
Phép nối nội (Inner Join)
– Thực chất là phép equi join, chỉ khác ở chỗ giữ lại của
2 thuộc tính ở quan hệ kết quả (kể cả trường hợp trùng tên)
C 3 6
C 3
D 1
Trang 57 Phép nối trái (Left join)
– Lấy các bộ của quan hệ bên trái ghép với các bộ củaquan hệ bên phải nếu có giá trị giống nhau trên 2 thuộctính kết nối Nếu không tìm thấy giá trị thỏa thuộc tínhkết nối ở bộ bên phải thì đặt giá trị NULL vào kq
C 3 6
3 6
1 2 null null
C 3 6
C=D
Trang 582.3.4 Các phép kết nối khác (tt)
Phép nối phải (Right join)
– Giống phép nối trái nhưng ưu tiên lấy tất cả các bộ củaquan hệ bên phải
2 6
1 2
C 3 6
C=D
Trang 59Bài tập
Cho các quan hệ R1, R2, R3 Hãy cho biết kết quả
khi thực hiện các phép toán sau:
Trang 60CHUYỂN ĐỔI
MÔ HÌNH E/R LƯỢC ĐỒ QUAN HỆ
Trang 61Quy tắc 1
Mỗi tập thực thể (Trừ tập thực thể yếu) chuyển thành các quan hệ có cùng têntrừ tập thực thể yếu và tập thuộc tính
NHANVIEN(MaNV, TenNV, hoNV, NS, Dchi, GT, Luong)
PHONGBAN(TenPhg, MaPhg)
Trang 62Quy tắc 2
Giữa 2 tập thực thể có mối quan hệ 1-1
– Thêm vào quan hệ này thuộc tính khóa của quan hệ kia– Hoặc thêm thuộc tính khóa mới vào cả 2 quan hệ
Trang 64Quy tắc 4
Mối quan hệ N-N
– Tạo một quan hệ (bảng) mới có:
• Tên bảng là tên của mối quan hệ
• Các cột là những thuộc tính khóa của các tập thực thể liên quan
DEAN
TENDA
DDIEM_D A MADA
Trang 65Quy tắc 5
Đối với các tập thực thể yếu
– Chuyển thành một quan hệ
• Có cùng tên với thực thể yếu
• Thêm vào thuộc tính khóa của quan hệ liên quan
THANNHAN(MANV, TENTN, GT, NS, QUANHE)
THANNHAN
TENTN GT NS
QUANHE
Co_than_nhan
(1,1) (1,n)
Trang 66Quy tắc 6
Thuộc tính đa trị
– Chuyển thành một quan hệ có cùng tên với thuộc tính
đa trị– Thuộc tính khóa của quan hệ này là khóa ngoài của quan hệ chứa thuộc tính đa trị
BANGCAP(MANV, BANGCAP)
NHANVIEN(MANV, TENNV, HONV, NS, DCHI, GT, LUONG, DCHI)
Trang 67Quy tắc 7
Đối với nhứng mối liên kết đa ngôi (n>2)
– Chuyển thành một quan hệ có cùng tên với tên mối liên kết đa ngôi
– Khóa chính là tổ hợp các khóa của tập các thực thể tham gia liên kết
Trang 68Tổng kết
ER
– Loại thực thể – Quan hệ 1:1, 1:N – Quan hệ N:M
– Quan hệ đa ngôi – Thuộc tính
– Thuộc tính phức hợp – Thuộc tính đa trị
– Tập các giá trị – Thuộc tính khóa
Mô hình quan hệ
– Quan hệ thực thể – Khóa ngoài
– Quan hệ với 2 khóa ngoài – Quan hệ với n khóa ngoài – Thuộc tính
– Tập các thuộc tính đơn – Quan hệ với khóa ngoài – Miền giá trị
– Khóa chính (khóa dự tuyển)
Trang 69(1,1) (0,N)
(0,1)