Với ưa điểm về tính cấu trúc và khả năng hình thúc hoá phong, phú, CSDL quan hệ để dàng, amé phỏng các hệ thống thông tin đa dạng trong thực tiễn, làm tăng khá năng xử lý, quân trị và k
Trang 1DAI HOC QUOC GIA HA NOI TRƯỜNG DẠI HỌC CÔNG NGIIỆ
VŨ CHÍ QUANG
_ NGHIÊN CỨU
MOT SÓ KHÍA CẠNH LÝ THUYẾT
TRONG MÔ HÌNH CSDL QUAN HỆ
TUẬN VĂN THẠC SĨ
HA NOI — 2007
Trang 2
1.1 Phương pháp thiết kế Bottom — Up 5 1.1.1, Các khỏi niệm cơ bản: -5
1.1.2 Các phép toán trong mô hình quan hệ 7 1.1.3, Phụ thuộc hảm HHhrHerierrereerroeou.Ð 1.1.4 Lý thuyết chuẩn hoa 18 1.2 Phương pháp thiết kế Ứop Down _
1.3 Quá trình thiết kế cơ sở dữ liệu 26
Chương LÍ - LÝ THUYET KỨT NỘI VÀ NỬA KẾT NÓI ÙNG DỤNG TRONG TỎI ƯU HOÁ CÂU HỎI - 28 2.1 Lý thuyết kết nối và một số kết quả của lý thuyết kết nỗi 28 2.1.1 Kết nỗi không mỗi thông tím 28
2.1.2 Kết nỗi mắt thông tỉn o5 1.30
nữa kết nỗi ứng đựng trong cơ sở ie Wau ph n lắn.38 39 41 4 2.3 Tdi tu hoá câu hỏi trong cơ sở đữ liêu phân tán 42 2.3.1 Khải quát về cơ sở dữ liệu phần tán —
2.3.2 Một số nguyên lý chung của tối tra hoá câu hỏi 52 2.3.3 Tôi ưu hoá câu hỗi 71
Chương LII - MỘT BỘ BÀI TOÁN NE-U TRONG MÔ HỈNH QUAN HỆ 106
3.1 Tẳng quan về thuật toán và đánh giả thuật toản — —
3.1.1 Khải niệm thuật toán co se — -
3.1.2 Các tính chất của thuậi toản - 107 3.1.3 Tai mỗ hình tính toán 108 3.1.4 Khái nệm độ phức tạp Thuật toán - - 108
3.1.5 Phép quy dẫn (dẫn về được) eeeerrersrreeeeoee, TÔ 3.1.6 Phan lop bai toán theo độ phú 11 3.1.7 Cấu trúc của lớp P, NP „112
3.2 Một số bài toán NP-C trong mỏ hình quan h -ee.114 3.2.1 Tãi toán siêu khoá só lực lượng không quá m - 114
Bài toán quyết định thuộc tính khoá bay không khoá 7 120
TAL LIBU THAM KHAO accesses sssiusseimastiasetssimissensanasensans L2D
Trang 3to
DANITMỤC CÁC HÏNI VẼ
Hình 1.2 Biểu dỗ H-R cho CBDL công ty .ceieieeiieeeie.2
Hình 3.1 Đỏ thị biểu diễn lược dò quan hệ R 5 sesesses3T
linh 2.2 Dồ thị con bị cẳm nen He kneereerisoarreooo4
Hình 3.4: Kiến trúc các lược để của một CSDL phân tán 46
linh 2.5: Kiến trúc chức năng của một hệ QTCSDL, phân tán A?
Hinh 2.6: Các kiểu phân đoạn của một quan hệ 49 Hình 2.7 Lược đẻ tổng quát xử lý truy vẫn phân tản Sseeeses SỐ
Hinh 2.9 Đề thị truy vấn không liên thông, - - 63 Hình 2.10 Ví dụ về cây truy vẫn co eeccececrerrrerrerrrisereee Ô
Hình 2.13 Cây truy vẫn sau khi thay thể csereeseessssssssissse.e Ñ
Hình 2.14 Rút gọn phân đoạn ngang (với phép chọn) - 68 Hình 2.15 Rút gọn phân đoạn ngang (với phép nối) - - 69 Hình 2.16 Rút gọn phân doạn đọc si cnsnnereirierrereeeirrro TÔ
Tlinh 2.17 Rut gon phan đoạn hỗn hợp 2 "AM
Hình 2.19 Các cây nỗi tương, Ổương, coi
Tlinh 2.20 Dé thị nỗi của cây truy vẫn - - 84
Hình 2.21 Các thử tự nói khác nhau eccccesee peeves ene BE
Llinb 2.22 Dé thi ndi otia cay tray van phan tn cece eee seo BỘ Hình 2.23 Truy vẫn mẫu và số liệu thông kê 99 Hình 2.34 Đề thị câu truy vấn don và số liệu thông kế - - 102
Hình 3.1 Sơ đỗ mình hoa các lớp bai toán MP, NP-C, NP-Hard 114
Trang 4từ những năm 60 của thể kỹ X% đến nay, các hệ cơ số đữ liệu ngày cảng phát triển
và hoản thiện, nhiều thể hệ quản trị CSDL đã ra đời, tạo ra nhiều sắn phẩm ứng, dung trong khoa học kỹ thuật, các ngành kinh tế cũng như trong đời sống xã hội
Việc nghiên cửu CSDL trên thể giỏi và ở trong nước đã và dang phát triển ngây cảng phong phú, đa dạng Từ những năm 70, l⁄F Codd di dua ra mé hinh dit
liệu quan hệ tạo một cơ sở vững chắc cho các vấn đề nghiên cứu về CSDL Với ưa
điểm về tính cấu trúc và khả năng hình thúc hoá phong, phú, CSDL quan hệ để dàng, amé phỏng các hệ thống thông tin đa dạng trong thực tiễn, làm tăng khá năng xử lý, quân trị và khai thác đữ liệu, phục vụ được bảu hết các yêu cầu của người sử dụng, Trên thực tế, đã có nhiều hệ quân trị CSDI, xây dựng trên mô hình CSDTL, quan hệ
được sử đựng phổ biến trên thị trường như: DBASE, FOXPRO, ORACLI, MS
SƠI.,
Cho dén nay CSDL quan hệ dã thu được rất nhiều (hành tựu sâu sắc cả về
phương điện lý thuyết và ứng đụng Phân lớn các hệ quản trị CSDL sử đựng trong
thục tiễn được thiết kế trong mô bình quan hệ, rất nhiền sản phẩm phan mềm được
tạo ra vẫn dang sử dạng rộng rãi và có hiệu quả Việc tiếp tục nghiền cửu các khía
cạnh lý thuyết trong mô hình CSDL quan hệ sẽ tạo điều kiện thuận lợi cho việc
như: CSDI, phân tán, CSDI niphiền cứu và phát trie: ử mô hình cơ sở đữ liệu ru
Trang 5~ Nghiên cứu sâu sắc vẻ lý thuyết kết nỗi và nửa kết nổi, ứng dụng lý thuyết kết nổi và nứa kết nỏi trong tối ưu hoá câu hỏi, đặc biệt lá trong tôi ưu hoá cầu hỏi
phan tan
- Nghiên cửu dộ phức tạp của các thuật toán trong CSDL, giới thiệu một số bài toán trong CSDL là NP-C
Nội dụng của bản luận văn này dược chúa làm 3 chương
Chương 1: Lý thuyết thiết kế cơ sở dữ liệu quan hệ Chương nảy trình bảy
vẻ các phương pháp thiết kế cơ sở đữ liệu quan hệ, quy trình thiết kế và cáo van dé
liên qua như: các phép loán trơng mô hình quan hệ, phụ thuộc hàm và chuẩn hoá
Chương II - Lý thuyết kết nói và nửa kết nổi Ứng dung trong tôi un hoa
câu hỏi Đây là chương chính của luận văn; rong chương này trình bảy các vẫn dé
về lý thuyết kết nếi nhụ: kết nổi không mất thông ñn, kết nói mất thông tín, điều
*kiện cần và đủ để kết nối không mắt thông tin Phản tiếp theo trình bảy về phép nửa kết nói, tính chất và ý nghĩa của nữa kết nối ứng dụng trong cơ sở dữ liệu phân tân
Phần cuỗi cùng trình bảy các vẫn dễ ứng dựng lý thuyết kết nội và nữa kết nói trong, tối ưu hơả câu hỏi phân tàn như: khai quát về CSDL phan tan, các van để về tối ưu thoá câu hồi, các thuật toán đề tối ưu hoá câu hỏi trong môi trường lập rung va mdi
trường phân tân
Chương 1H - Một số bài toán NP-C trong mô hình quan hệ Chương nảy trình bảy một khía cạnh lý thuyết trong cơ sở dữ liệu, đỏ là đánh giá độ phúc lạp
của các thuật toán trong các hệ cơ sở dữ liệu, vẫn dễ này it dược dé cập trong các
sách về CSDL va chỉ được giới thiệu trong các bài báo hoặc trong cáo sách nghiên cứu sâu về lý thuyết thuật toản và độ phúc tạp của thuật toán Ngoài ra trong
chương nảy còn giới thiệu một số bài toán cụ thể trong cơ sở dữ liệu là NP-C
Mặc du đã rất cổ gắng đẻ hoàn thành bản luận văn này, nhưng chắc chắn vẫn
Trang 6
phương pháp Top — Down (trén — xuống)
Theo phương pháp Betom — Up: Mục đích của việc thiết kế ca sở đữ liện
quan hệ là đưa ra một tập các lược dé quan hệ để lưu trữ các thông Lin của một lỗ chức xi nghiệp, ngân bảng, dại học, một cách không dự thừa đẳng thời cũng cho phép cập nhật, truy van dé dang Dé dat được mục đích đó khi nghiên cứu và khâo sát bài toán quản lý trong thực tiến; la phải xác định các thuộc lĩnh cần quân lý, ruối
quan hệ giữa các thuộc tỉnh (các phụ thuộc hàm), tiếp theo lá chuẩn hoá các lược đồ quan hệ, thực chất là thực hiện cáo phép tách để có được các lược đồ theo các đạng, chuén (INF, 2NF, 3NF, BCNF, 4NF, SNF); tuy nhiên các phép tách phải đâm bảo
các điều kiện như: bảo toán thuộc tính, báo toản phụ thuộc hảm, không mất mat
thông tin
Theo phương pháp Top Dowr: Khi nghiên cửu vả kháo sát bải toản quản lý
trong thục tiễn, ta phải xác định các đối tượng của cơ sở đữ liệu và rỗi liên hệ giữa các đổi tượng: tiếp theo là mô hình hoá thanh các kiểu thực thế, kiểu liên kết, xây
đựng lược đỏ thục thể liên kết ER; cuối cùng là áp dụng các nguyên lắc chuyển Lir
m6 hinh thực thế liên kết ER sang mô hình quan hệ
1.1 Phương nhắp thiết kế Bottam — Úp
- Thuộc tính: Thuộc tỉnh của một quan hệ là cột của băng quan hệ Trong,
mê hình quan hệ không cho phép thuộc tính phúc hợp, đa trị Chỉ được là thuộc tính
Trang 7- Lược dồ quan hệ Mô tả câu trúc của một quan hệ, được ký hiệu là R(Au,
Ag, , Aq) trong dé R [a tn quan hé va A; G=L n) la các thuộc tính
Vide Tage dd quan hệ
TNHANVIEN( IOTTN, MSBIIXII, DIACHI, LUONG, GIOITINH, NGAYSENII)
~ Quan hệ: Là một tập cơn của tích Descartes ctia danh sách các miễn giá trị,
được ký hiệu lá: r={t, ta, tạ} c DOM(A,) x x DOM(A,),
1 Một quan hệ chính là một bảng hai chiều:
+ Số các thuộc tỉnh của quan hệ là số ngồi của quan hệ
1 Thứ tự các đòng, các cột trong bảng quan hệ không quan trọng,
+ Che giá tri trong bing phải đơn trị và phủ hợp với kiểu đữ liệu cửa thuộc
tinh (ky ty, sé, Logic, Ngày)
!_ Dữ liệu của quan hệ có thế thay đổi theo thời gian do thường xuyên phải
cập nhật dữ liệu:
~ Lược đỄ CSDT; Là một tập các lược đỗ quan hệ ký hiệu là
S— {Ri Ra, Rm}, trong đó Rị (—1 m) là một lược đề quan hệ
- CSDL Quan hệ: Là một tập các quan hệ kỷ hiệu là:
DB = {n,m , tu}, trong đó r; (ä=1 rn) là quan hệ (thể hiện của Rị)
- Siéu khod (8K): SK được gọi là siêu khoá tiếu với mọi bụ l; r ri t;[SK] Z
1; [SK]
Trong đó:
¡_8K: là một hoặc nhiều cột (thuộc tính) trong bảng
+ ly, ly là các bộ giá trị của mỗi hàng trong bằng,
+ tị[SK], b[SK] theo thứ tự là các bộ giả trị của SK tương ứng với các bộ tụ, tr
Trang 8- Khoả ngoài (FK): Một nhỏm các thuộc tính gọi lá khoá ngoài (I'K) của một
quan hệ r1 tham chiều đến quan hệ r2 nêu miễn giá trị FK của rl phải giống miễn
piá trị PK của r2
- Rang buge:
+ Rảng buộc miễn: vị c DOM(A)
+ Rảng buộc Khoả: Giá trị của khoả phải duy nhất
1 Tảng buộc toàn vẹn thực thế: Giá trị của khoá chính (PK) phải xác định (không có giá trị nuÏ)
+ Rảng buộc toàn tham chiếu:
© Nếu Khoá ngơài của Rị tham chiếu đến khoá chỉnh của R thì phải có
củng miễn giá trị với khoá chính của l;
® Mỗi giả trị của Khoả ngoài cúa Rị hoặc là phải có mặt trong khoá chính
của Rạ hoặc là nhận giá trị NuÙl (với ngữ nghữa là một giá trị tồn tại
nhưng không, biết)
1.12 Các phép toán trong mö hình quan hệ
1.1.21 Pháp toán cập nhột
-_ Pháp chèn (INSERT): Là phép thêm một bộ (bản ghỉ) vào quan hệ r
-_ Pháp loại bã (DELETE): Là phép loại bỗ một bộ ra khôi quan hệ r
-_ Pháp cập nhật (UPDATE): La phép thay déi gia trị của cáo thuộc tính
trong tuột hoặc một số bộ nào đó
1.122 Dại số quan hệ
-_ Cúc phép toàn tập hợp: Cúc quan hệ tham gia một phép toán tập hợp
(hợp, giao, trữ) phải có củng cầu trúc,
+ Phép hợp r (/s: Thực chất của phép hợp là xây dựng một tập các bộ thuộc
quan hệ r hoặc quan hệ s hoặc cả 2 quan hệ.
Trang 9Phép hợp được ký hiệu và dịnh nghúa là:
+ Tích Descartes r Xs: Tich Descartes ciia hai quan hé chi xét trén cde lược
đồ rời nhau (nếu hai lược đổ có thuộc tính cùng tên thi ta có thể đối tên thuộc tính cùng lên của một trong la lược để, để bai lược đỗ rồi nhau) Cho hai lược đổ
RA, A¿, ., Aa| và 8={Hụ, Hạ, ., Bạ), r và s là hai quan hệ trên R và S tương
vg Tích Descartes của hai quan hệ r và s là một quan hệ q Mãi bộ trong quan hệ q
ky higu tụ là ghép một bộ t, er voi mat bd t, Es; trong dé 1, = (4, 4s, ., aa), ty = (bị,
Bay oe Din)s ty = (Bre Aas + as Dy, ba, ., Đại),
Tích Descarles dược ký liệu và định nghĩa là
rx s= {t]t=(ay, ag ag, By, Bas, Day), Cp, A2, AVEL VA (Oy, By, BES}
Như vậy nếu r có x bộ, s có y bộ thì q có x * y bộ,
+ Phép chia rs: Cho lược 48 RB ={Aq, Ao, , An}, SCR, rvas la hai quan
hệ trên R và S tương ứng Phép chia của quan hệ r cho s được một quan hệ q trên
luge 44 R-S sao cho mai bộ t e q ghép với mọi bộ tu € s ta được một bộ <Lu> e
+
Thép chia được ký hiệu và định nghĩa là:
r+s=ftl moiues,<tu> er}
Trang 10Phép chiều được ký hiệu và định nghĩa là
Lixtt) = (XI | ter}
- Phép chọn Ø-sèu ae(P): Thực chất của phép chọn là xây dựng một tập
cơn của quan hệ thoả mãn điều kiên xác định <Điều kiện> chính là một biểu thức
logiø; ta có thể sử dụng các phép toán sơ sánh: <=, <> và các phép toán
logie như: and (^), or (4), not (¬) để tạo các biểu thức điều kiện thoả mãn các yêu cầu của người sử dụng,
Phép chọn được ký hiệu và định nghĩa là
<Điều kiện>{ t ) = true }
Øawiuage(E) = {tÍ tc r
- Pháp nỗi rqulEkn»s: Thực chất của phép nối là phép chọn của quan hệ (r X
s) theo điều kiên xáo định Trong đó: r x s là tích Descartos, <Diều kiện> là một
biểu thức logic xác định điều kiện nói giữa hai quan hệ r vẻ s theo 6, (6 là một trong
gác phép toán so sánh , 1% < ,<>) dược ký hiệu la: Av Bị (Ai cr, Bị c s,
A¡ và Bị phải có củng miễn giá tị)
Phép nổi được ký hiệu và định nghĩa là:
T <plNfiea> S = O«pieu kim 2 X S)
-_ Phép nỗi tự nhiên: Khi cáo quan hệ r và s có chúng một số thuộc tính
(cùng tên và có cứng giá trị thuộc một miễn nào đó) thì phép kết nói r và s theo điều kiện các thuộc tính dé bằng nhau và một trong hai thuộc tính giếng nhau duợc loại
bỏ trong quan hệ kết quả thi phép kết nối này được gợi là phép kết nổi tự nhiên và
được ký hiệu là r4
Pháp nữu nÃt r< s: Thực chất của phép nửa nỗi là phép chiếu lên R của + ‹alÃl¿„- s Kết quá của phép nữa nổi một quan hệ r với mệt quan hệ s theo điều kiện nào đó là một quan hệ gồm tất cả các bộ thuộc r cé tính chất kết nổi được theo
điều kiện với mội bộ nào đó trong quan Hệ s.
Trang 11Phép nửa nối dược ký hiệu và dụnh nghĩa là:
1 ><s — Thứ 2p Hạc 8)
1.1.3 Phụ thuộc ham
1.141 Khải niệm phụ thuộc làm:
Phụ thuộc hàm trên một lược để quan hệ là một khải niệm có tim quan trong tiết sức lớn đôi với việc thiết kế cơ sở đữ liệu
Một phụ thuộc ham là một phát biểu ký hiệu ø: X —> Y, trong đỏ œ là tên của
phụ thuộc hàm, X vả Y là các tập thuộc tỉnh
Xét phụ thuộc hàm ơ: X -> Y trong luge dé quan hé R, voi R={A), A,
Aa} là lập các thuộc tính, X và Y là lập con của R, X ss Y— Ø Khi đó la nói Ä xác
định ham Y hay Y phụ thuộc hàm vào X néu Vụ, ty là các cặp bộ xác định trên quan
bệ r mà tị[X] = t;[X] thả tị[Y] = tị YỊ
1
32 Hệ tên để Armstrong
Trước khi đi vào trình bảy hệ tiên dễ cho phụ thuộc hàm, chủng ta sẽ xem xét
xột vải khải niệm liên quan đến các phụ thuộc ham trong lược để quan hệ
Goi F là lập c
phụ tuiộc hãm cho trước đúng trên luợc đồ quan hệ R, và X
—> Y là một phụ thuộc hàm với X_Y của lập các thuộc tỉnh
- Suy diễn logic: Nói rằng, ÄX- > Y được suy diễn logic từ E néu môi quan hệ r
trên lược đồ quan hệ T thoả cáo phụ thuộc hàm cửa E thì cứng thỏa X > Y
- Bao đông của lập phụ thuộc bảm: Gọi F 1a bao đông của , tức là tập tậL
cả các phụ thuộc hàm dược suy diễn loeic tir F
Tẻ có thể xác định khoá của một kược để quan hệ và các suy điển logic giữa các phụ thuộc hảm cân thiết phải tính được F' ti F Do đó đổi hỏi phải có hệ tiên
Trang 12và đây đủ trong [3] (chương 7, tập I)
Ta có một kết quả quan trong sau
Định lý 1.1: Hệ tiên để Armstrong là xác đáng và đây đủ
Chứng minh : Dịnh lý này đã được chứng mình đây đủ trong [3] (chương 7, tập 1U)
Tử hé tién dé Armstrong suy ra một số ludt mé rong sau:
- Luft hop: Néu XK > Yva K > Z thiK 3 YUZ
- Luật tựa bắc cầu: Nếu X > Yva YUW > Z thiXuW>Z
- Luật tách: X —z Y và Z = Y thì X —z Z
Chứng mình : Các luật mở rộng này đã được chứng mỉnh đây đủ trong [3] (chuong 7, tap II)
1.1.3.3 Buo đẳng cña một tập thuậc tỉnh :
ao đồng của X đỗi với F gọi là X”, tức là tập tất cá các thuộc tính phụ thuộc vào X thông qua F, Cho §= <Q, F> lá một lược đỗ quan hệ và X c 2 Bao
đóng của X dối với E được dịnh nghĩa :
Thuật toản sau sẽ xác định bao đóng của tập các thuộc tỉnh
Input :X¢ Ova F li lap cde phu thude ham của lược đỗ quan hệ 8 <@, F> Output TỔ”
Trang 13“Nhận xét: Độ phức tạp của giải thuật là O(r.p) với n — số thuộc tính và p ~
số các phụ thuộc hảm
- Cho lược dễ quan hệ:
R(MASORNV, IIOTEN, MSDUAN, TENDA, DIADIEM, SOGIO}
Tap cde phu thude ham F
MASONV > HOTEN
MSDUAN > TENDA, DLADLEM
MASONV, MSDUAN — SOGIO
- Tinh X' của về trái các phụ thuộc ham:
MASONV” = MASON V, HOTEN
MSDUAN *= MSDUAN, TENDA, DIADIEM
{MASONV, MSDUAN}' = MASONV, MSDUAN , SOGIO, HOTEN, TENDA, DIADIEM
1.1.3.4 Củch mic dink khod:
Trong lý thuyết thiết kế cơ sở đữ liệu quan hệ, việc xác định khoá của một
luge đỗ quan hệ là ruột bài toán quan trong Sau đây tác giả xin trình bảy một số kết
quả liên quan đến việc xác dịnh khoá của một lược dé quan hé
- Định lý của các tác giả Hỗ Thuần và Lé Van Bao cho một điều kiện cẩn để fap Xc Q là khoả của một lược đỗ quan hệ [2]
Định lý 1.2:
Cho 8 <G F> là một lược để quant hé, tap cae thuộc lính 3 {A¡, ,A,}, lập
cáo phụ thuộc hảm I = {Lj oR, L;, Rị c ©, Lí ¬ Rị = Ø, i=1, p), Diễu kiện cân
để XeG@ là khoá lược đỗ S là
(AB cK CAB ULAR)
trong dé L= (Jz, R= JR,
Ching mink:
Trang 14Đằng phương pháp chứng minh phản chứng, ta giả sử X ¬ (RL) / Ø Khi
đó tên tại một thuộc tính A sao cho A e X, A e Rvà A ơL
Đo X là khoá nên tà có X —> T,
Đo A £L ta có (XY {A}) ->L
Mitkhac tacoL >RvaR >A
Áp đụng quy tắc bắc edu ta cé (X\{A}) A, điều nảy trải với giả thiết X là
khoá
Vay dink lý được chứng mình
Từ định lý 1.2 ta có thể suy ra được các hệ quả sau:
Hé quá 1: Cho 8= < ©, F > là một lược dễ quan hệ Nếu R \ L / © thi tan tai mot
khoá X sao cho X#
khoá duy nhật của lược dé 5
- Thuật toán xác định một khoá của lược đồ [2]
Jnput : lược đỗ quan hệ < Q, F >
Ouipzf : một khoá của < €1, T >
Thuật toán 1.2 (Xác định một khoá của lược độ)
Bude 1: X:- Q\R,
Trang 15Tước 2: Néu X* = G thi chuyén sang bước 5;
Bude X: (RYU VR),
Bude 1: Voi moi A; ¢ L ^¬ R thực hiện
+Néu X40 thiX = Xv {A},
Tước 5: Kết luận X là khoá
- Đũhh lý của các tae gia Lucchesi va Osborn cho phóp xây dựng thuật loan
tìm tật cả các khoả của lược đồ quan hệ S = <€3, F> [2]
Dinh ff 1.3 (Lucchesi va Osborn)
Cho § = <Q, E> là một lược để quan hệ Gọi K là một tập khác rỗng các
khoá của 5 Diễu kiện cần và đủ để họ 2P \ K có chứa khoá của 5 là có tổn tại một
phan ti KeK va tén tai mat phu thudc ham (Lio + Rio) € F sao cho tap T = Lio (K\ Rp) không chứa phần tử nào thuộc K, (ở đây 2° ký hiệu họ tất cả các tập con
của Q)
Chứng mùi
+ Điều kiện đủ
Giá sử tổn tại KeK, (jg Rig) © F sno cho sao cho tap T Tae€K 3 Rạ)
không chứa phân tử nào thuộc K Dễ thấy T là mệt siêu khoá va phải chứa ít nhật
một khoá của 5 Vi T không chứa một khoá nào của K, Vậy T phải chứa một khoá
Thuộc họ 2°, Nói cách khác 2 \ K có chứa khoá của 5
¡ Điều kiện cản
Giả sử 221 K có chữa khoá K” của 8 Gọi K”” là tập tôi dại thoá mãn hai tính chất sau
i) _ K” không chứa phản tử nào của K
Để thấy siêu khoá K”” như vậy bao giờ cũng tổn tại (do tỉnh chất i)
Do tinh chat ii) K” < 2, va trong quả trình tính bao đóng, rõ ràng tổn tại phụ
w EK"
thuge ham Lig »Rjp sac cho
Trang 16
Kết hợp với Lip CK”, ta 06 T= Lyy UK Ry) CK’ Diễn đó chứng tổ sự
tổn tại của K ©K và sự Lin tai eda (4g Rig) © F sao cho tập T không clưm khoá
nao thude K
~ Thuật toán xác định tập tắt cả các khoá cửa lược đề quan hệ S=<4, F> dua
vào định lý 1.3 ( Lucchesi va Osborn) và thuật toán L.2 @ác định mệt khoá của lược
dé) 12, 3)
Taput : luợc đồ quan hé <Q, F >
Ouiput : Tap K, tat cả các khoả của 3
Thuật toán 1.3 (Xdc dinh tap tat cd cdc khoa cia here dé}
1 K,:r- FK| K là một khoá của lược dò < @, E > và K chứa trong siêu
6 For each Hin K, do
7 Mf HOM then Test ;= False ;
8 If Test tien K,:=K, ©2{KIK là một khoả của lược đổ <€3,†>
và K chúa trong T}
9 end ;
10 end
11 Return K, 1.1.3.5 Phủ của tập các phụ thuộc bằm:
Cho hai tập phụ thuộc hàm T và G trên tập các thuộc tính Q Ta nói T phủ Ở
Tiêu Œ ¢ F
Trang 17Định nghĩa (bai tập phụ thuộc bàm tương dương): Chơ hai phụ thuộc hàm F
va G G và l được gọi là tương đương nếu GÌ = IỶ, khi đó ta nói G là một phú của
E và ngược lại F cũng là một phủ của G
Định nghĩa (phú tối tiểu): Cho G là một tập phụ thuộc hảm F dược gọi là một phủ tối tiêu của G nếu thoả mãn các tính chất sau:
1.136 Tỷ thuyết phân tách:
- Khái niệm phép tách: Cho R(A+, A;, A„) là một lược đồ quan hệ Một
phân tách của R là việc thay thể lược dé R bằng một họ các lược để con
p (Ri.R¿ Ra)
sao cho (JR, =R
a Cho p = (R,, R„) là một phân tách của lược đỗ quan hệ RCAu, Au) và r
là một thể hiện của lược dỗ quan hệ <, E> Gọi m„() lá ánh xạ dược xác định bới:
w(t) — Pt ><) P<
Trong đó: tị —TIyG) vớii— 1,2, m
và P<l ký hiệu phép kết nỗi tự nhiền
Trang 18tách bảo toàn thông tín nhung không bảo toàn tập phụ thuộc hàm E vả ngược lại
- Phân tách không mắt thông tin
Định nghĩa: (Phân tách không mật thông tin)
Phan tach p (Rị, Rạ, R„) được gọi là phân tách có kết nối không tổn thấL
(tức không mật thông tin) của lược đỗ quan hệ <R, F> nếu rhư với mọi r lả (
cua R ma thod F thi :
FOND Pd Dette (oT p(t)
Đẻ kiểm tra một phân tách mắt thông ti hay không ta sử dụng thuật toán:
Input: Taroc 4 quan hé < RB, F >, phan tach p (Ry, Ra, -., Re
Output Cho câu trả lời sai hay đúng tuỷ thuộc phần tách p có mất thông tin
không ?
Thuật tuản 1.4 (Kiểm tra mội phần tách có mất thông tìn hay không)
Bước 1: Lập bảng ban dau là ma trận m hang (img với m luge dé con Rj) va
1 cột (ứng với tập thuộc tính {Ax, A›, Aa}) Phản tử hàng ¡, cột j (¡, j) của ma trận
được xác định theo công thức sau:
J8; nÔUA¡ €R,
OD, nÔtA, Z R,
trong dé a;, bụ e Dom(Aj)
ước 2: Biến đối bảng
Mục dích của việc biển dổi bãng là để cuối cùng thu dược một bảng, xeIt băng đỏ như một quan hệ, thoá tập phụ thuộc hảm I, Muốn vậy ta lần lượt xét các
phụ thuộc hảm ÄX > Y thuộc F
Với mỗi phụ thuộc hàm như vậy nếu phát hiện trên bảng có hai hàng giống
nhau trên X vả khác nhau trên Y thỉ phải thay đổi bảng sao cho hai hàng đỏ cũng
giống nhau trên Y Việc thay đổi được thực liên (heo quy tắc
Trang 19© Néu một trong hai ký hiệu trên Y có dạng a¡ thì ký hiệu kía sẽ được đổi
thánh aị
® Nếu cả hai ký hiệu liên Y đều có đạng bụ thì lấy Inỳ ý một trong hai ký
hiệu đó và gán chung cho cả hai
"Tiếp tục lâm như vậy cho tới khi không thé biển đổi bảng được nữa Khi đó
ta thủ được bằng cuối cũng,
Bước 3: Nếu trong bảng cuỗi củng có chứa hàng gồm toản ky hiệu a (tức
Thang mì, a, ., ap), ta kết luận p— (ŒRị, Rạ, , Rạ) là phân lách không mất thông tin
(tức là cho cầu trá lời đúng) Trường hợp ngược lại p là phân tách mắt thông tin
Dinh if 1.4:
Che <B, I’ la mat hrge dé quan hé Khi dé p = (Ry, Ry) la phiin tach od két
sồi không tên thất (đối với 1) khi và chỉ khi
CRị Ry) > (Ri - By) hay (Ry Ra} (Ra - Ri)
- Phân tách bảo toản các phụ thuộc ham
Định nghĩa: (Hình chiếu của E lên tap thuộc tính Z)
Cho lược đỗ quan hệ <R, F>, và Z CR Tinh chiéu của F lên tập thuộc tính Z„ ký hiệu x„(F), dược định nghĩa là
mŒ) = {X —> Y| X— Y) eF và XY =Z}
Định nghĩø: (Phân tách bão toàn các phụ thuộc hàm)
Phan tach p = (Ry, Rạ, , R„) của lược đề quan hệ <R, F> được gọi lả phân
tách bảo toàn tập phụ thuộc hảm T nếu:
(Un, =F'
1.1.4 Lý thuyết chuẩn hoá
Khi thiết kế cơ sở đứ Hiệu quan hệ thường nảy sinh cáo vấn để như: dư thừa
dữ liệu, gây ra các dị thường cập nhật (thém, xoá, sửa bộ), cho nên các lược dé quan hệ nhất thiết phải được biến đổi thành các đạng phù hợp Quá trình đó được
gọi là quá trình chuẩn hoá.
Trang 20Việc đưa các lược đỏ quan hệ vẻ các dạng chuẩn là nhằm mục dich:
+ Tránh dư thừa dữ liệu
+ Tránh các di thường trong cập nhật dữ liệu
Với ý nghĩa đó ta thấy dạng chuẩn BCNE tốt hơn 3NF, 3NF tốt hơn 2NF, 2NF tốt hơn INF; và bức tranh vẻ trật tự các dạng chuẩn được mô tả như sau:
Hình 1.1 Bức tranh về trật tự các dạng chuẩn
1.141 Một số khải niệm trong chuẩn hod:
~ Thuộc tính khoá: Một thuộc tỉnh trong lược đỏ quan hệ R được gọi là thuộc
tính khoá nêu nó tham gia ít nhật một khoá của R Ngược lại được gọi là thuộc tinh
không khoả
~ Phụ thuộc hàm đây đã: Cho lược đỗ quan hé R; R={Ay, Ao, ., Ay} là tập
các thuộc tỉnh, X và Y là hai tập con khác nhau của R Y là phụ thuộc hàm đây đủ
vào X nêu Y lả phụ thuộc hảm vao X nhưng không phụ thuộc ham vao bat ky tap
con thực sự nảo của X Ngược lại ta nói Y là phụ thuộc hàm bộ phận của X
hảm bộ phân của X
~ Phụ thuộc bắc cẩu: Cho lược đỗ quan hệ R; {A¡, Ap, ., Ay } la tập các
thuộc tỉnh; X, Y, Z là tập con của tập các thuộc tính Ta nói phụ thuộc hảm X —> Y
Trang 2120
được gọi là phụ thuộc bắc cầu nêu tổn tại Z sao cho X Z, Z — Y Nêu không có
Z như
ly ta nói Y phụ thuộc hàm trực tiếp vào 5
1.142 Định nghĩa các dang chuẫn:
- Đạng chuẩn INE Một lược đồ quan hệ T được gọi là ö đựng chuẩn 1 (N#) nếu mọi thuộc tính của R là đơn, đơn trị không cỏ thuộc tính đa trị, nhỏm
thuộc tính đa trị (quan hệ trong quan hệ) [6]
- Dang chudn 2NF Luge đỗ quan hệ R ở dạng chuẩn 2 (2NE) nếu nó ở dang chuẩn 1 va moi thuộc tính không khoả của E dẻu phụ thuộc hảm dây đủ vào
xuột siêu khoá cửa R [2]
hận xét: Nếu một lược đỗ quan hệ l\ với lập phu thuge ham F & BCN thi
nó Ïà ở 3NF, tĐiều này đã được chứng mình trong [3])
1.143 Phân tách dica hược đề về các dạng chuẩn:
“Trong việc thiết kế sơ sở đít liệu quan hệ đởi hỏi các lược đồ quan hệ phải ở
các dạng chuẩn thích hợp đẻ tránh dư thừa đỡ liêu và các dị thường cập nhật Do đỏ đối với một lược đồ quan hệ <f, F> la mong mudn xác định một phân lách j — (Rị,
Ra, Rm) a0 cho p cd ba tinh chit sau:
? Có kếtnối không tổn thất (không mat mat thong tin)
ii) Bảo loàn tập phụ uộc hằm F
iv) Moi luge dé con Ry, Ry, ., Rn déu 6 SNF
~ Phân tách — hết nỗi không tôu thất về chudn BCNE
Để thực hiện phân Lách — kết nỗi không lẩn thất ta phân tách luợc đồ R thành
các lược dé con ở dạng chuẩn BCNE theo thuật toán sau:
Input: Luc 43 quan hé < R, F>
Trang 22Output: Mét phan tach co kết nổi không tốn thất p = (Ry, Hạ, Ryd Vol
cdc luge a6 thank phan R,, i= 1 m ở dang chuan BCNT
Thudt todn 1.5 (Phân tách kết nỗi không tốn that dua luge dé vé chuin BCNF)
Bước 2: Néu trong p có lược đỗ 8 = < R,, F, > vị phạm BƠNE, tức là tổn tại
phụ thuộc hàm X + A được thoả trên S, nhưng X không phải là khoá của S và AeX thủ phân tách 8 thành bai lược dỗ với tập thuộc tính tương ứng là XÃ và RMA}
ước 3: Thue hign lai bude 2 dén khi trong p khéng có lược dỗ nảo vi phạm BCNF thi vòng lặp kết thúc
~ Phân tách bão toàn phy thudc ham vé chudn INE
Thuật toán 1.5 không đâm bảo sinh ra một phân tách bão toàn tập phụ thuộc
bam ¥, é dam bao dẫu ra của phân tách lả bảo toàn tập phụ thuộc ham F ta phan tách lược đã R thánh các lược 46 con ở dạng chuẩn 3NF theo thuật toán sau:
Input: Lược đồ quan hệ <'R, F > với giả thiết là phả tối tiêu
Output: Mét phân tách của R bảo toán tập F sao cho mỗi lược đồ con đều ở
3NF đối với hình chiêu của E lên hược đồ cơn đó
Thuật tuần 1.6 (Phan tách về dạng chudn 3NF va bao toàn lập F)
Bước 1: Nếu có những thuộc tỉnh của R không xuất hiện trong bất kỳ một phụ thuộc hảm nào của F thì ta tách các thuậc tính đó thành mét hroc đề quan hệ và
loại chúng ra khỏi R
ước 2: Nếu tên tại một phụ thuộc hàm chúa tất cả các thuộc tính của R thì phan tach can tim chinh 1a R
Bước 3: Trong trường hợp còn lại, kết quả gồm các lược đỗ ứng với các lập
thuộc tính có dang XA cho mỗi phụ thuộc ham XA trong F Nếu trong T có các
Trang 2322
phụ thuộc hàm có củng về trái X + Ay, X Ag, ., K— Ay thi chung ta c6 thé str
dung lược đỗ XA¡Aa A; thay cho cáo lược đồ XA; với
Lp
Như vậy ta có thuật toán 1.5 đẻ phân tách kết nổi không tổn thất một lược dỗ quan hệ thánh các lược để con ở chuẩn IƠNH, vá thuật toán 1.6 để phân tách báo
†oàn tập phụ thuộc hàm E của một lược đồ quan hệ thanh các lược dé con ở chuẩn
3NF Vấn để đặt ra là có hay không một thuật loáu tạo ra một phân tách có cả hai
tính chất kết nổi không tổn thất và bảo toàn phụ thuộc với yêu cầu các lược đỗ con
chỉ ở 3NE ? Định lý sau đây khẳng định tổn tại một phép tách như vậy [3]
Định lý 1.5: (Phâu tách về đạng chuẩn 3E, có kết nói không tên thất và bảo toàn
tập phụ thuộc dữ liệu)
Gọi p là phân tách về dạng chuẩn 3NE và bão toán tập F được xây dung bởi
thuật toán 1.6, và gọi X lá một khoả của R Khi đó t= @X} +! p là một phản tách
của R trong đó mọi lược dé con đều là 3NE, phân tách đó bảo toán tập F và có kết nổi không tên thất
Chứng mảnh : Dịnh ý đã được chứng mình đây đủ trong [2, 3]
1.2 Phương pháp thiết kế Top — Duwn
Một cách liếp cận khác đổi với việc thiết kế cơ sở dữ liệu quan hệ, đó là cách thiết kế từ trên xuống (Top — Down), Đối với phương pháp thiết kế này trước hết ta
thiết kế cơ sở đữ liệu theo mỏ hinh thực thể liên kết, sau đó sứ dựng biểu để thục thê hiên kéL BR (Entity Relafionships) ảnh xạ sang mô hình quan hệ Đề thực hiện chuyển từ mô hình thực thẻ liên kết sang mô hình quan hệ ta phải tuân theo các nguyên tắc sau: [6]
~ Nguyên tắc 1: Với kiếu thực thế thông thường => chuyển thành một quan
hệ sao cho các thuộc tính của quan hệ là các thuộc tính đơn (hoặc các thành phân đơn của thuộc tính phưtc hợp) Khoá chính của quan hệ chọn một trong các khoá của
Trang 24kết vào bang có các thực thể tham gia toàn bộ,
Với kiểu liên kết 1 — N : Lấy khoá chính của bảng bên l đưa
- Nguyên tác
sang làm khoá ngoài cũa bằng bén N
- Nguyên tắc 5: Với kiểu liên kếtM M: Thực hiện tạo thêm báng mới
Trong bảng mới lầy các thuệc tính là khoá chính của 2 bảng, nêu trong mỏi liên kết
có thuộc tỉnh liên kết thì đưa cả thuộc tính liên kết vào bang moi Khoa chính của
băng mới là khoá chỉnh của bảng bên N + khoá chính cúa bảng bên M
- Nguyên tắc 6: Với thuộc tính đa trị : Thực hiện loại bẻ thuộc tính đa trị trong bồng sau đó tạo thêm bằng mới Trong bâng mới lấy thuộc tính là khoá chỉnh của băng có thuộc tính đa trị và thuộc tính đa trị chuyển thành thuộc tính đơn trị Khoá chính của bang mdi là cả hai thuộc tinh cia bang,
7: Với kiểu liên kết
- Nguyên ấp cao (kiểu liên kết giữa ba kiểu thực thể
trở lên) Thực hiện tạo thêm bảng mới Trong bảng mới lấy các thuộc tỉnh lả các
khoá chính của các bằng tham gia liên kết, nêu trong môi liên kết có thuộc tỉnh liên
kết thì dưa cả thuộc tính liên kết vào bảng mới Khoá chỉnh của bảng mới là hợp các
khoá chính của các bảng tham gia liên kết
- Nguyên lắc 8: Với kiểu liêu kết đệ quy : Thực hiện bỗ sung thêm một thuộc tỉnh mới chứa giá trị khoá của thực thê liên kết độ quy
Vĩ dụ: Thiết kể cơ sở dữ liện quan hệ theo phương pháp Top — Down
Xây dựng CSDIT, quân lý công ty Sau khủ khảo sát thực tế các hoại động của
công ty dược mô tả bằng oác quy tắc sau:
1 Một công ty được tổ chức thành các đơn vị Mỗi đơn vị có một tên duy nhất,
một mã số duy nhật vã một nhân viên quân lý đem vị Việc rihân viên quân lý
đơn vị dược ghi lại bằng ngảy bất dâu Một dơn vị có thể có nhiều dịa diễm
2 Một đơn vị có thể kiểm soát một số dy an Méi dự án có một tên đuy nhất, một
mã số đuy nhật và một địa điểm
Trang 2524
3 Mỗi nhân viên dược lưu giữ: Họ tên, Mã số BHXH, Địa chỉ, Lương, Giới tỉnh,
Ngày sinh Mỗi nhân viên làm việc cho một đơn vị nhưng có thể làm việc trên
nhiêu du dn do đơn vị đó kiếm soái Việc làm việc trên dự án của nhân viên
ó những người phụ Hộ (người phải nuôi) những người
mày được hưởng bảo luểm xã hội Thông tin vẻ những người phụ thuộc gồm có:
TIọ tên, ngày sinh, giới tính, mỗi quan hệ
© Thực hiện xâu dựng mô hình thực thể liên kết (Lược đỗ E-R):
Bước 1: Xác định các kiều thực thể
ĐÓNVi(Tên đơn vị, Mã sẻ 12V, Nhãn Viên QL, Dịa điểm, Ngày 1D),
DUAN(Tén dự án, Mã số DA, Địa điểm)
NHANVIEN(H@ tên, MSBHXH, Địa chỉ, Lương, giới tỉnh, Ngày sinh)
NGUOIPT(Ho tên, giới tính, ngày sinh, mối quan hệ) {Thực thế yêu}
Trong đó: các thuộc tỉnh gạch chân một nét là khoá của kiểu thực thể, thuộc
tinh gach chan hai nét là thuộc tính đa trị
Bước 2: Xác dịnh các liên kết
Trang 26
Bước 3: Xây dựng mô hình thực thể liên kết:
Hinh 1.2 Biéu 43 E-R cho CSDL cing ty
ø_ Ảnh xạ từ mô hình thực thể liên kết sang mô hình quan hệ
- Xét kiểu thực thể DONVICIên đơn vị, Mã số 2V, Nhân Viên QL, Dịa
điểm, Ngày BĐ): Gó thuộc tinh Pia did
Trang 2726
DONVI(MSDV, TERNDV, MSBHXH, NGAYBD)
DV_DD(MSDV, DIADIEM
- Xét kiéu thie thé DUAN(Tén dy an, Mã số DA, Địa điểm): Có môi liên kết
N — 1 voi kiếu thực thế DONVI, có mỗi liên kết M — N với kiểu thực thế
NHANVIEN va thuộc tỉnh liên kết là Số giờ 1V Áp dụng các nguyên lắc 1, 4, 5 ta
có các lược đổ quan hệ
DUAN(MSDA, TENDA, DIADTEM, MSD)
NV_DA(MSDA, MSBIIXLL SOGIO)
NGUOIPT(MSBHXH, HOTEN, GIOITINH, NGAYSINH, MOIQH)
Cuỗi cùng la xây dựng được lược dd CSDT che bai loan quận lý céug ky nhur
DONVI(MSDV, TENDV, MSBELEML NGAYDD)
Trang 28Quá trình thiết kế cơ sở đữ liệu được minh hoạ ở hình 1.3 Quả trình dó thực hiện theo các bước sau:
ước 1 lập bợp các yêu cầu và phân tích: I2ây lả yêu cầu kháo sát bái toán quân lý trong thực tế, ta phải thu thập các yêu cầu của người đùng và ghi chép lại ở dạng súc tích Những đặc tả này càng chỉ tiết và dây dủ cảng tớt
Bude 2 thiết kế khái niệm: Lựa chọn một mô hình dỡ liệu, dùng các khải tiệm của mô hình đó để chuyển những đặc tả yêu câu của người đùng thành một lược đỗ khái miệm Tược đỏ khái mệm bậc cao được dùng để đâm bão rằng kết quả của quá trình thiết kế cơ sở dữ liêu sẽ dáp ứng dược tắt cả yêu cầu của người dùng,
và đảm bảo rằng những yêu cảu đó không chứa mâu thuẫn Với bước thiết kế này,
Trgười tiết kế cơ sở đữ liệu phât đặt ra các raục liêu phải thực hiện, có thể lập trưng, vào việc đặc tả các tính chất của đữ liệu mả chưa cằn quan tâm dén các chỉ tiết về
In trữ
Bước 3 Thiết kế logic: Dưa ra được thuật toán dé thục hiện các công việc Thực hiện cài đặt cơ số dữ liệu bằng một Hệ quần trị cơ sở đữ liệu cụ thể Kết quả
của bước nảy là một lược đồ cơ sở dữ liệu đưới dạng mô lính đở liệu thê hiện của
TIệ quản trị cơ sở dữ liệu
Bước 4 Thiết kế vật lý: Các đặc điểm về mặt vật lý của cơ só dữ liệu phải
được đặc tả ở giai đơợm này; chúng bao gồm câu trúc lưu trữ liên trong, kiểu tỏ chức
tệp cho cơ sở dữ liệu, cơ sở dữ liệu đặt ở đầu, quản lý các phụ thuộc vào lIệ quán trị
cơ sở dữ liệu (phụ thuộc phân mẻm, phần cứng),
Trang 29
Các yêu cầu CSDL
Lược đồ khái niệm
= (Trong mô hình dữ liêu bậc cao)
Lược đô khái niệm
(Trong mô hình dữ liêu của một DBMS cu thể)
(đôi với cùng một DBMS cụ thê đó)
Trang 30Hình 1.3 Quả trình thất kê một cơ sỡ đữ liệu
Trang 3128
Chương II - LÝ THUYÉT KẾT NÓI VÀ NỬA KÉT NÓI ỨNG DỤNG TRONG TỎI ƯU HOÁ CÂU HỎI
2.1 Lý thuyết kết nỗi và một số kết quả của lý thuyết kết nồi
Trong lý thuyết thiết kế cơ sở đữ liệu quan hệ, để tránh dư thừa đứ liệu, tránh các dị thường cập nhật và tăng tốc độ trong quá mình truy vấn thông tín thí khi thiết
ké cơ sở đữ liệu thông thường ta tổ chức dữ liệu thành một tập các quan hệ có liên
quan logie với nhau Nhưng khi thực hiện các yêu dầu của người sử dụng, gác yêu câu này thường liên quan dén nhiễu thuộc tỉnh trên nhiều quan hệ khác nhau Do đó khi thực hiện các truy vẫn để trả lời các yêu cầu của người sử đụng bắt buộc chứng,
ta phái kết nội các quan hệ liên quan đến câu hỏi lại để tìm ra kết quả Tuy nhiên vẫn dẻ đặt ra là việc kết nổi các quan hệ lại có cung cấp cho ta kết quá chỉnh xác
không? Có xuất hiện kết quả ngoại lai trong câu trả lời không? Trong phản này sẽ
trình bảy một số kết quả về lý thuyết kết nói trong mô hình quan hệ |1 1 |
2.1.1 Kết nối không mắt (hông lin
Khải niệm vẻ kết nỗi không mắt thông tin (phân tách có kết nói không tổn
thất) và thuật toán kiểm tra phép nôi không mắt thông tin đã được trình bay day đủ
trong chương 1 (trang 16, 17) Sau day là hai kết quả bổ sung của lý thuyết kết nồi không mắt thông tin [11]
Trang 32Trong ma trận trên ta thấy hàng Rạ và hàng Rạ giống nhau ở tất cả các cột
L toán kiểm tra phép
thuộc Linh trén Ry cy Ro Như vậy theo Ú tương ứng với
nổi không mất thông tin, nếu ký hiểu b trên cột của thuộc tính À bị dỗi thành a phải
có một phụ thuộc hàm X->A (với X Ry rv Ry) hay nói một cách khác ký hiệu b trên cột của thuộc tính A bị đổi thành a khi Ac(Rị =2)”, Do đỏ toàn bộ hàng, Rị trở thành a khi và chỉ khi Rạ - Rị C Œị Ra)”
Nếu Rạ, ., Ra va Su, Sự mỗi tập hợp đều có một phép nối không mat
thông tin, R = |JR,, 8 = [JS PzãR — 8 cũng lả phép nổi không mất thông tin,
joan a trong tất câ các cột của l_ q)
+ Do 8¡, ., S„ cò một phép nối không mắt thông ti Sử dụng thuật toán 1.4
ta sẽ tìm được mệt hàng chứa toàn a trong tắt cả các cột của S @
1 Do, 8 cũng có một phép nối không mất thông tin theo Hệ quả 2.1 ta có TK
5 -> 8 hoặc R ¬ 5 —+R @®)
Trang 33Trong lý thuyết kết nổi, một vẫn để dược đặt ra là: Cho một tập R các lược
đỗ quan hệ, hỏi có tổn tại hay không một tập con của nó mả trên tập con này không,
có kết nói không xuất thông tín (tức là có kết nối mắt thông tin)
Chúng ta cần lưu ý rằng, đổi với hai lược đỏ quan hệ rời nhau (không có thuộc tính chung) thì khí kết nếi hai lược đỗ quan hệ nảy chắc chắn đó là kết nếi có xuất thông tin (còn gợi là tốn thất thông tín tâm thường) Trong thực tế thì không có
lý do gi để kết nói hai lược đỏ quan hệ rời nhau, do đỏ trong phân nảy chúng ta chỉ quan lâm tới các lỗn thất thông tim không Lâm thường (lồn thất thông tin kÌủ kết nối
đai lược đỗ có chung thuộc tính) Khi dó ta định nghĩa một tập con {Rạ, Rạ, Ra}
của Ð là không tim thường nếu nỏ không tổn tại một phần hoạch thảnh hai tập có
Tiợp rời nhau
Như vậy chắc chắn rằng, một diều kiện cho R dé không, cỏ phép nối tốn thất thông tin không tâm thường lả mọi cặp lược đồ không rời nhau của tập lược đồ
quan hệ R phải thoả mãn hệ quả 2.1
Đ nghiên cứu vẫn đề này chúng ta dùng một đỗ thị có hướng G{E) để biểu,
điển tập lược đỏ quan hệ R Mỗi đỉnh của đả thị là một hược đẻ quan hệ của R, có
một cung đi từ đính Q đến đỉnh 3 khi và chỉ khi Q ¬ 8 > 8 Ta dùng kỷ hiệu Q =>
8 để biểu thị một cũng từ Q đến S ( sử dụng ký hiệu => đế phân biệt với ky hiệu >
dùng cho phụ thuộc hàm) Như vậy nêu có Q —> 8 thí Q > 8 (bởi vì từ Q =2 § ta
Trang 34Khi đỏ đồ thị G(R) được biểu điễn như sau
Hình 2.1 Đồ thị biễu diễn lược đồ quan hệ R
Như vậy bất cứ một cặp nảo của các lược đô quan hệ không rời nhau mà
không thoả mãn điều kiện của Hệ quả 2.1 (tức không có một cung nói giữa hai lược
đồ) thì sẽ có một phép nổi tổn thất thông tin Nhìn vào đổ thị hình 2.1 ta thấy phép
nổi PC va ZC lả mất thông tin Do đỏ nếu trong đỏ thị mả tỏn tại một cặp đỉnh
không rời nhau lại không nói được với nhau sẽ là điều kiên đủ đề kết luận tập các
lược đỏ cỏ kết nối mắt thông tin
Phần tiếp theo sẽ trình bảy một định lý xác định điều kiên cần và đủ để một
tập các lược đỏ quan hệ cỏ kết nỗi mắt thông tin hay không ?
Bê đề 21
Trang 35én I- fw, v} là một thể hiện sao cho w, v giồng rửau trên các thuộc tính của
XỶ và khác nhau trên tất cả các thuộc tỉnh còn lại
To X fo Vị nên Vị \ X # Ø vị vậy với cach chon tén w va v khdc nhaw ib
nhật trên một thuộc tính của Y; với Vi: l Sign
Bay pid ta chỉ ra rằng với cach chon niu trén sẽ không vi phạm các phụ
thuộc hàm của lược đỗ quan hệ
Xét phụ thuộc hàm bắt kỳ Z —> LƯ của lược đô Nêu w và v giống nhau trên các thuộc tính của ⁄ thi ⁄ c XỶ, do đó U C XỈ vi vậy w vá v cũng giống nhau trên
các thuộc tính của UU Như vậy phụ tửmộc ham 7 —> U thoả mãn và bố để được chứng minh
Định nghĩa: (Miễn liên thông mạnh) [11]
Một miễn liên thông mạnh (strongly connected region — SCR) của một đồ thị
là một đỗ thủ con trong đó luôn tổn tại đường đi có hướng từ mỗi đỉnh đến các đỉnh
‘Theo định nghĩa của miễn liên thông mạnh thi sé tên tại một đường đi có
hưởng từ R¿ đến RB, gid su duréng dé la Sy, Sp, ., Su (S1 = Ri: Sm = Ry)
‘Theo định nghĩa của đồ thị G(R) sẽ tôn tại cưng đi từ S¡ đến S¡, ¡với mọi ] <
n, lite là S, S44 t8, +¡ với moi 1 < i <M Do dé § > S)4) voi moi 1 <i <
m
Suy ra S, > S$, > > Spe
Trang 36Vay Bi Rị (5ị = Rị, S„ = Rị) và bê đề được chúng mính
Bé dé 2.3
Cho tập hợp R các lược đề thoả mãn điều kiện của hệ quả 2.1 (tức là với mọi
(Rụ, Rạ) là cặp lược đồ không rời nhau thì RạevRa-sRị hoặc RạrvRa-xRR;) Giả sứ xẳng đồ thị GŒ) có một niên Hên thông mạnh {T¡, Tạ, , Tu} và các đỉnh P, Q sao cho P > Ty, Q => T, va trong G(R) F/> Q, Y= P va không có một cung nào nồi
+DoP ST nén(P Ot) oT; a)
1 Theo bé dé 2.2 ta c6 Ty > T;,, vei moi i i<n
dodoTy >Mohe ut) >X @)
Te (1D), @), (3) ta cd Perl )P Suy ra tổn tại mét oung tr T, dén P, diéu
‘Ty bat ky đến P hoặc Q) Như
vậy P không lả tập con của X Lập luận tương tự ta cũng có Q không là tập con của
X
nảy trải với giả thiết (không có một cung nao ndi
Nếu P và Q không rời nhau thì ( P zš Q) —> P hoặc ( P z Q) —> Q đo đó
trong dé thi G(R) tổn tại một cung P > Q ho&e Q = P Điều nảy trái với giả thiết
dé 23, vay(PQ) &
của bd
Như vậy ta dã chứng mình duge cae két qua sau:
~_ Pkhông là tập con của X, suy ra (Ty v2 Tạ v2 c2 Tạ) /3 P,
— _ Q không là tập con của X, suy ra CHị «¿ Ï; k2 c2 Ta) />P
- (PQ)-Ø
Áp dụng bổ để 2.1 với P, Q, CHị cý Ta cà k2 ',) tạ có
Trang 3734
Tổn tại một thẻ hiện I={w, v} (một bảng gồm có 2 hàng) sao cho w, v giống
nhau trên các thuộc tính của (T¡ ©¿ T; ©2 ©2 Tạ) và khác nhau ít nhất trên một
thuộc tính của P cũng như của Q
Do do khi ap dung phép chiéu lén P, Q, (T}UT,W UT,) ctia thé hién I ta c6
TIb() có 2 phân tử
THẹ Œ) cỏ 2 phân tử
TH x2 (1) chỉ có 1 phân từ
Nên: Tb)Tle@)4 Hạ „ „,)(1)có 4 phan tit
Trong khi Tp GQ ur Uryu.ut,) (Lehi e6 2 phan từ
Vay Pd Q bd T1Dd Tibd bd Ty 1a co mat thong tin
Đồ thi con của G(R) gồm các đỉnh P, Q va {Ty, Ty, ., Ta} thoa man bé dé 2.3 được gọi là đỏ thị con bị cắm và được ký hiệu như sau
Định lý 2_1 (Định lý cho điều kiện cân và đủ về kết nói không mát thông tin)
Cho R là một tập các lược đổ quan hé R cỏ một tập con có kết nồi mắt thông
tỉn không tâm thường, khi và chỉ khi một trong hai điều kiện sau xảy ra
(1) Tôn tại cặp lược đồ P, Q không rời nhau ( P ¬ Q £ Ø ) sao cho PAQ/> P
và P¬Q />Q
Trang 38Theo hệ quả 2.1 và bỏ 3 dã chứng mình, ta thấy rằng nếi
xây ra thủ R có chứa một tập con có kết nói mất thông tín Tức là:
+ Nếu có (1) thì theo hệ quả 2.1 †a có P <1 Q là có mất thông tin
1 Nếu cé (2) thi theo bd dé 2.3 ta cd? Bét Q Bái Tì 4l T21 B1 Tạ là có
xnất thông tin
~ Điều hiện cần:
Bay giờ la giá sử điểu kiện (1) và (2) đều sai (túc không xây ra), ta phải
chứng mình R không cỏ tập con nào có kết nói mất thông tin
“Nhận xét: Nếu R có một tập con mà kết nối trên tập con này có tính chật mắt thông tín không tắm thường thì chúng ta có thể thay thế R bằng lập con nay trong phát biểu của định lý 2.1 Do đỏ, không mắt tính tổng quát ta xem như kết nổi trên toàn bộ R là miát thông tín
Trước hết ta thấy rằng nếu diễu kiện (1) không xây ra, tức lả với mọi cặp lược đổ T, Q không rời nhau thì D za Q —>P hoặc P z¬ Q —> Q
Bay gid ta sẽ vô hướng hoá đỗ thị có hướng G(R) thành Œ (R) như sau
P nổi với Q trong G4) khi và chí khi có cùng đi từ P đến Q hoặc cỏ cùng di
tit Q dén P trong G(R)
Ta sé chimg minh G(R) liên thông Khi đỏ sẽ gợi G(R) là giả liên thông (tức
là G() liên thông trên đỗ thị đã võ hướng hoá)
Giả sử G'Œ) khêéng liên thông, ta có thế chia tập đỉnh thành hai tập con
không rỗng, rời nhau {P\, , ạ} và {Q\, Qu} sao cho không có cạnh nối giữa Pị
và Qj với mọi ¡, j Mặt khác, đo kết nối trên R là không tâm thưởng nên giữa hai tập 42), Pal va {Qàụ, ., Qạ} phải có ít nhất một thuộc tình chúng, tức lả tồn tại P; ^
Trang 3936
Q 4 Ø với 1 <¡<n, 1 <j<m Do điều kiện (1) không xảy ra, suy ra P; sẽ nói với
Qj tong G`(R) điều này trái với giả sử trên Vậy G'(R) liên thông
Để tiếp tục chứng minh định lý ta cần phải chứng mình hai bỗ đề sau:
BỗđÈ24
Trong mọi đỏ thị có hướng giả liên thông vả điều kiện (2) của định lý 2.1
không xảy ra thì với mọi đỉnh P, Q bất kỳ đều tên tại đỉnh T sao cho có đường đi có hướng từ T đến P và từ T đến Q (T có thẻ trùng với P hoặc Q)
Ta chứng mình bổ đề nảy bằng phương pháp quy nạp theo độ dải của đường
đi giả ngắn nhất từ P đến Q (tức là đường đi ngắn nhất từ P đến Q trong đỏ thị võ
hướng G'(R))
+ Nếu đỏ dài đỏ bằng 1: do có cạnh PQ trong G*(R) nên trong G(R) phải cỏ
cung đi từ P đến Q hoặc tử Q đến P Nếu cỏ cung đỏ đi từ P đến Q ta chọn T = P,
ngược lại ta chon T = Q
+ Gia str bé dé ding với mọi đường đi giả ngắn nhất từ P đến Q có độ dài
ngắn hơn ¡ Ta phải chứng minh bổ để đúng với đường đi giả ngắn nhất từ P đến Q
có độ dài bằng ¡, khi đó đường đi giả ngắn nhất từ P đến Q có độ dải ¡ là : P, Tị,
Tia, Q
Theo giả thiết quy nap bo để đúng với mọi đường đi giả ngắn nhất từ P đến
Q có độ đài ngắn hơn ¡ Khi đó ta có tôn tại đỉnh T sao cho có đường đi có hưởng từ
T đến P và từ T đến T;¡ Ta phải chứng minh tổn tại đỉnh TỶ sao cho cỏ đường đi cỏ
Trang 40Hình 2.3 Mô phòng quan hệ giữa các đính
Trường hợp 2.1: Nếu tổn tại ¡ (1< ¡ š r) sao cho Ú; > Q, la chon TP = T khi
đó lá có diều phải chứng mình
Trường hợp 2.2: Nếu không tổn tại ¡ (1< ¡ < r) sao cho L1; => Q
Nhận xửt : Mọi j : L< j S , tổn tại kị > j, sao chơ tồn tại cạnh Q => Us, và
{Uy,, Tại, Ủ; 3 là mệt miền liên thông mạnh
Ta sé chứng minh nhận xét trên bằng phương pháp quy nạp lui
+ Khi j = r, chọn kị =r (do có cung Q => U,)
1 Giá sử nhận xéi đúng với j — # ¡ 1, tức là: 3 kạx¡ sao choQ > Uy, và {Uy „=2 Uz¿¡} là một miễn liên thông mạnh Ta phải chứng mình nhận xét
đúng với j = #, tửc là: I kạ sao cho Q => U,, va {U,,, , U,} la mot miễn liên
thông mạnh
Xét miễn liên thông mạnh {UI, „ s¿ Úự 1} và các đính U, Q; do điều kiện (2) của định lý dược giả sử lá không xảy ra, bức là trong R không tổn tại một dỗ thị
1 Un > Q voim mao dé: jim < kya)
ñ Uy > Upvoimuio dd :j<m <kyar
ii Q>U;,