1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn nghiên cứu một số khía cạnh lý thuyết trong mô hình csdl quan hệ

131 2 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên cứu Một Số Khía Cạnh Lý Thuyết Trong Mô Hình CSDL Quan Hệ
Tác giả Vũ Chí Quang
Trường học University of Science and Technology Hanoi
Chuyên ngành Hệ quản trị cơ sở dữ liệu
Thể loại Luận văn nghiên cứu
Năm xuất bản 2007
Thành phố Hà Nội
Định dạng
Số trang 131
Dung lượng 2,11 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Với ưa điểm về tính cấu trúc và khả năng hình thúc hoá phong, phú, CSDL quan hệ để dàng, amé phỏng các hệ thống thông tin đa dạng trong thực tiễn, làm tăng khá năng xử lý, quân trị và k

Trang 1

DAI HOC QUOC GIA HA NOI TRƯỜNG DẠI HỌC CÔNG NGIIỆ

VŨ CHÍ QUANG

_ NGHIÊN CỨU

MOT SÓ KHÍA CẠNH LÝ THUYẾT

TRONG MÔ HÌNH CSDL QUAN HỆ

TUẬN VĂN THẠC SĨ

HA NOI — 2007

Trang 2

1.1 Phương pháp thiết kế Bottom — Up 5 1.1.1, Các khỏi niệm cơ bản: -5

1.1.2 Các phép toán trong mô hình quan hệ 7 1.1.3, Phụ thuộc hảm HHhrHerierrereerroeou.Ð 1.1.4 Lý thuyết chuẩn hoa 18 1.2 Phương pháp thiết kế Ứop Down _

1.3 Quá trình thiết kế cơ sở dữ liệu 26

Chương LÍ - LÝ THUYET KỨT NỘI VÀ NỬA KẾT NÓI ÙNG DỤNG TRONG TỎI ƯU HOÁ CÂU HỎI - 28 2.1 Lý thuyết kết nối và một số kết quả của lý thuyết kết nỗi 28 2.1.1 Kết nỗi không mỗi thông tím 28

2.1.2 Kết nỗi mắt thông tỉn o5 1.30

nữa kết nỗi ứng đựng trong cơ sở ie Wau ph n lắn.38 39 41 4 2.3 Tdi tu hoá câu hỏi trong cơ sở đữ liêu phân tán 42 2.3.1 Khải quát về cơ sở dữ liệu phần tán —

2.3.2 Một số nguyên lý chung của tối tra hoá câu hỏi 52 2.3.3 Tôi ưu hoá câu hỗi 71

Chương LII - MỘT BỘ BÀI TOÁN NE-U TRONG MÔ HỈNH QUAN HỆ 106

3.1 Tẳng quan về thuật toán và đánh giả thuật toản — —

3.1.1 Khải niệm thuật toán co se — -

3.1.2 Các tính chất của thuậi toản - 107 3.1.3 Tai mỗ hình tính toán 108 3.1.4 Khái nệm độ phức tạp Thuật toán - - 108

3.1.5 Phép quy dẫn (dẫn về được) eeeerrersrreeeeoee, TÔ 3.1.6 Phan lop bai toán theo độ phú 11 3.1.7 Cấu trúc của lớp P, NP „112

3.2 Một số bài toán NP-C trong mỏ hình quan h -ee.114 3.2.1 Tãi toán siêu khoá só lực lượng không quá m - 114

Bài toán quyết định thuộc tính khoá bay không khoá 7 120

TAL LIBU THAM KHAO accesses sssiusseimastiasetssimissensanasensans L2D

Trang 3

to

DANITMỤC CÁC HÏNI VẼ

Hình 1.2 Biểu dỗ H-R cho CBDL công ty .ceieieeiieeeie.2

Hình 3.1 Đỏ thị biểu diễn lược dò quan hệ R 5 sesesses3T

linh 2.2 Dồ thị con bị cẳm nen He kneereerisoarreooo4

Hình 3.4: Kiến trúc các lược để của một CSDL phân tán 46

linh 2.5: Kiến trúc chức năng của một hệ QTCSDL, phân tán A?

Hinh 2.6: Các kiểu phân đoạn của một quan hệ 49 Hình 2.7 Lược đẻ tổng quát xử lý truy vẫn phân tản Sseeeses SỐ

Hinh 2.9 Đề thị truy vấn không liên thông, - - 63 Hình 2.10 Ví dụ về cây truy vẫn co eeccececrerrrerrerrrisereee Ô

Hình 2.13 Cây truy vẫn sau khi thay thể csereeseessssssssissse.e Ñ

Hình 2.14 Rút gọn phân đoạn ngang (với phép chọn) - 68 Hình 2.15 Rút gọn phân đoạn ngang (với phép nối) - - 69 Hình 2.16 Rút gọn phân doạn đọc si cnsnnereirierrereeeirrro TÔ

Tlinh 2.17 Rut gon phan đoạn hỗn hợp 2 "AM

Hình 2.19 Các cây nỗi tương, Ổương, coi

Tlinh 2.20 Dé thị nỗi của cây truy vẫn - - 84

Hình 2.21 Các thử tự nói khác nhau eccccesee peeves ene BE

Llinb 2.22 Dé thi ndi otia cay tray van phan tn cece eee seo BỘ Hình 2.23 Truy vẫn mẫu và số liệu thông kê 99 Hình 2.34 Đề thị câu truy vấn don và số liệu thông kế - - 102

Hình 3.1 Sơ đỗ mình hoa các lớp bai toán MP, NP-C, NP-Hard 114

Trang 4

từ những năm 60 của thể kỹ X% đến nay, các hệ cơ số đữ liệu ngày cảng phát triển

và hoản thiện, nhiều thể hệ quản trị CSDL đã ra đời, tạo ra nhiều sắn phẩm ứng, dung trong khoa học kỹ thuật, các ngành kinh tế cũng như trong đời sống xã hội

Việc nghiên cửu CSDL trên thể giỏi và ở trong nước đã và dang phát triển ngây cảng phong phú, đa dạng Từ những năm 70, l⁄F Codd di dua ra mé hinh dit

liệu quan hệ tạo một cơ sở vững chắc cho các vấn đề nghiên cứu về CSDL Với ưa

điểm về tính cấu trúc và khả năng hình thúc hoá phong, phú, CSDL quan hệ để dàng, amé phỏng các hệ thống thông tin đa dạng trong thực tiễn, làm tăng khá năng xử lý, quân trị và khai thác đữ liệu, phục vụ được bảu hết các yêu cầu của người sử dụng, Trên thực tế, đã có nhiều hệ quân trị CSDI, xây dựng trên mô hình CSDTL, quan hệ

được sử đựng phổ biến trên thị trường như: DBASE, FOXPRO, ORACLI, MS

SƠI.,

Cho dén nay CSDL quan hệ dã thu được rất nhiều (hành tựu sâu sắc cả về

phương điện lý thuyết và ứng đụng Phân lớn các hệ quản trị CSDL sử đựng trong

thục tiễn được thiết kế trong mô bình quan hệ, rất nhiền sản phẩm phan mềm được

tạo ra vẫn dang sử dạng rộng rãi và có hiệu quả Việc tiếp tục nghiền cửu các khía

cạnh lý thuyết trong mô hình CSDL quan hệ sẽ tạo điều kiện thuận lợi cho việc

như: CSDI, phân tán, CSDI niphiền cứu và phát trie: ử mô hình cơ sở đữ liệu ru

Trang 5

~ Nghiên cứu sâu sắc vẻ lý thuyết kết nỗi và nửa kết nổi, ứng dụng lý thuyết kết nổi và nứa kết nỏi trong tối ưu hoá câu hỏi, đặc biệt lá trong tôi ưu hoá cầu hỏi

phan tan

- Nghiên cửu dộ phức tạp của các thuật toán trong CSDL, giới thiệu một số bài toán trong CSDL là NP-C

Nội dụng của bản luận văn này dược chúa làm 3 chương

Chương 1: Lý thuyết thiết kế cơ sở dữ liệu quan hệ Chương nảy trình bảy

vẻ các phương pháp thiết kế cơ sở đữ liệu quan hệ, quy trình thiết kế và cáo van dé

liên qua như: các phép loán trơng mô hình quan hệ, phụ thuộc hàm và chuẩn hoá

Chương II - Lý thuyết kết nói và nửa kết nổi Ứng dung trong tôi un hoa

câu hỏi Đây là chương chính của luận văn; rong chương này trình bảy các vẫn dé

về lý thuyết kết nếi nhụ: kết nổi không mất thông ñn, kết nói mất thông tín, điều

*kiện cần và đủ để kết nối không mắt thông tin Phản tiếp theo trình bảy về phép nửa kết nói, tính chất và ý nghĩa của nữa kết nối ứng dụng trong cơ sở dữ liệu phân tân

Phần cuỗi cùng trình bảy các vẫn dễ ứng dựng lý thuyết kết nội và nữa kết nói trong, tối ưu hơả câu hỏi phân tàn như: khai quát về CSDL phan tan, các van để về tối ưu thoá câu hồi, các thuật toán đề tối ưu hoá câu hỏi trong môi trường lập rung va mdi

trường phân tân

Chương 1H - Một số bài toán NP-C trong mô hình quan hệ Chương nảy trình bảy một khía cạnh lý thuyết trong cơ sở dữ liệu, đỏ là đánh giá độ phúc lạp

của các thuật toán trong các hệ cơ sở dữ liệu, vẫn dễ này it dược dé cập trong các

sách về CSDL va chỉ được giới thiệu trong các bài báo hoặc trong cáo sách nghiên cứu sâu về lý thuyết thuật toản và độ phúc tạp của thuật toán Ngoài ra trong

chương nảy còn giới thiệu một số bài toán cụ thể trong cơ sở dữ liệu là NP-C

Mặc du đã rất cổ gắng đẻ hoàn thành bản luận văn này, nhưng chắc chắn vẫn

Trang 6

phương pháp Top — Down (trén — xuống)

Theo phương pháp Betom — Up: Mục đích của việc thiết kế ca sở đữ liện

quan hệ là đưa ra một tập các lược dé quan hệ để lưu trữ các thông Lin của một lỗ chức xi nghiệp, ngân bảng, dại học, một cách không dự thừa đẳng thời cũng cho phép cập nhật, truy van dé dang Dé dat được mục đích đó khi nghiên cứu và khâo sát bài toán quản lý trong thực tiến; la phải xác định các thuộc lĩnh cần quân lý, ruối

quan hệ giữa các thuộc tỉnh (các phụ thuộc hàm), tiếp theo lá chuẩn hoá các lược đồ quan hệ, thực chất là thực hiện cáo phép tách để có được các lược đồ theo các đạng, chuén (INF, 2NF, 3NF, BCNF, 4NF, SNF); tuy nhiên các phép tách phải đâm bảo

các điều kiện như: bảo toán thuộc tính, báo toản phụ thuộc hảm, không mất mat

thông tin

Theo phương pháp Top Dowr: Khi nghiên cửu vả kháo sát bải toản quản lý

trong thục tiễn, ta phải xác định các đối tượng của cơ sở đữ liệu và rỗi liên hệ giữa các đổi tượng: tiếp theo là mô hình hoá thanh các kiểu thực thế, kiểu liên kết, xây

đựng lược đỏ thục thể liên kết ER; cuối cùng là áp dụng các nguyên lắc chuyển Lir

m6 hinh thực thế liên kết ER sang mô hình quan hệ

1.1 Phương nhắp thiết kế Bottam — Úp

- Thuộc tính: Thuộc tỉnh của một quan hệ là cột của băng quan hệ Trong,

mê hình quan hệ không cho phép thuộc tính phúc hợp, đa trị Chỉ được là thuộc tính

Trang 7

- Lược dồ quan hệ Mô tả câu trúc của một quan hệ, được ký hiệu là R(Au,

Ag, , Aq) trong dé R [a tn quan hé va A; G=L n) la các thuộc tính

Vide Tage dd quan hệ

TNHANVIEN( IOTTN, MSBIIXII, DIACHI, LUONG, GIOITINH, NGAYSENII)

~ Quan hệ: Là một tập cơn của tích Descartes ctia danh sách các miễn giá trị,

được ký hiệu lá: r={t, ta, tạ} c DOM(A,) x x DOM(A,),

1 Một quan hệ chính là một bảng hai chiều:

+ Số các thuộc tỉnh của quan hệ là số ngồi của quan hệ

1 Thứ tự các đòng, các cột trong bảng quan hệ không quan trọng,

+ Che giá tri trong bing phải đơn trị và phủ hợp với kiểu đữ liệu cửa thuộc

tinh (ky ty, sé, Logic, Ngày)

!_ Dữ liệu của quan hệ có thế thay đổi theo thời gian do thường xuyên phải

cập nhật dữ liệu:

~ Lược đỄ CSDT; Là một tập các lược đỗ quan hệ ký hiệu là

S— {Ri Ra, Rm}, trong đó Rị (—1 m) là một lược đề quan hệ

- CSDL Quan hệ: Là một tập các quan hệ kỷ hiệu là:

DB = {n,m , tu}, trong đó r; (ä=1 rn) là quan hệ (thể hiện của Rị)

- Siéu khod (8K): SK được gọi là siêu khoá tiếu với mọi bụ l; r ri t;[SK] Z

1; [SK]

Trong đó:

¡_8K: là một hoặc nhiều cột (thuộc tính) trong bảng

+ ly, ly là các bộ giá trị của mỗi hàng trong bằng,

+ tị[SK], b[SK] theo thứ tự là các bộ giả trị của SK tương ứng với các bộ tụ, tr

Trang 8

- Khoả ngoài (FK): Một nhỏm các thuộc tính gọi lá khoá ngoài (I'K) của một

quan hệ r1 tham chiều đến quan hệ r2 nêu miễn giá trị FK của rl phải giống miễn

piá trị PK của r2

- Rang buge:

+ Rảng buộc miễn: vị c DOM(A)

+ Rảng buộc Khoả: Giá trị của khoả phải duy nhất

1 Tảng buộc toàn vẹn thực thế: Giá trị của khoá chính (PK) phải xác định (không có giá trị nuÏ)

+ Rảng buộc toàn tham chiếu:

© Nếu Khoá ngơài của Rị tham chiếu đến khoá chỉnh của R thì phải có

củng miễn giá trị với khoá chính của l;

® Mỗi giả trị của Khoả ngoài cúa Rị hoặc là phải có mặt trong khoá chính

của Rạ hoặc là nhận giá trị NuÙl (với ngữ nghữa là một giá trị tồn tại

nhưng không, biết)

1.12 Các phép toán trong mö hình quan hệ

1.1.21 Pháp toán cập nhột

-_ Pháp chèn (INSERT): Là phép thêm một bộ (bản ghỉ) vào quan hệ r

-_ Pháp loại bã (DELETE): Là phép loại bỗ một bộ ra khôi quan hệ r

-_ Pháp cập nhật (UPDATE): La phép thay déi gia trị của cáo thuộc tính

trong tuột hoặc một số bộ nào đó

1.122 Dại số quan hệ

-_ Cúc phép toàn tập hợp: Cúc quan hệ tham gia một phép toán tập hợp

(hợp, giao, trữ) phải có củng cầu trúc,

+ Phép hợp r (/s: Thực chất của phép hợp là xây dựng một tập các bộ thuộc

quan hệ r hoặc quan hệ s hoặc cả 2 quan hệ.

Trang 9

Phép hợp được ký hiệu và dịnh nghúa là:

+ Tích Descartes r Xs: Tich Descartes ciia hai quan hé chi xét trén cde lược

đồ rời nhau (nếu hai lược đổ có thuộc tính cùng tên thi ta có thể đối tên thuộc tính cùng lên của một trong la lược để, để bai lược đỗ rồi nhau) Cho hai lược đổ

RA, A¿, ., Aa| và 8={Hụ, Hạ, ., Bạ), r và s là hai quan hệ trên R và S tương

vg Tích Descartes của hai quan hệ r và s là một quan hệ q Mãi bộ trong quan hệ q

ky higu tụ là ghép một bộ t, er voi mat bd t, Es; trong dé 1, = (4, 4s, ., aa), ty = (bị,

Bay oe Din)s ty = (Bre Aas + as Dy, ba, ., Đại),

Tích Descarles dược ký liệu và định nghĩa là

rx s= {t]t=(ay, ag ag, By, Bas, Day), Cp, A2, AVEL VA (Oy, By, BES}

Như vậy nếu r có x bộ, s có y bộ thì q có x * y bộ,

+ Phép chia rs: Cho lược 48 RB ={Aq, Ao, , An}, SCR, rvas la hai quan

hệ trên R và S tương ứng Phép chia của quan hệ r cho s được một quan hệ q trên

luge 44 R-S sao cho mai bộ t e q ghép với mọi bộ tu € s ta được một bộ <Lu> e

+

Thép chia được ký hiệu và định nghĩa là:

r+s=ftl moiues,<tu> er}

Trang 10

Phép chiều được ký hiệu và định nghĩa là

Lixtt) = (XI | ter}

- Phép chọn Ø-sèu ae(P): Thực chất của phép chọn là xây dựng một tập

cơn của quan hệ thoả mãn điều kiên xác định <Điều kiện> chính là một biểu thức

logiø; ta có thể sử dụng các phép toán sơ sánh: <=, <> và các phép toán

logie như: and (^), or (4), not (¬) để tạo các biểu thức điều kiện thoả mãn các yêu cầu của người sử dụng,

Phép chọn được ký hiệu và định nghĩa là

<Điều kiện>{ t ) = true }

Øawiuage(E) = {tÍ tc r

- Pháp nỗi rqulEkn»s: Thực chất của phép nối là phép chọn của quan hệ (r X

s) theo điều kiên xáo định Trong đó: r x s là tích Descartos, <Diều kiện> là một

biểu thức logic xác định điều kiện nói giữa hai quan hệ r vẻ s theo 6, (6 là một trong

gác phép toán so sánh , 1% < ,<>) dược ký hiệu la: Av Bị (Ai cr, Bị c s,

A¡ và Bị phải có củng miễn giá tị)

Phép nổi được ký hiệu và định nghĩa là:

T <plNfiea> S = O«pieu kim 2 X S)

-_ Phép nỗi tự nhiên: Khi cáo quan hệ r và s có chúng một số thuộc tính

(cùng tên và có cứng giá trị thuộc một miễn nào đó) thì phép kết nói r và s theo điều kiện các thuộc tính dé bằng nhau và một trong hai thuộc tính giếng nhau duợc loại

bỏ trong quan hệ kết quả thi phép kết nối này được gợi là phép kết nổi tự nhiên và

được ký hiệu là r4

Pháp nữu nÃt r< s: Thực chất của phép nửa nỗi là phép chiếu lên R của + ‹alÃl¿„- s Kết quá của phép nữa nổi một quan hệ r với mệt quan hệ s theo điều kiện nào đó là một quan hệ gồm tất cả các bộ thuộc r cé tính chất kết nổi được theo

điều kiện với mội bộ nào đó trong quan Hệ s.

Trang 11

Phép nửa nối dược ký hiệu và dụnh nghĩa là:

1 ><s — Thứ 2p Hạc 8)

1.1.3 Phụ thuộc ham

1.141 Khải niệm phụ thuộc làm:

Phụ thuộc hàm trên một lược để quan hệ là một khải niệm có tim quan trong tiết sức lớn đôi với việc thiết kế cơ sở đữ liệu

Một phụ thuộc ham là một phát biểu ký hiệu ø: X —> Y, trong đỏ œ là tên của

phụ thuộc hàm, X vả Y là các tập thuộc tỉnh

Xét phụ thuộc hàm ơ: X -> Y trong luge dé quan hé R, voi R={A), A,

Aa} là lập các thuộc tính, X và Y là lập con của R, X ss Y— Ø Khi đó la nói Ä xác

định ham Y hay Y phụ thuộc hàm vào X néu Vụ, ty là các cặp bộ xác định trên quan

bệ r mà tị[X] = t;[X] thả tị[Y] = tị YỊ

1

32 Hệ tên để Armstrong

Trước khi đi vào trình bảy hệ tiên dễ cho phụ thuộc hàm, chủng ta sẽ xem xét

xột vải khải niệm liên quan đến các phụ thuộc ham trong lược để quan hệ

Goi F là lập c

phụ tuiộc hãm cho trước đúng trên luợc đồ quan hệ R, và X

—> Y là một phụ thuộc hàm với X_Y của lập các thuộc tỉnh

- Suy diễn logic: Nói rằng, ÄX- > Y được suy diễn logic từ E néu môi quan hệ r

trên lược đồ quan hệ T thoả cáo phụ thuộc hàm cửa E thì cứng thỏa X > Y

- Bao đông của lập phụ thuộc bảm: Gọi F 1a bao đông của , tức là tập tậL

cả các phụ thuộc hàm dược suy diễn loeic tir F

Tẻ có thể xác định khoá của một kược để quan hệ và các suy điển logic giữa các phụ thuộc hảm cân thiết phải tính được F' ti F Do đó đổi hỏi phải có hệ tiên

Trang 12

và đây đủ trong [3] (chương 7, tập I)

Ta có một kết quả quan trong sau

Định lý 1.1: Hệ tiên để Armstrong là xác đáng và đây đủ

Chứng minh : Dịnh lý này đã được chứng mình đây đủ trong [3] (chương 7, tập 1U)

Tử hé tién dé Armstrong suy ra một số ludt mé rong sau:

- Luft hop: Néu XK > Yva K > Z thiK 3 YUZ

- Luật tựa bắc cầu: Nếu X > Yva YUW > Z thiXuW>Z

- Luật tách: X —z Y và Z = Y thì X —z Z

Chứng mình : Các luật mở rộng này đã được chứng mỉnh đây đủ trong [3] (chuong 7, tap II)

1.1.3.3 Buo đẳng cña một tập thuậc tỉnh :

ao đồng của X đỗi với F gọi là X”, tức là tập tất cá các thuộc tính phụ thuộc vào X thông qua F, Cho §= <Q, F> lá một lược đỗ quan hệ và X c 2 Bao

đóng của X dối với E được dịnh nghĩa :

Thuật toản sau sẽ xác định bao đóng của tập các thuộc tỉnh

Input :X¢ Ova F li lap cde phu thude ham của lược đỗ quan hệ 8 <@, F> Output TỔ”

Trang 13

“Nhận xét: Độ phức tạp của giải thuật là O(r.p) với n — số thuộc tính và p ~

số các phụ thuộc hảm

- Cho lược dễ quan hệ:

R(MASORNV, IIOTEN, MSDUAN, TENDA, DIADIEM, SOGIO}

Tap cde phu thude ham F

MASONV > HOTEN

MSDUAN > TENDA, DLADLEM

MASONV, MSDUAN — SOGIO

- Tinh X' của về trái các phụ thuộc ham:

MASONV” = MASON V, HOTEN

MSDUAN *= MSDUAN, TENDA, DIADIEM

{MASONV, MSDUAN}' = MASONV, MSDUAN , SOGIO, HOTEN, TENDA, DIADIEM

1.1.3.4 Củch mic dink khod:

Trong lý thuyết thiết kế cơ sở đữ liệu quan hệ, việc xác định khoá của một

luge đỗ quan hệ là ruột bài toán quan trong Sau đây tác giả xin trình bảy một số kết

quả liên quan đến việc xác dịnh khoá của một lược dé quan hé

- Định lý của các tác giả Hỗ Thuần và Lé Van Bao cho một điều kiện cẩn để fap Xc Q là khoả của một lược đỗ quan hệ [2]

Định lý 1.2:

Cho 8 <G F> là một lược để quant hé, tap cae thuộc lính 3 {A¡, ,A,}, lập

cáo phụ thuộc hảm I = {Lj oR, L;, Rị c ©, Lí ¬ Rị = Ø, i=1, p), Diễu kiện cân

để XeG@ là khoá lược đỗ S là

(AB cK CAB ULAR)

trong dé L= (Jz, R= JR,

Ching mink:

Trang 14

Đằng phương pháp chứng minh phản chứng, ta giả sử X ¬ (RL) / Ø Khi

đó tên tại một thuộc tính A sao cho A e X, A e Rvà A ơL

Đo X là khoá nên tà có X —> T,

Đo A £L ta có (XY {A}) ->L

Mitkhac tacoL >RvaR >A

Áp đụng quy tắc bắc edu ta cé (X\{A}) A, điều nảy trải với giả thiết X là

khoá

Vay dink lý được chứng mình

Từ định lý 1.2 ta có thể suy ra được các hệ quả sau:

Hé quá 1: Cho 8= < ©, F > là một lược dễ quan hệ Nếu R \ L / © thi tan tai mot

khoá X sao cho X#

khoá duy nhật của lược dé 5

- Thuật toán xác định một khoá của lược đồ [2]

Jnput : lược đỗ quan hệ < Q, F >

Ouipzf : một khoá của < €1, T >

Thuật toán 1.2 (Xác định một khoá của lược độ)

Bude 1: X:- Q\R,

Trang 15

Tước 2: Néu X* = G thi chuyén sang bước 5;

Bude X: (RYU VR),

Bude 1: Voi moi A; ¢ L ^¬ R thực hiện

+Néu X40 thiX = Xv {A},

Tước 5: Kết luận X là khoá

- Đũhh lý của các tae gia Lucchesi va Osborn cho phóp xây dựng thuật loan

tìm tật cả các khoả của lược đồ quan hệ S = <€3, F> [2]

Dinh ff 1.3 (Lucchesi va Osborn)

Cho § = <Q, E> là một lược để quan hệ Gọi K là một tập khác rỗng các

khoá của 5 Diễu kiện cần và đủ để họ 2P \ K có chứa khoá của 5 là có tổn tại một

phan ti KeK va tén tai mat phu thudc ham (Lio + Rio) € F sao cho tap T = Lio (K\ Rp) không chứa phần tử nào thuộc K, (ở đây 2° ký hiệu họ tất cả các tập con

của Q)

Chứng mùi

+ Điều kiện đủ

Giá sử tổn tại KeK, (jg Rig) © F sno cho sao cho tap T Tae€K 3 Rạ)

không chứa phân tử nào thuộc K Dễ thấy T là mệt siêu khoá va phải chứa ít nhật

một khoá của 5 Vi T không chứa một khoá nào của K, Vậy T phải chứa một khoá

Thuộc họ 2°, Nói cách khác 2 \ K có chứa khoá của 5

¡ Điều kiện cản

Giả sử 221 K có chữa khoá K” của 8 Gọi K”” là tập tôi dại thoá mãn hai tính chất sau

i) _ K” không chứa phản tử nào của K

Để thấy siêu khoá K”” như vậy bao giờ cũng tổn tại (do tỉnh chất i)

Do tinh chat ii) K” < 2, va trong quả trình tính bao đóng, rõ ràng tổn tại phụ

w EK"

thuge ham Lig »Rjp sac cho

Trang 16

Kết hợp với Lip CK”, ta 06 T= Lyy UK Ry) CK’ Diễn đó chứng tổ sự

tổn tại của K ©K và sự Lin tai eda (4g Rig) © F sao cho tập T không clưm khoá

nao thude K

~ Thuật toán xác định tập tắt cả các khoá cửa lược đề quan hệ S=<4, F> dua

vào định lý 1.3 ( Lucchesi va Osborn) và thuật toán L.2 @ác định mệt khoá của lược

dé) 12, 3)

Taput : luợc đồ quan hé <Q, F >

Ouiput : Tap K, tat cả các khoả của 3

Thuật toán 1.3 (Xdc dinh tap tat cd cdc khoa cia here dé}

1 K,:r- FK| K là một khoá của lược dò < @, E > và K chứa trong siêu

6 For each Hin K, do

7 Mf HOM then Test ;= False ;

8 If Test tien K,:=K, ©2{KIK là một khoả của lược đổ <€3,†>

và K chúa trong T}

9 end ;

10 end

11 Return K, 1.1.3.5 Phủ của tập các phụ thuộc bằm:

Cho hai tập phụ thuộc hàm T và G trên tập các thuộc tính Q Ta nói T phủ Ở

Tiêu Œ ¢ F

Trang 17

Định nghĩa (bai tập phụ thuộc bàm tương dương): Chơ hai phụ thuộc hàm F

va G G và l được gọi là tương đương nếu GÌ = IỶ, khi đó ta nói G là một phú của

E và ngược lại F cũng là một phủ của G

Định nghĩa (phú tối tiểu): Cho G là một tập phụ thuộc hảm F dược gọi là một phủ tối tiêu của G nếu thoả mãn các tính chất sau:

1.136 Tỷ thuyết phân tách:

- Khái niệm phép tách: Cho R(A+, A;, A„) là một lược đồ quan hệ Một

phân tách của R là việc thay thể lược dé R bằng một họ các lược để con

p (Ri.R¿ Ra)

sao cho (JR, =R

a Cho p = (R,, R„) là một phân tách của lược đỗ quan hệ RCAu, Au) và r

là một thể hiện của lược dỗ quan hệ <, E> Gọi m„() lá ánh xạ dược xác định bới:

w(t) — Pt ><) P<

Trong đó: tị —TIyG) vớii— 1,2, m

và P<l ký hiệu phép kết nỗi tự nhiền

Trang 18

tách bảo toàn thông tín nhung không bảo toàn tập phụ thuộc hàm E vả ngược lại

- Phân tách không mắt thông tin

Định nghĩa: (Phân tách không mật thông tin)

Phan tach p (Rị, Rạ, R„) được gọi là phân tách có kết nối không tổn thấL

(tức không mật thông tin) của lược đỗ quan hệ <R, F> nếu rhư với mọi r lả (

cua R ma thod F thi :

FOND Pd Dette (oT p(t)

Đẻ kiểm tra một phân tách mắt thông ti hay không ta sử dụng thuật toán:

Input: Taroc 4 quan hé < RB, F >, phan tach p (Ry, Ra, -., Re

Output Cho câu trả lời sai hay đúng tuỷ thuộc phần tách p có mất thông tin

không ?

Thuật tuản 1.4 (Kiểm tra mội phần tách có mất thông tìn hay không)

Bước 1: Lập bảng ban dau là ma trận m hang (img với m luge dé con Rj) va

1 cột (ứng với tập thuộc tính {Ax, A›, Aa}) Phản tử hàng ¡, cột j (¡, j) của ma trận

được xác định theo công thức sau:

J8; nÔUA¡ €R,

OD, nÔtA, Z R,

trong dé a;, bụ e Dom(Aj)

ước 2: Biến đối bảng

Mục dích của việc biển dổi bãng là để cuối cùng thu dược một bảng, xeIt băng đỏ như một quan hệ, thoá tập phụ thuộc hảm I, Muốn vậy ta lần lượt xét các

phụ thuộc hảm ÄX > Y thuộc F

Với mỗi phụ thuộc hàm như vậy nếu phát hiện trên bảng có hai hàng giống

nhau trên X vả khác nhau trên Y thỉ phải thay đổi bảng sao cho hai hàng đỏ cũng

giống nhau trên Y Việc thay đổi được thực liên (heo quy tắc

Trang 19

© Néu một trong hai ký hiệu trên Y có dạng a¡ thì ký hiệu kía sẽ được đổi

thánh aị

® Nếu cả hai ký hiệu liên Y đều có đạng bụ thì lấy Inỳ ý một trong hai ký

hiệu đó và gán chung cho cả hai

"Tiếp tục lâm như vậy cho tới khi không thé biển đổi bảng được nữa Khi đó

ta thủ được bằng cuối cũng,

Bước 3: Nếu trong bảng cuỗi củng có chứa hàng gồm toản ky hiệu a (tức

Thang mì, a, ., ap), ta kết luận p— (ŒRị, Rạ, , Rạ) là phân lách không mất thông tin

(tức là cho cầu trá lời đúng) Trường hợp ngược lại p là phân tách mắt thông tin

Dinh if 1.4:

Che <B, I’ la mat hrge dé quan hé Khi dé p = (Ry, Ry) la phiin tach od két

sồi không tên thất (đối với 1) khi và chỉ khi

CRị Ry) > (Ri - By) hay (Ry Ra} (Ra - Ri)

- Phân tách bảo toản các phụ thuộc ham

Định nghĩa: (Hình chiếu của E lên tap thuộc tính Z)

Cho lược đỗ quan hệ <R, F>, và Z CR Tinh chiéu của F lên tập thuộc tính Z„ ký hiệu x„(F), dược định nghĩa là

mŒ) = {X —> Y| X— Y) eF và XY =Z}

Định nghĩø: (Phân tách bão toàn các phụ thuộc hàm)

Phan tach p = (Ry, Rạ, , R„) của lược đề quan hệ <R, F> được gọi lả phân

tách bảo toàn tập phụ thuộc hảm T nếu:

(Un, =F'

1.1.4 Lý thuyết chuẩn hoá

Khi thiết kế cơ sở đứ Hiệu quan hệ thường nảy sinh cáo vấn để như: dư thừa

dữ liệu, gây ra các dị thường cập nhật (thém, xoá, sửa bộ), cho nên các lược dé quan hệ nhất thiết phải được biến đổi thành các đạng phù hợp Quá trình đó được

gọi là quá trình chuẩn hoá.

Trang 20

Việc đưa các lược đỏ quan hệ vẻ các dạng chuẩn là nhằm mục dich:

+ Tránh dư thừa dữ liệu

+ Tránh các di thường trong cập nhật dữ liệu

Với ý nghĩa đó ta thấy dạng chuẩn BCNE tốt hơn 3NF, 3NF tốt hơn 2NF, 2NF tốt hơn INF; và bức tranh vẻ trật tự các dạng chuẩn được mô tả như sau:

Hình 1.1 Bức tranh về trật tự các dạng chuẩn

1.141 Một số khải niệm trong chuẩn hod:

~ Thuộc tính khoá: Một thuộc tỉnh trong lược đỏ quan hệ R được gọi là thuộc

tính khoá nêu nó tham gia ít nhật một khoá của R Ngược lại được gọi là thuộc tinh

không khoả

~ Phụ thuộc hàm đây đã: Cho lược đỗ quan hé R; R={Ay, Ao, ., Ay} là tập

các thuộc tỉnh, X và Y là hai tập con khác nhau của R Y là phụ thuộc hàm đây đủ

vào X nêu Y lả phụ thuộc hảm vao X nhưng không phụ thuộc ham vao bat ky tap

con thực sự nảo của X Ngược lại ta nói Y là phụ thuộc hàm bộ phận của X

hảm bộ phân của X

~ Phụ thuộc bắc cẩu: Cho lược đỗ quan hệ R; {A¡, Ap, ., Ay } la tập các

thuộc tỉnh; X, Y, Z là tập con của tập các thuộc tính Ta nói phụ thuộc hảm X —> Y

Trang 21

20

được gọi là phụ thuộc bắc cầu nêu tổn tại Z sao cho X Z, Z — Y Nêu không có

Z như

ly ta nói Y phụ thuộc hàm trực tiếp vào 5

1.142 Định nghĩa các dang chuẫn:

- Đạng chuẩn INE Một lược đồ quan hệ T được gọi là ö đựng chuẩn 1 (N#) nếu mọi thuộc tính của R là đơn, đơn trị không cỏ thuộc tính đa trị, nhỏm

thuộc tính đa trị (quan hệ trong quan hệ) [6]

- Dang chudn 2NF Luge đỗ quan hệ R ở dạng chuẩn 2 (2NE) nếu nó ở dang chuẩn 1 va moi thuộc tính không khoả của E dẻu phụ thuộc hảm dây đủ vào

xuột siêu khoá cửa R [2]

hận xét: Nếu một lược đỗ quan hệ l\ với lập phu thuge ham F & BCN thi

nó Ïà ở 3NF, tĐiều này đã được chứng mình trong [3])

1.143 Phân tách dica hược đề về các dạng chuẩn:

“Trong việc thiết kế sơ sở đít liệu quan hệ đởi hỏi các lược đồ quan hệ phải ở

các dạng chuẩn thích hợp đẻ tránh dư thừa đỡ liêu và các dị thường cập nhật Do đỏ đối với một lược đồ quan hệ <f, F> la mong mudn xác định một phân lách j — (Rị,

Ra, Rm) a0 cho p cd ba tinh chit sau:

? Có kếtnối không tổn thất (không mat mat thong tin)

ii) Bảo loàn tập phụ uộc hằm F

iv) Moi luge dé con Ry, Ry, ., Rn déu 6 SNF

~ Phân tách — hết nỗi không tôu thất về chudn BCNE

Để thực hiện phân Lách — kết nỗi không lẩn thất ta phân tách luợc đồ R thành

các lược dé con ở dạng chuẩn BCNE theo thuật toán sau:

Input: Luc 43 quan hé < R, F>

Trang 22

Output: Mét phan tach co kết nổi không tốn thất p = (Ry, Hạ, Ryd Vol

cdc luge a6 thank phan R,, i= 1 m ở dang chuan BCNT

Thudt todn 1.5 (Phân tách kết nỗi không tốn that dua luge dé vé chuin BCNF)

Bước 2: Néu trong p có lược đỗ 8 = < R,, F, > vị phạm BƠNE, tức là tổn tại

phụ thuộc hàm X + A được thoả trên S, nhưng X không phải là khoá của S và AeX thủ phân tách 8 thành bai lược dỗ với tập thuộc tính tương ứng là XÃ và RMA}

ước 3: Thue hign lai bude 2 dén khi trong p khéng có lược dỗ nảo vi phạm BCNF thi vòng lặp kết thúc

~ Phân tách bão toàn phy thudc ham vé chudn INE

Thuật toán 1.5 không đâm bảo sinh ra một phân tách bão toàn tập phụ thuộc

bam ¥, é dam bao dẫu ra của phân tách lả bảo toàn tập phụ thuộc ham F ta phan tách lược đã R thánh các lược 46 con ở dạng chuẩn 3NF theo thuật toán sau:

Input: Lược đồ quan hệ <'R, F > với giả thiết là phả tối tiêu

Output: Mét phân tách của R bảo toán tập F sao cho mỗi lược đồ con đều ở

3NF đối với hình chiêu của E lên hược đồ cơn đó

Thuật tuần 1.6 (Phan tách về dạng chudn 3NF va bao toàn lập F)

Bước 1: Nếu có những thuộc tỉnh của R không xuất hiện trong bất kỳ một phụ thuộc hảm nào của F thì ta tách các thuậc tính đó thành mét hroc đề quan hệ và

loại chúng ra khỏi R

ước 2: Nếu tên tại một phụ thuộc hàm chúa tất cả các thuộc tính của R thì phan tach can tim chinh 1a R

Bước 3: Trong trường hợp còn lại, kết quả gồm các lược đỗ ứng với các lập

thuộc tính có dang XA cho mỗi phụ thuộc ham XA trong F Nếu trong T có các

Trang 23

22

phụ thuộc hàm có củng về trái X + Ay, X Ag, ., K— Ay thi chung ta c6 thé str

dung lược đỗ XA¡Aa A; thay cho cáo lược đồ XA; với

Lp

Như vậy ta có thuật toán 1.5 đẻ phân tách kết nổi không tổn thất một lược dỗ quan hệ thánh các lược để con ở chuẩn IƠNH, vá thuật toán 1.6 để phân tách báo

†oàn tập phụ thuộc hàm E của một lược đồ quan hệ thanh các lược dé con ở chuẩn

3NF Vấn để đặt ra là có hay không một thuật loáu tạo ra một phân tách có cả hai

tính chất kết nổi không tổn thất và bảo toàn phụ thuộc với yêu cầu các lược đỗ con

chỉ ở 3NE ? Định lý sau đây khẳng định tổn tại một phép tách như vậy [3]

Định lý 1.5: (Phâu tách về đạng chuẩn 3E, có kết nói không tên thất và bảo toàn

tập phụ thuộc dữ liệu)

Gọi p là phân tách về dạng chuẩn 3NE và bão toán tập F được xây dung bởi

thuật toán 1.6, và gọi X lá một khoả của R Khi đó t= @X} +! p là một phản tách

của R trong đó mọi lược dé con đều là 3NE, phân tách đó bảo toán tập F và có kết nổi không tên thất

Chứng mảnh : Dịnh ý đã được chứng mình đây đủ trong [2, 3]

1.2 Phương pháp thiết kế Top — Duwn

Một cách liếp cận khác đổi với việc thiết kế cơ sở dữ liệu quan hệ, đó là cách thiết kế từ trên xuống (Top — Down), Đối với phương pháp thiết kế này trước hết ta

thiết kế cơ sở đữ liệu theo mỏ hinh thực thể liên kết, sau đó sứ dựng biểu để thục thê hiên kéL BR (Entity Relafionships) ảnh xạ sang mô hình quan hệ Đề thực hiện chuyển từ mô hình thực thẻ liên kết sang mô hình quan hệ ta phải tuân theo các nguyên tắc sau: [6]

~ Nguyên tắc 1: Với kiếu thực thế thông thường => chuyển thành một quan

hệ sao cho các thuộc tính của quan hệ là các thuộc tính đơn (hoặc các thành phân đơn của thuộc tính phưtc hợp) Khoá chính của quan hệ chọn một trong các khoá của

Trang 24

kết vào bang có các thực thể tham gia toàn bộ,

Với kiểu liên kết 1 — N : Lấy khoá chính của bảng bên l đưa

- Nguyên tác

sang làm khoá ngoài cũa bằng bén N

- Nguyên tắc 5: Với kiểu liên kếtM M: Thực hiện tạo thêm báng mới

Trong bảng mới lầy các thuệc tính là khoá chính của 2 bảng, nêu trong mỏi liên kết

có thuộc tỉnh liên kết thì đưa cả thuộc tính liên kết vào bang moi Khoa chính của

băng mới là khoá chỉnh của bảng bên N + khoá chính cúa bảng bên M

- Nguyên tắc 6: Với thuộc tính đa trị : Thực hiện loại bẻ thuộc tính đa trị trong bồng sau đó tạo thêm bằng mới Trong bâng mới lấy thuộc tính là khoá chỉnh của băng có thuộc tính đa trị và thuộc tính đa trị chuyển thành thuộc tính đơn trị Khoá chính của bang mdi là cả hai thuộc tinh cia bang,

7: Với kiểu liên kết

- Nguyên ấp cao (kiểu liên kết giữa ba kiểu thực thể

trở lên) Thực hiện tạo thêm bảng mới Trong bảng mới lấy các thuộc tỉnh lả các

khoá chính của các bằng tham gia liên kết, nêu trong môi liên kết có thuộc tỉnh liên

kết thì dưa cả thuộc tính liên kết vào bảng mới Khoá chỉnh của bảng mới là hợp các

khoá chính của các bảng tham gia liên kết

- Nguyên lắc 8: Với kiểu liêu kết đệ quy : Thực hiện bỗ sung thêm một thuộc tỉnh mới chứa giá trị khoá của thực thê liên kết độ quy

Vĩ dụ: Thiết kể cơ sở dữ liện quan hệ theo phương pháp Top — Down

Xây dựng CSDIT, quân lý công ty Sau khủ khảo sát thực tế các hoại động của

công ty dược mô tả bằng oác quy tắc sau:

1 Một công ty được tổ chức thành các đơn vị Mỗi đơn vị có một tên duy nhất,

một mã số duy nhật vã một nhân viên quân lý đem vị Việc rihân viên quân lý

đơn vị dược ghi lại bằng ngảy bất dâu Một dơn vị có thể có nhiều dịa diễm

2 Một đơn vị có thể kiểm soát một số dy an Méi dự án có một tên đuy nhất, một

mã số đuy nhật và một địa điểm

Trang 25

24

3 Mỗi nhân viên dược lưu giữ: Họ tên, Mã số BHXH, Địa chỉ, Lương, Giới tỉnh,

Ngày sinh Mỗi nhân viên làm việc cho một đơn vị nhưng có thể làm việc trên

nhiêu du dn do đơn vị đó kiếm soái Việc làm việc trên dự án của nhân viên

ó những người phụ Hộ (người phải nuôi) những người

mày được hưởng bảo luểm xã hội Thông tin vẻ những người phụ thuộc gồm có:

TIọ tên, ngày sinh, giới tính, mỗi quan hệ

© Thực hiện xâu dựng mô hình thực thể liên kết (Lược đỗ E-R):

Bước 1: Xác định các kiều thực thể

ĐÓNVi(Tên đơn vị, Mã sẻ 12V, Nhãn Viên QL, Dịa điểm, Ngày 1D),

DUAN(Tén dự án, Mã số DA, Địa điểm)

NHANVIEN(H@ tên, MSBHXH, Địa chỉ, Lương, giới tỉnh, Ngày sinh)

NGUOIPT(Ho tên, giới tính, ngày sinh, mối quan hệ) {Thực thế yêu}

Trong đó: các thuộc tỉnh gạch chân một nét là khoá của kiểu thực thể, thuộc

tinh gach chan hai nét là thuộc tính đa trị

Bước 2: Xác dịnh các liên kết

Trang 26

Bước 3: Xây dựng mô hình thực thể liên kết:

Hinh 1.2 Biéu 43 E-R cho CSDL cing ty

ø_ Ảnh xạ từ mô hình thực thể liên kết sang mô hình quan hệ

- Xét kiểu thực thể DONVICIên đơn vị, Mã số 2V, Nhân Viên QL, Dịa

điểm, Ngày BĐ): Gó thuộc tinh Pia did

Trang 27

26

DONVI(MSDV, TERNDV, MSBHXH, NGAYBD)

DV_DD(MSDV, DIADIEM

- Xét kiéu thie thé DUAN(Tén dy an, Mã số DA, Địa điểm): Có môi liên kết

N — 1 voi kiếu thực thế DONVI, có mỗi liên kết M — N với kiểu thực thế

NHANVIEN va thuộc tỉnh liên kết là Số giờ 1V Áp dụng các nguyên lắc 1, 4, 5 ta

có các lược đổ quan hệ

DUAN(MSDA, TENDA, DIADTEM, MSD)

NV_DA(MSDA, MSBIIXLL SOGIO)

NGUOIPT(MSBHXH, HOTEN, GIOITINH, NGAYSINH, MOIQH)

Cuỗi cùng la xây dựng được lược dd CSDT che bai loan quận lý céug ky nhur

DONVI(MSDV, TENDV, MSBELEML NGAYDD)

Trang 28

Quá trình thiết kế cơ sở đữ liệu được minh hoạ ở hình 1.3 Quả trình dó thực hiện theo các bước sau:

ước 1 lập bợp các yêu cầu và phân tích: I2ây lả yêu cầu kháo sát bái toán quân lý trong thực tế, ta phải thu thập các yêu cầu của người đùng và ghi chép lại ở dạng súc tích Những đặc tả này càng chỉ tiết và dây dủ cảng tớt

Bude 2 thiết kế khái niệm: Lựa chọn một mô hình dỡ liệu, dùng các khải tiệm của mô hình đó để chuyển những đặc tả yêu câu của người đùng thành một lược đỗ khái miệm Tược đỏ khái mệm bậc cao được dùng để đâm bão rằng kết quả của quá trình thiết kế cơ sở dữ liêu sẽ dáp ứng dược tắt cả yêu cầu của người dùng,

và đảm bảo rằng những yêu cảu đó không chứa mâu thuẫn Với bước thiết kế này,

Trgười tiết kế cơ sở đữ liệu phât đặt ra các raục liêu phải thực hiện, có thể lập trưng, vào việc đặc tả các tính chất của đữ liệu mả chưa cằn quan tâm dén các chỉ tiết về

In trữ

Bước 3 Thiết kế logic: Dưa ra được thuật toán dé thục hiện các công việc Thực hiện cài đặt cơ số dữ liệu bằng một Hệ quần trị cơ sở đữ liệu cụ thể Kết quả

của bước nảy là một lược đồ cơ sở dữ liệu đưới dạng mô lính đở liệu thê hiện của

TIệ quản trị cơ sở dữ liệu

Bước 4 Thiết kế vật lý: Các đặc điểm về mặt vật lý của cơ só dữ liệu phải

được đặc tả ở giai đơợm này; chúng bao gồm câu trúc lưu trữ liên trong, kiểu tỏ chức

tệp cho cơ sở dữ liệu, cơ sở dữ liệu đặt ở đầu, quản lý các phụ thuộc vào lIệ quán trị

cơ sở dữ liệu (phụ thuộc phân mẻm, phần cứng),

Trang 29

Các yêu cầu CSDL

Lược đồ khái niệm

= (Trong mô hình dữ liêu bậc cao)

Lược đô khái niệm

(Trong mô hình dữ liêu của một DBMS cu thể)

(đôi với cùng một DBMS cụ thê đó)

Trang 30

Hình 1.3 Quả trình thất kê một cơ sỡ đữ liệu

Trang 31

28

Chương II - LÝ THUYÉT KẾT NÓI VÀ NỬA KÉT NÓI ỨNG DỤNG TRONG TỎI ƯU HOÁ CÂU HỎI

2.1 Lý thuyết kết nỗi và một số kết quả của lý thuyết kết nồi

Trong lý thuyết thiết kế cơ sở đữ liệu quan hệ, để tránh dư thừa đứ liệu, tránh các dị thường cập nhật và tăng tốc độ trong quá mình truy vấn thông tín thí khi thiết

ké cơ sở đữ liệu thông thường ta tổ chức dữ liệu thành một tập các quan hệ có liên

quan logie với nhau Nhưng khi thực hiện các yêu dầu của người sử dụng, gác yêu câu này thường liên quan dén nhiễu thuộc tỉnh trên nhiều quan hệ khác nhau Do đó khi thực hiện các truy vẫn để trả lời các yêu cầu của người sử đụng bắt buộc chứng,

ta phái kết nội các quan hệ liên quan đến câu hỏi lại để tìm ra kết quả Tuy nhiên vẫn dẻ đặt ra là việc kết nổi các quan hệ lại có cung cấp cho ta kết quá chỉnh xác

không? Có xuất hiện kết quả ngoại lai trong câu trả lời không? Trong phản này sẽ

trình bảy một số kết quả về lý thuyết kết nói trong mô hình quan hệ |1 1 |

2.1.1 Kết nối không mắt (hông lin

Khải niệm vẻ kết nỗi không mắt thông tin (phân tách có kết nói không tổn

thất) và thuật toán kiểm tra phép nôi không mắt thông tin đã được trình bay day đủ

trong chương 1 (trang 16, 17) Sau day là hai kết quả bổ sung của lý thuyết kết nồi không mắt thông tin [11]

Trang 32

Trong ma trận trên ta thấy hàng Rạ và hàng Rạ giống nhau ở tất cả các cột

L toán kiểm tra phép

thuộc Linh trén Ry cy Ro Như vậy theo Ú tương ứng với

nổi không mất thông tin, nếu ký hiểu b trên cột của thuộc tính À bị dỗi thành a phải

có một phụ thuộc hàm X->A (với X Ry rv Ry) hay nói một cách khác ký hiệu b trên cột của thuộc tính A bị đổi thành a khi Ac(Rị =2)”, Do đỏ toàn bộ hàng, Rị trở thành a khi và chỉ khi Rạ - Rị C Œị Ra)”

Nếu Rạ, ., Ra va Su, Sự mỗi tập hợp đều có một phép nối không mat

thông tin, R = |JR,, 8 = [JS PzãR — 8 cũng lả phép nổi không mất thông tin,

joan a trong tất câ các cột của l_ q)

+ Do 8¡, ., S„ cò một phép nối không mắt thông ti Sử dụng thuật toán 1.4

ta sẽ tìm được mệt hàng chứa toàn a trong tắt cả các cột của S @

1 Do, 8 cũng có một phép nối không mất thông tin theo Hệ quả 2.1 ta có TK

5 -> 8 hoặc R ¬ 5 —+R @®)

Trang 33

Trong lý thuyết kết nổi, một vẫn để dược đặt ra là: Cho một tập R các lược

đỗ quan hệ, hỏi có tổn tại hay không một tập con của nó mả trên tập con này không,

có kết nói không xuất thông tín (tức là có kết nối mắt thông tin)

Chúng ta cần lưu ý rằng, đổi với hai lược đỏ quan hệ rời nhau (không có thuộc tính chung) thì khí kết nếi hai lược đỗ quan hệ nảy chắc chắn đó là kết nếi có xuất thông tin (còn gợi là tốn thất thông tín tâm thường) Trong thực tế thì không có

lý do gi để kết nói hai lược đỏ quan hệ rời nhau, do đỏ trong phân nảy chúng ta chỉ quan lâm tới các lỗn thất thông tim không Lâm thường (lồn thất thông tin kÌủ kết nối

đai lược đỗ có chung thuộc tính) Khi dó ta định nghĩa một tập con {Rạ, Rạ, Ra}

của Ð là không tim thường nếu nỏ không tổn tại một phần hoạch thảnh hai tập có

Tiợp rời nhau

Như vậy chắc chắn rằng, một diều kiện cho R dé không, cỏ phép nối tốn thất thông tin không tâm thường lả mọi cặp lược đồ không rời nhau của tập lược đồ

quan hệ R phải thoả mãn hệ quả 2.1

Đ nghiên cứu vẫn đề này chúng ta dùng một đỗ thị có hướng G{E) để biểu,

điển tập lược đỏ quan hệ R Mỗi đỉnh của đả thị là một hược đẻ quan hệ của R, có

một cung đi từ đính Q đến đỉnh 3 khi và chỉ khi Q ¬ 8 > 8 Ta dùng kỷ hiệu Q =>

8 để biểu thị một cũng từ Q đến S ( sử dụng ký hiệu => đế phân biệt với ky hiệu >

dùng cho phụ thuộc hàm) Như vậy nêu có Q —> 8 thí Q > 8 (bởi vì từ Q =2 § ta

Trang 34

Khi đỏ đồ thị G(R) được biểu điễn như sau

Hình 2.1 Đồ thị biễu diễn lược đồ quan hệ R

Như vậy bất cứ một cặp nảo của các lược đô quan hệ không rời nhau mà

không thoả mãn điều kiện của Hệ quả 2.1 (tức không có một cung nói giữa hai lược

đồ) thì sẽ có một phép nổi tổn thất thông tin Nhìn vào đổ thị hình 2.1 ta thấy phép

nổi PC va ZC lả mất thông tin Do đỏ nếu trong đỏ thị mả tỏn tại một cặp đỉnh

không rời nhau lại không nói được với nhau sẽ là điều kiên đủ đề kết luận tập các

lược đỏ cỏ kết nối mắt thông tin

Phần tiếp theo sẽ trình bảy một định lý xác định điều kiên cần và đủ để một

tập các lược đỏ quan hệ cỏ kết nỗi mắt thông tin hay không ?

Bê đề 21

Trang 35

én I- fw, v} là một thể hiện sao cho w, v giồng rửau trên các thuộc tính của

XỶ và khác nhau trên tất cả các thuộc tỉnh còn lại

To X fo Vị nên Vị \ X # Ø vị vậy với cach chon tén w va v khdc nhaw ib

nhật trên một thuộc tính của Y; với Vi: l Sign

Bay pid ta chỉ ra rằng với cach chon niu trén sẽ không vi phạm các phụ

thuộc hàm của lược đỗ quan hệ

Xét phụ thuộc hàm bắt kỳ Z —> LƯ của lược đô Nêu w và v giống nhau trên các thuộc tính của ⁄ thi ⁄ c XỶ, do đó U C XỈ vi vậy w vá v cũng giống nhau trên

các thuộc tính của UU Như vậy phụ tửmộc ham 7 —> U thoả mãn và bố để được chứng minh

Định nghĩa: (Miễn liên thông mạnh) [11]

Một miễn liên thông mạnh (strongly connected region — SCR) của một đồ thị

là một đỗ thủ con trong đó luôn tổn tại đường đi có hướng từ mỗi đỉnh đến các đỉnh

‘Theo định nghĩa của miễn liên thông mạnh thi sé tên tại một đường đi có

hưởng từ R¿ đến RB, gid su duréng dé la Sy, Sp, ., Su (S1 = Ri: Sm = Ry)

‘Theo định nghĩa của đồ thị G(R) sẽ tôn tại cưng đi từ S¡ đến S¡, ¡với mọi ] <

n, lite là S, S44 t8, +¡ với moi 1 < i <M Do dé § > S)4) voi moi 1 <i <

m

Suy ra S, > S$, > > Spe

Trang 36

Vay Bi Rị (5ị = Rị, S„ = Rị) và bê đề được chúng mính

Bé dé 2.3

Cho tập hợp R các lược đề thoả mãn điều kiện của hệ quả 2.1 (tức là với mọi

(Rụ, Rạ) là cặp lược đồ không rời nhau thì RạevRa-sRị hoặc RạrvRa-xRR;) Giả sứ xẳng đồ thị GŒ) có một niên Hên thông mạnh {T¡, Tạ, , Tu} và các đỉnh P, Q sao cho P > Ty, Q => T, va trong G(R) F/> Q, Y= P va không có một cung nào nồi

+DoP ST nén(P Ot) oT; a)

1 Theo bé dé 2.2 ta c6 Ty > T;,, vei moi i i<n

dodoTy >Mohe ut) >X @)

Te (1D), @), (3) ta cd Perl )P Suy ra tổn tại mét oung tr T, dén P, diéu

‘Ty bat ky đến P hoặc Q) Như

vậy P không lả tập con của X Lập luận tương tự ta cũng có Q không là tập con của

X

nảy trải với giả thiết (không có một cung nao ndi

Nếu P và Q không rời nhau thì ( P zš Q) —> P hoặc ( P z Q) —> Q đo đó

trong dé thi G(R) tổn tại một cung P > Q ho&e Q = P Điều nảy trái với giả thiết

dé 23, vay(PQ) &

của bd

Như vậy ta dã chứng mình duge cae két qua sau:

~_ Pkhông là tập con của X, suy ra (Ty v2 Tạ v2 c2 Tạ) /3 P,

— _ Q không là tập con của X, suy ra CHị «¿ Ï; k2 c2 Ta) />P

- (PQ)-Ø

Áp dụng bổ để 2.1 với P, Q, CHị cý Ta cà k2 ',) tạ có

Trang 37

34

Tổn tại một thẻ hiện I={w, v} (một bảng gồm có 2 hàng) sao cho w, v giống

nhau trên các thuộc tính của (T¡ ©¿ T; ©2 ©2 Tạ) và khác nhau ít nhất trên một

thuộc tính của P cũng như của Q

Do do khi ap dung phép chiéu lén P, Q, (T}UT,W UT,) ctia thé hién I ta c6

TIb() có 2 phân tử

THẹ Œ) cỏ 2 phân tử

TH x2 (1) chỉ có 1 phân từ

Nên: Tb)Tle@)4 Hạ „ „,)(1)có 4 phan tit

Trong khi Tp GQ ur Uryu.ut,) (Lehi e6 2 phan từ

Vay Pd Q bd T1Dd Tibd bd Ty 1a co mat thong tin

Đồ thi con của G(R) gồm các đỉnh P, Q va {Ty, Ty, ., Ta} thoa man bé dé 2.3 được gọi là đỏ thị con bị cắm và được ký hiệu như sau

Định lý 2_1 (Định lý cho điều kiện cân và đủ về kết nói không mát thông tin)

Cho R là một tập các lược đổ quan hé R cỏ một tập con có kết nồi mắt thông

tỉn không tâm thường, khi và chỉ khi một trong hai điều kiện sau xảy ra

(1) Tôn tại cặp lược đồ P, Q không rời nhau ( P ¬ Q £ Ø ) sao cho PAQ/> P

và P¬Q />Q

Trang 38

Theo hệ quả 2.1 và bỏ 3 dã chứng mình, ta thấy rằng nếi

xây ra thủ R có chứa một tập con có kết nói mất thông tín Tức là:

+ Nếu có (1) thì theo hệ quả 2.1 †a có P <1 Q là có mất thông tin

1 Nếu cé (2) thi theo bd dé 2.3 ta cd? Bét Q Bái Tì 4l T21 B1 Tạ là có

xnất thông tin

~ Điều hiện cần:

Bay giờ la giá sử điểu kiện (1) và (2) đều sai (túc không xây ra), ta phải

chứng mình R không cỏ tập con nào có kết nói mất thông tin

“Nhận xét: Nếu R có một tập con mà kết nối trên tập con này có tính chật mắt thông tín không tắm thường thì chúng ta có thể thay thế R bằng lập con nay trong phát biểu của định lý 2.1 Do đỏ, không mắt tính tổng quát ta xem như kết nổi trên toàn bộ R là miát thông tín

Trước hết ta thấy rằng nếu diễu kiện (1) không xây ra, tức lả với mọi cặp lược đổ T, Q không rời nhau thì D za Q —>P hoặc P z¬ Q —> Q

Bay gid ta sẽ vô hướng hoá đỗ thị có hướng G(R) thành Œ (R) như sau

P nổi với Q trong G4) khi và chí khi có cùng đi từ P đến Q hoặc cỏ cùng di

tit Q dén P trong G(R)

Ta sé chimg minh G(R) liên thông Khi đỏ sẽ gợi G(R) là giả liên thông (tức

là G() liên thông trên đỗ thị đã võ hướng hoá)

Giả sử G'Œ) khêéng liên thông, ta có thế chia tập đỉnh thành hai tập con

không rỗng, rời nhau {P\, , ạ} và {Q\, Qu} sao cho không có cạnh nối giữa Pị

và Qj với mọi ¡, j Mặt khác, đo kết nối trên R là không tâm thưởng nên giữa hai tập 42), Pal va {Qàụ, ., Qạ} phải có ít nhất một thuộc tình chúng, tức lả tồn tại P; ^

Trang 39

36

Q 4 Ø với 1 <¡<n, 1 <j<m Do điều kiện (1) không xảy ra, suy ra P; sẽ nói với

Qj tong G`(R) điều này trái với giả sử trên Vậy G'(R) liên thông

Để tiếp tục chứng minh định lý ta cần phải chứng mình hai bỗ đề sau:

BỗđÈ24

Trong mọi đỏ thị có hướng giả liên thông vả điều kiện (2) của định lý 2.1

không xảy ra thì với mọi đỉnh P, Q bất kỳ đều tên tại đỉnh T sao cho có đường đi có hướng từ T đến P và từ T đến Q (T có thẻ trùng với P hoặc Q)

Ta chứng mình bổ đề nảy bằng phương pháp quy nạp theo độ dải của đường

đi giả ngắn nhất từ P đến Q (tức là đường đi ngắn nhất từ P đến Q trong đỏ thị võ

hướng G'(R))

+ Nếu đỏ dài đỏ bằng 1: do có cạnh PQ trong G*(R) nên trong G(R) phải cỏ

cung đi từ P đến Q hoặc tử Q đến P Nếu cỏ cung đỏ đi từ P đến Q ta chọn T = P,

ngược lại ta chon T = Q

+ Gia str bé dé ding với mọi đường đi giả ngắn nhất từ P đến Q có độ dài

ngắn hơn ¡ Ta phải chứng minh bổ để đúng với đường đi giả ngắn nhất từ P đến Q

có độ dài bằng ¡, khi đó đường đi giả ngắn nhất từ P đến Q có độ dải ¡ là : P, Tị,

Tia, Q

Theo giả thiết quy nap bo để đúng với mọi đường đi giả ngắn nhất từ P đến

Q có độ đài ngắn hơn ¡ Khi đó ta có tôn tại đỉnh T sao cho có đường đi có hưởng từ

T đến P và từ T đến T;¡ Ta phải chứng minh tổn tại đỉnh TỶ sao cho cỏ đường đi cỏ

Trang 40

Hình 2.3 Mô phòng quan hệ giữa các đính

Trường hợp 2.1: Nếu tổn tại ¡ (1< ¡ š r) sao cho Ú; > Q, la chon TP = T khi

đó lá có diều phải chứng mình

Trường hợp 2.2: Nếu không tổn tại ¡ (1< ¡ < r) sao cho L1; => Q

Nhận xửt : Mọi j : L< j S , tổn tại kị > j, sao chơ tồn tại cạnh Q => Us, và

{Uy,, Tại, Ủ; 3 là mệt miền liên thông mạnh

Ta sé chứng minh nhận xét trên bằng phương pháp quy nạp lui

+ Khi j = r, chọn kị =r (do có cung Q => U,)

1 Giá sử nhận xéi đúng với j — # ¡ 1, tức là: 3 kạx¡ sao choQ > Uy, và {Uy „=2 Uz¿¡} là một miễn liên thông mạnh Ta phải chứng mình nhận xét

đúng với j = #, tửc là: I kạ sao cho Q => U,, va {U,,, , U,} la mot miễn liên

thông mạnh

Xét miễn liên thông mạnh {UI, „ s¿ Úự 1} và các đính U, Q; do điều kiện (2) của định lý dược giả sử lá không xảy ra, bức là trong R không tổn tại một dỗ thị

1 Un > Q voim mao dé: jim < kya)

ñ Uy > Upvoimuio dd :j<m <kyar

ii Q>U;,

Ngày đăng: 21/05/2025, 19:21

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1] Nguyễn Kim Anh (2006), Nguyên lý của các hệ cơ sở dit ligu, NXB Dai hoc Quốc gia Hà nội Sách, tạp chí
Tiêu đề: Nguyên lý của các hệ cơ sở dit ligu
Tác giả: Nguyễn Kim Anh
Nhà XB: NXB Đại học Quốc gia Hà Nội
Năm: 2006
2] Hỗ Thuản (1998). Cơ sở đữ liệu nâng cao, Đề cương chỉ tiệt cho các lớp Cao học, ĐHBK Hà nội Sách, tạp chí
Tiêu đề: Cơ sở đữ liệu nâng cao, Đề cương chỉ tiệt cho các lớp Cao học
Tác giả: Hỗ Thuản
Nhà XB: ĐHBK Hà nội
Năm: 1998
3] 11d Thuận, lễ Cảm Là (2004, 2005), Các hệ cơ sở: dữ liệu lý thuyết và thực hành, Tập T và T1, NXB Giáo dục, Hà nội Sách, tạp chí
Tiêu đề: Các hệ cơ sở: dữ liệu lý thuyết và thực hành, Tập T và T1
Tác giả: 11d Thuận, lễ Cảm Là
Nhà XB: NXB Giáo dục
Năm: 2004, 2005
4] Trinh Nhật Tiến (2006), Thiất ká và đánh giá thuội toán, Tập bài giãng cho các lớp Cao học, Dai hoc Công nghệ, Dai học Quốc gia Hà nội Sách, tạp chí
Tiêu đề: Thiất ká và đánh giá thuội toán, Tập bài giãng cho các lớp Cao học
Tác giả: Trinh Nhật Tiến
Nhà XB: Dai hoc Công nghệ
Năm: 2006
10] Lê Tiên Vương (2000), Nhập môn Cơ sở đữ liệu quan hé. NXB Thing kê, TEIICMTiếng Anh Sách, tạp chí
Tiêu đề: Nhập môn Cơ sở đữ liệu quan hé
Tác giả: Lê Tiên Vương
Nhà XB: NXB Thing kê
Năm: 2000

HÌNH ẢNH LIÊN QUAN

Hình  1.1  Bức  tranh  về  trật  tự  các  dạng  chuẩn - Luận văn nghiên cứu một số khía cạnh lý thuyết trong mô hình csdl quan hệ
nh 1.1 Bức tranh về trật tự các dạng chuẩn (Trang 20)
Hình  2.1  Đồ  thị  biễu  diễn  lược  đồ  quan  hệ  R - Luận văn nghiên cứu một số khía cạnh lý thuyết trong mô hình csdl quan hệ
nh 2.1 Đồ thị biễu diễn lược đồ quan hệ R (Trang 34)
Hình  2.2  Đồ  thị  con  bị  cắm - Luận văn nghiên cứu một số khía cạnh lý thuyết trong mô hình csdl quan hệ
nh 2.2 Đồ thị con bị cắm (Trang 37)
Hỡnh  2.4:  Kiến  trỳc  cỏc  lược  đồ  của  một  CSDL  phõn  tản - Luận văn nghiên cứu một số khía cạnh lý thuyết trong mô hình csdl quan hệ
nh 2.4: Kiến trỳc cỏc lược đồ của một CSDL phõn tản (Trang 51)
Hỡnh  2.6:  Cỏc  kiểu  phõn  đoạn  của  một  quan  hệ - Luận văn nghiên cứu một số khía cạnh lý thuyết trong mô hình csdl quan hệ
nh 2.6: Cỏc kiểu phõn đoạn của một quan hệ (Trang 53)
Hình  2.8  Các  đồ  thị  quan  hệ - Luận văn nghiên cứu một số khía cạnh lý thuyết trong mô hình csdl quan hệ
nh 2.8 Các đồ thị quan hệ (Trang 68)
Hình  2.9  Đã  thị  tray  vẫn  không  lên  thông - Luận văn nghiên cứu một số khía cạnh lý thuyết trong mô hình csdl quan hệ
nh 2.9 Đã thị tray vẫn không lên thông (Trang 69)
Hình  2  16  Rút  gạn  phân  đoạn  đọc - Luận văn nghiên cứu một số khía cạnh lý thuyết trong mô hình csdl quan hệ
nh 2 16 Rút gạn phân đoạn đọc (Trang 76)
Hình  2  18  Quá  trình  tối  tru  hoá  truy  vẫn - Luận văn nghiên cứu một số khía cạnh lý thuyết trong mô hình csdl quan hệ
nh 2 18 Quá trình tối tru hoá truy vẫn (Trang 78)
Hình  2.1  Các  cây  nỗi  trởng  dương - Luận văn nghiên cứu một số khía cạnh lý thuyết trong mô hình csdl quan hệ
nh 2.1 Các cây nỗi trởng dương (Trang 79)
Hình  2.20  Đồ  thị  nỗi  của  cây  truy  van - Luận văn nghiên cứu một số khía cạnh lý thuyết trong mô hình csdl quan hệ
nh 2.20 Đồ thị nỗi của cây truy van (Trang 90)
Hình  2.23  Truy  vẫn  mẫu  và  số  liệu  thống  kê - Luận văn nghiên cứu một số khía cạnh lý thuyết trong mô hình csdl quan hệ
nh 2.23 Truy vẫn mẫu và số liệu thống kê (Trang 106)
Hình  2.24  Đồ  thị  câu  truy  vẫn  đơn  và  số  liệu  thống  kê - Luận văn nghiên cứu một số khía cạnh lý thuyết trong mô hình csdl quan hệ
nh 2.24 Đồ thị câu truy vẫn đơn và số liệu thống kê (Trang 109)
Hình  3.1  Sơ  đồ  minh  hoạ  các  lớp  bài  toán  ANP,  NP-C,  NP-Hard - Luận văn nghiên cứu một số khía cạnh lý thuyết trong mô hình csdl quan hệ
nh 3.1 Sơ đồ minh hoạ các lớp bài toán ANP, NP-C, NP-Hard (Trang 122)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w