1. Trang chủ
  2. » Luận Văn - Báo Cáo

Về các phụ thuộc hàm xấp xỉ trong mô hình dữ liệu dạng khối

151 89 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 151
Dung lượng 3,21 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2NGUYỄN NĂNG HƯNG VỀ CÁC PHỤ THUỘC HÀM XẤP XỈ TRONG MÔ HÌNH DỮ LIỆU DẠNG KHỐI LUẬN VĂN THẠC SĨ MÁY TÍNH HÀ NỘI, 2014... LỜI CAM ĐOANT

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2

NGUYỄN NĂNG HƯNG

VỀ CÁC PHỤ THUỘC HÀM XẤP XỈ TRONG MÔ HÌNH DỮ LIỆU DẠNG KHỐI

LUẬN VĂN THẠC SĨ MÁY TÍNH

HÀ NỘI, 2014

Trang 2

LỜI CẢM ƠN

Tôi xin chân thành cảm ơn và tri ân sâu sắc đến PGS.TS Trịnh ĐìnhThắng đã tận tình hướng dẫn, giúp đỡ tôi trong quá trình nghiên cứu, hoànthành luận văn

Tôi xin chân thành cảm ơn Trường Đại học Sư phạm Hà Nội 2 quýThầy Cô giáo Lãnh đạo và các giảng viên, cán bộ của trường đã tạo điều kiệnthuận lợi cho tôi học tập, nghiên cứu và bảo vệ luận văn

Cảm ơn gia đình và những người thân đã ủng hộ, động viên, khích lệ,chia sẻ với tôi trong suốt quá trình học tập, nghiên cứu

TÁC GIẢ LUẬN VĂN

NGUYỄN NĂNG HƯNG

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan Luận văn: “Về các phụ thuộc hàm xấp xỉ trong

mô hình dữ liệu dạng khối” là công trình nghiên cứu của riêng bản

thân

Các số liệu trong luận văn là trung thực, được trích dẫn và cótính kế thừa, phát triển từ các tài liệu, tạp chí, các công trình đã nghiêncứu, ở trong nước và trên thế giới

Xây dựng chương trình tính toán phụ thuộc hàm xấp xỉ trong môhình dữ liệu dạng khối là chương trình do tôi tự viết Không sử dụngmột mã nguồn mở nào có sẵn

TÁC GIẢ

NGUYỄN NĂNG HƯNG

Trang 4

Trang phụ bìa

MỤC LỤC

i Lời cam đoan ii Mục

lục .iii

Danh mục các ký hiệu, các chữ viết tắt

vi Danh mục các bảng vii Danh mục các hình vẽ, đồ thị .viii MỞ ĐẦU i

CHƯƠNG 1: MÔ HÌNH CƠ SỞ DỮ LIỆU QUAN HỆ xiv

1.1 Thuộc tính, quan hệ, đại số quan hệ xiv

1.1.1 Thuộc tính và miền thuộc tính xiv

1.1.2 Quan hệ, lược đồ quan hệ .

xiv 1.2 Các phép toán đại số quan hệ

xvi 1.2.1 Phép hợp xvi

1.2.2 Phép giao xvi

1.2.3 Phép trừ xvii

1.2.4 Tích Đề-các xvii

1.2.5 Phép chiếu xviii

1.2.6 Phép chọn xix

1.2.7 Phép kết nối xx

1.2.8 Phép chia xxi

1.3 Phụ thuộc hàm

xxi 1.4 Bao đóng xxiii

Trang 5

1.4.1 Bao đóng của tập phụ thuộc hàm .xxiii 1.4.2 Bao đóng của tập thuộc tính đối với tập các phụ thuộc hàm xxiii

1.5 Khoá của quan

hệ xxiii

Trang 6

1.6 Phụ thuộc hàm và lớp tương đương

xxiv

1.6.1 Sự phân hoạch xxiv 1.6.2 Phân hoạch mịn hơn xxvi 1.6.3 Một số tính chất của phụ thuộc hàm và lớp tương đương .

xxvii

1.7 Phụ thuộc hàm xấp xỉ xxviii 1.8 Bao đóng của tập phụ thuộc hàm xấp xỉ xxxiii

1.9 Khoá xấp xỉ xxxiii

1.10 Một số Tính chất của phụ thuộc hàm xấp xỉ trên lược đồ quan hệ [9]

xxxv CHƯƠNG 2: MÔ HÌNH CƠ SỞ DỮ LIỆU DẠNG KHỐI xxxviii

2.1 Khối, lược đồ khối xxxviii

2.2 Lát cắt

xxxix 2.3 Đại số quan hệ trên khối

xl

2.3.1 Phép hợp xl 2.3.2 Phép giao xli 2.3.3 Phép trừ xli 2.3.4 Tích Đề các xli 2.3.5 Tích Đề các theo tập chỉ số xli 2.3.6 Phép chiếu xlii 2.3.7 Phép chọn xlii 2.3.8 Phép kết nối xliii 2.3.9 Phép chia xliv

2.4 Phụ thuộc hàm

xliv

Trang 7

2.5 Các tính chất của phụ thuộc hàm trên lược đồ khối xlv CHƯƠNG 3: PHỤ THUỘC HÀM XẤP XỈ TRONGMÔ HÌNH DỮ LIỆU DẠNG KHỐI xlix

3.1 Phụ thuộc hàm xấp xỉ trong mô hình dữ liệu khối xlix

Trang 8

3.2 Mối quan hệ giữa phụ thuộc hàm xấp xỉ trên khối và phụ thuộc hàm

xấp xỉ trên lát cắt liii

3.4 Một số tính chất

lvi 3.5 Cài đặt lx KẾT LUẬN .

54 TÀI LIỆU THAM KHẢO 55 PHỤ LỤC

58

Trang 9

DANH MỤC CÁC CHỮ VIẾT TẮT

Trang 10

DANH MỤC CÁC BẢNG

3 Bảng 1.3: Biểu diễn các quan hệ r, s và quan hệ r× s 9

Trang 11

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ

Trang 12

1 Lý do chọn đề tài MỞ ĐẦU

Để xây dựng được một hệ thống cơ sở dữ liệu tốt, người ta thường sửdụng các mô hình dữ liệu thích hợp Đã có một số mô hình được sửdụng trong các hệ thống cở sở dữ liệu như: mô hình thực thể - liên kết, môhình mạng, mô hình phân cấp, mô hình hướng đối tượng, mô hình dữ liệudatalog và mô hình quan hệ Trong số các mô hình này, có ba mô hình dữ liệuhay được sử dụng là mô hình phân cấp, mô hình mạng và mô hình quan

hệ Đối với ba mô hình này, mô hình quan hệ được quan tâm hơn cả, bởi vì

nó được xây dựng trên cơ sở toán học chặt chẽ Tuy nhiên, do các quan hệ

có cấu trúc phẳng (tuyến tính) nên mô hình này chưa đủ đáp ứng đối với cácứng dụng phức tạp, các cơ sở dữ liệu có cấu trúc phi tuyến tính

Trong những năm gần đây, việc nghiên cứu nhằm mở rộng mô hình dữliệu quan hệ đã được nhiều nhà khoa học quan tâm Theo hướng nghiên cứunày một mô hình được xem là mở rộng của mô hình dữ liệu quan hệ đãđược đề xuất đó là mô hình dữ liệu dạng khối Tuy nhiên mô hình nàymới xây dựng nên chưa hoàn thiện và hiện đang được quan tâm nghiên cứu,xem [7], [8], [9], [12] và các tài liệu dẫn trong đó

Với mong muốn tìm hiểu sâu hơn về những kiến thức đã học, mốiquan hệ và những ứng dụng của mô hình dữ liệu dạng khối, đặc biệt là

các phụ thuộc hàm xấp xỉ, tôi chọn đề tài “Về các phụ thuộc hàm xấp xỉ

trong mô hình dữ liệu dạng khối” để nghiên cứu.

2 Mục đích nghiên cứu

Nghiên cứu các tính chất của phụ thuộc hàm xấp xỉ trong mô hình

dữ liệu dạng khối nhằm góp phần hoàn chỉnh lý thuyết mô hình dữliệu dạng khối

Trang 13

3 Nhiệm vụ nghiên cứu

Tìm hiểu về phụ thuộc hàm xấp xỉ, nghiên cứu các tính chất của phụthuộc hàm xấp xỉ trong mô hình dữ liệu dạng khối Đồng thời nghiên cứu mốiquan hệ giữa phụ thuộc xấp xỉ trên khối và trên lát cắt

4 Đối tượng và phạm vi nghiên cứu

Phụ thuộc hàm xấp xỉ trong mô hình dữ liệu dạng khối

5 Phương pháp nghiên cứu

- Tìm hiểu tài liệu: Các bài báo đã được đăng và sách đã in liên quanmật thiết đến phụ thuộc hàm xấp xỉ trong mô hình dữ liệu dạng

khối

- Sử dụng các phương pháp phân tích tổng hợp các tài liệu và nhữngthông tin liên quan đến đề tài, kết hợp các nghiên cứu đã có trước đây củatác giả trong nước cùng với sự chỉ bảo, góp ý của thầy hướng dẫn để hoànthành nội dung nghiên cứu

6 Những đóng góp mới của đề tài

7 Cấu trúc của luận văn

Luận văn gồm: Lời mở đầu, ba chương nội dung, phần kết luận và tàiliệu tham khảo

Chương 1 Trình bày các khái niệm cơ bản nhất về mô hình quan hệ.

Trình bày các phép toán đại số trên mô hình quan hệ Phụ thuộc hàm xấp xỉ,một số tinh chất của phụ thuộc hàm xấp xỉ trên lược đồ quan hệ

Chương 2 Giới thiệu tổng quan về mô hình khối: Phụ thuộc hàm trên

khối, phụ thuộc hàm xấp xỉ trên khối

Chương 3 Phát biểu và chứng minh các tính chất của phụ thuộc hàm,

xấp xỉ trên khối Mối quan hệ giữa phụ thuộc hàm xấp xỉ trên khối và trên látcắt Phụ thuộc hàm xấp xỉ trên khối và phụ thuộc hàm xấp xỉ trên quan hệtrong mô hình dữ liệu quan hệ (khi khối suy biến thành quan hệ)

Trang 14

GIỚI THIỆU

Cơ sở dữ liệu là một trong những lĩnh vực quan trọng của công nghệthông tin Cơ sở dữ liệu đã được nghiên cứu, ứng dụng thành côngtrong nhiều lĩnh vực và đem lại hiệu quả kinh tế cao cho đời sống và xã hội

Đã có rất nhiều bài báo nghiên cứu về cơ sở dữ liệu và mô hình cơ sở dữ liệu

Có 3 mô hình thường được sử dụng: mô hình phân cấp, mô hình mạng và

mô hình quan hệ Trong đó mô hình quan hệ được quan tâm hơn cả Do cácquan hệ có cấu trúc phẳng (tuyến tính) nên mô hình này chưa đủ đáp ứngđối với các ứng dụng phức tạp, các cơ sở dữ liệu có cấu trúc phi tuyến,….Do

đó việc mở rộng mô hình dữ liệu quan hệ thành mô hình dữ liệu dạng khốinhằm mở ra khả năng quản lý dữ liệu, đáp ứng nhu cầu thực tế tốt hơn [2]

Phụ thuộc hàm là một loại ràng buộc dữ liệu giữa các thuộc tính trongmột cơ sở dữ liệu quan hệ, góp phần vào việc đảm bảo tính nhất quán của

dữ liệu, loại bỏ bớt dữ liệu dư thừa Phụ thuộc hàm cũng thể hiện tính chấtngữ nghĩa giữa các thuộc tính và có thể tồn tại trong một tập dữ liệu độclập với mô hình quan hệ Nghiên cứu về các phụ thuộc hàm là một hướngquan trọng trong thiết kế cơ sở dữ liệu quan hệ và đã đạt được nhiềuthành tựu [11, 12,

13, 20] bên cạnh đó nghiên cứu về phụ thuộc hàm trong mô hình dữ liệudạng khối [2] đã có những kết quả [2, 5] để tăng cường hơn nữa khả năngđảm bảo ngữ nghĩa, góp phần hoàn chỉnh thêm về mô hình dữ liệu dạng khối

i 1

id (i ) , X  Y là kí hiệu một phụ thuộc hàm Một khối r thoả X  Y

Từ định nghĩa phụ thuộc hàm ở trên, ta nhận thấy: nếu tồn

Trang 15

(hay phụ thuộc hàm X

 Y

không đúng trên r).

Trang 16

Trong thực hành, điều này tỏ ra quá chặt và cứng nhắc khi ta hình

dung quan hệ r có hàng nghìn bộ, trong đó chỉ có một vài bộ vi phạm phụ

mở rộng khái niệm phụ thuộc hàm (kinh điển) thành phụ thuộc hàm xấp xỉ(trong mô hình dữ liệu quan hệ, mô hình dữ liệu dạng khối) theo một cáchthức, một nghĩa nào đó là nhu cầu tất yếu và tự nhiên

Các phụ thuộc hàm xấp xỉ khai phá được từ mô hình cơ sở dữ liệuquan hệ, mô hình dữ liệu dạng khối là các mẫu quan trọng, là những tri thức

có giá trị về cấu trúc của các bộ dữ liệu

Trang 17

CHƯƠNG 1

MÔ HÌNH CƠ SỞ DỮ LIỆU QUAN HỆ

1.1 Thuộc tính, quan hệ, đại số quan hệ

1.1.1 Thuộc tnh và miền thuộc tính

Định nghĩa 1.1 [4], [6]

- Thuộc tính là đặc trưng của đối tượng

một hàm:

i

Ta có thể xem một quan hệ như một bảng, trong đó mỗi hàng (phầntử) là một bộ và mỗi cột tương ứng với một thành phần gọi là thuộc tính.Biểu diễn quan hệ r thành bảng như sau:

Trang 18

Bảng 1.2 :Bảng dữ liệu sinh viên

Trong đó các thuộc tính là MaSV: mã sinh viên; HOTEN: họ tên; NS:ngày sinh; DC: địa chỉ; KHOA: khoa

Bộ giá trị: (SV01, A, 24/01/92, HN, TOAN) là một bộ

t(X) (hoặc t.X) được gọi là giá trị của tập thuộc tính X trên bộ t

Định nghĩa 1.3 [4], [6]

Tập tất cả các thuộc tính trong một quan hệ cùng với mối liên hệ

giữa chúng được gọi là lược đồ quan hệ.

Trang 19

1.2 Các phép toán đại số quan hệ

Trang 20

r∩ s (A B C)

1.2.3 Phép trừ

Phép trừ của hai quan hệ khả hợp r và s, kí hiệu: r - s là tập tất cả các

bộ thuộc r nhưng không thuộc s Ta có:

kí hiệu là r × s, là tập tất cả các (m+n) - bộ có n thành phần đầu tiên là một

bộ thuộc r và m thành phần sau là một bộ thuộc s Ta có:

Trang 21

(r), là tập các bộ của r xác định trên tập thuộc tính X Ta có:

Cx

D)4

Trang 22

Phép chọn là phép toán lọc lấy ra một tập con các bộ của quan hệ

đã cho thoả mãn một điều kiện xác định Điều kiện đó được gọi là điều kiệnchọn hay biểu thức chọn

Biểu thức chọn F được định nghĩa là một tổ hợp logic của các toánhạng, mỗi toán hạng là một phép so sánh đơn giản giữa hai biến là hai thuộctính hoặc giữa một biến là một thuộc tính và một giá trị hằng Biểu thứcchọn F cho giá trị đúng hoặc sai đối với mỗi bộ đã cho của quan hệ khi kiểmtra riêng bộ đó

- Các phép toán so sánh trong biểu thức F: >, <, =, ≥, ≠, ≤

- Các phép toán logic trong biểu thức F: ∧ (và), ∨ (hoặc),  (phủ định).Cho r là một quan hệ và F là một biểu thức logic trên các thuộc tính của

các bộ của r thoả mãn F Ta có: 

F (r) = {t│ t ∈ r  F(t)}.

Trang 23

P(UV)= r*s= {u*v│u∈ r, v∈ s, u.M=v.M}

Nếu M= U∩V=Ф, r*s sẽ cho ta tích Đề- các, trong đó mỗi bộ của quan

hệ r sẽ được ghép với mọi bộ của quan hệ s

Trang 24

bộ v ∈ s thì khi ghép bộ t với bộ v ta được một bộ thuộc r.

s(A

x1

B)1

Trang 25

như loại bỏ đi những dư thừa dữ liệu trong một CSDL.

Phụ thuộc hàm là những mối quan hệ giữa các thuộc tính trong CSDLquan hệ Khái niệm về phụ thuộc hàm có một vai trò rất quan trọng trongviệc thiết kế mô hình dữ liệu Một trạng thái phụ thuộc hàm chỉ ra rằng giátrị của một thuộc tính được quyết định một cách duy nhất bởi giá trị củathuộc tính khác Sử dụng các phụ thuộc hàm để chuẩn hóa lược đồ quan

hệ về dạng chuẩn 3 hoặc chuẩn Boye-Codd

Trang 26

1.4 Bao đóng

1.4.1 Bao đóng của tập phụ thuộc hàm.

Định nghĩa 1.6 [1]

là tập lớn nhất chứa các phụ thuộc hàm được suy diễn từ các phụ thuộc hàm

1.4.2 Bao đóng của tập thuộc tính đối với tập các phụ thuộc hàm

Định nghĩa 1.7 [1]

Cho lược đồ quan hệ R xác định trên tập thuộc tính U, cho X ⊆ U, tập

tập tất cả các thuộc tính A mà X → A được suy diễn từ F Ta có:

1.5 Khoá của quan hệ

(i) K xác định được giá trị của Aj với mọi j = 1, 2, , n

(ii) Không tồn tại K' ⊆K mà K' có thể xác định được giá trị của Aj vớimọi j = 1,2, , n

Nghĩa là K là tập con nhỏ nhất mà giá trị của nó có thể xác định duy nhấtmột bộ giá trị của quan hệ

Trang 27

Cho lược đồ quan hệ R(A1, A2, ,An) và tập phụ thuộc hàm F, X  A1,

(tất cả các thuộc tính phụ thuộc vào tập thuộc tính X),

Siêu khoá(Supper key): K là siêu khóa của quan hệ R nếu

khóa của quan hệ

K ' 

Một lược đồ quan hệ Q của quan hệ R luôn luôn có ít nhất một siêu khóa và có thể có nhiều siêu khóa

Ví dụ: Cho lược đồ quan hệ R = (ABCD) và tập phụ thuộc hàm

F = { A → C, AB → DC}, khoá là {AB} Khi đó thuộc tính A, B gọi là thuộctính khoá, còn thuộc tính D, C gọi là thuộc tính không khóa

1.6 Phụ thuộc hàm và lớp tương đương

1.6.1 Sự phân hoạch

các bộ mà bằng nhau trên X thì cũng bằng nhau trên A, trong đó X  A

hiện bằng cách kiểm tra xem các bộ bất kì bằng nhau trên vế trái thì có bằngnhau trên vế phải của phụ thuộc hàm hay không

Các phương pháp tiếp cận mở rộng cho các phụ thuộc xấp xỉ đượcnghiên cứu và phát triển Một trong những cách tiếp cận là sử dụng các lớptương đương và các phân hoạch

Chúng ta dùng phương pháp phân hoạch chia các bộ dữ liệu thành cácnhóm dựa trên những giá trị khác nhau của mỗi cột (thuộc tính) Vớimỗi thuộc tính, số các nhóm bằng với số các giá trị khác nhau của mỗi thuộctính đó Mỗi nhóm được gọi là một lớp tương đương

Trang 28

Hai bộ t và u là tương đương đối với một tập X các thuộc tính chotrước nếu t[A] = u[A] với mọi A trong X Mỗi tập thuộc tính bất kỳ X phânhoạch các bộ của quan hệ thành các lớp tương đương Chúng ta biểu thịlớp

là:

tương đương là một phân hoạch của r theo X Như vậy mỗi lớp tương đương ứng

với một giá trị duy nhất cho tập thuộc tính X và hợp của các lớp tương đươngbằng với quan hệ r Bậc || của phân hoạch  là số lớp tương đương trong 

Thuộc tính A có giá trị “1” chỉ trong các bộ 1 và 2 vì vậy chúng tạo

giá trị “2” trong các bộ 3, 4, 5 và có giá trị “3” trong các bộ 6, 7, 8 Sau đây

Trang 29

8}} Các lớp tương đương với tổ hợp các thuộc tính {B, C} là {B, C} = {{1},{2}, {3, 4}, {5}, {6}, {7}, {8}}.

Phân hoạch của các thuộc tính:

1.6.2 Phân hoạch mịn hơn

Khái niệm phân hoạch mịn hơn liên quan trực tiếp với các phụ thuộchàm Một phân hoạch  mịn hơn một phân hoạch ‟ khác nếu mỗi lớp tương

đương trong  là tập con của một lớp tương đương nào đó của ‟

Trang 30

Các lớp tương đương đối với thuộc tính A: {{1, 2}, {3, 4, 5}, {6, 7,8}}, các lớp tương đương đối với thuộc tính E: {{1, 2}, {3, 4, 5}, {6, 7,8}} Vì các lớp tương đương của thuộc tính A mịn hơn các lớp tương đương của thuộc tính E, nên qua đó có thể phát hiện phụ thuộc hàm A  E

Thật vậy

Trang 31

đương của phân hoạch theo thuộc tính

X Chứng minh

Thật vậy:

 X Y

Ta có XY đúng, nên khi thêm Y vào tập X không tăng thêm số lớp

Vì thế t[X] = u[X] t[Y] = u[Y] Suy ra XY (2)

Từ (1) và (2) suy ra điều phải chứng minh

Sử dụng tính chất 2 để định nghĩa phụ thuộc hàm xấp xỉ trong cơ sở

dữ liệu quan hệ r.

1.7 Phụ thuộc hàm xấp xỉ

Các phụ thuộc hàm rất hữu ích trong việc phân tích và thiết kế cơ sở

dữ liệu quan hệ như xác định khóa, xác định các dạng chuẩn, các vấn đề về nhất

Trang 32

quán dữ liệu…Tuy nhiên trong thực tế do có một số giá trị dữ liệu khôngchính xác hoặc một số ngoại lệ nào đó làm cho các phụ thuộc hàmkhông thỏa Sự phụ thuộc tuyệt đối này dường như quá nghiêm ngặt khi tahình dung tới một quan hệ có hàng nghìn bộ, trong khi đó chỉ có khoảng vài

bộ vi phạm phụ thuộc hàm Điều này làm mất tính chất phụ thuộc vốn cógiữa các thuộc tính Ví dụ về những xe ô tô, nhãn mác xe được xác địnhbởi mô-đen Dựa vào điều đó, với mô-đen 323, chúng ta biết với xác suấtcao nhãn mác xe là Mazda, nhưng cũng có một xác suất nhỏ rằng nhãnmác xe là BMW Phụ

thuộc hàm xấp xỉ được mong đợi đó được xác định bởi Mô-đen  Nhãnmác xe.Vì vậy các nhà nghiên cứu đã mở rộng khái niệm phụ thuộc hàmthành phụ thuộc hàm xấp xỉ theo một cách thức, một nghĩa nào đó, các phụthuộc hàm xấp xỉ này cho phép có một số lượng lỗi nhất định của các bộ dữliệu đối với phụ thuộc hàm

Dưới đây, ta xem xét một số cách mở

rộng.

C á ch 1 [16]: Cho quan hệ r và phụ thuộc hàm

G1 ( X  Y , r) | {(u,v) | u,v  r,u[ X ]  v[ X ],u[Y ]  v[Y ]}|

Trang 33

- Trường hợp max(| t1 ( Ai ),t2 ( Ai ) |)  0 , tức t1 ( Ai )  t2 ( Ai )  0 ta qui ước:

Trang 35

1 2

X

Cho X ,Y  U Khi đó, Y được gọi là phụ thuộc hàm xấp xỉ vào X trên lược

đồ R(U ) dựa trên số tối thiểu  những hàng cần loại bỏ khỏi r được xác địnhnhư sau:

Cho X ,Y  U , Độ đo lỗi của phụ thuộc hàm xấp xỉ từ X vào Y được xácđịnh như sau:

g ( X  Y )  1  3 max{| s | s  r , s | X  Y }

| r |

Từ đó với mỗi phụ thuộc hàm f: XY với độ đo lỗi

Trang 36

c  và

đó A  B không thỏa

{B} = {{1}, {2}, {3, 4}, {5}, {6}, {7, 8}} Lớp tương đương {1, 2} trong 

Trang 37

F

bằng {1}  {2} lấy từ A  {B} , có kích thước lớn nhất của {1} và {2} là 1

Lớp tương đương {3, 4, 5} trong  A bằng {3, 4}  {5} lấy từ A  {B}, có kích

thước lớn nhất của {3, 4} và {5} là 2 Cuối cùng lớp tương đương {6, 7, 8}của  A bằng {6}  {7, 8} lấy từA  {B} , có kích thước lớn nhất của {6} và

{7, 8} là 2

trong 8 bộ ở ví dụ trên cần loại bỏ

nói phụ thuộc

hàm: A  B thỏa mãn xấp xỉ với tỷ lệ sai số  = 0.375.

1.8 Bao đóng của tập phụ thuộc hàm xấp xỉ

Định nghĩa 1.11 [8]

F  {X  ' Y}|  '  

Cho tập phụ thuộc hàm xấp xỉ F, bao đóng của tập phụ thuộc hàm xấp

xỉ được suy diễn từ các phụ thuộc hàm xấp xỉ thuộc F Vậy

Định nghĩa : Đặt A+ = { a: A  {a}  F+ } được gọi là bao đóng xấp xỉ của

1.9 Khoá xấp xỉ

Định nghĩa 1.12[8]

Định nghĩa 1.13[8]

Độ lỗi của một siêu khóa xấp xỉ là số hàng tối thiểu cần phải loại bỏ

Trang 38

một tập thuộc

g3(X) được xác định như sau: g3(X) = 1 -  X / r

Thuật toán thực hiện như sau:

Ví dụ:

xỉ của  = 0.05

Áp dụng thuật toán trên ta có:

Trang 39

1.10 Một số Tính chất của phụ thuộc hàm xấp xỉ trên lược đồ quan hệ [9]

Theo định nghĩa khóa xấp xỉ, độ đo lỗi được xác định như sau:

Theo định nghĩa độ đo lỗi của khóa xấp xỉ được xác định

Ta có |  X | là số phân hoạch theo giá trị

Ngày đăng: 24/01/2019, 05:57

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w