BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2NGUYỄN NĂNG HƯNG VỀ CÁC PHỤ THUỘC HÀM XẤP XỈ TRONG MÔ HÌNH DỮ LIỆU DẠNG KHỐI LUẬN VĂN THẠC SĨ MÁY TÍNH HÀ NỘI, 2014... LỜI CAM ĐOANT
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
NGUYỄN NĂNG HƯNG
VỀ CÁC PHỤ THUỘC HÀM XẤP XỈ TRONG MÔ HÌNH DỮ LIỆU DẠNG KHỐI
LUẬN VĂN THẠC SĨ MÁY TÍNH
HÀ NỘI, 2014
Trang 2LỜI CẢM ƠN
Tôi xin chân thành cảm ơn và tri ân sâu sắc đến PGS.TS Trịnh ĐìnhThắng đã tận tình hướng dẫn, giúp đỡ tôi trong quá trình nghiên cứu, hoànthành luận văn
Tôi xin chân thành cảm ơn Trường Đại học Sư phạm Hà Nội 2 quýThầy Cô giáo Lãnh đạo và các giảng viên, cán bộ của trường đã tạo điều kiệnthuận lợi cho tôi học tập, nghiên cứu và bảo vệ luận văn
Cảm ơn gia đình và những người thân đã ủng hộ, động viên, khích lệ,chia sẻ với tôi trong suốt quá trình học tập, nghiên cứu
TÁC GIẢ LUẬN VĂN
NGUYỄN NĂNG HƯNG
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan Luận văn: “Về các phụ thuộc hàm xấp xỉ trong
mô hình dữ liệu dạng khối” là công trình nghiên cứu của riêng bản
thân
Các số liệu trong luận văn là trung thực, được trích dẫn và cótính kế thừa, phát triển từ các tài liệu, tạp chí, các công trình đã nghiêncứu, ở trong nước và trên thế giới
Xây dựng chương trình tính toán phụ thuộc hàm xấp xỉ trong môhình dữ liệu dạng khối là chương trình do tôi tự viết Không sử dụngmột mã nguồn mở nào có sẵn
TÁC GIẢ
NGUYỄN NĂNG HƯNG
Trang 4Trang phụ bìa
MỤC LỤC
i Lời cam đoan ii Mục
lục .iii
Danh mục các ký hiệu, các chữ viết tắt
vi Danh mục các bảng vii Danh mục các hình vẽ, đồ thị .viii MỞ ĐẦU i
CHƯƠNG 1: MÔ HÌNH CƠ SỞ DỮ LIỆU QUAN HỆ xiv
1.1 Thuộc tính, quan hệ, đại số quan hệ xiv
1.1.1 Thuộc tính và miền thuộc tính xiv
1.1.2 Quan hệ, lược đồ quan hệ .
xiv 1.2 Các phép toán đại số quan hệ
xvi 1.2.1 Phép hợp xvi
1.2.2 Phép giao xvi
1.2.3 Phép trừ xvii
1.2.4 Tích Đề-các xvii
1.2.5 Phép chiếu xviii
1.2.6 Phép chọn xix
1.2.7 Phép kết nối xx
1.2.8 Phép chia xxi
1.3 Phụ thuộc hàm
xxi 1.4 Bao đóng xxiii
Trang 51.4.1 Bao đóng của tập phụ thuộc hàm .xxiii 1.4.2 Bao đóng của tập thuộc tính đối với tập các phụ thuộc hàm xxiii
1.5 Khoá của quan
hệ xxiii
Trang 61.6 Phụ thuộc hàm và lớp tương đương
xxiv
1.6.1 Sự phân hoạch xxiv 1.6.2 Phân hoạch mịn hơn xxvi 1.6.3 Một số tính chất của phụ thuộc hàm và lớp tương đương .
xxvii
1.7 Phụ thuộc hàm xấp xỉ xxviii 1.8 Bao đóng của tập phụ thuộc hàm xấp xỉ xxxiii
1.9 Khoá xấp xỉ xxxiii
1.10 Một số Tính chất của phụ thuộc hàm xấp xỉ trên lược đồ quan hệ [9]
xxxv CHƯƠNG 2: MÔ HÌNH CƠ SỞ DỮ LIỆU DẠNG KHỐI xxxviii
2.1 Khối, lược đồ khối xxxviii
2.2 Lát cắt
xxxix 2.3 Đại số quan hệ trên khối
xl
2.3.1 Phép hợp xl 2.3.2 Phép giao xli 2.3.3 Phép trừ xli 2.3.4 Tích Đề các xli 2.3.5 Tích Đề các theo tập chỉ số xli 2.3.6 Phép chiếu xlii 2.3.7 Phép chọn xlii 2.3.8 Phép kết nối xliii 2.3.9 Phép chia xliv
2.4 Phụ thuộc hàm
xliv
Trang 72.5 Các tính chất của phụ thuộc hàm trên lược đồ khối xlv CHƯƠNG 3: PHỤ THUỘC HÀM XẤP XỈ TRONGMÔ HÌNH DỮ LIỆU DẠNG KHỐI xlix
3.1 Phụ thuộc hàm xấp xỉ trong mô hình dữ liệu khối xlix
Trang 83.2 Mối quan hệ giữa phụ thuộc hàm xấp xỉ trên khối và phụ thuộc hàm
xấp xỉ trên lát cắt liii
3.4 Một số tính chất
lvi 3.5 Cài đặt lx KẾT LUẬN .
54 TÀI LIỆU THAM KHẢO 55 PHỤ LỤC
58
Trang 9DANH MỤC CÁC CHỮ VIẾT TẮT
Trang 10DANH MỤC CÁC BẢNG
3 Bảng 1.3: Biểu diễn các quan hệ r, s và quan hệ r× s 9
Trang 11DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Trang 121 Lý do chọn đề tài MỞ ĐẦU
Để xây dựng được một hệ thống cơ sở dữ liệu tốt, người ta thường sửdụng các mô hình dữ liệu thích hợp Đã có một số mô hình được sửdụng trong các hệ thống cở sở dữ liệu như: mô hình thực thể - liên kết, môhình mạng, mô hình phân cấp, mô hình hướng đối tượng, mô hình dữ liệudatalog và mô hình quan hệ Trong số các mô hình này, có ba mô hình dữ liệuhay được sử dụng là mô hình phân cấp, mô hình mạng và mô hình quan
hệ Đối với ba mô hình này, mô hình quan hệ được quan tâm hơn cả, bởi vì
nó được xây dựng trên cơ sở toán học chặt chẽ Tuy nhiên, do các quan hệ
có cấu trúc phẳng (tuyến tính) nên mô hình này chưa đủ đáp ứng đối với cácứng dụng phức tạp, các cơ sở dữ liệu có cấu trúc phi tuyến tính
Trong những năm gần đây, việc nghiên cứu nhằm mở rộng mô hình dữliệu quan hệ đã được nhiều nhà khoa học quan tâm Theo hướng nghiên cứunày một mô hình được xem là mở rộng của mô hình dữ liệu quan hệ đãđược đề xuất đó là mô hình dữ liệu dạng khối Tuy nhiên mô hình nàymới xây dựng nên chưa hoàn thiện và hiện đang được quan tâm nghiên cứu,xem [7], [8], [9], [12] và các tài liệu dẫn trong đó
Với mong muốn tìm hiểu sâu hơn về những kiến thức đã học, mốiquan hệ và những ứng dụng của mô hình dữ liệu dạng khối, đặc biệt là
các phụ thuộc hàm xấp xỉ, tôi chọn đề tài “Về các phụ thuộc hàm xấp xỉ
trong mô hình dữ liệu dạng khối” để nghiên cứu.
2 Mục đích nghiên cứu
Nghiên cứu các tính chất của phụ thuộc hàm xấp xỉ trong mô hình
dữ liệu dạng khối nhằm góp phần hoàn chỉnh lý thuyết mô hình dữliệu dạng khối
Trang 133 Nhiệm vụ nghiên cứu
Tìm hiểu về phụ thuộc hàm xấp xỉ, nghiên cứu các tính chất của phụthuộc hàm xấp xỉ trong mô hình dữ liệu dạng khối Đồng thời nghiên cứu mốiquan hệ giữa phụ thuộc xấp xỉ trên khối và trên lát cắt
4 Đối tượng và phạm vi nghiên cứu
Phụ thuộc hàm xấp xỉ trong mô hình dữ liệu dạng khối
5 Phương pháp nghiên cứu
- Tìm hiểu tài liệu: Các bài báo đã được đăng và sách đã in liên quanmật thiết đến phụ thuộc hàm xấp xỉ trong mô hình dữ liệu dạng
khối
- Sử dụng các phương pháp phân tích tổng hợp các tài liệu và nhữngthông tin liên quan đến đề tài, kết hợp các nghiên cứu đã có trước đây củatác giả trong nước cùng với sự chỉ bảo, góp ý của thầy hướng dẫn để hoànthành nội dung nghiên cứu
6 Những đóng góp mới của đề tài
7 Cấu trúc của luận văn
Luận văn gồm: Lời mở đầu, ba chương nội dung, phần kết luận và tàiliệu tham khảo
Chương 1 Trình bày các khái niệm cơ bản nhất về mô hình quan hệ.
Trình bày các phép toán đại số trên mô hình quan hệ Phụ thuộc hàm xấp xỉ,một số tinh chất của phụ thuộc hàm xấp xỉ trên lược đồ quan hệ
Chương 2 Giới thiệu tổng quan về mô hình khối: Phụ thuộc hàm trên
khối, phụ thuộc hàm xấp xỉ trên khối
Chương 3 Phát biểu và chứng minh các tính chất của phụ thuộc hàm,
xấp xỉ trên khối Mối quan hệ giữa phụ thuộc hàm xấp xỉ trên khối và trên látcắt Phụ thuộc hàm xấp xỉ trên khối và phụ thuộc hàm xấp xỉ trên quan hệtrong mô hình dữ liệu quan hệ (khi khối suy biến thành quan hệ)
Trang 14GIỚI THIỆU
Cơ sở dữ liệu là một trong những lĩnh vực quan trọng của công nghệthông tin Cơ sở dữ liệu đã được nghiên cứu, ứng dụng thành côngtrong nhiều lĩnh vực và đem lại hiệu quả kinh tế cao cho đời sống và xã hội
Đã có rất nhiều bài báo nghiên cứu về cơ sở dữ liệu và mô hình cơ sở dữ liệu
Có 3 mô hình thường được sử dụng: mô hình phân cấp, mô hình mạng và
mô hình quan hệ Trong đó mô hình quan hệ được quan tâm hơn cả Do cácquan hệ có cấu trúc phẳng (tuyến tính) nên mô hình này chưa đủ đáp ứngđối với các ứng dụng phức tạp, các cơ sở dữ liệu có cấu trúc phi tuyến,….Do
đó việc mở rộng mô hình dữ liệu quan hệ thành mô hình dữ liệu dạng khốinhằm mở ra khả năng quản lý dữ liệu, đáp ứng nhu cầu thực tế tốt hơn [2]
Phụ thuộc hàm là một loại ràng buộc dữ liệu giữa các thuộc tính trongmột cơ sở dữ liệu quan hệ, góp phần vào việc đảm bảo tính nhất quán của
dữ liệu, loại bỏ bớt dữ liệu dư thừa Phụ thuộc hàm cũng thể hiện tính chấtngữ nghĩa giữa các thuộc tính và có thể tồn tại trong một tập dữ liệu độclập với mô hình quan hệ Nghiên cứu về các phụ thuộc hàm là một hướngquan trọng trong thiết kế cơ sở dữ liệu quan hệ và đã đạt được nhiềuthành tựu [11, 12,
13, 20] bên cạnh đó nghiên cứu về phụ thuộc hàm trong mô hình dữ liệudạng khối [2] đã có những kết quả [2, 5] để tăng cường hơn nữa khả năngđảm bảo ngữ nghĩa, góp phần hoàn chỉnh thêm về mô hình dữ liệu dạng khối
i 1
id (i ) , X Y là kí hiệu một phụ thuộc hàm Một khối r thoả X Y
Từ định nghĩa phụ thuộc hàm ở trên, ta nhận thấy: nếu tồn
Trang 15(hay phụ thuộc hàm X
Y
không đúng trên r).
Trang 16Trong thực hành, điều này tỏ ra quá chặt và cứng nhắc khi ta hình
dung quan hệ r có hàng nghìn bộ, trong đó chỉ có một vài bộ vi phạm phụ
mở rộng khái niệm phụ thuộc hàm (kinh điển) thành phụ thuộc hàm xấp xỉ(trong mô hình dữ liệu quan hệ, mô hình dữ liệu dạng khối) theo một cáchthức, một nghĩa nào đó là nhu cầu tất yếu và tự nhiên
Các phụ thuộc hàm xấp xỉ khai phá được từ mô hình cơ sở dữ liệuquan hệ, mô hình dữ liệu dạng khối là các mẫu quan trọng, là những tri thức
có giá trị về cấu trúc của các bộ dữ liệu
Trang 17CHƯƠNG 1
MÔ HÌNH CƠ SỞ DỮ LIỆU QUAN HỆ
1.1 Thuộc tính, quan hệ, đại số quan hệ
1.1.1 Thuộc tnh và miền thuộc tính
Định nghĩa 1.1 [4], [6]
- Thuộc tính là đặc trưng của đối tượng
một hàm:
i
Ta có thể xem một quan hệ như một bảng, trong đó mỗi hàng (phầntử) là một bộ và mỗi cột tương ứng với một thành phần gọi là thuộc tính.Biểu diễn quan hệ r thành bảng như sau:
Trang 18Bảng 1.2 :Bảng dữ liệu sinh viên
Trong đó các thuộc tính là MaSV: mã sinh viên; HOTEN: họ tên; NS:ngày sinh; DC: địa chỉ; KHOA: khoa
Bộ giá trị: (SV01, A, 24/01/92, HN, TOAN) là một bộ
t(X) (hoặc t.X) được gọi là giá trị của tập thuộc tính X trên bộ t
Định nghĩa 1.3 [4], [6]
Tập tất cả các thuộc tính trong một quan hệ cùng với mối liên hệ
giữa chúng được gọi là lược đồ quan hệ.
Trang 191.2 Các phép toán đại số quan hệ
Trang 20r∩ s (A B C)
1.2.3 Phép trừ
Phép trừ của hai quan hệ khả hợp r và s, kí hiệu: r - s là tập tất cả các
bộ thuộc r nhưng không thuộc s Ta có:
kí hiệu là r × s, là tập tất cả các (m+n) - bộ có n thành phần đầu tiên là một
bộ thuộc r và m thành phần sau là một bộ thuộc s Ta có:
Trang 21(r), là tập các bộ của r xác định trên tập thuộc tính X Ta có:
Cx
D)4
Trang 22Phép chọn là phép toán lọc lấy ra một tập con các bộ của quan hệ
đã cho thoả mãn một điều kiện xác định Điều kiện đó được gọi là điều kiệnchọn hay biểu thức chọn
Biểu thức chọn F được định nghĩa là một tổ hợp logic của các toánhạng, mỗi toán hạng là một phép so sánh đơn giản giữa hai biến là hai thuộctính hoặc giữa một biến là một thuộc tính và một giá trị hằng Biểu thứcchọn F cho giá trị đúng hoặc sai đối với mỗi bộ đã cho của quan hệ khi kiểmtra riêng bộ đó
- Các phép toán so sánh trong biểu thức F: >, <, =, ≥, ≠, ≤
- Các phép toán logic trong biểu thức F: ∧ (và), ∨ (hoặc), (phủ định).Cho r là một quan hệ và F là một biểu thức logic trên các thuộc tính của
các bộ của r thoả mãn F Ta có:
F (r) = {t│ t ∈ r F(t)}.
Trang 23P(UV)= r*s= {u*v│u∈ r, v∈ s, u.M=v.M}
Nếu M= U∩V=Ф, r*s sẽ cho ta tích Đề- các, trong đó mỗi bộ của quan
hệ r sẽ được ghép với mọi bộ của quan hệ s
Trang 24bộ v ∈ s thì khi ghép bộ t với bộ v ta được một bộ thuộc r.
s(A
x1
B)1
Trang 25như loại bỏ đi những dư thừa dữ liệu trong một CSDL.
Phụ thuộc hàm là những mối quan hệ giữa các thuộc tính trong CSDLquan hệ Khái niệm về phụ thuộc hàm có một vai trò rất quan trọng trongviệc thiết kế mô hình dữ liệu Một trạng thái phụ thuộc hàm chỉ ra rằng giátrị của một thuộc tính được quyết định một cách duy nhất bởi giá trị củathuộc tính khác Sử dụng các phụ thuộc hàm để chuẩn hóa lược đồ quan
hệ về dạng chuẩn 3 hoặc chuẩn Boye-Codd
Trang 261.4 Bao đóng
1.4.1 Bao đóng của tập phụ thuộc hàm.
Định nghĩa 1.6 [1]
là tập lớn nhất chứa các phụ thuộc hàm được suy diễn từ các phụ thuộc hàm
1.4.2 Bao đóng của tập thuộc tính đối với tập các phụ thuộc hàm
Định nghĩa 1.7 [1]
Cho lược đồ quan hệ R xác định trên tập thuộc tính U, cho X ⊆ U, tập
tập tất cả các thuộc tính A mà X → A được suy diễn từ F Ta có:
1.5 Khoá của quan hệ
(i) K xác định được giá trị của Aj với mọi j = 1, 2, , n
(ii) Không tồn tại K' ⊆K mà K' có thể xác định được giá trị của Aj vớimọi j = 1,2, , n
Nghĩa là K là tập con nhỏ nhất mà giá trị của nó có thể xác định duy nhấtmột bộ giá trị của quan hệ
Trang 27Cho lược đồ quan hệ R(A1, A2, ,An) và tập phụ thuộc hàm F, X A1,
(tất cả các thuộc tính phụ thuộc vào tập thuộc tính X),
Siêu khoá(Supper key): K là siêu khóa của quan hệ R nếu
khóa của quan hệ
K '
Một lược đồ quan hệ Q của quan hệ R luôn luôn có ít nhất một siêu khóa và có thể có nhiều siêu khóa
Ví dụ: Cho lược đồ quan hệ R = (ABCD) và tập phụ thuộc hàm
F = { A → C, AB → DC}, khoá là {AB} Khi đó thuộc tính A, B gọi là thuộctính khoá, còn thuộc tính D, C gọi là thuộc tính không khóa
1.6 Phụ thuộc hàm và lớp tương đương
1.6.1 Sự phân hoạch
các bộ mà bằng nhau trên X thì cũng bằng nhau trên A, trong đó X A
hiện bằng cách kiểm tra xem các bộ bất kì bằng nhau trên vế trái thì có bằngnhau trên vế phải của phụ thuộc hàm hay không
Các phương pháp tiếp cận mở rộng cho các phụ thuộc xấp xỉ đượcnghiên cứu và phát triển Một trong những cách tiếp cận là sử dụng các lớptương đương và các phân hoạch
Chúng ta dùng phương pháp phân hoạch chia các bộ dữ liệu thành cácnhóm dựa trên những giá trị khác nhau của mỗi cột (thuộc tính) Vớimỗi thuộc tính, số các nhóm bằng với số các giá trị khác nhau của mỗi thuộctính đó Mỗi nhóm được gọi là một lớp tương đương
Trang 28Hai bộ t và u là tương đương đối với một tập X các thuộc tính chotrước nếu t[A] = u[A] với mọi A trong X Mỗi tập thuộc tính bất kỳ X phânhoạch các bộ của quan hệ thành các lớp tương đương Chúng ta biểu thịlớp
là:
tương đương là một phân hoạch của r theo X Như vậy mỗi lớp tương đương ứng
với một giá trị duy nhất cho tập thuộc tính X và hợp của các lớp tương đươngbằng với quan hệ r Bậc || của phân hoạch là số lớp tương đương trong
Thuộc tính A có giá trị “1” chỉ trong các bộ 1 và 2 vì vậy chúng tạo
giá trị “2” trong các bộ 3, 4, 5 và có giá trị “3” trong các bộ 6, 7, 8 Sau đây
Trang 298}} Các lớp tương đương với tổ hợp các thuộc tính {B, C} là {B, C} = {{1},{2}, {3, 4}, {5}, {6}, {7}, {8}}.
Phân hoạch của các thuộc tính:
1.6.2 Phân hoạch mịn hơn
Khái niệm phân hoạch mịn hơn liên quan trực tiếp với các phụ thuộchàm Một phân hoạch mịn hơn một phân hoạch ‟ khác nếu mỗi lớp tương
đương trong là tập con của một lớp tương đương nào đó của ‟
Trang 30Các lớp tương đương đối với thuộc tính A: {{1, 2}, {3, 4, 5}, {6, 7,8}}, các lớp tương đương đối với thuộc tính E: {{1, 2}, {3, 4, 5}, {6, 7,8}} Vì các lớp tương đương của thuộc tính A mịn hơn các lớp tương đương của thuộc tính E, nên qua đó có thể phát hiện phụ thuộc hàm A E
Thật vậy
Trang 31đương của phân hoạch theo thuộc tính
X Chứng minh
Thật vậy:
X Y
Ta có XY đúng, nên khi thêm Y vào tập X không tăng thêm số lớp
Vì thế t[X] = u[X] t[Y] = u[Y] Suy ra XY (2)
Từ (1) và (2) suy ra điều phải chứng minh
Sử dụng tính chất 2 để định nghĩa phụ thuộc hàm xấp xỉ trong cơ sở
dữ liệu quan hệ r.
1.7 Phụ thuộc hàm xấp xỉ
Các phụ thuộc hàm rất hữu ích trong việc phân tích và thiết kế cơ sở
dữ liệu quan hệ như xác định khóa, xác định các dạng chuẩn, các vấn đề về nhất
Trang 32quán dữ liệu…Tuy nhiên trong thực tế do có một số giá trị dữ liệu khôngchính xác hoặc một số ngoại lệ nào đó làm cho các phụ thuộc hàmkhông thỏa Sự phụ thuộc tuyệt đối này dường như quá nghiêm ngặt khi tahình dung tới một quan hệ có hàng nghìn bộ, trong khi đó chỉ có khoảng vài
bộ vi phạm phụ thuộc hàm Điều này làm mất tính chất phụ thuộc vốn cógiữa các thuộc tính Ví dụ về những xe ô tô, nhãn mác xe được xác địnhbởi mô-đen Dựa vào điều đó, với mô-đen 323, chúng ta biết với xác suấtcao nhãn mác xe là Mazda, nhưng cũng có một xác suất nhỏ rằng nhãnmác xe là BMW Phụ
thuộc hàm xấp xỉ được mong đợi đó được xác định bởi Mô-đen Nhãnmác xe.Vì vậy các nhà nghiên cứu đã mở rộng khái niệm phụ thuộc hàmthành phụ thuộc hàm xấp xỉ theo một cách thức, một nghĩa nào đó, các phụthuộc hàm xấp xỉ này cho phép có một số lượng lỗi nhất định của các bộ dữliệu đối với phụ thuộc hàm
Dưới đây, ta xem xét một số cách mở
rộng.
C á ch 1 [16]: Cho quan hệ r và phụ thuộc hàm
G1 ( X Y , r) | {(u,v) | u,v r,u[ X ] v[ X ],u[Y ] v[Y ]}|
Trang 33- Trường hợp max(| t1 ( Ai ),t2 ( Ai ) |) 0 , tức t1 ( Ai ) t2 ( Ai ) 0 ta qui ước:
Trang 351 2
X
Cho X ,Y U Khi đó, Y được gọi là phụ thuộc hàm xấp xỉ vào X trên lược
đồ R(U ) dựa trên số tối thiểu những hàng cần loại bỏ khỏi r được xác địnhnhư sau:
Cho X ,Y U , Độ đo lỗi của phụ thuộc hàm xấp xỉ từ X vào Y được xácđịnh như sau:
g ( X Y ) 1 3 max{| s | s r , s | X Y }
| r |
Từ đó với mỗi phụ thuộc hàm f: XY với độ đo lỗi
Trang 36c và
đó A B không thỏa
{B} = {{1}, {2}, {3, 4}, {5}, {6}, {7, 8}} Lớp tương đương {1, 2} trong
Trang 37F
bằng {1} {2} lấy từ A {B} , có kích thước lớn nhất của {1} và {2} là 1
Lớp tương đương {3, 4, 5} trong A bằng {3, 4} {5} lấy từ A {B}, có kích
thước lớn nhất của {3, 4} và {5} là 2 Cuối cùng lớp tương đương {6, 7, 8}của A bằng {6} {7, 8} lấy từA {B} , có kích thước lớn nhất của {6} và
{7, 8} là 2
trong 8 bộ ở ví dụ trên cần loại bỏ
nói phụ thuộc
hàm: A B thỏa mãn xấp xỉ với tỷ lệ sai số = 0.375.
1.8 Bao đóng của tập phụ thuộc hàm xấp xỉ
Định nghĩa 1.11 [8]
F {X ' Y}| '
Cho tập phụ thuộc hàm xấp xỉ F, bao đóng của tập phụ thuộc hàm xấp
xỉ được suy diễn từ các phụ thuộc hàm xấp xỉ thuộc F Vậy
Định nghĩa : Đặt A+ = { a: A {a} F+ } được gọi là bao đóng xấp xỉ của
1.9 Khoá xấp xỉ
Định nghĩa 1.12[8]
Định nghĩa 1.13[8]
Độ lỗi của một siêu khóa xấp xỉ là số hàng tối thiểu cần phải loại bỏ
Trang 38một tập thuộc
g3(X) được xác định như sau: g3(X) = 1 - X / r
Thuật toán thực hiện như sau:
Ví dụ:
xỉ của = 0.05
Áp dụng thuật toán trên ta có:
Trang 391.10 Một số Tính chất của phụ thuộc hàm xấp xỉ trên lược đồ quan hệ [9]
Theo định nghĩa khóa xấp xỉ, độ đo lỗi được xác định như sau:
Theo định nghĩa độ đo lỗi của khóa xấp xỉ được xác định
Ta có | X | là số phân hoạch theo giá trị