Bài viết này giới thiệu một mô hình cơ sở dữ liệu quan hệ mờ là mở rộng của mô hình cơ sở dữ liệu quan hệ truyền thống với hai đặc tính chính: Các quan hệ biểu diễn tập các bộ dữ liệu là quan hệ mờ, các điều kiện chọn được kết hợp với giá trị tập mờ để có thể truy vấn thông tin mờ, không chính xác của các đối tượng trong các quan hệ.
Trang 1ÁP DỤNG LÝ THUYẾT TẬP M ĐỂ MỞ RỘNG CSDL QUAN HỆ
NGUYỄN HÒA (*) NGUYỄN THỊ UYÊN NHI (**)
T M TẮT
-Fuzzy Relational
e M e ) r ủ r ) )
r r ủ
r M ủ
r r
ủ M
ủ
r ủ r
r
óa: tậ ờ, qu ờ, sở d u qu ờ é o ạ s qu ờ
ABSTRACT
This paper introduces a fuzzy relational data base model (FRDB) that extends the conventional relational data base model with two key features: (1) the relations represent the set of data tuples to be the fuzzy relations; (2) selection conditions are associated with fuzzy set values to be able to query the fuzzy, imprecise information of objects in relations
An interpretation of the membership degree of tuples for fuzzy relations is proposed on the foundation of the fuzzy set theory as the basis to develop the data and data manipulating model of FRDB including schemas, fuzzy relations and algebraic operations Some properties of the fuzzy relational algebraic operations also are formulated and proven as those that are extended of the properties of relational algebraic operations in the conventional relational data base model
Keywords: fuzzy set, fuzzy relation, fuzzy relational data base, fuzzy relational
algebraic operation
1 GIỚI THIỆU(*)(**)
Như chúng ta đã biết, mô hình sở
d u qu uyề (conventional
relational data base), được đề nghị bởi
Codd E.F năm 1 70 ([2]), đã chứng tỏ
nhiều ưu điểm trong các vấn đề mô hình
hóa, thiết kế và hiện thực các hệ thống lớn,
(*) TS, Trường Đại học Sài Gòn
(**) ThS, Trường Đại học Sài Gòn
từ phần mềm cho đến cơ sở dữ liệu (CSDL) Tuy nhiên, các ứng dụng dựa trên
mô hình CSDL quan hệ truyền thống không biểu diễn được các đối tượng mà thông tin về chúng không được xác định một cách rõ ràng và chính xác Điều đó làm hạn chế khả năng mô hình hóa và giải quyết các bài toán áp dụng trong thế giới thực Chẳng hạn, các ứng dụng mô hình
Trang 2CSDL truyền thống không thể trả lời được
các truy vấn kiểu như “tìm tất cả những
bệnh nhân ẻ có tiền sử bệnh viêm thanh
quản”; hoặc “tìm tất cả các gói bưu kiện có
trọng lượng k oả 10 kg và được vận
chuyển trong thời gian k oả 36 giờ từ
Hà Nội đến Sài Gòn”, v.v Trong đó ẻ,
k oả 10 kg và k oả 36 giờ là những
khái niệm và giá trị không chính xác Để
khắc phục được các hạn chế như vậy, cần
phải xây dựng các mô hình dữ liệu có khả
năng biểu diễn và xử lý được các đối tượng
mà các thông tin về chúng có thể không rõ
ràng (mờ) và không chính xác
Trong những năm qua đã có nhiều mô
hình cơ sở dữ liệu quan hệ dựa trên lý
thuyết ậ ờ (fuzzy set) được nghiên cứu
và xây dựng nhằm mô hình hóa các đối
tượng mà thông tin về chúng mờ, không
chính xác [1], [3], [7], [9], [10] Các mô
hình như vậy gọi là ô ì sở d u
qu ờ (fuzzy relational data base
model) Tuy nhiên, do tính đa dạng và
phức tạp về sự tồn tại của các đối tượng
cũng như các mối quan hệ của chúng nên
khó có mô hình nào có thể biểu diễn và xử
lý hết mọi khía cạnh không chắc chắn và
không chính xác về thông tin của các đối
tượng trong thế giới thực Vì vậy, các mô
hình CSDL mờ vẫn được tiếp tục nghiên
cứu và phát triển để đáp ứng các mục tiêu
ứng dụng khác nhau
Có hai cách tiếp cận chính để biểu diễn
dữ liệu mờ trong mô hình CSDL mờ: (1)
biểu diễn giá trị thuộc tính bằng các giá trị
tập mờ trong quan hệ mờ; (2) biểu diễn giá
trị thuộc tính bằng các giá trị rõ trong quan
hệ mờ
Trong cách tiếp cận thứ nhất, giá trị thuộc tính quan hệ được biểu diễn bằng một tập mờ và được diễn dịch bởi hàm thành viên của nó ([4], [7], [ ], [11]) Trong các mô hình được xây dựng bằng cách tiếp cận này, các quan hệ hai ngôi cổ điển giữa các thuộc tính được mở rộng thành các quan hệ mờ Mức độ thành viên của các bộ được ẩn trong mức độ thành viên của các giá trị thuộc tính Trong cách tiếp cận thứ hai, giá trị thuộc tính quan hệ được biểu diễn bằng một giá trị đơn rõ trong một quan hệ mờ trên các miền giá trị của các thuộc tính đó ([ ], [ ], [10]) Trong các mô hình được xây dựng bằng cách tiếp cận này, các quan hệ nhiều ngôi cổ điển (quan hệ trên các lược đồ CSDL) được mở rộng thành các quan hệ nhiều ngôi mờ và mức độ thành viên của các giá trị thuộc tính được ẩn trong mức độ thành viên của các bộ trong các quan hệ mờ này
Trong bài báo này, chúng tôi đề nghị một mô hình CSDL quan hệ mờ (FRDB) dựa trên cách tiếp cận thứ hai Để xây dựng FRDB, chúng tôi áp dụng lý thuyết tập mờ ([6], [12]), mở rộng quan hệ và các phép toán đại số quan hệ truyền thống ([5]) thành quan hệ mờ và các phép toán đại số quan hệ mờ Chúng tôi cũng đề nghị một diễn dịch mức độ thành viên của các bộ đối với một quan hệ cho các điều kiện chọn làm cơ sở để truy vấn với thông tin mờ, không chính xác trong FRDB
Cơ sở toán học để phát triển FRDB được trình bày trong Phần 2, lược đồ và thể hiện FRDB được giới thiệu trong Phần 3 Phần 4 trình bày các phép toán đại số trên FRDB và cuối cùng, Phần là một số kết
Trang 3luận và hướng nghiên cứu trong tương lai
2 CƠ SỞ TOÁN HỌC CỦA FRDB
Phần này giới thiệu tập mờ và quan hệ
mờ như là cơ sở toán để phát triển FRDB
Tập mờ được sử dụng để biểu diễn các truy
vấn với thông tin không rõ ràng, quan hệ
mờ được sử dụng để mở rộng các quan hệ
trong FRDB
2.1 ập mờ
Tập mờ là khái niệm mở rộng của tập
cổ điển và được định nghĩa như sau
Định nghĩa 2.1.1 Giả sử X là một tập
khác rỗng, một ánh xạ từ X đến khoảng
đóng [0, 1], A: X [0, 1], xác định ộ
ậ ờ (fuzzy set) A trên X Ánh xạ A
được gọi là hàm thành viên (membership
function) của tập mờ A Với mỗi x X,
A (x) là ộ (membership
degree) của x đối với A
Để đơn giản, ký hiệu A: X [0, 1] có
thể được sử dụng để biểu diễn tập mờ A
Ví dụ 2.1.1 Một ví dụ đơn giản về tập
mờ là tập các số gần số 2, about_2, được
cho bởi hàm thành viên của nó như sau:
] 3 , 1 [ 0
] 3 , 2 ( 3
] 2 , 1 [ 1 2
_
x
x x
x x about
và đồ thị hàm thành viên của about_2
như trong Hình 2.2.1
Hì 2.1.1: Tậ ờ s ầ 2
2.2 Bi u diễn tập mờ
Trong các ứng dụng, ngoài cách biểu
diễn tập mờ A như một hàm thành viên A:
X → [0, 1], còn có một số cách biểu diễn
tập mờ như sau:
1 Đối với tập X hữu hạn, một tập mờ
A trên X thường được biểu diễn bởi một hệ
thức có dạng A = , trong đó a i =
A(x i) ≠ 0
2 Đối với tập X vô hạn không đếm
được, thường là tập số thực, một tập mờ A
trên X có thể được biểu diễn bởi
Chúng tôi lưu ý dấu tích phân ở đây chỉ có ý nghĩa thể hiện một tập vô hạn
không đếm được các cặp x và A(x) trong X định nghĩa cho A
2.3 C c p ép t n trên tập mờ
Các phép toán trên các tập mờ được định nghĩa một cách tổng quát dựa trên các ánh xạ từ tập tích Descartes của các khoảng đóng [0,1] đến khoảng đóng [0,1] Tuy
nhiên, phần này chỉ giới thiệu các phép
o uẩ (standard operation) trên các
tập mờ ([6], [12]) được ứng dụng trong
FRDB
Định nghĩa 2.3.1 Giả sử A, B là hai tập
mờ trên tập X và có các hàm thành viên lần
lượt là A, B Phép toán lấy phần bù của
A, hợp, giao và hiệu của A và B được định
nghĩa theo hàm thành viên của chúng như sau
1 Ac (x) = 1-A (x), x X
2 AB (x) = max( A (x), B (x)), x X
3 AB (x) = min( A (x), B (x)), x X
4 A-B (x) = min( A (x), 1-B (x)), x X
Trang 42.4 Quan ệ mờ
Khái niệm quan hệ mờ là cơ sở để xây
dựng CSDL quan hệ mờ Quan hệ mờ được
định nghĩa bằng cách mở rộng quan hệ cổ
điển như sau
Định nghĩa 2.4.1 Giả sử A1, A2,…, A k
là các tập khác rỗng, một quan hệ mờ
k-ngôi R giữa k tập A1, A2,…, A k là một tập
con mờ của tập tích Descartes A1A2
…A k
Như vậy, một quan hệ mờ k-ngôi R
được kết hợp với một hàm thành viên R:
A1A2 …A k[0,1] Trường hợp quan hệ
mờ 2-ngôi R giữa X, Y (là cơ sở để xây
dựng các phép toán mờ 2-ngôi), là một tập
mờ R = {(x,y): R (x,y) | (x, y) X×Y } với
hàm thành viên R (x,y): X×Y → [0,1]
3 LƯỢC ĐỒ VÀ QUAN HỆ FRDB
Lược đồ và quan hệ FRDB được mở
rộng từ lược đồ và quan hệ CSDL quan hệ
truyền thống để biểu diễn khả năng các bộ
thuộc về một quan hệ mờ
3.1 ược đồ FRDB
Một lược đồ FRDB gồm một tập thuộc
tính kết hợp với một hàm thành viên làm
cơ sở để xác định các quan hệ mờ, được
định nghĩa như sau:
Định nghĩa 3.1.1 Một ượ ồ quan h
mờ (fuzzy relational schema) là một bộ đôi
R = (U, ) trong đó
1 U = {A1, A2, …, A k} là một tập các
thuộc tính đôi một khác nhau (biểu diễn
thông tin về giá trị các đối tượng trong
quan hệ)
2 là một ánh xạ đặt tương ứng mỗi
(v1, v2,…, v k) D1D2…D k với một số
thực thuộc [0, 1], trong đó D i là miền giá
trị của thuộc tính A i (i = 1, …, k)
Chúng tôi lưu ý rằng, như trong CSDL quan hệ truyền thống, để đơn giản, có thể
viết R(U, ) thay cho cách viết R = (U, )
Ngoài ra, mỗi t = (v1, v2,…, v k) được gọi là
một bộ trên tập thuộc tính {A1, A2, …, A k}
Ví dụ 3.1.1 Một lược đồ quan hệ mờ PATIENT trong FRDB mô tả về các bệnh
nhân có thể như sau:
PATIENT(PATIENT_ID,
PATIENT_NAME, AGE, SEX, ), với
là ánh xạ
: string string real binary[0,
1], trong đó string, real và binary là các
miền giá trị của các thuộc tính PATIENT_ID, PATIENT_NAME, AGE
và SEX
3.2 Quan ệ FRDB
Quan hệ mờ được mở rộng từ quan hệ truyền thống với mức độ thuộc được gán cho mỗi bộ như định nghĩa dưới đây
Định nghĩa 3.2.1 Giả sử U = {A1, A2,
… A k} là một tập thuộc tính đôi một khác
nhau, một quan h mờ (fuzzy relation) r
trên lược đồ R(U, ) là một tập hữu hạn
các bộ {t1, t2,…, t n} trên tập các thuộc tính
{A1, A2, …, A k}, được kết hợp tương ứng với các giá trị (t i) biểu diễn mức độ thuộc
của t i trong r Các ký hiệu t.A hoặc t[A]
biểu thị giá trị thuộc tính A của bộ t trong r Mức độ thuộc của t i trong r được ký hiệu là
r (t i)
Chúng tôi cũng dùng ký hiệu t[X] để
biểu thị giá trị thu hẹp của bộ t trên tập
thuộc tính X {A1, A2 … A k}
trên lược đồ PATIENT(PATIENT_ID,
MEDICAL_HISTORY, ) có thể như
Trang 5Bảng 3.2.1
Phụ thuộc hàm mờ trong FRDB được
mở rộng từ phụ thuộc hàm trong CSDL truyền thống như định nghĩa 3.2.2
Bảng 3.2.1: M t quan hệ mờ trên lược đồ PATIENT
Định nghĩa 3.2.2 Cho một lược đồ
quan hệ mờ R(U, ), r là một quan hệ mờ
bất kì trên R, X và Y là hai tập con các
thuộc tính của U Một ph thuộc hàm mờ
(fuzzy function dependence) của Y đối với
X trên lược đồ quan hệ R, ký hiệu là X ⇝
Y, nếu
t1, t2 r (r (t1) r (t2) t1[X] =
t2[X]) f (t1[Y] = t2[Y]), trong đó
a f b =
b a b
a
b a
khi ), ( 1
khi , 1
Phụ thuộc hàm X ⇝ Y còn được gọi là
“X xác định hàm Y” hoặc “Y phụ thuộc
hàm vào X”
Lưu ý rằng, khi giá trị hàm r bằng 1
với mọi r trên R, phụ thuộc hàm mờ trong
định nghĩa này sẽ đồng nhất với phụ thuộc
hàm trong CSDL truyền thống
Bây giờ CSDL quan hệ mờ là mở rộng
của CSDL quan hệ truyền thống và được
định nghĩa như sau
Định nghĩa 3.2.3 Một sở d li u
quan h mờ (fuzzy relational database) trên
một tập các thuộc tính A là một tập các
quan hệ mờ tương ứng với tập các lược đồ quan hệ mờ của chúng
Lưu ý rằng, nếu chỉ quan tâm đến một quan hệ duy nhất trên một lược đồ thì có thể đồng nhất ký hiệu tên quan hệ và lược
đồ của chúng
Ví dụ 3.2.3 Một CSDL quan hệ mờ
đơn giản các bệnh nhân tại phòng khám của một bệnh viện có thể được tổ chức như các Bảng 3.2.2, 3.2.3, 3.2.4 Ở đây, quy ước đơn vị thời gian điều trị, chi phí điều
trị tương ứng là ngày và 1000 (đồng VN)
Kinh nghiệm điều trị của bác sĩ được tính theo năm Chúng tôi lưu ý rằng, một số thuộc tính đã bị lược bỏ bớt (cho đơn giản)
và chúng cũng không ảnh hưởng đến việc minh họa cho mô hình CSDL quan hệ mờ
Bảng 3.2.2: Quan hệ PATIENT
PATIENT_ID PATIENT_NAME AGE WEIGHT MEDICAL_HISTORY
PT005 L.V Tam 53 70 Bronchitis 0.9
PT006 N T Trang 29 49 Gall-stone 0.5
PT007 T T Tu 21 65 Hepatitis 1.0
Trang 6Bảng 3.2.3: Quan hệ DIAGNOSE
Bảng 3.2.4: Quan hệ PHYSICIAN
4 CÁC PH P TOÁN ĐẠI SỐ FRDB
Các phép toán đại số quan hệ mờ như
phép chọn, phép giao, phép hợp và phép
trừ là cơ sở để truy vấn và thao tác dữ liệu
mờ, không chính xác trong FRDB Các
phép toán này được mở rộng từ các phép
toán đại số quan hệ truyền thống, trong đó
mức độ thành viên của các bộ là một giá trị
trong khoảng [0, 1]
4.1 P ép c n
Phép chọn trên một quan hệ FRDB là
cơ sở để thực hiện các truy vấn tìm kiếm
thông tin trong CSDL Trước khi định
nghĩa phép chọn, chúng tôi giới thiệu cú
pháp và ngữ nghĩa của các điều kiện chọn
như dưới đây
Định nghĩa 4.1.1 Giả sử R là một lược
đồ FRDB, X là một tập các biến bộ quan
hệ, là một quan hệ hai ngôi trong =, ,
, , , ≥ Các ều k n mờ (fuzzy
selection condition) được định nghĩa một
cách đệ quy và có một trong các dạng sau:
1 x.A v, trong đó x X, A là một thuộc
tính trong R và v là một giá trị
2 x.A v, trong đó x X, A là một
thuộc tính trong R, là một quan hệ
hai ngôi mờ và v là một giá tr tập mờ
3 x.A 1 x.A2, trong đó x X, A1 và A2 là
hai thuộc tính phân biệt trong R
4 E nếu E là một điều kiện chọn mờ
5 E1 E2 nếu E1 và E2 là các điều kiện chọn mờ trên cùng một biến quan hệ
6 E1 E2 nếu E1 và E2 là các điều kiện chọn mờ trên cùng một biến quan hệ
Ba dạng đầu của điều kiện chọn mờ
được gọi là các ều k sở
(atomic selection condition) Ba dạng sau của điều kiện chọn mờ được suy dẫn từ các dạng cơ sở bằng đệ quy Chúng tôi lưu ý có thể coi mỗi giá trị rõ, chính xác cũng là một giá trị tập mờ với hàm thành viên của
nó bằng 1
Ví dụ 4.1.1 Với lược đồ quan hệ PATIENT trong CSDL các bệnh nhân ở
Ví dụ 3.2.3, một số điều kiện chọn mờ có
thể như sau (x là biến bộ):
1 Tìm những bệnh nhân trẻ tuổi (young)
Yêu cầu này có thể được biểu diễn bởi
điều kiện chọn cơ sở x.AGE
young
2 Tìm tất cả bệnh nhân trẻ tuổi và có tiền sử bệnh viêm gan (hepatitis) Yêu
Trang 7cầu này có thể được biểu diễn bởi điều
kiện chọn x.AGE young
3 Tìm tất cả bệnh nhân cao tuổi (old)
hoặc có cân nặng dưới 50 kg Yêu cầu
này có thể được biểu diễn bởi điều
kiện chọn x.AGE old x.WEIGHT
50
Định nghĩa 4.1.2 Giả sử R(U, ) là một
lược đồ quan hệ FRDB, r là một quan hệ
trên R, x là một biến bộ quan hệ và t là một
bộ trong r Di n d ch (interpretation) của
các điều kiện chọn mờ theo R, r và t, được
biểu thị bởi int R,r,t, là một ánh xạ bộ phận
từ tập tất cả các điều kiện chọn mờ đến
khoảng [0, 1] và được định nghĩa đệ qui
như sau:
1 int R,r,t (x.A v) = r (t) nếu t.A v và
int R,r,t (x.A v) = 0 nếu ngược lại
2 int R,r,t (x.A v) = min(r (t), (t)), với
= t.A v
3 int R,r,t (x.A 1 x.A2) = r (t) nếu t.A1 t.A2
và int R,r,t (x.A 1 x.A2) = 0 nếu ngược lại
4 int R,r,t(E) = 1 − int R,r,t (E)
5 int R,r,t (E1 E2) = min(int R,r,t (E1),
int R,r,t (E2))
6 int R,r,t (E1 E2) = max(int R,r,t (E1),
int R,r,t (E2))
Chúng tôi lưu ý rằng, v là một tập mờ
trong t.A v nên = t.A v là một quan
hệ mờ Vì vậy cũng là một tập mờ Cụ
thể là tập mờ mà hàm thành viên của nó
có đối số là các bộ t của R Với mỗi t R,
(t) = v(t.A)
Về trực giác, int R,r,t (x.A v) và int R,r,t (x.A
v) tương ứng cho biết mức độ thỏa mãn
các điều kiện (quan hệ) t.A v và t.A v
(ở đây v là tập mờ) của bộ t trong r còn
int R,r,t (x.A 1 x.A2) cho biết mức độ thỏa
mãn điều kiện t.A1 t.A2 của bộ t trong r
Ví dụ 4.1.2 Giả sử các tập mờ young,
middle_aged, old tương ứng biểu diễn tuổi
ẻ, trung niên và của các bệnh nhân
với các hàm thành viên như dưới đây:
35 0
), 35 , 20 ( 15 / ) 35 (
] 20 , 0 [ 1
x
x x
x young
) 60 , 20 ( 0
) 60 , 45 [ 15 / ) 60 (
) 45 , 35 [ 1
) 35 , 20 [ 15 / ) 20 ( _
x
x x
x
x x
aged middle
] 120 , 45 [ 0
] 120 , 60 [ 1
) 60 , 45 [ 15 / ) 60 (
x x
x x
old
Thì diễn dịch của các điều kiện chọn mờ E1
= “x.AGE young” và E2= “x.AGE
hepatitis” theo quan hệ r = PATIENT trong
CSDL các bệnh nhân ở Ví dụ 3.2.3 được tính toán như trong Bảng 5.2.1 Lưu ý rằng,
để tiện theo dõi kết quả tính toán, các bộ trong quan hệ PATIENT được đánh số theo thứ tự xuất hiện của chúng trong Bảng 4.1.1
Trang 8Bảng 4.1.1 Di n dịch biểu thức chọn mờ trên uan hệ PATIENT
t3 min(1.0, 0.93) = 0.93 min(min(1.0, 0.93), 1.0 ) = 0.93
Bây giờ, phép chọn trong FRDB được
mở rộng từ phép chọn trong CSDL quan hệ
truyền thống như sau
Định nghĩa 4.1.3 Giả sử R(U, ) là một
lược đồ quan hệ mờ FRDB, r là một quan
hệ trên R và là một điều kiện chọn trên
biến bộ x Phép ch n trên r theo , được ký
hiệu (r), là một quan hệ mờ trên R,
bao gồm tất cả các bộ t được định nghĩa
bởi:
r’=t r | int R,r,t() 0 r’ (t)=int R,r,t()
Một cách đơn giản hơn, (r) = {t r |
int R,r,t() 0}
Ví dụ 4.1.3 Xét quan hệ r = PATIENT
trong cơ sở dữ liệu các bệnh nhân ở Ví dụ 3.2.3, truy vấn “Tìm tất cả bệnh nhân trẻ và
có tiền sử bệnh viêm gan” có thể được thực
hiện bởi phép chọn = (PATIENT) với
x.MEDICAL_HISTORY= hepatitis”
Phép chọn được thực hiện bằng cách kiểm tra sự thỏa mãn của tất cả các bộ trong PATIENT đối với điều kiện chọn
Từ Ví dụ 4.1.2 ta dễ dàng thấy chỉ có bộ t3 thỏa mãn với giá trị hàm thành viên là 0.93 Vì vậy kết quả phép chọn là quan hệ
r’ như trong Bảng 4.1.2
Bảng 4.1.2 Quan hệ r’= (PATIENT)
4.2 Phép hợp, giao và tr
Sử dụng các phép toán trên các tập hợp
mờ trong Định nghĩa 2.3.1 chúng tôi mở
rộng các phép toán hợp, giao và trừ các
quan hệ trong CSDL truyền thống thành
các phép toán hợp, giao và trừ các quan hệ
trong FRDB như các định nghĩa dưới đây
Định nghĩa 4.2.1 Giả sử r và s là hai quan
hệ mờ trên cùng một lược đồ R(U,) Phép
hợp (union) của hai quan hệ
r và s, kí hiệu là r s, là một quan hệ mờ trên R bao gồm các bộ t được định nghĩa
bởi
r s = {t | rs (t)=max(r (t), s (t))}
Ví dụ 4.2.1 Giả sử hai quan hệ
DIAGNOSE1 và DIAGNOSE2 trên lược đồ quan hệ DIAGNOSE(PATIENT_ID,
DISEASE, COST, ) như trong các Bảng 4.2.1, 4.2.2 Khi đó hợp của chúng là quan
hệ DIAGNOSE được tính toán như trong
Bảng 4.2.3
Trang 9Bảng 4.2.1: Quan hệ DIAGNOSE1
Định nghĩa 4.2.2 Giả sử r và s là hai quan
hệ trên cùng một lược đồ R(U, ) Phép
giao (intersection) của hai quan hệ r và s,
kí hiệu là r s, là một quan hệ trên R bao
gồm các bộ t được định nghĩa bởi
r s = {t | rs (t) = min(r (t), s (t))}
Định nghĩa 4.2.3 Giả sử r và s là hai quan
hệ mờ trên cùng một lược đồ R(U,) Phép
trừ (difference) của quan hệ r cho s, kí hiệu
là r – s, là một quan hệ trên R bao gồm các
bộ t được định nghĩa bởi
r–s = {t | r s (t) = min(r (t), 1-s (t))}
4.3 n c ất của c c p ép t n đại s
Như đã thấy ở các phần trên, mô hình
FRDB được mở rộng từ mô hình CSDL
quan hệ truyền thống cả về biểu diễn dữ
liệu và các phép toán đại số quan hệ Hệ
quả logic là các tính chất của các phép toán
đại số trong FRDB cũng được mở rộng từ
các tính chất của các phép toán đại số quan
hệ truyền thống
Sau đây là các định lý về các tính chất của các phép toán đại số trên FRDB được chúng tôi mở rộng từ các tính chất của các phép toán đại số quan hệ truyền thống
Định lý 4.3.1 Giả sử r là một quan hệ mờ
trên lược đồ R(U, ) trong FRDB Gọi 1
và 2 là hai điều kiện chọn Khi đó 1(2(r)) = 2(1(r)) = 12(r) (1)
Với giả thiết trong 12(r) các điều
kiện chọn 1 và 2 là có cùng một biến bộ
Chứng minh Đặt s = 2(r), ta có
1(2(r))=ts int R,s,t(1)0
(Định nghĩa 4.1.3) =tr int R,r,t(2)0 int R,s,t(1)0}
=tr int R,r,t(2)0 int R,r,t(1)0)
(dosr)
=trmin(int R,r,t(2), int R,r,t(1))0)
(Định nghĩa 4.1.2)
Trang 10=trint R,r,t(21)> 0) = 12(r)
Từ đó hệ thức 1(2(r)) = 1 2(r)
được chứng minh Hệ thức 2(1(r)) =
2 1(r) được chứng minh tương tự Vì 1
2 2 1 (phép hội trên tập các điều
kiện chọn mờ cũng như trên mệnh đề có
tính giao hoán), nên 1 2(r) = 21(r)
Từ đó suy ra hệ thức 1(2(r)) =
2(1(r)) và do đó 1(2(r)) =
2(1(r)) = 12(r)
Định lý 4.3.2 Nếu r1, r2 và r3 là các quan
hệ mờ trên cùng một lược đồ R(U, ) thì
r1 r2 =r2 r1 (2)
(r1 r2) r3 = r1 (r2r3) (3)
r1 r2 =r2 r1 (4)
(r1 r2) r3 = r1 (r2r3) (5)
Chứng minh Các hệ thức trong định lý
này được chứng minh như sau:
Do các phép toán giao và hợp các tập
hợp, phép lấy min và max có tính giao hoán
và kết hợp nên từ các Định nghĩa 4.2.1 và
4.2.2 ta suy các hệ thức (2), (3), (4) và ( )
KẾT LUẬN Trong bài báo này, chúng tôi đã giới thiệu một mô hình cơ sở dữ liệu quan hệ
mờ, được gọi là FRDB, cùng với các phép toán đại số cơ bản như chọn, hợp, giao và trừ để cho phép thao tác và truy vấn thông tin không rõ ràng, không chính xác Mỗi quan hệ FRDB là một tập mờ với mức độ
thành viên bộ trong khoảng [0,1], các uy
ấ ề (soft query) có thể được thực hiện
bằng cách sử dụng các điều kiện chọn kết hợp với các giá trị tập mờ Một số các tính chất của các phép toán đại số trên FRDB cũng được đề nghị và chứng minh
Trong các bước tiếp theo, chúng tôi
sẽ xây dựng các phép toán đại số khác như
phép u (projection), phép tích Descartes và phép k (join) các quan hệ để
hoàn thiện mô hình FRDB Ngoài ra, việc phát triển một hệ quản trị cho FRDB với ngôn ngữ thao tác và truy vấn tựa SQL để
hỗ trợ ườ sử d ầu u (end-user)
cũng là một nghiên cứu có nhiều ý nghĩa
TÀI LIỆU THAM KHẢO
1 Dubois, D., and Prade, (2009) H Using fuzzy sets in flexible querying: why and how?
In Proceedings of the workshop on flexible query-answering systems (FQAS’1 ), Denmark, 89-103
2 Codd, E.F (1970) A Relational model of data for large shared data banks
Communications of the ACM, 13(6), 377-387
3 Cubero, J.C., Medina, J.M., Pons, O., and Vila, M.A (1999) Data summarization in
relational databases through fuzzy dependencies International Journal of Information
Sciences, 121, 22-43
4 Chakraborty, S (2012) Codd s e o d ode d fuzzy o :
approach to find the computer solution International Journal of Advanced Technology
& Engineering Research (IJATER), 2(4), 21-27