Trong lĩnh vực cơ sở dữ liệu, một trong những yêu cầu là phản ánh thật tốt thế giới thực, giúp người quản trị dễ dàng xử lý, lưu trữ chính xác những thông tin thu nhận được. Mời các bạn cùng tìm hiểu vấn đề này qua nội dung bài viết.
Trang 1T P CHÍ KHOA H C, Đ i h c Hu , S 20, 2003Ạ Ọ ạ ọ ế ố
M T S PHÉP TOÁN QUAN H M Ộ Ố Ệ Ờ
VÀ PH THU C HÀM M D A TRÊN S M HÌNH THANGỤ Ộ Ờ Ự Ố Ờ
Nguy n Công Hào ễ
Tr ườ ng Đ i h c Khoa h c, Đ i h c Hu ạ ọ ọ ạ ọ ế
1. Đ T V N ĐẶ Ấ Ề
Trong lĩnh v c c s d li u, m t trong nh ng yêu c u là ph n ánh th t t t thự ơ ở ữ ệ ộ ữ ầ ả ậ ố ế
gi i th c, giúp ngớ ự ười qu n tr d dàng x lý, l u tr chính xác nh ng thông tin thuả ị ễ ử ư ữ ữ
nh n đậ ược. Trong th c t , đôi khi chúng ta không th thu nh n đự ế ể ậ ược các thông tin
m t cách đ y đ , ho c có nh ng thông tin không chính xác (ộ ầ ủ ặ ữ Inexact), không ch cắ
ch n (ắ Uncertain) g i chung là các thông tin m Do đó, khi ngọ ờ ười qu n tr m t CSDLả ị ộ
th c t nào đó d a trên mô hình kinh đi n, thự ế ự ể ường g p nh ng trặ ữ ường h p sau:ợ
T i th i đi m c n c p nh t m t đ i tạ ờ ể ầ ậ ậ ộ ố ượng nào đó vào CSDL nh ng ch a cóư ư
đ y đ thông tin v đ i tầ ủ ề ố ượng đó, ch ng h n bi t là m t cán b gi ng d y ẳ ạ ế ộ ộ ả ạ "thâm niên" nh ng không rõ năm vào biên ch (Giá tr hi n t i là ư ế ị ệ ạ Unknown ).
Bi t m t cán b gi ng d y có ế ộ ộ ả ạ "nhi u" ề công trình nghiên c u khoa h c, nh ngứ ọ ư không bi t c th là bao nhiêu (Khái ni m m ế ụ ể ệ ờVague ).
N u gi i h n trong mô hình CSDL kinh đi n thì ph i đ i đ y đ thông tin vế ớ ạ ể ả ợ ầ ủ ề
đ i tố ượng đó m c p nh t vào CSDL, ho c n u c nh p thì s gây khó khăn, m tớ ậ ậ ặ ế ứ ậ ẽ ấ
ng nghĩa và không nh t quán trong x lý d li u.ữ ấ ử ữ ệ
Do đó đ đáp ng nhu c u th c t , chúng ta ph i m r ng mô hình CSDL kinhể ứ ầ ự ế ả ở ộ
đi n, xây d ng các phép toán quan h cũng nh ph thu c d li u.ể ự ệ ư ụ ộ ữ ệ
2. CÁC KHÁI NI M C B NỆ Ơ Ả
Cho W=(A1, A2, An, ) là t p h u h n các thu c tính, các mi n giá tr tậ ữ ạ ộ ề ị ươ ng
ng D(A
ứ 1), D(A2), D(An), D( ) =[0,1]. Trong đó, D(Ai) (i=1 n) có th nh n giá tr rõể ậ ị
ho c giá tr m ặ ị ờ
2.1. Lược đ quan h mồ ệ ờ
Là t p h u h n các thu c tính Aậ ữ ạ ộ 1, A2, An, Trong đó là thu c tính đ thu c.ộ ộ ộ 2.2. Quan h mệ ờ
Trang 2M t quan h m fr trên lộ ệ ờ ược đ quan h m là t p con c a tích Descartesồ ệ ờ ậ ủ D(A1) D(A2) D(An) D( ). T c là fr ứ D(A1) D(A2) D(An) D( )
2.3. B d li uộ ữ ệ
M t b d li u tộ ộ ữ ệ fr có d ng: (t, ạ fr(t))
Trong đó: fr(t): D(A1) D(A2) D(An) [0, 1] đ cho đ thu c c a b t vàoể ộ ộ ủ ộ quan h fr.ệ
Do đó quan h fr có th bi u di n l i nh sau:ệ ể ể ễ ạ ư
fr = ((t, fr(t) | fr(t) [0,1] và t r)
V i rớ D(A1)xD(A2)x x D(An)
2.4. Bi n ngôn ngế ữ
Theo L.A.Zadeh bi n ngôn ng là lo i bi n mà mi n giá tr c a nó bao g m cácế ữ ạ ế ề ị ủ ồ
t ho c câu ngôn ng t nhiên ho c ngôn ng nhân t o (G i chung là giá tr ngônừ ặ ở ữ ự ặ ữ ạ ọ ị
ng ). M t cách t ng quát, bi n ngôn ng đữ ộ ổ ế ữ ược đ c tr ng b i b 6 (X, T, H, U, G,ặ ư ở ộ M)
Trong đó:
X: Tên bi n ngôn ng , ch ng h n nh ế ữ ẳ ạ ưTu iổ
T: T p các giá tr c a bi n ngôn ng X , ch ng h n nh ậ ị ủ ế ữ ẳ ạ ư tr , trung niên, già, ẻ khá tr ẻ
H: T p các gia t , ch ng h n nh ậ ử ẳ ạ ư khá, h i, r t ơ ấ
U: T p c s c a bi n X ậ ơ ở ủ ế
G: T p các qui t c s n sinh ra các ph n t c a X.ậ ắ ả ầ ử ủ
M: T p các qui t c ng nghĩa gán cho m i giá tr ngôn ng c a bi n X m t ýậ ắ ữ ỗ ị ữ ủ ế ộ nghĩa là t p m trên U.ậ ờ
3. XÂY D NG HÀM X P X GI A 2 T P M Ự Ấ Ỉ Ữ Ậ Ờ
D A TRÊN S M HÌNH THANGỰ Ố Ờ
Xét lược d quan h R=(Aồ ệ 1, An, )
Đ i v i thu c tính Aố ớ ộ i là rõ thì D(Ai)=U(Ai)
Đ i v i thu c tính Aố ớ ộ i là thu c tính m thì D(Aộ ờ i)=U(Ai) LV(Ai) P(Ai) I(Ai)
đây: U(A
Ở i): Là mi n giá tr c s , LV(Aề ị ơ ở i): T p các giá tr ngôn ng c a bi nậ ị ữ ủ ế ngôn ng Aữ i, P(Ai): T p các t p m bi u di n dậ ậ ờ ể ễ ướ ại d ng s m hình thang, I(Aố ờ i):
T p các t p m bi u di n dậ ậ ờ ể ễ ướ ại d ng s m d ng kho ng.ố ờ ạ ả
Cho 2 t p m fậ ờ 1=( a1, b1, c1, d1)a1 b1 c1 d1
f2=( a2, b2, c2, d2) a2 b2 c2 d2
Trang 3G i SP(fọ 1 f2) là hàm x p x gi a 2 t p m fấ ỉ ữ ậ ờ 1 và f2 theo phép toán , trong đó
= {=,<,>,<=,>=, }. Chúng ta s xây d ng hàm SP(fẽ ự 1 f2) sao cho khi f1 và f2 g nầ
nhau thì SP(f1 f2) >1 khi là phép "=", khi f1 và f2 xa nhau thì SP(f1 f2) >0 khi là
phép "="
G i Sọ f1 và Sf2 là bi u di n s m hình thang tể ễ ố ờ ương ng c a 2 t p m fứ ủ ậ ờ 1 và f2
3.1. N u ế là phép "="
Tr ườ ng h p 1: ợ N u Sế f1 Sf2= thì SP(f1 f2)=0
Tr ườ ng h p 2: ợ N u Sế f1 Sf2 ho c Sặ f2 Sf1 thì SP(f1 f2)=1
Tr ườ ng h p 3: ợ N u fế 1 P(A) và f2 U(A) ho c fặ 1 U(A) và f2 P(A), khi đó giá
tr hàm SP(fị 1 f2) chính là giao đi m I c a Sể ủ f1 và Sf2.
Tr ườ ng h p 4: ợ N u fế 1 P(A) và f2 P(A) nh ng Sư f1 Sf2 và f1 f2 và f2 f1 ,
khi đó hàm SP được xây d ng nh sau:ự ư
3.2. N u ế là phép so sánh " "
Ta có SP(f1 f2)=1SP(f1=f2)
3.3. N u ế là phép so sánh " "
SP(f1 f2) =0 khi Sf1 Sf2 = và d1< a2
2
a
1
1
f
2
f I
1
1
1
2
2
(
a
b
a
a
f
f
SP
1
1
I
2
d
1 1
2 1
2
(
c d
d d
f f SP
1
d
1
f
2
f
2
d
2
2 2
1 2
2
(
c d
d d
f f SP
1
a
1
I
2
2
2
1
2
(
a
b
a
a
f
f
SP
2
I
) ,
( ))
, ( )
, ( ( 2 1 ) (
1 2 1 2 2
1 2
1
2 1 2 1 2 1 2 1 2
d d c c b b a a f
f SP
Trang 4SP(f1 f2) =1 khi a1 a2, b1 b2, c1 c2, d1 d2 và m t s trộ ố ường h pợ
nh trong [2 ].ư
3.4. N u ế là phép so sánh " "
Ta có SP(f1 f2) SP(f2 f1). Vì v y ch c n hoán đ i 2 t p m fậ ỉ ầ ổ ậ ờ 1 và f2
3.5. N u ế là phép so sánh "<"
Ta có SP(f1<f2)=1SP(f1 f2)
3.6. N u ế là phép so sánh ">"
Ta có SP(f1> f2) SP(f2<f1). Vì v y ch c n hoán đ i 2 t p m fậ ỉ ầ ổ ậ ờ 1 và f2
4. CÁC PHÉP TOÁN QUAN H MỆ Ờ
4.1. Phép ch n m (Fuzzy selection)ọ ờ
Cho R={A1,A2, ,An, }, fr là quan h m trên Rệ ờ
A R, c D(A). Phép ch n m Fs đọ ờ ược đ nh nghĩa nh sau:ị ư
Fs A c( fr )={ (t, fr (t)) SP(t[A] c) | (t, fr (t)) fr và fr (t) SP (t[A] c) )}
Trong đó : là ngưỡng được ch n và ọ (0,1], {=, <, >, ,, , }, : Phép Min
4.2. Phép chi u m (Fuzzy projection)ế ờ
Cho quan h m fr={(t,ệ ờ fr(t))} trên lược đ quan h R, Xồ ệ R. V i m i bớ ỗ ộ (t, fr(t)) fr, ký hi u tệ x là t p các b (tậ ộ 1, fr(t1)) fr mà t1[X]=t[X]. Có nghĩa là
tx={t1 | (t1, fr(t1)) fr và SP(t1[X]=t[X]) =1}
Phép chi u m c a quan h fr trên X là m t quan h m trên X ế ờ ủ ệ ộ ệ ờ được đ nhị nghĩa nh sau:ư
4.3. Phép k t n i t nhiên m (Fuzzy natural join)ế ố ự ờ
Cho 2 quan h fr1= (tệ 1, fr1(t1)) và fr2=(t2, fr2(t2)) trên R1, R2, A R1, B R2, R1 R2=R3, R1 R2=R
a. N u R3ế ta đ nh nghĩa phép n i t nhiên m nh sau:ị ố ự ờ ư
FNJ fr1 fr2={(t, fr1 (t 1 ) fr2 (t 2 ) SP (t 1 [C],t 2 [C])) | (t 1 , fr1 (t 1 )) fr1 và (t 2 , fr2 (t 2 )) fr2 mà t[A]=t 1 [A] và t[B]=t 2 [B]và t[C]=t 1 [C]=t 2 [C]}
Trong đó fr1 xác đ nh trên AC và frị 2 xác đ nh trên CB và A ị B C=
b. N u Rế 3= thì ta có phép n i t nhiên m s thành tích Descarts m ố ự ờ ẽ ờ
4.4. Phép k t n i m ế ố ờ ( Fuzzy join)
Trong trường h p ợ ={<, >, , , } thì phép k t n i t nhiên s thành phépế ố ự ẽ
k t n i m ế ố ờ
Phép k t n i m ế ố ờ c a 2 quan h m frủ ệ ờ 1 và fr2 trên 2 thu c tính A và B độ ượ c
đ nh nghĩa nh sau:ị ư
] [ ), ( )
1
X t t fr
t t X
X
Trang 5f J fr1fr2 ={(t, fr1 (t1) fr2 (t2) SP(t1[A] t2[B])) | t[R 1 ]=t 1 , t[R 2 ]=t 2 , (t1, fr1 (t 1 )) fr1, (t 2 , fr2 (t 2 )) fr2, fr1 (t 1 ) fr2 (t 2 ) SP (t 1 [A] t 2 [B]) }
đây quan h f
Ở ệ J xác đ nh trên R=R1ị R2 và R1 R2=
5. PH THU C HÀM MỤ Ộ Ờ
5.1. Đ nh nghĩa ph thu c hàm mị ụ ộ ờ
Cho lược đ quan h m R xác đ nh trên t p h u h n các thu c tính W.ồ ệ ờ ị ậ ữ ạ ộ X,Y W, fr là quan h m trên R. Ta nói X xác đ nh hàm m Y hay Y ph thu c hàmệ ờ ị ờ ụ ộ
m vào X trong fr, ký hi u X~>Y: N u v i m i b tờ ệ ế ớ ọ ộ 1, t2 trong fr mà giá tr c a chúngị ủ
x p x b ng nhau trên X thì cũng x p x b ng nhau trên Y. Có nghĩa là X~>Yấ ỉ ằ ấ ỉ ằ ( t1,
t2 fr) (SP(t1[X]=t2[X]) ) SP(t1[Y]=t2[Y]) ( (0,1])
5.2. Ví dụ
Cho quan h m ệ ờBanhang đ c mô t nh sau:ượ ả ư
Máy chi uế 02/02/01 kho ng 30ả khá nhi uề K03 0.7
Máy tính 04/06/99 khá nhi uề kho ng 250ả K07 0.9 Trong quan h m ệ ờ Banhang ta có ph thu c hàm m ụ ộ ờ soluong ~> Loinhuan. Trong trường h p ng d ng c th thì ngợ ứ ụ ụ ể ười ta có th ch n ngể ọ ưỡng (0,1] tùy theo t ng trừ ường h p c th ợ ụ ể
6. K T LU NẾ Ậ
M t trong nh ng v n đ r t quan tr ng đ xây d ng các phép toán quan hộ ữ ấ ề ấ ọ ể ự ệ trên c s d li u m và ph thu c hàm m là làm th nào đ so sánh gi a 2 giá trơ ở ữ ệ ờ ụ ộ ờ ế ể ữ ị
m v i nhau theo ng nghĩa nào đó. Vì v y bài báo này đã t p trung nghiên c u vàờ ớ ữ ậ ậ ứ
gi i quy t đả ế ược m t s v n đ c b n sau:ộ ố ấ ề ơ ả
H th ng các khái ni m nh lệ ố ệ ư ược đ quan h m , quan h m , bi n ngôn ng ồ ệ ờ ệ ờ ế ữ
Đ xu t cách xây d ng hàm x p x SP gi a 2 t p m d a trên s m hìnhề ấ ự ấ ỉ ữ ậ ờ ự ố ờ thang, đây là v n đ r t quan tr ng, chúng tôi đã m r ng các k t qu nghiên c uấ ề ấ ọ ở ộ ế ả ứ trong [2]
Xây d ng m t s phép toán quan h trên mô hình c s d li u m ự ộ ố ệ ơ ở ữ ệ ờ
Đ xu t đ nh nghĩa ph thu c hàm m v i ng nghĩa m i.ề ấ ị ụ ộ ờ ớ ữ ớ
Trang 6TÀI LI U THAM KH OỆ Ả
1. Lê Ti n V ế ươ ng, Nh p môn c s d li u ậ ơ ở ữ ệ , NXB khoa h c k thu t.ọ ỹ ậ
Tr ườ ng Đ i h c Khoa h c T nhiên Hà N i (2001) ạ ọ ọ ự ộ
3. Tr ươ ng Đ c Hùng, ứ M t s v n đ v c s d li u v i thông tin không đ y ộ ố ấ ề ề ơ ở ữ ệ ớ ầ
đ và l p lu n x p x trong x lý câu h i ủ ậ ậ ấ ỉ ử ỏ Lu n án Phó Ti n sĩ, trậ ế ườ ng Đ i h c Bách Khoa ạ ọ
Hà N i (1996) ộ
4. Nguy n Cát H , ễ ồ C s d li u v i thông tin không đ y đ ơ ở ữ ệ ớ ầ ủ, Bài gi ng trả ườ ng thu v "H m và ng d ng", Hà N i (2001) ề ệ ờ ứ ụ ộ
relational databases, International journal of intelligent System 9 (1994) 441448
set theory and linguistic variables, computer and Artifical Intelligence 8 (2) (1989) 153168.
sets and systems 89 (1997) 205213.
fuzzy sets and systems 7 (1982) 213226.
with proximity relations, fuzzy sets and systems 117 (2001) 195201.
SOME FUZZY RELATIONAL OPERATORS AND FUZZY FUNCTIONAL DEPENDENCY BASED ON TRAPEZOIDAL FUZZY NUMBER
Nguyen Cong Hao College of Sciences, Hue University
SUMMARY
In this paper, we introduced a new approach for building fuzzy relational operators and fuzzy functional dependency. This approach is building proximity function between two fuzzy sets based on trapezoidal fuzzy number Then, putting forward a new definition of fuzzy functional dependency with new semantic. Last, we have given examples for description about fuzzy functional dependency.