Khảo với CSDL mờ trong đó giá trị ngôn ngữ được xem như lá nhãn của tập mi, theo nách tiễn cân của ĐSGT, các giá trị như vậy được xem chính là các phẩn tử của đại số gia tử, vỉ theo
Trang 1ĐẠI HỌC QUỐC GIÁ HÀ NỘI
ĐẠI HỌC CÔNG NGHỆ
PHẠM LÊ CƯƠNG
VE MOT MO IHNIICSDL QUAN IIE VỚI THONG
TIN KHONG CHAC CHẮN DẠNG NGÔN NGỠ
GẦN TỰ NHIÊN
LUẬN VĂN THẠC SĨ CONG NGHE THONG TIN
HA NOI - 2008
Trang 2
DAT HOC QUOC GTA HA NOT
DALIQC CONG NGHE
PHAM LE CUONG
VẺ MỘT MÔ HÌNI CSDL QUAN IIE VOI THONG
TIN KHÔNG CHẮC CHẮN DẠNG NGÔN NGỮ
GAN TU NHIÊN
LUẬN VĂN THẠC SĨ CONG NGHE THONG TIN
Người hướng dẫn khoa học: PGS,TSKH NGUYÊN CÁT HO
HA NOI - 2008
Trang 3
1.1.4.1.3 Topo va tinh tra mat trong ĐSGT ieeeeieesoeo, T7
2.1 Giới thiệu dang ví về cơ sở đữ liêu với ói thông tin ngôn ngữ dS
2.3 Phụ thuộc hàm dựa trên độ tương tự trong C8DL ngôn ngữ 4Ó
CHUONG 3- CAI DAT MOT SO TITU TUC CUA CSDL NGON NGt 58
3.2 Lập hàm tính độ đo tính mờ âm is sen seerseeeerseeeeo S8 3.3 Lập hàm dịnh lượng ngữ nghĩa Q8P tose OL 3.4 Lập hàm ánh xa giá trị cáo giá trị biển ngôn ngữ sang miễn giá trị thực 62
3.6 Sửa đổi các thao táo truyền thống trên cơ ad dt Kéu insert, update, delete, seleeL
Trang 5
“
DANH MUC CAC KY HIEU CAC CHU VIET TAT
CSDL: Cơ sở đữ liệu
ĐSGT: Đại số gia Lữ
Trang 6DANH MỤC CÁC HÌNH VẼ
Hình l: Tập mờ và tap 16
Hình 2: Mô tà cường độ đồng điện
Trang 7MO DAU
Trong những năm gần đây, CSDI mờ đã được nhiều tác giá trong và ngoài nước quan tàm nghiên cứu và dã có những kết quả dáng kế [1,6,14,15] Co nhiều cách: tiếp cận khác nhan như cách tiếp cận theo lý thuyết tập mở [2,14], theo lý thuyết khả năng do Prade và Testemale năm 1983, tương tự [11] .Tất cả các cách liếp cận trên nhằm mục đích nắm bắt và xứ lý một cách thỏa đáng trên một quan điểm ảo
đó các thông tin không chính xác (nexzcf), không chắc chắn (wmcerfaimy) hay
ahimg théng tin khong day di Zncomplete) Do sự da dạng của những loại thông tin nay nên chứng ta gặp rất khỏ khăn trong biểu thị ngữ nghĩa và thao tác với ching Trong những năm gan day đại số gia tử được nhiều tác giả nghiên cứu trong 13,4,5,12,13| và đã có những ứng dụng đáng chú ý, đặc biệt trong lập luận xấp xĩ và trong một số bài toán điều khiển Vi vậy, mặc dù đã có nhiều kết quả nghiên cửu về CSDL mờ, theo chiêu hướng đó cách tiếp cận nghiên cửu CSDL mờ với ngữ nghĩa đựa trên đại số gia tử vẫn có thế được xem là một vẫn đề nghiên cứu mới
Khảo với CSDL mờ trong đó giá trị ngôn ngữ được xem như lá nhãn của tập
mi, theo nách tiễn cân của ĐSGT, các giá trị như vậy được xem chính là các phẩn
tử của đại số gia tử, vỉ theo cách biểu thí ngữ nghĩa trong ĐSGT, chúng có thể được xem chính là các giá trị ngồn ngữ
Con người thưởng phải dối mặt với thông tin không chắc chan va do dé co mét shu câu tự nhiên đối với việc xây đụng CSDL mờ Việc quản lý và thao tác thông tia mờ biểu thị bằng lý thuyết tập mờ tương CSDI, dã và đang được quan lâm nghiên cứu mạnh mê, Tuy nhiễn người ta vẫn gặp một số khó khăn trong biểu diễn
và quản lý thông tin ma
Trang 8tác dữ liệu dễ bảo dâm tính trọn vẹn đữ liệu dỗi với mô hình CSDL mới này và
chứng tỏ sự thuận tiện và đơn gián của loại mô hình này.
Trang 9kiện rõ rằng — một phân tử hoặc thuộc hoặc không thuộc về tập hợp Ngược hại, lý
thuyết tập mở cho phép đánh giá quan hệ thành viên giữa một phần tử và một tập hợp; quan hé nay duge mé ta bang mét ham thuée (membership function)
¡ —11J
Các tập mờ được coi lả một mmở rộng của lý thuyết tập hợp kinh điền là vị, với một xuiển nhất định, một hàm thuộc có thể giữ vai trò của một hàm đặc Irung ánh xạ mỗi phân tử tới một giá trị 0 hoặc 1 như trong khải niệm kinh diễn
Định nghĩa 1.1
'Một tập hợp mờ trên một tập hợp kinh điển X được định nghĩa như sau:
A= {le, walx)) |x € X}
‘Ham thudc trạ(x) lượng hóa mức độ mâ các phan tit x thuée vé tp ca séX Néu
bam cho két qua 0 déi với một phần tử thị phần tử đỏ không có trong, tập đã cho, kết quả 1 mô tả một thành viên toàn phân của tập hợp Các giá trị trong khoảng mở từ 0
đến 1 đặc trưng cho các thành viên mờ.
Trang 10
Hình 1: Tập mờ và tập rõ Hêm thuộc g„(x) thỏa mãn các diều kiện sau
8UP„cx[~a(£)] = 1
1.1.2 Lôgic ma
Légie ma (tigng Anh: Fuzzy logic) duoc phát triển từ ly thuyết tập mờ để thực hiện
lập luận một cách xâp xĩ thay vị lập luận chính xác theo ligie vi từ kinh điển Lögie
Để mình họa sự khác biệt, xét tình huống sau: Bảo đang đứng trong một ngồi nhá
có hai phòng thông nhau: phòng bếp và phỏng ăn Trong nhiều trường hợp, trang thái của Bảo trong tập hợp gồm những thứ "ở trong bếp" hoàn toàn đơn giản: hoặc
là anh ta "trong bếp" hoặc "không ở trong bếp" Nhung nếu Lão đứng tại cửa nổi giữa bai phỏng thì sao? Anh ta có thể được soi là "có phần ở trang bếp", Việc định lượng trạng thái "một phần" này cho ra rnột qrem hệ thuộc đốt với mội lập mờ
Ching han, néu Bão chỉ thò một ngôn chân gái vào phỏng ãn, ta có thể nói rằng Bão
ð "trong bếp" đến 99% và ở trong phòng ăn 1% Một khi anh ta còn đứng ỡ cửa thi
Trang 11không có một biên cô nào (ví dụ một đồng xu dược tung lên) quyết dịnh rằng Bảo hoàn toản "ở trong bếp" hay hoán toàn “không ở trong bếp" Các tập mờ được đặt
cu sở trên các định nghĩa mmờ về các lập hợp chứ không phải đựa trên sự ngẫu nhiền
Lôgic mờ cho phép đẻ thuộc có giá trị trong khoảng đóng ([0,1]), và ở hình thức tigôn từ, các khái niệm không chính xác nữ “hơi hơi", "gân như", "khá là" và "rất"
Cụ thể, nó cho phép quan hệ thảnh viên không đây đủ giữa thành viên và tập hợp
Tính chất này có liên quan đến tập mờ và lý thuyết xáo suất Lêgie mờ đã được đưa
ra lần đầu vào năm 1965 bởi G8 Tuotfi Zadch tại Đại học California, Berkeley
1.1.3 Hạn chế của việc quân lý và thao tác thông tìn mờ biểu thị bằng lý thuyết tập mờ trong CSDL
Chúng †a có thể nhận thấy việc sứ dụng tập mở và mồ hình quan hệ đề xử lý thông,
tin mờ có ruột số hạn chế nhất định
(Ũ Với các thuộc tính mã giá trị là dữ liệu kinh điển và đữ liêu mờ, (gọi là các thuộc tính mở), kiểu đỡ liêu không dỏng nhất, do đó, việc xử ]ý đữ liêu gặp nhiều khó
khan Ching hạn, do đữ liện ngôn ngữ được biếu điển dưới dang cdc tap mờ, nghĩa
là được thể tiện bởi các hàm thuộc của L, miễn thuộc tính cơ sở, vào khoảng đơn vị [0,1], định nghĩa các quan hệ dối sánh trên các dừ liệu này không phải là một vấn dẻ giản đơn và cé nhiều cách giải quyết khác nhau Tắt nhiên, sự thỏa mãn các mỗi
quan hệ trong trường hợp này được định nghĩa dụa trên logi đo trị thay vi logic hai giá trị Chúng ta hãy xem xét một thí dụ, thuộc tình AGE (Tuổi) và giá thiết rằng di liệu rather young, được thể hiện bằng một tập mờ øs;„„ với hàm thuộc sessing Với trường hợp dữ liêu 34 và rather young, dẳng thức 34 — Rather young có thể dược didn giải là thỏa mãn múc độ chân lý /0g,„„(34) Song có một câu hồi khó hơn là
lãm sao la có thể điển giải điêu kiện thôa mãn loại bat ding thite Rather young <
347 Có một cách là diễn giải bắt đẳng thức này bằng cách tỉnh tập mức Á đz»zumg.2
của lập mờ #g„„„„ và kiểm tra bắt đẳng thức 3g, „„„ ¿< 34, trong đó bất đẳng thức
o6 nghia ring (Vu = ryangd(u < 34) Nếu bắt đẳng thức nảy được thỏa mân,
Trang 12chúng ta nói răng mức độ thỏa mãn của bắt đắng thức này là giá trị chân lý của 2
Nhu vay, tay theo cách điễn giải của người sử đụng, ta cân thiết kế các thủ tục đẻ
quan lý dữ liệu có thuộc tính mờ
- _ Hình 2: Mö tả cường độ đòng điện co (0 Việc diễn giải về ngữ nghĩa của dử liệu ngôn ngữ là một vẫn để cơ bản, tuy
nhiên, nó hoàn toàn phụ thuộc vào cách biểu thị quá chủ quan về ngữ nghĩa của ngôn ngữ biểu điển bằng tập mờ Điều này có nghĩa là mọi người thường tự thiết kế các tập mờ cho mỗi ứng dụng, trừ khi chọn lựa cáo giá trị dựa trên ngữ nghĩa trong,
thực tế Không có ràng buộc chính thức nao cho thiết kế kiến này Ví dụ như, để
diễn giải nghĩa của bảy thuật ngit terms very very small, very small, small, medium, large, very large, very very large nhằm mô tả các giả trị của cường độ dòng diện
trong khoảng [0, 10] am-pe, người ta có thế đựng bây tam giác cân như hình 2 Đó
là các tam giác bằng nhau trừ tr giác đầu và coỗi, lại tam giáo nay bang mot na các tam giác hoản chính Vấn để đường như rất kỹ thuật và chủ quan, va một câu thôi phát sinh là vì sao cáo tam giác bằng nhau và các cạnh đáy của chúng năm tring lên nhau đúng một nửa Điều nảy có vẻ không phủ hợp khi xern xót ngữ nghĩa tự nhiên cửa các thuật ngữ này
Trang 13ngữ và giả thiết tập các giá trị ngôn ngữ dược nhúng vào một dại số gia tử Ngữ nghữa của các quan hệ hai ngôi trên mỗi miễn giá trị thuộc tính, bao gồm các giá trị
kinh điển và các giá trị ngôn ngữ, sẽ được nghién cửu và trên cơ sở đó các phép
toán dại số quan hệ sẽ được dịnh nghĩa phủ hợp với ngữ nghìa mới Việc tiếp cận dựa trên đại số gia tử chỉ ra răng mô hình CSDL với thông tin mở trở niên rõ ràng, nhất quản trong thao tác và thao tác đữ liệu đơn giân hơn.
Trang 141 1.4.1 Dại số gia tử
Để xây dung cách tiếp cận đại số gia tũ đối với CSDT, tuờ, trong phản nảy xin trình bảy tổng quan về một số nét cơ bản của đại số gia tử vả khá năng biểu thị tiefr nghĩa đựa vào cầu trúc của đại số gia tử
Chúng ta xét miễn ngôn ngữ của biến chân lý TRUTH gồm các từ sau Dom(TRUTID= (true, false, very true, very false, more-or-less true, more-or-less
false, possibly true, possibly false, approximately (rue, approximately false, little
true, little faise, very possibly true, very possibly faise }, trong do true, false là các từ nguyên thuy, cdc tir nhan (mordifier hay intensifier) very, more-or-less, possibly, approximately true, little gọi là các gia tử (hedges) Khi đó miễn ngôn ngữ 'T=øm(TRUTLD có thể biểu thị như một đại số 4/7 = (X, C, 1, <), trong đó C là tập các từ nguyên thuỷ được xem là các phân tử sinh H là tập các gia tử được xem như là các phép toán một ngôi, quan hệ < trên các tử (các khái niệm mờ) là quan hệ thử tự được "căm sinh" tử ngữ nghĩa tự nhiên Ví dụ dựa trên ngữ nghĩa, các quan
hệ thứ tự sau là dúng: false <true, more true<very true nhung very false< more false, possibly (rue<irue nhung false <poswibly false Tap X được sinh ra từ Ở bối các phép tinh trong H Khir vậy mỗi phần từ của X sẽ có đạng biểu điển x=luh,Ú
1 ne, c&C Tập tất cả các phân tử được sinh ra từ một phan tử x duoc ky higu 1a
H@) Nếu C có đúng hai từ nguyên thuệ mở, thì một được gợi là phần từ sinh dương ký liệu là c', một gọi là phần tử sinh âm ký hiệu là e vả ta có ở < e' Trong,
ví dụ trên 7rwe là dương con False 1 am
Nếu các tập các phép toán (hay gia tử) #f”, ÖƑ và tập Ở các phản tử sinh là tuyến tính thì tập nền X = 17(G) cũng tuyến tính Tuy nhiên tập 17(G) thiếu các phân
tử giới hạn, hay nói khác đi nó không đéng đối vái phép “lây giới hạn” Chính vì thế, đại số gia từ đây đủ AX = <X, C,H, 9, è, €> được xây dựng bằng cách bổ
sung vào tập X các phần tử giới hạn nhằm làm đẩy đủ miễn giả trị của nó
Trang 151 1.4.1.1 Những phát biểu cơ hãn
Cho X là một tập sắp thứ tự một phần (partially ordered seQ vá U, V là hai tập cơn của X Ta ký higu U < ƒ (phát biểu tương ứng cho Ù < J2, nếu (Vx cJ(Vy c
ME <y} (ương ứng, ƒx < y})
Xét đại số gảa tứ đây đủ 1X = « X, G, LH, Ø, 6,
có biểu điển đưới đạng x— bự hạn với ue XÃ, thì tá số quy ước sử đụng ký pháp SAU: Xp = Ap Art, 1S < n, với quy ước khi i= 1 thi Ap = 7, phép toán đồng nhất
trên X
Giá sử x c X vả nêu né
Định nghia 1.1: DSGT AX ~ <.X, G, LH, o, g, <> duge goi là tự đơ (hay sinh
tự đe) nếu với mọi h c TH mọi x c LH(G) tá đều có hx z x Về trực quan điều này
có nghĩa, mỗi gia tử (phép toán) khi tác dông vao mét phan tit bat ky trong LH(G) đều được sinh (một cách tự do) ra phân tử mới
Những kết quả sau đây sẽ được tham chiếu đến trong các chứng minh sau nảy Định lý 1.1: Xét DSGŒT 4X = (X, G, LI1, œ, ú, <) là đại số gia tử mở rộng đây
di Vai moi y c LHQ),x c Xa có
ii) de <Q) <x 6
Mệnh đề L1: Xét ĐSGT mở rộng đây dủ AX — (X, G, LH, s, $ <) Voi moth
€ LH, moi k ¢ LH‘, néu ox, ox © lim(x) (hay ox, ox # LH(G)) thì
lx <kxkéotheo nhx kx, bx2kxkéotheo fle=okx &
Bổ đề L1: Với moi x © AiG),
om = supremum{P"o'x: 0 © UOS, o'x >x, 2-12, } - oF"0'x— ao'x va
dx = infirman{V"orx: 0 ¢ UOS, ox Sx, n—1, 3, } = 6 ho 7x = fox,
lưu ý rằng la positive déi vdi cA hai toan ti don vi trong UOS va day {V"o'x: o” € UOS, d'x 2x, n= 1,2, .} dơn diệu tăng còn dấy { “2%: 0” ¢ UOS, ox x, n= 1,
3, .} đơn điệu giảm É
1.1.4.1.2 Các khải niệm vả tính tuyến tính
Định nghĩa 1.2 Dại số gia tử (mở rộng) đây đủ 1X = (X, G11, Ø, 6, <) được
gọi là tuyến Lính nếu tập các phần từ sinh G {6, e, E, c°, 1} và các dán các gia Lử
TH = {Ly , b„}và H = {ñụ, lạ} là sắp thử tụ tuyển tính, ở đây Öƒ = 1Í VAT, và
Trang 16giả sử ñ;
Lathes
DSGT mé réng day đủ với 1ƒ và I7 là các tập sắp mét phan (poset) da nghiên cứu Trong trường hợp chủng | tuyén tinh thi LH” =H" va LH =H Với giá thiết tây ta có kết quá quan trọng và được phát biểu trong bổ đề sau:
ñ„ Ký hiệu hạ =7 còn [ƒ mà được hiểu lac €
Ba dé 1.2 ChoDSGT AX (H(G), GH <) Néu G va A théa main các giả tiết
như trong Dinh nghia 1.2 thi H(G) la tap sap thi ty tuyén tinh &
Đổi với trường hợp IDDSGT đây đủ và tuyến tỉnh, ta cũng có định lý sau về tính
Trước hết giả sử chỉ một Irong hai phan ir x va dng hạn là y, thuộc Lòm(X)
và chứng có biểu diễn sau: x = ñụ È;, y = oy' với „` = ky kạut, Vì H(G) sắp toàn phản nên z và y° phải sánh được với nhau và giả định x < #' (đối với trường thợp ngược lại sẽ được chứng mình tương tự bằng đối ngẫu) Khi đó, nếu w và a” được sinh từ hai từ nguyên thủy khác nhau thì ta có x € H(e) va ye Hc") Suy ra
=0 > ức > ac Dx,
Nếu cả hai te H(C), c 6 {C, C”} và pid sth waa, x= A, hae va y= hy
- ki, với bị = kị, Cũng như trên ta giá định x < „” và do đó kéo theo j;
tuận lương tự như lrên, la thu dược y— øV) >: đạm > ghe > Chiu) Vậy y x Một trong các khả năng khác có thể xây ra là x = A, Ay’ Gid thiét x <y' 38 dẫn đến bất đẳng thức hy' <+° Khi đó, oy’ 29" > hy) > gy Vix e Why") và viø c {¥, o}, ti cac bat ding thie cudi ta suy 1a y = oy” va x ludn sánh dược với nhau
Một khả năng còn lại là y` = k„ È,x Cũng như trên, giả thiết x < y` sẽ dẫn đến
‘at dang thức k„ >-x va do đó #Œc,+) > x Do HŒcx) > HG”), nén ta c6 HQ") > x Suy ra, y— oy >
Tây giờ ta giả thiết cả hai x vay clmg thudc Lim(X) va ching co dang biéu diễn xox’, y—o'V va gid sitx! — hy he vay’ — hy ki’, Vi ACG) sip loan phan nén x’ vay” phdi sanh được với nhau và, chẳng han, x’ < y’, Do dé, tương tự như
Trang 17trên, nêu œ và z được sinh ra từ hai từ nguyên thủy khác nhau thì ta phải có x” 6
He) con yc H(c'), Suy ra, y= Ø7) > ỐC = Ớc >óy”=x
Truong hop x’ = hy diy’ Gia thiét x' < y' sẽ đẫn đến bất đẳng thức ñyy <+`
Khi dé, oy’ > Hy) =p’ Do Hx’) C H(A) va 0, 0’ 6 {6, of, ta cd thé
shan thay y = o'p’ vax = ox’ phai sanh duoc với nhau
Trung hop con lai lay’ = ky ky’ Gid thiét x’ <y’ 38 dain dén bat đẳng thức
lux’ > x" va do dé HUkjx’) > x", Do Ak:x) = HG”) và H(G) sip toan phần nên ta
két luan p = 0’y’ vax = oy 14 sénh được
Thư vậy định lý đã được hoàn toàn chứng minh €
1.1.4.1.3 Tô-p và tính trủ mat trong DSGT
Ta biết rằng X = 11(G) — Lim(X), nghĩa là Løm(©) là tập các điểm giới hạn của H(G\ Ta có thể cô câm nhận trực quan thay ring H(G) la tap trù mật trong X theo nghia sau
Dinh nghia 1.3 Cho Xi tap sip thứ tự mội phân và Ù, Ứ là các tập con của X,
Wj{x<y SG s Lj|x
< yl} Voix < y, ta ky higu <xy> = {2 c Xa <2 < y} va cũng gọi là một
khoảng được xác dinh bởi x và y, €
UP, Tập son được gọi là tri mat trong F nêu (Vxy'
chất khá đặc biệt và tính trù mật của 77G) có đặc trang mang hon Dinh nghia 13
rât nhiều Tỉnh chất này là cơ sở để chứng minh mét s6 quả nghiên cứu tiếp theo
‘Trude hết ta hãy khảo sát tỉnh topo của họ # = {0ð, w c #(G)} Chúng ta biết ving mét ha Q bat kỳ các tập cơn của X được gọi là ruột cơ sở 2pø trên X tiêu ching có các tính chất sau:
ø1) VÕ c O;
ø3)VU,e,1=1,.„k [Ÿ,c9
Mỗi cơ sở topo sẽ sinh ra một tope trên X; tức là họ tất cả các tập cơn mở của X
và X trở thành không gian topo Trong không gian topo ta có khái riệm điểm trong,
như sau Xét một tập can V C X: Diễm ø e Ƒ được gọi là điểm trong của tập Ứ nếu
(SỬ c @){w c ÚC V†, nghĩa là có tổn tại một tập con mỡ: của Ƒ chứa ø
Trang 18Ta cỏ khải niệm mới vẻ dộ trủ mật như sau gọi là độ đậm đặc
Định nghĩa 1.4 Cho một không gian tapo X- Tập ý c X, được gọi là đậm đặc trong XÃ, nếu với mọi khoảng <x,y> của X đều chứa íL nhất một điểm trong s, LÌ QGU s G{UC&x <U <y} &
Rõ ràng là nêu l7 là đâm đặc trong X thi F là tric mat trong X
'Ta có bổ để sau
Bé dé 1.3 Cho DSGT AX = (X GH, o ÿ, <), họ 8' = 9 Là {Œ} là một cơ sở topo trên X-
Chứng mảnh: Xét hai tập Ha và FT{v) bất kỳ Khi đó chỉ có hai khả năng, Nếu
u va v là độc lập, tÌ v ơ//00 và nơ11(v), thì JÚ) ¬ 11(v) = Ở Nếu ngược lại, chang han, « e #0) thì Híu) c HỤy) Từ dó dễ dàng suy ra họ 9° thỏa mãn diễu kiện o2) trên &
Nhằm thiết lập mặt tính chất quan trọng dưới đây để sử dụng trong nghiên cứu
việc định lương hóa ĐSGT ta cân bổ d SALL
Bỗ để 1.4 Cho ĐSGT (mở rộng) đầy chi, tuydn tinh va tr do AX =(X% GH, G
, <), xót phần tữx - , hia © A(G) va phép loan o © {¢, ø} Khí đó I thép
(1) Nếu đủ¿# < øx thí khoảng <©Øbr,ax> chứa ít nhất một diễm trong Hơn nữa,
tổn tại m Rvp hạ hy, sao cho Jịxy, < hy, và hậu fa, < Ale)
Luu y rang trong ¢4 hai trong hop trén ta déu cé H(z) ~ H(x) = ©
Chứng mình: Trước hết ta luôn nhớ rằng, theo BS dé 1.2, Hp 77(G) là tuyển tính Dầu tiên ta xét trường hop fiyu < ox, x =h, htt Theo Bổ để 1.1, ta có ghju
Môn bại <colu hại Khi đó tần tại ¡sao choc Poh dkm 2x hư,
trong đỏ œ, B là các xâu gia tử tiên tố tương ứng của z và x Lưu ý rằng, theo Bồ đề
Ll taco dhe = dfx = dc ‘Tix bat đẳng thức cuối cùng ta suyra kx;, < Èx„„ VÌ
trong trường hợp ngược lại ta thu được bắt đẳng thức oi hạn < oh; «
#h;u mâu thuẫn với giả thiết đh„w < or Do dé, (Ea) < H(b#,2) và điều
dến đi = đá, ¡ < HC, 2) < phe, ; Sox, vix c Mthy, 1), va HG) HQ) = Ø với a= kets
Trang 19
Đổi với trường hợp dt > ox, ta ching mình tương tự bằng đổi ngẫu É,
Định lý 14 Cho AX = (X, G, H, ơ, ý, <) là đại số gia tử đây đã, tuyến tính và (sinh) #ự do Khi dó lập H(G) là đậm đặc trong X và hơn nữa tà có
Wa,yeX, x<y > Que IG)ix « HẠ) <w}
Nhớ rằng ta luôn luôn 06 H(w) C A(G)
Chứng mình: Như ta biết X — (G) cà Lim(X) và H(G) 7s Lim(X) — Ø và do
đó ta sẽ chứng rninh định lý theo từng trưởng hợp
(1) Trường hạp x, y © L(G), x = hy hye va
mạ - &iế", "Ta biết rằng, vì 1X
được bất đẳng thức mong muốn là y> Hữm) > x và HŒH) C HỌt)
Bây giờ la giả sử nọ d và hưu z kạm” VÌ x < y tá suy ma hye < ky’ va do vay ta
có JNhịm) < H(m”) Cũng như trên ta chọn h e IT sao cho hx > x và khi đó, vì HỢP) >x, lv c H(hm), vc Hdu) và HỢb) < (hj), ta co điều mong, muốn
THỨn) > x Nêu việc sinh của x và y có dang x = h, Ayy thix
Khi đỏ cũng tổn tại # c H sao cho hy > x và do đỏ ta cũng có y > H(hx) > x Mot cach hoan loan tuong lz, uéuy š„ &¿x thì x < y kéo theo k,x> x Ta chon ke 7
sao cho y> hy 6 #(x)>x Do đó y> HỢp) > x và Hữn) C HỘ)
— oy" & Lim(X), wong doa © {gh a}, — Ayo
(2) Truong hop x © ACG) va)
hyw vay’ =k, ky’, DOiv6i ca hai kha ning uc" va = c" holo u= a va hye ky’, digu kin x < y din din HG) < HQ”) Ta cũng chọn # c #f sao cho Äx > x và
do JỢm) < H(z) ta suy ra y = oy" 2 gy’ > ox > H(hx) > x, nghia là ta có bất đẳng, thức mong muốn Nếu x = „ hạ” thí x © Lay’) vax <y cung với áp" < (uy)
< ay’ kéo theo y — ay’, Vay véi lx > xta oting ob y~ ay’ > HỮM) >x
Néuy’ = ky kx thix <y kéo theo ka > xva y= oy’ = pepe 2x
Néu oy’ = flax thi p = dix > x va khi đó &; không phải là atom (gia tử nhỏ nhất trong đàn ⁄ 7) Vậy có tên tại &' sao cho 77x) > H'x) > x và điều này dẫn đến y
oy > ux> HC X)> x Ngoài Ta lá cũng cô Hín) c HỆ), với k's
Néu oy’ > dfx thi tan tai x sao cho x « flex = đz< 1Œ) < oy' và 11) 9’) -Ø
(3) Trueng hop x = ox” LimiX) vay c H(G), trong đó ø c {4 o} vax = hy
hu vay’ =k, ke’ duoc chimg minh twong ty nhu trong (2)
Trang 20(4) Trường hợp x = øx° € Lin(X) va y = o'y’ = Lim(X), trong d6.x° = hy Bs
vay? — km kịu” Tập luận như trong (2), cả hai khả năng đổi với œ và ¡” đều dẫn
đến lụu + kạu”, và từ điều kiện x < y ta suy ra yu < kyu’
Tiếu oft = đạn, thì có bai khả năng Thứ nhất là x = 2x = øhz và khi đó x =
Hey < ö'y" Tên tai w= 5, sa0 cho x = ox" = kyu = đai SH) = ÚC Xã) <0
Trong trudng hgp nay ta co Hig) 0 Hy’) ~ © Gid att ohm + eu Khi dé diéu
kiên x < y kéo theo Ape < ky va do vay ox” < ohju < feu < o'y" Neu hy, ky khong
củng thuộc tập gia tử JŸ thì h„w < w < kụ: và nêu các gia tử này dễu là nhỏ nhất thì chy — gkju Ta gap mau thuận Vậy mội trong hai gia tử này không là nhỏ rất, chẳng hạn đỏ là h, Khi đó có #° sao cho ñ„ < ñ' và do dò ta có H(hin) < HỮPh) < H(,,) Nếu bị, kị cùng thuộc tập gia tử #” thí chủng không thể lá hai gia bử kể nhau, đo đỏ cũng tổn tại #' sao cho bu < #' < kạu và điêu này cũng dẫn đến H(i) < H(h'u) <A (eu) Te diy ta suy ra x = ox" < ohyu < H(h'u) < dea < oy’
y nghta Ip ta c cde bat ding (hie mong mudn va cling có didu kiện H(A’%) >
ay Viyo’ a Ldy h' sao cho yˆ< hy? là sẽ côx ox’ <y"<H hy) < ayy
va H(h'y') CHG)
Vì đối với trường hop y’= ñụ b,x" sẽ được chúng mình tương tự nên định lý hoàn
toan duge chimg minh &
= ox’
1.1.4.1.4 Độ đo tính mờ
Cho dai sé gia tir AY — &, C,H, <), với X là tấp nền, Ở —{c', e Hương đỏ c
và ơ tương ứng là phần tử sinh đương và âm 77 =f7 I voi LT = fy, Baa, By VA
= Myris vey Pprghy WP R >hy và lạirs SỈp „
Để mô phỏng tỉnh mờ của các khái niệm mờ trước hết ta hãy dua ra một số tiêu
chuẩn có tính đặc trưng trực quan thiết yêu dễ thừa nhận vẻ tỉnh mnờ của ngôn ngữ (1) Tỉnh mờ của một khải niệm rỡ (crisp) phái bằng không;
(2) Một khái niệm mờ z° tu được nhờ đặc tả cá thế hơn sẽ có tỉnh mờ ít hơn
khái niệm mờ gốc z Như vậy tính mờ của z' phụ thuộc vào tính mờ của z,
Trang 21(3) Néu hai khải niệm mờ rvà z' có ngữ nghĩa không phụ thuộc vào nhau, nehia la viéc x4c dinh ngữ nghĩa của từ này không ảnh hưởng đến việc xác định net
ugbia oda từ kia, thì tính mờ của chúng dộc lập nhau Chẳng hạn tính mở của “App true” va “Little true” là độc lập nhau
(Ð Nếu các từ r' và r"' được sinh từ từ r khi đùng các gia tử tác động vào, thì tinh mé của £ và 7” cũng góp phân tạo sinh ra tỉnh mờ của từ 7;
'Trở lại ĐSGT ,1X* Nó được xem là cấu trúc của mién gia trị biến ngôn ngữ #⁄ Hãy xét họ {A(x}: x c X*} Họ này có các tính chất sau
1)Vxe€ Lion), Hx) — oh,
3) vxc X*, vÀ, kc 11, Hw) c 110) và Men He) = Ø với hà k,
3) Yxe *, 70) = (J „H0n)
Về mặt ngữ nghĩa ta thấy M(x) là tập tắt cá các khái niệm được sinh ra tir x nhờ
việc thay đổi ngít nghĩa của x bằng các gia tủ ngân ngữ Các khái niệm như vậy đều
mang ngữ nghĩa “gốc” của x và do dó chúng góp phân tạo ra tính mở của x Chẳng, han lap H{App truế) — {2 trưố : đ © AY} tong dé A là tập lật cả các xâu trên bang
thể hiện rằng lính xnờ của khái niệm x chính là được Iạo ra lừ các tính znờ của các
khai niệm thứ cấp được sinh ra nhờ việc biểu chướng ngữ nghĩa của tất cã các gia
tử
Với những tính chất như vậy ta có thế xem tập 77(x) mỏ phỏng tính mờ của khát
riệm x De vay dé xác định độ do tính mờ của khái miệm x ta 66 thé dum vào việc
Trang 2222
các dinh kich thuée dinh luong cia tap H(x), chẳng bạn như nó là dường kính của tập HQ), được ký biệu lá dix)
Để đính lượng la xét một ánh xạ bão toàn thứ tự ƒ: X* —> [a,b], rong đó đoạn
Ta,b† là miễn giả trị của biển nên (base variable) của biên ngôn ngữ #&c Vi ƒ báo toàn thứ tự và nhận giá trị trong [a,b] nên ta có thể xem ƒ là ảnh xạ ngữ nghĩa định lượng, của #ˆ Theo truyền thông, để chuẩn hỏa, ta luôn luôn giả thiết rằng hàm £ nhận giả
trị trong đoạn [0.1] Một cách chính xác ta có định nghĩa sau:
Định nghĩa 1.6 Một ảnh xạ ý được gọi là ảnh xạ ngữ nghầa định lượng của 8
tiêu nó thỏa mãn các điều kiện sau:
Q1) £ lá song ảnh,
Q2) f bao toan thứ tự trên X*, tức là x <y —> Ñx)< Ấy), và f0 0 f7) 1,
Q3) Vx © X*, — Inlmum /G)) và flor) ~ supremum (HQ)
Tinh chất Q3) có thế xem 1a tinh chat liền tục và cũng là một đòi hỏi tự nhiên
Với ánh xạ ngũ nghĩa ý, kích cỡ của tập 11x), hay độ đo tính mờ của x, có thế định lượng bằng đường kinh của tập ÑH(©)) và kí hiệu là Ñn(x) Mục đích của chang ta la tim phương pháp xây dụng ánh xạ ngữ nghĩa định lượng trên cơ sở độ
do tinh mờ Mặt kháo việc tiên đẻ hóa đô đo tính mờ đễ hơn và true quan hon Vì vậy ta đưa ra hệ tiên để hóa của độ đo tính mở trong định nghĩa saix
Dịnh nghĩa 1.6 ( Dộ đo tính mở )
Gọi 774; là tập các phần tử sinh ra từ x bởi oác gia tử Vi vậy, kích thước của
TH) có thể biểu điển tỉnh mờ của x Do đó la có thể định nghĩa độ đo tính tờ cia x,
+ý hiệu /ñmGÒ là đường kính của tập Z7) ={f(u}:ueii@6)}, trong đó £ X->[0,1]
Trang 23(1) fin(o") — w > O vat fin(o') — 7= w>0
(2) Voie © foe") thi S fae) = fale)
ra
(3) Véi Vayex, vher, HỮU) PHUN) — HP) vớ eco ty,
fmx) ƒmịy) — fife)
nghĩa là tỉ số này không phụ thuộc vào x và y, được kí hiệu là //(/) gọi là độ đo tính
md (fuzziness measure ) của gia tử
Mật số tính chất của độ đo tinh mi far
Trang 2424
GQ) #mđm) = nñmG\), với VseX
(2) #06) — #uŒ), trong đồ 6 € {e—, e}
@ S jinthyx) — fin(2), với VxCX
rt
(4) Suthy=a va ¥ u)= Bye, P>Ovaatp=1
1.1.4.1.5 Hảm định lượng ngữ nghĩa của biến ngôn ngữ
Dinh nghia 1.7 [12] (Eden Sign)
Hàm 8n: X —>{-1, 0, 1} lồ một ánh xe được định nghĩa một cách độ qui nhu sau, với Vh, hlellL
(1) Signéc ) = -1 va Sign(he ) = |Sign(e )néu he «co
Sign(he") = -Sign(e") néu hie > o7 Sign(c') =+1 va Sign(he") = +Sign(c') néu he" >
Sign(he") = -Sign(e’) néu he" <o*
(2) Sign(h hx) - -Sign(hx) néu h' ta negative đôi với h và hhhx + hx
(3) Signth hx) +S8ign(hx) udu h! la positive dai voi k va hihx # bx
(4) 8g(hfx) Quốu hữm hx
Diub nghia 1.8 [12] (Ham định lượng ngữ ngiữa 1) Giá sử cho trước độ do tính tờ
của các gia tử zz), và các giá trị độ đo tính mờ của các phần tử sinh fre), fin(c')
và w là phần tử trưng hỏa Hàm đình lượng ngữ nghĩa (Qsemdilatively semaniio
function) v của X được xây đựng như sau với x=h„„
(1) v() =w-d,#m(c) và v(c") = we, fine")
Trang 25(v1) Buse l: Với 4j€+) = 1, tức là x e (€, £'}, ta chia đoạn [0,1] thành hai doạn, ký hiệu là z(£ ) và (c'}, theo thử tự từ trái sang, phải, tức là s{£) ‹< s{e') và
dé dai ca doan 4c), HAC) ~ fine), va Kefe')) ~ fin(e!) Khi dó giá trị v(c) là didn chia doan 4{¢7) thamh bai doan con theo t7 16 #: a vi Sign(e")-1 Con ufo)
la diém chia đoạn +4”) thành hai đoạn theo tỷ lệ œ: 8, vi Sign(c) +1 Cáo đoạn
cơn thu được tương ứng với tất cá cdc tir ca dé su dp(x) = | tạo thành một phân
hoạch của đoạn [0,1] với tính chất Ä(s{x)) = #m(x)
(v3) Bước 2: Di với đoạn s{e ), vi Siga(e ) = -1, ta phần hoạch đoạn đỏ thành qtp đoạn sao cho 4AfuZ ) > 2bế), với =4 € ï <7 Sp, và IQuế)) = #m(hể ) Lưu ý
ving x Vữic )= (Wm(C )và điểm chia Wc) la diém nit chung efia bai đoạn
Abie) va Hiể), Ngược lại, đối với doan s{c"),vi Sign(c") = +1, ta phân hoạch doan 4c") thanh q!p doan sao cho hc") < dhe"), với -g < £ <7 < p, và the") =
firth’) Lua y rang 3)”, finthe )= ffadc')va diém chia v(c') 4 diém nut chung
của hai đoạn 4(#_,e”) và {b,¡ể), Giá trị vfnc°) được chọn là điểm chia doan Chic}
theo tỷ lệ a: A néu Sign(/¿°) = LÍ và theo tỷ lệ 8: a nếu Sign(h¿¿F) = ~L
'Ta cũng thấy các đoạn con thu được tương ứng với tit cá các từ +”! có độ sâu
Trang 26dp(@SÐ ~ 2 lạa thành một phân hoạch của đoạn [0,1] với tính chất 143/25) — font?)
va vl") la did trong của mỗi đoạn
(v3) Buớc lấp: Giả sử quy nạp rằng các đoạn thẳng con của tất cả các từ xÈ ? có
độ sàu &-1, tập các đoạn con thu được tương ứng với tắt cả các từ có dộ sâu dp(x!")
= k-1 tao thanh mét phan hoach cua doan [0,1] voi tinh chit K(x") = fant") va giá trị ve") 1a diém chia doan x”) theo ty 18 a đ nếu Sign(e!")
tỷ lệ B: a nbu Signia* ) = -1
F1 và theo
Giảng như trong Hước 2, đổi với mỗi đoạn «@x°?), với x có độ sâu đp(x) = k-1,
iếu 9m(x'°?) - -1, thì tá phân hoạch doạm đỏ thành œ+p đoạn sao cho hx) >
the"), vei ý <4 <j < p, và Kotha) = fla), Lom ý rằng
fh) — rks) va điểm chia ve) 1 điệm nút chung của hai đoạn he) va thy), Khi ab whe) la didn chia doan (4x) theo ty 1
@: Bi néu Signthx) = +1 Ngược lại, nếu Sign(x) = +1, ta phân hoạch đoạn
ac*") thành q p doan sao cho he) « sgl", vei g < i<j < p va Kotha
Ds sinha"),
Định lý 1.5 Xe anh xa duge xây dung trong Dinh nghia 1.6 Tập ảnh v|H(x)] là
tập trù mật trong đoạn x) = [v( ge), vCar)], Vx = A, voi ur) = infant v[LIG)], v(ax) = supremiun v[II@)] va fine) = v(ox) - v(gx), te 6 bang 46 dai ctia doan
&)
Chứng mình: Với cách xây dựng như trên, có thẻ thấy bằng quy nạp là nêu đoạn thắng ấu) đã được xảo định thì giá trị rƒy) được xây đụng bằng cách chia đoạn
thẳng đó ra thánh p+g đoạn thẳng con 47/0 theo thứ tự của ƒ c [-gˆp] sao cho độ
đải của doạn thứ ; bằng ðn(J)#0) — ø(,Jðn(0) và giá trì v(bz chúa đoạn fj) theo
tỷ lệ œ: /@hoặc /8: ø Tất nhiên ta có v(2)e Aha) Vide chia nay bao gid cing thuc hiện được, Bằng cách như vậy, ta chia đoạn thẳng xuất phát 4x) thanh p+q doan con và tương tự như vậy, với mọi y CHG), y= #ụ hạx, hị, fy, CH, ta 06 thé chia
Trang 27bà a
đoạn con 43) thành p+q đoạn can và đoạn con thứ ï có độ dài là finfhy) =
4thUfn() = Hữu họ ác L8/JfMQ) < Ä #m(), tong dò: Á= Max): Ƒ
€[ ø'p]} <1 Ta cũng có vfiw)e 4n)
Bay giờ ta có thể dé đảng chứng minh rằng tập ảnh v[H(x)] là tập trủ mật trong
đoạn s3) Ta lấy một đoạn thẳng [a,b] co độ đải £> 0 bat ky Voi moi phần tứ trong HỘ) cô đạng y— hạ ha, bị, ,hụ ©H và với œ dã lớn, đoạn thẳng x) duoc
chia thành các đoạn con có độ đài không vượt quá 2'°/#m(x) < £/2 Vậy có tên tại
một đoạn con 4’), „ˆ e Ö@v), với v(y)e.ấy2, thu dược từ cách chia đoạn Ấx) như
trên nắm trọn trong đoạn [a,b] Diễu này chủng tỏ tập ảnh v[E(x)] là tập trù mật
trong đoạn 4x)
Dé dang nhận thây rằng v(4ha), v(oñix), được xác định trong 3) của Định nghĩa
1.6, là cận đưới dúng và cận trên dúng của đoạn thẳng 4x) Vậy ánh xạ v thỏa
mãn điều kiện Q3), Định nghĩa l.5
Từ lính trù mật nảy la suy ra 3%) - [v(k), v()] Do đó (v79) — #mŒ) — v(2) - v(#x)
'Ta có hệ qủa trực tiếp của mệnh dẻ trên như sau
Hệ quả 1.1 Cho AXE là đại số gia tử tuyển tỉnh, đầy đã và v là ảnh xạ được xây dựng như trong Định nghĩa 1.6 Khi dó tập ãnh v[#4(G)] trủ mật trong [Ø,1]
Định lý l6 v là ánh xe ngữ nghĩa định lượng và thôa mãn tính chit
Trang 28Giá trị ngôn ngữ Tim v Giá trị ngôn ngất Tiầm v
Very Possibly Small 026 Vary Possibly Large 0.74
Very Tittle Simall 0.46 Faery Little Large 0.54
1.1.41.6 Sự tương tự tô-põ của đữ liệu định nghĩa bởi ánh xạ định lượng ngữ nghĩa
Chúng ta hãy cùng xem xét một biển ngôn ngữ và giả thiết rằng không gian tham chiêu là Uạ, nghĩa là các phân tử của LU, là dữ liệu rõ Bộ dữ liệu ngôn ngữ mô tả giá trị trong L/x hay miễn ngôn ngữ của A được ký hiệu là //2øm(1J Vi trong nhiều trường hợp, một biển 4 cé thé nhan giá trị trong LĨu cũng như trong một tập Trgôn ngữ X = 1Dom(4) của biển ngôn ngít 4, chứng ta có thể xéi một miền hỗn hợp olla A va dit D4 =LDom(A) o Uy
Câu hỏi đặt ra là làm thế nào đẻ chúng ta có thể dịnh nghĩa sự tương tự của dữ liệu trong một miễn hỗn hợp 24?
‘Theo phương, pháp kinh diễn, mỗi dữ liệu ngôn ngữ dễu được hiểu là một tập mờ trong [74 Rõ ràng theo cách thể hiện đữ liệu mỡ nảy, việc xử lý dữ liệu khó hơn so với xử lý đữ liêu rõ Đặc biệt việc xác định sự tương tự dữ liệu bằng một phương pháp hợp lý không hề đơn gián
Trang 29Chúng ta sẽ trả lời câu hỏi nảy theo cách chúng ta có thể xử lý dữ liệu trong các cơ
sở dữ liệu một cách để dàng và theo một phương pháp thông nhất
Đầu tiên, chủng ta thấy rằng trong trường hợp nảy các kiêu dữ liệu của thuộc tính 4
không phải lả duy nhất Để thông nhất các dạng dữ liệu, chúng ta sử dụng một ánh
xa định lượng ngữ nghĩa 0; gắn với một biển 44 để biên đổi tuyên tính dữ liệu ngôn ngữ sang dữ liệu thực, nghĩa là „ : X —› L„ Như vậy, mỗi dữ liệu ngôn ngữ x của
.4 có thể được coi như là nhãn của một giả trị thực được định nghĩa bởi 0ạ Vì D„(x)
€ U¿, chúng ta có thẻ thiết lập một phương pháp xử lý dữ liêu dang thực và dạng
ngôn ngữ bằng một phương pháp thống nhật
Vi gia tri thue v(x) chỉ là một đại diện của thuật ngữ không chắc chắn x, chủng ta không thể đơn thuần sử dụng 0„@) thay cho x khi so sánh với dữ liêu thực và các gia trị ngôn ngữ của A Vì vậy, vẫn đề quan trọng hiện nay lả lắm thế nào đề chúng,
ta có thể định nghĩa được một khái niệm vẻ sự tương tự ngữ nghĩa của dữ liệu trong
Dạ
Ching ta da biet, tap 9" = {H(x): x H(G)}©2{X} được coi là cơ sở của một
%, nghĩa là (X, %) trở thành một không gian tô-pô được định nghĩa bởi 9’, va H(x),
tập tất cả các thuật ngữ xuất phát từ nghĩa của x, thể hiện một sự tương tự ngữ nghĩa giữa các phần tử của nó Bên cạnh đó, vì 0 bảo toản quan hệ thứ tự ngữ nghĩa trên
X, chủng ta cỏ thể coi khoảng 5(x) = (0„( đà), 0„(23)] như một lân cận của phân tử v4(x) © Ủx và gọi nó là lân cận ngất nghĩa của thuật ngữ mờ x Nó phản ánh một
mức độ tương đồng vẻ ngữ nghĩa giữa x và giả trị thực trong khoảng 3),
Dựa trên phân tích nảy, chủng ta cỏ thể xử lý dữ liệu trong một cơ sở dữ liệu theo
cách thông thông thường và thống nhất như được trình bảy dưới đây Tuy nhiên,
vấn de đặt ra là lam thé nao dé ching ta cỏ thẻ tìm một lân cận của thuật ngữ x đủ nhỏ ở mức mả chủng ta mong muôn? Chủng ta cỏ thể tiến hảnh như sau:
Trang 3030
Cho trước một miễn thuật ngữ X của mệt biến ngôn ngữ 44 Ký hiểu X; là tập tất
cã các thuậi ngữ cửa x có độ đài k, nghữa là Xy— {x © X: Kx) — &} Phần tử nhỏ nhất
trong X; được k hiệu là xạ Chú ý là 0„(đxø¿) = 0 Ta hãy đưa ra các kỷ pháp như sau PAL Hx) (v(t), DẠ(ĐỘ|, với xe Xã và xẻ xạ, và 5x4) [ĐAÁĐey),
ĐA(ZXa)] hoặc đặt Sx) = [vA Pr), 0(24)] nêu 0„(đx) = 0 Bằng phương pháp quy
nap, cé thé thdy rang,
(1) Dal SO) {Ấxả) Le Ben), On Bead lh 2 7Œ) (wal dee), va Bh) fp x
X, & x +x} va gọi các thành phần của nó là lân cận mức & Khi đó 3(Xị) là một phân hoạch cũa khoăng L7, nghĩa là:
(Œ) Bãi kỳ 2 lân cận khảe nhau trong, 2(Xi) đều rời nhau; và
(0?) Hợp của tất cả các lân cận trong 3(Äj) bằng Uy
(2) Phân hoạch 3X ;) min hon 3(X0, nghĩa là mỗi khoảng cửa 3X.) thuộc một khoáng của T(X¿) Nếu clrủng ta gọi 4y lả độ dài lớn nhất của các khoảng trong HX) va 7 là đô mờ lớn nhảt của các gia tủ trong Z7, khi đó tá có Âu; < pay < FA;
Vi ï?< 1, nên thuật ngữ x càng cụ thể (hoặc công dài) thì khoảng 2(x) cảng nhỏ
(3) Ảnh xạ D„(+) của mỗi thuật ngữ term x c X; có độ đài 7 < š luôn là diễm mut chung của hai phân hoạch thuộc khoảng, 3ỢX¿;)
Định nghĩa 1.9 Với mỗi thuật ngữ Ay he 06 d6 dai k, ¢ © Ở, 1uột tập hợp
cáo khoảng, ký hiệu là NeiG’ (x), đ> &, được gọi là một hệ lân cận ngữ nghĩa cơ sở
với độ dài đ của x theo ánh xạ tụ, nếu nó bao gồm những phân hoạch sau:
1) ®@) = Ø0) = (ua(đ), 04291, một khoảng với độ sâu k của x;
3) đ@9, với đ >7 > k, 906) là khoảng được định nghĩa là hợp giữa hai khoảng
với độ sâu ƒ có giá trị „(«) là điểm mút chung, Nó cũng được gọi là một lân cận có
độ sâu / của thuật ngữ x.
Trang 3131
Rõ rằng o;(x) luôn là một điểm trong của mọi làn cận ngí nghĩa của NeïŒf,(x) Cân
hm ý là cách định nghĩa các lân cận theo định nghĩa trên phụ thuộc vào quan hệ giữa chỉ số biểu thị dộ sâu của một lân cậu của thuật ngĩt x và dộ dài của w
Ví dụ 1.2: Chúng ta hãy xem xét một đại số gia tử tuyển tỉnh về AGE, At = (X, G, C,H,E Œ.<),vớiGŒ tyơung,dld),H {P,LÌ vàH'- (VỊ, PL, M và
các chữ viết tắt tương ứng của 2ossibiy, Little, More va Very Gid sit, = JO, 1201,
#n(old) — 0.55, fn(young) — 0.45, sP) ~ 0.32, uL) - 0.20, wd) - 0.30 va a) - 0.18 Nhu vay a= 0.52 va A= 0.48
lu young), vf Spoung)| (0, fan(young)*i 20] [0, $4.00),
HG lan can ngit nghia co sé véi dé sdu 2 otia tir young, NeiG" (young), bao g6m phan hoach S(young) = [0, 54.00] va phan hoach (u,(@Myvoung), v4 DMivoungy] c¿
(u.( EP voung), v.(2Pyoung)] = (uC @i¢young), vs(2Pyoung)|=(v.(voung) fin(At
young), v,(young) | fin(Pyoung)] = (28.08 — 0.135%120, 28.08 0.144120) = (11.88, 45.36], vi Myoung and Pyoung la cae từ lân cận trải và phải với độ sâu 2 của young va IMyoung = @Pyoung = young
Lan cin véi 46 sau 3 cia young theo u, 1A phin hoach @:(young) = (v PLM
voung), bA2LMyoung)] ‹2 (b(@ŒWyoung), U(2VPyoung)| = (DI(GLAAyoung),
vf ZVPyoung)| (valyoung) — fn Myoung), v4young) + fn(VPyoung)| (28.08
Trang 322) Các lân cận ngữ nghĩa của 7ossibly young: Theo định nghĩa, UA(Pyowng) chia khoảng (0, ương), 02()| theo tỷ lệ 8: ava do vay u(Pyoung) 28.08 + 0.48+0.32x 0.45⁄120 = 36.3744
NeiG' (Pyoung) bao gồm một khoảng đuy nhất [Da(đ2young), 0u(2Pyoung)] = (28.08, 28.08 : 0.32+0.45x120] = (28.08, 45.36];
NgiŒÌ (Pyoung) chứa các lân cận trong NeiG? ,(Pyoung) va cdc lân cận sau vôi
lưu ý rằng độ sâu của Pyowng là 2:
@{Pyoung) = (vs(Pyoung) — fo MP young)*120, v4(Pyoung) +
Trang 3333
CHƯƠNG 2~— XÂY DỰNG MÔ HÌNH CSDL QU
THONG TIN NGON NOT’
2.1 Giới thiệu chung về cơ sở dữ liệu với thông tin ngôn ngữ
Xât một lược để CSDI, quan hệ 2B {U, Ry, Rp, ., Re, Consi}, trong đố Ù {4,,
Ay, oy Aq} lá tập vũ trụ các thuộc tính, 74, lược đổ quan hệ, tức lả một tập con của
U, Const 14 mét tap các ràng buộc đứ liệu của CSDL Mỗi thuộc tính <4; được gắn
với một xniễn giả trị thuộc tính, kỷ hiện là Dom(4)), trong đó một số thuộc tính cho
phép nhận các giá trị ngôn ngữ trong lưu trữ trong CSDL hay trong các câu hỏi truy vẫn và được gọi là thuộc tính ngôn ngữ Những thuộc tính còn lại được gọi là thuộc tính thực hay kinh diễn Thuộc tính thực A duoc gắn với một miền giả trị kinh diễn,
ký hiệu là J2¿ Thuộc tính ngôn ngữ 1 sẽ được gin mét miễn giả trị kinh dién 4, va Tnột miền giả lrị ngôn rụyữ ƑJ2,,
Giả sử một thuộc tính 4, gắn với một miễn Ø4) — + +2 LDom(4) Các thành
phân của 2„; được kỹ hiệu bởi a, ở, e, với các chí số nêu cẳn, vả các thành phần
của LDøm(4) được ký hiệu bằng +, y, z, w, v, cũng với các chỉ số nêu cân
Một hộ ¿ trên Ữ là một ánh xa t J > DAUD (Ag DHA,) sao cho “Ade DOAJ,
tới 1< ¡<n Các bộ được ký hiệu bởi £ s với chỉ số khu cản #4] croc hiéu lA gid ti
của bộ ¿ tại thuộc tính z1, Với một tập con_Y bất ky thuée U, 1[X] biểu thị ánh xạ t
giới Hạn trên Ý và được gọi là bộ trên X-
Chúng ta hay xét mệt lược đổ quan hệ, tức tập #‡ của L Một thể hiện của # là một tập các bộ trên R va dược gọi là quan hệ Các quan hệ của R dược biểu diễn bởi HR], of], Néu R không gây hiểu nhằm thì có thẻ bỏ đi trang ký pháp này
VÌ £ có thể nhận các giá trị thực và giá trị ngôn ngữ, ta cần cỏ cách dé thao tac dit liệu đựa trên ngữ nghĩa Nếu ta điễn giải dữ liệu ngôn ngữ như là nhãn các lập mờ thị có thể thao tác đỡ liệu dựa trên lý thuyết tập mờ và ta có khái niệm cơ sở dữ liệu
mo.
Trang 34Ta sẽ trả lời câu hỏi này sao cho có thể quản lý được đữ liệu trong CSDL theo một cách phủ hợp vẻ ngữ nghĩa vả thuận tiện nhất
Cho rvà s là hai bộ định nghĩa trên [7 Mỗi thuộc tính 44,sẽ được trang bị một ánh xạ
inh hong v(4,): LDom(4,) > U, Câu hỏi đầu tiên là làm sao chúng ta có thể định
nghĩa được một quan hé "bing" tén D(4,) trong đỏ đữ liệu ngôn ngữ (dữ liệu không chắc chắn) tần tại cứng dữ liên thực? Định nghĩa quan hệ "bằng" đường rửur
là hợp lý nêu nó thốa mãn các điều kiện sau
1 Liên tục
2 Về nguyên tắc, nếu có "đủ" các bằng chứng chí ra rằng bai dữ liệu
trong D(4,) là khác nhan, chúng không thể thỏa mãn quan hệ "bằng*
Trong trường hợp của chúng ta, hãy xem xét các chỉ tiết sau như là những bằng,
ghứng đây đủ cho sự khác nhau:
(i) Hai giá trị thục kháo nhau,
(0) Hai đữ liệu ngôn ngữ cụ thể nhất có trong CSDT,
Trang 35Tuy nhiên, để khai thác ngữ nghĩa của đữ liệu ngôn ngữ trong CSDL, ta đưa ra một
ký pháp "bằng nhau mức &°, với È là một số nguyên Van để nảy duòng như phụ thuộc vào cách chúng 1a hiểu ngữ nghĩa của đữ liệu ngôn ngữ trong 72(4,) ruột cách chính quy,
Đầu tiên, chúng ta định nghĩa một quan hệ "bằng" mức & trên /J(/1) Với mỗi số
tuyên đương k đặt VÉ) {x © LDom(): (x)}<k} Xị l2Ấ ki k2 Ấ có nghia la X(k) li tập cáo đữ liệu ngôn ngữ có độ sâu không lớn hơn k
(Xị) và SỢM, 1) của khoảng 7„„„ Dựa lrên nghiên cứu của phần
Xét hai phân boat
trước, sự lương tự về tô-pô của đữ liệu định ngkữa theo anh xa định lượng ngôn ngữ,
ching ta dinh nghia lân cận mức # của các thuật ngữ trong một CSDL như sau:
(ND) Voi mai x c X(k-T), 0œ) là một điểm muối của các khoảng nhất định
thuộc phân hoạch '5(X¿) Ta đặt (23x) = @@), lân cận mức & của thuật ngữ x
được định nghĩa, như trong phẩn trước, là hợp của hai khoảng có độ sâu l7 nằm phia trải và phía phải của điểm v(x);
(N2) Với mỗi y < +, đặt (40) = 50) \ Une 80):
(N3) Với mỗi x= hy) hyo © XY, trong đó e © Œ và ƒ > &, đặt (10) = (Q0
hc), nghĩa là lân cận mức k của một thuật ngữ có độ sân lớn hơn È chính là lân
cận mức k của hậu Lỗ của nó với dộ sâu &
`
Tlinh 4: Một ví dụ vẻ hệ lân cận
Trang 3636
Dé mink hoa, ta hay xem xét một ví dụ cho trong hình 4 Với x có dộ sâu nhỏ hơn &,
nghữa là xe A©2), lần dân (24G) — đáx) mức & cửa x là hợp của hai khoảng
hạ 4(2-.;), hai tập con của các khoảng nhất định của 3%) Ching han, xét y c Xpva
x, x? © X(k-1) trong hitth, 6G) = Wg) Shyu’) va Ae) = đỮny) cà 30a”) Với x = hy, trong đó Ấy) = k, ta có (10) = AQ) = Shy) © My) Nhu duge chứng rmainh Hong phần sau, chúng la thấy rằng họ {4Œ}: x cA(&)} là một phân hoạch của (2, Ngoài ra, với mỗi x e XŒ, D2) e £3@) vả, hơn nữa, đó là một diễm trọng tô-pô của £3(x) Do vậy, chúng ta sẽ gọi nó là một hệ lân cận mức È của cáo giả trị ngôn ngữ của A, theo Uz,
Định lý 2.1 Cho một ĐSGT tuyển tỉnh dây dủ, trong đỏ lập các gia từ HT and H
có ít nhất hai phần tủ Khi đó, họ các khaảng { 4G): x €X}, lan cận mức k của đt liệu ngôn ngữ của thuộc tính A,, là một phân hoạch của I1 và do Ãó, mỗi thuật ngữ
x của A, cô một lần cận mức k dhụy nhất Ngoài ra, với mỗi x CÁ, 0Œ) là một điễm
trong của CALx)
Chứng minh: b„(+) là một ánh xạ một-một từ X vào /3„ và 5Q0,.¡} là một phân
hoạch của Da; mịn hơn %(j) Da #f và #f” có ít nhật hai phân tữ mỗi khoảng của
S(X/) dịnh nghĩa theo x c X; chữa ít nhất bốn khoảng con được định nghĩa bởi cào
phân Lữ theo đạng lx, he HH càHT, Vì với mỗi xc XÉCD), DaÁ@) là một điểm
xuút của một số khoáng của phân hoạch '%(X;) và theo (V7), £3(x) = 4Œ) là hợp của hai khodng trong S(¥pe1) năm phía bên phải và trái của điểm bạ @>), suy ra {4Œ}: x cXŒ-D)} là họ các khoảng rời nhau Rõ ràng rằng 0z) là một điểm trong cửa 4œ)
‘Ya cũng nhận thấy, (M2) cho thấy {(4@): x cXŒ)} = (4G): x cXŒ=ĐD] xà (403: yĂ€Xz} là một họ các tập rời nhau Ta cân chứng mình rằng, với mỗi y cX+ Qty) + Z2 và nó lá một khoảng Thực ra, chúng ta cần xem xét khoáng '%(y) Dễ nhận thấy ring né được định nghấu là ảnh của tập H,@) theo ảnh xạ dạ và S(y) chứa các
Trang 37khoảng hữu hạn có độ sâu & 7 theo thử tự sau: hoặc S(L„y) < Su, ở) < < SƠ
YY S Oe) < S(ty) < < S(h,y) hoặc S duy) < SỢu, p) < < Suy) Š DA) <
Shy < 5(,y) Cân luu ý rằng không phân tử nào của 7/0) có độ sâu nhỏ hơn & hoặc nếu x c Z2) có độ sâu nhõ hơn &, thì o„„áx} phái lá một diễm mút của 0) Do đó, phụ thuộc vào việc các điểm mút của %(y) có phải là ảnh của các phan
tử của Xức7) hay không, (1Ó) sẽ không chứa một trong hai khoảng, 9Œ: „y) và S(#„y) hoặc cả hai Rõ ràng là, trong mọi trường hợp, (1Ó) là một khoảng và b0) làm một điểm trong cia 19)
Vi với mỗi 7 > &, {1Ú} y =X} C (40) y eXH, ta để thấy từ định nghĩa rằng, {QQ}: x =X† là một phân hoạch của „, M
Bây giờ chúng ta đã sẵn sàng đưa ra khái niệm “bằng không chắc chắn" trên (44) của thuộc tính ngôn ngữ 1;
Dinh nghĩa 2.1 Giả sử ¿ và s là hai bồ trên E7 Ta sẽ viết 4] —„z s[⁄4] và goi nó lA
dang thie mirc &, nều các điều kiện sau được thỏa
() Nếu 44] 3⁄4]c 2z thì 8⁄4] = s4},
(ñ) Nếu chỉ có một Irong Hai bộ 4⁄4;|, s|⁄4,J, chẳng hạn /|⁄4J, là đữ liệu ngôn ngữ, thì s4] < 4);
(8Ø Nêu cả ti ![24,], x⁄4,] là đữ liệu ngôn ngữ thì QULAD - Alsl4))
Có thế đễ kiếm chúng rằng “đẳng thức” =„¿ mức & thỏa tất cả các điêu kiện trên Ở
đây ta hiểu rằng riều một trong những điều kiện trên không thỏa, ta xem như có đã bang chứng (mức &) dễ chỉ ra rằng hai giá trị là khác nhau
Trang 3838
Hệ quả 2.1 Với hai bộ s và t bắt kỳ định nghĩa trên và thuộc tính A, hoặc tL4|
ve SLA] hod ((A,] zu« s4], ngoài ra, đẳng thức —u„ mutc k ở trên là liên tục trên
mién D(A)
Thát biểu này cho ta khả năng định nghĩa các quan hệ đồi sánh mức # khảo giữa các phân lữ ong 74) một cách đễ dàng, Để đơn giân hóa việc phát biểu trong các
định nghĩa sau, chứng †a châp nhận một quy tróc vẻ cách sử đụng, 14, như sau:
voi hdd Đại, (G14) biểu thị giá trí thục 4| và, với một dữ liêu ngôn ngữ 4⁄4¡] 44040) biểu thị in can QULAD đình ngiõa ô trên
Với hai lân cận bất kỳ £3(1) và /40), ta sẽ viết (4) <: 4Ó), nêu t < v, với
<G) và ve 40) bắt kỳ
Dịnh nghĩa 2.2 Cũng với giả tuất như trên,
() Ta sẽ viết H21] Su; sf), née hode A] = sf] hode 44⁄4) < SASL);
(0 Ta sẽ viết t4] xu; sl2Ll, nếu (0124) < QUI),
Gi) Ta sẽ viết tLA,| >¿ s 4,1, nếu C4014) > AGlA,)
Những quan hệ này được gọi là các quan bệ đối sánh mờ trên một CSDL với đữ liệu ngôn ngữ
Dinh lý 2.2 V6i hai gid trị bắt kỳ t4), s4] = DỤA), chỉ một trong hai điều kiện
san thỏa
(4) 8⁄1] =„x s4], G9 f
Spe TAs] 0/9 8⁄4] >¿š She]
Chứng minh: Theo hệ quả 31, với hai bộ ø và r bất kỳ †a có hoặc /{4,] =u¿ sL4,] hoặc 1⁄4] #ay s4] Trong trường hợp -4] #uy 3[⁄4,], có ba khả năng xây ra:
1) Nếu 4] và sE4,] là các giả trị thực, định lý hiển nhiên đúng,
2) Nếu chỉ một trong bai bộ (.4,| và sL⁄4,| là giả trị thực, chẳng hạn 444,|, thì ta có 14] £ (s4) và do đó, boặc 241 <¿z (G44) hoặc 4A] >u (G14) Các bất
Trang 39Ví dụ 2.1 Giả thiết giống như trong ví dụ 1.2 Ta sẽ định nghĩa hệ lân cận ruức 2
và các quan hệ đổi sánh mức 2 theo tự,
1) Hệ lân cận mức 2 của các thuật ngữ thuộc X(2) không lớn hơn young: Tập Ấ; với các phần tử mức 1 không lớn hơn vøwng chi chia young Dio vậy, nếu biểu thi young bdi y, ta củ 2G) — AG) = SUA) ‹ 3ŒPy) - (2808 — 0.20x0.30x0.45x120, 28.08 + 0.18x0.32x0.45x120] = (24.84, 31.1904], trong đó như đã chi ra trong vi du 1.2, v4(voung) = 28.08
Cúc thuật ngữ mức 2 không lớn hơn young la “More young” va “Very young” Ching ta 06 (Hinh 5): (Very young) = S(Very young) = (nv PVy), vl VY) = [0 409-1 54.11 = [0, 28.08 0.30«0.45%120] = [0, 11.88] and GCVfore young) = S(More young) \ S(LMy) = (11.88, 28.08 — 0.20%0.30%0.45%120] = (11.88, 24.84]
2) Ta dua ra một số vi dụ vẻ quan hệ đổi sảnh mức 2 trên (4) định nghĩa bởi một SQM 0: Theo dịnh nghĩa 2.2, có thể thấy ring MF young —,,2 LF young —.,> young vA PM young ~,2 M young V young <y2 young va young <p 54, vì S{young) < 34, nhang 54 =,, young suy xa từ 54 c (20) = 3Ó) = [0, 54)
Trang 4040
Hình 5: Ví đụ về hệ lân cân
Trong các ứng dụng, chúng ta thường sử dụng một số lượng nhật định các dữ liệu
ngôn ngữ Do dé, ta cô thể giá thiết rằng, số đữ liệu ngồn ngữ của 41, là hữu hạn va
đo vậy ta có thể giả thiết rằng có một độ dai lớn nhất #, cho những dữ liệu ngôn ngữ Trong trường hợp này, các thao tác dỏi sánh xuức &; có các tính chất sau:
Định lý 2.3 Giá thiết rằng tập LDomQA) các để liệu ngôn ngữ của một thuộc tính
A, tập nên X của một ĐSG1 tuyển tinh ddy dit AX, la hie han va & là độ sấu lớn
nhất của đit liệu thuộc Lom(1) Khi đö,
() TẤt câ các quan hệ dối sảnh mờ “ụu, tui, mu “uy Đề >ụy với k > ky là
trùng tương ứng VỚi - sua 7, „ạ và vì thế Irong trường hợp
này ching ta sé sit dung ky phap =,, +0, “v,?y,* va >, thay cho =on, Aum
Sues Zur Soke VE vin
(i) Cae quan hd ddi sinh mo, 4), Sự, >ụ, < và >v trên LDam(1) là trùng
với =,⁄, %>,< và > định nghĩa tren X,
Chứng minh: (¡) Vi & 1 độ sâu lớn nhất của dữ liệu ngôn ngữ trong XÃ, ta có XỨ) = Xứ) với mỗi k > k„ Chúng ta cô {4G}: x CX(] = {£4@}: x cXk)}, diéu nay chứng tổ (0 là đúng,
(2) Đề chứng minh () chỉ cần chứng tỏ rằng £3,(x) chứa một phân tử đuy nhất cửa
va(X(k)) Thực ra, vì mỗi lân cân (34x) chứa mệt phản tử duy nhất của 0„(X()),
ta suy ra, voix, y @X, x —» y niêu và chỉ nếu i[ Є@) — Đ4@y), suy rax — y Ta biết
xầng, 0ạ, bảo toàn thứ tự của ÄX, tập {44x} x cX(J)] là một đẳng cầu vào Ý Điều
này clưúng 1ó tính đúng, đắn của phát biểu cho các quan hệ đổi sánh còn lại
Tây giờ ta chỉ ra rằng mỗi lần cận £3(>) chứa một phan ti duy nhất của o„(X2)
Ta biết rằng ánh của phần tử bất kỳ của X(&-7) theo ánh xạ 0, là điểm mút của họ