1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn về một mô hình csdl quan hệ với thông tin không chắc chắn dạng ngôn ngữ gần tự nhiên

104 1 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Luận văn về một mô hình Cơ sở dữ liệu quan hệ với thông tin không chắc chắn dạng ngôn ngữ gần tự nhiên
Tác giả Phạm Lấc Cương
Người hướng dẫn PGS, TSKH Nguyễn Cát Ho
Trường học Đại học quốc gia Hà Nội
Chuyên ngành Kỹ thuật và Công nghệ Thông tin
Thể loại Luận văn Thạc sĩ
Năm xuất bản 2008
Thành phố Hà Nội
Định dạng
Số trang 104
Dung lượng 1,17 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Khảo với CSDL mờ trong đó giá trị ngôn ngữ được xem như lá nhãn của tập mi, theo nách tiễn cân của ĐSGT, các giá trị như vậy được xem chính là các phẩn tử của đại số gia tử, vỉ theo

Trang 1

ĐẠI HỌC QUỐC GIÁ HÀ NỘI

ĐẠI HỌC CÔNG NGHỆ

PHẠM LÊ CƯƠNG

VE MOT MO IHNIICSDL QUAN IIE VỚI THONG

TIN KHONG CHAC CHẮN DẠNG NGÔN NGỠ

GẦN TỰ NHIÊN

LUẬN VĂN THẠC SĨ CONG NGHE THONG TIN

HA NOI - 2008

Trang 2

DAT HOC QUOC GTA HA NOT

DALIQC CONG NGHE

PHAM LE CUONG

VẺ MỘT MÔ HÌNI CSDL QUAN IIE VOI THONG

TIN KHÔNG CHẮC CHẮN DẠNG NGÔN NGỮ

GAN TU NHIÊN

LUẬN VĂN THẠC SĨ CONG NGHE THONG TIN

Người hướng dẫn khoa học: PGS,TSKH NGUYÊN CÁT HO

HA NOI - 2008

Trang 3

1.1.4.1.3 Topo va tinh tra mat trong ĐSGT ieeeeieesoeo, T7

2.1 Giới thiệu dang ví về cơ sở đữ liêu với ói thông tin ngôn ngữ dS

2.3 Phụ thuộc hàm dựa trên độ tương tự trong C8DL ngôn ngữ 4Ó

CHUONG 3- CAI DAT MOT SO TITU TUC CUA CSDL NGON NGt 58

3.2 Lập hàm tính độ đo tính mờ âm is sen seerseeeerseeeeo S8 3.3 Lập hàm dịnh lượng ngữ nghĩa Q8P tose OL 3.4 Lập hàm ánh xa giá trị cáo giá trị biển ngôn ngữ sang miễn giá trị thực 62

3.6 Sửa đổi các thao táo truyền thống trên cơ ad dt Kéu insert, update, delete, seleeL

Trang 5

DANH MUC CAC KY HIEU CAC CHU VIET TAT

CSDL: Cơ sở đữ liệu

ĐSGT: Đại số gia Lữ

Trang 6

DANH MỤC CÁC HÌNH VẼ

Hình l: Tập mờ và tap 16

Hình 2: Mô tà cường độ đồng điện

Trang 7

MO DAU

Trong những năm gần đây, CSDI mờ đã được nhiều tác giá trong và ngoài nước quan tàm nghiên cứu và dã có những kết quả dáng kế [1,6,14,15] Co nhiều cách: tiếp cận khác nhan như cách tiếp cận theo lý thuyết tập mở [2,14], theo lý thuyết khả năng do Prade và Testemale năm 1983, tương tự [11] .Tất cả các cách liếp cận trên nhằm mục đích nắm bắt và xứ lý một cách thỏa đáng trên một quan điểm ảo

đó các thông tin không chính xác (nexzcf), không chắc chắn (wmcerfaimy) hay

ahimg théng tin khong day di Zncomplete) Do sự da dạng của những loại thông tin nay nên chứng ta gặp rất khỏ khăn trong biểu thị ngữ nghĩa và thao tác với ching Trong những năm gan day đại số gia tử được nhiều tác giả nghiên cứu trong 13,4,5,12,13| và đã có những ứng dụng đáng chú ý, đặc biệt trong lập luận xấp xĩ và trong một số bài toán điều khiển Vi vậy, mặc dù đã có nhiều kết quả nghiên cửu về CSDL mờ, theo chiêu hướng đó cách tiếp cận nghiên cửu CSDL mờ với ngữ nghĩa đựa trên đại số gia tử vẫn có thế được xem là một vẫn đề nghiên cứu mới

Khảo với CSDL mờ trong đó giá trị ngôn ngữ được xem như lá nhãn của tập

mi, theo nách tiễn cân của ĐSGT, các giá trị như vậy được xem chính là các phẩn

tử của đại số gia tử, vỉ theo cách biểu thí ngữ nghĩa trong ĐSGT, chúng có thể được xem chính là các giá trị ngồn ngữ

Con người thưởng phải dối mặt với thông tin không chắc chan va do dé co mét shu câu tự nhiên đối với việc xây đụng CSDL mờ Việc quản lý và thao tác thông tia mờ biểu thị bằng lý thuyết tập mờ tương CSDI, dã và đang được quan lâm nghiên cứu mạnh mê, Tuy nhiễn người ta vẫn gặp một số khó khăn trong biểu diễn

và quản lý thông tin ma

Trang 8

tác dữ liệu dễ bảo dâm tính trọn vẹn đữ liệu dỗi với mô hình CSDL mới này và

chứng tỏ sự thuận tiện và đơn gián của loại mô hình này.

Trang 9

kiện rõ rằng — một phân tử hoặc thuộc hoặc không thuộc về tập hợp Ngược hại, lý

thuyết tập mở cho phép đánh giá quan hệ thành viên giữa một phần tử và một tập hợp; quan hé nay duge mé ta bang mét ham thuée (membership function)

¡ —11J

Các tập mờ được coi lả một mmở rộng của lý thuyết tập hợp kinh điền là vị, với một xuiển nhất định, một hàm thuộc có thể giữ vai trò của một hàm đặc Irung ánh xạ mỗi phân tử tới một giá trị 0 hoặc 1 như trong khải niệm kinh diễn

Định nghĩa 1.1

'Một tập hợp mờ trên một tập hợp kinh điển X được định nghĩa như sau:

A= {le, walx)) |x € X}

‘Ham thudc trạ(x) lượng hóa mức độ mâ các phan tit x thuée vé tp ca séX Néu

bam cho két qua 0 déi với một phần tử thị phần tử đỏ không có trong, tập đã cho, kết quả 1 mô tả một thành viên toàn phân của tập hợp Các giá trị trong khoảng mở từ 0

đến 1 đặc trưng cho các thành viên mờ.

Trang 10

Hình 1: Tập mờ và tập rõ Hêm thuộc g„(x) thỏa mãn các diều kiện sau

8UP„cx[~a(£)] = 1

1.1.2 Lôgic ma

Légie ma (tigng Anh: Fuzzy logic) duoc phát triển từ ly thuyết tập mờ để thực hiện

lập luận một cách xâp xĩ thay vị lập luận chính xác theo ligie vi từ kinh điển Lögie

Để mình họa sự khác biệt, xét tình huống sau: Bảo đang đứng trong một ngồi nhá

có hai phòng thông nhau: phòng bếp và phỏng ăn Trong nhiều trường hợp, trang thái của Bảo trong tập hợp gồm những thứ "ở trong bếp" hoàn toàn đơn giản: hoặc

là anh ta "trong bếp" hoặc "không ở trong bếp" Nhung nếu Lão đứng tại cửa nổi giữa bai phỏng thì sao? Anh ta có thể được soi là "có phần ở trang bếp", Việc định lượng trạng thái "một phần" này cho ra rnột qrem hệ thuộc đốt với mội lập mờ

Ching han, néu Bão chỉ thò một ngôn chân gái vào phỏng ãn, ta có thể nói rằng Bão

ð "trong bếp" đến 99% và ở trong phòng ăn 1% Một khi anh ta còn đứng ỡ cửa thi

Trang 11

không có một biên cô nào (ví dụ một đồng xu dược tung lên) quyết dịnh rằng Bảo hoàn toản "ở trong bếp" hay hoán toàn “không ở trong bếp" Các tập mờ được đặt

cu sở trên các định nghĩa mmờ về các lập hợp chứ không phải đựa trên sự ngẫu nhiền

Lôgic mờ cho phép đẻ thuộc có giá trị trong khoảng đóng ([0,1]), và ở hình thức tigôn từ, các khái niệm không chính xác nữ “hơi hơi", "gân như", "khá là" và "rất"

Cụ thể, nó cho phép quan hệ thảnh viên không đây đủ giữa thành viên và tập hợp

Tính chất này có liên quan đến tập mờ và lý thuyết xáo suất Lêgie mờ đã được đưa

ra lần đầu vào năm 1965 bởi G8 Tuotfi Zadch tại Đại học California, Berkeley

1.1.3 Hạn chế của việc quân lý và thao tác thông tìn mờ biểu thị bằng lý thuyết tập mờ trong CSDL

Chúng †a có thể nhận thấy việc sứ dụng tập mở và mồ hình quan hệ đề xử lý thông,

tin mờ có ruột số hạn chế nhất định

(Ũ Với các thuộc tính mã giá trị là dữ liệu kinh điển và đữ liêu mờ, (gọi là các thuộc tính mở), kiểu đỡ liêu không dỏng nhất, do đó, việc xử ]ý đữ liêu gặp nhiều khó

khan Ching hạn, do đữ liện ngôn ngữ được biếu điển dưới dang cdc tap mờ, nghĩa

là được thể tiện bởi các hàm thuộc của L, miễn thuộc tính cơ sở, vào khoảng đơn vị [0,1], định nghĩa các quan hệ dối sánh trên các dừ liệu này không phải là một vấn dẻ giản đơn và cé nhiều cách giải quyết khác nhau Tắt nhiên, sự thỏa mãn các mỗi

quan hệ trong trường hợp này được định nghĩa dụa trên logi đo trị thay vi logic hai giá trị Chúng ta hãy xem xét một thí dụ, thuộc tình AGE (Tuổi) và giá thiết rằng di liệu rather young, được thể hiện bằng một tập mờ øs;„„ với hàm thuộc sessing Với trường hợp dữ liêu 34 và rather young, dẳng thức 34 — Rather young có thể dược didn giải là thỏa mãn múc độ chân lý /0g,„„(34) Song có một câu hồi khó hơn là

lãm sao la có thể điển giải điêu kiện thôa mãn loại bat ding thite Rather young <

347 Có một cách là diễn giải bắt đẳng thức này bằng cách tỉnh tập mức Á đz»zumg.2

của lập mờ #g„„„„ và kiểm tra bắt đẳng thức 3g, „„„ ¿< 34, trong đó bất đẳng thức

o6 nghia ring (Vu = ryangd(u < 34) Nếu bắt đẳng thức nảy được thỏa mân,

Trang 12

chúng ta nói răng mức độ thỏa mãn của bắt đắng thức này là giá trị chân lý của 2

Nhu vay, tay theo cách điễn giải của người sử đụng, ta cân thiết kế các thủ tục đẻ

quan lý dữ liệu có thuộc tính mờ

- _ Hình 2: Mö tả cường độ đòng điện co (0 Việc diễn giải về ngữ nghĩa của dử liệu ngôn ngữ là một vẫn để cơ bản, tuy

nhiên, nó hoàn toàn phụ thuộc vào cách biểu thị quá chủ quan về ngữ nghĩa của ngôn ngữ biểu điển bằng tập mờ Điều này có nghĩa là mọi người thường tự thiết kế các tập mờ cho mỗi ứng dụng, trừ khi chọn lựa cáo giá trị dựa trên ngữ nghĩa trong,

thực tế Không có ràng buộc chính thức nao cho thiết kế kiến này Ví dụ như, để

diễn giải nghĩa của bảy thuật ngit terms very very small, very small, small, medium, large, very large, very very large nhằm mô tả các giả trị của cường độ dòng diện

trong khoảng [0, 10] am-pe, người ta có thế đựng bây tam giác cân như hình 2 Đó

là các tam giác bằng nhau trừ tr giác đầu và coỗi, lại tam giáo nay bang mot na các tam giác hoản chính Vấn để đường như rất kỹ thuật và chủ quan, va một câu thôi phát sinh là vì sao cáo tam giác bằng nhau và các cạnh đáy của chúng năm tring lên nhau đúng một nửa Điều nảy có vẻ không phủ hợp khi xern xót ngữ nghĩa tự nhiên cửa các thuật ngữ này

Trang 13

ngữ và giả thiết tập các giá trị ngôn ngữ dược nhúng vào một dại số gia tử Ngữ nghữa của các quan hệ hai ngôi trên mỗi miễn giá trị thuộc tính, bao gồm các giá trị

kinh điển và các giá trị ngôn ngữ, sẽ được nghién cửu và trên cơ sở đó các phép

toán dại số quan hệ sẽ được dịnh nghĩa phủ hợp với ngữ nghìa mới Việc tiếp cận dựa trên đại số gia tử chỉ ra răng mô hình CSDL với thông tin mở trở niên rõ ràng, nhất quản trong thao tác và thao tác đữ liệu đơn giân hơn.

Trang 14

1 1.4.1 Dại số gia tử

Để xây dung cách tiếp cận đại số gia tũ đối với CSDT, tuờ, trong phản nảy xin trình bảy tổng quan về một số nét cơ bản của đại số gia tử vả khá năng biểu thị tiefr nghĩa đựa vào cầu trúc của đại số gia tử

Chúng ta xét miễn ngôn ngữ của biến chân lý TRUTH gồm các từ sau Dom(TRUTID= (true, false, very true, very false, more-or-less true, more-or-less

false, possibly true, possibly false, approximately (rue, approximately false, little

true, little faise, very possibly true, very possibly faise }, trong do true, false là các từ nguyên thuy, cdc tir nhan (mordifier hay intensifier) very, more-or-less, possibly, approximately true, little gọi là các gia tử (hedges) Khi đó miễn ngôn ngữ 'T=øm(TRUTLD có thể biểu thị như một đại số 4/7 = (X, C, 1, <), trong đó C là tập các từ nguyên thuỷ được xem là các phân tử sinh H là tập các gia tử được xem như là các phép toán một ngôi, quan hệ < trên các tử (các khái niệm mờ) là quan hệ thử tự được "căm sinh" tử ngữ nghĩa tự nhiên Ví dụ dựa trên ngữ nghĩa, các quan

hệ thứ tự sau là dúng: false <true, more true<very true nhung very false< more false, possibly (rue<irue nhung false <poswibly false Tap X được sinh ra từ Ở bối các phép tinh trong H Khir vậy mỗi phần từ của X sẽ có đạng biểu điển x=luh,Ú

1 ne, c&C Tập tất cả các phân tử được sinh ra từ một phan tử x duoc ky higu 1a

H@) Nếu C có đúng hai từ nguyên thuệ mở, thì một được gợi là phần từ sinh dương ký liệu là c', một gọi là phần tử sinh âm ký hiệu là e vả ta có ở < e' Trong,

ví dụ trên 7rwe là dương con False 1 am

Nếu các tập các phép toán (hay gia tử) #f”, ÖƑ và tập Ở các phản tử sinh là tuyến tính thì tập nền X = 17(G) cũng tuyến tính Tuy nhiên tập 17(G) thiếu các phân

tử giới hạn, hay nói khác đi nó không đéng đối vái phép “lây giới hạn” Chính vì thế, đại số gia từ đây đủ AX = <X, C,H, 9, è, €> được xây dựng bằng cách bổ

sung vào tập X các phần tử giới hạn nhằm làm đẩy đủ miễn giả trị của nó

Trang 15

1 1.4.1.1 Những phát biểu cơ hãn

Cho X là một tập sắp thứ tự một phần (partially ordered seQ vá U, V là hai tập cơn của X Ta ký higu U < ƒ (phát biểu tương ứng cho Ù < J2, nếu (Vx cJ(Vy c

ME <y} (ương ứng, ƒx < y})

Xét đại số gảa tứ đây đủ 1X = « X, G, LH, Ø, 6,

có biểu điển đưới đạng x— bự hạn với ue XÃ, thì tá số quy ước sử đụng ký pháp SAU: Xp = Ap Art, 1S < n, với quy ước khi i= 1 thi Ap = 7, phép toán đồng nhất

trên X

Giá sử x c X vả nêu né

Định nghia 1.1: DSGT AX ~ <.X, G, LH, o, g, <> duge goi là tự đơ (hay sinh

tự đe) nếu với mọi h c TH mọi x c LH(G) tá đều có hx z x Về trực quan điều này

có nghĩa, mỗi gia tử (phép toán) khi tác dông vao mét phan tit bat ky trong LH(G) đều được sinh (một cách tự do) ra phân tử mới

Những kết quả sau đây sẽ được tham chiếu đến trong các chứng minh sau nảy Định lý 1.1: Xét DSGŒT 4X = (X, G, LI1, œ, ú, <) là đại số gia tử mở rộng đây

di Vai moi y c LHQ),x c Xa có

ii) de <Q) <x 6

Mệnh đề L1: Xét ĐSGT mở rộng đây dủ AX — (X, G, LH, s, $ <) Voi moth

€ LH, moi k ¢ LH‘, néu ox, ox © lim(x) (hay ox, ox # LH(G)) thì

lx <kxkéotheo nhx kx, bx2kxkéotheo fle=okx &

Bổ đề L1: Với moi x © AiG),

om = supremum{P"o'x: 0 © UOS, o'x >x, 2-12, } - oF"0'x— ao'x va

dx = infirman{V"orx: 0 ¢ UOS, ox Sx, n—1, 3, } = 6 ho 7x = fox,

lưu ý rằng la positive déi vdi cA hai toan ti don vi trong UOS va day {V"o'x: o” € UOS, d'x 2x, n= 1,2, .} dơn diệu tăng còn dấy { “2%: 0” ¢ UOS, ox x, n= 1,

3, .} đơn điệu giảm É

1.1.4.1.2 Các khải niệm vả tính tuyến tính

Định nghĩa 1.2 Dại số gia tử (mở rộng) đây đủ 1X = (X, G11, Ø, 6, <) được

gọi là tuyến Lính nếu tập các phần từ sinh G {6, e, E, c°, 1} và các dán các gia Lử

TH = {Ly , b„}và H = {ñụ, lạ} là sắp thử tụ tuyển tính, ở đây Öƒ = 1Í VAT, và

Trang 16

giả sử ñ;

Lathes

DSGT mé réng day đủ với 1ƒ và I7 là các tập sắp mét phan (poset) da nghiên cứu Trong trường hợp chủng | tuyén tinh thi LH” =H" va LH =H Với giá thiết tây ta có kết quá quan trọng và được phát biểu trong bổ đề sau:

ñ„ Ký hiệu hạ =7 còn [ƒ mà được hiểu lac €

Ba dé 1.2 ChoDSGT AX (H(G), GH <) Néu G va A théa main các giả tiết

như trong Dinh nghia 1.2 thi H(G) la tap sap thi ty tuyén tinh &

Đổi với trường hợp IDDSGT đây đủ và tuyến tỉnh, ta cũng có định lý sau về tính

Trước hết giả sử chỉ một Irong hai phan ir x va dng hạn là y, thuộc Lòm(X)

và chứng có biểu diễn sau: x = ñụ È;, y = oy' với „` = ky kạut, Vì H(G) sắp toàn phản nên z và y° phải sánh được với nhau và giả định x < #' (đối với trường thợp ngược lại sẽ được chứng mình tương tự bằng đối ngẫu) Khi đó, nếu w và a” được sinh từ hai từ nguyên thủy khác nhau thì ta có x € H(e) va ye Hc") Suy ra

=0 > ức > ac Dx,

Nếu cả hai te H(C), c 6 {C, C”} và pid sth waa, x= A, hae va y= hy

- ki, với bị = kị, Cũng như trên ta giá định x < „” và do đó kéo theo j;

tuận lương tự như lrên, la thu dược y— øV) >: đạm > ghe > Chiu) Vậy y x Một trong các khả năng khác có thể xây ra là x = A, Ay’ Gid thiét x <y' 38 dẫn đến bất đẳng thức hy' <+° Khi đó, oy’ 29" > hy) > gy Vix e Why") và viø c {¥, o}, ti cac bat ding thie cudi ta suy 1a y = oy” va x ludn sánh dược với nhau

Một khả năng còn lại là y` = k„ È,x Cũng như trên, giả thiết x < y` sẽ dẫn đến

‘at dang thức k„ >-x va do đó #Œc,+) > x Do HŒcx) > HG”), nén ta c6 HQ") > x Suy ra, y— oy >

Tây giờ ta giả thiết cả hai x vay clmg thudc Lim(X) va ching co dang biéu diễn xox’, y—o'V va gid sitx! — hy he vay’ — hy ki’, Vi ACG) sip loan phan nén x’ vay” phdi sanh được với nhau và, chẳng han, x’ < y’, Do dé, tương tự như

Trang 17

trên, nêu œ và z được sinh ra từ hai từ nguyên thủy khác nhau thì ta phải có x” 6

He) con yc H(c'), Suy ra, y= Ø7) > ỐC = Ớc >óy”=x

Truong hop x’ = hy diy’ Gia thiét x' < y' sẽ đẫn đến bất đẳng thức ñyy <+`

Khi dé, oy’ > Hy) =p’ Do Hx’) C H(A) va 0, 0’ 6 {6, of, ta cd thé

shan thay y = o'p’ vax = ox’ phai sanh duoc với nhau

Trung hop con lai lay’ = ky ky’ Gid thiét x’ <y’ 38 dain dén bat đẳng thức

lux’ > x" va do dé HUkjx’) > x", Do Ak:x) = HG”) và H(G) sip toan phần nên ta

két luan p = 0’y’ vax = oy 14 sénh được

Thư vậy định lý đã được hoàn toàn chứng minh €

1.1.4.1.3 Tô-p và tính trủ mat trong DSGT

Ta biết rằng X = 11(G) — Lim(X), nghĩa là Løm(©) là tập các điểm giới hạn của H(G\ Ta có thể cô câm nhận trực quan thay ring H(G) la tap trù mật trong X theo nghia sau

Dinh nghia 1.3 Cho Xi tap sip thứ tự mội phân và Ù, Ứ là các tập con của X,

Wj{x<y SG s Lj|x

< yl} Voix < y, ta ky higu <xy> = {2 c Xa <2 < y} va cũng gọi là một

khoảng được xác dinh bởi x và y, €

UP, Tập son được gọi là tri mat trong F nêu (Vxy'

chất khá đặc biệt và tính trù mật của 77G) có đặc trang mang hon Dinh nghia 13

rât nhiều Tỉnh chất này là cơ sở để chứng minh mét s6 quả nghiên cứu tiếp theo

‘Trude hết ta hãy khảo sát tỉnh topo của họ # = {0ð, w c #(G)} Chúng ta biết ving mét ha Q bat kỳ các tập cơn của X được gọi là ruột cơ sở 2pø trên X tiêu ching có các tính chất sau:

ø1) VÕ c O;

ø3)VU,e,1=1,.„k [Ÿ,c9

Mỗi cơ sở topo sẽ sinh ra một tope trên X; tức là họ tất cả các tập cơn mở của X

và X trở thành không gian topo Trong không gian topo ta có khái riệm điểm trong,

như sau Xét một tập can V C X: Diễm ø e Ƒ được gọi là điểm trong của tập Ứ nếu

(SỬ c @){w c ÚC V†, nghĩa là có tổn tại một tập con mỡ: của Ƒ chứa ø

Trang 18

Ta cỏ khải niệm mới vẻ dộ trủ mật như sau gọi là độ đậm đặc

Định nghĩa 1.4 Cho một không gian tapo X- Tập ý c X, được gọi là đậm đặc trong XÃ, nếu với mọi khoảng <x,y> của X đều chứa íL nhất một điểm trong s, LÌ QGU s G{UC&x <U <y} &

Rõ ràng là nêu l7 là đâm đặc trong X thi F là tric mat trong X

'Ta có bổ để sau

Bé dé 1.3 Cho DSGT AX = (X GH, o ÿ, <), họ 8' = 9 Là {Œ} là một cơ sở topo trên X-

Chứng mảnh: Xét hai tập Ha và FT{v) bất kỳ Khi đó chỉ có hai khả năng, Nếu

u va v là độc lập, tÌ v ơ//00 và nơ11(v), thì JÚ) ¬ 11(v) = Ở Nếu ngược lại, chang han, « e #0) thì Híu) c HỤy) Từ dó dễ dàng suy ra họ 9° thỏa mãn diễu kiện o2) trên &

Nhằm thiết lập mặt tính chất quan trọng dưới đây để sử dụng trong nghiên cứu

việc định lương hóa ĐSGT ta cân bổ d SALL

Bỗ để 1.4 Cho ĐSGT (mở rộng) đầy chi, tuydn tinh va tr do AX =(X% GH, G

, <), xót phần tữx - , hia © A(G) va phép loan o © {¢, ø} Khí đó I thép

(1) Nếu đủ¿# < øx thí khoảng <©Øbr,ax> chứa ít nhất một diễm trong Hơn nữa,

tổn tại m Rvp hạ hy, sao cho Jịxy, < hy, và hậu fa, < Ale)

Luu y rang trong ¢4 hai trong hop trén ta déu cé H(z) ~ H(x) = ©

Chứng mình: Trước hết ta luôn nhớ rằng, theo BS dé 1.2, Hp 77(G) là tuyển tính Dầu tiên ta xét trường hop fiyu < ox, x =h, htt Theo Bổ để 1.1, ta có ghju

Môn bại <colu hại Khi đó tần tại ¡sao choc Poh dkm 2x hư,

trong đỏ œ, B là các xâu gia tử tiên tố tương ứng của z và x Lưu ý rằng, theo Bồ đề

Ll taco dhe = dfx = dc ‘Tix bat đẳng thức cuối cùng ta suyra kx;, < Èx„„ VÌ

trong trường hợp ngược lại ta thu được bắt đẳng thức oi hạn < oh; «

#h;u mâu thuẫn với giả thiết đh„w < or Do dé, (Ea) < H(b#,2) và điều

dến đi = đá, ¡ < HC, 2) < phe, ; Sox, vix c Mthy, 1), va HG) HQ) = Ø với a= kets

Trang 19

Đổi với trường hợp dt > ox, ta ching mình tương tự bằng đổi ngẫu É,

Định lý 14 Cho AX = (X, G, H, ơ, ý, <) là đại số gia tử đây đã, tuyến tính và (sinh) #ự do Khi dó lập H(G) là đậm đặc trong X và hơn nữa tà có

Wa,yeX, x<y > Que IG)ix « HẠ) <w}

Nhớ rằng ta luôn luôn 06 H(w) C A(G)

Chứng mình: Như ta biết X — (G) cà Lim(X) và H(G) 7s Lim(X) — Ø và do

đó ta sẽ chứng rninh định lý theo từng trưởng hợp

(1) Trường hạp x, y © L(G), x = hy hye va

mạ - &iế", "Ta biết rằng, vì 1X

được bất đẳng thức mong muốn là y> Hữm) > x và HŒH) C HỌt)

Bây giờ la giả sử nọ d và hưu z kạm” VÌ x < y tá suy ma hye < ky’ va do vay ta

có JNhịm) < H(m”) Cũng như trên ta chọn h e IT sao cho hx > x và khi đó, vì HỢP) >x, lv c H(hm), vc Hdu) và HỢb) < (hj), ta co điều mong, muốn

THỨn) > x Nêu việc sinh của x và y có dang x = h, Ayy thix

Khi đỏ cũng tổn tại # c H sao cho hy > x và do đỏ ta cũng có y > H(hx) > x Mot cach hoan loan tuong lz, uéuy š„ &¿x thì x < y kéo theo k,x> x Ta chon ke 7

sao cho y> hy 6 #(x)>x Do đó y> HỢp) > x và Hữn) C HỘ)

— oy" & Lim(X), wong doa © {gh a}, — Ayo

(2) Truong hop x © ACG) va)

hyw vay’ =k, ky’, DOiv6i ca hai kha ning uc" va = c" holo u= a va hye ky’, digu kin x < y din din HG) < HQ”) Ta cũng chọn # c #f sao cho Äx > x và

do JỢm) < H(z) ta suy ra y = oy" 2 gy’ > ox > H(hx) > x, nghia là ta có bất đẳng, thức mong muốn Nếu x = „ hạ” thí x © Lay’) vax <y cung với áp" < (uy)

< ay’ kéo theo y — ay’, Vay véi lx > xta oting ob y~ ay’ > HỮM) >x

Néuy’ = ky kx thix <y kéo theo ka > xva y= oy’ = pepe 2x

Néu oy’ = flax thi p = dix > x va khi đó &; không phải là atom (gia tử nhỏ nhất trong đàn ⁄ 7) Vậy có tên tại &' sao cho 77x) > H'x) > x và điều này dẫn đến y

oy > ux> HC X)> x Ngoài Ta lá cũng cô Hín) c HỆ), với k's

Néu oy’ > dfx thi tan tai x sao cho x « flex = đz< 1Œ) < oy' và 11) 9’) -Ø

(3) Trueng hop x = ox” LimiX) vay c H(G), trong đó ø c {4 o} vax = hy

hu vay’ =k, ke’ duoc chimg minh twong ty nhu trong (2)

Trang 20

(4) Trường hợp x = øx° € Lin(X) va y = o'y’ = Lim(X), trong d6.x° = hy Bs

vay? — km kịu” Tập luận như trong (2), cả hai khả năng đổi với œ và ¡” đều dẫn

đến lụu + kạu”, và từ điều kiện x < y ta suy ra yu < kyu’

Tiếu oft = đạn, thì có bai khả năng Thứ nhất là x = 2x = øhz và khi đó x =

Hey < ö'y" Tên tai w= 5, sa0 cho x = ox" = kyu = đai SH) = ÚC Xã) <0

Trong trudng hgp nay ta co Hig) 0 Hy’) ~ © Gid att ohm + eu Khi dé diéu

kiên x < y kéo theo Ape < ky va do vay ox” < ohju < feu < o'y" Neu hy, ky khong

củng thuộc tập gia tử JŸ thì h„w < w < kụ: và nêu các gia tử này dễu là nhỏ nhất thì chy — gkju Ta gap mau thuận Vậy mội trong hai gia tử này không là nhỏ rất, chẳng hạn đỏ là h, Khi đó có #° sao cho ñ„ < ñ' và do dò ta có H(hin) < HỮPh) < H(,,) Nếu bị, kị cùng thuộc tập gia tử #” thí chủng không thể lá hai gia bử kể nhau, đo đỏ cũng tổn tại #' sao cho bu < #' < kạu và điêu này cũng dẫn đến H(i) < H(h'u) <A (eu) Te diy ta suy ra x = ox" < ohyu < H(h'u) < dea < oy’

y nghta Ip ta c cde bat ding (hie mong mudn va cling có didu kiện H(A’%) >

ay Viyo’ a Ldy h' sao cho yˆ< hy? là sẽ côx ox’ <y"<H hy) < ayy

va H(h'y') CHG)

Vì đối với trường hop y’= ñụ b,x" sẽ được chúng mình tương tự nên định lý hoàn

toan duge chimg minh &

= ox’

1.1.4.1.4 Độ đo tính mờ

Cho dai sé gia tir AY — &, C,H, <), với X là tấp nền, Ở —{c', e Hương đỏ c

và ơ tương ứng là phần tử sinh đương và âm 77 =f7 I voi LT = fy, Baa, By VA

= Myris vey Pprghy WP R >hy và lạirs SỈp „

Để mô phỏng tỉnh mờ của các khái niệm mờ trước hết ta hãy dua ra một số tiêu

chuẩn có tính đặc trưng trực quan thiết yêu dễ thừa nhận vẻ tỉnh mnờ của ngôn ngữ (1) Tỉnh mờ của một khải niệm rỡ (crisp) phái bằng không;

(2) Một khái niệm mờ z° tu được nhờ đặc tả cá thế hơn sẽ có tỉnh mờ ít hơn

khái niệm mờ gốc z Như vậy tính mờ của z' phụ thuộc vào tính mờ của z,

Trang 21

(3) Néu hai khải niệm mờ rvà z' có ngữ nghĩa không phụ thuộc vào nhau, nehia la viéc x4c dinh ngữ nghĩa của từ này không ảnh hưởng đến việc xác định net

ugbia oda từ kia, thì tính mờ của chúng dộc lập nhau Chẳng hạn tính mở của “App true” va “Little true” là độc lập nhau

(Ð Nếu các từ r' và r"' được sinh từ từ r khi đùng các gia tử tác động vào, thì tinh mé của £ và 7” cũng góp phân tạo sinh ra tỉnh mờ của từ 7;

'Trở lại ĐSGT ,1X* Nó được xem là cấu trúc của mién gia trị biến ngôn ngữ #⁄ Hãy xét họ {A(x}: x c X*} Họ này có các tính chất sau

1)Vxe€ Lion), Hx) — oh,

3) vxc X*, vÀ, kc 11, Hw) c 110) và Men He) = Ø với hà k,

3) Yxe *, 70) = (J „H0n)

Về mặt ngữ nghĩa ta thấy M(x) là tập tắt cá các khái niệm được sinh ra tir x nhờ

việc thay đổi ngít nghĩa của x bằng các gia tủ ngân ngữ Các khái niệm như vậy đều

mang ngữ nghĩa “gốc” của x và do dó chúng góp phân tạo ra tính mở của x Chẳng, han lap H{App truế) — {2 trưố : đ © AY} tong dé A là tập lật cả các xâu trên bang

thể hiện rằng lính xnờ của khái niệm x chính là được Iạo ra lừ các tính znờ của các

khai niệm thứ cấp được sinh ra nhờ việc biểu chướng ngữ nghĩa của tất cã các gia

tử

Với những tính chất như vậy ta có thế xem tập 77(x) mỏ phỏng tính mờ của khát

riệm x De vay dé xác định độ do tính mờ của khái miệm x ta 66 thé dum vào việc

Trang 22

22

các dinh kich thuée dinh luong cia tap H(x), chẳng bạn như nó là dường kính của tập HQ), được ký biệu lá dix)

Để đính lượng la xét một ánh xạ bão toàn thứ tự ƒ: X* —> [a,b], rong đó đoạn

Ta,b† là miễn giả trị của biển nên (base variable) của biên ngôn ngữ #&c Vi ƒ báo toàn thứ tự và nhận giá trị trong [a,b] nên ta có thể xem ƒ là ảnh xạ ngữ nghĩa định lượng, của #ˆ Theo truyền thông, để chuẩn hỏa, ta luôn luôn giả thiết rằng hàm £ nhận giả

trị trong đoạn [0.1] Một cách chính xác ta có định nghĩa sau:

Định nghĩa 1.6 Một ảnh xạ ý được gọi là ảnh xạ ngữ nghầa định lượng của 8

tiêu nó thỏa mãn các điều kiện sau:

Q1) £ lá song ảnh,

Q2) f bao toan thứ tự trên X*, tức là x <y —> Ñx)< Ấy), và f0 0 f7) 1,

Q3) Vx © X*, — Inlmum /G)) và flor) ~ supremum (HQ)

Tinh chất Q3) có thế xem 1a tinh chat liền tục và cũng là một đòi hỏi tự nhiên

Với ánh xạ ngũ nghĩa ý, kích cỡ của tập 11x), hay độ đo tính mờ của x, có thế định lượng bằng đường kinh của tập ÑH(©)) và kí hiệu là Ñn(x) Mục đích của chang ta la tim phương pháp xây dụng ánh xạ ngữ nghĩa định lượng trên cơ sở độ

do tinh mờ Mặt kháo việc tiên đẻ hóa đô đo tính mờ đễ hơn và true quan hon Vì vậy ta đưa ra hệ tiên để hóa của độ đo tính mở trong định nghĩa saix

Dịnh nghĩa 1.6 ( Dộ đo tính mở )

Gọi 774; là tập các phần tử sinh ra từ x bởi oác gia tử Vi vậy, kích thước của

TH) có thể biểu điển tỉnh mờ của x Do đó la có thể định nghĩa độ đo tính tờ cia x,

+ý hiệu /ñmGÒ là đường kính của tập Z7) ={f(u}:ueii@6)}, trong đó £ X->[0,1]

Trang 23

(1) fin(o") — w > O vat fin(o') — 7= w>0

(2) Voie © foe") thi S fae) = fale)

ra

(3) Véi Vayex, vher, HỮU) PHUN) — HP) vớ eco ty,

fmx) ƒmịy) — fife)

nghĩa là tỉ số này không phụ thuộc vào x và y, được kí hiệu là //(/) gọi là độ đo tính

md (fuzziness measure ) của gia tử

Mật số tính chất của độ đo tinh mi far

Trang 24

24

GQ) #mđm) = nñmG\), với VseX

(2) #06) — #uŒ), trong đồ 6 € {e—, e}

@ S jinthyx) — fin(2), với VxCX

rt

(4) Suthy=a va ¥ u)= Bye, P>Ovaatp=1

1.1.4.1.5 Hảm định lượng ngữ nghĩa của biến ngôn ngữ

Dinh nghia 1.7 [12] (Eden Sign)

Hàm 8n: X —>{-1, 0, 1} lồ một ánh xe được định nghĩa một cách độ qui nhu sau, với Vh, hlellL

(1) Signéc ) = -1 va Sign(he ) = |Sign(e )néu he «co

Sign(he") = -Sign(e") néu hie > o7 Sign(c') =+1 va Sign(he") = +Sign(c') néu he" >

Sign(he") = -Sign(e’) néu he" <o*

(2) Sign(h hx) - -Sign(hx) néu h' ta negative đôi với h và hhhx + hx

(3) Signth hx) +S8ign(hx) udu h! la positive dai voi k va hihx # bx

(4) 8g(hfx) Quốu hữm hx

Diub nghia 1.8 [12] (Ham định lượng ngữ ngiữa 1) Giá sử cho trước độ do tính tờ

của các gia tử zz), và các giá trị độ đo tính mờ của các phần tử sinh fre), fin(c')

và w là phần tử trưng hỏa Hàm đình lượng ngữ nghĩa (Qsemdilatively semaniio

function) v của X được xây đựng như sau với x=h„„

(1) v() =w-d,#m(c) và v(c") = we, fine")

Trang 25

(v1) Buse l: Với 4j€+) = 1, tức là x e (€, £'}, ta chia đoạn [0,1] thành hai doạn, ký hiệu là z(£ ) và (c'}, theo thử tự từ trái sang, phải, tức là s{£) ‹< s{e') và

dé dai ca doan 4c), HAC) ~ fine), va Kefe')) ~ fin(e!) Khi dó giá trị v(c) là didn chia doan 4{¢7) thamh bai doan con theo t7 16 #: a vi Sign(e")-1 Con ufo)

la diém chia đoạn +4”) thành hai đoạn theo tỷ lệ œ: 8, vi Sign(c) +1 Cáo đoạn

cơn thu được tương ứng với tất cá cdc tir ca dé su dp(x) = | tạo thành một phân

hoạch của đoạn [0,1] với tính chất Ä(s{x)) = #m(x)

(v3) Bước 2: Di với đoạn s{e ), vi Siga(e ) = -1, ta phần hoạch đoạn đỏ thành qtp đoạn sao cho 4AfuZ ) > 2bế), với =4 € ï <7 Sp, và IQuế)) = #m(hể ) Lưu ý

ving x Vữic )= (Wm(C )và điểm chia Wc) la diém nit chung efia bai đoạn

Abie) va Hiể), Ngược lại, đối với doan s{c"),vi Sign(c") = +1, ta phân hoạch doan 4c") thanh q!p doan sao cho hc") < dhe"), với -g < £ <7 < p, và the") =

firth’) Lua y rang 3)”, finthe )= ffadc')va diém chia v(c') 4 diém nut chung

của hai đoạn 4(#_,e”) và {b,¡ể), Giá trị vfnc°) được chọn là điểm chia doan Chic}

theo tỷ lệ a: A néu Sign(/¿°) = LÍ và theo tỷ lệ 8: a nếu Sign(h¿¿F) = ~L

'Ta cũng thấy các đoạn con thu được tương ứng với tit cá các từ +”! có độ sâu

Trang 26

dp(@SÐ ~ 2 lạa thành một phân hoạch của đoạn [0,1] với tính chất 143/25) — font?)

va vl") la did trong của mỗi đoạn

(v3) Buớc lấp: Giả sử quy nạp rằng các đoạn thẳng con của tất cả các từ xÈ ? có

độ sàu &-1, tập các đoạn con thu được tương ứng với tắt cả các từ có dộ sâu dp(x!")

= k-1 tao thanh mét phan hoach cua doan [0,1] voi tinh chit K(x") = fant") va giá trị ve") 1a diém chia doan x”) theo ty 18 a đ nếu Sign(e!")

tỷ lệ B: a nbu Signia* ) = -1

F1 và theo

Giảng như trong Hước 2, đổi với mỗi đoạn «@x°?), với x có độ sâu đp(x) = k-1,

iếu 9m(x'°?) - -1, thì tá phân hoạch doạm đỏ thành œ+p đoạn sao cho hx) >

the"), vei ý <4 <j < p, và Kotha) = fla), Lom ý rằng

fh) — rks) va điểm chia ve) 1 điệm nút chung của hai đoạn he) va thy), Khi ab whe) la didn chia doan (4x) theo ty 1

@: Bi néu Signthx) = +1 Ngược lại, nếu Sign(x) = +1, ta phân hoạch đoạn

ac*") thành q p doan sao cho he) « sgl", vei g < i<j < p va Kotha

Ds sinha"),

Định lý 1.5 Xe anh xa duge xây dung trong Dinh nghia 1.6 Tập ảnh v|H(x)] là

tập trù mật trong đoạn x) = [v( ge), vCar)], Vx = A, voi ur) = infant v[LIG)], v(ax) = supremiun v[II@)] va fine) = v(ox) - v(gx), te 6 bang 46 dai ctia doan

&)

Chứng mình: Với cách xây dựng như trên, có thẻ thấy bằng quy nạp là nêu đoạn thắng ấu) đã được xảo định thì giá trị rƒy) được xây đụng bằng cách chia đoạn

thẳng đó ra thánh p+g đoạn thẳng con 47/0 theo thứ tự của ƒ c [-gˆp] sao cho độ

đải của doạn thứ ; bằng ðn(J)#0) — ø(,Jðn(0) và giá trì v(bz chúa đoạn fj) theo

tỷ lệ œ: /@hoặc /8: ø Tất nhiên ta có v(2)e Aha) Vide chia nay bao gid cing thuc hiện được, Bằng cách như vậy, ta chia đoạn thẳng xuất phát 4x) thanh p+q doan con và tương tự như vậy, với mọi y CHG), y= #ụ hạx, hị, fy, CH, ta 06 thé chia

Trang 27

bà a

đoạn con 43) thành p+q đoạn can và đoạn con thứ ï có độ dài là finfhy) =

4thUfn() = Hữu họ ác L8/JfMQ) < Ä #m(), tong dò: Á= Max): Ƒ

€[ ø'p]} <1 Ta cũng có vfiw)e 4n)

Bay giờ ta có thể dé đảng chứng minh rằng tập ảnh v[H(x)] là tập trủ mật trong

đoạn s3) Ta lấy một đoạn thẳng [a,b] co độ đải £> 0 bat ky Voi moi phần tứ trong HỘ) cô đạng y— hạ ha, bị, ,hụ ©H và với œ dã lớn, đoạn thẳng x) duoc

chia thành các đoạn con có độ đài không vượt quá 2'°/#m(x) < £/2 Vậy có tên tại

một đoạn con 4’), „ˆ e Ö@v), với v(y)e.ấy2, thu dược từ cách chia đoạn Ấx) như

trên nắm trọn trong đoạn [a,b] Diễu này chủng tỏ tập ảnh v[E(x)] là tập trù mật

trong đoạn 4x)

Dé dang nhận thây rằng v(4ha), v(oñix), được xác định trong 3) của Định nghĩa

1.6, là cận đưới dúng và cận trên dúng của đoạn thẳng 4x) Vậy ánh xạ v thỏa

mãn điều kiện Q3), Định nghĩa l.5

Từ lính trù mật nảy la suy ra 3%) - [v(k), v()] Do đó (v79) — #mŒ) — v(2) - v(#x)

'Ta có hệ qủa trực tiếp của mệnh dẻ trên như sau

Hệ quả 1.1 Cho AXE là đại số gia tử tuyển tỉnh, đầy đã và v là ảnh xạ được xây dựng như trong Định nghĩa 1.6 Khi dó tập ãnh v[#4(G)] trủ mật trong [Ø,1]

Định lý l6 v là ánh xe ngữ nghĩa định lượng và thôa mãn tính chit

Trang 28

Giá trị ngôn ngữ Tim v Giá trị ngôn ngất Tiầm v

Very Possibly Small 026 Vary Possibly Large 0.74

Very Tittle Simall 0.46 Faery Little Large 0.54

1.1.41.6 Sự tương tự tô-põ của đữ liệu định nghĩa bởi ánh xạ định lượng ngữ nghĩa

Chúng ta hãy cùng xem xét một biển ngôn ngữ và giả thiết rằng không gian tham chiêu là Uạ, nghĩa là các phân tử của LU, là dữ liệu rõ Bộ dữ liệu ngôn ngữ mô tả giá trị trong L/x hay miễn ngôn ngữ của A được ký hiệu là //2øm(1J Vi trong nhiều trường hợp, một biển 4 cé thé nhan giá trị trong LĨu cũng như trong một tập Trgôn ngữ X = 1Dom(4) của biển ngôn ngít 4, chứng ta có thể xéi một miền hỗn hợp olla A va dit D4 =LDom(A) o Uy

Câu hỏi đặt ra là làm thế nào đẻ chúng ta có thể dịnh nghĩa sự tương tự của dữ liệu trong một miễn hỗn hợp 24?

‘Theo phương, pháp kinh diễn, mỗi dữ liệu ngôn ngữ dễu được hiểu là một tập mờ trong [74 Rõ ràng theo cách thể hiện đữ liệu mỡ nảy, việc xử lý dữ liệu khó hơn so với xử lý đữ liêu rõ Đặc biệt việc xác định sự tương tự dữ liệu bằng một phương pháp hợp lý không hề đơn gián

Trang 29

Chúng ta sẽ trả lời câu hỏi nảy theo cách chúng ta có thể xử lý dữ liệu trong các cơ

sở dữ liệu một cách để dàng và theo một phương pháp thông nhất

Đầu tiên, chủng ta thấy rằng trong trường hợp nảy các kiêu dữ liệu của thuộc tính 4

không phải lả duy nhất Để thông nhất các dạng dữ liệu, chúng ta sử dụng một ánh

xa định lượng ngữ nghĩa 0; gắn với một biển 44 để biên đổi tuyên tính dữ liệu ngôn ngữ sang dữ liệu thực, nghĩa là „ : X —› L„ Như vậy, mỗi dữ liệu ngôn ngữ x của

.4 có thể được coi như là nhãn của một giả trị thực được định nghĩa bởi 0ạ Vì D„(x)

€ U¿, chúng ta có thẻ thiết lập một phương pháp xử lý dữ liêu dang thực và dạng

ngôn ngữ bằng một phương pháp thống nhật

Vi gia tri thue v(x) chỉ là một đại diện của thuật ngữ không chắc chắn x, chủng ta không thể đơn thuần sử dụng 0„@) thay cho x khi so sánh với dữ liêu thực và các gia trị ngôn ngữ của A Vì vậy, vẫn đề quan trọng hiện nay lả lắm thế nào đề chúng,

ta có thể định nghĩa được một khái niệm vẻ sự tương tự ngữ nghĩa của dữ liệu trong

Dạ

Ching ta da biet, tap 9" = {H(x): x H(G)}©2{X} được coi là cơ sở của một

%, nghĩa là (X, %) trở thành một không gian tô-pô được định nghĩa bởi 9’, va H(x),

tập tất cả các thuật ngữ xuất phát từ nghĩa của x, thể hiện một sự tương tự ngữ nghĩa giữa các phần tử của nó Bên cạnh đó, vì 0 bảo toản quan hệ thứ tự ngữ nghĩa trên

X, chủng ta cỏ thể coi khoảng 5(x) = (0„( đà), 0„(23)] như một lân cận của phân tử v4(x) © Ủx và gọi nó là lân cận ngất nghĩa của thuật ngữ mờ x Nó phản ánh một

mức độ tương đồng vẻ ngữ nghĩa giữa x và giả trị thực trong khoảng 3),

Dựa trên phân tích nảy, chủng ta cỏ thể xử lý dữ liệu trong một cơ sở dữ liệu theo

cách thông thông thường và thống nhất như được trình bảy dưới đây Tuy nhiên,

vấn de đặt ra là lam thé nao dé ching ta cỏ thẻ tìm một lân cận của thuật ngữ x đủ nhỏ ở mức mả chủng ta mong muôn? Chủng ta cỏ thể tiến hảnh như sau:

Trang 30

30

Cho trước một miễn thuật ngữ X của mệt biến ngôn ngữ 44 Ký hiểu X; là tập tất

cã các thuậi ngữ cửa x có độ đài k, nghữa là Xy— {x © X: Kx) — &} Phần tử nhỏ nhất

trong X; được k hiệu là xạ Chú ý là 0„(đxø¿) = 0 Ta hãy đưa ra các kỷ pháp như sau PAL Hx) (v(t), DẠ(ĐỘ|, với xe Xã và xẻ xạ, và 5x4) [ĐAÁĐey),

ĐA(ZXa)] hoặc đặt Sx) = [vA Pr), 0(24)] nêu 0„(đx) = 0 Bằng phương pháp quy

nap, cé thé thdy rang,

(1) Dal SO) {Ấxả) Le Ben), On Bead lh 2 7Œ) (wal dee), va Bh) fp x

X, & x +x} va gọi các thành phần của nó là lân cận mức & Khi đó 3(Xị) là một phân hoạch cũa khoăng L7, nghĩa là:

(Œ) Bãi kỳ 2 lân cận khảe nhau trong, 2(Xi) đều rời nhau; và

(0?) Hợp của tất cả các lân cận trong 3(Äj) bằng Uy

(2) Phân hoạch 3X ;) min hon 3(X0, nghĩa là mỗi khoảng cửa 3X.) thuộc một khoáng của T(X¿) Nếu clrủng ta gọi 4y lả độ dài lớn nhất của các khoảng trong HX) va 7 là đô mờ lớn nhảt của các gia tủ trong Z7, khi đó tá có Âu; < pay < FA;

Vi ï?< 1, nên thuật ngữ x càng cụ thể (hoặc công dài) thì khoảng 2(x) cảng nhỏ

(3) Ảnh xạ D„(+) của mỗi thuật ngữ term x c X; có độ đài 7 < š luôn là diễm mut chung của hai phân hoạch thuộc khoảng, 3ỢX¿;)

Định nghĩa 1.9 Với mỗi thuật ngữ Ay he 06 d6 dai k, ¢ © Ở, 1uột tập hợp

cáo khoảng, ký hiệu là NeiG’ (x), đ> &, được gọi là một hệ lân cận ngữ nghĩa cơ sở

với độ dài đ của x theo ánh xạ tụ, nếu nó bao gồm những phân hoạch sau:

1) ®@) = Ø0) = (ua(đ), 04291, một khoảng với độ sâu k của x;

3) đ@9, với đ >7 > k, 906) là khoảng được định nghĩa là hợp giữa hai khoảng

với độ sâu ƒ có giá trị „(«) là điểm mút chung, Nó cũng được gọi là một lân cận có

độ sâu / của thuật ngữ x.

Trang 31

31

Rõ rằng o;(x) luôn là một điểm trong của mọi làn cận ngí nghĩa của NeïŒf,(x) Cân

hm ý là cách định nghĩa các lân cận theo định nghĩa trên phụ thuộc vào quan hệ giữa chỉ số biểu thị dộ sâu của một lân cậu của thuật ngĩt x và dộ dài của w

Ví dụ 1.2: Chúng ta hãy xem xét một đại số gia tử tuyển tỉnh về AGE, At = (X, G, C,H,E Œ.<),vớiGŒ tyơung,dld),H {P,LÌ vàH'- (VỊ, PL, M và

các chữ viết tắt tương ứng của 2ossibiy, Little, More va Very Gid sit, = JO, 1201,

#n(old) — 0.55, fn(young) — 0.45, sP) ~ 0.32, uL) - 0.20, wd) - 0.30 va a) - 0.18 Nhu vay a= 0.52 va A= 0.48

lu young), vf Spoung)| (0, fan(young)*i 20] [0, $4.00),

HG lan can ngit nghia co sé véi dé sdu 2 otia tir young, NeiG" (young), bao g6m phan hoach S(young) = [0, 54.00] va phan hoach (u,(@Myvoung), v4 DMivoungy] c¿

(u.( EP voung), v.(2Pyoung)] = (uC @i¢young), vs(2Pyoung)|=(v.(voung) fin(At

young), v,(young) | fin(Pyoung)] = (28.08 — 0.135%120, 28.08 0.144120) = (11.88, 45.36], vi Myoung and Pyoung la cae từ lân cận trải và phải với độ sâu 2 của young va IMyoung = @Pyoung = young

Lan cin véi 46 sau 3 cia young theo u, 1A phin hoach @:(young) = (v PLM

voung), bA2LMyoung)] ‹2 (b(@ŒWyoung), U(2VPyoung)| = (DI(GLAAyoung),

vf ZVPyoung)| (valyoung) — fn Myoung), v4young) + fn(VPyoung)| (28.08

Trang 32

2) Các lân cận ngữ nghĩa của 7ossibly young: Theo định nghĩa, UA(Pyowng) chia khoảng (0, ương), 02()| theo tỷ lệ 8: ava do vay u(Pyoung) 28.08 + 0.48+0.32x 0.45⁄120 = 36.3744

NeiG' (Pyoung) bao gồm một khoảng đuy nhất [Da(đ2young), 0u(2Pyoung)] = (28.08, 28.08 : 0.32+0.45x120] = (28.08, 45.36];

NgiŒÌ (Pyoung) chứa các lân cận trong NeiG? ,(Pyoung) va cdc lân cận sau vôi

lưu ý rằng độ sâu của Pyowng là 2:

@{Pyoung) = (vs(Pyoung) — fo MP young)*120, v4(Pyoung) +

Trang 33

33

CHƯƠNG 2~— XÂY DỰNG MÔ HÌNH CSDL QU

THONG TIN NGON NOT’

2.1 Giới thiệu chung về cơ sở dữ liệu với thông tin ngôn ngữ

Xât một lược để CSDI, quan hệ 2B {U, Ry, Rp, ., Re, Consi}, trong đố Ù {4,,

Ay, oy Aq} lá tập vũ trụ các thuộc tính, 74, lược đổ quan hệ, tức lả một tập con của

U, Const 14 mét tap các ràng buộc đứ liệu của CSDL Mỗi thuộc tính <4; được gắn

với một xniễn giả trị thuộc tính, kỷ hiện là Dom(4)), trong đó một số thuộc tính cho

phép nhận các giá trị ngôn ngữ trong lưu trữ trong CSDL hay trong các câu hỏi truy vẫn và được gọi là thuộc tính ngôn ngữ Những thuộc tính còn lại được gọi là thuộc tính thực hay kinh diễn Thuộc tính thực A duoc gắn với một miền giả trị kinh diễn,

ký hiệu là J2¿ Thuộc tính ngôn ngữ 1 sẽ được gin mét miễn giả trị kinh dién 4, va Tnột miền giả lrị ngôn rụyữ ƑJ2,,

Giả sử một thuộc tính 4, gắn với một miễn Ø4) — + +2 LDom(4) Các thành

phân của 2„; được kỹ hiệu bởi a, ở, e, với các chí số nêu cẳn, vả các thành phần

của LDøm(4) được ký hiệu bằng +, y, z, w, v, cũng với các chỉ số nêu cân

Một hộ ¿ trên Ữ là một ánh xa t J > DAUD (Ag DHA,) sao cho “Ade DOAJ,

tới 1< ¡<n Các bộ được ký hiệu bởi £ s với chỉ số khu cản #4] croc hiéu lA gid ti

của bộ ¿ tại thuộc tính z1, Với một tập con_Y bất ky thuée U, 1[X] biểu thị ánh xạ t

giới Hạn trên Ý và được gọi là bộ trên X-

Chúng ta hay xét mệt lược đổ quan hệ, tức tập #‡ của L Một thể hiện của # là một tập các bộ trên R va dược gọi là quan hệ Các quan hệ của R dược biểu diễn bởi HR], of], Néu R không gây hiểu nhằm thì có thẻ bỏ đi trang ký pháp này

VÌ £ có thể nhận các giá trị thực và giá trị ngôn ngữ, ta cần cỏ cách dé thao tac dit liệu đựa trên ngữ nghĩa Nếu ta điễn giải dữ liệu ngôn ngữ như là nhãn các lập mờ thị có thể thao tác đỡ liệu dựa trên lý thuyết tập mờ và ta có khái niệm cơ sở dữ liệu

mo.

Trang 34

Ta sẽ trả lời câu hỏi này sao cho có thể quản lý được đữ liệu trong CSDL theo một cách phủ hợp vẻ ngữ nghĩa vả thuận tiện nhất

Cho rvà s là hai bộ định nghĩa trên [7 Mỗi thuộc tính 44,sẽ được trang bị một ánh xạ

inh hong v(4,): LDom(4,) > U, Câu hỏi đầu tiên là làm sao chúng ta có thể định

nghĩa được một quan hé "bing" tén D(4,) trong đỏ đữ liệu ngôn ngữ (dữ liệu không chắc chắn) tần tại cứng dữ liên thực? Định nghĩa quan hệ "bằng" đường rửur

là hợp lý nêu nó thốa mãn các điều kiện sau

1 Liên tục

2 Về nguyên tắc, nếu có "đủ" các bằng chứng chí ra rằng bai dữ liệu

trong D(4,) là khác nhan, chúng không thể thỏa mãn quan hệ "bằng*

Trong trường hợp của chúng ta, hãy xem xét các chỉ tiết sau như là những bằng,

ghứng đây đủ cho sự khác nhau:

(i) Hai giá trị thục kháo nhau,

(0) Hai đữ liệu ngôn ngữ cụ thể nhất có trong CSDT,

Trang 35

Tuy nhiên, để khai thác ngữ nghĩa của đữ liệu ngôn ngữ trong CSDL, ta đưa ra một

ký pháp "bằng nhau mức &°, với È là một số nguyên Van để nảy duòng như phụ thuộc vào cách chúng 1a hiểu ngữ nghĩa của đữ liệu ngôn ngữ trong 72(4,) ruột cách chính quy,

Đầu tiên, chúng ta định nghĩa một quan hệ "bằng" mức & trên /J(/1) Với mỗi số

tuyên đương k đặt VÉ) {x © LDom(): (x)}<k} Xị l2Ấ ki k2 Ấ có nghia la X(k) li tập cáo đữ liệu ngôn ngữ có độ sâu không lớn hơn k

(Xị) và SỢM, 1) của khoảng 7„„„ Dựa lrên nghiên cứu của phần

Xét hai phân boat

trước, sự lương tự về tô-pô của đữ liệu định ngkữa theo anh xa định lượng ngôn ngữ,

ching ta dinh nghia lân cận mức # của các thuật ngữ trong một CSDL như sau:

(ND) Voi mai x c X(k-T), 0œ) là một điểm muối của các khoảng nhất định

thuộc phân hoạch '5(X¿) Ta đặt (23x) = @@), lân cận mức & của thuật ngữ x

được định nghĩa, như trong phẩn trước, là hợp của hai khoảng có độ sâu l7 nằm phia trải và phía phải của điểm v(x);

(N2) Với mỗi y < +, đặt (40) = 50) \ Une 80):

(N3) Với mỗi x= hy) hyo © XY, trong đó e © Œ và ƒ > &, đặt (10) = (Q0

hc), nghĩa là lân cận mức k của một thuật ngữ có độ sân lớn hơn È chính là lân

cận mức k của hậu Lỗ của nó với dộ sâu &

`

Tlinh 4: Một ví dụ vẻ hệ lân cận

Trang 36

36

Dé mink hoa, ta hay xem xét một ví dụ cho trong hình 4 Với x có dộ sâu nhỏ hơn &,

nghữa là xe A©2), lần dân (24G) — đáx) mức & cửa x là hợp của hai khoảng

hạ 4(2-.;), hai tập con của các khoảng nhất định của 3%) Ching han, xét y c Xpva

x, x? © X(k-1) trong hitth, 6G) = Wg) Shyu’) va Ae) = đỮny) cà 30a”) Với x = hy, trong đó Ấy) = k, ta có (10) = AQ) = Shy) © My) Nhu duge chứng rmainh Hong phần sau, chúng la thấy rằng họ {4Œ}: x cA(&)} là một phân hoạch của (2, Ngoài ra, với mỗi x e XŒ, D2) e £3@) vả, hơn nữa, đó là một diễm trọng tô-pô của £3(x) Do vậy, chúng ta sẽ gọi nó là một hệ lân cận mức È của cáo giả trị ngôn ngữ của A, theo Uz,

Định lý 2.1 Cho một ĐSGT tuyển tỉnh dây dủ, trong đỏ lập các gia từ HT and H

có ít nhất hai phần tủ Khi đó, họ các khaảng { 4G): x €X}, lan cận mức k của đt liệu ngôn ngữ của thuộc tính A,, là một phân hoạch của I1 và do Ãó, mỗi thuật ngữ

x của A, cô một lần cận mức k dhụy nhất Ngoài ra, với mỗi x CÁ, 0Œ) là một điễm

trong của CALx)

Chứng minh: b„(+) là một ánh xạ một-một từ X vào /3„ và 5Q0,.¡} là một phân

hoạch của Da; mịn hơn %(j) Da #f và #f” có ít nhật hai phân tữ mỗi khoảng của

S(X/) dịnh nghĩa theo x c X; chữa ít nhất bốn khoảng con được định nghĩa bởi cào

phân Lữ theo đạng lx, he HH càHT, Vì với mỗi xc XÉCD), DaÁ@) là một điểm

xuút của một số khoáng của phân hoạch '%(X;) và theo (V7), £3(x) = 4Œ) là hợp của hai khodng trong S(¥pe1) năm phía bên phải và trái của điểm bạ @>), suy ra {4Œ}: x cXŒ-D)} là họ các khoảng rời nhau Rõ ràng rằng 0z) là một điểm trong cửa 4œ)

‘Ya cũng nhận thấy, (M2) cho thấy {(4@): x cXŒ)} = (4G): x cXŒ=ĐD] xà (403: yĂ€Xz} là một họ các tập rời nhau Ta cân chứng mình rằng, với mỗi y cX+ Qty) + Z2 và nó lá một khoảng Thực ra, chúng ta cần xem xét khoáng '%(y) Dễ nhận thấy ring né được định nghấu là ảnh của tập H,@) theo ảnh xạ dạ và S(y) chứa các

Trang 37

khoảng hữu hạn có độ sâu & 7 theo thử tự sau: hoặc S(L„y) < Su, ở) < < SƠ

YY S Oe) < S(ty) < < S(h,y) hoặc S duy) < SỢu, p) < < Suy) Š DA) <

Shy < 5(,y) Cân luu ý rằng không phân tử nào của 7/0) có độ sâu nhỏ hơn & hoặc nếu x c Z2) có độ sâu nhõ hơn &, thì o„„áx} phái lá một diễm mút của 0) Do đó, phụ thuộc vào việc các điểm mút của %(y) có phải là ảnh của các phan

tử của Xức7) hay không, (1Ó) sẽ không chứa một trong hai khoảng, 9Œ: „y) và S(#„y) hoặc cả hai Rõ ràng là, trong mọi trường hợp, (1Ó) là một khoảng và b0) làm một điểm trong cia 19)

Vi với mỗi 7 > &, {1Ú} y =X} C (40) y eXH, ta để thấy từ định nghĩa rằng, {QQ}: x =X† là một phân hoạch của „, M

Bây giờ chúng ta đã sẵn sàng đưa ra khái niệm “bằng không chắc chắn" trên (44) của thuộc tính ngôn ngữ 1;

Dinh nghĩa 2.1 Giả sử ¿ và s là hai bồ trên E7 Ta sẽ viết 4] —„z s[⁄4] và goi nó lA

dang thie mirc &, nều các điều kiện sau được thỏa

() Nếu 44] 3⁄4]c 2z thì 8⁄4] = s4},

(ñ) Nếu chỉ có một Irong Hai bộ 4⁄4;|, s|⁄4,J, chẳng hạn /|⁄4J, là đữ liệu ngôn ngữ, thì s4] < 4);

(8Ø Nêu cả ti ![24,], x⁄4,] là đữ liệu ngôn ngữ thì QULAD - Alsl4))

Có thế đễ kiếm chúng rằng “đẳng thức” =„¿ mức & thỏa tất cả các điêu kiện trên Ở

đây ta hiểu rằng riều một trong những điều kiện trên không thỏa, ta xem như có đã bang chứng (mức &) dễ chỉ ra rằng hai giá trị là khác nhau

Trang 38

38

Hệ quả 2.1 Với hai bộ s và t bắt kỳ định nghĩa trên và thuộc tính A, hoặc tL4|

ve SLA] hod ((A,] zu« s4], ngoài ra, đẳng thức —u„ mutc k ở trên là liên tục trên

mién D(A)

Thát biểu này cho ta khả năng định nghĩa các quan hệ đồi sánh mức # khảo giữa các phân lữ ong 74) một cách đễ dàng, Để đơn giân hóa việc phát biểu trong các

định nghĩa sau, chứng †a châp nhận một quy tróc vẻ cách sử đụng, 14, như sau:

voi hdd Đại, (G14) biểu thị giá trí thục 4| và, với một dữ liêu ngôn ngữ 4⁄4¡] 44040) biểu thị in can QULAD đình ngiõa ô trên

Với hai lân cận bất kỳ £3(1) và /40), ta sẽ viết (4) <: 4Ó), nêu t < v, với

<G) và ve 40) bắt kỳ

Dịnh nghĩa 2.2 Cũng với giả tuất như trên,

() Ta sẽ viết H21] Su; sf), née hode A] = sf] hode 44⁄4) < SASL);

(0 Ta sẽ viết t4] xu; sl2Ll, nếu (0124) < QUI),

Gi) Ta sẽ viết tLA,| >¿ s 4,1, nếu C4014) > AGlA,)

Những quan hệ này được gọi là các quan bệ đối sánh mờ trên một CSDL với đữ liệu ngôn ngữ

Dinh lý 2.2 V6i hai gid trị bắt kỳ t4), s4] = DỤA), chỉ một trong hai điều kiện

san thỏa

(4) 8⁄1] =„x s4], G9 f

Spe TAs] 0/9 8⁄4] >¿š She]

Chứng minh: Theo hệ quả 31, với hai bộ ø và r bất kỳ †a có hoặc /{4,] =u¿ sL4,] hoặc 1⁄4] #ay s4] Trong trường hợp -4] #uy 3[⁄4,], có ba khả năng xây ra:

1) Nếu 4] và sE4,] là các giả trị thực, định lý hiển nhiên đúng,

2) Nếu chỉ một trong bai bộ (.4,| và sL⁄4,| là giả trị thực, chẳng hạn 444,|, thì ta có 14] £ (s4) và do đó, boặc 241 <¿z (G44) hoặc 4A] >u (G14) Các bất

Trang 39

Ví dụ 2.1 Giả thiết giống như trong ví dụ 1.2 Ta sẽ định nghĩa hệ lân cận ruức 2

và các quan hệ đổi sánh mức 2 theo tự,

1) Hệ lân cận mức 2 của các thuật ngữ thuộc X(2) không lớn hơn young: Tập Ấ; với các phần tử mức 1 không lớn hơn vøwng chi chia young Dio vậy, nếu biểu thi young bdi y, ta củ 2G) — AG) = SUA) ‹ 3ŒPy) - (2808 — 0.20x0.30x0.45x120, 28.08 + 0.18x0.32x0.45x120] = (24.84, 31.1904], trong đó như đã chi ra trong vi du 1.2, v4(voung) = 28.08

Cúc thuật ngữ mức 2 không lớn hơn young la “More young” va “Very young” Ching ta 06 (Hinh 5): (Very young) = S(Very young) = (nv PVy), vl VY) = [0 409-1 54.11 = [0, 28.08 0.30«0.45%120] = [0, 11.88] and GCVfore young) = S(More young) \ S(LMy) = (11.88, 28.08 — 0.20%0.30%0.45%120] = (11.88, 24.84]

2) Ta dua ra một số vi dụ vẻ quan hệ đổi sảnh mức 2 trên (4) định nghĩa bởi một SQM 0: Theo dịnh nghĩa 2.2, có thể thấy ring MF young —,,2 LF young —.,> young vA PM young ~,2 M young V young <y2 young va young <p 54, vì S{young) < 34, nhang 54 =,, young suy xa từ 54 c (20) = 3Ó) = [0, 54)

Trang 40

40

Hình 5: Ví đụ về hệ lân cân

Trong các ứng dụng, chúng ta thường sử dụng một số lượng nhật định các dữ liệu

ngôn ngữ Do dé, ta cô thể giá thiết rằng, số đữ liệu ngồn ngữ của 41, là hữu hạn va

đo vậy ta có thể giả thiết rằng có một độ dai lớn nhất #, cho những dữ liệu ngôn ngữ Trong trường hợp này, các thao tác dỏi sánh xuức &; có các tính chất sau:

Định lý 2.3 Giá thiết rằng tập LDomQA) các để liệu ngôn ngữ của một thuộc tính

A, tập nên X của một ĐSG1 tuyển tinh ddy dit AX, la hie han va & là độ sấu lớn

nhất của đit liệu thuộc Lom(1) Khi đö,

() TẤt câ các quan hệ dối sảnh mờ “ụu, tui, mu “uy Đề >ụy với k > ky là

trùng tương ứng VỚi - sua 7, „ạ và vì thế Irong trường hợp

này ching ta sé sit dung ky phap =,, +0, “v,?y,* va >, thay cho =on, Aum

Sues Zur Soke VE vin

(i) Cae quan hd ddi sinh mo, 4), Sự, >ụ, < và >v trên LDam(1) là trùng

với =,⁄, %>,< và > định nghĩa tren X,

Chứng minh: (¡) Vi & 1 độ sâu lớn nhất của dữ liệu ngôn ngữ trong XÃ, ta có XỨ) = Xứ) với mỗi k > k„ Chúng ta cô {4G}: x CX(] = {£4@}: x cXk)}, diéu nay chứng tổ (0 là đúng,

(2) Đề chứng minh () chỉ cần chứng tỏ rằng £3,(x) chứa một phân tử đuy nhất cửa

va(X(k)) Thực ra, vì mỗi lân cân (34x) chứa mệt phản tử duy nhất của 0„(X()),

ta suy ra, voix, y @X, x —» y niêu và chỉ nếu i[ Є@) — Đ4@y), suy rax — y Ta biết

xầng, 0ạ, bảo toàn thứ tự của ÄX, tập {44x} x cX(J)] là một đẳng cầu vào Ý Điều

này clưúng 1ó tính đúng, đắn của phát biểu cho các quan hệ đổi sánh còn lại

Tây giờ ta chỉ ra rằng mỗi lần cận £3(>) chứa một phan ti duy nhất của o„(X2)

Ta biết rằng ánh của phần tử bất kỳ của X(&-7) theo ánh xạ 0, là điểm mút của họ

Ngày đăng: 21/05/2025, 20:52

HÌNH ẢNH LIÊN QUAN

Hình  1:  Tập  mờ  và  tập  rõ - Luận văn về một mô hình csdl quan hệ với thông tin không chắc chắn dạng ngôn ngữ gần tự nhiên
nh 1: Tập mờ và tập rõ (Trang 10)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm