Áp dụng lý thuyết tập mờ để mở rộng CSDL quan hệ

Bài viết này giới thiệu một mô hình cơ sở dữ liệu quan hệ mờ là mở rộng của mô hình cơ sở dữ liệu quan hệ truyền thống với hai đặc tính chính: Các quan hệ biểu diễn tập các bộ dữ liệu là quan hệ mờ, các điều kiện chọn được kết hợp với giá trị tập mờ để có thể truy vấn thông tin mờ, không chính xác của các đối tượng trong các quan hệ.

Trang 1

ÁP DỤNG LÝ THUYẾT TẬP M ĐỂ MỞ RỘNG CSDL QUAN HỆ

NGUYỄN HÒA (*) NGUYỄN THỊ UYÊN NHI (**)

T M TẮT

-Fuzzy Relational

e M e ) r ủ r ) )

r r ủ

r M ủ

r r

ủ M

ủ

r ủ r

r

óa: tậ ờ, qu ờ, sở d u qu ờ é o ạ s qu ờ

ABSTRACT

This paper introduces a fuzzy relational data base model (FRDB) that extends the conventional relational data base model with two key features: (1) the relations represent the set of data tuples to be the fuzzy relations; (2) selection conditions are associated with fuzzy set values to be able to query the fuzzy, imprecise information of objects in relations

An interpretation of the membership degree of tuples for fuzzy relations is proposed on the foundation of the fuzzy set theory as the basis to develop the data and data manipulating model of FRDB including schemas, fuzzy relations and algebraic operations Some properties of the fuzzy relational algebraic operations also are formulated and proven as those that are extended of the properties of relational algebraic operations in the conventional relational data base model

Keywords: fuzzy set, fuzzy relation, fuzzy relational data base, fuzzy relational

algebraic operation

1 GIỚI THIỆU(*)(**)

Như chúng ta đã biết, mô hình sở

d u qu uyề (conventional

relational data base), được đề nghị bởi

Codd E.F năm 1 70 ([2]), đã chứng tỏ

nhiều ưu điểm trong các vấn đề mô hình

hóa, thiết kế và hiện thực các hệ thống lớn,

(*) TS, Trường Đại học Sài Gòn

(**) ThS, Trường Đại học Sài Gòn

từ phần mềm cho đến cơ sở dữ liệu (CSDL) Tuy nhiên, các ứng dụng dựa trên

mô hình CSDL quan hệ truyền thống không biểu diễn được các đối tượng mà thông tin về chúng không được xác định một cách rõ ràng và chính xác Điều đó làm hạn chế khả năng mô hình hóa và giải quyết các bài toán áp dụng trong thế giới thực Chẳng hạn, các ứng dụng mô hình

Trang 2

CSDL truyền thống không thể trả lời được

các truy vấn kiểu như “tìm tất cả những

bệnh nhân ẻ có tiền sử bệnh viêm thanh

quản”; hoặc “tìm tất cả các gói bưu kiện có

trọng lượng k oả 10 kg và được vận

chuyển trong thời gian k oả 36 giờ từ

Hà Nội đến Sài Gòn”, v.v Trong đó ẻ,

k oả 10 kg và k oả 36 giờ là những

khái niệm và giá trị không chính xác Để

khắc phục được các hạn chế như vậy, cần

phải xây dựng các mô hình dữ liệu có khả

năng biểu diễn và xử lý được các đối tượng

mà các thông tin về chúng có thể không rõ

ràng (mờ) và không chính xác

Trong những năm qua đã có nhiều mô

hình cơ sở dữ liệu quan hệ dựa trên lý

thuyết ậ ờ (fuzzy set) được nghiên cứu

và xây dựng nhằm mô hình hóa các đối

tượng mà thông tin về chúng mờ, không

chính xác [1], [3], [7], [9], [10] Các mô

hình như vậy gọi là ô ì sở d u

qu ờ (fuzzy relational data base

model) Tuy nhiên, do tính đa dạng và

phức tạp về sự tồn tại của các đối tượng

cũng như các mối quan hệ của chúng nên

khó có mô hình nào có thể biểu diễn và xử

lý hết mọi khía cạnh không chắc chắn và

không chính xác về thông tin của các đối

tượng trong thế giới thực Vì vậy, các mô

hình CSDL mờ vẫn được tiếp tục nghiên

cứu và phát triển để đáp ứng các mục tiêu

ứng dụng khác nhau

Có hai cách tiếp cận chính để biểu diễn

dữ liệu mờ trong mô hình CSDL mờ: (1)

biểu diễn giá trị thuộc tính bằng các giá trị

tập mờ trong quan hệ mờ; (2) biểu diễn giá

trị thuộc tính bằng các giá trị rõ trong quan

hệ mờ

Trong cách tiếp cận thứ nhất, giá trị thuộc tính quan hệ được biểu diễn bằng một tập mờ và được diễn dịch bởi hàm thành viên của nó ([4], [7], [ ], [11]) Trong các mô hình được xây dựng bằng cách tiếp cận này, các quan hệ hai ngôi cổ điển giữa các thuộc tính được mở rộng thành các quan hệ mờ Mức độ thành viên của các bộ được ẩn trong mức độ thành viên của các giá trị thuộc tính Trong cách tiếp cận thứ hai, giá trị thuộc tính quan hệ được biểu diễn bằng một giá trị đơn rõ trong một quan hệ mờ trên các miền giá trị của các thuộc tính đó ([ ], [ ], [10]) Trong các mô hình được xây dựng bằng cách tiếp cận này, các quan hệ nhiều ngôi cổ điển (quan hệ trên các lược đồ CSDL) được mở rộng thành các quan hệ nhiều ngôi mờ và mức độ thành viên của các giá trị thuộc tính được ẩn trong mức độ thành viên của các bộ trong các quan hệ mờ này

Trong bài báo này, chúng tôi đề nghị một mô hình CSDL quan hệ mờ (FRDB) dựa trên cách tiếp cận thứ hai Để xây dựng FRDB, chúng tôi áp dụng lý thuyết tập mờ ([6], [12]), mở rộng quan hệ và các phép toán đại số quan hệ truyền thống ([5]) thành quan hệ mờ và các phép toán đại số quan hệ mờ Chúng tôi cũng đề nghị một diễn dịch mức độ thành viên của các bộ đối với một quan hệ cho các điều kiện chọn làm cơ sở để truy vấn với thông tin mờ, không chính xác trong FRDB

Cơ sở toán học để phát triển FRDB được trình bày trong Phần 2, lược đồ và thể hiện FRDB được giới thiệu trong Phần 3 Phần 4 trình bày các phép toán đại số trên FRDB và cuối cùng, Phần là một số kết

Trang 3

luận và hướng nghiên cứu trong tương lai

2 CƠ SỞ TOÁN HỌC CỦA FRDB

Phần này giới thiệu tập mờ và quan hệ

mờ như là cơ sở toán để phát triển FRDB

Tập mờ được sử dụng để biểu diễn các truy

vấn với thông tin không rõ ràng, quan hệ

mờ được sử dụng để mở rộng các quan hệ

trong FRDB

2.1 ập mờ

Tập mờ là khái niệm mở rộng của tập

cổ điển và được định nghĩa như sau

Định nghĩa 2.1.1 Giả sử X là một tập

khác rỗng, một ánh xạ từ X đến khoảng

đóng [0, 1], A: X [0, 1], xác định ộ

ậ ờ (fuzzy set) A trên X Ánh xạ A

được gọi là hàm thành viên (membership

function) của tập mờ A Với mỗi x  X,

A (x) là ộ (membership

degree) của x đối với A

Để đơn giản, ký hiệu A: X [0, 1] có

thể được sử dụng để biểu diễn tập mờ A

Ví dụ 2.1.1 Một ví dụ đơn giản về tập

mờ là tập các số gần số 2, about_2, được

cho bởi hàm thành viên của nó như sau:





























] 3 , 1 [ 0

] 3 , 2 ( 3

] 2 , 1 [ 1 2

_

x

x x

x x about

và đồ thị hàm thành viên của about_2

như trong Hình 2.2.1

Hì 2.1.1: Tậ ờ s ầ 2

2.2 Bi u diễn tập mờ

Trong các ứng dụng, ngoài cách biểu

diễn tập mờ A như một hàm thành viên A:

X → [0, 1], còn có một số cách biểu diễn

tập mờ như sau:

1 Đối với tập X hữu hạn, một tập mờ

A trên X thường được biểu diễn bởi một hệ

thức có dạng A = , trong đó a i =

A(x i) ≠ 0

2 Đối với tập X vô hạn không đếm

được, thường là tập số thực, một tập mờ A

trên X có thể được biểu diễn bởi

Chúng tôi lưu ý dấu tích phân ở đây chỉ có ý nghĩa thể hiện một tập vô hạn

không đếm được các cặp x và A(x) trong X định nghĩa cho A

2.3 C c p ép t n trên tập mờ

Các phép toán trên các tập mờ được định nghĩa một cách tổng quát dựa trên các ánh xạ từ tập tích Descartes của các khoảng đóng [0,1] đến khoảng đóng [0,1] Tuy

nhiên, phần này chỉ giới thiệu các phép

o uẩ (standard operation) trên các

tập mờ ([6], [12]) được ứng dụng trong

FRDB

Định nghĩa 2.3.1 Giả sử A, B là hai tập

mờ trên tập X và có các hàm thành viên lần

lượt là A, B Phép toán lấy phần bù của

A, hợp, giao và hiệu của A và B được định

nghĩa theo hàm thành viên của chúng như sau

1 Ac (x) = 1-A (x), x X

2 AB (x) = max( A (x), B (x)), x X

3 AB (x) = min( A (x), B (x)), x X

4 A-B (x) = min( A (x), 1-B (x)), x X

Trang 4

2.4 Quan ệ mờ

Khái niệm quan hệ mờ là cơ sở để xây

dựng CSDL quan hệ mờ Quan hệ mờ được

định nghĩa bằng cách mở rộng quan hệ cổ

điển như sau

Định nghĩa 2.4.1 Giả sử A1, A2,…, A k

là các tập khác rỗng, một quan hệ mờ

k-ngôi R giữa k tập A1, A2,…, A k là một tập

con mờ của tập tích Descartes A1A2

…A k

Như vậy, một quan hệ mờ k-ngôi R

được kết hợp với một hàm thành viên R:

A1A2 …A k[0,1] Trường hợp quan hệ

mờ 2-ngôi R giữa X, Y (là cơ sở để xây

dựng các phép toán mờ 2-ngôi), là một tập

mờ R = {(x,y): R (x,y) | (x, y)  X×Y } với

hàm thành viên R (x,y): X×Y → [0,1]

3 LƯỢC ĐỒ VÀ QUAN HỆ FRDB

Lược đồ và quan hệ FRDB được mở

rộng từ lược đồ và quan hệ CSDL quan hệ

truyền thống để biểu diễn khả năng các bộ

thuộc về một quan hệ mờ

3.1 ược đồ FRDB

Một lược đồ FRDB gồm một tập thuộc

tính kết hợp với một hàm thành viên làm

cơ sở để xác định các quan hệ mờ, được

định nghĩa như sau:

Định nghĩa 3.1.1 Một ượ ồ quan h

mờ (fuzzy relational schema) là một bộ đôi

R = (U, ) trong đó

1 U = {A1, A2, …, A k} là một tập các

thuộc tính đôi một khác nhau (biểu diễn

thông tin về giá trị các đối tượng trong

quan hệ)

2  là một ánh xạ đặt tương ứng mỗi

(v1, v2,…, v k)  D1D2…D k với một số

thực thuộc [0, 1], trong đó D i là miền giá

trị của thuộc tính A i (i = 1, …, k)

Chúng tôi lưu ý rằng, như trong CSDL quan hệ truyền thống, để đơn giản, có thể

viết R(U, ) thay cho cách viết R = (U, )

Ngoài ra, mỗi t = (v1, v2,…, v k) được gọi là

một bộ trên tập thuộc tính {A1, A2, …, A k}

Ví dụ 3.1.1 Một lược đồ quan hệ mờ PATIENT trong FRDB mô tả về các bệnh

nhân có thể như sau:

PATIENT(PATIENT_ID,

PATIENT_NAME, AGE, SEX, ), với 

là ánh xạ

: string  string real  binary[0,

1], trong đó string, real và binary là các

miền giá trị của các thuộc tính PATIENT_ID, PATIENT_NAME, AGE

và SEX

3.2 Quan ệ FRDB

Quan hệ mờ được mở rộng từ quan hệ truyền thống với mức độ thuộc được gán cho mỗi bộ như định nghĩa dưới đây

Định nghĩa 3.2.1 Giả sử U = {A1, A2,

… A k} là một tập thuộc tính đôi một khác

nhau, một quan h mờ (fuzzy relation) r

trên lược đồ R(U, ) là một tập hữu hạn

các bộ {t1, t2,…, t n} trên tập các thuộc tính

{A1, A2, …, A k}, được kết hợp tương ứng với các giá trị (t i) biểu diễn mức độ thuộc

của t i trong r Các ký hiệu t.A hoặc t[A]

biểu thị giá trị thuộc tính A của bộ t trong r Mức độ thuộc của t i trong r được ký hiệu là

r (t i)

Chúng tôi cũng dùng ký hiệu t[X] để

biểu thị giá trị thu hẹp của bộ t trên tập

thuộc tính X  {A1, A2 … A k}

trên lược đồ PATIENT(PATIENT_ID,

MEDICAL_HISTORY, ) có thể như

Trang 5

Bảng 3.2.1

Phụ thuộc hàm mờ trong FRDB được

mở rộng từ phụ thuộc hàm trong CSDL truyền thống như định nghĩa 3.2.2

Bảng 3.2.1: M t quan hệ mờ trên lược đồ PATIENT

Định nghĩa 3.2.2 Cho một lược đồ

quan hệ mờ R(U, ), r là một quan hệ mờ

bất kì trên R, X và Y là hai tập con các

thuộc tính của U Một ph thuộc hàm mờ

(fuzzy function dependence) của Y đối với

X trên lược đồ quan hệ R, ký hiệu là X ⇝

Y, nếu

t1, t2  r (r (t1)  r (t2)  t1[X] =

t2[X]) f (t1[Y] = t2[Y]), trong đó

a f b =













b a b

a

b a

khi ), ( 1

khi , 1

Phụ thuộc hàm X ⇝ Y còn được gọi là

“X xác định hàm Y” hoặc “Y phụ thuộc

hàm vào X”

Lưu ý rằng, khi giá trị hàm r bằng 1

với mọi r trên R, phụ thuộc hàm mờ trong

định nghĩa này sẽ đồng nhất với phụ thuộc

hàm trong CSDL truyền thống

Bây giờ CSDL quan hệ mờ là mở rộng

của CSDL quan hệ truyền thống và được

định nghĩa như sau

Định nghĩa 3.2.3 Một sở d li u

quan h mờ (fuzzy relational database) trên

một tập các thuộc tính A là một tập các

quan hệ mờ tương ứng với tập các lược đồ quan hệ mờ của chúng

Lưu ý rằng, nếu chỉ quan tâm đến một quan hệ duy nhất trên một lược đồ thì có thể đồng nhất ký hiệu tên quan hệ và lược

đồ của chúng

Ví dụ 3.2.3 Một CSDL quan hệ mờ

đơn giản các bệnh nhân tại phòng khám của một bệnh viện có thể được tổ chức như các Bảng 3.2.2, 3.2.3, 3.2.4 Ở đây, quy ước đơn vị thời gian điều trị, chi phí điều

trị tương ứng là ngày và 1000 (đồng VN)

Kinh nghiệm điều trị của bác sĩ được tính theo năm Chúng tôi lưu ý rằng, một số thuộc tính đã bị lược bỏ bớt (cho đơn giản)

và chúng cũng không ảnh hưởng đến việc minh họa cho mô hình CSDL quan hệ mờ

Bảng 3.2.2: Quan hệ PATIENT

PATIENT_ID PATIENT_NAME AGE WEIGHT MEDICAL_HISTORY 

PT005 L.V Tam 53 70 Bronchitis 0.9

PT006 N T Trang 29 49 Gall-stone 0.5

PT007 T T Tu 21 65 Hepatitis 1.0

Trang 6

Bảng 3.2.3: Quan hệ DIAGNOSE

Bảng 3.2.4: Quan hệ PHYSICIAN

4 CÁC PH P TOÁN ĐẠI SỐ FRDB

Các phép toán đại số quan hệ mờ như

phép chọn, phép giao, phép hợp và phép

trừ là cơ sở để truy vấn và thao tác dữ liệu

mờ, không chính xác trong FRDB Các

phép toán này được mở rộng từ các phép

toán đại số quan hệ truyền thống, trong đó

mức độ thành viên của các bộ là một giá trị

trong khoảng [0, 1]

4.1 P ép c n

Phép chọn trên một quan hệ FRDB là

cơ sở để thực hiện các truy vấn tìm kiếm

thông tin trong CSDL Trước khi định

nghĩa phép chọn, chúng tôi giới thiệu cú

pháp và ngữ nghĩa của các điều kiện chọn

như dưới đây

Định nghĩa 4.1.1 Giả sử R là một lược

đồ FRDB, X là một tập các biến bộ quan

hệ,  là một quan hệ hai ngôi trong =, ,

, , , ≥ Các ều k n mờ (fuzzy

selection condition) được định nghĩa một

cách đệ quy và có một trong các dạng sau:

1 x.A  v, trong đó x X, A là một thuộc

tính trong R và v là một giá trị

2 x.A  v, trong đó x  X, A là một

thuộc tính trong R,  là một quan hệ

hai ngôi mờ và v là một giá tr tập mờ

3 x.A 1 x.A2, trong đó x  X, A1 và A2 là

hai thuộc tính phân biệt trong R

4 E nếu E là một điều kiện chọn mờ

5 E1  E2 nếu E1 và E2 là các điều kiện chọn mờ trên cùng một biến quan hệ

6 E1  E2 nếu E1 và E2 là các điều kiện chọn mờ trên cùng một biến quan hệ

Ba dạng đầu của điều kiện chọn mờ

được gọi là các ều k sở

(atomic selection condition) Ba dạng sau của điều kiện chọn mờ được suy dẫn từ các dạng cơ sở bằng đệ quy Chúng tôi lưu ý có thể coi mỗi giá trị rõ, chính xác cũng là một giá trị tập mờ với hàm thành viên của

nó bằng 1

Ví dụ 4.1.1 Với lược đồ quan hệ PATIENT trong CSDL các bệnh nhân ở

Ví dụ 3.2.3, một số điều kiện chọn mờ có

thể như sau (x là biến bộ):

1 Tìm những bệnh nhân trẻ tuổi (young)

Yêu cầu này có thể được biểu diễn bởi

điều kiện chọn cơ sở x.AGE 

young

2 Tìm tất cả bệnh nhân trẻ tuổi và có tiền sử bệnh viêm gan (hepatitis) Yêu

Trang 7

cầu này có thể được biểu diễn bởi điều

kiện chọn x.AGE  young

3 Tìm tất cả bệnh nhân cao tuổi (old)

hoặc có cân nặng dưới 50 kg Yêu cầu

này có thể được biểu diễn bởi điều

kiện chọn x.AGE  old  x.WEIGHT

 50

Định nghĩa 4.1.2 Giả sử R(U, ) là một

lược đồ quan hệ FRDB, r là một quan hệ

trên R, x là một biến bộ quan hệ và t là một

bộ trong r Di n d ch (interpretation) của

các điều kiện chọn mờ theo R, r và t, được

biểu thị bởi int R,r,t, là một ánh xạ bộ phận

từ tập tất cả các điều kiện chọn mờ đến

khoảng [0, 1] và được định nghĩa đệ qui

như sau:

1 int R,r,t (x.A  v) = r (t) nếu t.A  v và

int R,r,t (x.A  v) = 0 nếu ngược lại

2 int R,r,t (x.A v) = min(r (t), (t)), với

 = t.A  v

3 int R,r,t (x.A 1 x.A2) = r (t) nếu t.A1  t.A2

và int R,r,t (x.A 1 x.A2) = 0 nếu ngược lại

4 int R,r,t(E) = 1 − int R,r,t (E)

5 int R,r,t (E1  E2) = min(int R,r,t (E1),

int R,r,t (E2))

6 int R,r,t (E1  E2) = max(int R,r,t (E1),

int R,r,t (E2))

Chúng tôi lưu ý rằng, v là một tập mờ

trong t.A  v nên  = t.A  v là một quan

hệ mờ Vì vậy  cũng là một tập mờ Cụ

thể  là tập mờ mà hàm thành viên của nó

có đối số là các bộ t của R Với mỗi t  R,

(t) = v(t.A)

Về trực giác, int R,r,t (x.A  v) và int R,r,t (x.A

 v) tương ứng cho biết mức độ thỏa mãn

các điều kiện (quan hệ) t.A  v và t.A  v

(ở đây v là tập mờ) của bộ t trong r còn

int R,r,t (x.A 1  x.A2) cho biết mức độ thỏa

mãn điều kiện t.A1 t.A2 của bộ t trong r

Ví dụ 4.1.2 Giả sử các tập mờ young,

middle_aged, old tương ứng biểu diễn tuổi

ẻ, trung niên và của các bệnh nhân

với các hàm thành viên như dưới đây:



























35 0

), 35 , 20 ( 15 / ) 35 (

] 20 , 0 [ 1

x

x x

x young

































) 60 , 20 ( 0

) 60 , 45 [ 15 / ) 60 (

) 45 , 35 [ 1

) 35 , 20 [ 15 / ) 20 ( _

x

x x

x

x x

aged middle



























] 120 , 45 [ 0

] 120 , 60 [ 1

) 60 , 45 [ 15 / ) 60 (

x x

old

Thì diễn dịch của các điều kiện chọn mờ E1

= “x.AGE  young” và E2= “x.AGE 

hepatitis” theo quan hệ r = PATIENT trong

CSDL các bệnh nhân ở Ví dụ 3.2.3 được tính toán như trong Bảng 5.2.1 Lưu ý rằng,

để tiện theo dõi kết quả tính toán, các bộ trong quan hệ PATIENT được đánh số theo thứ tự xuất hiện của chúng trong Bảng 4.1.1

Trang 8

Bảng 4.1.1 Di n dịch biểu thức chọn mờ trên uan hệ PATIENT

t3 min(1.0, 0.93) = 0.93 min(min(1.0, 0.93), 1.0 ) = 0.93

Bây giờ, phép chọn trong FRDB được

mở rộng từ phép chọn trong CSDL quan hệ

truyền thống như sau

Định nghĩa 4.1.3 Giả sử R(U, ) là một

lược đồ quan hệ mờ FRDB, r là một quan

hệ trên R và  là một điều kiện chọn trên

biến bộ x Phép ch n trên r theo , được ký

hiệu (r), là một quan hệ mờ trên R,

bao gồm tất cả các bộ t được định nghĩa

bởi:

r’=t  r | int R,r,t() 0 r’ (t)=int R,r,t()

Một cách đơn giản hơn, (r) = {t  r |

int R,r,t() 0}

Ví dụ 4.1.3 Xét quan hệ r = PATIENT

trong cơ sở dữ liệu các bệnh nhân ở Ví dụ 3.2.3, truy vấn “Tìm tất cả bệnh nhân trẻ và

có tiền sử bệnh viêm gan” có thể được thực

hiện bởi phép chọn = (PATIENT) với

x.MEDICAL_HISTORY= hepatitis”

Phép chọn được thực hiện bằng cách kiểm tra sự thỏa mãn của tất cả các bộ trong PATIENT đối với điều kiện chọn 

Từ Ví dụ 4.1.2 ta dễ dàng thấy chỉ có bộ t3 thỏa mãn  với giá trị hàm thành viên là 0.93 Vì vậy kết quả phép chọn là quan hệ

r’ như trong Bảng 4.1.2

Bảng 4.1.2 Quan hệ r’= (PATIENT)

4.2 Phép hợp, giao và tr

Sử dụng các phép toán trên các tập hợp

mờ trong Định nghĩa 2.3.1 chúng tôi mở

rộng các phép toán hợp, giao và trừ các

quan hệ trong CSDL truyền thống thành

các phép toán hợp, giao và trừ các quan hệ

trong FRDB như các định nghĩa dưới đây

Định nghĩa 4.2.1 Giả sử r và s là hai quan

hệ mờ trên cùng một lược đồ R(U,) Phép

hợp (union) của hai quan hệ

r và s, kí hiệu là r  s, là một quan hệ mờ trên R bao gồm các bộ t được định nghĩa

bởi

r  s = {t | rs (t)=max(r (t), s (t))}

Ví dụ 4.2.1 Giả sử hai quan hệ

DIAGNOSE1 và DIAGNOSE2 trên lược đồ quan hệ DIAGNOSE(PATIENT_ID,

DISEASE, COST, ) như trong các Bảng 4.2.1, 4.2.2 Khi đó hợp của chúng là quan

hệ DIAGNOSE được tính toán như trong

Bảng 4.2.3

Trang 9

Bảng 4.2.1: Quan hệ DIAGNOSE1

hệ trên cùng một lược đồ R(U, ) Phép

giao (intersection) của hai quan hệ r và s,

kí hiệu là r  s, là một quan hệ trên R bao

gồm các bộ t được định nghĩa bởi

r  s = {t | rs (t) = min(r (t), s (t))}

hệ mờ trên cùng một lược đồ R(U,) Phép

trừ (difference) của quan hệ r cho s, kí hiệu

là r – s, là một quan hệ trên R bao gồm các

bộ t được định nghĩa bởi

r–s = {t | r s (t) = min(r (t), 1-s (t))}

4.3 n c ất của c c p ép t n đại s

Như đã thấy ở các phần trên, mô hình

FRDB được mở rộng từ mô hình CSDL

quan hệ truyền thống cả về biểu diễn dữ

liệu và các phép toán đại số quan hệ Hệ

quả logic là các tính chất của các phép toán

đại số trong FRDB cũng được mở rộng từ

các tính chất của các phép toán đại số quan

hệ truyền thống

Sau đây là các định lý về các tính chất của các phép toán đại số trên FRDB được chúng tôi mở rộng từ các tính chất của các phép toán đại số quan hệ truyền thống

Định lý 4.3.1 Giả sử r là một quan hệ mờ

trên lược đồ R(U, ) trong FRDB Gọi 1

và 2 là hai điều kiện chọn Khi đó 1(2(r)) = 2(1(r)) = 12(r) (1)

Với giả thiết trong 12(r) các điều

kiện chọn 1 và 2 là có cùng một biến bộ

Chứng minh Đặt s = 2(r), ta có

1(2(r))=ts  int R,s,t(1)0

(Định nghĩa 4.1.3) =tr int R,r,t(2)0 int R,s,t(1)0}

=tr int R,r,t(2)0  int R,r,t(1)0)

(dosr)

=trmin(int R,r,t(2), int R,r,t(1))0)

(Định nghĩa 4.1.2)

Trang 10

=trint R,r,t(21)> 0) = 12(r)

Từ đó hệ thức 1(2(r)) = 1 2(r)

được chứng minh Hệ thức 2(1(r)) =

2 1(r) được chứng minh tương tự Vì 1

 2  2 1 (phép hội trên tập các điều

kiện chọn mờ cũng như trên mệnh đề có

tính giao hoán), nên 1  2(r) = 21(r)

Từ đó suy ra hệ thức 1(2(r)) =

2(1(r)) và do đó 1(2(r)) =

2(1(r)) = 12(r)

Định lý 4.3.2 Nếu r1, r2 và r3 là các quan

hệ mờ trên cùng một lược đồ R(U, ) thì

r1 r2 =r2 r1 (2)

(r1 r2) r3 = r1 (r2r3) (3)

r1 r2 =r2 r1 (4)

(r1 r2) r3 = r1 (r2r3) (5)

Chứng minh Các hệ thức trong định lý

này được chứng minh như sau:

Do các phép toán giao và hợp các tập

hợp, phép lấy min và max có tính giao hoán

và kết hợp nên từ các Định nghĩa 4.2.1 và

4.2.2 ta suy các hệ thức (2), (3), (4) và ( )

KẾT LUẬN Trong bài báo này, chúng tôi đã giới thiệu một mô hình cơ sở dữ liệu quan hệ

mờ, được gọi là FRDB, cùng với các phép toán đại số cơ bản như chọn, hợp, giao và trừ để cho phép thao tác và truy vấn thông tin không rõ ràng, không chính xác Mỗi quan hệ FRDB là một tập mờ với mức độ

thành viên bộ trong khoảng [0,1], các uy

ấ ề (soft query) có thể được thực hiện

bằng cách sử dụng các điều kiện chọn kết hợp với các giá trị tập mờ Một số các tính chất của các phép toán đại số trên FRDB cũng được đề nghị và chứng minh

Trong các bước tiếp theo, chúng tôi

sẽ xây dựng các phép toán đại số khác như

phép u (projection), phép tích Descartes và phép k (join) các quan hệ để

hoàn thiện mô hình FRDB Ngoài ra, việc phát triển một hệ quản trị cho FRDB với ngôn ngữ thao tác và truy vấn tựa SQL để

hỗ trợ ườ sử d ầu u (end-user)

cũng là một nghiên cứu có nhiều ý nghĩa

TÀI LIỆU THAM KHẢO

1 Dubois, D., and Prade, (2009) H Using fuzzy sets in flexible querying: why and how?

In Proceedings of the workshop on flexible query-answering systems (FQAS’1 ), Denmark, 89-103

2 Codd, E.F (1970) A Relational model of data for large shared data banks

Communications of the ACM, 13(6), 377-387

3 Cubero, J.C., Medina, J.M., Pons, O., and Vila, M.A (1999) Data summarization in

relational databases through fuzzy dependencies International Journal of Information

Sciences, 121, 22-43

4 Chakraborty, S (2012) Codd s e o d ode d fuzzy o :

approach to find the computer solution International Journal of Advanced Technology

& Engineering Research (IJATER), 2(4), 21-27

Định dạng
Số trang	11
Dung lượng	627,08 KB