1. Trang chủ
  2. » Luận Văn - Báo Cáo

Cơ sở dữ liệu hướng đối tượng với thông tin ngôn ngữ mờ (tóm tắt + toàn văn)

34 648 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Cơ sở dữ liệu hướng đối tượng với thông tin ngôn ngữ mờ
Tác giả Đoàn Văn Thắng
Người hướng dẫn PGS.TS Đoàn Văn Ban, PGS.TS Trương Cụng Tuấn
Trường học Viện Hàn Lâm Khoa Học Và Công Nghệ Việt Nam
Chuyên ngành Bảo đảm toán học cho máy tính và hệ thống tính toán
Thể loại Luận án tiến sĩ
Năm xuất bản 2014
Thành phố Hà Nội
Định dạng
Số trang 34
Dung lượng 0,9 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Nhờ những ưu điểm của cấu trúc đại số gia tử [4,5][18,32], chúng tôi đã đưa ra và nghiên cứu CSDL HĐT với thông tin mờ và không chắc chắn dựa trên cách tiếp cận ngữ nghĩa định lượng của

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ

CÔNG NGHỆ VIỆT NAM VIỆN CÔNG NGHỆ THÔNG TIN

TÓM TẮT LUẬN ÁN TIẾN SĨ TOÁN HỌC

Người hướng dẫn khoa học:

2 PGS.TS Trương Công Tuấn

HÀ NỘI – 2014

Trang 2

LỜI NÓI ĐẦU

Như chúng ta đã biết, mô hình hướng đối tượng truyền thống đã chứng

tỏ nhiều ưu điểm trong các vấn đề mô hình hóa, thiết kế và hiện thực các hệ thống lớn, từ phần mềm cho đến CSDL Đó là nhờ mô hình này có khả năng biểu diễn trạng thái và hành vi của các đối tượng cũng như sự phân cấp, phân loại và quan hệ giữa chúng trong các ứng dụng thực tế Hơn nữa,

mô hình hướng đối tượng còn giúp tối ưu dữ liệu và tái sử dụng mã khi xây dựng hệ thống thông qua cơ chế thừa kế thông tin giữa các lớp đối tượng Tuy nhiên, trong mô hình hướng đối tượng truyền thống các mối quan hệ cũng như trạng thái và hành vi của các đối tượng luôn luôn được thể hiện một cách chắc chắn và chính xác Điều này không hoàn toàn phù hợp với thực tế, bởi thông tin về các đối tượng trong thế giới thực có thể mơ hồ, không chắc chắn, không đầy đủ

Hệ quả là các ứng dụng dựa trên mô hình CSDL hướng đối tượng truyền thống không biểu diễn được các đối tượng ma thông tin về chúng không được xác định một cách chắc chắn và chính xác Chẳng hạn, các ứng

dụng mô hình CSDL truyền thống không thể trả lời các truy vấn như “tìm tất cả những bệnh nhân trẻ có tiền sử bệnh viêm thanh quản”; hoặc “tìm tất

cả các gói bưu kiện có thể tích khoảng 25000 cm 3 ”… trong đó trẻ và khoảng 25000 là những khái niệm và giá trị không chính xác Để khắc phục

được các hạn chế như vậy, các nghiên cứu gần đây đã tập trung nghiên cứu

mô hình CSDL HĐT có khả năng biểu diễn và xử lý được các đối tượng mà các thông tin về chúng có thể không chắc chắn và không chính xác

Trên tinh thần đó, trong những năm qua đã có nhiều công trình nghiên cứu để giải quyết các vấn đề này với các hướng tiếp cận khác nhau, chẳng hạn theo tiếp cận quan hệ tương tự, tiếp cận lý thuyết khả năng, tiếp cận lý thuyết xác suất và đã có được những kết quả [22, 24, 38, 40] Tuy nhiên, Trở ngại lớn nhất trọng việc phát triển các hệ thống CSDL HĐT (rõ) mờ đó

là chưa có một mô hình dữ liệu chuẩn hay cơ sở toán học thống nhất cho việc biểu diễn và xử lý dữ liệu đối tượng mờ Cho đến nay, các nghiên cứu

về mô hình CSDL hướng đối tượng mờ chủ yếu tập trung vào việc mở rộng

mô hình dữ liệu rõ đã có theo nhiều cách tiếp cận khác nhau và cho phép biểu diễn, thao tác trên dữ liệu mờ Do đó, các mô hình CSDL HĐT mờ này chỉ thống nhất trên một tập các khái niệm chung nhất trong mô hình của ODMG Có thể thấy rằng, các kết quả nghiên cứu trên CSDL HĐT mờ

Trang 3

2 luôn được xem xét với một mô hình cụ thể, các kết quả này sẽ giải quyết cho một lớp các bài toán với một tập con các khái niệm, tính chất đặc trưng hướng đối tượng Như vậy, việc chọn lựa một mô hình dữ liệu để nghiên cứu các vấn đề trong CSDL HĐT mờ là rất quan trọng

Nguyễn Cát Hồ và Wechler [27, 28] đề xuất mô hình đại số gia tử, trong mô hình này giá trị tập mờ của mỗi thuộc tính được biểu diễn bởi một nhãn ngôn ngữ Tuy nhiên, các giá trị thuộc tính như vậy không được diễn dịch bởi hàm thành viên mà ngữ nghĩa của nó được xác định bởi đại số gia

tử trên miền trị của thuộc tính tương ứng Nhờ những ưu điểm của cấu trúc đại số gia tử [4,5][18,32], chúng tôi đã đưa ra và nghiên cứu CSDL HĐT với thông tin mờ và không chắc chắn dựa trên cách tiếp cận ngữ nghĩa định lượng của đại số gia tử, trong đó ngữ nghĩa ngôn ngữ được lượng hóa bằng các ánh xạ định lượng của đại số gia tử Theo cách tiếp cận này, giá trị ngôn ngữ là dữ liệu, không phải là nhãn của các tập mờ biểu diễn ngữ nghĩa của giá trị ngôn ngữ và ưu điểm cơ bản của nó là việc cho phép tìm kiếm, xác định ngữ nghĩa của thông tin không chắc chắn chỉ bằng các thao tác dữ liệu kinh điển thường dùng và do đó đảm bảo tính thuần nhất của kiểu dữ liệu trong xử lý ngữ nghĩa của chúng Ngoài ra, theo cách tiếp cận ngữ nghĩa định lượng của đại số gia tử, ngữ nghĩa ngôn ngữ có thể biểu thị bằng một lân cận các khoảng được xác định bởi độ đo tính mờ của các giá trị ngôn ngữ của một thuộc tính với vai trò là biến ngôn ngữ Ví dụ, ngữ nghĩa

của giá trị ngôn ngữ rất cao của thuộc tính “lương nhân viên” sẽ được biểu thị bằng những khoảng lân cận của giá trị đại diện của giá trị ngôn ngữ rất cao thông qua ánh xạ định lượng của đại số gia tử của thuộc tính “lương

nhân viên”

Các kết quả chính của luận án được báo cáo và thảo luận tại các hội nghị, hội thảo khoa học: Hội thảo quốc gia “Một số vấn đề chọn lọc về công nghệ thông tin và truyền thông” tại Cần thơ 2011, Hà Nội 2012 The Fourth International Conference on Knowledge and Systems Engineering, KSE12, Da Nang - Viet Nam, 08/2012 Hội nghị khoa học FAIR tại Huế

2013, Thái Nguyên 2014

Chương 1 - Tổng Quan Về Cơ Sở Dữ Liệu Hướng Đối Tượng Mờ

Trong chương này, chúng tôi trình bày một cách ngắn ngọn các khái niệm của đại số gia tử, đại số gia tử tuyến tính đầy đủ, các mệnh đề, định lý

Trang 4

liên quan làm cơ sở nghiên cứu mô hình CSDL hướng đối tượng với thông tin mờ và không chắc chắn

1.1 Thông tin không đầy đủ trong mô hình CSDL

Trong các hệ thống CSDL, chúng ta luôn quan tâm đến ba loại thông tin không hoàn hảo sau [1]: (1) thông tin sai lệch: là loại thông tin không hoàn hảo đơn giản nhất Thông tin của cơ sở dữ liệu là sai lệch khi nó khác với “thông tin thực”; (2) thông tin không chính xác: là không chính xác khi

nó biểu diễn một tập các giá trị có thể, và giá trị thực là một phần tử của tập đó; (3) thông tin không chắc chắn: là loại thông tin với độ chắc chắn nhất định không phải là thông tin sai lệch và không làm ảnh hưởng tới tính nhất quán của CSDL

1.2 Tập mờ

Lý thuyết tập mờ được Zadeh đề xuất năm 1965 bằng cách mở rộng khái niệm tập cổ điển, với ý tưởng đầu tiên là giúp biểu diễn và đo ngữ nghĩa các khái niệm không chính xác, mơ hồ trong thực tế Lý thuyết tập

mờ là cơ sở toán học được ứng dụng rộng rãi trong thực tế nói chung và khoa học kỹ thuật nói riêng, đặc biệt là khoa học máy tính, khi xây dựng các hệ thống tính toán biết phân tích, xử lý và ra quyết định thông minh

1.2.1 Tập mờ

Trước hết chúng ta xuất phát từ tập hợp kinh điển Cho U là một tập hợp và F là một tập con của U Nếu một phần tử x thuộc F, ký hiệu x  F, ngược lại x  F Như vậy, để mô tả khái niệm “thuộc” ta sử dụng hàm

thuộc μF:

1 if ( )

F

Có nghĩa là: F{( ,xF( )) |x x U ,F:U[0,1]}

Trang 5

4 Tập mờ được biểu diễn dưới dạng:

1

( ) ( ) / ( ) /

n

F i

i i

 Nếu U không hữu hạn

Ví dụ 1.1 Xét tập U gồm 5 người là x 1 , x 2 ,…, x 5 tương ứng có tuổi là 10,

15, 50, 55, 70 và F là tập hợp các người “Trẻ” Khi đó ta có thể xây dựng

hàm thuộc như sau: μTrẻ(10) = 0.95, μTrẻ(15) = 0.75, μTrẻ(50) = 0.35, μTrẻ(55)

b a neu b x c

d x neu c x d

Định nghĩa 1.4.[1] Cho F là tập mờ trên tập vũ trụ U

(1): Giá đỡ (Support) SF của tập mờ F là tập các phần tử có giá trị hàm

thuộc lớn hơn 0 Có nghĩa là SF = {x  U | μF(x)> 0}

(2): Lõi (Core) CF của tập mờ F là tập các phần tử có giá trị hàm thuộc

Tương tự như lý thuyết tập hợp, trên các tập mờ cũng định nghĩa một

số phép toán: bằng nhau, bao nhau, giao, hợp là sự mở rộng các định nghĩa trên lý thuyết tập hợp

Trang 6

Định nghĩa 1.5 [1] Cho F và F1 là hai tập mờ trên U

1.2.3 Tổng quát hoá ba phép toán cơ bản trên tập mờ

Ngoài ba phép toán cơ bản min, max và phần bù được dùng thao tác trên các tập mờ, để tổng quát hơn có thể định nghĩa họ các toán tử T là t- norm, t-conorm và N-Negation cho các phép toán trên

Định nghĩa 1.7 [1] Hàm T: [0,1] x [0,1] → [0,1] được gọi là t-norm khi và

chỉ khi thoả mãn ∀ x,y,z ∈ [0, l]:

(1) T(x,y) = T(y,x)

(2) T(x,y) ≤ T(x,z), ∀ y ≤ z

(3) T(x,T(y,z)) = T(T(x,y),z)

(4) T(x,1) = 1

Định nghĩa 1.8 [1] Hàm S: [0,1] x [0,1] → [0,1] được gọi là t-conorm khi

và chỉ khi thoả mãn ∀ x,y,z ∈ [0, l]:

(1) S(x,y) = S(y,x)

(2) S(x,y) ≤ S(x,z), ∀ y ≤ z

(3) S(x,S(y,z)) = S(S(x,y),z)

(4) S(x,0) = 0

Định nghĩa 1.9 [1] Hàm N: [0,1] → [0,1] được gọi là hàm phủ định khi và

chỉ khi N thoả mãn ∀x,y ∈ [0, l]:

(1) N(0) = 1, N(1) = 0

(2) N(x) ≤ N(y), ∀y ≤ x

Trang 7

6 Theo định nghĩa, tập các tập mờ là không gian F(U, [0,1]) các hàm từ U vào đoạn [0,1], một không gian tương đối giàu về cấu trúc tính toán Việc xây dựng hàm thuộc của các tập mờ dựa trên ngữ nghĩa của các khái niệm mờ Ngược lại, một lớp các khái niệm mờ có thể được mô hình hoá ngữ nghĩa qua các tập mờ Trên cơ sở mối quan hệ này, L.A.Zadeh đã đưa ra khái niệm mới đó là biến ngôn ngữ

1.2.4 Biến ngôn ngữ

Trong [50] L.A.Zadeh đã viết “khi thiếu hụt tính chính xác bề ngoài của những vấn đề phức tạp một cách tự nhiên là tìm cách sử dụng các biến ngôn ngữ, đó là các biến mà giá trị của chủng không phải là số mà là các

từ hoặc các câu trong ngôn ngữ tự nhiên hoặc nhân tạo Động lực cho việc

sử dụng các từ, các câu hơn các số là đặc trưng ngôn ngữ của các từ, các câu thường là ít xác định hơn của số”

Nói tóm lại, ý trên đây đã khái quát cho khái niệm biến ngôn ngữ Một cách hình thức biến ngôn ngữ được định nghĩa như sau

Định nghĩa 1.10 [50] Biến ngôn ngữ là một bộ năm (X, T(X), U, R, M),

trong đó X là tên biến, T(X) là tập các giá trị ngôn ngữ của biến X, U là không gian tham chiếu của biến cơ sở u, mỗi giá trị ngôn ngữ xem như là một biến mờ trên U kết hợp với biến cơ sở u, R là một qui tắc cú pháp sinh các giá trị ngôn ngữ của T(X), M là qui tắc ngữ nghĩa gán mỗi giá trị ngôn ngữ trong T(X) với một tập mờ trên U

Ví dụ 1.2 [50] Cho X là biến ngôn ngữ có tên là AGE, biến cơ sở u lấy

theo số tuổi của con người có miền xác định là U = [0,100] Tập các giá trị ngôn ngữ T(AGE) = {old, very old, more or less young, less young, very young …} là một qui tắc sinh các giá trị này M gán ngữ nghĩa mỗi tập mờ với một giá trị ngôn ngữ Chẳng hạn, đối với giá trị nguyên thủy old, M(old) ={µ,µold(u)|u∈[0,100]}, ở đây chọn

Cho một ĐSGT tuyến tính đầy đủ AX = (X, G, H, , , ≤), trong đó

Dom(X) = X là miền các giá trị ngôn ngữ của thuộc tính ngôn ngữ X được sinh tự do từ tập các phần tử sinh G = {1, c +

, W, c, 0} bằng việc tác động

tự do các phép toán một ngôi trong tập H,  là hai phép tính với ngữ

Trang 8

nghĩa là cận trên đúng và cận dưới đúng của tập H(x), tức là x = supremum H(x) and x = infimum H(x), trong đó H(x) là tập các phần tử sinh ra từ x, còn quan hệ là quan hệ sắp thứ tự tuyến tính trên X cảm sinh

từ ngữ nghĩa của ngôn ngữ

Cho tập các gia tử H = HH + , trong đó H +

= {h 1 , , h p } và H - = {h

-1 , , h -q }, với h 1 < < h p , h -1 < < h -q , và p, q >1 Ký hiệu fm: X [0,1] là

độ đo tính mờ của ĐSGT AX Khi đó ta có mệnh đề sau:

Mệnh đề 1.2 [8] Độ đo tính mờ fm và độ đo tính mờ của gia tử (h), h

được gọi là PN-dấu và được định nghĩa đệ quy như sau:

Định nghĩa 1.13 [32] (hàm PN-dấu Sgn): Sgn : X {-1, 0, 1} là hàm dấu được xác định như sau, ở đây h, h H, và c {c, c + }:

(1) Sgn(c) = 1, Sgn(c + ) = +1

(2) Sgn(h'hx) = 0 , nếu h’hx = hx, còn ngược lại ta có

Sgn(h'hx) = Sgn(hx), nếu h’hx hx và h' là âm tính đối với h (hoặc c, nếu h = I và x = c)

Sgn(h'hx) = +Sgn(hx), nếu h’hx hx và h' dương tính đối với h (hoặc c, nếu h = I và x = c)

Mệnh đề 1.1 [32] Với x X, ta có: h H, nếu Sgn(hx)= +1 thì hx > x, nếu Sgn(hx) = 1 thì hx < x và nếu Sgn(hx)= 0 thì hx = x

Từ các tính chất của tính mờ và hàm PN-dấu, ánh xạ ngữ nghĩa định

lượng của ĐSGT được định nghĩa như sau:

Định nghĩa 1.15 [33] Giả sử AX = (X, G, H, , , ) là một ĐSGT đầy

đủ, tuyến tính và tự do, fm(x) và (h) tương ứng là các độ đo tính mờ của ngôn ngữ và của gia tử h thỏa mãn các tính chất trong mệnh đề 2.1 Khi đó,

ta nói là ánh xạ cảm sinh bởi độ đo tính mờ fm của ngôn ngữ nếu nó

được xác định như sau:

Trang 9

8

(1) (W) = = fm(c), (c) =  - fm(c) = fm(c), (c +) =  +fm(c +) (2)

Nghĩa là u, v  X, u k v k  Pk: I(u) k

Xk là tập tất cả các phần tử độ dài k Dựa vào khoảng mờ mức k và mức

k+1 các tác giả [5,10] đã xây dựng một phân hoạch của miền [0,1] như sau: (1) Độ tương tự mức 1: Với k = 1, các khoảng mờ mức 1 gồm I(c) và

I(c + ) Các khoảng mờ mức 2 trên khoảng I(c +

) là I(h -q c + ) ≤ I(h -q+1 c +) ≤

I(h -2 c + ) ≤ I(h-1 c +) ≤ A (c + ) ≤ I(h1 c + ) ≤ I(h 2 c + ) ≤ ≤ I(h p-1 c + ) ≤ I(h p c +) Khi

đó, ta xây dựng phân hoạch về độ tương tự mức 1 gồm các lớp tương

đương sau: S(0) =I(h p c); S(c)=I(c) \ [I(h -q c)  I(h p c)]; S(W) = I(h -q c) 

I(h -q c + ); S(c + ) = I(c + ) \ [I(h -q c +)  I(h p c + )] và S(1) = I(h p c +)

Ta thấy, trừ hai điểm đầu mút A (0) = 0 và A (1) = 1, các giá trị đại

diện A (c), A (W) và A (c +) đều là điểm trong tương ứng của các lớp

tương tự mức 1 S(c), S(W) và S(c +)

(2) Độ tương tự mức 2: với k = 2, các khoảng mờ mức 2, chẳng hạn, trên một khoảng mờ mức 2, chẳng hạn, I(h i c +) = (A(h i c + ), A(h i c +)] với hai

khoảng mờ kề là I(h i-1 c + ) và I(h i+1 c +), các lớp tương đương dạng sau:

S(h i c + ) = I(h i c + ) \ [I(h p h i c +)  I(h -q h i c + )], S(h i c + ) = I(h -q h i-1 c +)  I(h -q h i c +)

và S(h i c + ) = I(h p h i c +)  I(h p h i c + ), với i sao cho -q i p và i  0

Bằng cách tương tự như vậy, có thể xây dựng các phân hoạch các lớp

tương tự mức k bất kỳ Tuy nhiên, trong thực tế ứng dụng theo [6] thì k  4,

Trang 10

tức có tối đa 4 gia tử tác động liên tiếp lên phần tử nguyên thủy c và c +

Các giá trị rõ và các giá trị mờ gọi là có độ tương tự mức k nếu các giá trị đại diện của chúng cùng nằm trong một lớp tương tự mức k

mức k là các khoảng S(x1), S(x2), …, S(xm) Khi đó, mỗi giá trị ngôn ngữ fu chỉ và chỉ thuộc về một lớp tương tự, chẳng hạn đó là S(xi) nó gọi là lân cận

mức k của fu và ký hiệu là FNk(fu)

1.4 Mô hình CSDL hướng đối tượng mờ

Các nghiên cứu mở rộng trên mô hình CSDL HĐT mờ dựa trên mô hình CSDL HĐT truyền thống tập trung vào các vấn đề sau [19][23][24][25][52]:

1 Biểu diễn giá trị thuộc tính không chắc chắn hoặc không chính xác của các đối tượng

2 Biểu diễn và thực thi các phương thức lớp

3 Mô hình hóa khả năng áp dụng không chắc chắn của các tính chất (thuộc tính hoặc phương thức) lớp

4 Mô hình hóa các quan hệ lớp và định nghĩa mức độ thành viên không chắc chắn của các đối tượng

5 Xác định cơ chế thừa kế không chắc chắn của các đối tượng

1.4.1 Đối tượng mờ

Các đối tượng được dùng để đặc tả các thực thể trong thế giới thực hoặc các khái niệm trừu tượng Mỗi đối tượng lưu trữ trong các được hệ thống CSDL HĐT cung cấp một định danh duy nhất Định danh này do hệ thống tự động tạo và được gọi là định danh đối tượng (OID Ngoài ra, các đối tượng này chứa một tập nhất định các thông tin về đối tượng và các hành vi dựa trên các thông tin đó Thông tin về đối tượng được gọi là thuộc tính đối tượng và được xác định bởi các giá trị cụ thể, giá trị này có thể là giá trị rõ hoặc vì một lý do nào đó mà ta không xác định được giá trị chính xác của nó Chẳng hạn, thuộc tính tuổi của một đối tượng được cho là

“khoảng 18”, hoặc có thể là một giá trị ngôn ngữ “rất trẻ”… Những thông

tin không chính xác, không rõ ràng như vậy gọi là thông tin mờ Như vậy, một đối tượng là mờ vì có một hoặc nhiều thuộc tính có chứa thông tin mờ (gọi là thuộc tính mờ)

1.4.2 Lớp mờ

Một lớp đươc xem là mờ bởi các lý do sau [23]:

Trang 11

10

- Thứ nhất, một số đối tượng của một lớp được xác định là đối tượng mờ

- Thứ hai, khi một lớp được định nghĩa, miền trị của một thuộc tính nào

đó có thể là mờ và như vậy một lớp mờ được hình thành

- Thứ ba, một lớp con được thừa kế một hoặc nhiều lớp cha, trong đó

1.4.4 Phương thức

Thuộc tính và phương thức đối tượng, là một trong những khái niệm trung tâm của mô hình CSDL HĐT truyền thống Trong mô hình CSDL HĐT mờ, các giá trị thuộc tính là các giá trị không chính xác hoặc mờ, trong khi đó phương thức được biểu diễn như một hàm thao tác trên các giá trị thuộc tính này Chính vì vậy, phương thức xác định các đối tượng lớp này cũng trở nên mơ hồ và không chắc chắn

Cho C là một lớp với các thuộc tính {a1, a2, ,an} và ký hiệu Attr(C), và Attr’(C) là tập thuộc tính có được từ việc xây dựng mức phân hoạch cho các thuộc tính trong Attr(C) Và với những tính chất của giá trị thuộc tính

đã nêu ở trên, vậy miền giá trị của thuộc tính kinh điển của ai là dom(ai) = Cdom(ai), miền giá trị thuộc tính mờ aj là dom(aj) = Cdom(aj) Fdom(aj) o

là một đối tượng trên tập thuộc tính {a1, a2, ,an}, và o.ai biểu thị giá trị

thuộc tính của o trên thuộc tính ai

1.4.5 Quan hệ lớp đối tượng mờ

Trong mô hình CSDL HĐT mờ, bốn trường hợp sau đây có thể được dùng để phân biệt cho các quan hệ lớp đối tượng mờ [23]: (1) Lớp rõ và đối

Trang 12

tượng rõ; (2) Lớp rõ và đối tượng mờ; (3) Lớp mờ và đối tượng rõ: Giống như trường hợp ở (2); (4) Lớp mờ và đối tượng mờ: Trong trường hợp này, đối tượng thuộc về lớp với mức độ thuộc k

Các mối quan hệ lớp đối tượng trong (2), (3), và (4) trên đây được gọi

là quan hệ lớp đối tượng mờ Trong thực tế, trường hợp (1) có thể được xem như là trường hợp đặc biệt của mối quan hệ lớp đối tượng mờ, với độ thuộc vào lớp là 1

1.4.6 Quan hệ kế thừa mờ

Sự thừa kế là một trong những khái niệm trung tâm của mô hình CSDL HĐT Thừa kế là cơ chế cho phép một lớp được áp dụng các tính chất của lớp cha của nó, phản ánh một đặc trưng vốn có trong quan hệ giữa các đối tượng thực tế

Trong CSDL HĐT mờ, các lớp có thể là mờ hoặc rõ Ba dạng cơ bản của quan hệ kế thừa mờ trong mô hình này đó là [23]: (1) Lớp cha rõ và lớp con rõ; (2) Lớp cha rõ và lớp con mờ; (3) Lớp cha mờ và lớp con mờ Trong đó, trường hợp 1 giống như trong các CSDL HĐT truyền thống, nghĩa là các lớp có thể có hoặc không có sự kế thừa một cách chắc chắn Trường hợp 2, 3 được gọi là quan hệ kế thừa mờ, nghĩa là hai lớp có sự kế thừa với mức độ thuộc k

1.4.7 Mô hình lớp đối tượng mờ và một số phép toán

1.4.7.1 Chuyển các giá trị thuộc tính về giá trị khoảng [a, b]

Trong phần này, trình bày phương pháp biến đổi các giá trị này về các khoảng [a, b] tương ứng Đây là phương pháp biểu diễn một cách thống

nhất các dạng dữ liệu, nhằm thuận tiện cho việc đánh giá quan hệ gần nhau

giữa chúng Phương pháp chuyển về giá trị khoảng được thực hiện như sau:

- Giá trị thuộc tính là giá trị số: (1) Nếu giá trị thuộc tính là a thì chuyển

thành [a, a]; (2) Nếu giá trị thuộc tính là vào khoảng a thì chuyển thành [a -

, a + ], với  là bán kính với tâm a; (3) Nếu giá trị thuộc tính là a đến b thì

chuyển thành [a, b]

- Giá trị thuộc tính là giá trị ngôn ngữ: Thuộc tính của đối tượng được xem như là thuộc tính ngôn ngữ và được biểu diễn theo cấu trúc ĐSGT Xây dựng phân hoạch các lớp tương tự mức k và từ đó xác định được khoảng giá trị tương ứng cho giá trị thuộc tính này

1.4.7.2 Định nghĩa lớp mờ

Trang 13

12 Các lớp trong CSDL HĐT mờ có thể mờ Về mặt hình thức, định nghĩa của một lớp mờ được thể hiện như sau:

1.4 Ngôn ngữ truy vấn dữ liệu

Trong CSDL mờ, các điều kiện được sử dụng khi truy vấn dữ liệu gọi

là điều kiện mờ Có thể phân tích các thành phần chính trong một điều kiện

mờ được biểu diễn bởi ngữ nghĩa của đại số gia tử như sau:

- Vị từ nguyên tố (atomic predicate): là ánh xạ từ tập các miền trị thuộc tính vào [0, 1] Một vị từ nguyên tố thường tương ứng với một giá trị ngôn

ngữ như “già”, “trẻ”…

- Toán tử sửa đổi: là ánh xạ từ [0, 1] vào [0, 1] ứng với một từ nhấn

như “rất”, “có thể”…

- Các toán tử so sánh: là các phép toán đối sánh giữa các giá trị mờ trên

những miền trị, chẳng hạn như phép so sánh “xấp xỉ”, “gần nhau”…

- Liên kết logic: thường dùng các phép toán hội, tuyển, phủ định

Chương 2 - Phụ Thuộc Dữ Liệu Trong Mô Hình Cơ Sở Dữ Liệu Hướng Đối Tượng Mờ

Trong chương này, trình bày các dạng phụ thuộc dữ liệu: phụ thuộc hàm giữa các thuộc tính, phụ thuộc giữa các thuộc tính và phương thức trong một lớp các đối tượng mờ trong mô hình CSDL HĐT mờ, và các luật suy dẫn liên quan đến các phụ thuộc hàm Lý thuyết về suy diễn tương tự cũng được xem xét, và cuối cùng áp dụng các phụ thuộc hàm mờ vào quá trình suy diễn tương tự để tìm ra câu trả lời gần đúng cho truy vấn Null Các kết quả nghiên cứu chính liên quan đến phụ thuộc dữ liệu trong một lớp đối tượng mờ được công bố trong các bài báo (1), (2), (5)

Trang 14

2.1 Quan hệ ngữ nghĩa của dữ liệu mờ

2.1.1 Đối sánh giá trị khoảng

Cho ĐSGT X= (X, G,H,≤) và một giá trị khoảng [fa,fb] Vì tính mờ x ∈

X là đoạn con của [0,1], do đó để đối sánh x ∈ X và một giá trị khoảng

[fa,fb], chúng ta ánh xạ đoạn con [0,1] của x ∈ X vào miền giá trị thực và sau đó tìm phần giao của hai khoảng tương ứng

1 [fa, fb] và ∃x ∈ X, sao cho [fa, fb] (x)

2.1.2 Sự tương đương hai giá trị thuộc tính

Trong cơ sở dữ liệu rõ, để kiểm tra hai giá trị trên một thuộc tính của hai đối tượng có giống nhau hay không người ta thưởng sử dụng phép so sánh bằng Trong cơ sở dữ liệu mờ, hai giá trị trên một thuộc tính của hai

đối tượng được xem là “xấp xỉ nhau” nếu giá trị của chúng cùng thuộc về

một lớp tương đương

Định nghĩa 2.1: Cho lớp mờ C xác định trên tập thuộc tính Attr(C) và tập

phương thức M, Ai  Attr(C) (1 ≤ i ≤ n) (Ai là thuộc tính kiểu nguyên tố), o1, o2  C và k là mức phân hoạch Ta nói rằng o1.Ai bằng nhau bậc k với

o2.Ai được ký hiệu o1.Ai k o2.Ai nếu:

(1) Nếu o1.Ai, o2.Ai  CDom(Ai) thì o1.Ai = o2.Ai hoặc tồn tại FNk(o2.Ai) sao cho o1.Ai  FNk(o2.Ai)

(x) f(a) f(b)

(x 1 )

(x)

Trang 15

14 (2) Nếu o1.Ai hoặc o2.Ai  FDom(Ai), chẳng hạn o1.Ai thì ta phải có o2.Ai

ngữ nghĩa (Semantic Proximity) [40] để phù hợp trong ngữ nghĩa mới, ký

hiệu SP(f1, f2)(0 ≤ SP(f1, f2) ≤ 1), được định nghĩa như sau:

Định nghĩa 2.2 Cho lớp các đối tượng mờ C xác định trên tập thuộc tính

Attr(C), Ai  Attr(C) (1 i n ) Hàm đánh giá độ xấp xỉ ngữ nghĩa giữa

hai giá trị thuộc tính ai của hai đối tượng o1.Ai, o2.Ai, o1, o2  C có hai khoảng tương ứng là [l1, u1] và [l2, u2], ký hiệu SP(o1.Ai,o2.Ai) (Semantic

Proximity), được xác định như sau:

( i, i) i . i / i . i . i . i /

SP o A o Ao Ao A o Ao Ao Ao A  Trong đó: [h] là độ dài của khoảng h được định nghĩa như sau:

4 Nếu độ dài của f1 bằng độ dài của f2 và độ dài giao của f1, g1 lớn hơn độ dài giao của f2, g1 thì SP(f1, g1) lớn hơn SP(f2, g1) (nghĩa là,

Trang 16

nếu |a2 – b2| ≥ |a1 - b1| và | | ≥ | | thì SP(f1, g1) ≥ SP(f2, g1))

Ví dụ 2.3: giả sử phạm vi của miền giá trị là 10, và α = 10000, δ = 1/α

1 Nếu f1 = [10, 10] và f2 = [10, 10], thì SP(f1, f2) = δ/δ – δ/α ≈ 1

2 Nếu f1 = [2, 5] và f2 = [6, 7] thì SP(f1, f2) = 0/4 – 0/α = 0

3 Nếu f1 = [2, 5] và f2 = [2, 5], g1 = [2, 8] và g2 = [2, 8], thì SP(f1, f2)

= 3/3 – 3/α = 0.9997 và SP(g1, g2) = 6/6 – 6/α = 0.9994 Ta có SP(f1, f2) ≥ SP(g1, g2)

4 Nếu f1 = [3, 5], f2 = [2, 4], g1 = [3, 6], thì SP(f1, g1) = 2/3 – 2/α = 0.6665 và SP(f2, g1) = 1/4 – 1/α = 0.2499 Ta có SP(f1, g2) ≥ SP(f2, g1)

Đối với CSDL hướng đối tượng mờ, giá trị của các thuộc tính không đơn thuần là các giá trị mờ đơn mà còn có các giá trị tập, giá trị bộ, Vì vậy, hàm xấp xỉ ngữ nghĩa trên tập thuộc tính X  Attr(C) của hai đối tượng o1, o2 của lớp mờ C, được ký hiệu SP(o1.X,o2.X), và được xác định

đệ qui như sau:

1 Nếu giá trị Ai là giá trị đơn SP(o1.Ai,o2.Ai) được xác định như công thức 2.1

2 Nếu giá trị Ai là giá trị tập, giả sử o1.Ai = {s1, s2,…, sk,…, sn}, o2.Ai = {s1, s2,…, sj,…, sm} thì xấp xỉ ngữ nghĩa của hai giá trị mờ o1.Ai và o2.Ai được tính là SP(o1.Ai,o2.Ai) =min(max(SP(sk,sj))) với k=1 n,j=1 m

3 Nếu giá trị Ai là giá trị bộ, giả sử o1.Ai = [v1, v2,…, vk,…, vn], o2.Ai = [w1, w2,…, wk,…, wn] thì xấp xỉ ngữ nghĩa của hai giá trị mờ o1.Ai và o2.Ai được tính là SP(o1.Ai,o2.Ai) = min(SP(vk, vj) với k,j =1 n

4 Nếu X={A1, A2,…, Ak} thì

SP(o1.X, o2.X) = min(SP(o1.A1,o2.A1),…, SP(o1.Ak,o2.Ak))

2.2 Phụ thuộc thuộc tính mờ và tập luật suy dẫn

Khi mở rộng mô hình quan hệ để có thể biểu diễn và xử lý được những thông tin không chắc chắn, không đầy đủ gọi chung là dữ liệu mờ đã có rất nhiều công trình tập trung nghiên cứu mở rộng các dạng phụ thuộc này trên

mô hình mới Các cách tiếp cận mở rộng phụ thuộc hàm kinh điển này dựa vào hai nguyên tắc chính:

- Nguyên tắc thứ nhất (mở rộng ký hiệu): Nguyên tắc mở rộng này thay cho quan hệ bằng nhau trên dữ liệu rõ bởi quan hệ gần nhau hoặc quan hệ tương tự trên dữ liệu mờ và đặt ngưỡng để xác định độ gần nhau

Trang 17

16

- Nguyên tắc thứ hai (mở rộng ngữ nghĩa): Nguyên tắc này dựa vào ý nghĩa của các phụ thuộc dữ liệu để xây dựng định nghĩa tương ứng cho mô hình mới sao cho bảo toàn một số kết quả quan trọng đã được xây dựng trong mô hình quan hệ

Với mô hình CSDL HĐT mờ được trình bày trong Chương 1, một số dạng phụ thuộc dữ liệu mờ trong mô hình này được đề xuất và nghiên cứu

2.2.1 Phụ thuộc hàm mờ trong lớp đối tượng

Định nghĩa 2.3: Cho lớp mờ C với tập thuộc tính U, X, Y  U Ta định nghĩa Y phụ thuộc thuộc tính mờ vào X, ký hiệu Xfa Y khi và chỉ khi o1, o2  C, nếu SP(o1.X, o2.X) ≤ SP(o1.Y, o2.Y)

Bổ đề 2.1: Cho lớp mờ C với tập thuộc tính U, X  U, A ∈ U, X faA, nếu A được thay thế bởi tập thuộc tính {A1, A2,…, Ak} trong C thì

fa

i

XA, i = 1, 2,…, k

Định lý 2.1 Phụ thuộc hàm trong cơ sở dữ liệu quan hệ thỏa mãn định

nghĩa phụ thuộc thuộc tính mờ trong CSDL HĐT mờ

Dựa vào định lý 2.1, có thể thấy rằng việc chuyển đổi từ mô hình quan

hệ sang mô hình HĐT, các phụ thuộc hàm giữa các thuộc tính được bảo toàn

2.2.2 Các luật suy dẫn trên phụ thuộc hàm mờ

U là tập các thuộc tính của lớp C; X, Y, W  U, các luật suy dẫn bao gồm:

Bổ đề 1 Các luật suy dẫn 2.1 đến 2.3 là đúng đắn và đầy đủ

2.3 Phụ thuộc phương thức mờ trong lớp đối tượng

Định nghĩa 2.4: Cho Mj là một phương thức của một lớp C, X là tập các

thuộc tính nhận giá trị đơn (giá trị rõ hoặc mờ) (có thể đọc hoặc sửa đổi) Quan hệ giữa X và Mj, được ký hiệu X fmM j, nếu X được sử dụng bởi

Mj thỏa mãn FM-phụ thuộc

Ngày đăng: 19/08/2014, 09:07

HÌNH ẢNH LIÊN QUAN

Bảng 2.3(a) kết quả thực hiện bước 1 - Cơ sở dữ liệu hướng đối tượng với thông tin ngôn ngữ mờ (tóm tắt + toàn văn)
Bảng 2.3 (a) kết quả thực hiện bước 1 (Trang 21)
Bảng 2.5 Thể hiện của lớp BoPhan và QuanLy  Thể hiện của lớp BoPhan  Thể hiện của lớp QuanLy - Cơ sở dữ liệu hướng đối tượng với thông tin ngôn ngữ mờ (tóm tắt + toàn văn)
Bảng 2.5 Thể hiện của lớp BoPhan và QuanLy Thể hiện của lớp BoPhan Thể hiện của lớp QuanLy (Trang 22)
Hình 3.1. Mối quan hệ giữa lớp SinhVien và PhongHoc - Cơ sở dữ liệu hướng đối tượng với thông tin ngôn ngữ mờ (tóm tắt + toàn văn)
Hình 3.1. Mối quan hệ giữa lớp SinhVien và PhongHoc (Trang 32)
Bảng 3.1(b) Các thể hiện lớp SinhVien - Cơ sở dữ liệu hướng đối tượng với thông tin ngôn ngữ mờ (tóm tắt + toàn văn)
Bảng 3.1 (b) Các thể hiện lớp SinhVien (Trang 32)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm