Theo cách tiếpcận này, giá trị ngôn ngữ là dữ liệu, không phải là nhãn của các tập mờ biểudiễn ngữ nghĩa của giá trị ngôn ngữ và ưu điểm cơ bản của nó là việc cho phéptìm kiếm, xác định
Trang 1CÔNG NGHỆ VIỆT NAM
VIỆN CÔNG NGHỆ THÔNG TIN
ĐOÀN VĂN THẮNG
CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG VỚI
THÔNG TIN NGÔN NGỮ MỜ
LUẬN ÁN TIẾN SĨ TOÁN HỌC
HÀ NỘI – 2014
Trang 2CÔNG NGHỆ VIỆT NAM
VIỆN CÔNG NGHỆ THÔNG TIN
ĐOÀN VĂN THẮNG
CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG VỚI
THÔNG TIN NGÔN NGỮ MỜ
Chuyên ngành: Bảo đảm toán học cho máy tính và hệ thống tính toán
Mã số: 62 46 35 01
LUẬN ÁN TIẾN SĨ TOÁN HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1 PGS.TS ĐOÀN VĂN BAN
2 PGS.TS TRƯƠNG CÔNG TUẤN
HÀ NỘI – 2014
Trang 3Luận án được hoàn thành tại Viện Công nghệ Thông tin Để hoàn thành luận
án này, tác giả đã nhận được sự chỉ bảo tận tình, cùng những đòi hỏi nghiêmkhắc của PGS.TS Đoàn Văn Ban, người đã truyền đạt rất nhiều kiến thức quíbáu cũng như những kinh nghiệm nghiên cứu khoa học trong suốt thời gian tácgiả theo học nghiên cứu sinh Tác giả cũng đã nhận được sự hướng dẫn và quantâm giúp đỡ của PGS.TS Trương Công Tuấn Nhân dịp này, tác giả xin đượcbày tỏ lòng biết ơn chân thành và sự kính trọng sâu sắc đối với các Thầy.Trong thời gian làm nghiên cứu sinh ở Viện Công nghệ Thông tin, tác giảđược tiếp nhận những kiến thức quý giá và sự quan tâm chân tình từ các thầy,
cô giáo ở Viện Tác giả xin gửi tới các thầy, cô lòng biết ơn, và lời cảm ơn chânthành nhất
Tác giả xin chân thành cảm ơn Ban lãnh đạo, Bộ phận quản lý Nghiên cứusinh và các Phòng chức năng của Viện Công nghệ Thông tin đã tạo mọi điềukiện thuận lợi trong quá trình học tập, nghiên cứu của tác giả tại Viện
Tác giả xin cảm ơn Ban Giám hiệu trường Cao đẳng Công nghệ Thông tinhữu nghị Việt Hàn, Ban Giám hiệu trường Cao đẳng Công Thương Hồ Chí Minh,Ban Chủ nhiệm khoa Công nghệ Thông tin và các Phòng chức năng của trườngCao đẳng Công Thương đã quan tâm giúp đỡ mọi mặt để tác giả hoàn thànhnhiệm vụ học tập
Xin chân thành cảm ơn sự quan tâm, động viên và những đóng góp quý báucủa các đồng nghiệp
Sự quan tâm, mong mỏi của mọi thành viên trong Gia đình là một trongnhững động cơ để tác giả nỗ lực học tập, nghiên cứu Luận án này, như một mónquà tinh thần, xin đáp lại những niềm quan tâm, mong mỏi đó
Cuối cùng, tác giả xin biểu thị sự biết ơn tới những người thân và bạn bè đã
ưu ái, giúp đỡ, động viên, khích lệ để tác giả hoàn thành luận án này
Trang 4Tác giả xin khẳng định tất cả các kết quả được trình bày trong luận án làcủa riêng tác giả, không sao chép từ bất kỳ một công trình nào khác Nếu cóđiều gì không trung thực, tác giả xin chịu hoàn toàn trách nhiệm.
Tác giả
Đoàn Văn Thắng
Trang 5Mục lục
Chương 1 TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI
1.1 Giới thiệu 6
1.2 Thông tin không đầy đủ trong mô hình CSDL 9
1.2.1 Thông tin sai lệch 10
1.2.2 Thông tin thiếu chính xác 10
1.2.3 Thông tin không chắc chắn 11
1.3 Tập mờ 11
1.3.1 Tập mờ 12
1.3.2 Các phép toán trên tập mờ 14
1.3.3 Tổng quát hoá ba phép toán cơ bản trên tập mờ 14
1.3.4 Biến ngôn ngữ 15
1.4 Mô hình biểu diễn dữ liệu mờ với ngữ nghĩa của đại số gia tử 17
1.4.1 Đại số gia tử 17
1.4.2 Đại số gia tử tuyến tính đầy đủ 20
1.5 Mô hình CSDL hướng đối tượng mờ 26
1.5.1 Đối tượng mờ 27
1.5.2 Lớp mờ 28
Trang 61.5.4 Phương thức 30
1.5.5 Quan hệ lớp đối tượng mờ 30
1.5.6 Quan hệ kế thừa mờ 32
1.5.7 Mô hình lớp đối tượng mờ 33
1.6 Ngôn ngữ truy vấn dữ liệu 37
1.7 Kết luận 37
Chương 2 PHỤ THUỘC DỮ LIỆU TRONG MÔ HÌNH CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜ 39 2.1 Quan hệ ngữ nghĩa của dữ liệu mờ 39
2.1.1 Đối sánh giá trị khoảng 39
2.1.2 Sự tương đương hai giá trị thuộc tính 41
2.1.3 Xấp xỉ ngữ nghĩa 43
2.2 Phụ thuộc thuộc tính mờ và tập luật suy dẫn 45
2.2.1 Phụ thuộc thuộc tính mờ trong lớp đối tượng 46
2.2.2 Các luật suy dẫn trên phụ thuộc thuộc tính mờ 50
2.3 Phụ thuộc phương thức mờ trong lớp đối tượng 51
2.4 Truy vấn Null và lập luận tương tự 52
2.4.1 Các giá trị Null 52
2.4.2 Truy vấn Null 52
2.4.3 Lập luận tương tự 53
2.4.4 Thuật toán tìm câu trả lời gần đúng cho truy vấn Null 54
2.5 Một số ví dụ minh họa 63
2.6 Kết luận 69
Chương 3 TRUY VẤN DỮ LIỆU TRONG HỆ THỐNG HƯỚNG ĐỐI TƯỢNG VỚI THÔNG TIN KHÔNG CHẮC CHẮN 70 3.1 Đối tượng mờ dư thừa 71
Trang 73.2.1 Phép chọn mờ 73
3.2.2 Phép chiếu mờ 75
3.2.3 Phép tích mờ 75
3.2.4 Phép kết nối mờ 75
3.2.5 Phép hợp mờ 77
3.2.6 Phép giao mờ 78
3.2.7 Phép trừ mờ 79
3.3 Phương pháp truy vấn dữ liệu mờ 80
3.3.1 Tìm kiếm dữ liệu theo lân cận ngữ nghĩa 81
3.3.2 Truy vấn mờ với lượng từ ngôn ngữ 85
3.4 Một số ví dụ minh họa 90
3.5 Kết luận 96
Trang 8Danh mục thuật ngữ, từ viết tắt
Biến ngôn ngữ Linguistic variable
Cơ sở dữ liệu hướng đối tượng Object-Oriented DataBase OODB
Cơ sở dữ liệu hướng đối tượng mờ Fuzzy Object-Oriented DataBase FOODB
Dữ liệu ngôn ngữ Linguistic data
Đại số gia tử tuyến tính Linear Hedge algebra
Đại số gia tử Hedge algebra HAĐại số đối tượng mờ Fuzzy Object Algebra
Đối tượng phức hợp Composite object
Định danh đối tượng Object Identity OIDGiá trị chân lý Truth value
Lập luận xấp xỉ Approximate reasoning
Lược đồ đối tượng Object Schemas
Nhóm quản trị cơ sở đối tượng Object DataBase ODMG
Management GroupNgôn ngữ truy vấn đối tượng Object Query Language OQLNgôn ngữ truy vấn đối tượng mờ Fuzzy Object Query Language FOQLQuan hệ kế thừa Inheritance relationship
Quan hệ kết nhập Aggregation relationship
Phân cấp thừa kế mờ Fuzzy inheritance hierarchy
Phụ thuộc hàm mờ Fuzzy Fuctional Dependency FFDPhụ thuộc phương thức mờ Fuzzy Method Dependency FMDLân cận mờ Fuzzy Neighborhood FN
Trang 9Danh sách hình vẽ
2.1 [f a , f b] ∈ ℑ(x) 40
2.2 [f a , f b] ̸⊂ ℑ(x) 40
2.3 khi [f a , f b] ∩ ℑ(x) = ∅ 41
2.4 Tính mờ của trẻ và già 41
2.5 Lớp đối tượng Sinh Viên 46
2.6 Lược đồ lớp NhanVien 66
3.1 Mối quan hệ giữa lớp SinhVien và PhongHoc 90
Trang 10Danh sách bảng
2.1 Thể hiện của lớp SinhVien 47
2.2 Thể hiện của lớp SinhVien khi chuyển về giá trị khoảng và đối sánh với các khoảng mờ của thuộc tính 49
2.3 Kết quả thực hiện truy vấn 2.1 64
2.4 Kết quả thực hiện truy vấn 2.2 65
2.5 Thể hiện của lớp BoPhan và QuanLy 66
2.6 Ma trận độ tương tự giữa các thuộc tính 66
2.7 Kết quả thực hiện trong truy vấn 2.4 68
3.1 Các thể hiện của lớp PhongHoc và SinhVien 91
3.2 Kết quả truy vấn 3.2 93
3.3 Kết quả truy vấn 3.2 95
Trang 11và chính xác Điều này không hoàn toàn phù hợp với thực tế, bởi thông tin vềcác đối tượng trong thế giới thực có thể mơ hồ, không chắc chắn, không đầy đủ.
Hệ quả là các ứng dụng dựa trên mô hình CSDL HĐT truyền thống khôngbiểu diễn được các đối tượng mà thông tin về chúng không được xác định mộtcách chắc chắn và chính xác Chẳng hạn, các ứng dụng mô hình CSDL truyền
thống không thể trả lời các truy vấn như “tìm tất cả những bệnh nhân trẻ có tiền sử bệnh viêm thanh quản”; hoặc “tìm tất cả các gói bưu kiện có thể tích khoảng 25000 cm3”, trong đó trẻ và khoảng 25000 là những khái niệm và giá
trị không chính xác Để khắc phục được các hạn chế như vậy, các nghiên cứu gầnđây đã tập trung nghiên cứu mô hình CSDL HĐT có khả năng biểu diễn và xử
lý được các đối tượng mà thông tin về chúng có thể không chắc chắn và khôngchính xác
Trên tinh thần đó, trong những năm qua đã có nhiều cách tiếp cận khácnhau để giải quyết các vấn đề này Một số nghiên cứu của George, Buckles vàPetry, 1993 [25]; Yazici và George, 1999 [47]; Yazici, George và Aksoy 1999 [48]cho phép giá trị thuộc tính đối tượng là một tập các giá trị mờ kết hợp với mộtquan hệ tương tự trên miền giá trị thuộc tính Tùy theo ngữ cảnh, tập các giá trị
Trang 12thuộc tính được định nghĩa là tuyển hoặc hội logic của các giá trị này Ngữ nghĩacủa các giá trị tập mờ được xác định thông qua các quan hệ tương tự trên cácmiền giá trị thuộc tính tương ứng Vì các giá trị thuộc tính đối tượng là nhữngtập mờ, nên các lớp đối tượng cũng trở nên mờ Ngoài ra, sự phân loại và phâncấp lớp là mờ nên mức độ thành viên lớp của các đối tượng cũng được mờ hóatheo.
Như trong mô hình CSDL quan hệ mờ, trong các các mô hình CSDL HĐT
mờ, phương pháp biểu diễn giá trị thuộc tính đối tượng bởi các phân bố khảnăng Các nghiên cứu theo tiếp cận này rất đa dạng và khả năng mô hình hóa cácđối tượng mờ cũng rất khác nhau Nhóm tác giả Van Gyseghem và De Caluwe[44] kết hợp với lý thuyết tập mờ đã định nghĩa lớp như một tập các tính chấtgồm các thuộc tính và phương thức lớp xác định các đối tượng mờ của lớp Mỗiphương thức được biểu diễn như một hàm thao tác trên các giá trị tập mờ củathuộc tính đối tượng Bao hàm và phân cấp lớp mờ được xác định thông quabao hàm các miền giá trị thuộc tính tương ứng của các lớp Thừa kế không chắcchắn thuộc tính lớp được tính toán thông qua mức độ bao hàm lớp con tronglớp cha
Mô hình dựa trên lý thuyết xác suất đầu tiên được nhóm tác giả Kornatzky
và Shimony đề xuất năm 1994 [27] Trong mô hình này, lớp được định nghĩa nhưmột tập các thuộc tính mà giá trị của chúng có thể kết hợp với một phân bố xácsuất Lược đồ được định nghĩa như một tập các lớp có phân cấp kết hợp với xácsuất có điều kiện để một đối tượng của một lớp thuộc về lớp con của nó Các tácgiả cũng đã phát triển một ngôn ngữ truy vấn để thao tác chọn các đối tượngthỏa một xác suất được kết hợp với các truy vấn
Rõ ràng, trở ngại lớn nhất trong việc phát triển các hệ thống CSDL HĐT
mờ đó là chưa có một mô hình dữ liệu chuẩn hay cơ sở toán học thống nhất choviệc biểu diễn và xử lý dữ liệu đối tượng mờ Cho đến nay, các nghiên cứu về môhình CSDL HĐT mờ chủ yếu tập trung vào việc mở rộng mô hình dữ liệu rõ đã
có theo nhiều cách tiếp cận khác nhau và cho phép biểu diễn, thao tác trên dữliệu mờ Do đó, các mô hình CSDL HĐT mờ này chỉ thống nhất trên một tập
Trang 13các khái niệm chung nhất trong mô hình của ODMG [22] Có thể thấy rằng, cáckết quả nghiên cứu trên CSDL HĐT mờ luôn được xem xét với một mô hình cụthể, các kết quả này sẽ giải quyết cho một lớp các bài toán với một tập con cáckhái niệm, tính chất đặc trưng hướng đối tượng Như vậy, việc chọn lựa một môhình dữ liệu để nghiên cứu các vấn đề trong CSDL HĐT mờ là rất quan trọng.Trong cơ sở dữ liệu quan hệ mờ, ở trong nước, từ năm 1985 Lê Tiến Vương
đã nghiên cứu áp dụng lý thuyết tập mờ trong mô hình quan hệ Một số các kếtquả về mô hình cơ sở dữ liệu mở rộng sử dụng lý thuyết tập mờ và biến ngônngữ của Lê Tiến Vương và Hồ Thuần đã được công bố vào năm 1989 Vẫn tiếptục đi sâu vào hướng đó, có các công trình nghiên cứu của Đinh Thị Ngọc Thanh(1991) và Trương Đức Hùng (1996) Năm 2002, Hồ Cẩm Hà đã mở rộng mô hình
cơ sở dữ liệu mờ dựa trên quan hệ tương tự và phát triển một số các kết quảdựa trên mô hình [25] Năm 2004, Trần Thiên Thanh đã đề xuất một số kết quả
về phụ thuộc dữ liệu và tổng kết dữ liệu trên mô hình lý thuyết khả năng.Trên cơ sở những mô hình mở rộng, những kết quả đã đạt được trên mô hìnhquan hệ như phụ thuộc hàm, phụ thuộc đa trị, các dạng chuẩn, phân tách lược
đồ quan hệ, ngôn ngữ hỏi đáp, được mở rộng theo nhiều cách khác nhau đểphù hợp với từng mô hình Ngoài ra, để khai thác dữ liệu trên mô hình cơ sở dữliệu mờ nhiều tác giả nghiên cứu đã mở rộng những ngôn ngữ hỏi đáp trên môhình quan hệ như đại số quan hệ, phép tính quan hệ trên bộ, phép tính quan hệtrên miền, ngôn ngữ SQL, cho phù hợp với mô hình mới và đáp ứng yêu cầukhai thác dữ liệu đa dạng của người dùng
Tuy đã có nhiều cách tiếp cận để xử lý thông tin mờ nhưng hầu hết việc biểudiễn và đối sánh dữ liệu vẫn phức tạp và mang tính chủ quan, phụ thuộc vàonhiều yếu tố làm ảnh hưởng đến hiệu quả của việc thao tác dữ liệu Chẳng hạnnhư theo cách tiếp cận quan hệ mờ, yếu tố ảnh hưởng vào việc biểu diễn ngữ
nghĩa là việc xây dựng hàm thuộc và chọn ngưỡng lát cắt α của tập mờ, theo
cách tiếp cận quan hệ tương tự là việc chọn ngưỡng tương tự hai giá trị, ngưỡngcủa mỗi thuộc tính và ngưỡng của bộ dữ liệu, Vì vậy, cần có một cách tiếpcận để xử lý thông tin mờ một cách hiệu quả, đơn giản và trực quan hơn
Trang 14Nếu xem thuộc tính mờ A là một biến ngôn ngữ và F D A là miền các giá
trị ngôn ngữ của A được sắp theo một thứ tự tuyến tính, thì F D A được xétnhư là một đại số gia tử (ĐSGT) tuyến tính Cách tiếp cận từ đại số đến ngữnghĩa ngôn ngữ được nghiên cứu đầu tiên bởi tác giả Nguyễn Cát Hồ và Wechler[30][31], trong mô hình này giá trị tập mờ của mỗi thuộc tính được biểu diễn bởimột nhãn ngôn ngữ Tuy nhiên, các giá trị thuộc tính như vậy không được diễndịch bởi hàm thành viên mà ngữ nghĩa của nó được xác định bởi đại số gia tửtrên miền trị của thuộc tính tương ứng Nhờ những ưu điểm của cấu trúc ĐSGT[5][6][20][35], chúng tôi tập trung nghiên cứu CSDL HĐT với thông tin ngôn ngữ
mờ dựa trên cách tiếp cận ngữ nghĩa định lượng của ĐSGT, trong đó ngữ nghĩangôn ngữ được lượng hóa bằng các ánh xạ định lượng của ĐSGT Theo cách tiếpcận này, giá trị ngôn ngữ là dữ liệu, không phải là nhãn của các tập mờ biểudiễn ngữ nghĩa của giá trị ngôn ngữ và ưu điểm cơ bản của nó là việc cho phéptìm kiếm, xác định ngữ nghĩa của thông tin không chắc chắn chỉ bằng các thaotác dữ liệu kinh điển thường dùng và do đó đảm bảo tính thuần nhất của kiểu
dữ liệu trong xử lý ngữ nghĩa của chúng Điều này khác với CSDL HĐT mờ theocác cách tiếp cận trước đây là vừa phải xử lý ngữ nghĩa kinh điển, vừa phải xử
lý ngữ nghĩa được biểu diễn dưới dạng tập mờ hay hàm thuộc của chúng Ngoài
ra, theo cách tiếp cận ngữ nghĩa định lượng của ĐSGT, ngữ nghĩa ngôn ngữ cóthể biểu thị bằng một lân cận các khoảng được xác định bởi độ đo tính mờ củacác giá trị ngôn ngữ của một thuộc tính với vai trò là biến ngôn ngữ Ví dụ, ngữ
nghĩa của giá trị ngôn ngữ "rất cao" của thuộc tính lương nhân viên sẽ được biểu thị bằng những khoảng lân cận của giá trị đại diện của giá trị ngôn ngữ "rất cao" thông qua ánh xạ định lượng của ĐSGT của thuộc tính lương nhân viên.
Với ý nghĩa như vậy, luận án đặt ra mục tiêu nghiên cứu cụ thể như sau:
1 Nghiên cứu mô hình CSDL HĐT với thông tin ngôn ngữ mờ dựa trên địnhlượng của ĐSGT và lân cận ngữ nghĩa của ĐSGT
2 Xây dựng một số dạng phụ thuộc dữ liệu và các vấn đề liên quan
3 Tiến hành nghiên cứu một số thao tác dữ liệu trong mô hình CSDL HĐTmờ
Trang 15Để thực hiện được các mục tiêu nêu trên, luận án được tổ chức như sau: Phần
mở đầu, ba chương và phần kết luận
Chương 1 trình bày khái quát về cơ sở dữ liệu hướng đối tượng mờ Nội
dung cụ thể của chương: tóm tắt các hướng tiếp cận khác nhau cho việc nghiêncứu mô hình CSDL HĐT mờ Tiếp đến, trình bày tóm tắt một số khái niệm vàtính chất cơ bản của ĐSGT như độ đo tính mờ, hàm dấu, hàm định lượng ngữnghĩa, Phần cuối, trình bày một số khái niệm cơ bản trong mô hình CSDLHĐT như đối tượng, lớp, quan hệ lớp đối tượng, v.v được mở rộng sang môhình CSDL HĐT với thông tin ngôn ngữ mờ theo tiếp cận ĐSGT
Chương 2 giới thiệu các phụ thuộc và ràng buộc dữ liệu trong một lớp đối
tượng mờ Dựa trên hàm đo xấp xỉ ngữ nghĩa của hai giá trị mờ, chúng tôi đưa
ra khái niệm phụ thuộc hàm mờ cho các thuộc tính của lớp, phụ thuộc hàm mờgiữa thuộc tính và phương thức lớp, và các vấn đề liên quan Trong chương này,
lý thuyết suy diễn tương tự được trình bày và áp dụng quá trình suy diễn tương
tự để tìm ra câu trả lời gần đúng cho truy vấn Null
Chương 3 trình bày ngôn ngữ truy vấn hướng đối tượng mờ và các phép
toán đại số mờ Đưa lượng từ ngôn ngữ vào trong câu truy vấn được đề xuất phùhợp với mô hình CSDL hướng đối tượng mờ theo cách tiếp cận đại số gia tử.Các kết quả chính của luận án được báo cáo và thảo luận tại các hội nghị,hội thảo khoa học:
- Hội thảo quốc gia “Một số vấn đề chọn lọc về công nghệ thông tin và truyềnthông”, tại Cần Thơ ngày 7-8/10/2011, và Hà Nội ngày 3-4/12/2012
- Hội nghị khoa học kỷ niệm 35 năm thành lập Viện công nghệ thông tin, HàNội 26/12/2011
- The Fourth International Conference on Knowledge and Systems ing, KSE12, Da Nang - Viet Nam, 08/2012
Engineer Hội nghị khoa học FAIR “Nghiên cứu cơ bản và ứng dụng công nghệ thôngtin”, tại Huế ngày 20-21/06/2013, và Thái Nguyên ngày 19-20/06/2014
Các kết quả của luận án được công bố trong 8 công trình ở trang 98
Trang 16TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG MỜ
1.1 Giới thiệu
Trong những năm gần đây, mô hình CSDL HĐT với thông tin mờ và khôngchắc chắn được nhiều tác giả trong và ngoài nước quan tâm nghiên cứu Tất cảcác cách tiếp cận nhằm mục đích nắm bắt và xử lý một cách thỏa đáng trên mộtluận điểm nào đó các thông tin không chính xác, không chắc chắn hay khôngđầy đủ Dưới đây, chúng tôi tóm tắt lại một số mô hình CSDL HĐT mờ theocác cách tiếp cận và các kết quả đạt được trên các mô hình đã được đề xuất.Trước hết, một số nghiên cứu cho phép giá trị thuộc tính đối tượng là mộttập các giá trị mờ kết hợp với một quan hệ tương tự trên miền giá trị thuộc tínhnày (George, Buckles và Petry, 1993 [25]; Yazici và George, 1999 [47]) Tùy theongữ cảnh, tập giá trị thuộc tính được định nghĩa như là tuyển hoặc hội logic củacác giá trị này Ngữ nghĩa của các giá trị tập mờ được xác định thông qua cácquan hệ tương tự trên các miền giá trị thuộc tính tương ứng Các phép toán đại
số trên các lớp đối tượng như chọn, chiếu, kết nối, v.v , dựa trên độ đo tương
tự đã được xây dựng làm ngôn ngữ thao tác truy vấn đối tượng
Vì các giá trị thuộc tính đối tượng có thể là những tập mờ, nên các lớp đốitượng cũng trở nên mờ Trong các mô hình này, sự phân loại, phân cấp các lớp
là mờ nên mức độ thành viên lớp của các đối tượng cũng được mờ hóa theo.Các độ đo tương ứng được sử dụng để tính toán mức độ bao hàm lớp và mức độthành viên lớp Độ đo bao hàm lớp con trong lớp cha được xác định bởi mức độ
Trang 17tương tự tương ứng của các miền giá trị các thuộc tính của lớp con đối với lớpcha Độ đo thành viên lớp của mỗi đối tượng được định nghĩa thông qua mức độtương tự giữa giá trị tương ứng của mỗi thuộc tính của đối tượng với tập giá trịcủa miền giá trị thuộc tính lớp.
Ngoài ra, mô hình này được Yazici và George (1999b) [47] mở rộng bằng mộttập luật cho phép suy diễn trên các thông tin mờ về các đối tượng trong CSDL.Nhóm tác giả Yazici, George và Aksoy (1999) [48] đã đề xuất các vấn đề về thiết
kế và thực hiện các mô hình hướng đối tượng mờ dựa trên quan hệ tương tự.Các tác giả này cũng đã xây dựng một hệ thống CSDL mờ dựa trên tính tương
tự cho phép thao tác và truy vấn thông tin mờ của các đối tượng thực tế.Như các mô hình CSDL quan hệ mờ, trong các mô hình CSDL HĐT mờ,phương pháp biểu diễn giá trị thuộc tính đối tượng bởi các phân bố khả năngcũng được nghiên cứu rộng rãi Các đề nghị theo tiếp cận này rất đa dạng và khảnăng mô hình hóa các đối tượng mờ cũng rất khác nhau Bordogna, Lucarella vàPasi (1994) [17] đã đề nghị một mô hình dữ liệu hướng đối tượng dựa trên đồ thị,trong đó giá trị thuộc tính được biểu diễn bởi các phân bố khả năng, bao hàmcác lớp con trong lớp cha được biểu diễn bởi các tập mờ Mức độ thành viên mờcủa các đối tượng được xác định thông qua mức độ bao hàm lớp và mức độ baohàm giá trị thuộc tính của đối tượng trong miền giá trị thuộc tính tương ứng củalớp Một ngôn ngữ truy vấn đối tượng dựa trên các độ đo khả năng đã được xâydựng cho mô hình này và khả năng áp dụng của các tính chất lớp là chắc chắn.Nhóm tác giả này [18] tiếp tục mở rộng bằng cách kết hợp giá trị thuộc tính đốitượng với một giá trị trong khoảng [0, 1] để biểu diễn mức độ không chắc chắn
Trang 18Van Gyseghem và De Caluwe (1997) [44] định nghĩa lớp như một tập cácthuộc tính và phương thức xác định các đối tượng mờ của lớp Mỗi phương thứcđược biểu diễn như một hàm thao tác trên các giá trị tập mờ của thuộc tính đốitượng Trong mô hình này, khả năng không chắc chắn các tính chất lớp của cácđối tượng đã được đề cập, nhưng mức độ áp dụng của mỗi tính chất không đượcđịnh nghĩa hình thức trong biểu diễn lớp Bao hàm và phân cấp lớp mờ được xácđịnh thông qua bao hàm các miền trị thuộc tính tương ứng của các lớp Thừa
kế không chắc chắn thuộc tính lớp được tính toán thông qua mức độ bao hàmlớp con trong lớp cha
Marin, Pons và Vila (2001) [29], Berzal và cộng sự (2005a) [15] đã áp dụng
lý thuyết khả năng để xây dựng một tập các độ đo cho các quan hệ trên các tập
mờ làm cơ sở để các thao tác và truy vấn đối tượng Các phương thức lớp cũng
đã được định nghĩa hình thức để biểu diễn thao tác của các đối tượng De Tre và
De Caluwe (2005) [24] đã biểu diễn dữ liệu mờ của đối tượng như các ràng buộctrên các tính chất của chúng Một truy vấn được kết hợp với các ràng buộc, vàcác đối tượng được chọn nếu thỏa mãn các ràng buộc này
Eiter và cộng sự (2001) đã mở rộng mô hình CSDL HĐT xác suất của matzky và Shimony (1994) và gọi là mô hình POB (Probabilistic Object Base).Đây là một mô hình cơ sở đối tượng xác suất dựa trên thủ tục Theo đó, giá trịthuộc tính của đối tượng được biểu diễn như một tập, kết hợp với hai hàm phân
Kor-bố xác suất cận dưới và cận trên để đo độ không chắc chắn về giá trị trong tập
mà thuộc tính có thể nhận
Kết hợp tập mờ và xác suất, Baldwin và cộng sự (2000) [16], Cao và Rossiter(2003) [19] đã đề xuất một mô hình CSDL HĐT xác suất mờ dựa trên cơ sởlogic Trong đó, lớp được định nghĩa bởi một tập tính chất được diễn dịch nhưcác vị từ mờ kết hợp với một khoảng xác suất biểu diễn khả năng áp dụng khôngchắc chắn của chúng đối với lớp Các vị từ không có tiền điều kiện biểu diễnthuộc tính, ngược lại chúng biểu diễn phương thức của một lớp Mỗi tính chấtđối tượng có thể nhận một giá trị tập mờ với một xác suất thuộc về khoảng xácsuất được suy dẫn từ mức độ áp dụng của nó đối với đối tượng
Trang 19Năm 2013, Vũ Đức Quảng [13] đã thực hiện các nghiên cứu về các phụ thuộc
dữ liệu của các đối tượng mờ trên mô hình CSDL hướng đối tượng mờ với dữ liệuđược biểu diễn bởi phân bố khả năng được đề xuất bởi ZongMin Ma [51] Trên
mô hình mà Zong Min Ma đề xuất ngoài việc đảm bảo các khái niệm, tính chấtcốt lõi của mô hình CSDL hướng đối tượng rõ, nó còn giải quyết được tương đốiđầy đủ tính mờ của đối tượng, lớp, tính mờ trong mối quan hệ giữa đối tượng
và lớp, giữa lớp cha và lớp con
Như đã trình bày ở trên, các hướng tiếp cận nghiên cứu mô hình CSDL HĐTvới thông tin mờ và không chắc chắn cũng đã chứng tỏ được khả năng mô hìnhhóa thông tin mờ, không chính xác và không chắc chắn về các đối tượng Tuynhiên, do sự đa dạng của những loại thông tin không đầy đủ, do những khó khănkhi phải thao tác trên những thông tin như vậy nên còn rất nhiều vấn đề cầnđược tiếp tục nghiên cứu Trong những năm gần đây đại số gia tử được nhiều tácgiả nghiên cứu [5][6][10][20][34][35] và đã có được những kết quả đáng kể trongcác nghiên cứu về CSDL mờ Vì vậy, mặc dù có nhiều kết quả nghiên cứu vềCSDL HĐT mờ, theo chiều hướng đó cách tiếp cận nghiên cứu CSDL HĐT mờvới ngữ nghĩa dựa trên đại số gia tử vẫn có thể được xem là một vấn đề nghiêncứu mới Trong phần sau, một số khái niệm ĐSGT và ĐSGT tuyến tính đầy đủ,các mệnh đề, định lý liên quan được trình bày làm cơ sở nghiên cứu trên môhình này
1.2 Thông tin không đầy đủ trong mô hình CSDL
Một trong những lĩnh vực nghiên cứu chủ yếu trong CSDL là tiếp tục pháttriển các kết quả đã đạt được trong các mô hình CSDL truyền thống với mộttập các khái niệm có ngữ nghĩa mở rộng Một trong các yêu cầu không được giảiquyết đầy đủ bởi các các mô hình truyền thống, đó là việc biểu diễn và xử lýthông tin không chính xác và không chắc chắn Các mô hình truyền thống giảđịnh rằng mô hình cơ sở dữ liệu phản ánh một cách chính xác thế giới thực, dữliệu được lưu trữ là được xác định, chính xác và đầy đủ Tuy nhiên, trong thực
tế cuộc sống, nhiều khi các giả định này không được thỏa đáng Vì vậy trong
Trang 20những năm gần đây, các mô hình dữ liệu khác nhau được đề xuất để giải quyếtcác loại đặc trưng của dữ liệu.
Trong các hệ thống CSDL, chúng ta thường quan tâm đến ba loại thông tinkhông hoàn hảo (imperfect) sau: thông tin sai lệch, thông tin không chính xác,thông tin không chắc chắn [1]
1.2.1 Thông tin sai lệch
Thông tin sai lệch là loại thông tin không hoàn hảo đơn giản nhất Thông tincủa cơ sở dữ liệu là sai lệch khi nó khác với “thông tin thực” (true information).Mọi sai số lớn hay nhỏ của thông tin đều làm ảnh hưởng đến tính toàn vẹncủa CSDL, đó là vấn đề không thể chấp nhận và cần được xem xét trong các
hệ CSDL Một loại thông tin sai lệch quan trọng là sự không nhất quán Đôikhi cùng một khía cạnh của thế giới thực được biểu diễn nhiều lần trong cùngmột CSDL hay trong nhiều CSDL khác nhau Khi các biểu diễn đó là đối lậpkhông thể kết hợp được, dẫn đến thông tin là không nhất quán Trong việc tíchhợp thông tin từ nhiều CSDL khác nhau, các vấn đề về sự không nhất quán củathông tin phải được quan tâm một cách đầy đủ
1.2.2 Thông tin thiếu chính xác
Thông tin trong CSDL là thiếu chính xác khi nó biểu diễn một tập các giátrị có thể, và giá trị thực là một phần tử của tập đó Như vậy, thông tin thiếuchính xác không phải là thông tin sai lệch và không làm ảnh hưởng tới tính toànvẹn của CSDL Sau đây là một số thông tin thiếu chính xác đặc trưng:
- Thông tin tuyển, chẳng hạn tuổi của Nam hoặc là 35 hoặc là 36.
- Thông tin âm, chẳng hạn tuổi của Nam không phải là 30.
- Thông tin khoảng/miền, chẳng hạn tuổi của Nam nằm trong khoảng từ 35 đến 40 hoặc tuổi của Nam lớn hơn 35.
- Thông tin với các cận sai số, chẳng hạn tuổi của Nam là 30 ± 1.
Trang 21Hai loại thông tin không chính xác cực biên là thông tin chính xác (ứng vớitrường hợp tập các giá trị có thể là một phần tử) và các giá trị null (được hiểutheo nghĩa là thông tin không chính xác, trong đó tập các giá trị có thể bao gồmtoàn bộ miền các giá trị hợp lệ).
1.2.3 Thông tin không chắc chắn
Tri thức của chúng ta về thế giới thực (chính xác hoặc không chính xác), đôikhi không thể được phát biểu với một mức độ chân lý tuyệt đối, và đòi hỏi taphải xác định giá trị chân lý về thông tin được phát biểu Thông tin với độ chắcchắn nhất định không phải là thông tin sai lệch và không làm ảnh hưởng tới tínhnhất quán của CSDL
Trong phát biểu “tuổi của Nam hoặc là 35 hoặc là 36 ” thể hiện tính không chính xác, phát biểu “tuổi của Nam có khả năng là 35 ” lại thể hiện tính không
chắc chắn
Mỗi lĩnh vực khoa học kỹ thuật đều có một miền ứng dụng của nó Khoahọc kỹ thuật lấy tính “chính xác” làm cơ sở để xây dựng, phát triển và cũng cónhững giới hạn xác định không thể vượt qua, chúng chỉ có khả năng mô phỏngđược một phần thế giới thực Câu hỏi đặt ra ở đây là liệu có một lý thuyết toánhọc nào cho phép mô hình hóa phần thế giới thực mà con người vẫn chỉ có thểnhận thức, mô tả bằng ngôn ngữ tự nhiên vốn hàm chứa những thông tin khôngchính xác (inexact), không chắc chắn (uncertain)
Lý thuyết tập mờ được Zadeh đề xuất năm 1965 bằng cách mở rộng kháiniệm tập cổ điển, với ý tưởng đầu tiên là giúp biểu diễn và đo ngữ nghĩa cáckhái niệm không chính xác, mơ hồ trong thực tế Ngày nay, sau hơn 40 năm,một thời gian rất ngắn so với lịch sử toán học, lý thuyết tập mờ không chỉ đãphát triển bùng nổ vượt bậc mà còn đặt nền móng cho việc xây dựng một loạtcác lý thuyết quan trọng như logic mờ, lý thuyết khả năng, lý thuyết xác suất
mờ v.v Nhu cầu phát triển của lý thuyết tập mờ là tìm kiếm các công cụ để
Trang 22mô hình hóa tính không chắc chắn, không rõ ràng, rất phổ biến trong thực tế
mà nếu chỉ dùng lý thuyết xác suất không đủ Toán học dựa trên lý thuyết tập
mờ phát triển chủ yếu bằng cách mở rộng hầu hết các khái niệm và lý thuyếtcủa toán học cổ điển như logic, số học, quan hệ, độ đo v.v thành logic, sốhọc, hay độ đo mờ v.v Lý thuyết tập mờ, với những khả năng như đã nói, là
cơ sở toán học được ứng dụng rộng rãi trong thực tế nói chung và khoa học kỹthuật nói riêng, đặc biệt là khoa học máy tính, khi xây dựng các hệ thống tínhtoán biết phân tích, xử lý và ra quyết định thông minh
1.3.1 Tập mờ
Trước hết chúng ta xuất phát từ tập hợp kinh điển Cho U là một tập hợp
và F là một tập con của U Nếu một phần tử x thuộc F, ký hiệu x ∈ F , ngược lại x / ∈ F Như vậy, để mô tả khái niệm “thuộc” ta sử dụng hàm thuộc µ F:
Định nghĩa 1.1 [50] Cho U là vũ trụ các đối tượng Tập mờ F trên U là một
tập các cặp có thứ tự (x, µ F (x)), với µ F là hàm từ U → [0, 1] gán cho mỗi phần
tử x thuộc U giá trị µ F (x) để chỉ mức độ của x thuộc hàm tập mờ F
x , nếu U không hữu hạn
Ví dụ 1.1 Xét tập U gồm 5 người là x1, x2, , x5 tương ứng có tuổi là 10,
15, 50, 55, 70 và F là tập hợp các người “trẻ” Khi đó ta có thể xây dựng hàm
Trang 23thuộc như sau: µtrẻ(10) = 0.95, µtrẻ(15) = 0.75, µtrẻ(50) = 0.35, µtrẻ(55) = 0.30,
Tập U thường được gọi là vũ trụ hay không gian tham chiếu, hàm µ F được
gọi là hàm thuộc của tập mờ F , là ánh xạ của U vào [0,1] Do luận án làm việc chủ yếu trên tập mờ, nên từ đây ta ký hiệu F cho tập mờ thay vì F
Như vậy, tập mờ được hiểu là tập mô tả thuộc tính nào đó của một đối tượngđược nhúng trong không gian tất cả các hàm F(U,[0,1]) với U là vũ trụ ứng vớithuộc tính đó
Định nghĩa 1.2 [50] Tập mờ F được gọi là chuẩn nếu tồn tại ít nhất một phần
Định nghĩa 1.4 [1] Cho F là tập mờ trên tập vũ trụ U
(1): Giá đỡ (Support) S F của tập mờ F là tập các phần tử có giá trị hàm
thuộc lớn hơn 0 Có nghĩa là S F ={x ∈ U|µ F (x) > 0 }.
(2): Lõi (Core) C F của tập mờ F là tập các phần tử có giá trị hàm thuộc
Trang 241.3.2 Các phép toán trên tập mờ
Tương tự như lý thuyết tập hợp, trên các tập mờ cũng định nghĩa một sốphép toán: bằng nhau, bao nhau, giao, hợp [1] là sự mở rộng các định nghĩatrên lý thuyết tập hợp
Định nghĩa 1.5 [1] Cho F và F1 là hai tập mờ trên U
(1): F bằng F1, ký hiệu F = F1, nếu µ F (x) = µ F1(x), ∀x ∈ U
(2): F chứa trong F1, ký hiệu F ⊆ F1, nếu µ F (x) ≤ µ F1(x), ∀x ∈ U.
(3): Hợp của hai tập mờ F và F1, ký hiệu F ∪ F1, là một tập mờ trên U với
1.3.3 Tổng quát hoá ba phép toán cơ bản trên tập mờ
Ngoài ba phép toán cơ bản min, max và phần bù được dùng thao tác trêncác tập mờ, để tổng quát hơn có thể định nghĩa họ các toán tử T là t-norm,t-conorm và N-Negation cho các phép toán trên
Định nghĩa 1.7 [1] Hàm T: [0,1] x [0,1] → [0,1] được gọi là t-norm khi và chỉ
khi thoả mãn ∀x, y, z ∈ [0, 1]:
(1) T(x,y) = T(y,x)
(2) T(x,y) ≤ T(x,z), ∀y ≤ z.
(3) T(x,T(y,z)) = T(T(x,y),z)
Trang 251.3.4 Biến ngôn ngữ
Trong [51] L.A.Zadeh đã viết "thiếu hụt tính chính xác bề ngoài của những vấn đề phức tạp một cách tự nhiên là tìm cách sử dụng các biến ngôn ngữ, đó là các biến mà giá trị của chúng không phải là số mà là các từ hoặc các câu trong ngôn ngữ tự nhiên hoặc nhân tạo Động lực cho việc sử dụng các từ, các câu hơn các số là đặc trưng ngôn ngữ của các từ, các câu thường là ít xác định hơn của số".
Nói tóm lại, ý trên đây đã khái quát cho khái niệm biến ngôn ngữ Một cáchhình thức biến ngôn ngữ được định nghĩa như sau
Định nghĩa 1.10 [51] Biến ngôn ngữ là một bộ năm (X, T (X), U, R, M ), trong
đó X là tên biến, T (X) là tập các giá trị ngôn ngữ của biến X, U là không gian
Trang 26tham chiếu của biến cơ sở u, mỗi giá trị ngôn ngữ xem như là một biến mờ trên
U kết hợp với biến cơ sở u, R là một qui tắc cú pháp sinh các giá trị ngôn ngữ của T (X), M là qui tắc ngữ nghĩa gán mỗi giá trị ngôn ngữ trong T (X) với một tập mờ trên U
Ví dụ 1.2 [51] Cho X là biến ngôn ngữ có tên là AGE, biến cơ sở u lấy theo
số tuổi của con người có miền xác định là U = [0,100] Tập các giá trị ngôn ngữ T(AGE) = {old, very old, more or less young, less young, very young } là một qui tắc sinh các giá trị này M gán ngữ nghĩa mỗi tập mờ với một giá trị ngôn ngữ Chẳng hạn, đối với giá trị nguyên thủy old, M (old) = {(u, µ old (u) |u ∈ [0, 100]},
Các đặc trưng của biến ngôn ngữ
Trong thực tế có rất nhiều biến ngôn ngữ khác nhau về các giá trị nguyên
thủy, chẳng hạn như biến ngôn ngữ SỐ NGÀY LÀM VIỆC có giá trị nguyên thuỷ là ít, nhiều, biến ngôn ngữ LƯƠNG có giá trị nguyên thủy là thấp, cao, .
Tuy nhiên, những kết quả nghiên cứu đối với một miền trị của một biến ngônngữ cụ thể vẫn giữ được ý nghĩa về mặt câu trúc đối với miền giá trị của cácbiến còn lại Đặc trưng này được gọi là tính phổ quát của biến ngôn ngữ.Ngữ nghĩa của các gia tử và các liên từ hoàn toàn độc lập với ngữ cảnh, điềunày khác với giá trị nguyên thủy của các biến ngôn ngữ lại phụ thuộc vào ngữ
cảnh Ví dụ, ta nói LƯƠNG của cán bộ An là rất cao, khi đó được hiểu rằng LƯƠNG khoảng trên 8.000.000 đồng, nhưng ta nói CHIỀU CAO của cán bộ An
là rất cao thì được hiểu rằng CHIỀU CAO khoảng trên 1.8m Do đó, khi tìm
kiếm mô hình cho các gia tử và các liên từ chúng ta không quan tâm đến giá trị
nguyên thuỷ của biến ngôn ngữ đang xét Đặc trưng này được gọi là tính độc lập ngữ cảnh của gia tử và liên từ.
Các đặc trưng trên cho phép chúng ta sử dụng cùng một tập các gia tử vàxây dựng một cấu trúc toán học cho miền giá trị của các biến ngôn ngữ khácnhau
Trang 271.4 Mô hình biểu diễn dữ liệu mờ với ngữ nghĩa của đại số
gia tử
1.4.1 Đại số gia tử
Vấn đề sử dụng tập mờ để biểu diễn các giá trị ngôn ngữ và dùng các phép toán
trên tập mờ để biểu thị các gia tử ngôn ngữ như µ rattre = (µ tre)2, µ itnhieutre =
(µ tre)1/2, đã cho phép thực hiện các thao tác dữ liệu mờ, đáp ứng nhu cầu thực
tế của con người Tuy nhiên, theo cách sử dụng tập mờ ta thấy có nhiều nhượcđiểm do việc xây dựng các hàm thuộc và xấp xỉ các giá trị ngôn ngữ bởi các tập
mờ còn mang tính chủ quan, phụ thuộc nhiều vào ý kiến chuyên gia cho nên dễmất mát thông tin Mặc khác, bản thân các giá trị ngôn ngữ có một cấu trúcthứ tự nhưng ánh xạ gán nghĩa sang tập mờ, không bảo toàn cấu trúc đó nữa
Do đó, vấn đề đặt ra là cần có một cấu trúc toán học để mô phỏng đượcchính xác hơn cấu trúc ngữ nghĩa của một khái niệm mờ Trong [30][31] N.C.Ho
và cộng sự đã đưa ra ĐSGT và ĐSGT mở rộng, [7][34] đề xuất ĐSGT tuyến tínhđầy đủ đã giải đáp đầy đủ cho bài toán trên
1.4.1.1 Một số khái niệm
Chúng ta xét miền ngôn ngữ của biến chân lý T RU T H gồm các từ sau: Dom(T RU T H) = {true, false, very true, very false, more-or-less true, more-or- less false, possibly true, approximately false, approximately true, approximately false, little true, little false, very possibly true, very possibly false, }, trong đó true, false là các từ nguyên thuỷ, các từ nhấn (modifier or intensifier) very, more-or-less, possibly, approximately, little gọi là các gia tử (hedges).
Khi đó, miền ngôn ngữ T = dom(T RU T H) có thể biểu thị như một đại số
X = (X, G, H, ≤), trong đó G là tập các từ nguyên thuỷ được xem là các phần
tử sinh H = H − ∪ H+ với H − và H+ tương ứng là tập các gia tử dương, âm
và được xem như là các phép toán một ngôi, quan hệ ≤ trên các từ (các khái
niệm mờ) là quan hệ sắp thứ tự tuyến tính trên X cảm sinh từ ngữ nghĩa của
ngôn ngữ Ví dụ dựa trên ngữ nghĩa, các quan hệ thứ tự sau là đúng: false <
Trang 28true, more true < very true nhưng very false < more false, possibly true < true
nhưng false < possibly false, Tập X được sinh ra từ G bởi các phép toán trong
H Như vậy, mỗi phần tử của X sẽ có dạng biểu diễn x = h n h n −1 h1c, c ∈ G Tập tất cả các phần tử được sinh ra từ một phần tử x được ký hiệu là H(x) Nếu G có đúng hai từ nguyên thuỷ mờ, thì một được gọi là phần tử sinh dương
ký hiệu là c+, một gọi là phần tử sinh âm ký hiệu là c − và ta có c − < c+ Trong
ví dụ trên true là phần tử sinh dương còn false là phần tử sinh âm.
Về mối quan hệ giữa các gia tử chúng ta có các khái niệm sau:
(1) Mỗi gia tử hoặc là dương, hoặc là âm đối với bất kỳ một gia tử nào khác,
kể cả chính nó
(2) Nếu hai khái niệm u và v độc lập, nghĩa là u / ∈ H(v) và v /∈ H(u) thì
∀x ∈ H(u) ta có x /∈ H(v) Ngoài ra nếu u và v là không sánh được thì bất
kỳ x ∈ H(u) cũng không sánh được với bất kỳ y ∈ H(v).
(3) Nếu x ̸= hx thì x /∈ H(x) và nếu h ̸= k và hx < kx thì h ′ hx < k ′ kx với
mọi gia tử h, k, h ′ , k ′ Hơn nữa hx ̸= kx thì hx độc lập với kx.
(4) Nếu u / ∈ H(v) và u ≤ v (w ≥ v) thì u ≤ hv (u ≥ hv), với mọi gia tử h.
Định nghĩa trên mới chỉ dựa vào các tính chất ngữ nghĩa và di truyền ngữnghĩa của ngôn ngữ nhưng đã tạo ra cấu trúc đủ giàu để xây dựng các quan hệđối sánh trong mô hình CSDL mờ
Tiếp theo là định lý thể hiện ý nghĩa trực quan trong ngôn ngữ về tính chất
di truyền ngữ nghĩa của ngôn ngữ
Định lý 1.1 [12] Giả sử x = h n h1u và y = k m k1u là các biểu diễn chính tắc của x và y đối với u Khi đó tồn tại một chỉ số j ≤ min{m, n} + 1 sao cho với mọi i < j ta có h i = k i và
(1) x < y khi và chỉ khi h j x j < k j x j , trong đó x j = h j −1 h1u;
(2) x = y khi và chỉ khi n = m = j và h j x j = k j x j ;
Trang 29(3) x và y là không sánh được khi và chỉ khi h j x j và k j x j là không sánh được.
Vì tất cả các thuộc tính có miền trị chứa giá trị số trong CSDL đều tuyểntính, nên một cách tự nhiên ta giả thiết trong luận án này, ĐSGT được sử dụng
là ĐSGT tuyến tính, do đó tập H+ và H − là tập sắp thứ tự tuyến tính Như vậy,
cho X = (X, G, H, ≤) với G = {0, c − , W, c+, 1 }, H = H − ∪H+, với giả thiết H+
= {h1, , h p } và H − = {h −1 , , h −q }, với h1 > · · · > h p và h −1 < · · · < h −q
là dãy các gia tử, ta có các định nghĩa liên quan như sau :
Định nghĩa 1.11 [12] Cho X =(X, G, H, ≤) là một ĐSGT, với mỗi x ∈ X, độ
dài của x được ký hiệu |x| và xác định như sau:
(1) Nếu x = c+ hoặc x = c − thì |x| = 1
(2) Nếu x = hx ′ thì |x| = 1 + |x’|, với mọi h ∈ H.
Định nghĩa 1.12 [32] Hàm f m : X → [0, 1] được gọi là độ đo tính mờ trên X
nếu thoả mãn các điều kiện sau:
(1) f m là độ đo mờ đầy đủ trên X, tức là ∑
−q≤i≤p,i̸=0
f m(h i u) = f m(u) (2) Nếu x là khái niệm rõ, tức là H(x)={x} thì fm(x)=0, do đó f m(0) =
f m(W ) = f m(1) = 0.
(3) Với ∀x, y ∈ X, ∀h ∈ H, ta có f m(hx)
f m(x) = f m(hy) f m(y) , nghĩa là tỉ số này không phụ thuộc vào x và y, được kí hiệu là µ(h) gọi là độ đo tính mờ (fuzziness measure) của gia tử h.
Trong đại số gia tử mỗi phần tử x ∈ X đều mang dấu âm hay dương, được
gọi là PN-dấu và được định nghĩa đệ quy như sau:
Định nghĩa 1.13 [32] (hàm Sgn) Sgn: X → {−1, 0, 1} là hàm dấu được xác định như sau, ở đây h, h ∈ H, và c ∈ {c − , c+}:
(1) Sgn(c −) =−1, Sgn(c+) = +1
(2) Sgn(h ′ hx) = 0, nếu h ′ hx = hx
Trang 30(3) Sgn(h ′ hx) = −Sgn(hx), nếu h ′ hx ̸= hx và h’ là âm tính đối với h (4) Sgn(h ′ hx) = +Sgn(hx), nếu h ′ hx ̸= hx và h’ dương tính đối với h.
Mệnh đề 1.1 [32] Với ∀x ∈ X, ta có: ∀h ∈ H, nếu Sgn(hx) = +1 thì hx > x,
nếu Sgn(hx) = -1 thì hx < x và nếu Sgn(hx) = 0 thì hx = x.
1.4.1.2 Các tính chất của độ đo tính mờ trong ĐSGT
Dựa trên cấu trúc của ĐSGT, trong đó quan hệ giữa các phần tử là quan hệthứ tự ngữ nghĩa, mô hình toán học của tính mờ và độ đó tính mờ của các kháiniệm mờ đã được định nghĩa trong [8][32], một số mệnh đề và bổ đề liên quan
đến hàm f m và hàm v sẽ được trình bày tóm tắt dưới đây.
Mệnh đề 1.2 [8] Độ đo tính mờ f m và độ đo tính mờ của gia tử µ(h), ∀h ∈ H,
Bổ đề 1.1 [8] Cho f m là hàm độ đo tính mờ trên X và hàm định lượng ngữ
nghĩa v trên X gắn với f m Khi đó tồn tại một phân hoạch ∆ gắn với fm sao
cho phát biểu sau là đúng, với ∀x ∈ X: v(x) ∈ I(x) và v(x) chia đoạn I(x) thành
hai đoạn con tỷ lệ α : β Và nếu Sgn(h1x) = 1 thì đoạn con tương ứng với α lớn hơn đoạn con tương ứng với β và nếu Sgn(h1x) = -1 thì đoạn con tương ứng với
α nhỏ hơn đoạn con tương ứng với β.
1.4.2 Đại số gia tử tuyến tính đầy đủ
Cho một ĐSGT tuyến tính đầy đủAX = (X, G, H, Σ, Φ, ≤), trong đó Dom(X )
= X là miền các giá trị ngôn ngữ của thuộc tính ngôn ngữ X được sinh tự do
Trang 31từ tập các phần tử sinh G = {1, c − , W, c+, 0 } bằng việc tác động tự do các phép toán một ngôi trong tập H, Σ và Φ là hai phép tính với ngữ nghĩa là cận trên đúng và cận dưới đúng của tập H(x), tức là Σx = supermumH(x) and
Φx = inf imumH(x), trong đó H(x) là tập các phần tử sinh ra từ x, còn quan
hệ ≤ là quan hệ sắp thứ tự tuyến tính trên X cảm sinh từ ngữ nghĩa của ngôn
ngữ
1.4.2.1 Một số khái niệm
1 Khoảng mờ của khái niệm mờ
Giả sử thuộc tính (hay biến ngôn ngữ) X có miền tham chiếu thực là khoảng [a, b] Để chuẩn hóa, nhờ một phép biến đổi tuyến tính, ta giả thiết mọi miền
như vậy đều là khoảng [0, 1] Khi đó, tính chất (2) trong mệnh đề 1.2 cho phép
ta xây dựng hai khoảng mờ của hai khái niệm nguyên thủy c − và c+, ký hiệu
là I(c − ) và I(c+) với độ dài tương ứng là f m(c − ) và f m(c+) sao cho chúng tạo
thành một phân hoạch của miền tham chiếu [0, 1] và f m(c − ) và f m(c+) là đồng biến với c − và c+, tức là c − ≤ c+ kéo theo I(c −)≤ I(c+)
2 Khoảng mờ mức k
Một cách quy nạp, giả sử rằng với ∀x ∈ X k −1 = {x ∈ X : x có độ dài
|x| = k − 1}, ta đã xây dựng được hệ các khoảng mờ {I(x) : x ∈ X k −1 và
|I(x)| = fm(x)} sao cho chúng là đồng biến và tạo thành một phân hoạch của đoạn [0, 1] Khi đó, trên mỗi khoảng mờ I(x), độ dài f m(x) của x ∈ X k −1, nhờ
tính chất (4) trong mệnh đề 1.2, ta có thể xây dựng được họ {I(h i x) : −q ≤
i ≤ p, i ̸= 0, |I(h i x) | = fm(h i x) } sao cho chúng là một phân hoạch của khoảng
mờ I(x) Có thể thấy họ {I(h i x) : −q ≤ i ≤ p, i ̸= 0, |I(h i x) | = fm(h i x) và
x ∈ X k −1 } = {I(y) : y ∈ X k và |I(y)| = fm(y)} là một phân hoạch của [0, 1] Các khoảng này gọi là các khoảng mờ mức k.
Như vậy, có một sự liên hệ chặt chẽ giữa ngữ nghĩa ngôn ngữ của các kháiniệm mờ và các khoảng mờ trong đoạn [0, 1] như sau:
Mỗi phần từ x ∈ X đều được gắn với một khoảng mờ I(x) có độ dài chính
Trang 32bằng độ đo tính mờ của x.
Nếu x ′ là hậu tố của x, tức là nó là xâu con bên trái cùng của xâu x, hay nói khác đi, x ′ sinh ra xâu x, thì I(x) ⊂ I(x ′).
Nếu x và x ′ có cùng độ dài và x ≤ x ′ thì I(x) ≤ I(x ′).
Đây là những tính chất rất quan trọng của các khoảng mờ được định nghĩa
dựa trên cấu trúc ĐSGT và là cơ sở để định nghĩa hệ lân cận ngữ nghĩa của x
đã được định nghĩa trong [33], sẽ được trình bày tóm tắt dưới đây
Định nghĩa 1.14 [33] Ánh xạ f : X → [0, 1] được gọi là ánh xạ định lượng của
ĐSGT AX nếu nó thỏa mãn các điều kiện sau:
là ánh xạ cảm sinh bởi độ đo tính mờ f m của ngôn ngữ nếu nó được xác định
Trang 33Ta có: v(Φh j x) = v(x) + Sgn(h j x) {∑j −1
i=sign(j) µ(h i )f m(x) } và v(Σh j x) = v(x) + Sgn(h j x) {∑j
i=sign(j) µ(h i )f m(x) } Thực chất của ánh xạ v là mọi x = h j u, v(x) chính là điểm chia trong khoảng
mờ I(x) theo tỷ lệ α:β nếu Sgn(h p h j u) = +1 và nếu ngược lại, nó là điểm chia trong khoảng I(x) theo tỷ lệ β:α Như vậy, chúng ta có mối quan hệ chặt chẽ
giữa giá trị ánh xạ định lượng của ĐSGT và ngữ nghĩa của giá trị ngôn ngữ đượcbiểu thị qua các khoảng mờ của chúng
Từ mệnh đề 1.2 và định nghĩa 1.5 chúng ta thấy, với bất kỳ một ĐSGT, taluôn xây dựng được độ đo tính mờ và hàm định lượng cảm sinh từ độ đo tính mờ
bằng cách lựa chọn các giá trị độ đo tính mờ của các phần tử nguyên thủy c −
và c+, và của các gia tử sao cho chúng thỏa mãn tính chất (2) và (5) của mệnh
đề 1.2, và được gọi là bộ tham số định lượng Nói khác đi, chúng ta có một bộtham số để điều chỉnh cho thích ứng với một ứng dụng cụ thể nào đó Ta có các
khoảng mờ I(x) = (v A (Φx), v A (Σx)].
1.4.2.2 Các tính chất tôpô
Định lý 1.2 [33] AX = (X, G, H, Σ, Φ, ≤) là một ĐSGT đầy đủ, và v được định nghĩa như trong định nghĩa 1.5 Khi đó, v(H(x)) là trù mật trong khoảng [v A (Φx), v(Σx)], ∀x ∈ X Hơn nữa, v(Φx) = inf v(H(x)), v(Σx) = sup v(H(x))
và f m(x) = v(Σx) − v(Φx), do đó fm(x) = d(v(H(x))), ở đây d(A) ⊆ [0, 1] được định nghĩa là đường kính của A vì thế v[H(G)] trù mật trong [0, 1].
Định lý 1.3 [33] Giả thiết cho như trong định lý 1.2, khi đó, ta có tỉ lệ
(1) v là ánh xạ 1-1 và bảo toàn thứ tự, nghĩa là x < y ⇔ v(x) < v(y);
Trang 34(2) Ảnh v(H(c − , c+)) = v(H(c −)) ∪ v(H(c+)) là trù mật trong đoạn [0, 1]; (3) Tỉ lệ d(v(H(hx))) d(v(H(x))) = d(v(H(hy))) d(v(H(y))) là đúng ∀x, y ∈ X.
Khi đó v là ánh xạ định lượng ngữ nghĩa trong định nghĩa 1.6, và ta có µ(h)
= d(v(H(hx))) d(v(H(x))) và µ(c+) = d(H(c+))
1.4.2.3 Ngữ nghĩa dữ liệu dựa trên lân cận tôpô của ĐSGT
Xét một CSDL {U; Const }, trong đó U = {A1, A2, , A n } là tập vũ trụ các thuộc tính, Const là một tập các ràng buộc dữ liệu của CSDL Mỗi thuộc tính
A được gắn với một miền giá trị thuộc tính, ký hiệu là Dom(A), trong đó một
số thuộc tính cho phép nhận các giá trị ngôn ngữ trong lưu trữ trong CSDL haytrong các câu hỏi truy vấn và được gọi là thuộc tính ngôn ngữ Những thuộc
tính còn lại được gọi là thuộc tính thực hay kinh điển Thuộc tính thực A được gắn với một miền giá trị kinh điển, ký hiệu là D A Thuộc tính ngôn ngữ A sẽ được gắn một miền giá trị kinh điển D A và một miền giá trị ngôn ngữ LD A hay
là tập các phần tử của một ĐSGT Để bảo đảm tính nhất quán trong xử lý ngữnghĩa dữ liệu trên cơ sở thống nhất kiểu dữ liệu của thuộc tính ngôn ngữ, mỗi
thuộc tính ngôn ngữ sẽ được gắn với một ánh xạ định lượng v A : LD A → D A
được xác định bởi một bộ tham số định lượng của A Như vậy, mỗi giá trị ngôn ngữ x của A sẽ được gán một nhãn giá trị thực v A ∈ D A được xem như giá trị
đại diện của x Việc đánh giá độ tương tự giữa các dữ liệu của một thuộc tính
A được dựa trên khái niệm lân cận mức k của một giá trị ngôn ngữ, với k là số
nguyên dương
Các tác giả trong [5][10] đã lấy các khoảng mờ của các phần tử độ dài k làm
độ tương tự giữa các phần tử, nghĩa là các phần tử mà các giá trị đại diện của
chúng thuộc cùng một khoảng mờ mức k là tương tự mức k Tuy nhiên, theo cách xây dựng các khoảng mờ mức k, giá trị đại diện của các phần tử x có độ dài nhỏ hơn k luôn là đầu mút của các khoảng mờ mức k Do vậy, khi xác định lân cận mức k mong muốn, các giá trị đại diện như vậy phải là điểm trong của lân cận mức k.
Trang 35Ta luôn luôn giả thiết rằng mỗi tập H − và H+ chứa ít nhất hai gia tử Xét
Xk là tập tất cả các phần tử độ dài k Dựa vào khoảng mờ mức k và mức k+1
các tác giả [5],[10] đã xây dựng một phân hoạch của miền [0, 1] như sau:
Với k = 1, các khoảng mờ mức 1 gồm I(c − ) và I(c+) Các khoảng mờ mức
2 trên khoảng I(c+) là I(h −q c+) ≤ I(h −q+1 c+) ≤ I(h −2 c+) ≤ I(h −1 c+) ≤
v A (c+) ≤ I(h1c+) ≤ I(h2c+) ≤ ≤ I(h p−1 c+)≤ I(h p c+) Khi đó, ta xây dựng
phân hoạch về độ tương tự mức 1 gồm các lớp tương đương sau: S(0) = I(h p c −);
S(c − ) = I(c −)\[I(h −q c −)∪ I(h p c − )]; S(W) = I(h −q c −) ∪ I(h −q c+); S(c+) =
I(c+)\[I(h −q c+)∪ I(h p c+)] và S(1) = I(h p c+)
Ta thấy, trừ hai điểm đầu mút v A (0) = 0 và v A(1) = 1, các giá trị đại diện
v A (c − ), v A (W), v A (c+) đều là điểm trong tương ứng của các lớp tương tự mức 1 S(c − ), S(W) và S(c+)
Tương tự, với k = 2, chẳng hạn, I(h i c+) = (v A (Φh i c+), v A (Σh i c+)] với hai
khoảng mờ kề là I(h i−1 c+) và I(h i+1 c+), ta sẽ có các lớp tương đương dạng
sau: S(h i c+) = I(h i c+)\[I(h p h i c+)∪ I(h −q h i c+)]; S(Φh i c+) = I(h −q h (i −1) c+)∪ I(h −qh i c+) và S(Φh i c+) = I(h p h i c+)∪ I(h p h i c+), với i sao cho −q ≤ i ≤ p và
i ̸= 0.
Bằng cách tương tự như vậy, có thể xây dựng các phân hoạch các lớp tương
tự mức k bất kỳ Tuy nhiên, trong thực tế ứng dụng theo [6] thì k ≤ 4, tức có tối
đa 4 gia tử tác động liên tiếp lên phần tử nguyên thủy c − và c+ Các giá trị rõ
và các giá trị mờ gọi là có độ tương tự mức k nếu các giá trị đại diện của chúng cùng nằm trong một lớp tương tự mức k.
Lân cận mức k của khái niệm mờ: Giả sử phân hoạch các lớp tương tự
mức k là các khoảng S(x1), S(x2), , S(x m ) Khi đó, mỗi giá trị ngôn ngữ fu chỉ
và chỉ thuộc về một lớp tương tự, chẳng hạn đó là S(x i ) và nó gọi là lân cận mức
k của fu và ký hiệu là F N k (f u).
Trang 361.5 Mô hình CSDL hướng đối tượng mờ
Trong phần 1.1 chúng tôi đã trình bày tổng quan về các hướng tiếp cận choviệc nghiên cứu mô hình CSDL HĐT với thông tin mờ và không chắc chắn Cácnghiên cứu, phát triển trên mô hình CSDL HĐT mờ dựa trên mô hình CSDLHĐT truyền thống thường tập trung vào các vấn đề sau [19][23][24][25][53]:
1 Biểu diễn giá trị thuộc tính không chắc chắn hoặc không chính xác của cácđối tượng
2 Biểu diễn và thực thi các phương thức lớp
3 Mô hình hóa khả năng áp dụng không chắc chắn của các tính chất (thuộctính hoặc phương thức) lớp
4 Mô hình hóa các quan hệ lớp và định nghĩa mức độ không chắc chắn củacác đối tượng
5 Xác định cơ chế thừa kế không chắc chắn của các đối tượng
Như đã đề cập ở trên, các nghiên cứu về mô hình CSDL hướng đối tượng
mờ chủ yếu tập trung vào việc mở rộng mô hình dữ liệu rõ đã có theo các cáchtiếp cận khác nhau và cho phép biểu diễn, thao tác trên dữ liệu mờ Do đó, các
mô hình CSDL mờ này cũng chỉ thống nhất trên một tập các khái niệm chungnhất (tập lõi) trong mô hình hạt nhân của ODMG [22] Có thể thấy rằng, cáckết quả nghiên cứu trên CSDL HĐT mờ luôn được xem xét với một mô hình cụthể, các kết quả này sẽ giải quyết cho một lớp các bài toán với một tập con cáckhái niệm, tính chất đặc trưng hướng đối tượng đã được cài đặt trên mô hình.Nhờ những ưu điểm của cấu trúc ĐSGT như đã trình bày trong phần mởđầu, chúng tôi xem các giá trị trên miền của thuộc tính đối tượng là một cấutrúc ĐSGT và các giá trị này được sinh ra từ hai phần tử dương và âm trongĐSGT Ngoài ra, chúng tôi xem mỗi phương thức được biểu diễn như một hàmthao tác trên các giá trị tập mờ của thuộc tính đối tượng Trong mô hình này,chúng tôi dựa trên tính toán lân cận tương tự, độ đo ngữ nghĩa và các quan hệ
Trang 37đối sánh của chúng để đưa ra các phụ thuộc dữ liệu của đối tượng mờ và các vấn
đề liên quan, một số phép toán đại số, tích hợp nhiều đại số gia tử để thực hiệnviệc thao tác và truy vấn dữ liệu trên mô hình CSDL HDT với thông tin ngônngữ mờ
1.5.1 Đối tượng mờ
Các đối tượng được dùng để đặc tả các thực thể trong thế giới thực hoặc cáckhái niệm trừu tượng Các đối tượng có các thuộc tính hay các mối quan hệ giữađối tượng này với một hay nhiều đối tượng khác Mỗi đối tượng lưu trữ trong hệthống CSDL HĐT được xác định bởi một định danh duy nhất Định danh này
do hệ thống tự động tạo và được gọi là định danh đối tượng (OID) Giá trị OIDđược hệ thống sử dụng để xác định duy nhất một đối tượng và dùng để tạo racác tham chiếu bên trong đối tượng, người sử dụng không tham chiếu được giátrị này Các OID thỏa mãn hai tính chất sau [23]:
1 Giá trị OID của một đối tượng không thay đổi, điều này đảm bảo tính duynhất của mỗi đối tượng Do đó, một hệ thống CSDL HĐT phải có cơ chếtạo ra các OID và đảm bảo tính bất biến của chúng
2 Mỗi giá trị OID chỉ được sử dụng duy nhất một lần; nghĩa là, nếu một đốitượng bị xóa khỏi hệ thống CSDL thì giá trị OID này cũng không được gáncho một đối tượng khác
Từ hai tính chất này chứng tỏ rằng OID không phụ thuộc vào giá trị thuộctính của bất kỳ đối tượng nào, bởi vì giá trị của thuộc tính có thể thay đổi vàchỉnh sửa Ngoài ra, OID cũng không dựa trên địa chỉ vật lý của đối tượng, bởi
vì địa chỉ vật lý có thể thay đổi sau mỗi lần tổ chức lại CSDL về phương diệnvật lý Tuy nhiên, một số hệ thống vẫn có thể sử dụng địa chỉ vật lý làm OID đểtăng hiệu quả truy vấn Thông thường, các hệ thống HĐT sử dụng số nguyênlớn để biểu diễn giá trị của OID, và đó sử dụng sử dụng một bảng băm để ánh
xạ giạ trị OID đến địa chỉ vật lý hiện tại của đối tượng
Mỗi đối tượng được xác định bởi tập các thuộc tính mô tả các thông tin đặctrưng của đối tượng và các phương thức thể hiện các hành vi xử lý các thông
Trang 38tin và mối quan hệ giữa các đối tượng trong hệ thống Thuộc tính của đối tượngđược xác định bởi các giá trị cụ thể, giá trị này có thể là giá trị rõ hoặc vì một lý
do nào đó mà ta không xác định được giá trị chính xác của nó Chẳng hạn, thuộc
tính tuổi của một đối tượng được cho là “khoảng 18 ”, hoặc “từ 20 đến 22 ”, hoặc
có thể là một giá trị ngôn ngữ “rất trẻ ” Hoặc trong một ngữ cảnh khác, thuộc tính lương của đối tượng là “cao”, “khả năng thấp”, Những thông tin không
chính xác, không rõ ràng như vậy gọi là thông tin mờ Như vậy, một đối tượng
là mờ vì có một hoặc nhiều thuộc tính có chứa thông tin mờ (gọi là thuộc tínhmờ), và phương thức sử dụng các thuộc tính này để đọc hay sửa đổi thì phươngthức cũng trở nên mờ Không mất tính tổng quát, về mặt hình thức, đối tượng
có ít nhất một thuộc tính mờ được gọi là đối tượng mờ
1.5.2 Lớp mờ
Các đối tượng có những thuộc tính và hành vi ứng xử giống nhau thườngđược đưa vào một lớp và tổ chức các lớp thành hệ thống phân cấp Về mặt lýthuyết, một lớp có thể được xem xét từ hai quan điểm khác nhau [23]:
1 Thứ nhất, một lớp mở rộng được định nghĩa bởi danh sách các đối tượngcủa nó
2 Thứ hai, một lớp khái niệm được xác định bởi một tập các thuộc tính vàcác giá trị hợp lệ của các thuộc tính (và các phương thức thao tác trên cácthuộc tính này)
Vì vậy, một lớp đươc xem là mờ bởi các lý do sau:
1 Thứ nhất, một số đối tượng của một lớp được xác định là đối tượng mờ,khi đó, những đối tượng này thuộc về lớp với độ thuộc nhất định
2 Thứ hai, khi một lớp được định nghĩa, miền trị của một thuộc tính nào đó
có thể là mờ và như vậy một lớp mờ được hình thành
3 Thứ ba, một lớp con được thừa kế một hoặc nhiều lớp cha, trong đó có ítnhất một lớp cha là lớp mờ
Trang 39Sự khác nhau chính giữa các lớp mờ và các lớp rõ đó là ranh giới của các lớp
mờ không rõ ràng Sự không chính xác trong ranh giới giữa các lớp mờ là do
sự không chính xác của những giá trị trong miền thuộc tính Trong CSDL HĐT
mờ, các lớp là mờ vì miền trị thuộc tính của chúng chứa các giá trị mờ Do đó,một đối tượng thuộc mờ vào một lớp xảy ra vì lớp hoặc đối tượng đó có thể mờ,
và một lớp là lớp con của một lớp khác với độ thuộc k (k ∈ Z+) nào đó vì đó làlớp mờ Do vậy, việc đánh giá mối quan hệ lớp đối tượng mờ và phân cấp thừa
kế mờ là quan trọng của mô hình CSDL HĐT mờ
1.5.3 Giá trị thuộc tính
Giá trị thuộc tính của đối tượng có thể là một trong bốn trường hợp sau:
1 Giá trị chính xác: Giá trị có thể là các giá trị của các kiểu dữ liệu nguyên
thủy như các kiểu số hoặc kiểu xâu ký tự, hoặc là tập hợp các giá trị nguyênthủy Miền giá trị trong trường hợp này chúng ta có thể dễ dàng thao tácbằng việc sử dụng các phép toán (≤, ≥, =) trong biểu thức điều kiện của
câu hỏi truy vấn; hoặc chúng ta có thể xây dựng các điều kiện mờ để thực
hiện truy vấn dữ liệu, ví dụ “cho biết tất cả đối tượng nhân viên có thu nhập thấp hơn lương trung bình? ”
2 Giá trị thiếu chính xác (hoặc mờ): Trường hợp với giá trị thiếu chính
xác (hoặc mờ) rất phức tạp, thường thì nhãn ngôn ngữ được sử dụng đểbiểu diễn cho những loại giá trị này Những kiểu giá trị thiếu chính xácphải được xem xét theo ngữ nghĩa của các giá trị thiếu chính xác
3 Đối tượng: Trong trường hợp này giá trị thuộc tính có thể tham chiếu đến
một đối tượng khác (đối tượng phức) Đối tượng mà nó tham chiếu đến cóthể mờ
4 Sưu tập (collection): Giá trị thuộc tính có thể là tập các giá trị hoặc tập
các đối tượng Sự thiếu chính xác của các giá trị thuộc tính này được chiathành 2 mức:
a Tập các giá trị này có thể mờ
Trang 40b Tập các đối tượng mà các đối tượng này có thể mờ.
1.5.4 Phương thức
Thuộc tính và phương thức đối tượng, là một trong những khái niệm trungtâm của mô hình CSDL HĐT Theo đó các thuộc tính thể hiện thông tin vềtrạng thái của đối tượng, còn các phương thức được xem như là những đặc tính
mô tả các hành vi của chúng Phương thức biểu diễn các hành động hay thaotác có thể được thực hiện bởi một đối tượng hoặc trên một đối tượng Việc thựchiện một thao tác có thể làm thay đổi giá trị thuộc tính của đối tượng, nghĩa làlàm thay đổi trạng thái của đối tượng Ngoài ra, phương thức còn là công cụ xácđịnh kết quả để hỗ trợ trong cơ chế trao đổi thông tin giữa các đối tượng quathông báo Mỗi phương thức có một tên và một thân thực hiện một thao tác nào
đó của đối tượng hoặc trên đối tượng Thông thường, việc thực thi các thao táccủa đối tượng bởi phương thức có một kết quả nào đó Phương thức không chỉcho phép biểu diễn các thao tác của đối tượng hoặc trên đối tượng mà còn chophép truy vấn thông tin trong CSDL thông qua thực thi phương thức
Trong mô hình CSDL HĐT mờ, các giá trị thuộc tính là các giá trị chính xáchoặc mờ, trong khi đó phương thức được biểu diễn như một hàm thao tác trêngiá trị các thuộc tính này Chính vì vậy, phương thức xác định các đối tượng lớpnày cũng trở nên mơ hồ và không chắc chắn
Cho C là một lớp với tập thuộc tính Attr(C) = {A1, A2, , A n} Với nhữngtính chất của giá trị thuộc tính đã nêu ở trên, vậy miền giá trị của thuộc tính
kinh điển của A i là Dom(A i ) = Cdom(A i ), miền giá trị thuộc tính mờ A j là
Dom(A j ) = Cdom(A j)∪ F dom(A j ) o là một đối tượng có các thuộc tính {A1,
A2, , A n }, và o.A i biểu thị giá trị của o trên thuộc tính A i (1≤ i ≤ n) Lớp C chứa tập các đối tượng (mờ), ký hiệu C = {o1, o2, , o m }, và o(C) là đối tượng
o của lớp C.
1.5.5 Quan hệ lớp đối tượng mờ
Trong mô hình CSDL HĐT mờ, bốn trường hợp sau đây có thể được dùng
để phân biệt cho các quan hệ lớp đối tượng mờ [23]: