Trong đề tài này chúng tôi đã đạt được một số kết quả sau: + Giải quyết bài toán lập luận mờ với giá trị ngôn ngữ dựa trên khoảng cách của các term trong đại số gia tử tuyến tính.. Qua đ
Trang 1Lời nói đầu
Đề tài này là sự tiếp tục phát triển các kết quả của đề tài cấp Trường “Lập luận
mờ trên cơ sở Đại số gia tử” - Mã số: T.05.TN-70 của chúng tôi Đề tài T.05.TN-70
đã đạt được một số kết quả sau:
+ Một số cơ chế lập luận mờ trên cơ sở đại số gia tử
+ Một số phương pháp nội suy mờ giải bài toán mô hình mờ
+ Bước đầu ứng dụng vào việc đánh giá học sinh với các tham số đầu vào mờ
Dự kiến kết quả đạt được khi đăng ký đề tài này là:
+ Các kỹ thuật lập luận mờ, phương pháp giải bài toán mô hình mờ trên cơ sở đại số gia tử
+ Xây dựng một cơ sở logic mờ giá trị ngôn ngữ làm cơ sở cho lập luận mờ + Phát triển các ứng dụng của lập luận mờ trên cơ sở đại số gia tử trong các lĩnh vực của Tin học cũng như trong thực tiễn
Trong đề tài này chúng tôi đã đạt được một số kết quả sau:
+ Giải quyết bài toán lập luận mờ với giá trị ngôn ngữ dựa trên khoảng cách của các term trong đại số gia tử tuyến tính Qua đó giải quyết bài toán được Lascio – Gilsofi đưa ra trong [8] với một số cơ sở logic chặt chẽ hơn và với phương pháp
đề xuất, trong đề tài đã giải quyết được một loạt các trường hợp lập luận với giá trị ngôn ngữ Các kết quả này được trình bày trong chương 2 và đã được đăng tải qua bài báo [D2]
+ Dựa trên mô hình cơ sở dữ liệu (CSDL) quan hệ mờ giá trị ngôn ngữ của
GS Nguyễn Cát Hồ đề xuất, chúng tôi tiếp tục phát triển các kết quả: xây dựng các phép toán đại số quan hệ và câu truy vấn trên mô hình này Việc truy vấn có thể được cài đặt trên một hệ quản trị CSDL thương mại như Microsoft Foxpro (có modul chương trình cài đặt minh họa) Bên cạnh đó chúng tôi phát triển khái niệm ràng buộc phụ thuộc hàm mờ và các kết quả liên quan về dạng ràng buộc này trên môn hình CSDL nói trên Ngoài ra mối liên hệ giữa mô hình CSDL và ràng buộc phụ thuộc hàm với một lớp công thức logic mờ giá trị ngôn ngữ, cùng nguyên lý hợp giải trên đó cũng được trình bày Các kết quả này trình bày trong chương 3 và
2 bài báo [D7], [D8] và [D9]
+ Chương 4 đưa ra một số kết quả có liên quan đến bài toán mô hình mờ đã được giải quyết Cụ thể là: một phương pháp nội suy giải bài toán mô hình mờ được
đề xuất, giải quyết một bài toán mô hình mờ khá kinh điển có so sánh đánh giá sai
số và đưa ra được một mệnh đề làm nền tảng cho ánh xạ ngược của ánh xạ lượng hóa ngữ nghĩa Đề xuất sự kết hợp việc phân lớp dữ liệu trong quá trình xây dựng
mô hình SISO dựa trên cơ sở đại số gia tử Các kết quả đã được đăng tải trong [10]
và [D1]
Cũng cần lưu ý rằng bài toán mô hình mờ là một cách phát biểu chuẩn của bài toán lập luận mờ trong rất nhiều lĩnh vực như điều khiển học, xấp xỉ hàm mờ … Hơn nữa mô hình cơ sở dữ liệu mờ cùng các ràng buộc dữ liệu và mối liên hệ giữa
Trang 2các ràng buộc dữ liệu với một lớp công thức logic mờ là một trong các ứng dụng của lập luận mờ trong lĩnh vực cơ sở dữ liệu và khai phá dữ liệu mờ Đó là các ứng dụng của lập luận mờ trong Tin học đáng được quan tâm
+ Chương 5 trình bày các ứng dụng của lập luận mờ trong thực tiễn Trong chương này chúng tôi đề cập đến các ứng dụng lập luận mờ trong bài toán đánh giá dạy và học Một số trong các kết quả này đã được đăng qua bài báo [D6]
Ngoài mục đích và ý nghĩa về khoa học cơ bản, đề tài cũng đã tạo ra được một hướng chuyên đề khá mới mẽ cho sinh viên Khoa Tin học - Trường ĐHSP Huế trong việc nâng cao kiến thức về lĩnh vực trí tuệ nhân tạo và các vấn đề liên quan Trong các năm qua, chúng tôi đã hướng dẫn được 5 khóa luận, cố vấn 1 đề tài cấp Trường cho sinh viên về các lĩnh vực có liên quan đến đề tài Chúng tôi cũng đã
hoàn thành tập bài giảng “Đại số gia tử - logic mờ giá trị ngôn ngữ và một số ứng
dụng” phục vụ cho chuyên đề năm sinh viên thứ 3 và thứ 4 trong các năm học 2006
– đến 2009 Các kết quả liên quan của đề tài đã được một số nhóm nghiên cứu khác trích dẫn như [24],[25], www.lrc.ctu.edu.vn/pjob/search
So với dự kiến khi đăng ký, đề tài cơ bản đã hoàn thành các nhiệm vụ đặt ra Tuy vậy đề tài có một số hạn chế sau:
+ Các module chương trình chưa được hoàn thiện và các ứng dụng thực tiễn chưa được triển khai kiểm nghiệm rộng rãi (lưu ý rằng đề tài này thuộc loại hình nghiên cứu cơ bản) Đây cũng là một nhiệm vụ đặt ra trong thời gian tới của đề tài, nếu có kinh phí để triển khai thực tiễn
+ Các kết quả về phương pháp giải bài toán mô hình mờ trên cơ sở đại số gia
tử chưa được phát triển một cách hoàn thiện trong đề tài
+ Cơ sở logic mờ giá trị ngôn ngữ làm cơ sở cho lập luận mờ dựa trên cấu trúc dàn đại số gia tử hữu hạn mà ban đầu chúng tôi đề nghị có hướng tiếp cận khác với các nghiên cứu của GS Nguyễn Cát Hồ Tuy vậy do hạn chế về thông tin và hạn chế của bản thân, hướng đi đó đã có kết quả khá sâu sắc của Yang Xu [28] Chúng tôi chỉ phát triển các kết quả này qua các ứng dụng trong bài toán đánh giá
Đề tài chắc chắn còn khá nhiều hạn chế, rất mong sự quan tâm chỉ bảo của quý Thầy cô, các bạn đồng nghiệp và các bạn sinh viên
Huế, 3/2009
Nguyễn Thế Dũng
Trang 3A PHẦN MỞ ĐẦU
I LÝ DO CHỌN ĐỀ TÀI
Tri thức của con người thường bao gồm 2 phần cơ bản: phần rõ ràng và phần
mơ hồ, không chắc chắn Tuy vậy hầu hết các bài toán trong thực tiễn, thông tin cần
xử lý lại là các thông tin mờ và không chắc chắn
Với các thành tựu của trí tuệ nhân tạo, các hệ chuyên gia, các chương trình xử
lý thông tin dựa trên việc lập luận tương tự lối suy nghĩ trực tiếp của con người qua ngôn ngữ mang tính định tính trên tri thức thu thập được, thay vì tính toán xử lý thông tin mang tính định lượng đang được ứng dụng nhiều trong các lĩnh vực thực tiễn
Việc lập luận trực tiếp trên biến ngôn ngữ tựa như cách lập luận của con người xem ra tự nhiên và trực cảm đối với người sử dụng hơn
Các nghiên cứu về đại số gia tử cũng đã phát triển mạnh mẽ và đã tạo nên một
cơ sở đại số khá đầy đủ cho một logic của việc lập luận mờ trên biến ngôn ngữ Các nghiên cứu trong đề tài Lập luận mờ trên cơ sở Đại số gia tử - Mã số:
T.05.TN-70 đã được nghiệm thu của Nguyễn Thế Dũng cho thấy có rất nhiều vấn
đề về lập luận mờ theo hướng này và các ứng dụng của chúng trong một số lĩnh vực của Tin học và thực tiễn như trí tuệ nhân tạo, hệ chuyên gia, hệ hỗ trợ ra quyết định là rất đáng quan tâm
Việc nghiên cứu đề tài cũng tạo ra một hướng chuyên đề khá mới mẽ cho sinh viên Khoa Tin học - Trường ĐHSP Huế trong việc nâng cao kiến thức về lĩnh vực trí tuệ nhân tạo và các vấn đề liên quan
Đó là các lý do chính để đề tài "Lập luận mờ trên cơ sở Đại số gia tử và một
số ứng dụng trong Tin học" được đặt ra
II SƠ LƯỢC LỊCH SỬ NGHIÊN CỨU CỦA ĐỀ TÀI
Logic mờ được Zadeh đề xướng từ 1965 và đã phát triển mạnh mẽ trong việc
xử lý các thông tin không chắc chắn và mơ hồ Các vấn đề về lập luận mờ từ đó được đặt ra
Các nghiên cứu về việc lập luận mờ trên biến ngôn ngữ và tính toán trên các từ cũng được đặt ra, có thể xem các tài liệu [2][3][4],
Các nghiên cứu về đại số gia tử cũng đã phát triển mạnh, xin xem thêm trong [1][2][3] và [11]
Các nghiên cứu trong đề tài Lập luận mờ trên cơ sở Đại số gia tử - Mã số:
T.05.TN-70 đã được nghiệm thu có kết quả tốt của chính tác giả đề tài này
Tuy vậy một cơ sở logic cho việc lập luận và việc giải bài toán mô hình mờ trên cơ sở đại số gia tử cũng như các ứng dụng của nó chưa được nghiên cứu nhiều Các yếu tố trên chứng tỏ vấn đề mà đề tài đặt ra là đáng quan tâm, cấp thiết và khá mới mẽ, đồng thời có một tiền đề thuận lợi cho việc nghiên cứu
Trang 4III ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
Lập luận mờ, nội suy mờ
Đại số gia tử - ánh xạ định lượng ngữ nghĩa - tập mờ loại 2 dựa trên cơ sở đại
số gia tử
Các phương pháp lập luận mờ trên cơ sở đại số gia tử như nội suy, lập luận trên biến ngôn ngữ
Các vấn đề liên quan đến bài toán mô hình mờ
Nghiên cứu các ứng dụng của vấn đề lập luận mờ trong Tin học và trong thực tiễn
IV MỤC ĐÍCH VÀ Ý NGHĨA CỦA ĐỀ TÀI
Nghiên cứu các vấn đề liên quan đến lập luận mờ, tập trung mở rộng các phương pháp lập luận trên biến ngôn ngữ dựa trên cơ sở đại số gia tử, cùng các ứng dụng thực tiễn của nó
Vấn đề lập luận là một vấn đề quan trọng và chủ đạo trong lĩnh vực AI, đặc biệt các vấn đề lập luận mờ trên tri thức mơ hồ và không chắc chắn đang được ứng dụng rộng rãi trên nhiều lĩnh vực như điều khiển học, hệ chuyên gia Do đó việc nghiên cứu và phát triển các vấn đề lập luận mờ trên biến ngôn ngữ là một vấn đề
có ý nghĩa thực tiễn Đại số gia tử phát triển mạnh trong các năm gần đây tạo nên một cơ sở logic cho việc lập luận định tính nói trên khá chặt chẽ, hợp lý hơn về tính khoa học Vì vậy đề tài đáng được đặt ra
Việc nghiên cứu đề tài cũng tạo ra một hướng chuyên đề khá mới mẽ cho sinh viên Khoa Tin học - Trường ĐHSP Huế trong việc nâng cao kiến thức về lĩnh vực trí tuệ nhân tạo và các vấn đề liên quan
Trên cơ sở các kết quả đạt được của đề tài "Lập luận mờ trên cơ sở đại số gia tử” – Mã số T.05.TN.70, đó là:
+ Một số cơ chế lập luận mờ trên cơ sở đại số gia tử
+ Một số phương pháp nội suy mờ giải bài toán mô hình mờ
+ Bước đầu ứng dụng vào việc đánh giá học sinh với các tham số đầu vào mờ Chúng tôi tiếp tục phát triển:
+ Các kỹ thuật lập luận mờ, phương pháp giải bài toán mô hình mờ trên cơ sở đại số gia tử
+ Xây dựng một cơ sở logic mờ giá trị ngôn ngữ làm cơ sở cho lập luận mờ + Phát triển các ứng dụng của lập luận mờ trên cơ sở đại số gia tử trong các lĩnh vực của Tin học cũng như trong thực tiễn
V PHƯƠNG PHÁP NGHIÊN CỨU
Sử dụng các phương pháp nghiên cứu của khoa học cơ bản như đọc tài liệu, dựa trên các hướng lập luận đã có để mở rộng, khái quát trên cơ sở đại số gia tử làm cho việc lập luận có tính chặt chẽ về logic, nhưng mềm dẻo gần gũi với cách suy nghĩ của con người hơn
Trang 5So sánh đánh giá với các phương pháp lập luận thu được và các kết quả trong thực tiễn
Triển khai thiết kế, cài đặt một số module chương trình minh họa các thuật toán
VI CẤU TRÚC CỦA BÁO CÁO
Nội dung của báo cáo được chia thành 5 chương gồm:
Chương 1 Một số kết quả cơ sở về đại số gia tử
Trình bày tóm lược một số kết quả cơ bản về đại số gia tử của nhóm nghiên cứu của GS Nguyễn Cát Hồ làm cơ sở cho các kết quả ở các chương khác
Chương 2 Lập luận xấp xỉ với logic mờ giá trị ngôn ngữ
Trình bày phương pháp đánh giá chân trị của một mệnh đề mờ và xây dựng phương pháp lập luận xấp xỉ dựa trên logic mờ giá trị ngôn ngữ Bên cạnh đó tóm lược một số kết quả về lập luận ngôn ngữ đã đạt được trong đề tài T.05.TN-70 Chương 3 Cơ sở dữ liệu quan hệ mờ giá trị ngôn ngữ và một số ứng dụng trong lập luận mờ
Đề xuất các phép toán đại số quan hệ trên mô hình cơ dữ liệu quan hệ mờ và ràng buộc phụ thuộc hàm mờ trên đó, cùng các kết quả có liên quan đến ràng buộc dạng này cũng như một lớp công thức logic mờ với nguyên lý giải trên đó được trình bày
Chương 4 Một số kết quả về bài toán mô hình mờ Chương này được chia thành hai phần đó là:
+ 4.1 Một phương pháp nội suy giải bài toán mô hình mờ trên cơ sở đại số
gia tử
Trình bày một phương pháp nội suy giải bài toán mô hình mờ, giải quyết một bài toán mô hình khá kinh điển có so sánh đánh giá sai số và đưa ra một mệnh đề làm nền tảng cho ánh xạ ngược của ánh xạ lượng hóa ngữ nghĩa
+ 4.2 Xây dựng mô hình mờ SISO dựa trên cơ sở đại số gia tử
Đề xuất sự kết hợp việc phân lớp dữ liệu trong quá trình xây dựng mô hình SISO dựa trên cơ sở đại số gia tử
Chương 5 Hệ thống đánh giá – một ứng dụng trong thực tiễn của bài toán lập luận mờ trên cơ sở đại số gia tử
Vận dụng các kết quả của bài toán lập luận mờ trên cơ sở đại số gia tử vào hệ thống đánh giá
Trang 6B NỘI DUNG
CHƯƠNG 1 MỘT SỐ KẾT QUẢ CƠ SỞ VỀ ĐẠI SỐ GIA TỬ
Để tiện cho việc trình bày và theo dõi trong chương này chúng tôi trình bày một số kết quả về đại số gia tử và các kết quả cơ sở Các kết quả này có thể tìm thấy trong các bài báo của nhóm nghiên cứu của GS Nguyễn Cát Hồ
I Biến ngôn ngữ
Biến ngôn ngữ được L.Zadeh định nghĩa như bộ 5 gồm (X,T(X),U,G,M), trong đó:
X - Tên của biến ngôn ngữ (Ví dụ như Age, Truth )
T(X) - Tập các giá trị ngôn ngữ của biến X, mỗi giá trị ngôn ngữ được xem như một biến mờ trên U kết hợp với biến cơ sở liên quan đến biến ngôn ngữ X
U - Tập vũ trụ
G - Tập các luật cú pháp sản sinh ra các phần tử của T(X)
M - Tập các luật ngữ nghĩa gán mỗi phần tử của T(X) bởi một tập mờ trên U
Ví dụ: Xét biến ngôn ngữ có tên là Age, tức X = Age, với U = [0,100] Khi đó tập các giá trị ngôn ngữ T(Age) của biến Age bao gồm các giá trị:
young old not young nor old
not yong not old not very young not very old
more-or-less young more-or-less old
possibly young possibly old
Các giá trị ngôn ngữ young và old được gọi là các biến nguyên thuỷ (hay còn gọi là các phần tử sinh nguyên thuỷ) Mỗi giá trị ngôn ngữ trong T(Age) là tên của một biến mờ trên U, tức là biến có thể nhận các giá trị trên U, mỗi giá trị ứng với mỗi mức độ tương thích trong đoạn [0,1]; ràng buộc hạn chế trên mỗi giá trị hình thành ngữ nghĩa cho giá trị ngôn ngữ đó Ví dụ ngữ nghĩa của old được cho như sau:
100
50
1 2./])5
50(1[)
M
Trang 7Các gia tử ngôn ngữ như very, more-or-less, được mô hình bởi các toán tử trên các tập mờ, sau đó ngữ nghĩa của các giá trị ngôn ngữ hợp thành được tính bằng cách tác động các toán tử mô hình (modifier operator) các gia tử tương ứng lên tập mờ ngữ nghĩa của các term nguyên thuỷ
L Zadeh đã chỉ ra hai đặc trưng quan trọng nhất của biến ngôn ngữ như sau: Đặc trưng thứ nhất là tính phổ quá t của cấu trúc miền giá trị của chúng, tức là
miền giá trị của hầu hết các biến ngôn ngữ có cùng cấu trúc cơ sở theo nghĩa các giá trị ngôn ngữ tương ứng là giống nhau, ngoại trừ phần tử sinh nguyên thuỷ Ví dụ như tập các giá trị ngôn ngữ được cho tương ứng của hai biến ngôn ngữ Heath và Age Ta có good- old, very good - very old, more or less good- more or less old Đặc trưng thứ hai của biến ngôn ngữ là tính chất ngữ nghĩa độc lập ngữ cảnh
của các gia tử và các liên từ, trong khi ngữ nghĩa của các phần tử sinh nguyên thuỷ
là phụ thuộc ngữ cảnh
Hai đặc trưng trên cho phép chúng ta sử dụng một tập các gia tử ngôn ngữ cho nhiều biến ngôn ngữ khác nhau, và có thể mô hình miền giá trị của các biến ngôn ngữ bởi một cấu trúc toán học thuần nhất Vấn đề quan trọng ở đây là mô hình phải dựa trên các yếu tố nào để cho cấu trúc toán học đó phản ánh được nhiều ngữ nghĩa của các giá trị ngôn ngữ Một cách tiếp cận được đề xuất bởi N.C Hồ và W.Wechler trong [3] dựa trên các đặc trưng ngôn ngữ sau đây:
Các giá trị ngôn ngữ có ngữ nghĩa tự nhiên của chúng khi được con người sử dụng trong cuộc sống hằng ngày; con người sử dụng ngữ nghĩa này để xác định quan hệ thứ tự ngữ nghĩa giữa các giá trị ngôn ngữ của cùng một biến
Các gia tử ngôn ngữ được con người sử dụng để nhấn mạnh về mặt ngữ nghĩa của giá trị ngôn ngữ; tức là mỗi gia tử có thể làm mạnh lên hoặc làm yếu đi ngữ nghĩa tự nhiên của giá trị ngôn ngữ được tác động
Với mỗi giá trị ngôn ngữ x trong tập T(X) và tập H các gia tử ngôn ngữ, khi đó
H được phân hoạch thành hai tập con rời nhau sao cho một tập chứa các gia tử làm
tăng ngữ nghĩa của x và tập còn lại chứa các gia tử làm giảm ngữ nghĩa của x Hơn
nữa trong mỗi tập con đó của H, bản thân các gia tử cũng được sắp xếp theo mức độ nhấn ngữ nghĩa của chúng; ví dụ mức độ nhấn ngữ nghĩa của gia tử very được xem như là mạnh hơn gia tử more
(1) Mọi gia tử đều hoặc làm mạnh hơn hoặc yếu đi ngữ nghĩa của giá trị ngôn
ngữ nguyên thuỷ Nghĩa là, với h H ta có hx<x hoặc hx>x, trong đó x T(X) Ví dụ: More và Very làm tăng ý nghĩa của Low và High, còn Little và Possible làm
giảm đi ý nghĩa đó
Trang 8(2) Mọi gia tử đều hoặc làm mạnh hơn hoặc yếu đi ngữ nghĩa bất kì gia tử nào
khác
Thật vậy, các gia tử Very, More làm mạnh hơn ngữ nghĩa của các gia tử Very, More, Little và làm yếu đi ngữ nghĩa của Possible Còn các gia tử Little, Possible lại làm yếu đi ngữ nghĩa của Very, More, Little và làm mạnh thêm ngữ nghĩa của Possible
Chúng ta thấy rằng, dù trong tình huống nào thì giá trị ngữ nghĩa của các từ nguyên thuỷ cũng không thay đổi, nghĩa là chuỗi các gia tử chỉ có thể làm mạnh hơn hoặc làm yếu đi ngữ nghĩa của chúng mà thôi Do vậy cho một chuỗi các gia tử
=h 1 h 2 h n thì True vẫn thể hiện một ngữ nghĩa của True, tương tự False thể
hiện một ngữ nghĩa của False
(3) Với mỗi gia tử h H thì hx thừa hưởng ngữ nghĩa của phần tử x mà nó tác động lên Tổng quát: nếu hx kx thì H(hx) H(kx) Trong đó, H(u) là tập các phần tử của X sinh ra từ u bởi các gia tử trong H
Dưới đây chúng ta xem xét một số khái niệm đại số cơ bản
II Một số khái niệm cơ bản - đại số gia tử
Khái niệm về cấu trúc đại số
Một cấu trúc đại số là một cặp (A, ) gồm một tập hợp không rỗng A và một tập hợp phép toán xác định trên A, thoả mãn những luật nào đó gọi là các tiên đề của cấu trúc đã cho
Tập hợp A gọi là tập nền của cấu trúc (A, ) ta thường kí hiệu bản thân cấu trúc và tập nền của nó bằng cùng một chữ
Khái niệm về poset
Một poset P là một tập sắp thứ tự bộ phận (partial ordered set)
Chúng ta có thể viết P = {A, }, với = { }
Khái niệm về dàn
Định nghĩa cận trên bé nhất và cận dưới lớn nhất
Giả sử L là một poset, cho x,y L
Kí hiệu: x y gọi là cận trên bé nhất của x và y
x y thỏa mãn các tính chất sau: x x y; y x y và với z L: x z, y z thì
x y z
Kí hiệu: x y gọi là cận dưới lớn nhất
Trang 9là đầy đủ nếu mỗi tập con bất kỳ của L đều có cận trên bé nhất và cận dưới lớn nhất
Về ký hiệu, chúng ta có thể viết (A, , ), ở đây = { , }
II.1 Đại số gia tử
Trước hết, chúng ta xét miền giá trị ngôn ngữ của các biến chân lý TRUTH, tập các giá trị của TRUTH là X={đúng, sai, rất đúng, rất sai, ít nhiều đúng, ít nhiều sai, có thể sai, xấp xỉ sai, rất có thể đúng, rất có thể sai, }, có thể thấy rằng ngữ nghĩa tự nhiên do các khái niệm này cảm sinh ra một quan hệ thứ tự Nếu xem {đúng, sai} như là một tập các phần tử sinh và H={rất, có thể, xấp xỉ, ít nhiều } như là các toán tử một ngôi thì X={X,{đúng, sai}, H, } sẽ trở thành một cấu trúc đại số Vấn đề là xây dựng cho X một hệ tiên đề sao cho nó mô phỏng tốt nhất cấu trúc của miền giá trị của biến ngôn ngữ
Sau đây là một số định nghĩa mô tả các tính chất đơn giản của các gia tử - tức
là các trạng từ nhấn Cho một đại số X=(X,C, H, ) như trên, với X là tập giá trị C
là tập các từ sinh Ta luôn giả thiết rằng các gia tử trong H là các toán tử thứ tự, nghĩa là ( h H, h:X X), ( x X) ta có hx x hoặc hx x Hai gia tử h, k H gọi là
ngược nhau nếu ( x X) {hx x khi và chỉ khi kx x} và chúng được gọi là tương thích nếu ( x X){hx x khi và chỉ khi kx x} Ta ký hiệu h k nếu h, k tương thích
và ( x X){hx kx x hoặc hx kx x} Ngoài ra tập H có thể được phân hoạch thành hai tập H+ và H- với các gia tử trong cùng tập H+ và H- tương thích với nhau và mỗi gia tử của H+ cũng ngược với bất kỳ gia tử nào trong H- và ngược lại Ta giả thiết rằng trong H+ có phần tử V (ngầm định là "rất") và trong H- có phần tử L (ngầm định là "kém") là phần tử lớn nhất, thì phần tử sinh a C là dương nếu a Va và là
âm nếu a Va Ngoài ra chúng ta gọi I là toán tử đồng nhất nếu mọi toán tử h trong
H áp dụng vào I sau khi I được tác động vào một phần tử x là không có hiệu lực, có nghĩa là hIx=x với x X Giả thiết H+
+I và H-+I là các dàn modular, khi đó I được xem như phần tử zero trong các dàn H+
+I và H-+I, còn V và L tương ứng là các phần tử đơn vị trong các dàn H+
+I và H-+I Đặt UOS={V, L}
Trang 10Một toán tử h là dương (hoặc âm) đối với một toán tử k nếu
( x X){hkx kx x hoặc hkx kx x}(hoặc ( x X){kx hkx x hoặc kx hkx x})
Ví dụ rất là dương đối với rất, nhiều, ít và âm đối với có thể, xấp xỉ, ít nhiều
Định nghĩa 2.1 Một đại số X=(X, H, ) với H được phân tách thành hai tập
H+ và H- được gọi là một đại số gia tử, nếu nó thoả mãn các tiên đề sau:
(A1) Mọi toán tử trong H+ là ngược với mỗi toán tử trong H-
(A2) Toán tử đơn vị V trong H++I là dương hoặc âm đối với mọi toán tử trong
H Đặc biệt V là dương đối với V và L
(A3) Nếu hai khái niệm u và v là độc lập, nghĩa là u H(v)và v H(u), thì ( x H(u)) {x H(v)} Ngoài ra nếu u và v là không sánh được thì bất kỳ x H(u) cũng không sánh được với bất kỳ y H(v) (H(u) là tập các giá trị được sinh ra do tác động của các gia tử của H vào u)
(A4) Nếu x hx thì x H(hx) và nếu h k và hx kx thì h’hx k’kx, với mọi h’,k’ UOS Hơn nữa nếu hx kx thì hx và kx là độc lập
(A5) Nếu u H(v) và u v (u v) thì u hv (u hv) với mọi gia tử h UOS
Với x,y X, ta ký hiệu x< y biểu thị tính chất nói rằng x y và dù tác động liên tiếp các gia tử vào x và y như thế nào từ 2 từ thu được u và v tương ứng vẫn thỏa mãn quan hệ u v
Ta viết x< y nếu và chỉ nếu ( m,n N, h,k H) {x y Vnhx Vmky}
Định nghĩa 2.2 Với h, k H, ta nói hx< kx (hx< Ix) nếu với mọi h', k' UOS
và mọi n, m N, Vnh'hx Vmk'kx (Vnh'hx Ix) Nếu bất đẳng thức sau cùng là chặt ta nói hx << kx (hx <<Ix)
Ta nói rằng hnhn-1 h1u là một biểu diễn chuẩn tắc của x đối với u nếu x= hnh
n-1 h1u và hnhn-1 h1u hn-1 h1u, điều đó có nghĩa là gia tử cuối hn cũng sinh ra nghĩa xác định
Trang 11được biểu diễn trong hình Với mọi x True và x False, chúng ta định nghĩa hx=x
Dễ dàng thấy trong cấu trúc đại số này, các toán tử được xác định và thoả mãn các tiên đề của đại số gia tử
VTRue MTrue
True ATrue NTRue
LTrue
LFalse
False MFalse
Vfalse
Định lý 2.1 Giả sử X=(X,H, ) là một ĐSGT Khi đó chúng ta có các tính chất sau đây:
i) Nếu x là một điểm dừng của một toán tử h, có nghĩa là hx=x, thì nó cũng là điểm dừng với bất kỳ một toán tử nào khác
ii) Nếu x có biểu diễn dưới dạng x= hnhn-1 h1u thì tồn tại một chỉ số i n có dạng hihi-1 h1u là một biểu diễn chuẩn của x và với mọi j i thì hjx=x
iii) Với mọi toán tử gia tử h, k, nếu x hx( x hx) thì Ix < hx ( Ix > hx) và nếu hx kx và h k thì hx < kx
Chú ý rằng tính chất (i) tuy đơn giản nhưng rất thú vị, bởi lẽ nó chỉ ra rằng ngữ nghĩa của một khái niệm mơ hồ không thể sinh ra bởi một gia tử này thì cũng không thể sinh ra bởi gia tử khác
Định lý 2.2 Giả sử rằng x = hnhn-1 h1u và y= kmkm-1 k1u là các biểu diễn chuẩn tắc của x, y qua u Thì khi đó tồn tại một chỉ số j min{m,n}+1 để với mọi i<j, hi=ki và
x<y nếu và chỉ nếu hjxj < kjyj, ở đây xj= hj-1 h1u
x=y nếu và chỉ nếu n=m=j và hjxj=kjyj
Trang 12x và y là không sánh được với nhau nếu và chỉ nếu hjxj và kjyj là không sánh được
Định nghĩa 2.3 Cho X=(X, H, ) là một ĐSGT a X được gọi là phần tử sinh
nguyên thủy của X nếu a H(b) với mọi b X và a b a được gọi là phần tử sinh dương (âm) nếu Va>a (a< Va) Nếu G là tập tất cả các phần tử sinh của X và H(G)=X, ta nói X là đại số gia tử sinh nguyên thủy
Định lý 2.3 Nếu các tập gia tử H+ và H- của đại số gia tử X=(X,H, ) là sắp thứ
tự tuyến tính thì:
i) Với u X, H(u) là tập sắp thứ tự tuyến tính
ii) Nếu X là sinh nguyên thủy với G là tập phần tử sinh là tập sắp thứ tự tuyến tính thì H(G) được sắp thứ tự tuyến tính và nếu u v và u, v là độc lập thì H(u)< H(v)
Mặc dù HA trên mô hình cấu trúc tự nhiên của miền ngôn ngữ rất tốt, nhưng nói chung, nó vẫn chưa phải là một dàn (Lattice) Để làm được điều này, các tác giả trong [6] bổ sung thêm vào H các phần tử giới hạn Sup và Inf với ý nghĩa là Inf(x)
và Sup(x) là infimum và supremum (hay 0 và 1) của tập H(x) trong tập X Cấu trúc đại số như vậy là một đại số gia tử mở rộng (EHA)
III Đại số gia tử mở rộng
Trong phần này chúng tôi chỉ tập trung trình bày định nghĩa cơ bản của đại số gia tử (ĐSGT) mở rộng và tập trung vào đặc trưng dàn của nó
Với mọi h, k H+
hoặc h, k H-, h k khi và chỉ khi h và k là tương thích và với x X, hx>x => hx kx và hx < x => hx kx
Ta nói X và H là tương thích (compatible) nếu H thỏa tính chất trên và với mọi
x X, với mọi h,k H sao cho hx kx, hx và kx sánh được kéo theo h và k sánh được
Trang 13Cho W là một poset và Z là tập con của W Z được gọi là trù mật trong W nếu với mọi x, y W sao cho ít nhất một trong hai phần tử thuộc về W\Z và x<y khi đó
u Z: x < u < y
Đinh nghĩa 3.1 AX=(X, G, He, ) với G là cơ sở của AX, X và H là tương thích được gọi là đại số gia tử mở rộng nếu (H(G), H, ) là một đại số gia tử và thỏa các tính chất sau:
(E1) Với mọi x X và {V, L} Infx x Supx và Infx Inf x Sup x Supx
(E2) Với h {Inf, Sup}, k H và với , ' {V, L}, hx X\H(G), hx hkx kéo
theo hx 'hkx và hx hkx kéo theo hx 'hkx
(E3) Với mọi x, y X, H(x) y kéo theo Supx y và H(x) y kéo theo Infx
y
(E4) H(G) là trù mật trong X
Giả sử G là dàn hữu hạn, khi đó ta có
Định lý 3.1 Mọi đại số gia tử mở rộng AX=(X, G, He, ) là một dàn với phần
tử zero và đơn vị Hơn nữa với hai phần tử x, y không sánh được trong X, x He(a)
và y He(b), ở đây a,b G
i) Nếu a b thì Supremum{x,y}=Infc và Infimum{x, y}=Supc', ở đây c=a b
và c'=a b với , lần lượt là toán tử joint và meet trong G
ii) Nếu a=b thì tồn tại hai gia tử h, k tương thích và w H(a) sao cho hw và
kw là không sánh được sao cho x He(hw), y He(kw) và
supremum{x, y} = supremum{hw, kw}
=
whw nÕu
whw nÕu
w k h Inf
w k h Inf
)(
)(
infimum{x, y} = infimum{hw, kw}
=
whw nÕu
whw nÕu
w k h Sup
w k h Sup
)(
)(
Ở đây , lần lượt là toán tử joint và meet trên dàn H+
+I và H-+I và nếu
h k=I hoặc h k=I thì tương ứng:
Sup(h k)w=Inf(h k)w hoặc Sup(h k)w=Inf(h k)w=w
Trang 14Do đó chúng ta có thể thêm vào các toán tử trên dàn này là và tương ứng với toán tử joint và meet trên dàn AX và chúng ta có thể viết AX = (X,C,H, , , )
IV Đại số gia tử đối xứng và logic giá trị ngôn ngữ
Trong thực tiễn ta thấy có rất nhiều biến ngôn ngữ chỉ có 2 term nguyên thủy
có nghĩa đối nghịch nhau như True - False, già - trẻ, lớn - bé Điều này gợi ý cho việc nghiên cứu các ĐSGT chỉ có 2 phần tử sinh t được gọi là phần tử sinh dương (âm) nếu Vt t (t Vt)
Giả sử một ĐSGT có hai phần tử sinh là s, t s là phần tử sinh dương, t là phần
tử sinh âm, chúng ta thêm phần tử sinh W vào giữa s và t và thoả mãn hW=W với (h H) Chúng ta nói rằng y là phần tử đối của x nếu tồn tại một biểu diễn của x dưới dạng x=hn h1c, W c C, thì y= hn h1c’, trong đó W c’ C và c’ c Đặc biệt, với việc định nghĩa W như trên ta có W cũng chính là phần tử đối của nó W gọi là phần tử trung hoà Nếu y là phần tử đối của x, chúng ta viết y=-x với chỉ số nếu cần thiết Ví dụ VeryPossiblyTrue và VeryPossiblyFalse là các phần tử đối của nhau Nhìn chung, một phần tử có thể có nhiều phần tử đối nghịch Nếu mỗi phần tử của
X chỉ có duy nhất một phần tử đối nghịch thì Xđược gọi là một đại số gia tử đối xứng Khi đó ta có các đặc trưng sau đây:
Định lý 4.1 Một đại số gia tử X là đối xứng nếu và chỉ nếu với mọi x trong
X, x là điểm dừng nếu và chỉ nếu -x cũng là một điểm dừng
Định lý 4.2 Với mọi ĐSGT đối xứng AX=(X, G, He, ) ta có
i) Với h H và x -(hx)=h(-x), -Supx = Inf(-x) và -Infx=Sup(-x)
ii) -(-x) =x và x He(u) khi và chỉ khi -x He(-u)
iii) Với mọi h H, hx>x khi và chỉ khi h(-x)< -x
iv) Với mọi x, y X, x<y khi và chỉ khi -x> -y
Trong ĐSGT đối xứng AT của biến chân lý TRUTH sinh bởi hai phần tử sinh True và False, các tác giả đã đưa ra toán tử kéo theo theo định nghĩa sau: x y=-
x y với mọi phần tử x,y X Bên cạnh đó đưa vào hai phần tử đặc biệt là 1,0 gọi
là các giá trị lớn nhất và nhỏ nhất trong X (Tức Inf False=0 và SupTrue =1 ), W được là phần tử trung hoà, ta có W=Inf True = Sup False Với C={False, W, True}
và với các phép toán , , trên AT và T là tập giá trị của biến ngôn ngữ TRUTH, có thể viết AT=(T, C, He, -, , , , )
Định lý 4.3 Với đại số gia tử đối xứng AT =(T, C, He, -, , , , ) chúng ta
có các tính chất sau đây:
Trang 15(i) - hx = h-x, với mọi h H và -Supx = Inf(-x) và -Infx=Sup(-x)
(xi) x y=1 khi và chỉ khi x = 0 hoặc y = 1
Trong [6] đã chỉ ra logic dựa trên đại số gia tử đối xứng AT không phải là logic cổ điển và (iv) chứng tỏ rằng nó là đại số Kleen, (ii),(x) và (xi) chứng tỏ rằng tập sinh C là một đại số gia tử con đối xứng của AT và là đại số Lukasiewicz 3 trị Trong các logic đa trị ta thường dùng đoạn [0,1] để biểu diễn các giá trị chân
lý Đối với AT ta có định lý sau [4]
Định lý 4.4 Giả sử H+ và H- có cùng số từ nhấn và sắp tuyến tính Khi đó tồn tại đồng cấu từ AT=(T, C, He, -, , , ) vào đoạn [0,1], bảo toàn thứ tự của T, hơn nữa (-u)=1- (u), (u v) = max( (u), (v)), (u v) = min( (u), (v)) và (u v) = max(1- (u), (v))
Từ các nhận xét trên, chúng ta có thể kết luận là đại số gia tử đối xứng là cơ sở cho một logic mờ giá trị ngôn ngữ
V Kết luận
Trong các phần trên chúng ta đã hệ thống các định nghĩa và tính chất cơ bản của ĐSGT Các kết quả được đưa ra với mục tiêu là nắm được động cơ của sự phát triển của các cấu trúc khác nhau của ĐSGT và làm cơ sở cho các kết quả trong các chương tiếp theo
Lưu ý rằng còn có các cấu trúc mở rộng của đại số gia tử Trong các chương tiếp theo khi có các kết quả riêng biệt của các cấu trúc này, chúng tôi sẽ trình bày
cụ thể trong từng chương
Trang 16CHƯƠNG 2 LẬP LUẬN XẤP XỈ VỚI LOGIC MỜ
GIÁ TRỊ NGÔN NGỮ
Trong chương này chúng tôi trình bày phương pháp đánh giá chân trị của một mệnh đề mờ và xây dựng phương pháp lập luận xấp xỉ dựa trên logic mờ giá trị ngôn ngữ Bên cạnh đó tóm lược một số kết quả về lập luận ngôn ngữ đã đạt được trong đề tài T.05.TN-70
I Mở đầu
Xét các mệnh đề mờ có dạng P(X,u) với X là biến và u là một khái niệm mờ Một khẳng định S có dạng S=(P(X,u), t) với t là một giá trị ngôn ngữ thuộc đại số gia tử (ĐSGT) đối xứng, đầy đủ tuyến tính và tự do AX=< AX,G, LH, > của biến chân lý Truth, với G={O, False, W, True, I}, t > W Trên ĐSGT AX có thể định nghĩa khoảng cách giữa phần tử x,y AX như sau: d(x,y)=| (x)- (y)|, với là ánh
xạ lượng hóa ngữ nghĩa Trên AX ta có O y W x I với x LH(True) và với
y LH(False) I, O, W lần lượt được hiểu là các giá trị ngôn ngữ tương ứng: Absolutely true, Absolutely false và Unknown Các vấn đề về ĐSGT và ánh xạ lượng hóa ngữ nghĩa xin xem thêm trong [7] [3] [5][6]
Các vấn đề lập luận ngôn ngữ trên tri thức bao gồm các mệnh đề và khẳng định có dạng trên đã được xét trong [5] [9], phương pháp lập luận ngôn ngữ được các tác giả đưa ra dựa trên khoảng cách và quan hệ thứ tự trên ĐSGT Trong [5][9]
đã đưa ra các quy tắc chuyển đổi gia tử cho các mệnh đề đơn giản và mệnh đề kéo theo như sau:
(RT1)
) ), , ((
) ), , ((
h u P
hu P
; (RT2)
) ), , ((
) ), , ((
hu P
h u P
(RTI1)
) ,
(
) , ( ), ,
(
htrue Q
P
true P true hQ hP
; (RTI2) ( , ), ( , )
P Q htrue P true
hP hQ true Các qui tắc sau là mở rộng của modus ponens và modus tollens của logic kinh điển
(RMP)
) , (
) , ( ), ,
(
true Q
true P true Q P
và (RMT)
) , (
) , ( ), ,
(
true P
true Q true Q P
Qui tắc liên quan đến mệnh đề kéo theo:
(RPI) ( ( , ) ( , ), )
P X u Q X v true
P X u Q X v true Với h, k là các gia tử, còn các , là các chuỗi gia tử, {True, False}, u, v là
Trang 17lớn"=P(I0,"khá lớn") Vấn đề đặt ra là: Hãy xét xem chân trị của mệnh đề P(I0),"khá lớn") là gì?
Một cách tổng quát ta xét bài toán sau, được đưa ra trong [8]:
Cho khẳng định S=(P(X, u), t) Cần xác định chân trị của mệnh đề P(X, u)
Để tiện trong trình bày, chúng ta gọi bài toán trên là bài toán LG (Lacsio -
Gisolfi)
Ta thấy các qui tắc trong [5][9] vừa nêu ở phần trên, đối với bài toán LG trong trường hợp tổng quát là rất khó áp dụng Tuy vậy trong các phần sau chúng ta sẽ thấy bài toán này đóng vai trò quan trọng trong lập luận ngôn ngữ Trong [8] đã giải quyết bài toán tương tự dựa trên cơ sở các số mờ tam giác trên đoạn [0,1] và tập nhãn ngôn ngữ tương ứng mô tả các số mờ đó Theo chúng tôi ý tưởng của các tác giả trong [8] cũng xuất phát từ cùng ý tưởng định lượng ngữ nghĩa và khoảng cách trên ĐSGT trong [5][9] Nhưng các cơ sở logic và cấu trúc đại số trong [8] để giải bài toán là chưa được chặt chẽ và rõ ràng, chẳng hạn khi các tác giả xấp xỉ các nhãn ngôn ngữ với một số mờ tam giác phải đưa ra các nhãn mới không thuộc tập nhãn ban đầu như NEXT, BETWEEN , cùng một số hạn chế khác Trên cơ sở đại số gia
tử, trong đề tài này chúng tôi sẽ giải quyết bài toán trên một cách chặt chẽ hơn, sau
đó đưa ra một số qui tắc lập luận xấp xỉ, qua đó chúng ta sẽ làm phong phú thêm các qui tắc chuyển gia tử và qui tắc liên quan đến phép kéo theo, modus ponens, modus tollens vừa nói trên
Phần II trình bày việc xác định chân trị của một mệnh đề từ một khẳng định, trong phần III trình bày một phương pháp lập luận ngôn ngữ dựa trên logic mờ giá trị ngôn ngữ Phần IV giới thiệu một số mở rộng của bài toán lập luận ở phần III
II Xác định chân trị của một mệnh đề từ một khẳng định
Để đơn giản khi viết P(X,u), nếu không nói khác đi ta hiểu mệnh đề P(X,u) có chân trị là True Hơn nữa với h là một gia tử, khi đó nếu P(X,hu) có chân trị là True thì theo qui tắc (RT1) và (RT2) ta có khẳng định (P(X,u), hTrue) và ngược lại nếu (P(X,u), hTrue) thì ta có P(X,hu) có chân trị là True
Bên cạnh đó, giả sử ta có khẳng định S=(P(X,not hu),t) khi đó ta cũng có khẳng định (P(X,hu),-t)
Để tiện cho việc tính toán, tương tự trong [8] ta đưa ra các phép toán và
như sau trên ĐSGT Nhưng trước hết ta có các nhận xét sau:
Nhận xét:
+ Theo Định lý 3.3 trong [11] thì ánh xạ lượng hóa ngữ nghĩa trên ĐSGT đầy đủ tuyến tính tự do là song ánh nên ánh xạ ngược -1 là tồn tại
+ Hơn nữa theo hệ quả 3.1 trong [11] thì tập ảnh v[H(G)] trù mật trên đoạn
[0,1] và như vậy với mọi a [0,1] và với mọi >0 cho trước, luôn xác định được một giá trị ngôn ngữ x thuộc ĐSGT AX có giá trị lượng hóa ngữ nghĩa sai khác a không quá : (xem [10])
a [0,1], >0, x X: | (x) - a| <
Trang 18+ Để đi đến xác định chân trị cho mệnh đề P(X, u) trong bài toán LG nói trên
và cũng là tư tưởng chính của phương pháp lập luận đưa ra trong bài, trước hết ta có nhận xét sau, dựa trên quan hệ thứ tự và khoảng cách của ĐSGT:
Nếu gọi tc là chân trị của mệnh đề P(X, u), khi đó ta thấy:
- Khoảng cách giữa True và True bằng khoảng cách giữa t và tc Tức
| (True)- ( True)|=| (t)- (tc)|
- Nếu t > True thì tc > True và ngược lại
Định nghĩa 2.1
Cho t 1 , t 2 là các phần tử của ĐSGT AX
Kí hiệu: t 1 t 2 chính là phần tử nằm chính giữa t 1 và t 2 theo nghĩa sau:
t 1 t 2 = -1 (( (t 1 )+ (t 2 ))/2)
Định nghĩa 2.2
Cho t 1 , t 2 là các phần tử của ĐSGT AX
t 1 t 2 =
0 )) ( ) (t (2.
O 1 )) ( ) (t (2
Ι [0,1] )) ( ) (t (2
) (
2
1 2
1 2
1 2
1 2 1
t t
t )
ν(t ) t ν ( ν
Dễ kiểm chứng một số tính chất sau của phép toán
Mệnh đề 2.1
Với mọi t, t 1 , t 2 và với O, I thuộc ĐSGT AX
i) t t = t
ii) t 1 (t 1 t 2 ) = t 2 ; ( t 1 t 2 ) t 1 = t 2
iii) t O = O; I I=I; O O =O; O I=I; I O =O, t I = I
Với các nhận xét và các định nghĩa 2.1, 2.2 nói trên có thể xác định giá trị t c
trong bài toán LG nói trên qua định nghĩa sau:
Định nghĩa 2.3
Cho khẳng định (P(X, u), t) và mệnh đề (P(X, u) Khi đó chân trị của mệnh
đề (P(X, u) là t c được tính theo công thức sau:
t c = True (t True)
Cho khẳng định (P(X,u),t), mệnh đề (P(X, not u) sẽ có chân trị là t'c được xác định như sau: t'c= - ( True (t True)) hay nói cách khác t'c là phần tử đối của tc được xác định trong định nghĩa 2.3 nói trên
Từ mệnh đề trên ta có ngay:
(P(X,u), True) <=> (P(X, not u), False)
(P(X, u), t) <=> (P(X, not u), -t)
Trang 19(P(X, not u), t) <=> (P(X, u), -t)
Ví dụ
Với khẳng định "Cường độ dòng điện là lớn" là "ít sai" Khi đó, nếu nói
"Cường độ dòng điện là không lớn" sẽ thấy mệnh đề này là "không ít sai" hay "ít đúng"
Trong các phần dưới đây thống nhất ký hiệu , , ', ' là các chuỗi gia tử Trường hợp tổng quát của bài toán LG là:
Cho khẳng định q 1 =(P(X, u),t), hãy xác định chân trị của mệnh đề
q 2 =P(X, u)
Các kết quả tính chân trị của q2 sẽ được trình bày dưới đây Trước hết giả sử chân trị của q2 là xác định được, để tiện trình bày trong các phần sau ta ký hiệu COMP(q2|q1) là chân trị của q2
Ký hiệu COMP(q2|q1) nhằm diễn tả mối quan hệ giữa q1, q2 Nó là sự so sánh ngữ nghĩa giữa hai mệnh đề q1, q2 khi nói về cùng một đối tượng nào đó
Mệnh đề 2.2
Cho khẳng định q 1= (P(X, u), t 1 ) và mệnh đề q 2 =P(X, u), khi đó
t 2 =COMP(q 2 |q 1 )= True ( True t 1 )
Tương tự nếu q 3= (P(X, not u), t 3 ), khi đó t 4 =COMP(q 2 |q 3 ) = True ( True -t 3 )
"Quả cà chua là rất đỏ là đúng" <=> "Quả cà chua là đỏ là rất đúng"
"Quả cà chua là có thể xanh là đúng" <=> "Quả cà chua là đỏ là có thể sai" Tiếp theo chúng ta sẽ mở rộng bài toán LG đã nói ở phần I trong một số trường hợp
Trong quá trình lập luận trong thực tiễn, chúng ta có sử dụng đến phép phủ định "not" và thường thì trong câu không sử dụng quá một từ "not" nếu có Vì vậy trong các phần dưới để mở rộng vấn đề và dễ kí hiệu, ta viết >0 nếu chuỗi gia tử không chứa "not" và ngược lại <0 nếu có chứa "not", nếu quan niệm như thế thì: True với <0 có thể viết lại là 'False với ' chính là nhưng đã loại bỏ "not"
Trang 20(1) Nếu >0 và >0 thì t c = True (t 1 True)
(2) Nếu >0 và <0 thì t c = -( True (t 1 True))
(3) Nếu <0 và >0 thì t c = True (-t 1 True)
(4) Nếu <0 và <0 thì t c = -( True (-t 1 True))
Chứng minh:
(1) Với >0 và >0, theo mệnh đề 2.2 ta có (P(X, u), t 1 ) <=> (P(X,u), t )
với t =True ( True t 1 ) Theo định nghĩa 2.3 thì P(X, u) có chân trị là t c = True (t True)= True ((True ( True t 1 )) True)= True ( True t 1 )
(2) Với >0 và <0, tương tự trường hợp (1) nhưng lúc đó True<W và ta có
tc=- True (-t True) = - True (-(True ( True t 1 )) True)=-( True ( True t 1 ))
III Phương pháp lập luận xấp xỉ với logic mờ giá trị ngôn ngữ
Xét bài toán lập luận sau:
If X is A then Y is B
X is A 0 -
Y is B 0
Trang 21Với A, A0 là các giá trị ngôn ngữ được xét trên một ĐSGT đối xứng, đầy đủ tuyến tính AX1, tương tự B, B0 là các giá trị ngôn ngữ được xét trên một ĐSGT đối xứng, đầy đủ tuyến tính AX2 Khi đó A, A0 có thể biểu diễn ở dạng chuẩn tắc: A= ac, A0= 'ac với , ' là các chuỗi gia tử và ac G1 (G1 là tập sinh của AX1) Tương tự B= bc
, B0= 'bc với , ' là các chuỗi gia tử và bc G2 (G2 là tập sinh của
AX2) Theo các kết quả ở phần II, ta thấy mệnh đề "X is A" có thể viết lại là "X is
ac " và "X is A0" có thể viết lại là "(X is ac
) is 'True".Tương tự các phân tích trên cũng đúng cho các mệnh đề "Y is B" và "Y is B0" Do đó bài toán lập luận trên có thể viết lại:
Trước hết, ta thấy khi giả thiết là không đúng so với dữ kiện tức tc<W thì không thể kết luận gì về ', khi đó ta không thể có kết luận gì về Y hay "Y is 'bc
is Unknown" Ngược lại nếu tc>W thì khoảng cách giữa 'True và True phải bằng khoảng cách giữa tc và True
Từ các nhận xét trên, ' có thể xác định theo mệnh đề sau:
Trang 22Ta có (Y is B is more True) <=> (Y is more B)
Nên bài toán trên tương đương với:
Trang 23Y được xác định như sau:
Trước hết tc =COMP("X is VeryA"|"X is A is Possible True") được tính theo mệnh đề 2.3
Tiếp đó xác định 'True=True (MoreTrue tc) theo mệnh đề 3.1
Khi đó kết quả suy diễn sẽ là: Y is B is 'True với 'True được xác định như trên
IV Một số mở rộng của lập luận xấp xỉ với logic mờ giá trị ngôn ngữ
Chúng ta có thể mở rộng qui tắc lập luận trong mệnh đề 3.1 cho các bài toán lập luận có dạng sau:
Dạng 1
If (X is m 1 A is True) then (Y is m 2 B is True)
X is m 3 A is 'True -
Y is B is 'True
Ở đây m1, m2, m3 là các gia tử, còn , ', , ' là các chuỗi gia tử, vấn đề đặt
ra là xác định '
Theo các qui tắc (RT1), (RT2) ta có "X is mA is True" <=> "X is m A" và
"Y is mB is True" <=> "Y is B is mTrue" nên có thể đưa bài toán vừa nêu về trường hợp trong mệnh đề 3.1
Dạng 2
If (X is m 1 A is t 1 ) then (Y is m 2 B is t 2 )
X is m 5 A is t 5 -
Z is ?
Với mi (i=1, ,5) là các gia tử, ti (i=1, ,5) là các giá trị chân lý ngôn ngữ thuộc ĐSGT AX như đã nói ở phần I, còn A, B, C là các giá trị ngôn ngữ thuộc các ĐSGT đối xứng, đầy đủ tuyến tính
Ta chuyển bài toán (2) về hai bài toán nhỏ sau:
If (X is m 1 A is t 1 ) then (Y is m 2 B is t 2 ) (2)'
X is m 5 A is t 5 -
Y is mB is t
Có thể xác định được m và t trong bài toán (2)' nhờ các kết quả ở phần III
Trang 24Tiếp đó, kết quả của bài toán (2) chính là kết quả của bài toán sau:
If (Y is m 3 B is t 3 ) then (Z is m 4 C is t 4 ) (2)''
Y is mB is t -
Z is C is more very True
Xét bài toán lập luận xấp xỉ tổng quát hơn có dạng sau:
Có thể giải bài toán vừa nêu theo 3 bước sau:
Trang 25- Trước hết ta tính chân trị của tci=COMP("Xi is miAi is ti"|"X0i is m0iAi is t0i) với i=1, ,k
- Tính tc= k
i ci t
1, với phép là toán tử joint trong ĐSGT AX
- tB được tính tương tự như trong mệnh đề 3.1 như sau:
X1 is A is Very True X2 is B is True Y is C is True
X1 is A is MoreLess True X2 is B is True Y is C is MoreLessTrue
X1 is A is MoreLess True X2 is B is MoreLessTrue Y is C is MoreLessTrue
V Kết luận
Trên cơ sở ĐSGT, trong chương này chúng ta đã đưa ra được cách xác định chân trị của một mệnh đề mờ trên cơ sở của một khẳng định tương tự, giống như cách làm trong [8] nhưng cách làm của chúng ta có cơ sở đại số chặt chẽ hơn Từ đó chúng ta đã đưa ra được một số phương pháp lập luận mới, rõ ràng các qui tắc đề ra trong phần này đã làm phong phú hơn các qui tắc lập luận trong [5][9] và một số trường hợp trong [5][9] là trường hợp đặc biệt của các phương pháp trong chương này
Bên cạnh đó chúng tôi cũng đã đạt được một số kết quả sau trong đề tài
Mở rộng modus ponens trên cơ sở tri thức được biểu diễn dưới dạng luật If then với cấp độ đúng (truth-degree) và cấp độ tin cậy (certain-degree) trên cơ sở đại số gia tử (xem bài báo [D3])
Một số lưu ý khi sử dụng qui tắc chuyển gia tử cho mệnh đề kéo theo RTI1, RTI2 trong [7] Bên cạnh đó cơ chế suy diễn lùi trên cơ sở tri thức mờ theo cách biễu diễn trong [5], được đưa ra cùng các ví dụ minh họa(xem bài báo [D4])
Trang 26Chương 3 CƠ SỞ DỮ LIỆU QUAN HỆ MỜ GIÁ TRỊ NGÔN NGỮ
chủ quan khi những dữ liệu này được xây dựng bởi các tập mờ
Một vấn đề cơ bản nữa khi xây dựng mô hình CSDL quan hệ mờ dựa trên cách tiếp cận của một số tác giả là: xây dựng quan hệ tương tự mờ (fuzzy similarity relation) thỏa các tính chất phản xạ, đối xứng và bắc cầu min-max trên miền giá trị của các thuộc tính vừa chứa giá trị rõ lẫn giá trị mờ là không đơn giản và phải làm
rõ ngữ ngữ nghĩa của các giá trị mờ
Dựa trên các kết quả nghiên cứu về đại số gia tử tuyến tính đầy đủ của Nguyễn Cát Hồ, Nguyễn Văn Long và các kết quả về CSDL mờ của GS Nguyễn Cát Hồ Chúng tôi xây dựng một mô hình CSDL mờ mới mà các thuộc tính có thể chứa các giá trị rõ lẫn giá trị mờ Ở đây các giá trị mờ được biểu diễn dưới dạng các giá trị của biến ngôn ngữ (term), các giá trị này được cấu trúc đại số bởi cấu trúc đại số gia
tử tuyến tính đầy đủ [12]
Trong chương này chúng tôi
của một giá trị ngôn ngữ trên đại số gia tử giữa các giá trị của thuộc tính
, trong chương này
và cách cài đặt chúng trên các hệ quản trị CSDL đang được thương mại hóa như Microsot Foxpro (có module chương trình minh họa)
Bên cạnh đó,
M
công thức logic mờ dựa trên đại số gia tử cũng được trình bày Trong đó chúng ta sẽ
Trang 27thấy rằng một quan hệ r thỏa một phụ thuộc hàm mờ thì chân trị của công thức mờ tương ứng sẽ đạt một giá trị nào đó trong miền giá trị của biến ngôn ngữ TRUTH được sinh bởi hai từ sinh True, False Chúng ta biết rằng trong logic mờ thì qui tắc hợp giải là không đúng vì với logic mờ theo nghĩa của Zadeh thì luật bài trung là không thỏa Trong chương này, chúng tôi đưa ra khái niệm tính thỏa (sound properties) của một lớp công thức logic mờ dựa trên đại số gia tử và qua đó luật bài trung là đúng, vì vậy qui tắc hợp giải có thể áp dụng được trong tính toán đối với lớp công thức logic mờ này
I KHÁI NIỆM LÂN CẬN NGỮ NGHĨA TRÊN DỮ LIỆU GIÁ TRỊ
Trong phần này giới thiệu các kết quả chính về mô hình cơ sở dữ liệu quan hệ
mờ giá trị ngôn ngữ theo quan niệm của nhóm nghiên cứu của Nguyễn Cát Hồ Các kết quả cụ thể xin xem thêm trong [13]
={U, R1, R2, ., Rm; Const} Ở đây U={A1,
A2, An , Rj là một lược đồ quan hệ, Rj là một tập con của U j=1,2,…m Const là một tập các ràng buộc trên dữ liệu trong CSDL
i
– (Ai) của một biến ngôn ngữ có không gian vũ trụ là khoảng DAi của tập số thựcR Ai
(Aiđầy đủ AXi = (Xi, G, H, , , ) Đặt D(Ai)= DAi LDom(Ai)
I.1 Khái niệm lân cận ngữ nghĩa
I.1.1 Định nghĩa khoảng lân cận độ sâu k trên D(A i )
, , ), tập J’={H(x): x H(G)} {Xi} tạo thành một cơ sở của một tôpô J và (X,J)
là một không gian tôpô
Với ánh xạ lượng hóa ngữ nghĩa trên Xi, trước hết cần phải lưu ý rằng trên các thuộc tính mờ Ai mà các giá trị của chúng có thể bao gồm các giá trị rõ trên DAi
và các giá trị mờ biểu diễn dưới dạng giá trị ngôn ngữ trên LDom(Ai) thì việc so sánh giữa một giá trị rõ y và một giá trị mờ x không thể thực hiện qua việc sử dụng giá trị của ánh xạ lượng hóa ngữ nghĩa Ai(x) để so sánh với y, vì Ai(x) chỉ biểu diễn cho một giá trị mờ x Hơn nữa ngoài quan hệ tương tự mờ, nhằm tiện cho việc quản lý ngữ nghĩa của dữ liệu cần phải mở rộng các quan hệ so sánh chẳng hạn quan hệ giữa giá trị x và giá trị y Vì vậy cần phải xây dựng các khái niệm lân cận
ngữ nghĩa của một giá trị mờ x qua độ đo mờ fm(x) và ánh xạ lượng hóa ngữ nghĩa
Trang 28+ Gọi (Xk) = { (xok) = [ Ai ( xok), Ai ( xok)]} { (x) = ( Ai ( x), Ai( x)]: x Xk, x xok} là các khoảng lân cận độ sâu k Khi đó (Xk) trở thành 1 phân hoạch của khoảng DAi sao cho:
- Hai lân cận khác nhau trong (Xk) là rời nhau
- Hợp các khoảng lân cận độ sâu k (Xk) đúng bằng DAi+ Với mỗi khoảng (Xk+1), tồn tại (Xk) sao cho (Xk+1) (Xk)
+ Với mọi x Xj với j k, ta có (x) luôn là điểm cuối hay điểm đầu của các khoảng phân hoạch (Xk+1)
I.1.2 Định nghĩa hệ thống cơ sở lân cận ngữ nghĩa
Xét x=h k-1 h 1 c với độ dài k, c G Hệ thống cơ sở lân cận ngữ nghĩa với độ
sâu d của x dưới ánh xạ lượng hóa ngữ nghĩa Ai, được kí hiệu là NeiG d (x), k d,
bao gồm các khoảng như sau:
1) k (x) = (x) =( Ai( x), Ai( x) ], khoảng lân cận độ sâu k của x Với k là
độ dài của x
2) j (x), với k<j d, j (x) là khoảng được định nghĩa bởi hợp của hai khoảng
độ sâu j có A(x) là điểm đầu của khoảng này và điểm cuối của khoảng kia j (x)
cũng được gọi là khoảng lân cận độ sâu j của x
Định nghĩa 2.1 (Lân cận độ sâu k)
LDom(A i ):l(x) k}=X 1 X 2 X k.
X(k) là tập các term x có độ dài không lớn hơn k
Chúng ta định nghĩa lân cận độ sâu k của x như sau:
(N1) Với mỗi x X(k-1), lân cận với độ sâu k của x là k(x) k(x) Theo định nghĩa của k (x) ở trên thì k (x) là hợp của hai khoảng lân cận
có độ sâu k+1 bên trái và bên phải của điểm Ai (x)
(N2) Với mỗi y X k , đặt ( ) ( )\ ( 1 ) ( );
k X
(N3) Với mỗi x=h j-1 h 1 c X j , ở đây c G và j>k, đặt
)
( ) (y h k 1 h1c
k nghĩa là lân cận độ sâu k của một từ với độ dài lớn hơn k cũng là lân cận độ sâu k của phần hậu tố của nó với độ dài k
Chú ý rằng họ { k(x) :x X(k) }là một phân hoạch của DAi Hơn nữa,
) (
)
Ai và là một điểm trong của k (x)(theo nghĩa tôpô), với x X (k) và
do đó k(x) k(x) được gọi là hệ lân cận với độ sâu k của các giá trị ngôn ngữ
của thuộc tính Ai dưới ánh xạ Ai
Trang 29I.2 Quan hệ so sánh trên miền giá trị ngôn ngữ LDom(A i )
Định nghĩa 2.2 (Quan hệ bằng nhau mức k) ([ 13 ])
Giả sử t và u là hai bộ trên U, ta sẽ viết t A i .k u A i và gọi là quan hệ bằng
nhau mức k, nếu thoả mãn các điều kiện sau:
(i) Nếu t A i , u A i D Ai , thì t A i = u A i ; (ii) Nếu một trong t A i , u A i là dữ liệu ngôn ngữ, giả sử
i A
t LDom(A i) thì u A i k(t A i ) (iii) Nếu cả t A i , u A i là dữ liệu ngôn ngữ thì k(u A i ) k(t A i )
Khi đó ta hiểu t A i .k u A i theo nghĩa phủ định của t A i .k u A i
Với bất kì hai lân cận k(x), k(y), chúng ta viết k(x) k(y) nếu u<v với
mọi u k(x)và với mọi v k(y)
Định nghĩa 2.3 (Quan hệ so sánh mức k) ([ 13 ])
Với giả thiết như trên, ta nói:
k i A
t , u A i nếu t A i .k u A i hoặc k(t A i ) k(u A i );
k i A
t , u A i nếu k(t A i ) k(u A i );
k i A
, , , , , , , ,
đồng nhất tương ứng với các phép toán ,ki, ,ki, ,ki, ,ki, ,ki, ,ki , trong
Trang 30trường hợp này chúng ta sẽ sử dụng các kí hiệu , , , , , để thay cho
ki ki ki ki ki
ki, , , , , , , , , ,
Nhận xét:
Như vậy, nếu giả sử các giá trị ngôn ngữ trong LDom(Ai) có độ dài lớn nhất là
k Khi đó, theo định nghĩa k(x) và theo định lý 2.2 các phép toán quan hệ
, , ,
,
, là đủ để so sánh trên các giá trị của thuộc tính D(Ai) bao gồm giá trị thực DAi và giá trị ngôn ngữ LDom(Ai), hơn nữa các quan hệ so sánh trên vẫn
có nghĩa với các term có độ dài khác nhau, chứ không nhất thiết có độ dài k
II Phép toán đại số quan hệ và câu truy vấn thông tin
II.1 Một số ràng buộc toàn ven đặc biệt
II.1 1 Định nghĩa hai bộ bằng nhau dưới ánh xạ và cấp độ k
Cho t1=(x11,x12, ,x1n) và t2=(x21,x22, ,x2n) là hai bộ của quan hệ R Ta nói t1bằng t2 ở độ sâu k và viết: t1 ,k t2 nếu t A i ,k t2 Ai , i 1,n
Giả sử rằng UTUOI=[0, 120], ULUONG=[0, 2500000],
fm(old)=0.55, fm(young)=0.45, fm(high)=0.6, fm(low)=0.4
Trang 31Với thuộc tính TUOI chúng ta sẽ tính toán các giá trị lƣợng hoá ngữ nghĩa
và các lân cận độ 3 của Mry (More rather young), Vry (Very rather young), R (Rather old) nhƣ sau:
(
)
(
67 32 120 45 0 3 0 3 0 ) 2 0 3
(
1 35 120 45 0 3 0 ) 20 0 30
(
27 120 45 0 ) 20 0 30 0 ( 120 ) ( )
( ) ( )
(
y
f m R V
L R
y
f m R
M Ry
VRy
y
f m R M
L R
Ry MRy
y
f m R
V M
y Ry
y
f m V
M y
tuoi
tuoi
tuoi tuoi
tuoi tuoi
tuoi
Một số lân cận của young:
24.30,76
23
120)()()()(,120)()()()(
(
)(
2.43,
8
10
120)()()(,120)()()(()(
0.54,0.0120)(,0.0)()(
y y
fm M
L y
y
y fm R y
y fm M
y y
y fm y
y
tuoi tuoi
TUOI
tuoi tuoi
30
(
)972.067.32,43.267
32
(
)120)(
)()()()(
,120)(
)()())()(()(
(
)(
\)(
)()((
\)()
3
.
young fm
R M
L MRy
young fm
R M
R L
MRy
VMRy MRy
My Ry
MRy MRy
\)(
)()((
\)()
3
.
LVRy MRy
My Ry
MRy VRy
TUOI
24 30 , 648
.
27
62 1 62 28 , 972 0 62
.
28
120 ) (
) ( ) ( )) ( ) ( ( ) (
, 120 ) (
) ( ) ( ) ( ) (
(
young
f m R M
M V
VRy
young
f m R V
R VRy
A
A
Ánh xạ lƣợng hoá ngữ nghĩa và lân cận của rather old (Ro):
Trang 32
71
120)()()(()(,120)()()()(
)()(
)()(
04.83,20
67
120)()()()(,120)()())()(()(
)(
\)
(
)(
\)()(
1.779.9
87
120)()()()()()
(
8712055.0)30.020.0(45.0120)()()()
(
3 3
,
2 2
,
old
f m R M
Ro old
f m R R
Ro
VRo RRo
Ro Ro
old
f m R M
Ro old
f m R L
R Ro
VRo Ro
old Ro
Ro
old
f m R V
M old
Ro
old
f m R L
old
TUOI
TUOI
tuoi TUOI
(t1[TUOI]=30) 3(t8[TUOI])=(23.76,30.24) nên t1 TUOI ,3 t8 TUOI ;
Tương tự chúng ta có:t1 CV ,3 t8 CV ; t1 LUONG ,3 t8 LUONG
Vậy theo định nghĩa, chúng ta có: t1 , 3 t8
II.1.2 Định nghĩa quan hệ con
Cho R1 và R2 là hai quan hệ cùng xác định trên một lược đồ quan hệ Ta nói rằng R1 là quan hệ con của R2 dưới ánh xạ và độ k và viết R1 ,k R2 nếu
Trang 33Cho R1 và R2 là hai quan hệ cùng xác định trên một lược đồ quan hệ Ta nói rằng R1 ,k R2 nếu R1 ,k R2 và R2 ,k R1
II.2 Các phép toán đại số quan hệ
Khái niệm hai quan hệ khả hợp vẫn xét như trong mô hình CSDL quan hệ thông thường
Giả sử các giá trị ngôn ngữ có độ dài lớn nhất k và ánh xạ lượng hóa ngữ nghĩa là
II.2 1 Phép giao (intersection)
s t r t t s
r ,k , ,k ,k
II.2 2 Phép hợp (union)
Hợp của hai quan hệ mờ khả hợp r và s là tập các bộ thuộc r, thuộc s hoặc
thuộc cả hai quan hệ mức độ k Biểu diễn hình thức của phép toán này là:
s t r t t s
r ,k , ,k ,k
II.2 3 Phép chiếu (projection)
Phép chiếu trên một quan hệ mờ R 1 với độ k thực chất là phép toán loại đi một số thuộc tính và chỉ giữ lại một số thuộc tính của quan hệ đó Sau đó ta loại bỏ các bộ bằng nhau cấp độ k để được quan hệ R 2 sao cho R1 ,k R2
Biểu diễn hình thức của phép toán này như sau:
r X
Trong các phép toán hợp, chiếu nếu cần loại bỏ hai bộ bằng nhau trong quan
hệ kế quả thì khái niệm hai bộ bằng nhau ở đây theo nghĩa hai bộ bằng nhau dưới ánh xạ và cấp độ k theo định nghĩa III.1.1
II.2 4 Phép chọn (selection)
Cho r là một quan hệ và F là một biểu thức logic trên các thuộc tính của r như trên Phép chọn trên quan hệ r với biểu thức chọn F ,k, kí hiệu F,k(r), là tất cả các tập của r thoả mãn F ,k
true t
F r t
k
F, ( ) , , ( )Các phép so sánh trong biểu thức F ,k là: ,k, ,k, ,k, ,k, ,k, ,k Các phép toán logic trong F như (and), (or), (not) được hiểu như các phép toán logic thông thường
II.2 5 Phép kết nối (join)
Phép kết nối của quan hệ r và quan hệ s được với biểu thức kết nối F ,k được định nghĩa như sau:
true t
F s v r u v u t s
Trang 34II.3 Câu truy vấn thông tin
Với các phép toán đại số quan hệ nêu trên, ta thấy việc quản lý ngữ nghĩa của
dữ liệu tổ chức theo mô hình CSDL mờ giá trị ngôn ngữ dựa trên đại số gia tử ở phần II là khá hiệu quả và có thể triển khai trên các hệ quản trị cơ sở dữ liệu dựa trên mô hình quan hệ được thương mại hóa hiện nay Để triển khai các CSDL mờ với các hệ quản trị này cần có một số cải tiến
Cụ thể như sau:
- Xây dựng các hàm dấu, hàm ánh xạ lượng hóa ngữ nghĩa theo các định nghĩa
đã có với đầu vào là các tham số hàm độ đo tính mờ của các phần tử sinh và các gia
tử
- Xây dựng các hàm tính lân cận k(x)
- Dựa trên kết quả các hàm ở trên, xây dựng các hàm cho các phép toán so sánh theo định nghĩa gồm có các phép so sánh giữa các giá trị mờ, phép so sánh bằng nhau giữa các bộ mờ, phép toán thuộc của một bộ vào một quan hệ, quan hệ con, hai quan hệ xấp xỉ
- Gọi các hàm khi viết các câu truy vấn dựa trên các phép toán đại số quan hệ
III.1 Định nghĩa phụ thuộc hàm mờ trên mô hình CSDL mờ giá trị ngôn ngữ
Ở trong các phần trên, chúng ta đã biết quan hệ = v,k phụ thuộc vào ánh xạ
lượng hóa ngữ nghĩa v và mức so sánh k Vì với ánh xạ v khác nhau thì độ đo mờ
khác nhau và vì vậy khoảng lân cận k(x) khác nhau, do đó các lân cận k(x) cũng
khác nhau Tuy nhiên với ánh xạ v cho trước, thì quan hệ = v,k trên phụ thuộc vào mức so sánh k Trong thực tế khi so sánh 2 giá trị ngôn ngữ t1[Ai], t2[Ai], chúng ta thường quan tâm đến các yếu tố quan trọng sau:
- Khoảng giá trị ước lượng của giá trị ngôn ngữ tj[Ai], j=1,2 trên trục số thực,
đó chính là khoảng lân cận k(x)
- Mức độ chính xác của sự so sánh, tức số các từ nhấn tác động lên phần tử sinh c+ hay c-, nói cách khác đó là độ dài k tối đa của các term trên LDom(Ai)
Ví dụ khi so sánh 2 giá trị “rất cao” và “rất rất cao” của thuộc tính chiều cao, trong thực tế người ta thường quan tâm đến việc ước lượng “rất cao” và rất rất cao”
sẽ nhận giá trị là cao khoảng từ bao nhiêu mét đến bao nhiêu mét thì xem là “rất cao” hay “rất rất cao” Hơn nữa, người ta sẽ quan tâm đến trên thuộc tính ấy các giá
Trang 35trị ngôn ngữ nói về chiều cao sẽ có độ dài từ nhấn là bao nhiêu hay tối đa các mức cao sẽ là gì? Chẳng hạn “rất rất rất cao” là cao nhất, hay còn giá trị nào khác được xem là cao hơn nữa
Trong các phần dưới đây nếu không nói gì thêm về ánh xạ lượng hóa ngữ
nghĩa v, chúng ta giả thiết ánh xạ v là được cho trước và chỉ quan tâm đến mức so
sánh k Khi ấy phép so sánh =v,k được viết lại là =k
III.1.1 Định nghĩa sự tương tự ngữ nghĩa giữa hai bộ
Cho t 1 =(x 11 ,x 12 , ,x 1n ) và t 2 =(x 21 ,x 22 , ,x 2n ) là hai bộ của quan hệ r trên tập thuộc tính U, X U
Ta nói t 1 [X] tương tự ngữ nghĩa với t 2 [X] ở mức k(X), kí hiệu t 1 [X]= k(X) t 2 [X], nếu t 1 [A i ] = ki t 2 [A i ] A i X Ở đây k i là mức so sánh giữa t 1 [A i ] và t 2 [A i ] Bên cạnh
- Với Ai chỉ chứa các giá trị rõ, khi đó t1[Ai]=vi,kit2[Ai] được hiểu là phép so
i) Nếu t 1 [A i ]= k t 2 [A i ] thì với mọi k’ k, ta có t 1 [A i ]= k’ t 2 [A i ]
ii) Nếu t 1 [X]= k(X) t 2 [X] thì t 1 [Y]= k(Y) t 2 [Y]
Chứng minh:
Tính chất i) là đúng, vì lưu ý rằng với k bất kỳ ta có k+1 k Hơn nữa theo định nghĩa của k và định nghĩa t1[Ai]=kt2[Ai], ta có với k’ k thì t1[Ai]=k’ t2[Ai] Lưu ý điều ngược lại là không đúng, tức t1[Ai]=k’ t2[Ai] không suy ra được
t1[Ai]=kt2[Ai] với k k’
Tính chất ii) được suy ra từ k(X) = max{k(Ai), Ai X} max{k(Y), k(Ai),
Ai X\Y} k(Y) Giả sử t1[Y] k(Y) t2[Y] , khi đó tồn tại Ai Y: t1[Ai] k(Ai) t2[Ai], để
ý k(Ai) k(Y) k(X) Điều này là vô lý với giả thiết t1[X]=k(X)t2[X] Vậy ta có ii) đúng
III.1.3 Định nghĩa phụ thuộc hàm
Phụ thuộc hàm XY được gọi là đúng trên quan hệ r, hay r thõa XY <=>
t 1 , t 2 r: t 1 [X]= k(X) t 2 [X] => t 1 [Y] = k(Y) t 2 [Y]
Nhận xét:
Trang 36Định nghĩa III.1.3 là trường hợp tổng quát của định nghĩa phụ thuộc hàm trong [14] Phụ thuộc hàm XY cũng chính là XkY trong [14] với mức k=max{k(X),k(Y)} Tuy vậy với định nghĩa III.1.3.các dữ liệu mờ không nhất thiết phải giả định là chỉ mang các giá trị ngôn ngữ được xét trên cấu trúc đại số gia tử Hơn nữa với định nghĩa phụ thuộc hàm này, cũng không cần giả định các giá trị của thuộc tính Ai đều được xét trên cùng một cấu trúc đại số gia tử hoặc đều có cùng phân hoạch mức k, như vậy chúng ta đã khắc phục được các giả định trong [14]
III.1.4 Định lý
Mỗi phụ thuộc hàm rõ theo định nghĩa trong lý thuyết cơ sở dữ liệu quan hệ
cổ điển cũng là một phụ thuộc hàm mờ theo định nghĩa III.1.3
Chứng minh:
Trong trường hợp xét cơ sở dữ liệu quan hệ rõ, theo định nghĩa phụ thuộc hàm
ta có t1[X] = t2[X] => t1[Y] = t2[Y] Ở đây t1[X], t2[X], t1[Y], t2[Y] nhận các giá trị
rõ, nên quan hệ so sánh t1[X] =k(X) t2[X] theo định nghĩa III.1.1 trở thành so sánh trên các thuộc tính Ai nhận giá trị rõ Ta biết rằng với giá trị rõ tj[Ai] trên đại số gia
tử LDom(Ai) thì tj[Ai] là bất biến ngữ nghĩa với mọi tác động của gia tử, tức
h1h2 hntj[Ai] = tj[Ai] Do đó so sánh t1[Ai] =ki t2[Ai] được hiểu là so sánh bằng với mọi mức ki
Vì vậy mỗi phụ thuộc hàm rõ fd cũng là một phụ thuộc hàm mờ ffd theo định nghĩa III.1.3
III.2 Hệ tiên đề suy dẫn phụ thuộc hàm
III.2.1 Hệ tiên đề
AFFD1 (phản xạ): Nếu Y X thì XY
AFFD2 (tăng trưởng): Nếu XY và Z U thì XZYZ
AFFD3 (bắc cầu): Nếu XY và YZ thì XZ
III.2.2 Mệnh đề
Hệ tiên đề III.2.1 là đúng
Chứng minh
Với Y X ta có k(Y) k(X) Giả sử t1[Y] k(Y)t2[Y], tức Ai Y X sao cho
t1[Ai] k(Ai)t2[Ai] với ki k(Y) k(X), điều này là vô lý với giả thiết t1[X]=k(X)t2[X] Vậy AFFD1 là đúng
AFFD2 là đúng, thật vậy giả sử t1[XZ]=k(XZ)t2[XZ], khi đó ta có t1[X]=k(X)t2[X]
và t1[Z]=k(Z)t2[Z] (1) Do XY nên ta có t1[Y]=k(Y)t2[Y] (2) Giả sử
t1[YZ] k(YZ)t2[YZ], tức Ai YZ sao cho t1[Ai] k(Ai)t2[Ai], nếu Ai Y thì điều này dẫn đến t1[Y] k(Y)t2[Y] Vô lý với (2) Giả sử Ai Z thì điều này dẫn đến
t1[Z] k(Z)t2[Z] Vô lý với (1) Vậy ta phải có t1[YZ]=k(YZ)t2[YZ], tức AFFD2 là đúng
Với XY ta có t1[X]=k(X)t2[X]=>t1[Y]=k(Y)t2[Y], với YZ ta có
t1[Y]=k(Y)t2[Y]=> t1[Z] =k(Z) t2[Z] Vậy từ t1[X]=k(X)t2[X] => t1[Z] =k(Z) t2[Z] hay XZ Nên AFFD3 là đúng
Trang 37Nhận xét:
Dễ chứng minh được các luật suy dẫn mở rộng sau, từ hệ tiên đề III.2.1
AFFD4 (luật hợp) Nếu XY và XZ thì XYZ
AFFD5 (luật tựa bắc cầu) Nếu XY và WYZ thì WXZ
AFFD6 (luật tách) Nếu XY, Z Y thì XZ
III.2.3 Định nghĩa (Suy dẫn logic)
là suy dẫn logic từ F Nếu mọi quan hệ r trên R(U,F) thỏa mọi phụ thuộc hàm trong
F thì cũng thỏa XY và ngược lại
III.2.4 Định nghĩa (Suy dẫn theo hệ tiên đề)
là suy dẫn từ F theo hệ tiên đề III.2.1 nếu XY có thể thu được từ F qua việc sử dụng các luật của hệ III.2.1
Ta gọi tập tất cả các phụ thuộc hàm được suy dẫn từ F theo hệ tiên đề III.2.1 là bao đóng của F và được ký hiệu là F+
III.2.5 Định nghĩa (bao đóng tập thuộc tính)
Cho F là tập phụ thuộc hàm trên U, X U Kí hiệu X + là bao đóng tập thuộc tính X trên tập phụ thuộc hàm F là tập các thuộc tính A i U, sao cho XA i F +
Ngược lại, nếu Y X+, theo định nghĩa bao đóng X+
, ta có XAik với mọi k=1,2, ,m Theo luật hợp AFFD4, ta có XY F+
III.2.7 Định lý
Hệ tiên đề III.2.1 là đúng và đầy đủ
Chứng minh:
Tính đúng đắn của III.2.1 đã được nêu trong mệnh đề III.2.2
Ta chứng minh tính đầy đủ của III.2.1 Ta chứng minh giả sử có XY F+ thì
XY cũng không được suy dẫn logic từ F Tức tồn tại một quan hệ r trên tập thuộc tính U thỏa các phụ thuộc hàm trong F, nhưng r không thỏa XY
Xét quan hệ r gồm hai bộ như sau:
a a a a a a a a a a
a a a a a b b b b b Trước hết ta chứng minh r thỏa F Giả sử r không thỏa F, tức tồn tại WV F nhưng WV không đúng trên r Khi đó W X+
và V X+, tức tồn tại A V nhưng
Trang 38A X+ Với thuộc tính A như thế ta có: XW, WV, VA.Do tính bắc cầu, ta có XA F+ Điều này là vô lý với A X+ Vậy r phải thỏa F
Ta chứng minh XY không đúng trên r Thật vậy, giả sử XY đúng trên r
Khi đó X X+ và Y X+, vì nếu Y X+, khi đó tồn tại Ai Y nhưng Ai X+, tức XY không đúng trên r Nhưng nếu Y X+ thì theo mệnh đề III.2.6 ta có XY F+, điều này mâu thuẫn với giả thiết XY F+
, nên XY không đúng trên
r
Vậy mọiX Y F+ thì X Y cũng không được suy dẫn logic từ F Định lý
chứng minh xong
IV PHỤ THUỘC HÀM VÀ CÔNG THỨC LOGIC MỜ
IV.1 Nhắc lại về đại số gia tử tuyến tính đầy đủ đối xứng
Xét đại số gia tử tuyến tính đầy đủ và đối xứng của biến ngôn ngữ TRUTH sinh bởi tập từ sinh G={True, False} Trong đại số này mọi phần tử x có duy nhất một phần tử ngược x- được định nghĩa như sau: x = h n h1c, x− = h n h1c’, với
c, c’ G Toán tử bù (complement) và toán tử kéo theo (implication) được định
nghĩa như sau: ¬x = x− và x => y = ¬x y với mọi x, y Ở đây , lần lượt là toán
tử joint, meet trên dàn AX
Định lý 4.1 (xem [11]) Cho AX = (X,G,C,H,) là một đại số gia tử đầy đủ
tuyến tính và đối xứng Khi đó,
(i) ¬(hx) = h¬x, với mọi h LH and x X
(ii) ¬(¬x) = x, với mọi x X
(iii) ¬(x y) = ¬x ∩¬y và ¬(x ∩ y) = ¬x ¬y, với mọi x, y X
(iv) x ∩¬x y ¬y, với mọi x, y X
(xiii) x => y W iff x W hoặc y W, và x => y W iff x W and y W
IV.2 Tính thỏa của một công thức logic mờ
Các khái niệm về biến, term và công thức logic mờ được hiểu tương tự như trong logic mệnh đề, ở đây chân trị của một công thức logic mờ là một giá trị trên đại số gia tử đầy đủ tuyến tính của biến ngôn ngữ TRUTH Dưới đây chúng ta sẽ thiết lập một mối quan hệ giữa công thức logic mờ và phụ thuộc hàm mờ dựa trên đại số gia tử vừa nêu ở phần III
Trang 39Trong các phần dưới ta sẽ gặp khái niệm quan hệ 2-bộ thường gặp trong cơ sở
dữ liệu quan hệ Đó là các quan hệ r chỉ bao gồm 2 bộ {t1, t2}
Định nghĩa 4.1 (Phép gán chân trị cho một công thức logic mờ)
Xét lược đồ quan hệ R={A 1 , A 2 , ,A n } và r = {t 1 , t 2 } là một quan hệ 2-bộ trên
R Một phép gán chân trị trên biến A i dựa trên r, kí hiệu I r được định nghĩa như sau:
I r (A i ) H(True) nếu k: t 1 [A i ] = k t 2 [A i ] và I r (A i ) H(False) nếu t 1 [A i ] k
t 2 [A i ]
Ở đây H(True), H(False) lần lượt là tập các giá trị ngôn ngữ sinh từ 2 từ sinh True và False bởi các gia tử thuộc H trong đại số gia tử đầy đủ tuyến tính của biến
ngôn ngữ TRUTH
Định nghĩa 4.2 (Công thức logic mờ suy dẫn)
Xét phụ thuộc hàm X Y trên lược đồ quan hệ R={A 1 , A 2 , ,A n } Ở đây X={A 1, A 2, ,A m } và Y={B 1 ,B 2 ,…,B n } Xét công thức logic mờ như sau: f= (A 1 A 2 A m => B 1 B 2 … B n ) , ta nói f là công thức logic mờ được suy dẫn từ phụ thuộc hàm X Y Kí hiệu X => Y
Định nghĩa 4.3 (Tính thỏa của công thức logic mờ)
Ta nói công thức lôgic mờ f = (X => Y) là được thỏa, nếu tồn tại các phép gán chân trị I r trên các biến có trong f
Y được thỏa với phép gán chân trị trên r
Chứng minh: Giả sử quan hệ r thỏa phụ thuộc hàm X Y, khi đó t1[X] =k(X)
t2[Y] Ở đây X={A1,A2, ,Am} và Y={B1,B2,…,Bn} Giả sử công thức logic mờ F= (A1 A2 Am) => (B1 B2 … Bn) là không thỏa với một phép gán chân trị Ir’, tức
Ir’(F) H(False) Ta có Ir’(F) = Ir’((A1 A2 Am) =>(B1 B2 … Bn)) = -(Ir’(A1)
Ir’(A2) Ir’(Am)) (Ir’(B1) Ir’(B2) Ir’(Bm)) H(False) Do đó với i=1,2, ,m,
Ir’(Ai) H(True) và j=1,2, ,n, Ir’(Bj) H(False) (*)
Nếu với i=1,2, ,m, Ir’(Ai) H(True) thì t1[X]=k(X)t2[X] Do giả thiết X Y thỏa trên r nên từ t1[X]=k(X)t2[X] ta có t1[Y] =k(Y) t2[Y] Tức với j=1,2, ,m, ta có
t1[Bj]=k(Bj)t2[Bj], hay Ir’(Bj) H(True) Vô lý với (*) Vậy công thức F= (X => Y)
là thỏa với mọi phép gán chân trị Ir
Ngược lại giả sử công thức logic mờ f = (A1 A2 Am) => (B1 B2 … Bn) thỏa với phép gán chân trị Ir Ta có Ir(f) = Ir((A1 A2 Am) =>(B1 B2 … Bn)) = -(Ir(A1) Ir(A2) Ir(Am)) (Ir(B1) Ir(B2) Ir(Bm)) H(True) Khi đó xảy ra 2 trường hợp:
a) (Ir(A1) Ir(A2) Ir(Am)) H(False)
Trang 40b) (Ir(B1) Ir(B2) Ir(Bn)) H(True)
Giả sử xảy ra trường hợp a), khi đó i=1,2, ,m, Ir(Ai) H(False) Do đó t1[Ai]
k(Ai) t2[Ai] và vì vậy t1[X] k(X) t2[X] và từ đây phụ thuộc hàm X Y thỏa trên r Giả sử xảy ra trường hợp b), khi đó j=1,2, ,n, Ir(Bj) H(True), vì vậy t1[Y]
=k(Y)t2[Y] và phụ thuộc hàm X Y thỏa trên r Định lý chứng minh xong
Định lý 4.3
Xét phụ thuộc hàm X Y trên lược đồ quan hệ R và F là tập các phụ thuộc hàm trên R Khi đó ta có:
F => X Y khi và chỉ khi F => X Y trên các quan hệ 2 – bộ
Chứng minh: Điều kiện cần của định lý là hiển nhiên Ta chỉ cần chứng minh
điều kiện đủ Giả sử F => X Y trên các quan hệ 2 – bộ nhưng X Y không được suy dẫn logic từ F Khi đó tồn tại quan hệ r trên R thỏa tất cả các phụ thuộc hàm trong F nhưng r không thỏa X Y Tức tồn tại 2 bộ ti, tj trên r sao cho ti[X]
=k(X) tj[X] nhưng ti[Y] k(Y) tj[Y] Xét quan hệ r*
chỉ bao gồm 2 bộ ti, tj nói trên thì
r* thỏa F nhưng không thỏa X Y Vô lý, vậy F => XY
Định lý 4.4
Xét phụ thuộc hàm X Y trên lược đồ quan hệ R và F là tập các phụ thuộc hàm trên R Khi đó F => X Y trên các quan hệ 2 – bộ khi và chỉ khi công thức logic mờ X => Y được suy dẫn từ F, ở đây F là tập các công thức logic mờ suy dẫn
từ tập phụ thuộc hàm F theo định nghĩa 4.2
Chứng minh: Giả sử Ir là một phép gán chân trị trên R sao cho các công thức logic mờ dẫn xuất từ các phụ thuộc hàm F là được thỏa và công thức X => Y là không thỏa Khi đó ta sẽ xây dựng được một quan hệ rZ gồm 2 bộ thỏa các phụ thuộc hàm F nhưng không thỏa phụ thuộc hàm X Y
Gọi Z = {A R: Ir(A) H(True)} Xét quan hệ rZ như sau:
Các thuộc tính thuộc Z Các thuộc tính thuộc R\Z
Ở đây a và b là những giá trị của các thuộc tính A Z, sao cho a k b
Quan hệ rZ thỏa các công thức logic mờ dẫn xuất từ các phụ thuộc hàm F Thật vậy với công thức U => V F Nếu t1[U] =k(U) t2[U], khi đó với mọi thuộc tính
A U, ta có t1[A]=k(A)t2[A] nên A Z và U Z, nên Ir(U) H(True) Nếu t1[V] k(V)
t2[V], tức A V sao cho t1[A] k(A) t2[A], từ đây A Z và V Z, nên
Ir(V) H(False) Do đó Ir(X=>Y) = -Ir(Ir(X) Ir(Y)) H(False) Vô lý với giả thiết Ir
là một phép gán chân trị trên R sao cho các công thức logic mờ dẫn xuất từ các phụ thuộc hàm F là được thỏa
Bây giờ ta chứng minh rZ không thỏa X Y Thật vậy, từ giả thiết X =>Y không thỏa với phép gán chân trị Ir nên Ir(X) H(True) và Ir(Y) H(False) (*) Giả sử rZ thỏa X Y, tức t1[X]=k(X)t2[X] => t1[Y] =k(Y) t2[Y], khi đó Y Z, tức Ir(Bi) H(True) với Bi Y, do đó Ir(Y) H(True), vô lý với (*) Vậy rZ không