1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu tính giải nghĩa được của hệ mờ theo ngữ nghĩa thế giới thực

116 121 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 116
Dung lượng 1,73 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

90 III.4.1.Kiểm tra tính giải nghĩa được theo ngữ nghĩa thế giới thực của một số biểu thức mờ của lý thuyết tập mờ .... 5 DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Các ký hiệu: AX Đại số gi

Trang 1

VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

NGUYỄN THU ANH

Tên đề tài : Nghiên cứu tính giải nghĩa được của hệ mờ

theo ngữ nghĩa thế giới thực

LUẬN ÁN TIẾN SĨ TOÁN HỌC Chuyên ngành: Cơ sở toán học cho tin học

Mã số: 62.46.01.10

Người hướng dẫn khoa học:

TS Trần Thái Sơn

Hà Nội – 2019

Trang 2

1

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi Các kết quả được viết chung với các tác giả khác đều được sự đồng ý của đồng tác giả trước khi đưa vào luận án Các kết quả trong luận án là trung thực và chưa từng được công bố trong bất kỳ công trình nào khác

Tác giả

Nguyễn Thu Anh

Trang 3

2

LỜI CẢM ƠN

Luận án được hoàn thành dưới sự hướng dẫn tận tình và nghiêm khắc của TS.Trần Thái Sơn Lời đầu tiên, tác giả xin bày tỏ lòng kính trọng và biết ơn sâu sắc tới Thầy

Xin chân thành gửi lời cảm ơn tới PGS TSKH Nguyễn Cát Hồ về những đóng góp quý báu trong quá trình nghiên cứu cũng như trong thời gian hoàn thành luận án

Tác giả xin chân thành gửi lời cảm ơn đến Ban lãnh đạo Viện Công nghệ thông tin, Bộ phận đào tạo, Phòng Các hệ chuyên gia và tính toán mềm đã tạo điều kiện thuận lợi trong quá trình học tập, nghiên cứu và hoàn thành luận án

Cảm ơn các anh chị phòng Các hệ chuyên gia và tính toán mềm - Viện Công nghệ thông tin, nhóm nghiên cứu về đại số gia tử đã động viên và trao đổi kinh nghiệm để tác giả có thể hoàn thành luận án

Cuối cùng, tác giả xin chân thành cảm ơn các thành viên trong Gia đình, những người luôn dành cho tác giả những tình cảm nồng ấm và sẻ chia những lúc khó khăn trong cuộc sống, luôn động viên giúp đỡ tác giả trong quá trình nghiên cứu Luận án cũng là món quà tinh thần mà tác giả trân trọng gửi tặng đến các thành viên trong Gia đình

Trang 4

3

MỤC LỤC

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT 5

DANH MỤC CÁC HÌNH VÀ BẢNG BIỂU 7

CHƯƠNG I : NHỮNG KIẾN THỨC CƠ SỞ 18

I.1 Tập mờ và các phép toán trên tập mờ 18

I.1.1.Tập mờ 18

I.1.2.Các phép toán trên tập mờ 19

1) Phép khử mờ 19

2) Phép kết nhập 20

3) Phép kéo theo mờ 21

4) Phép hợp thành các quan hệ mờ 22

I.2 Biến ngôn ngữ 23

I.3 Phân hoạch mờ 24

I.4 Mô hình mờ 25

I.5 Hệ dựa trên luật mờ (Hệ mờ) 26

1) Các thành phần của hệ mờ 26

2) Các mục tiêu khi xây dựng FRBS 27

3) Ứng dụng của hệ mờ 29

I.6 Đại số gia tử 32

1) Khái niệm Đại số gia tử 32

2) Một số tính chất của Đại số gia tử tuyến tính 33

3) Độ đo tính mờ của các giá trị ngôn ngữ 34

4) Khoảng tính mờ 37

5) Định lượng ngữ nghĩa của giá trị ngôn ngữ 38

I.7 Kết luận chương 1 40

CHƯƠNG 2 TÍNH GIẢI NGHĨA ĐƯỢC CỦA KHUNG NHẬN THỨC NGÔN NGỮ TRONG CÁC HỆ MỜ NGÔN NGỮ 41

II.1.Mở đầu 41

II.2.Tính giải nghĩa được của LRBSs ở mức từ ngôn ngữ 44

II.2.1.Lược đồ giải bài toán tính giải nghĩa được của biểu diễn tính toán khung nhận thức ngôn ngữ 47

Trang 5

4

II.2.2.Ràng buộc về tính giải nghĩa được của việc biểu diễn ngữ nghĩa của

các từ của biến 50

II.2.3.Bổ sung ràng buộc trên biểu diễn tính toán của các khung NTNN 55

II.3.Giải nghĩa tính toán của LFoCs với tập mờ tam giác/ hình thang 58

II.4.Kết luận chương 2 63

CHƯƠNG 3 TÍNH GIẢI NGHĨA ĐƯỢC THEO NGỮ NGHĨA THẾ GIỚI THỰC CỦA CÁC BIỂU THỨC NGÔN NGỮ 65

III.1.Mở đầu 65

III.2.Tính giải nghĩa được theo ngữ nghĩa thế giới thực của miền từ các biến ngôn ngữ 67

III.2.1.Khái niệm mới về tính giải nghĩa được theo ngữ nghĩa thế giới thực (RWS) của các lý thuyết hình thức 68

III.2.2.Tính giải nghĩa được ngữ nghĩa thế giới thực của ngôn ngữ tự nhiên của con người và đại số gia tử các biến ngôn ngữ 77

III.3.Tính giải nghĩa được ngữ nghĩa thế giới thực của các thành phần cấu thành của các hệ mờ 80

III.3.1.Tính giải nghĩa được theo ngữ nghĩa thế giới thực của các khung nhận thức ngôn ngữ LFoCs 81

III.3.2.Khả năng giải nghĩa được theo ngữ nghĩa thế giới thực đối với biểu diễn tính toán của LRB và ARM 85

III.4.Về tính giải nghĩa được theo ngữ nghĩa thế giới thực của các biểu thức, phương pháp luận hay các lý thuyết ngôn ngữ mờ 90

III.4.1.Kiểm tra tính giải nghĩa được theo ngữ nghĩa thế giới thực của một số biểu thức mờ của lý thuyết tập mờ 90

III.4.2.Phương pháp biểu diễn đồ thị của các cơ sở luật ngôn ngữ và tính giải nghĩa được theo ngữ nghĩa thế giới thực của nó 96

III.4.3.Phương pháp lập luận xấp xỉ thực hiện trên biểu diễn đồ thị của các cơ sở luật ngôn ngữ 100

III.5.Kết luận chương 3 105

KẾT LUẬN CỦA LUẬN ÁN 106

CÁC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN 109

Trang 6

5

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT

Các ký hiệu:

AX Đại số gia tử tuyến tính

AX * Đại số gia tử tuyến tính đầy đủ

(h) Độ đo tính mờ của gia tử h

fm(x) Độ đo tính mờ của hạng từ x

Hàm định lượng của giá trị ngôn ngữ của biến

A (x) Hàm xác định độ thuộc của giá trị x vào tập mờ A

l(x) Độ dài của từ ngôn ngữ x

fm Khoảng tính mờ của giá trị ngôn ngữ

X k Tập các hạng từ có độ dài đúng k

X (k) Tập tất cả các hạng từ có độ dài  k

Comp Độ phức tạp của hệ luật

C(𝒳) Tập hợp các đối tượng tính toán

core(x) Lõi ngữ nghĩa của từ x

int Ngữ nghĩa khoảng của từ

ℐfuz Giải nghĩa tập mờ của từ

trp Ngữ nghĩa bộ ba của từ

CS Không gian tính toán

CSw Không gian tính toán thích hợp với thế giới thực W

Sw Cấu trúc của thế giới thực con W

Các từ viết tắt:

ĐSGT Đại số gia tử

FoC Frame of Cognitive

FRBS Fuzzy Rule-based System

FRB Fuzzy Rule-based

Trang 7

FSyst Fuzzy System

ARM Approximate Reasoning Method

Trang 8

7

DANH MỤC CÁC HÌNH VÀ BẢNG BIỂU

Các hình

Hình 1.1 Tập mờ hình thang 19

Hình 1.2 Một cấu trúc phân hoạch mờ dạng đơn thể hạt 25

Hình 1.3 Một cấu trúc phân hoạch mờ dạng đa thể hạt 25

Hình 1.4 Bộ bốn (a,b,c,d) biểu diễn cho hàm thuộc dạng hình thang của tập mờ 31

Hình 1.5 Cấu trúc thứ bậc đa thể hạt phân tách mô hình tính mờ của các từ ngôn ngữ dựa trên quan hệ chung-riêng (generality-spcificity) qua tác động của các gia tử 34

Hình 1.6 Cấu trúc thứ bậc các khoảng tính mờ của các từ ngôn ngữ của biến 𝒳 được xác định bởi ánh xạ đẳng cấu f và các mô hình tính mờ của chúng 35 Hình 1.7 Độ đo tính mờ của biến TRUTH 36

Hình 1.8 Khoảng tính mờ của các hạng từ của biến TRUTH 38

Hình 2.1 Lược đồ giải nghĩa tính toán I của LFoC 47

Hình 2.2 54

(a) Ví dụ về hai tam giác có thứ tự theo điều kiện (ii):(a, b, d) ≼m (a', b', d') (b) Ví dụ về hai tam giác có thứ tự theo điều kiện (iii): (a, b, d) ≼w (a', b', d') Hình 2.3 Đa thể hạt với tập mờ tam giác/hình thang của các từ trong LFoC 𝔉 60

Hình 3.1 Mối quan hệ giữa các lý thuyết hình thức, các mô hình và ứng dụng của chúng và các thế giới con của thế giới thực tương ứng 68

Hình 3.2 Lược đồ giải quyết vấn đề giải nghĩa được RWS 75

Hình 3.3 Biểu diễn đa thể hạt tam giác/hình thang giải nghĩa RWS của X TUỔI,(2) 84

Hình 3.4 Hợp của 2 tập mờ của biến CHIỀU_CAO 92

Trang 10

9

MỞ ĐẦU

Trong những thập niên gần đây khoa học và công nghệ phát triển rất mạnh mẽ, đã sản sinh ra nhiều thiết bị máy móc hỗ trợ cho con người trong mọi lĩnh vực của sống Trong một số lĩnh vực, chúng ta mong muốn máy móc có thể mô phỏng được hành vi, khả năng lập luận như con người và đưa

ra cho con người những gợi ý tin cậy trong quá trình ra quyết định Một đặc trưng nổi bật của con người là khả năng suy luận trên cơ sở tri thức được hình thành từ cuộc sống và biểu thị bằng ngôn ngữ tự nhiên Do đó máy móc muốn hành xử như con người thì nó phải được trang bị cơ sở tri thức và khả năng lập luận trên ngôn ngữ Đây là một bài toán rất phức tạp, vì vậy để giải quyết yêu cầu này các nhà khoa học đã và đang nghiên cứu cả về lý thuyết lẫn ứng dụng với mục đích đưa ra các phương pháp nhằm mô phỏng khả năng lập luận của con người trên các thiết bị máy móc Do đặc trưng của ngôn ngữ là tính mờ, vì vậy bài toán đầu tiên cần phải giải quyết đó là làm thế nào để hình thức hóa toán học các vấn đề ngữ nghĩa ngôn ngữ và xử lý ngữ nghĩa ngôn ngữ mà con người thường thao tác trong cuộc sống

Trước những yêu cầu đặt ra đó, năm 1965 Lotfi A Zadeh là người đầu tiên đặt nền móng trong lĩnh vực này trong [62] Ý tưởng của ông là ngữ nghĩa của mỗi từ mờ được biểu diễn bằng một hàm từ tập vũ trụ U vào đoạn [0, 1] và hàm đó gọi là tập mờ trên U Vì vậy, với mỗi tập mờ ứng với một từ

mờ vốn không tính toán được trở thành một đối tượng toán học hoàn toàn có thể tính toán được Dựa trên lý thuyết tập mờ, hệ dựa trên luật mờ (Fuzzy Rule Based System - FRBS) đã được phát triển và trở thành một trong những công cụ mô phỏng gần gũi phương pháp suy luận và lấy quyết định của con người nhất FRBS đã thu được nhiều thành công trong giải quyết các bài toán thực tiễn như bài toán điều khiển, bài toán phân lớp, bài toán hồi quy, bài toán trích rút ngôn ngữ

FRBS được phát triển trên nền tảng lý thuyết tập mờ và logic mờ, với thành phần cơ bản là các luật mờ dạng if-then là một trong những phương tiện khá tốt mô phỏng khả năng lập luận của con người trong giải quyết các vấn đề phức tạp với những thông tin không chắc chắn, có tính mơ hồ Các

Trang 11

10

FRBS thường được xây dựng tự động từ các sự kiện trong thế giới thực hoặc trên cơ sở tri thức của các chuyên gia, hoặc kết hợp cả hai phương pháp Khi xây dựng các FRBS, chúng ta cần đạt được hai mục tiêu là độ chính xác (accuracy) và tính giải nghĩa được (interpretability) Đây là hai mục tiêu xung đột nhau, làm tăng mục tiêu này thì phải giảm mục tiêu kia

Vì vậy, khi xây dựng các FRBS các thuật toán được đề xuất luôn phải hướng tới đảm bảo sự cân bằng giữa hai mục tiêu này Trong những năm đầu ứng dụng FRBS, người ta chủ yếu quan tâm đến độ chính xác Mục tiêu tính giải nghĩa được của FRBS được quan tâm nhiều hơn khi FRBS được ứng dụng vào các lĩnh vực mà ở đó con người là trung tâm, ví dụ: y tế, tâm lý học, kinh tế, ngôn ngữ học [19] Trong những lĩnh vực này các FRBS được xem như là các hộp xám (gray-boxes) Và ở đây đặt ra yêu cầu là các FRBS khi được ứng dụng thì người dùng có thể kiểm tra và hiểu được tất cả các thành phần của nó [24] Vì vậy, trong những năm gần đây vấn đề tính giải nghĩa được của FRBS trở thành một chủ đề “nóng” được nhiều nhà khoa học tập trung nghiên cứu Ví dụ như Alonso và cộng sự [24], Antonelli và các cộng

sự [16], Cordon [17], Gacto và cộng sự [18], Ishibuchi và Nojima [34], Mencar và các cộng sự [28] [19], Nauck [42], de Oliveira [48], Pulkkinen và Koivisto [21], Zhou và Gan [29]

Mục tiêu độ chính xác của FRBS đã có định nghĩa bằng công thức toán học để đánh giá như thế nào là một FRBS tốt Với bài toán phân lớp, độ chính xác được đo bằng tỉ lệ phần trăm giữa số mẫu dữ liệu được phân lớp chính xác trên số mẫu dữ liệu được kiểm tra, tỉ lệ này càng cao càng tốt Với bài toán hồi quy độ chính xác được đo bằng giá trị trung bình phương sai (Mean Square Error viết tắt là MSE) giữa giá trị đầu ra được lập luận bằng FRBS với giá trị đầu ra cho trước của mẫu dữ liệu, giá trị này càng nhỏ càng tốt

Về tính giải nghĩa được của FRBS, trong [19] Mencar cho rằng “Tính giải nghĩa được là vấn đề chính khi thiết kế các hệ thống dựa trên tính toán với từ (Computing With Word - CWW), thiếu tính giải nghĩa được sẽ làm thiệt hại đến những lợi ích của CWW Nếu FRBS không có tính giải nghĩa được thì thay thế bằng các phương pháp thuần số học sẽ mang lại hiệu quả cao hơn” Do đó những năm gần đây mục tiêu tính giải nghĩa được được các

Trang 12

11

nhà nghiên cứu quan tâm nhiều hơn khi thiết kế FRBS Tính giải nghĩa được không phải là một tính chất, nó liên quan đến nhiều yếu tố khác nhau Hiện tại chúng ta vẫn chưa có một tiêu chuẩn toán học để mô tả chính xác khái niệm này trong lý thuyết tập mờ, và vẫn còn nhiều quan điểm khác nhau, ngay cả các thuật ngữ để chỉ tính giải nghĩa được cũng chưa thống nhất, như thuật ngũ tính dễ hiểu (intelligibility), tính trong suốt (transparence), tính dễ đọc (readability), …, các thuật ngữ này có khi được sử dụng đồng nghĩa và thay thế cho nhau [17] Trong một số nghiên cứu, các tác giả đã cố gắng đánh giá tính giải nghĩa được của các FRBS bằng cách phân chia các yếu tố liên quan đến nó theo từng nhóm và thiết lập một tập các ràng buộc ở các mức khác nhau Tính giải nghĩa được được đánh giá dựa trên mức độ thỏa mãn những ràng buộc này

Trong [18] Gacto cho rằng hiện tại có hai hương tiếp cận chính về tính giải nghĩa được Hướng thứ nhất dựa trên độ phức tạp (Complexity-based Interpretability), hướng này tập trung vào việc làm giảm độ phức tạp của mô hình đạt được, thường sử dụng các độ đo như số luật, số biến, độ dài của luật, số từ sử dụng cho một biến,… Hướng thứ hai dựa trên ngữ nghĩa (Semantics-based Interpretability), hướng này tập trung vào đảm bảo tính toàn vẹn ngữ nghĩa của các nhãn ngôn ngữ, được thể hiện bằng các tập mờ được thiết kế cho FRBS và ngữ nghĩa của luật Một hướng tiếp cận khác được Mencar và các cộng sự đề xuất trong [19], được gọi là phương pháp tiếp cận dựa trên độ đo tương tự để đánh giá tính giải nghĩa được của các luật mờ dựa trên ngữ nghĩa Ý tưởng của họ là hiện tại có hai cách nhìn vào các luật mờ Cách nhìn thứ nhất, mỗi luật mờ được xem như là một biểu thức ngôn ngữ, bao gồm các từ và từ nối của một ngôn ngữ và nó được gọi là luật ngôn ngữ Cách nhìn thứ hai, luật mờ được xem như là một biểu thức của các tập mờ, bao gồm các tập mờ và các toán tử trên các tập mờ Tính giải nghĩa được của các luật mờ được đo bằng độ tương tự giữa tri thức được biểu diễn bằng biểu thức tập mờ và biểu thức ngôn ngữ trong ngôn ngữ tự nhiên (tri thức mà người dùng thu nhận được khi đọc luật mờ) Theo hiểu biết của chúng tôi, đây là lần đầu tiên đưa ra một ý tưởng mới để đánh giá tính giải nghĩa được của các luật mờ Tuy nhiên, việc xác định độ đo tương

tự của tri thức như vậy là một bài toán khó, khi ngữ nghĩa tính toán của các

từ và từ nối giữa chúng không được định nghĩa bằng một phương pháp hình

Trang 13

12

thức đầy đủ dựa trên ngữ nghĩa vốn có của từ Vì thế, có thể phải tìm kiếm một hướng tiếp cận mới cho vấn đề này mà ở đó ngữ nghĩa tính toán của từ được định nghĩa bằng một phương pháp hình thức đầy đủ dựa trên ngữ nghĩa vốn có của từ

Năm 2017, một cách tiếp cận mới đối với khả năng giải nghĩa được của

hệ mờ, đó là cách tiếp cận dựa trên tính giải nghĩa theo ngữ nghĩa thế giới thực (Real-world-semantics-based approach – RWS- approach) lần đầu tiên

đã được đề xuất và bước đầu được khảo sát trong [5] bởi N.C Hồ và cộng

sự Cách tiếp cận này dựa trên các ngữ nghĩa mang tính chất thế giới thực của các từ và các mối quan hệ giữa ngữ nghĩa của các thành phần hệ mờ với các cấu trúc phần tương ứng trong thế giới thực

Cụ thể, cách tiếp cận theo ngữ nghĩa thế giới thực đề cập đến mối quan

hệ giữa ba thực thể: (1) một hệ thống mờ, được coi là một biểu thức hình thức; (2) mô hình của nó, đó là hình ảnh tính toán của biểu thức hình thức và (3) cấu trúc thế giới thực của nó Tính giải nghĩa theo ngữ nghĩa thế giới thực của biểu thức tính toán biểu diễn một thành phần hệ thống mờ được đảm bảo bởi các ràng buộc được đề xuất từ hiện thực tương ứng của nó.Cách tiếp cận ngữ nghĩa thế giới thực thiết lập một cơ sở hình thức để thu hẹp khoảng cách giữa ngữ nghĩa tính toán của một hệ thống được thiết kế bởi người thiết kế và ngữ nghĩa thực sự của tất cả các thành phần hệ thống, bao gồm khung nhận thức ngôn ngữ (LFoCs), cơ sở luật ngôn ngữ (FRBs) và phương pháp lập luận xấp xỉ (ARM), được xác định trong ngữ cảnh thế giới thực mà nó liên quan Vì ngữ nghĩa của bất kỳ biểu thức hoặc lý thuyết hình thức nào (kể cả lý thuyết toán học) phải được định nghĩa trong quan hệ chặt chẽ với thực tế liên quan, luôn có khoảng cách mà người phát triển phải vượt qua để đảm bảo theo rằng lý thuyết được mô hình hoá phù hợp với phần tương ứng của nó trong thế giới thực Do đó, câu hỏi làm thế nào để đảm bảo tính giải nghĩa được theo ngữ nghĩa thế giới thực trong ngữ cảnh của lý thuyết tập mờ vẫn là một vấn đề mở Một số câu hỏi được các tác giả trong [5] chỉ ra nhưng chúng phải được khảo sát kỹ hơn, ví dụ như vấn đề về tính giải nghĩa theo ngữ nghĩa thế giới thực của phương pháp lập luận xấp xỉ

Trang 14

13

Các phương pháp xây dựng FRBS từ dữ liệu theo hướng tiếp cận dựa trên lý thuyết tập mờ, do thiếu một liên kết hình thức đầy đủ giữa các tập mờ biểu diễn ngữ nghĩa tính toán của từ với ngữ nghĩa vốn có của nó và các từ

sử dụng trong FRBS chỉ được xem như là các nhãn hay là các ký hiệu gán cho các tập mờ tương ứng, rất khó có thể chuyển tải được đầy đủ ngữ nghĩa tiềm ẩn (underlying semantics) như các từ ngôn ngữ tự nhiên Điều này làm cho tính giải nghĩa được của các FRBS giảm đi đáng kể so với các FRBS mà các từ sử dụng trong nó là các từ ngôn ngữ tự nhiên(trong [9] gọi là Linguistic Rule Based System - LRBS) Thêm vào đó khi thực hiện tìm kiếm các FRBS tối ưu, các phương pháp này thường phải tìm kiếm trong không gian luật và không gian tham số của tập mờ rất lớn Vì ở đây các tập mờ chỉ

có thể xác định được bằng một bộ các tham số độc lập hoặc một tham số và mối quan hệ với tập mờ liền kề Chẳng hạn, trong trường hợp sử dụng tập

mờ tam giác, mỗi tập mờ được biểu diễn bằng bộ 3 tham số, khi đó số chiều của không gian tìm kiếm tham số là 3Tn cho các biến đầu vào, trong đó n

là số chiều của bài toán và T là số từ sử dụng cho mỗi biến Trong trường hợp tập mờ tam giác được xác định bằng một tham số xác định lõi và lõi của các tập mờ liền kề xác định độ hỗ trợ của nó thì không gian tìm kiếm tham

số là T*n chiều cho các biến đầu vào (T  2)

Để giảm không gian tìm kiếm, các phương pháp dựa trên lý thuyết tập

mờ phải đưa ra một số ràng buộc trên tính giải nghĩa được của FRBS được định nghĩa dựa trên độ phức tạp Chẳng hạn như yêu cầu giới hạn số tập mờ

có thể sử dụng T trên mỗi biến không quá 72 [63], hoặc số tập mờ sử dụng trong tất cả các biến ngôn ngữ phải tương đương nhau, hoặc số luật tối đa trong các RB không quá lớn Giới hạn này không phù hợp vì trong thực tế khi con người hình thành các luật ngôn ngữ họ có thể lựa chọn bất kỳ từ nào trong ngôn ngữ của họ mà nó phù hợp với luật cần xây dựng, và số các luật trong miền tri thức của họ nhìn chung là lớn

Để khắc phục phần nào những hạn chế của hướng tiếp cận dựa trên lý thuyết tập mờ, Nguyen và Wechler đã đề xuất một hướng tiếp cận đại số được gọi là Đại số gia tử (ĐSGT) cho vấn đề ngữ nghĩa tính toán của các từ ngôn ngữ [58] [56] Trong [58] [43] [35] Nguyen và cộng sự chỉ ra rằng, ngữ nghĩa tính toán của từ phải được định nghĩa dựa trên ngữ nghĩa thứ tự vốn có

Trang 15

14

của các từ của biến, và các miền từ của các biến thiết lập một cấu trúc dựa trên thứ tự là đủ giầu để giải các bài toán thực tế Phương pháp luận ở đây là mỗi miền từ trở thành một cấu trúc toán học Việc gán ngữ nghĩa tính toán cho các từ của một biến bằng các tập mờ được xem như là một ánh xạ Về nguyên tắc, nó phải là một đẳng cấu từ miền từ với cấu trúc tính toán yếu vào một cấu trúc tính toán đủ giầu [35] và phải bảo toàn những tính chất quan trong và cần thiết của từ, chẳng hạn như cấu trúc thứ tự, tính khái quát

và tính đặc tả

Đại số gia tử hình thành một phương pháp tiếp cận đại số đối với ngữ nghĩa vốn có của các từ của một biến ngôn ngữ Nó thiết lập một phương pháp hình thức đầy đủ và đúng đắn để liên kết ngữ nghĩa định lượng (ngữ nghĩa tính toán) của các từ bao gồm cả ngữ nghĩa dựa trên tập mờ với ngữ nghĩa vốn có của từ ngôn ngữ Với phương pháp tiếp cận này, chúng ta chỉ cần một bộ độ đo tính mờ của các từ của một biến đủ để xác định những đặc tính định lượng khác nhau của từ như: khoảng tính mờ, khoảng tương tự, giá trị ngữ nghĩa định lượng (hoặc ngữ nghĩa số), và ngữ nghĩa dựa trên tập mờ

Do đó khi phát triển các thuật toán tối ưu xây dựng các FRBS từ tập dữ liệu theo hướng tiếp cận dựa trên ĐSGT thì không gian tìm kiếm các tham số tập mờ giảm đi đáng kể so với các thuật toán được phát triển theo hướng tiếp cận dựa trên lý thuyết tập mờ Bên cạnh đó, các từ xuất hiện trong FRBS là các từ ngôn ngữ tự nhiên Do đó, nó có thể chuyển tải được ngữ nghĩa tiềm

ẩn và làm cho FRBS tăng tính dễ giải nghĩa với người dùng

Với cách tiếp cận này, các tác giả trong [9] khởi tạo một hướng đánh giá tính giải nghĩa được của FRBS mới, với ý tưởng tương tự như logic truyền thống, tập trung nghiên cứu và đưa ra các ràng buộc tính giải nghĩa được của FRBS ở mức phân hoạch mờ Để thực hiện việc này, các tác giả đưa khái niệm khung nhận thức ngôn ngữ (LFoC) trên cơ sở khái niệm khung nhận thức (FoC) và lý thuyết ĐSGT, đã đề xuất 4 ràng buộc:

- Ràng buộc 1 về vai trò ngữ nghĩa tính toán của của từ, nhằm bảo toàn ngữ nghĩa vốn có của từ trong cơ sở luật

- Ràng buộc 2 về ngữ nghĩa tính toán của từ, nhằm đưa ra một yêu cầu ngữ nghĩa tính toán của từ phải được xây dựng bằng một phương pháp hình thức đầy đủ trên miền từ của biến ngôn ngữ

Trang 16

sở ngữ nghĩa tự nhiên vốn có của nó

Với mong muốn được tiếp tục các nghiên cứu về vấn đề giải nghĩa được của FRBSs theo cách tiếp cận ngữ nghĩa thế giới thực, cũng như áp dụng đại

số gia tử để giải bài toán về tính giải nghĩa được, Luận án đặt ra mục tiêu là tập trung vào thực hiện các nội dung sau:

- Nghiên cứu vấn đề tính giải nghĩa được của FRBS theo hướng tiếp cận dựa trên ĐSGT và đề xuất thêm một số ràng buộc, định nghĩa, định lý theo hướng tiếp cận này

- Nghiên cứu cách tiếp cận dựa trên khả năng giải nghĩa theo thế giới thực đối với vấn đề tính giải nghĩa được của hệ mờ Trong luận án này, chúng tôi sẽ phân tích sâu và thiết thực hơn về tính giải nghĩa của các lý thuyết hình thức bao gồm các ngôn ngữ tự nhiên của con người nói chung và các hệ mờ được hình thức hoá nói riêng

Theo mục tiêu đặt ra ở trên, Luận án đã đạt được một số kết quả chính

có thể khái quát như sau:

 Nghiên cứu, phân tích phép giải nghĩa như là việc nghiên cứu mối quan hệ giữa ngữ nghĩa thế giới thực của các biểu thức ngôn ngữ và ngữ nghĩa tính toán của biểu thức tính toán gán cho biểu thức ngôn ngữ Trên cơ

sở ý tưởng này, đề xuất lược đồ giải bài toán tính giải nghĩa được của biểu diễn tính toán của các khung nhận thức ngôn ngữ (khung NTNN), trong đó khâu phát hiện ngữ nghĩa cấu trúc của khung NTNN có ý nghĩa quan trọng

Trang 17

16

 Thay cho việc đưa ra các ràng buộc đối với tập mờ được thiết kế

để bảo đảm tính giải nghĩa được của các hệ mờ như trong các nghiên cứu hiện nay, LA nghiên cứu đề xuất các ràng buộc đối với các phép giải nghĩa được xây dựng để chuyển tải, bảo toàn các khía cạnh ngữ nghĩa mong muốn của khung NTNN cho các hệ mờ

 Ứng dụng phương pháp tiếp cận ĐSGT giải bài toán tính giải nghĩa được của biểu diễn tính toán của các khung NTNN bằng việc xây dựng cấu trúc đa thể hạt các tập mờ tam giác hay các tập mờ hình thang Các tính chất quan trọng của ngữ nghĩa cấu trúc của khung NTNN là các quan hệ thứ

tự, quan hệ chung-riêng gắn kết với chức năng nghĩa của các gia tử và lõi ngữ nghĩa của các từ ngôn ngữ Chúng dẫn đến các ràng buộc đối với việc biểu diễn tính toán khung NTNN áp đặt lên các phép giải nghĩa được nghiên cứu Đã chứng minh các phép giải nghĩa thỏa tất cả hay một phần những ràng buộc đã thảo luận và đề xuất

 Làm rõ thêm về tính giải nghĩa theo ngữ nghĩa thế giới thực của các ngôn ngữ tự nhiên của con người, các miền từ của các biến và vai trò cơ bản của nó trong việc kiểm tra khả năng giải nghĩa ngữ nghĩa thế giới thực của các thành phần của hệ thống mờ

 Chứng minh rằng các đại số tập mờ tiêu chuẩn không phải là giải nghĩa được ngữ nghĩa thế giới thực

 Đề xuất một phương pháp hình thức hoá để giải quyết sự giải nghĩa ngữ nghĩa thế giới thực của các hệ thống mờ trong trường hợp hai và n biến đầu vào

Bố cục của luận án gồm: phần mở đầu, 3 chương, phần kết luận và tài liệu tham khảo Kết quả chính của LA tập trung ở chương 2 và 3 Cụ thể: Chương 1 trình bày những kiến thức cơ sở cần thiết làm nền tảng trong quá trình nghiên cứu và những đề xuất mới của LA Các khái niệm của lý thuyết tập mờ như: tập mờ, phương pháp xây dựng tập mờ, biến ngôn ngữ, phân hoạch mờ Trình bày những nội dung cơ bản của lý thuyết ĐSGT như: khái niệm ĐSGT, ĐSGT tuyến tính, ĐSGT tuyến tính đầy đủ, độ đo tính mờ, hàm định lượng ngữ nghĩa (SQM), hệ khoảng tương tự Trình bày tóm tắt về

hệ mờ, ứng dụng của hệ mờ và tính giải nghĩa được của nó

Trang 18

17

Chương 2 bàn luận về vấn đề tính giải nghĩa được của Khung nhận thức ngôn ngữ, trình bày khái niệm khung nhận thức, và phát biểu định nghĩa khung nhận thức ngôn ngữ (LFoC) Trình bày hướng tiếp cận giải quyết vấn

đề tính giải nghĩa được của FRBS dựa trên ĐSGT, các ràng buộc trên khung nhận thức ngôn ngữ, như ràng buộc ngữ nghĩa của từ, ràng buộc phương pháp xác định ngữ nghĩa tính toán của từ, ràng buộc trên ngữ nghĩa khoảng của từ và ràng buộc ngữ nghĩa thứ tự của từ Cũng trong chương này, LA đề xuất thêm các ràng buộc như ràng buộc về lõi ngữ nghĩa, ràng buộc về ngữ nghĩa khoảng và khoảng lõi, ràng buộc về ngữ nghĩa tập mờ của từ, phương pháp thiết kế ngữ nghĩa tính toán dạng cấu trúc đa thể hạt cho từ ngôn ngữ của LFoC, thỏa mãn những ràng buộc đã được đề xuất Phát biểu và chứng minh các định lý về tính đúng đắn và sự thỏa mãn các ràng buộc mới

Chương 3 thảo luận chi tiết hơn về vấn đề tính giải nghĩa được theo thế giới thực của các hệ thống mờ, làm rõ thêm sự giải nghĩa RWS của các ngôn ngữ tự nhiên của con người và các miền từ của các biến và vai trò cơ bản của nó trong việc kiểm tra khả năng giải nghĩa RWS của các thành phần của hệ thống mờ Kiểm tra khả năng giải nghĩa của RWS về các hoạt động

cơ bản của lý thuyết tập mờ được định hướng lần đầu tiên để trả lời cho câu hỏi liệu lý thuyết này có phải là giải nghĩa được RWS hay không Đề xuất một khả năng giải quyết sự giải nghĩa RWS của một số phương pháp lý luận xấp xỉ dựa trên lý thuyết đại số gia tử và lý thuyết định lượng của chúng

Trang 19

18

CHƯƠNG I : NHỮNG KIẾN THỨC CƠ SỞ

I.1 Tập mờ và các phép toán trên tập mờ

Lý thuyết tập mờ được Zadeh thiết lập lần đầu năm 1965 trong [62] và được phát triển mạnh mẽ từ đó đến nay Trong mục này chúng tôi chỉ trình bày một số khái niệm và phép toán cần thiết cho LA

I.1.1 Tập mờ

Khái niệm tập mờ là một mở rộng của lý thuyết tập hợp cổ điển và được dùng trong lôgic mờ Theo đó, ngữ nghĩa của mỗi từ mờ được biểu diễn bằng một hàm từ tập vũ trụ U vào đoạn [0, 1] và hàm đó gọi là tập mờ trên

U Trong lý thuyết tập hợp cổ điển, quan hệ thành viên của các phần tử trong một tập hợp được đánh giá theo kiểu nhị phân, một phần tử hoặc thuộc hoặc không thuộc về tập hợp đó Với tập mờ thì bất kỳ phần tử nào trong vũ trụ đều có thể thuộc về nó với mức độ thuộc được đo bởi một giá trị trong đoạn [0, 1]

Định nghĩa 1.1 [62] Cho U là vũ trụ các đối tượng Tập mờ A trên U

là tập các cặp có thứ tự (x, A (x)), với A (x) là hàm từ U vào [0,1] gán cho

mỗi phần tử x thuộc U giá trị A (x) phản ánh mức độ của x thuộc vào tập mờ

A

Nếu A (x) = 0 thì ta nói x hoàn toàn không thuộc vào tập A, ngoài ra nếu

A (x) = 1 thì ta nói x thuộc hoàn toàn vào A Trong Định nghĩa 1.1, hàm

còn được gọi là hàm thuộc (membership function)

Một số hàm thuộc thông dụng trong ứng dụng của lý thuyết tập mờ:

- Dạng tam giác: A (x) = max(min((x-a)/(b-a),(c-x)/(c-b)),1),

- Dạng hình thang: A (x) = max(min((x-a)/(b-a),(d-x)/(d-c),1),1),

- Dạng Gauss: A (x) = exp(-(c-x)2/(22)), trong đó a, b, c, d, , là các tham số của hàm thuộc tương ứng

Trang 20

19

Có nhiều dạng hàm thuộc để biểu diễn cho tập mờ A, mà trong đó dạng

hình thang, hình tam giác và hình chuông là thông dụng nhất Sau đây là một

ví dụ về hàm thuộc được cho ở dạng hình thang

Ví dụ 1.1 Cho A là một tập mờ, A có thể được biểu diễn dưới dạng

hình thang với hàm thuộc liên tục A (x) như sau:

R x

d x

d x c c d

x d

c x b

b x a a b

a x

a x

d c b a

,1,

,0

),,,

như t-norm, t-conorm, negation và phép kéo theo (implication), trong lôgíc

mờ được đề xuất, nghiên cứu chi tiết cung cấp cho các mô hình ứng dụng giải các bài toán thực tế

I.1.2 Các phép toán trên tập mờ

Trang 21

) (

) (

x

x x x

k

i i

o Phương pháp điểm giữa x* = (x1 + x k)/2

Lưu ý rằng khi chọn phương pháp khử mờ chúng ta cần quan tâm đến phương pháp mờ hoá ban đầu

Dựa vào các tính chất của các toán tử người ta chia thành các dạng như:

t-chuẩn (t-norm), t-đối t-chuẩn (t-conorm) và toán tử trung bình (averaging operator)

Một toán tử kết nhập n chiều Agg: [0,1] n → [0,1] thông thường thỏa các tính chất sau đây:

i) Agg(x) = x,

ii) Agg(0, …, 0) = 0; Agg(1, …, 1) = 1;

iii) Agg(x1, x2,…, x n)  Agg(y1, y2,…, y n ) nếu (x1, x2,…, x n)  (y1, y2,…,

y n)

Trang 22

21

Lớp toán tử trung bình trọng số có thứ tự OWA (Ordered Weighted

Averaging) được R.Yager đưa ra vào năm 1988 [51], các tính chất và công

dụng đã được giới thiệu chi tiết, đầy đủ trong những năm tiếp sau Lớp toán

tử này có tính chất trọng số thứ tự nên giá trị được tích hợp luôn nằm giữa hai phép toán logic là phép tuyển “OR” và phép hội “AND”

Trong luận án này, khi cần thiết kết nhập các mệnh đề, chúng tôi sử dụng toán tử trung bình có trọng số

Định nghĩa 1.2 [51] Toán tử trung bình có trọng số n chiều là ánh xạ f:

R n → R cùng với vectơ kết hợp n chiều W = [w1, w2, …, w n]T (w i [0,1], w1 +

w2 + …+ w n = 1, i = 1,…, n) được xác định bởi công thức f(a1, a2, …, a n) =

Dễ dàng nhận thấy phép kết nhập trung bình có trọng số nằm giữa hai

phép toán lấy max và min nên quá trình tính toán trung gian trong lập luận

xấp xỉ, khi sử dụng toán tử kết nhập trung bình có trọng số để kết nhập các tri thức và dữ liệu thì không sợ mắc phải sai lầm logic hoặc sai số quá lớn Trước khi kết nhập các tri thức, dữ liệu phải được chuyển đổi về dạng số

3) Phép kéo theo mờ

Toán tử kéo theo mờ là sự mở rộng của phép kéo theo trong logic hai trị

để biểu diễn mệnh đề điều kiện “If X is A then Y is B”

Trước tiên, xét mệnh đề điều kiện “If XA then YB” trong logic hai

trị, ở đây A, B là các tập con tương ứng của U, V mà X, Y nhận giá trị trong

đó Điều kiện này là sai nếu như “XA” mà “YB”, ngoài ra được xem là

đúng Vì vậy mệnh đề điều kiện “If then ” có thể biểu diễn bởi quan hệ

)(

)

(ABAV , ở đây A là phần bù của A trong V

Mở rộng cho A, B là các tập mờ trong không gian U, V Khi đó mệnh đề điều kiện sẽ là “If X is A then Y is B” Tương tự như trên nó sẽ được biểu diễn bằng một quan hệ mờ trong U×V , tức là một tập con mờ của U×V Như đã biết trước đây, phép “OR” được mô hình bởi t-conorm S, còn tích Decac mô hình bởi t-norm T Vì vậy, tập con mờ (AB)(AV) có hàm thuộc là:

Trang 23

22

)1))(1((

))()(()

,

(x y  A x B y  A x

trong đó  là ký hiệu của phép min còn là ký hiệu của phép max và

giá trị 1 có thể giản ước

Một cách tổng quát khi  và  tương ứng là các phép norm và

t-conorm bất kỳ, (AB)(AV) có hàm thuộc là:

)))(()),(),((()

(x, y) = J(A (x), B (y)), với J(a, b) = S[T(a, b),N(a)]

Chúng ta dễ dàng kiểm tra các điều kiện biên sau:

J(0, 0) = J(0, 1) = J(1, 1) = 1 và J(1, 0) = 0

Định nghĩa 1.3 Một hàm J : [0,1]×[0,1] [0,1] bất kỳ thỏa mãn điều

kiện biên trên được gọi là toán tử kéo theo mờ

Phép kéo theo có ý nghĩa rất quan trọng trong việc xây dựng các phương pháp lập luận xấp xỉ

4) Phép hợp thành các quan hệ mờ

Quan hệ mờ là sự mở rộng của khái niệm quan hệ thông thường trong toán học Quan hệ mờ cho phép chúng ta biểu thị mối quan hệ giữa các đối tượng một cách mềm dẻo hơn, chẳng hạn nó có thể biểu diễn cho một các

phát biểu “A trẻ hơn B khá nhiều”, “x rất lớn so với y”,

Như chúng ta đã biết, một quan hệ thông thường của các tập U và V là một tập con của U×V và do đó ta có thể mở rộng thành quan hệ mờ của U và

V Một quan hệ mờ R là một tập con mờ của U×V, tức là:

R : U×V [0,1]

với R(x, y) chỉ cho mức độ cặp (x, y) thỏa hay thuộc vào quan hệ R

Ví dụ với quan hệ R = “x nhỏ hơn y khá nhiều” thì R(10, 15) = 0.4 được

hiểu là mệnh đề khẳng định “10 nhỏ hơn 15 khá nhiều” có độ tin cậy là 0.4

Trang 24

, )(

Tổng quát hơn là:

)) , ( ), , ( ( )

, )(

với T là một t-norm bất kỳ, Sup là supremum

Quan hệ mờ là cơ sở quan trọng để biểu diễn toán tử kéo theo mờ cũng như ứng dụng trong việc hợp thành các luật suy diễn mờ

I.2 Biến ngôn ngữ

Nói một cách đơn giản như Zadeh đã từng nói, một biến ngôn ngữ là biến mà “các giá trị của nó là các từ hoặc câu trong ngôn ngữ tự nhiên hoặc

ngôn ngữ nhân tạo” Ví dụ như khi nói về chiều cao của con người ta có thể

xem đây là biến ngôn ngữ có tên gọi CHIỀU_CAO và nó nhận các giá trị ngôn ngữ như “cao”, “rất cao”, “trung bình”, “thấp”… Đối với mỗi giá trị

này, chúng ta sẽ gán cho chúng một hàm thuộc Giả sử lấy giới hạn của chiều cao thông thường trong khoảng [140cm, 190cm] và giả sử rằng các giá trị ngôn ngữ được sinh bởi một tập các luật Khi đó, một cách hình thức, chúng

ta có định nghĩa của biến ngôn ngữ sau đây:

Định nghĩa 1.4 [61] Biến ngôn ngữ là một bộ gồm năm thành phần

(X,T(X), U, R, M), trong đó X là tên biến, T(X) là tập các giá trị ngôn ngữ

của biến X, U là không gian tham chiếu của biến cơ sở u, mỗi giá trị ngôn ngữ xem như là một biến mờ trên U kết hợp với biến cơ sở u, R là một qui tắc cú pháp sinh các giá trị ngôn ngữ cho tập T(X), M là qui tắc ngữ nghĩa gán mỗi giá trị ngôn ngữ trong T(X) với một tập mờ trên U

Ví dụ 1.2 Từ định nghĩa trên ta có tên biến ngôn ngữ X chính là

CHIỀU_CAO, biến cơ sở u có miền xác định là U = [140, 190] tính theo cm

Tập các giá trị ngôn ngữ tương ứng của biến ngôn ngữ là T(CHIỀU_CAO) = {cao, rất cao, tương_đối cao, thấp, rất thấp, trung bình, …} R là một qui tắc để sinh ra các giá trị này M là luật gán ngữ nghĩa sao cho mỗi một giá trị

Trang 25

24

ngôn ngữ sẽ được gán với một tập mờ Chẳng hạn, đối với giá trị nguyên

thủy cao, M(cao)= {(u, cao (u) | u  [140, 190]}, được gán như sau:

u

175 ,

1

175 165

, 10 165

165 ,

0

I.3 Phân hoạch mờ

Phân hoạch mờ là một khái niệm được sử dụng để mờ hóa các miền xác định của các biến ngôn ngữ Chúng ta có định nghĩa phân hoạch mờ như sau

Định nghĩa 1.5 [38] Cho m điểm cố định p1<p2< <p m thuộc tập U = [a, b] R là không gian tham chiếu của biến cơ sở u của biến ngôn ngữ 𝔛

Khi đó một tập T gồm m tập mờ A1, A2, , A m định nghĩa trên U (với hàm

thuộc tương ứng là A1, A2, , Am ) được gọi là một phân hoạch mờ của U

nếu các điều kiện sau thỏa mãn, k=1, , m:

1) Ak (p k ) = 1 (p k thuộc về phần được gọi là lõi của A k);

Mỗi phân hoạch mờ theo định nghĩa 1.5 còn được gọi là một thể hạt

(granularity), một phân hoạch mờ gồm một thể hạt gọi là phần hoạch mờ

Trang 26

25

đơn thể hạt (single granularity), một phân hoạch mờ gồm nhiều thể hạt gọi

là phân hoạch mờ đa thể hạt (multi granularity)

Hình 1.2 Một cấu trúc phân hoạch

“then” được gọi là phần kết luận

Mô hình mờ dạng đơn giản hay còn gọi là mô hình SISO (Single Input Single Output) là tập các luật mà trong đó mỗi luật chỉ chứa một điều kiện và một kết luận được cho như sau:

if X = A1 then Y = B1

if X = A2 then Y = B2

if X = A n then Y = B n

trong đó X, Y là các biến ngôn ngữ thuộc không gian U, V tương ứng

và các giá trị ngôn ngữ A1, A2,…, A n , B1, B2, …, B n là các tập mờ

Tuy nhiên, trong một số lĩnh vực, chẳng hạn như trong điều khiển mờ,

sự phụ thuộc giữa các biến vật lý không chỉ biểu diễn ở dạng đơn giản như

mô hình trên mà nó bao gồm nhiều điều kiện ràng buộc Vì vậy, một mô

Trang 27

26

hình mờ ở dạng tổng quát là một tập các luật (mệnh đề If-then) mà phần tiền

đề của mỗi luật là một điều kiện phức được viết như sau:

If X1 = A11 and and X m = A 1m then Y = B1

If X1 = A21 and and X m = A 2m then Y = B2

If X1 = A n1 and and X m = A nm then Y = B n

ở đây X1, X2, …, X m và Y là các biến ngôn ngữ, A ij , B i (i = 1,…, n ; j = 1,…, m) là các giá trị ngôn ngữ tương ứng (xem [61])

Hầu hết các ứng dụng trong hệ chuyên gia mờ, phân cụm mờ, điều khiển mờ,… liên quan đến việc suy diễn thì mô hình mờ là một phần không thể thiếu và do vậy các ứng dụng này luôn gắn liền với các phương pháp giải quyết bài toán lập luận xấp xỉ đa điều kiện Bài toán lập luận xấp xỉ mờ đa điều kiện [61], [54], [41], được phát biểu như dưới đây:

Cho mô hình mờ (1.1) và các giá trị ngôn ngữ A 01 , A 02 , …, A 0m tương ứng với các biến ngôn ngữ X 1 , X 2 , …, X m Hãy tính giá trị của Y

I.5 Hệ dựa trên luật mờ (Hệ mờ)

1) Các thành phần của hệ mờ

Một hệ dựa trên luật mờ gồm các thành phần chính sau: cơ sở dữ liệu (Database), cơ sở luật mờ (Fuzzy Rule-based - FRB) và hệ suy diễn (Inference System)

- Cơ sở dữ liệu là các tập 𝔏j gồm T j nhãn ngôn ngữ tương ứng với các

tập mờ dùng để xây dựng phân hoạch mờ miền tham chiếu U jR (tập số thực) của biến 𝔛j, (j=1, ,n+1) của bài toán n đầu vào 1 đầu ra Mỗi tập mờ

được xây dựng dựa trên một bộ tham số của nó, các tham số này có thể được xác định bằng kinh nghiệm của các chuyên gia, hoặc là kết quả của quá trình khai phá tri thức từ thực nghiệm hoặc được học bằng các thuật toán học máy Các tập mờ có thể bố trí thành các phân hoạch mờ đơn thể hạt hoặc đa thể hạt

- Cơ sở luật mờ là một tập các luật mờ dạng if-then, mỗi luật mờ biểu diễn một tri thức về miền ứng dụng của hệ, luật mờ là thành phần chính của

hệ mờ Cấu trúc của một luật mờ có dạng như sau:

Trang 28

n thì chúng phải bổ sung vào mỗi 𝔏j (j=1, ,n) một giá trị nhãn

“Don’tcare”có giá trị hàm thuộc đồng nhất bằng 1.Ví dụ các kiểu luật:

Luật mờ kiểu Mamdani:

If 𝔛1 is Don’tcare and 𝔛2 is Very Low and 𝔛3 is High then 𝔛 4 is

Good

Luật mờ kiểu Takagi-Sugeno:

If 𝔛1 is Small and 𝔛2 is Don’tcare then 𝔛3 is “Iris-versicolor”

- Hệ suy diễn thực hiện lập luận xấp xỉ dựa trên các luật và các giá trị đầu vào để đưa ra giá trị dự đoán đầu ra Trên cơ sở lý thuyết tập mờ và logic

mờ, các phương pháp lập luận xấp xỉ dựa trên FRB đã được phát triển mạnh

mẽ và đã được ứng dụng vào thực tiễn giải quyết nhiều bài toán phi tuyến phức tạp Một số hướng lập luận xấp xỉ:

+ Lập luận xấp xỉ dựa trên quan hệ mờ

+ Lập luận xấp xỉ bằng nội suy tuyến tính trên tập mờ

+ Lập luận dựa trên mức đốt cháy luật

2) Các mục tiêu khi xây dựng FRBS

Khi xây dựng các FRBS hai mục tiêu cần đạt được là hiệu quả thực hiện (độ chính xác) và tính giải nghĩa được của FRBS Đây là hai mục tiêu xung đột nhau, làm tăng mục tiêu này thì phải trả giá cho mục tiêu kia Mục tiêu độ chính xác đã có các công thức để đánh giá, mục tiêu tính giải nghĩa được liên quan đến nhiều yếu tố và ngay cả thuật ngữ để chỉ nó cũng chưa thống nhất Dưới đây chúng ta xem xét các phương pháp đã được đề xuất để đánh giá các mục tiêu

Đánh giá hiệu quả thực hiện của FRBS

Mục tiêu hiệu quả thực hiện của FRBS, chúng ta đã có những công thức toán học để đánh giá một FRBS như thế nào là hiệu quả

Trang 29

28

Với một số bài toán phân lớp hiệu quả thực hiện của FRBS được đánh giá dựa trên tỉ lệ phần trăm số mẫu được phân lớp chính xác trên tổng số mẫu được phân lớp, tỉ lệ này càng cao càng tốt

max

%100

N

N perf acc

trong đó N là số mẫu dữ liệu được phân lớp và N acc là số mẫu dữ liệu được phân lớp chính xác

Với bài toán hồi quy, đánh giá hiệu quả thực hiện của FRBS trong các nghiên cứu [23]-[26][31][12][16][13][21][14], các tác giả sử dụng độ đo giá trị trung bình phương sai (MSE) Giá trị MSE càng nhỏ thì độ chính xác của FRBS càng cao, và nó được xác định bằng công thức dưới đây:

2

1(ˆ )2

1

 

i y i y i N

MSE

trong đóyˆi là giá trị suy diễn từ FRBS với giá trị đầu vào p i

Vấn đề tính giải nghĩa được của FRBS

Tính giải nghĩa được là một vấn đề phức tạp và trừu tượng, nó liên quan đến nhiều yếu tố Hiện tại chúng ta vẫn chưa có một tiêu chuẩn toán học để

mô tả chính xác, và còn nhiều quan điểm khác nhau, ngay cả các thuật ngữ

để chỉ tính giải nghĩa được cũng chưa thống nhất, chẳng hạn như: tính dễ hiểu (intelligibility), tính trong suốt (transparency), tính dễ đọc (readability),

…, các thuật ngữ này được sử dụng đồng nghĩa và thay thế cho nhau [19]

Việc lựa chọn một độ đo tính giải nghĩa được vẫn là vấn đề mở Trong một

số nghiên cứu cố gắng đánh giá tính giải nghĩa được của FRBS bằng cách phân chia nó theo từng nhóm và thiết lập một tập các ràng buộc ở các mức khác nhau Các FRBS thỏa mãn càng nhiều ràng buộc thì có tính giải nghĩa được càng cao Trong [18] Gacto cho rằng hiện tại có hai hướng tiếp cận chính về tính giải nghĩa được

- Tính giải nghĩa được dựa trên độ phức tạp: Hướng tiếp cận này được

phân thành hai mức, mức cơ sở luật mờ và mức phân hoạch mờ

 Độ phức tạp ở mức cơ sở luật thường sử dụng các độ đo: số luật của hệ luật càng ít càng tốt, độ dài của luật càng ngắn càng tốt

Trang 30

29

 Độ phức tạp ở mức phân hoạch mờ thường sử dụng các độ đo: số thuộc tính hay số biến, số biến sử dụng ít sẽ làm tăng tính giải nghĩa được của hệ luật; số hàm thuộc sử dụng trong phân hoạch mờ, số hàm thuộc không nên vượt quá 7±2 [63]

- Tính giải nghĩa được dựa trên ngữ nghĩa: Hướng tiếp cận này cũng

được chia thành hai mức, mức cơ sở luật và mức phân hoạch mờ

 Ngữ nghĩa ở mức cơ sở luật: Cơ sở luật phải nhất quán, tức là nó không chứa các luật mâu thuẫn, các luật có cùng phần tiền đề thì phải có cùng kết luận; số luật bị đốt cháy bởi một dữ liệu đầu vào càng ít càng tốt

 Ngữ nghĩa ở mức phân hoạch mờ (mức từ): Miền xác định của các biến phải được phủ hoàn toàn bởi hàm thuộc của các tập mờ Tất cả các điểm

dữ liệu phải thuộc vào ít nhất một tập mờ; các hàm thuộc phải thuộc loại chuẩn, có nghĩa là mỗi hàm thuộc phải có ít nhất một điểm dữ liệu trong miền xác định của biến có độ thuộc bằng 1; các hàm thuộc thể hiện ngữ nghĩa của các tập mờ phải phân biệt được với nhau

3) Ứng dụng của hệ mờ

* Bài toán trích rút các tóm tắt ngôn ngữ:

Mục đích của bài toán là trích rút tri thức dạng tóm tắt bằng ngôn ngữ

tự nhiên từ cơ sở dữ liệu Kết quả nhận được là các câu tóm tắt mô tả rõ ràng, ngắn gọn, dễ hiểu về tập dữ liệu cần xem xét Ưu điểm của câu tóm tắt

là sử dụng ngôn ngữ tự nhiên nên dễ hiểu đối với người dùng và có thể được đọc tự động bởi máy

Quan điểm tóm tắt dữ liệu được đề xuất bởi Yager [59], được mở rộng nghiên cứu mạnh bởi nhóm Kacrpzyk [20][45][40][8], nhóm Wilbik [10][22] Bài toán trích rút dữ liệu ở dạng câu có từ định lượng như sau:

Y = {y 1 , y 2 , …, y n } là tập các đối tượng (bản ghi) trong cơ sở dữ liệu D

( Ví dụ: cơ sở dữ liệu về công nhân, bệnh nhân, …)

V = {V 1, V 2, …, V m } là tập các thuộc tính của các đối tượng trong tập Y

(Ví dụ: thuộc tính lương của công nhân, thuộc tính huyết áp của bệnh nhân, …)

Trang 31

- S là một kết luận (summarizer) Thông thường, S ở dạng một từ

mô tả về một thuộc tính Ví dụ: lương thấp, huyết áp cao, …S cũng có thể ở dạng tổ hợp mô tả cho nhiều thuộc tính như lương thấp và trình độ trung

bình, huyết áp cao và nhịp tim cao, …

- Q là một định lượng về tỷ lệ các đối tượng thỏa kết luận S Q có

thể ở dạng tuyệt đối như khoảng 10, một vài, … hoặc ở dạng tương đối như

khoảng một nửa, hầu hết, nhiều, rất ít,…

- F là điều kiện lọc để giới hạn một nhóm các đối tượng trong D cần

quan tâm Ví dụ: khi F là tuổi trẻ thì chỉ có các công nhân thỏa điều kiện tuổi

trẻ mới được đưa vào tập các đối tượng cần đưa ra kết luận Thành phần F

này có thể có hoặc không trong câu tóm tắt đưa ra

- Một giá trị T [0,1] để đánh giá mức độ đúng đắn của câu tóm tắt

Ví dụ về các câu tóm tắt được trích rút từ cơ sở dữ liệu công nhân như sau:

(1) Dạng 1:Khoảng một nửa (Q) công nhân (y) có lương khá thấp (S)(T

= 0.95)

(2) Dạng 2: Hầu hết (Q) công nhân (y) trình độ thấp (F) có lương thấp

(S)(T = 1)

Trong hầu hết các nghiên cứu đã có về tóm tắt dữ liệu, ngữ nghĩa của

các hạng từ (khoảng một nửa, hầu hết, thấp, khá thấp trong câu ví dụ (1) và

(2)) được biểu diễn bằng các tập mờ trên miền tham chiếu của thuộc tính tương ứng Dạng tập mờ phổ biến nhất được dùng trong tóm tắt dữ liệu là tập

mờ hình thang (Xem Hình 1.4)

Trang 32

có dạng như sau, vế phải của luật là một giá trị rõ thuộc vào các lớp của C

r q: If 𝔛1 is A q1 and … and 𝔛n is A qn then 𝔛n+1 is C q với q=1, ,M

Như trình bày trong phần trên, mục tiêu cần đạt được khi xây dựng các FRBS là độ chính xác và tính giải nghĩa được của hệ luật Đây là hai mục tiêu xung đột nhau, do đó các giải pháp được đề xuất đều cố gắng đạt được

sự cân bằng (tradeoff) cả hai mục tiêu này bằng cách phát triển các thuật toán tiến hóa tối ưu đa mục tiêu cho phép học tự động sinh các FRBS Trong

đó mục tiêu tính giải nghĩa được của FRBS được định nghĩa dựa trên độ phức tạp bao gồm các yếu tố: số luật ít, chiều dài trung bình của các luật càng ngắn càng tốt

Khi phát triển các thuật toán giải quyết bài toán này, các thuật toán phải thực hiện các công việc sau:

- Thiết kế phân hoạch mờ miền tham chiếu của các biến ngôn ngữ

- Sinh tập các luật mờ ứng cử

- Tìm kiếm hệ luật mờ S tối ưu từ tập các luật mờ ứng cử với các mục tiêu fp(S) max, fn(S) và fa(S) min Trong đó fp(S) là hàm đánh

Trang 33

32

giá hiệu quả phân lớp, fn(S) là số luật và fa(S) là độ dài trung bình của các luật trong S

* Bài toán hồi quy : Cho tập dữ liệu mẫu D = {(p i , y i ), i = 1, ,N}, trong

đó p iU = U1 U n là tích Đề-các của các miền xác định tương ứng của n

biến độc lập (thuộc tính) đầu vào 𝔛1, ,𝔛n ; y iU n+1 là biến phụ thuộc đầu ra

𝔛n+1 , U i với i=1, ,n+1 là các tập số thực; N là số mẫu dữ liệu Từ tập dữ liệu mẫu D xây dựng một mô hình cho phép dự đoán giá trị ˆy ứng với giá trị đầu vào p

- Giải bài toán hồi quy bằng FRBS là đi xây dựng một hệ luật mờ S

để ánh xạ tập dữ liệu đầu vào U có n chiều vào tập đầu ra U n+1 có một chiều,

bằng một phương pháp lập luận xấp xỉ Tức là với một giá trị đầu vào pU

qua ánh xạ này ta xác định được giá trị đầu ra ˆyU n+1

- Khi xây dựng các FRBS cho bài toán hồi quy, các luật sử dụng trong FRBS thường là các luật mờ Mamdani có dạng dưới đây trong đó kết luận của luật là một tập mờ:

r q: If 𝔛1 is A q1 and … and 𝔛n is A qn then 𝔛n+1 is A q(n+1) với q =1, ,M

- Quá trình giải bài toán hồi quy bằng FRBS cũng tương tự như giải bài toán phân lớp Tuy nhiên do bài toán hồi quy phức tạp hơn nên các thuật toán được đề xuất phải thực hiện nhiều các kỹ thuật phức tạp (như tối ưu số tập mờ, tham số tập mờ, lựa chọn các phép toán cho toán tử AND, toán tử kéo theo, …) nhằm nâng cao hiệu quả thực hiện của FRBS được xây dựng

I.6 Đại số gia tử

1) Khái niệm Đại số gia tử

Định nghĩa 1.6 [35]: Một ĐSGT được ký hiệu là bộ 4 thành phần được

ký hiệu là AX = (X, G, H, ) trong đó G là tập các phần tử sinh, H là tập các

gia tử (hedge) còn “” là quan hệ cảm sinh ngữ nghĩa trên X Giả thiết trong

G có chứa các phần tử hằng 0, 1, W với ý nghĩa là phần tử bé nhất, phần tử

lớn nhất và phần tử trung hòa (neutral) trong X Ta gọi mỗi giá trị ngôn ngữ

Tập H được chia thành hai tập con rời nhau, ký hiệu là H và H +, trong

đó H là tập gia tử âm (các gia tử làm giảm ngữ nghĩa của các phần tử sinh),

Trang 34

33

H + là tập các gia tử dương (các gia tử làm tăng ngữ nghĩa của các phần tử

sinh) Không mất tính tổng quát, ta luôn giả thiết rằng H - = {h-1<h-2< <h -q}

và H + = {h1<h2< <h p } Khi tác động gia tử hH vào phần tử xX, thì thu

được phần tử ký hiệu hx Với mỗi xX, ký hiệu H(x) là tập tất cả các hạng từ

uX được sinh từ từ ngôn ngữ x bằng cách áp dụng các gia tử trong H và

viết u = h n …h1x, với h n , …, h1H, n  1

Nếu tập X và H là các tập sắp thứ tự tuyến tính, khi đó AX = (X, G, H,

) gọi là ĐSGT tuyến tính Và nếu được trang bị thêm hai gia tử tới hạn là 

và  với ngữ nghĩa là cận trên đúng và cận dưới đúng của tập H(x) khi tác động lên x, thì ta được ĐSGT tuyến tính đầy đủ, ký hiệu AX* = (X, G, H, ,

, ) Lưu ý rằng h n h1u được gọi là một biểu diễn chính tắc của một hạng

từ x đối với u nếu x = h n h1u và h i h1uh i-1 h1u với i nguyên và in Ta gọi

độ dài của một hạng từ x là số gia tử trong biểu diễn chính tắc của nó đối với phần tử sinh cộng thêm 1, ký hiệu l(x)

Ví dụ 1.3: Cho biến ngôn ngữ TRUTH, có G = {0, FALSE, W, TRUE, 1}, H - = { Possible<Little } và H + = { More<Very } Khi đó Very FALSE <

More FALSE < FALSE < Possible FALSE < Little FALSE < TRUE < More TRUE < Very TRUE

2) Một số tính chất của Đại số gia tử tuyến tính

Định lý 1.1: [35]Cho tập H- và H+ là các tập sắp thứ tự tuyến tính của

ĐSGT AX = (X, G, H, ) Khi đó ta có các khẳng định sau:

i) Với mỗi uX thì H(u) là tập sắp thứ tự tuyến tính

ii) Nếu X được sinh từ G bởi các gia tử và G là tập sắp thứ tự tuyến tính

thì X cũng là tập sắp thứ tự tuyến tính Hơn nữa nếu u<v, và u, v là độc lập

với nhau, tức là uH(v) và vH(u), thì H(u) H(v)

Định lý dưới đây xem xét sự so sánh của hai hạng từ trong miền ngôn

ngữ của biến X Trong đó I là gia tử đơn vị, khi tác động lên một hạng từ

không sinh ngữ nghĩa mới

Định lý 1.2: [35]Cho x = h n …h1u và y = k m …k1u là hai biểu diễn chính

tắc của x và y đối với u Khi đó tồn tại chỉ số j ≤ min{n, m} + 1 sao cho h j' =

k j' với mọi j'<j (ở đây nếu j = min {n, m} + 1 thì hoặc h j = I, h j là gia tử đơn

vị I, với j = n + 1 ≤ m hoặc k j = I với j = m + 1 ≤ n) và

Trang 35

34

i) x<y khi và chỉ khi h j x j <k j x j , trong đó x j = h j-1 h1u

ii) x = y khi và chỉ khi m = n và h j x j = k j x j

iii) x và y là không so sánh được với nhau khi và chỉ khi h j x j và k j x j là không so sánh được với nhau

3) Độ đo tính mờ của các giá trị ngôn ngữ

Khái niệm độ đo tính mờ của giá trị ngôn ngữ là một khái niệm trừu tượng không dễ để xác định bằng trực giác và có nhiều phương pháp tiếp cận khác để xác định khái niệm này Trong lý thuyết tập mờ, các phương pháp tiếp cận chủ yếu là dựa trên hình dạng của tập mờ và người ta xem tập mờ biểu thị được tính mờ của thông tin nhờ độ thuộc lấy trong đoạn [0, 1]

Mô hình tính mờ: ĐSGT nhằm mô hình hóa toán học các miền ngôn

ngữ của biến và thiết lập cơ sở hình thức để thao tác trực tiếp trên các từ

ngôn ngữ của biến Các từ ngôn ngữ vốn hàm chứa tính mờ: “tính mờ của

một từ ngôn ngữ x được hiểu như là ngữ nghĩa của nó vẫn có thể biến đổi khi tác động gia tử vào nó, nhưng vẫn giữ lại ngữ nghĩa gốc” [35] Chẳng

hạn, ngữ nghĩa ‘rất trẻ’ thay đổi so với ‘trẻ’ nhưng nó vẫn còn là thể hiện ngữ nghĩa ngữ của từ ‘trẻ’ Còn ngữ nghĩa của con số, khi chịu tác động của

của một tác tử (phép toán chẳng hạn) thì nó thay đổi thành ngữ nghĩa của

con số khác Do đó, tập các hạng từ sinh ra từ x bằng các gia tử sẽ thể hiện

cho tính mờ của x và do đó, H(x) có thể sử dụng như là một mô hình biểu thị

tính mờ của từ x của biến 𝒳

Tập tất các các mô hình tính mờ {H(x) : x ∈ Dom(𝒳)} có cấu trúc chặt

chẽ như trong Hình 1.4

Hình 1.5 Cấu trúc thứ bậc đa thể hạt phân tách mô hình tính mờ của các từ ngôn ngữ

dựa trên quan hệ chung-riêng (generality-spcificity) qua tác động của các gia tử: hx có tính riêng hơn x, trong đó các hình ovan biểu thị các mô hình tính mờ bằng các tập H(x)

Trang 36

35

Trong Hình 1.5, quan hệ bao hàm biểu thị từ ở mức dưới sinh ra từ một

từ ở mức trên bằng một gia tử thì từ mức dưới có tính riêng hơn, hay từ mức trên có tính khái quát hơn và mô hình tính mờ của nó chứa mô hình tính mờ của từ mức dưới Các mũi tên chỉ quan hệ bao hàm đó và hợp của mô hình

tính mờ của từ mức dưới của H(x) bằng chính nó

Khoảng tính mờ và độ đo tính mờ: Giả sử f là ánh xạ đẳng cấu bảo

toàn thứ tự của miền X = Dom(𝒳) vào miền chuẩn hóa [0, 1] với tập ảnh f(X)

trù mật trong [0, 1]: f(0) ≤ f(X) ≤ f(1)

Khi đó, theo lý thuyết ĐSGT, ánh xạ f xác định một ánh xạ f* chuyển cấu trúc đa thể hạt về cấu trúc các khoảng tính mờ f*(x), x ∈ X, biểu thị trong Hình 1.6 , ở đây f*(x) chỉ khoảng tính mờ ứng với nhãn H(x) trong hình Hợp của các khoảng tính mờ của các từ sinh ra từ x bởi các gia tử (ở mức dưới) bằng chính khoảng tính mờ cử từ x

Từ cấu trúc các khoảng tính mờ như trên gợi ý đưa ra định nghĩa độ đo tính mờ như sau và xem như là tiên đề của độ đo tính mờ của các từ ngôn ngữ:

Định nghĩa 1.7:[35] Cho AX* = (X, G, H, , , ) là một ĐSGT tuyến

tính đầy đủ Ánh xạ fm: X [0,1] được gọi là một độ đo tính mờ của các

hạng từ trong X nếu:

(i) fm là đầy đủ, tức là fm(c - ) + fm(c +) =1 và hH fm(hu) = fm(u), uX;

(ii) fm(x) = 0, với các x thỏa H(x) = {x} và fm(0) = fm(W) = fm(1) = 0;

(iii) x,y X, h H, ký hiệu (h) =

)(

)()

(

)(

y fm

hy fm x

fm

hx

fm  , tỷ số này không

phụ thuộc vào x và y, và nó được gọi là độ đo tính mờ của các gia tử

Hình 1.6 Cấu trúc thứ bậc các khoảng tính mờ của các từ ngôn ngữ của biến 𝒳 được

xác định bởi ánh xạ đẳng cấu f và các mô hình tính mờ của chúng

Trang 37

36

Trong đó, c+ và c- là phần tử sinh dương và phần tử sinh âm, điều kiện

(i) thể hiện tính đầy đủ của các phần tử sinh và các gia tử cho việc biểu diễn ngữ nghĩa của miền thực đối với các biến, (ii) thể hiện tính rõ của các hạng

từ và (iii) có thể được chấp nhận vì chúng ta đã chấp nhận giả thiết rằng các gia tử là độc lập với ngữ cảnh và vì vậy, khi áp dụng một gia tử h lên các

hạng từ thì hiệu quả tác động làm thay đổi ngữ nghĩa của các hạng từ đó là như nhau Hình 1.7 minh họa rõ hơn cho khái niệm độ đo tính mờ của biến

x fm(x) 1, trong đó X k là tập các hạng từ có độ dài đúng k; (iv) fm(hx) = (h).fm(x), và xX, fm(x) = fm(x) = 0;

(v) Cho fm(c - ), fm(c +) và (h) với hH, khi đó với x = h n h1c, c {c

-, c + }, dễ dàng tính được độ đo tính mờ của x như sau: fm(x) =

(h n) (h1)fm(c)

Hình 1.7 Độ đo tính mờ của biến TRUTH

fm(True)

fm(VeryTrue) fm(LittleTr) fm(PossTr)

fm(M Tr)

True

VeryTrue LittleTrue

Poss

True

More True

fm(VLTr)

fm(MLTr) fm(PLTr)

f m(LLTr) fm(VVTr)

fm(MVTr) fm(PVTr)

fm(LVTr)

Trang 38

37

Ví dụ 1.4: Cho AX* = (X, G, H, , , ) là một ĐSGT tuyến tính đầy

đủ của biến ngôn ngữ TUỔI với H = {V, M, A, P, L}và G = {trẻ, già} Bây

giờ chúng ta sẽ tính độ đo tính mờ cho các phần tử của AX* mà độ dài không quá 2 Thông thường, tuổi của con người từ 0 đến 35 được gọi là trẻ, từ 36 đến 80 được gọi là già, ta có các tham số được định nghĩa như sau :

Khoảng tính mờ (fuzziness interval) của các khái niệm mờ là một khái

niệm rất quan trọng làm cơ sở cho việc nghiên cứu và xây dựng các mô hình

ứng dụng Trong ĐSGT, dựa trên độ đo tính mờ fm, chúng ta sẽ định nghĩa

khoảng tính mờ của các hạng từ Gọi Itv([0, 1]) là họ các đoạn con của đoạn [0, 1], ký hiệu || là độ dài của đoạn “”

Định nghĩa 1.8 [35]: Khoảng tính mờ của các hạng từ xX, ký hiệu

fm (x), là một đoạn con của đoạn [0, 1], fm (x)  Itv([0, 1]) Nếu nó có độ dài bằng độ đo tính mờ, |fm (x)| = fm(x), và được xác định bằng qui nạp theo

độ dài của x như sau:

(i) Với độ dài của x bằng 1 (l(x) = 1), tức là x {c - , c +}, khi đó |fm (c -)|

= fm(c -), |fm (c + )| = fm(c +) và fm (c -) fm (c +);

(ii) Giả sử x có độ dài n (l(x) = n) và khoảng tính mờ fm (x) đã được

định nghĩa với |fm (x)| = fm(x) Khi đó tập các khoảng tính mờ {fm (h j x):

-qjp và j 0}  Itv([0,1]) được xây dựng sao cho nó là một phân hoạch của

fm (x), và thỏa mãn |fm (h j x)| = fm(h j x) và có thứ tự tuyến tính tương ứng với

thứ tự của tập {h -q x, h -q+1 x, , h p x}, tức là nếu h -q x>h -q+1 x> >h p x thì fm (h

-q x) >fm (h -q+1 x) > >fm (h p x) và ngược lại (xem hình 1.8) Dễ dàng thấy

Trang 39

38

rằng hệ phân hoạch như vậy luôn tồn tại dựa vào tính chất i) trong Mệnh đề

1.1

Hình 1.8 Khoảng tính mờ của các hạng từ của biến TRUTH

Trường hợp độ dài của x bằng k, l(x) = k, ta ký hiệu k (x) thay cho

fm (x), khi đó ta nói khoảng tính mờ của x có độ sâu k hay khoảng tính mờ mức k

5) Định lượng ngữ nghĩa của giá trị ngôn ngữ

Theo phương pháp tiếp cận của tập mờ, các giá trị định lượng của mỗi tập mờ là giá trị khử mờ của hàm thuộc tương ứng Vì các giá trị ngôn ngữ

có thứ tự theo ngữ nghĩa của nó nên trong ĐSGT đã thiết lập một hàm định lượng ngữ nghĩa của các từ với các giá trị nằm trong đoạn [0, 1], các giá trị tương ứng với các từ đảm bảo thứ tự này

Định nghĩa 1.9:[35] Cho AX = (X, G, H, ) là một ĐSGT tuyến tính

Ánh xạ : X [0,1] được gọi là một hàm định lượng ngữ nghĩa của AX nếu:

(i) là ánh xạ 1-1 từ tập X vào đoạn [0, 1] và bảo toàn thứ tự trên X,

tức là x, yX, x<y(x) < (y) và (0) = 0, (1) = 1

(ii) liên tục: trù mật trong [0, 1], nghĩa là (a, b) ≠  và

(a, b)[0, 1], (a, b) ≠ 

Điều kiện (i) là bắt buộc tối thiểu đối với bất kỳ phương pháp định

lượng nào, còn điều kiện (ii) đảm bảo tính trù mật của H(G) trong X Dựa

trên những ràng buộc này, các tác giả trong [50] đã xây dựng một phương

Trang 40

1) Hàm sign(k, h) ∈ {-1, 1} được gọi là hàm dấu tương đối (relative)

của k đối với h nếu sign(k, h) = 1((x≤ hx) hx ≤ khx)(x≥hx) hx≥khx)),

và sign(k, h) = -1 ((x ≤ hx) hx≥ khx ≥ x) (x ≥ hx) hx≤ khx≤ x))

2) Hàm Sign: X {-1, 0, 1} được gọi là hàm dấu của các từ x nếu h n …

h1c, c ∈G, là biểu diễn chính tắc, tức là h j h j-1 … h1c ≠ h j-1 … h1c, với mọi j =

1, …, n và h0 = Id, phép đồng nhất, tức là h0c = c, thì ta có:

Sign(x) = Sign(h n h n-1 …h1c)= sign(h n ,h n-1 )×…×sign(h 2 ,h1)× sign(h1) ×sign(c) Dựa trên định nghĩa hàm dấu, chúng ta có tiêu chuẩn để so sánh hx và x

Mệnh đề 1.2 [35] Với bất kỳ h và x, nếu Sign(hx) = 1 thì hx>x; nếu

Sign(hx) = -1 thì hx<x và nếu Sign(hx) = 0 thì hx = x

Từ mệnh đề trên ta có:

0≤ H(x) ≤ 1 và H(x) ≤ H(y), x, y, tức là xH(x) và yH(y) (1.2)

Sign(h p x) =+1H(h -q x) ≤…≤ H(h-1x) ≤ x ≤ H(h1x) ≤…≤ H(h p x) (1.3) Sign(h p x) = 1H(h -q x) ≥…≥ H(h-1x) ≥ x ≥ H(h1x) ≥…≥ H(h p x) (1.4)

Định nghĩa 1.11 [35] : Cho AX là một ĐSGT tuyến tính và fm là một

độ đo tính mờ trên X Ta nói ánh xạ : X [0, 1] được cảm sinh bởi độ đo

tính mờ fm nếu được định nghĩa bằng đệ qui như sau:

(

j sign i

j sign i

x fm j h x j h x fm i h x

j h

Ngày đăng: 26/02/2019, 09:44

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w