Tinh giản các luật trong hệ suy diễn với hệ thống có thông tin mờ

Tính diễn giải được cao của hệ thống mờ phụ thuộc một số yếu tố như cấu trúc của mô hình của hệ thống, số luật là nhỏ, số điều kiện trong phần tiền đề luật là ít, số nhãn ngôn ngữ ch

Trang 1

HUỲNH MINH TRÍ

TINH GIẢN CÁC LUẬT TRONG HỆ SUY DIỄN VỚI HỆ THỐNG CÓ THÔNG TIN MỜ

Chuyên ngành: KHOA HỌC MÁY TÍNH

Mã số chuyên ngành: 62.48.01.01

Phản biện 1: PGS.TSKH Bùi Công Cường Phản biện 2: PGS.TS Vũ Thanh Nguyên Phản biện 3: PGS.TS Lê Hoàng Thái Phản biện độc lập 1: GS.TS Phan Thị Tươi Phản biện độc lập 2: PGS.TS Trần Đình Khang Phản biện độc lập 3: PGS.TS Đàm Gia Mạnh

NGƯỜI HƯỚNG DẪN KHOA HỌC:

1 PGS.TSKH NGUYỄN XUÂN HUY

2 PGS TS LÊ HOÀI BẮC

TP.HỒ CHÍ MINH – 2014

Trang 2

MỤC LỤC

MỤC LỤC 3

DANH MỤC CÁC HÌNH 8

DANH MỤC CÁC TỪ VIẾT TẮT 9

CAM ĐOAN 10

LỜI CẢM ƠN 11

MỞ ĐẦU 12

Chương 1 TỔNG QUAN VÀ CÁC KIẾN THỨC CƠ SỞ 16

1.1 Giới thiệu 16

1.2 Các kiến thức cơ bản về hệ suy diễn mờ 17

1.2.1 Hệ suy diễn mờ 18

1.2.2 Logic mờ và hệ thống mờ 18

1.2.3 Phân loại các hệ suy diễn mờ 20

1.2.3.1 Các hệ thống luật mờ dạng Mamdani 20

1.2.3.2 Các hệ thống luật mờ dạng Takagi-Sugeno-Kang 23

1.2.3.3 Các thành phần của hệ thống luật dạng Mamdani 24

1.3 Sơ lược về thuật giải di truyền (Genetic Algorithms, GAs) 28

1.4 Hệ thống dựa trên luật mờ di truyền 30

1.4.1 Tinh chỉnh bằng GAs 33

1.4.2 Tinh chỉnh hàm tỷ lệ 33

1.4.3 Tinh chỉnh hàm thuộc 34

1.4.4 Học Cơ sở luật bằng GAs 35

1.4.5 Học Cơ sở Tri thức bằng GAs 37

1.4.6 Tóm tắt các phương pháp tiếp cận cổ điển cho GRBFS 38

1.5 Động cơ nghiên cứu 39

1.6 Mục tiêu và phạm vi nghiên cứu 42

1.7 Cấu trúc của luận án 46

Chương 2 PHƯƠNG PHÁP XÂY DỰNG HỆ SUY DIỄN MỜ TINH GIẢN, HIỆU QUẢ 48

2.1 Giới thiệu 48

2.2 Phương pháp TMH: khởi tạo hệ suy diễn mờ ban đầu từ dữ liệu số 52

2.2.1 Khởi tạo DB ban đầu 52

2.2.2 Khởi tạo RB ban đầu: 62

Trang 3

2.2.3 Mờ hóa và Giải mờ: 63

2.3 Tinh giản, tinh chỉnh Cơ sở Tri thức (KB) ban đầu: 64

2.3.1 Hàm mục tiêu: 65

2.3.2 Mã hóa KB: 66

2.3.3 Quần thể ban đầu: 68

2.3.4 Toán tử lai ghép: 68

2.3.5 Toán tử đột biến: 69

2.4 Phương pháp tìm số nhãn ngôn ngữ tối ưu cho các biến đầu vào, đầu ra 72

2.4.1 Quần thể ban đầu: 73

2.4.2 Toán tử lai ghép: 73

2.4.3 Toán tử đột biến: 74

2.4.4 Hàm mục tiêu: 74

2.4.5 Phương pháp tìm số nhãn tối ưu 1: 74

2.4.6 Phương pháp tìm số nhãn tối ưu 2: 75

2.5 Thực nghiệm và đánh giá: 76

2.5.1 Mô hình 1: 77

2.5.2 Mô hình 2: 79

2.5.3 Mô hình 3: 79

2.5.4 Mô hình 4: 80

2.5.5 Mô hình 5: 81

2.5.6 Mô hình 6: 82

2.5.7 Thực nghiệm 1: Bài toán đánh giá hương vị gạo 84

2.5.8 Thực nghiệm 2: Bài toán nhà máy hóa chất 88

2.5.9 Thực nghiệm 3: Bài toán chuỗi thời gian hỗn loạn 94

2.6 Tổng kết ý nghĩa sáu mô hình đề xuất của luận án 98

2.7 Sự khác biệt và mối quan hệ giữa hai quá trình tinh giản và tinh chỉnh hệ suy diễn trong sáu mô hình của luận án 100

2.7.1 Quá trình tinh giản hệ suy diễn 100

2.7.2 Quá trình tinh chỉnh hệ suy diễn 101

2.7.3 Mối quan hệ giữa tinh giản và tinh chỉnh hệ suy diễn 101

2.8 Kết luận chương 2: 102

Chương 3 PHƯƠNG PHÁP XÂY DỰNG TẬP DỮ LIỆU HUẤN LUYỆN RÚT GỌN 104

3.1 Giới thiệu: 104

3.2 Phương pháp sử dụng phân hoạch rõ để chọn tập RTR 106

Trang 4

3.2.1 Phân hoạch rõ của tập dữ liệu huấn luyện TR 106

3.2.2 Phương pháp dùng phân hoạch rõ để chọn RTR 107

3.3 Phương pháp sử dụng phân hoạch mờ để chọn tập RTR 109

3.3.1 Phân hoạch mờ của tập dữ liệu huấn luyện TR 109

3.3.2 Phương pháp dùng phân hoạch mờ để chọn RTR 111

3.4 Thực nghiệm và đánh giá 112

3.4.1 Thực nghiệm 1: Bài toán ước lượng chi phí bảo trì lưới điện 115

3.4.2 Thực nghiệm 2: Bài toán ước lượng chiều dài của đường dây điện trong lưới điện hạ thế ở các thành phố và nông thôn 120

3.5 Cơ sở về lý luận và ý nghĩa thực nghiệm của hai phương pháp chọn tập RTR bằng phân hoạch rõ và mờ 127

3.5.1 Cơ sở lý luận 127

3.5.2 Ý nghĩa thực nghiệm 128

3.6 Kết luận chương 3 130

Chương 4 KẾT LUẬN 132

4.1 Tổng kết các hướng tiếp cận của đề tài 132

4.1.1 Hướng tiếp cận thứ nhất: 132

4.1.2 Hướng tiếp cận thứ hai: 134

4.2 Các kết quả đạt được 134

4.2.1 Đóng góp thứ nhất: 135

4.2.2 Đóng góp thứ hai: 135

4.2.3 Đóng góp thứ ba: 135

4.2.4 Đóng góp thứ tư: 136

4.2.5 Đóng góp thứ năm: 137

4.3 Hướng phát triển của luận án 137

CÁC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN 138 TÀI LIỆU THAM KHẢO TIẾNG ANH 139

TIẾNG VIỆT 152

Trang 5

DANH MỤC CÁC BẢNG, BIỂU ĐỒ

Bảng 2.1 Các gia tử ngôn ngữ và các hàm tương ứng 67

Bảng 2.2 Các kết quả của các tác giả khác 85

Bảng 2.3 Các kết quả của sáu mô hình đề xuất với hàm thuộc là hàm tam giác 85

Bảng 2.4 Các kết quả của sáu mô hình đề xuất với hàm thuộc dạng hình chuông 86

Bảng 2.5 Các kết quả của sáu mô hình đề xuất với hàm thuộc hình thang 86

Biểu đồ 2.1 So sánh các kết quả của các tác giả khác với các kết quả của sáu mô hình đề xuất với hàm thuộc là hàm tam giác 87

Biểu đồ 2.2 So sánh các kết quả của các tác giả khác với các kết quả của sáu mô hình đề xuất với hàm thuộc dạng hình chuông 87

Biểu đồ 2.3 So sánh các kết quả của các tác giả khác với các kết quả của sáu mô hình đề xuất với hàm thuộc hình thang 88

Bảng 2.6 Các kết quả thực nghiệm bài toán lò đốt bằng gas của mô hình 2 đề xuất và các phương pháp khác (Bài toán Box và Jenkins) 91

Biểu đồ 2.4 Biểu đồ so sánh các giá trị PI* của bài toán lò đốt bằng gas của mô hình 2 đề xuất với các phương pháp khác (Bài toán Box và Jenkins) 91

Bảng 2.7 Các kết quả thực nghiệm bài toán lò đốt bằng gas của sáu mô hình đề xuất và của các phương pháp khác (Bài toán Box và Jenkins) 93

Bảng 2.8 Các kết quả bài toán chuỗi thời gian hỗn loạn của mô hình 2 đề xuất và của các phương pháp khác (Bài toán Mackey và Glass) 95

Biểu đồ 2.5 Biểu đồ so sánh các giá trị NDEI* của bài toán lò đốt bằng gas của mô hình 2 đề xuất và các phương pháp khác (Bài toán Box và Jenkins) 96

Bảng 2.9 Các kết quả bài toán chuỗi thời gian hỗn loạn của sáu mô hình đề xuất và của các phương pháp khác (Bài toán Mackey và Glass) 97

Bảng 3.1 Các kết quả của bài toán ước lượng chi phí bảo trì mạng lưới điện của các tác giả khác so với mô hình 2 của luận án 116

Biểu đồ 3.1 Biểu đồ so sánh các giá trị MSEtra, MSEtst của bài toán ước lượng chi phí bảo trì mạng lưới điện của các tác giả khác và mô hình 2 của luận án với tập huấn luyện RTR được tạo bởi phân hoạch rõ có p=0.3 117

Biểu đồ 3.2 Biểu đồ so sánh số luật (#R) của bài toán ước lượng chi phí bảo trì mạng lưới điện của các tác giả khác và mô hình 2 của luận án 117

Bảng 3.2 Các kết quả của bài toán ước lượng chi phí bảo trì mạng lưới điện của các tác giả khác [123], [93], [86] 118

Bảng 3.3 Các kết quả của bài toán ước lượng chi phí bảo trì mạng lưới điện của 118

sáu mô hình đề xuất với tập huấn luyện RTR được tạo bởi phân hoạch rõ có p=0.3 118

Bảng 3.4 Các kết quả của bài toán ước lượng chi phí bảo trì mạng lưới điện của sáu mô hình đề xuất với tập huấn luyện RTR được tạo bởi phân hoạch mờ có q=0.3 119

Biểu đồ 3.3 Biểu đồ so sánh số luật (#R) của bài toán ước lượng chi phí bảo trì mạng lưới điện của các tác giả khác và các mô hình của luận án 119

Trang 6

Biểu đồ 3.4 Biểu đồ so sánh các giá trị MSEtra, MSEtst của bài toán ước lượng chi phí bảo trì mạng lưới điện của các tác giả khác và các mô hình của luận án với tập huấn luyện RTR được tạo bởi phân hoạch rõ có p=0.3 và phân hoạch mờ có q=0.3 120 Bảng 3.5 Các kết quả của bài toán ước lượng chiều dài của đường dây điện trong lưới điện

hạ thế ở các thành phố và thị trấn của các tác giả khác và mô hình 2 của luận án với tập huấn luyện RTR được tạo bởi phân hoạch rõ có p=0.3 122 Biểu đồ 3.5 Biểu đồ so sánh các giá trị trung bình của MSEtra và MSEtst của bài toán ước lượng chiều dài của đường dây điện trong lưới điện hạ thế ở các thành phố và thị trấn nông thôn của các tác giả khác với mô hình 2 của luận án với tập huấn luyện RTR được tạo bởi phân hoạch rõ có p=0.3 123 Biểu đồ 3.5 Biểu đồ so sánh các kết quả #R (số luật) của bài toán ước lượng chiều dài của đường dây điện trong lưới điện hạ thế ở các thành phố và thị trấn nông thôn của các tác giả khác với mô hình 2 của luận án với tập huấn luyện RTR được tạo bởi phân hoạch rõ có p=0.3 124 Bảng 3.6 Các kết quả của bài toán ước lượng chiều dài của đường dây điện trong lưới điện

hạ thế ở các thành phố và thị trấn của các tác giả khác 124 Bảng 3.7 Các kết quả của bài toán ước lượng chiều dài của đường dây điện trong lưới điện

hạ thế ở các thành phố và nông thôn của các tác giả khác 125 Bảng 3.8 Các kết quả của bài toán ước lượng chiều dài của đường dây điện trong lưới điện

hạ thế ở các thành phố và nông thôn của các tác giả khác 125 Bảng 3.9 Các kết quả của bài toán ước lượng chiều dài của đường dây điện trong lưới điện

hạ thế ở các thành phố và nông thôn của sáu mô hình đề xuất với tập huấn luyện RTR được tạo bởi phân hoạch rõ có p=0.3 126 Biểu đồ 3.6 Biểu đồ so sánh các kết quả số luật #R và số nhãn #Label của bài toán ước lượng chiều dài của đường dây điện trong lưới điện hạ thế ở các thành phố và thị trấn nông thôn của các tác giả khác với sáu mô hình của luận án với tập huấn luyện RTR được tạo bởi phân hoạch rõ có p=0.3 126 Biểu đồ 3.7 Biểu đồ so sánh các kết quả số luật #R và số nhãn #Label của bài toán ước lượng chiều dài của đường dây điện trong lưới điện hạ thế ở các thành phố và thị trấn nông thôn của các tác giả khác với sáu mô hình của luận án với tập huấn luyện RTR được tạo bởi phân hoạch rõ có p=0.3 127

Trang 7

DANH MỤC CÁC HÌNH

Hình 1.1 Cấu trúc cơ bản của FRBSs dạng Mamdani 20

Hình 1.2 Cấu trúc cơ bản của FRBSs dạng TSK 24

Hình 1.3 Minh họa một thuật giải GA căn bản 29

Hình 1.4 Học theo phương pháp tiếp cận Pittsburgh 32

Hình 1.5 Sơ đồ quy trình tinh chỉnh DB 32

Hình 1.6 Học theo phương pháp tiếp cận Michigan 33

Hình 1.7 Sơ đồ quy trình học RB 36

Hình 1.8 Biểu diễn một luật với mã có chiều dài cố định hoặc thay đổi 36

Hình 1.9 Quy trình học RB, sau đó học DB 36

Hình 1.10 Sơ đồ quy trình học KB 37

Hình 1.11 Các giai đoạn thiết kế các hệ thống mờ 40

Hình 1.12 Minh họa phạm vi nghiên cứu của đề tài 44

Hình 2.1 Đồ thị minh họa của một hàm thuộc Gauss với l r 54

Hình 2.2 Đồ thị minh họa của ba hàm thuộc khi dùng hàm Gauss 55

Hình 2.3 Đồ thị minh họa của một hàm thuộc tam giác với l r 56

Hình 2.4 Đồ thị minh họa của ba hàm thuộc khi dùng hàm tam giác 57

Hình 2.5 Đồ thị minh họa của một hàm thuộc hình thang với l r 57

Hình 2.6 Đồ thị minh họa của ba hàm thuộc khi dùng hàm hình thang 59

Hình 2.7 Đồ thị minh họa của một hàm thuộc dạng hình chuông tổng quát với l r 60

Hình 2.8 Đồ thị minh họa của ba hàm thuộc khi dùng hàm dạng hình chuông với b=1 61

Hình 2.9 Sơ đồ minh họa việc khởi tạo DB ban đầu 61

Hình 2.10 Sơ đồ minh họa việc khởi tạo RB ban đầu 63

Hình 2.11 Các thành phần của một nhiễm sắc thể 68

Hình 2.12 Toán tử lai ghép 69

Hình 2.13 Hình minh họa đồ thị các hàm thuộc có miền xác định rời nhau hay giao nhau 70

Hình 2.14 Hình minh họa đồ thị miền biến thiên của các đỉnh của các hàm thuộc 71

Hình 2.15 Biểu diễn mã hóa của phần T 73

Hình 2.16 Đường liền nét biểu diễn dữ liệu đầu ra là số thực và đường chấm-chấm biểu diễn dữ liệu dự đoán bởi mô hình 3 92

Hình 2.17 Kết quả học và dự đoán với P=6 (a) Đường liền nét biểu diễn dữ liệu đầu ra mong muốn và đường chấm-chấm biểu diễn dữ liệu học và dự đoán bởi mô hình 3 (b) Đồ thị biểu diễn sai số học và dự đoán 97

Hình 3.1 Minh họa phương pháp chọn tập huấn luyện đại diện RTR từ tập huấn luyện ban đầu TR 107

Hình 3.2 Minh họa việc chọn tập RTRi từ tập Li 109

Hình 4.1 Hình minh họa hướng tiếp cận thứ 1 của đề tài 133

Hình 4.2 Hình minh họa quá trình tinh giản/tinh chỉnh FRBS của hướng tiếp cận thứ 1 133 Hình 4.3 Hình minh họa hướng tiếp cận thứ 2 của đề tài 134

Trang 8

DANH MỤC CÁC TỪ VIẾT TẮT

STT Từ viết tắt Diễn giải tiếng Anh Diễn giải tiếng Việt

Hệ thống dựa trên luật mờ

di truyền

Phương pháp IRL, PP Học Luật tương tác

Chỉ số sai số không phụ thuộc chiều

Tập dữ liệu huấn luyện đại diện

Phương pháp chọn lọc mẫu ngẫu nhiên cua Baker

Takagi-22 CVT(Rp,er)

Hàm xác định giá trị phủ

Trang 9

MỞ ĐẦU

Từ khi Mamdani đưa ra khái niệm về hệ thống mờ vào năm 1974, việc nghiên cứu

áp dụng lý thuyết điều khiển mờ được xem là lãnh vực sôi động nhất trong logic mờ vào các năm vừa qua Kể từ thập kỷ 80, logic mờ đã góp phần quan trọng trong việc tìm ra các giải pháp đơn giản và thực tế cho các ứng dụng hết sức đa dạng và phong phú trong các ngành khoa học và kỹ thuật [146]-[150] Do tầm quan trọng của logic

mờ trong điều khiển hệ thống, kiểm soát chuyến bay, kiểm soát tốc độ của vệ tinh, và các vấn đề tương tự nên nó đã trở một phần quan trọng không thể thiếu được trong các quá trình sản xuất công nghiệp

Vào thập niên 1970-80, hệ thống mờ thường được thiết kế bởi các chuyên gia Các hệ thống này chủ yếu là các hệ thống dựa trên luật mờ, còn gọi là các hệ suy diễn

mờ (Fuzzy Rule-Based Systems, FRBSs), là việc mô phỏng các quy tắc về hành vi ứng xử của con người dưới dạng các luật mờ Các hệ thống này thường là các hệ thống dựa trên luật mờ, sử dụng các biến ngôn ngữ Chúng đã tạo nên sự bùng nổ các ứng dụng trong công nghệ như máy điều hòa mờ, máy làm sạch không khí mờ, máy ảnh mờ, máy giặt mờ, nồi cơm điện mờ v.v Các hệ thống mờ này thường nhỏ và sử dụng luật mờ dạng ngôn ngữ tự nhiên nên có tính diễn giải được cao, nghĩa là dễ hiểu,

có thể giải thích dễ dàng cho người sử dụng nhưng lại có độ chính xác không cao Tính diễn giải được cao của hệ thống mờ phụ thuộc một số yếu tố như cấu trúc của

mô hình của hệ thống, số luật là nhỏ, số điều kiện trong phần tiền đề luật là ít, số nhãn ngôn ngữ cho mỗi biến là tối ưu, dạng của hàm thuộc v.v [1, 2] Ngoài ra, không phải lúc nào cũng tìm được chuyên gia để thiết kế FRBSs cho một ứng dụng cụ thể nào đó và cũng cần nhiều thời gian để chuyên gia có thể thiết kế thủ công các hệ thống này Do đó nảy sinh yêu cầu thiết kế FRBSs một cách tự động từ dữ liệu số của một ứng dụng cụ thể [130, 131] Vào đầu những năm 1990, các hệ thống mờ phức tạp có độ chính xác cao đã được thiết kế bằng các giải thuật mạng nơron nhân tạo và

di truyền [132]-[136], [148]-[150] Những hệ thống này lại có tính diễn giải được thấp, nghĩa là hệ thống tương đối phức tạp với Cơ sở luật lớn mặc dù có tính chính xác cao

Trang 10

Vào giữa những năm 1990, các nhà nghiên cứu đã đề cập việc tìm kiếm một ranh giới tối ưu giữa tính diễn giải và tính chính xác cho một hệ thống Hai tính chất này thường tỷ lệ nghịch với nhau trong cùng một hệ thống mờ Ý tưởng chính là kết hợp giá trị sai số (biểu thị cho tính chính xác) và số luật trong Cơ sở luật (biểu thị cho tính diễn giải được, cũng liên quan đến độ phức tạp) của hệ thống vào cùng một hàm vô hướng như sau:

f (S) = w1 ⋅ fError(S) + w2 ⋅ fComplexity(S)

trong đó w1, w2 là các giá trị trọng số, fError(S) và fComplexity(S) lần lượt biểu thị giá trị

hướng chọn được các So có độ phức tạp thấp (tính diễn giải được cao) nhưng có độ

chính xác thấp (sai số cao) [137]-[140] Đó chính là các khó khăn khi tìm kiếm một

hệ thống vừa có tính diễn giải cao, vừa có độ chính xác cao khi dùng một hàm duy

nhất f như trên

Do đó, vào cuối những năm 1990 cho đến hiện nay, các nhà nghiên cứu đã đề cập đến việc thiết kế các hệ thống mờ đa mục tiêu Các hệ thống này phải thỏa mãn hai mục tiêu chính là tính diễn giải cao và độ chính xác cao [141]-[145] Cách tiếp cận là

đa mục tiêu, tức là

Cực tiểu {fError(S), fComplexity(S)}

Thông thường, các hệ thống mờ gồm nhiều biến sẽ được xem là các hệ thống phức tạp Đối với các hệ thống như thế, kích thước của cơ sở luật sẽ bùng nổ theo cấp số nhân Ví dụ: một hệ thống điều khiển gồm m thuộc tính và n biến đầu vào, số luật

nghĩa là tối ưu số luật (giảm số luật), tối ưu số điều kiện (giảm số điều kiện) trong phần tiền đề của luật mà hệ thống vẫn còn hiệu quả cao trong ứng dụng Điều này cũng có nghĩa là hệ thống phải thỏa mãn hai mục tiêu là có tính diễn giải được cao đồng thời vẫn có tính chính xác cao [1]-[6], [i]-[ii] Có nhiều phương pháp giải quyết vấn đề này như phương pháp phân cấp, phương pháp nhập biến, phương pháp kết hợp

Trang 11

của hai phương pháp trên [128], phương pháp các điểm dữ liệu đặc trưng và các phương pháp thiết kế hệ thống mờ đa mục tiêu [141]-[145] v.v… Ưu điểm của các cách tiếp cận này là kích thước của cơ sở luật của hệ thống giảm đi nhiều, do đó làm giảm chi phí tính toán và chi phí về thời gian

Để xây dựng một hệ thống mờ thỏa hai mục tiêu là có tính diễn giải cao và độ chính xác cao, luận án đề xuất sử dụng thuật giải di truyền, sẽ được đề cập chi tiết trong chương hai và ba đã công bố trong [i]-[iv]

Các hệ thống mờ thông dụng nhất thường là FRBSs FRBSs dạng ngôn ngữ được chia làm hai loại chính, tùy thuộc vào dạng biểu diễn của luật trong Cơ sở luật Loại thứ nhất là FRBSs dạng Mamdani

Loại thứ hai là FRBSs dạng TSK (Takagi-Sugeno-Kang)

Các FRBSs này sẽ được đề cập chi tiết hơn trong chương 1, mục 1.2.3.1 và 1.2.3.2 Trong luận án này, tác giả đề xuất một phương pháp xây dựng tự động hệ suy diễn

mờ ban đầu từ dữ liệu số, bao gồm cơ sở luật mờ, các hàm thuộc, cơ chế mờ hóa, cơ chế suy diễn và cơ chế giải mờ Phương pháp này được đặt tên là phương pháp TMH (viết tắt theo Tên+Chữ đệm+Họ của nghiên cứu sinh) đã được công bố trong các hội nghị và tạp chí quốc tế [i]-[iv] Một đặc điểm đáng lưu ý của phương pháp này là gồm nhiều bước, trong đó bước đầu tiên là tìm số nhãn ngôn ngữ tối ưu cho mỗi biến đầu vào và đầu ra Điều này cực kỳ quan trọng, nó quyết định sự thành công sau này của việc khởi tạo hệ suy diễn mờ ban đầu, cũng như tạo thuận lợi việc tinh giản, tinh chỉnh hệ thống đó sau này Trong luận án, việc tinh giản hệ thống được hiểu như là tối ưu Cơ sở luật, bao gồm việc rút gọn số luật và số điều kiện trong phần tiền đề của luật một cách tối ưu bằng giải thuật di truyền (Genetic Algorithms, GAs) Việc tinh chỉnh hệ thống được hiểu như là hiệu chỉnh các tham số của các hàm thuộc và thêm các gia tử ngôn ngữ vào luật một cách tối ưu bằng GAs Ngoài ra, luận án còn đề xuất dạng biểu diễn thống nhất cho các hàm thuộc thông dụng như hàm Gauss, hàm tam giác, hàm hình thang, hàm dạng hình chuông tổng quát v.v là nhằm thống nhất cách biểu diễn một nhiểm sắc thể, tạo điều kiện thuận lợi cho việc áp dụng GAs Hơn nữa, với dạng thống nhất này, ý nghĩa của các tham số hàm thuộc trở nên rõ ràng, dễ hiểu hơn

Trang 12

Luận án còn đề xuất một thuật giải di truyền được sử dụng theo nhiều giai đoạn khác nhau và ở hai cấp độ khác nhau như vĩ mô, lẫn vi mô để tinh giản và tinh chỉnh FRBS đã khởi tạo ban đầu bằng phương pháp TMH TMH được viết tắt theo Tên+Chữ đệm+Họ của nghiên cứu sinh đã được công bố trong các hội nghị và tạp chí quốc tế [i]-[iv], sẽ được đề cập chi tiết trong mục 2.2, chương 2 Mục đích của các quá trình này là tối ưu hệ thống và nhưng vẫn đảm bảo tính hiệu quả, tính chính xác trong việc thực thi của hệ thống Từ các đề xuất vừa đề cập ở trên, luận án đưa ra sáu mô hình để xây dựng một hệ suy diễn mờ vừa có tính diễn giải cao, vừa có độ chính xác cao (sẽ đề cập chi tiết trong chương 2) Các kết quả này đã được công bố trong hội nghị và tạp chí quốc tế [i, iv]

Cuối cùng, đối với các dữ liệu thực nghiệm có kích thước lớn và độ phức tạp cao, luận án cũng đề nghị hai phương pháp chọn tập dữ liệu huấn luyện rút gọn từ tập huấn luyện ban đầu Tập con này còn gọi là tập dữ liệu huấn luyện đại diện, ký hiệu RTR (The Representative Training Data Set) Luận án cũng đã trình bày các thực nghiệm trên tập huấn luyện RTR cùng với sáu mô hình đã đề cập ở trên (sẽ đề cập chi tiết trong chương 3) Các kết quả này đã được công bố trong hội nghị và tạp chí quốc tế [ii]-[iii]

Luận án này bao gồm bốn chương Chương 1 giới thiệu các kiến thức cơ sở, động

cơ nghiên cứu, các nghiên cứu của các tác giả khác, các đóng góp của luận án Chương

2 trình bày phương pháp xây dựng hệ suy diễn mờ tinh giản và hiệu quả (mang tính diễn giải cao và có độ chính xác cao) Phương pháp này bao gồm việc xây dựng hệ thống ban đầu, sau đó tinh giản, tinh chỉnh hệ thống bằng sáu mô hình đề xuất Chương 3 trình bày hai phương pháp xây dựng tập dữ liệu huấn luyện rút gọn dựa trên các phân hoạch rõ và mờ Luận án đã thực nghiệm với tập dữ liệu huấn luyện rút gọn, có so sánh kết quả với các kết quả của các tác giả khác Chương 4 tổng kết các kết quả đã thực hiện và hướng phát triển

Trang 13

có thông tin không chắc chắn và không chính xác [41]-[44], [146]-[150] Các hệ thống

mờ dạng luật Mamdani (Mamdani-type Fuzzy Rule Based Systems, FRBSs dạng Mamdani) là một trong những hệ thống thực hiện điều này, cung cấp cho người dùng một mô tả rất dễ hiểu về hệ thống dưới dạng các luật ngôn ngữ, đây cũng là một yêu cầu bắt buộc trong nhiều bài toán thực tế

Một thành phần quan trọng của FRBSs là Cơ sở Tri thức (Knowlelege Base, KB)

KB của FRBSs thường không phải là một cấu trúc đồng nhất mà là sự kết hợp các thành phần khác nhau Ví dụ: KB của một FRBS theo mô hình Mamdani bao gồm hai thành phần:

 Cơ sở Dữ Liệu (Data Base, DB) chứa các định nghĩa của các hàm tỷ lệ cho các biến đầu vào/ra và các hàm thuộc của các tập mờ tương ứng với các nhãn ngôn ngữ

 Cơ sở Luật (Rule Base, RB) tạo thành tập các luật mờ của hệ thống (sẽ đề cập chi tiết hơn ở 1.2.3.1)

Tổng quát một FRBS bao gồm hai thành phần chính:

 Bộ Suy diễn thực hiện quá trình suy diễn cho đầu ra của hệ thống khi một đầu vào được xác định

 Một cơ sở tri thức (KB) biểu diễn các tri thức đã biết của bài toán hay vấn đề cần giải quyết

Trang 14

Trong chương này, luận án sẽ đề cập ngắn gọn về các phiên bản khác nhau hiện có của FRBSs, cùng với các cấu trúc và đặc trưng riêng của chúng, nhưng vẫn chủ yếu tập trung nói về FRBSs dạng Mamdani là FRBSs có các luật dạng ngôn ngữ tự nhiên Tính hiệu quả của một FRBS dạng ngôn ngữ phụ thuộc vào

cơ sở luật và các hàm thuộc tương ứng với các phân hoạch trên các miền dữ liệu của hệ thống Việc thiết kế các thành phần trong FRBSs là một vấn đề phức tạp nên nhiều tác giả đã đề nghị các kỹ thuật khác nhau để thực hiện việc này

Một vài phương pháp học trên các thành phần của RB hay DB và các phương pháp tinh chỉnh trên DB của hệ thống Các phương pháp này dựa trên ý tưởng của ba cách tiếp cận nổi tiếng là phương pháp phủ dữ liệu ad-hoc, mạng nơ ron và thuật giải

di truyền

FRBSs thường được phân làm hai loại là các hệ thống mờ dạng Mamdani và dạng TSK, tùy thuộc vào biểu thức của phần kết luận của các luật trong RB Các luật mờ dạng Mamdani có phần kết luận là một biến ngôn ngữ, trong khi các luật mờ dạng TSK có phần kết luận là một đa thức của các biến đầu vào

Mô hình hóa một bài toán thực tế ở dạng ngôn ngữ thông tự nhiên dựa trên logic

mờ được xem như là việc xây dựng một hệ thống được biểu diễn bằng ngôn ngữ theo

mô hình của FRBSs dạng Mamdani Khi đó khái niệm biến ngôn ngữ sẽ đóng vai trò trung tâm, bởi vì các biến ngôn ngữ có thể được diễn giải thành lời, dễ hiểu và dễ sử dụng Do đó các FRBSs dạng này đã được sử dụng rộng rãi và đã đạt được nhiều kết quả rất tốt trong nhiều ứng dụng khác nhau

Phần này sẽ đề cập ngắn gọn về các FRBSs dạng ngôn ngữ và xem xét các kỹ thuật thiết kế khác nhau Nhiều phương pháp tiếp cận dựa trên nền tảng các giải thuật học, chẳng hạn như các phương pháp ad-hoc, mạng nơron nhân tạo (Artificial Neural Networks, ANNs), thuật giải di truyền (Genetic Algorithms, GAs), clustering v.v Phần này sẽ đề cập các cách tiếp cận nổi tiếng về giải thuật học và tinh chỉnh các FRBSs dạng ngôn ngữ

Trong mục sau sẽ trình bày sơ lượt một số dạng khác nhau của FRBSs Sau đó, sẽ trình bày một số phương pháp học và tinh chỉnh các FRBSs dạng ngôn ngữ

1.2 Các kiến thức cơ bản về hệ suy diễn mờ

Trang 15

1.2.1 Hệ suy diễn mờ

Theo nghĩa rộng, một FRBS là một hệ thống dựa trên luật trong đó logic mờ được

sử dụng như một công cụ để biểu diễn các dạng khác nhau của tri thức về một vấn đề cần giải quyết, cũng như để mô hình hóa sự tương tác và các mối quan hệ giữa các biến của hệ thống Nhờ vào đó, các hệ thống này đã được áp dụng thành công vào một lớp lớn các vấn đề có liên quan đến các hệ thống có thông tin không chắc chắn

và không rõ ràng [41]-[44], [146]-[150]

Trong mục này, sẽ trình bày các khía cạnh cơ bản của FRBSs như các loại FRBSs khác nhau, các thành phần và các chức năng của chúng Tuy nhiên, chúng ta sẽ không đề cập nhiều về logic mờ, có thể tham khảo thêm trong [44]-[45]

1.2.2 Logic mờ và hệ thống mờ

Hệ thống dựa trên luật đã được sử dụng để mô hình hóa các hoạt động của con người trong cách giải quyết một vấn đề, một bài toán, trong đó tri thức của con người

được biểu diễn theo cách cổ điển bằng các luật “IF-THEN” Khi phần tiền đề của

luật được thỏa mãn thì phần kết luận sẽ được thực hiện, trong thực tế sẽ đưa ra một hành động tương ứng Trong cách tiếp cận thông thường, để biểu diễn tri thức, người

ta thường dùng logic nhị nguyên nhưng chính điều này mà hệ thống sẽ không có khả năng giải quyết được những vấn đề có thông tin không chắc chắn và không chính xác

Do đó, các cách tiếp cận cổ điển đã không thể cung cấp một mô hình đầy đủ cho các kiểu lý luận khác nhau và thậm chí cả những lý luận thông thường

Logic mờ được xem như một mở rộng của logic cổ điển, cung cấp một khái niệm hiệu quả để giải quyết vấn đề biểu diễn tri thức trong hai môi trường không chắc chắn

và không chính xác Logic mờ, như tên gọi của nó, là phương tiện để thực hiện các lập luận xấp xỉ gần đúng Tầm quan trọng của logic mờ bắt nguồn từ các sự kiện và các phương thức lập luận của con người, đặc biệt là các lập luận thông thường có bản chất là các lập luận xấp xỉ Người đọc có thể tham khảo mối quan hệ giữa Logic mờ với các lập luận xấp xỉ các sự kiện có thông tin không chắc chắn và không chính xác trong [8], [46], [146]

Trang 16

Trong Logic mờ cùng với lý thuyết tập mờ, độ thuộc của các phần tử nào đó vào một tập hợp sẽ giảm từ từ, không giảm đột ngột như trong logic cổ điển Mô hình hóa các bài toán thực tế thông qua Logic mờ và tập mờ đã cung cấp một quan điểm mới,

mở rộng hơn bằng việc cung cấp các công cụ sáng tạo để giải quyết các bài toán trong các hệ thống phức tạp và khó xác định

Lãnh vực nghiên cứu tập mờ đã được quan tâm nhiều sau các công trình tiên phong của Zadeh [46] và đã đặt nền tảng ban đầu cho việc xây dựng các hệ thống mờ Theo quan điểm tổng quát, một hệ thống mờ là bất kỳ hệ thống nào dựa trên logic

mờ, trong đó logic mờ đươc sử dụng làm Cơ sở để biểu diễn các dạng khác nhau của tri thức hoặc để mô hình hóa các tương tác và mối quan hệ của các biến trong hệ thống Các công cụ cổ điển không thể giải quyết được một số bài toán thực vì độ phức tạp hay không chính xác nên hệ thống mờ đã chứng tỏ là một công cụ quan trọng để

mô hình hóa các hệ thống phức tạp này [40]-[43]

Cụ thể, việc ứng dụng logic mờ vào các hệ thống dựa trên các luật truyền thống

đã dẫn đến các hệ thống dựa trên luật mờ (FRBSs) Những hệ thống này xem xét các

luật dạng “IF-THEN” với phần tiền đề và phần kết luật là các phát biểu mờ, đã cho

thấy có hai ưu thế so hệ thống dựa trên các luật cổ điển như:

 Các tập mờ biểu diễn Cơ sở Tri thức, liên quan đến việc xử lý các thông tin không chắc chắn

 Các phương pháp suy diễn trở nên mạnh hơn và linh hoạt hơn với các phương pháp lập luận xấp xỉ của logic mờ

Việc biểu diễn tri thức được tăng cường bằng cách sử dụng các biến ngôn ngữ và các giá trị ngôn ngữ, được xác định bởi các tập mờ phụ thuộc vào ngữ cảnh của bài toán mà ngữ nghĩa của nó được xác định bởi các hàm thuộc [46] Ngoài ra, các quy tắc suy diễn mới như quy tắc khẳng định tổng quát (còn gọi là quy tắc modus ponens tổng quát) và quy tắc phủ định tổng quát, còn gọi là quy tắc modus tollens tổng quát, v.v , dựa trên logic mờ, hình thành Cơ sở cho lập luận xấp xỉ [46] Do đó, logic mờ cung cấp một khuôn khổ tính toán độc đáo cho cơ chế suy diễn trong các hệ thống dựa trên luật Không như các hệ thống logic truyền thống, mục tiêu của logic mờ là

Trang 17

nhằm cung cấp các phương thức lập luận gần đúng và tương tự, hơn là chính xác [146]-[150]

1.2.3 Phân loại các hệ suy diễn mờ

Các FRBSs thường được phân biệt làm hai loại trong các tài liệu chuyên ngành tùy thuộc vào dạng luật mờ được xem xét và các loại đầu vào và ra được dùng [47], sẽ được giới thiệu trong mục sau

1.2.3.1 Các hệ thống luật mờ dạng Mamdani

Các FRBSs dạng này đã được Mamdani đề nghị trong [48], sử dụng các lý thuyết ban đầu của Zadeh để xây dựng FRBSs và đã được ứng dụng để giải các bài toán điều khiển Từ đó đến nay, các hệ thống mờ loại này được sử dụng nhiều nhất, thường được gọi là FRBSs với bộ Mờ hóa và bộ Giải mờ hay thông dụng hơn được gọi là các

hệ điều khiển mờ (tên gọi này được Mamdani đề nghị trong các bài báo đầu tiên của

mình [49])

Các FRBSs dạng Mamdani gồm có bốn thành phần chính: Cơ sở Tri thức (KB),

bộ Mờ hóa, bộ Suy diễn và bộ Giải mờ KB gồm Cơ sở Dữ Liệu (DB) và Cơ sở Luật

(RB) chứa các tri thức về một vấn đề đang quan tâm dưới dạng các luật “IF-THEN”

Cấu trúc của FRBSs dạng Mamdani được thể hiện trong hình sau

Các luật mờ trong RB của FRBSs dạng Mamdani có dạng như sau:

IF X 1 is A 1 and and X n is A n THEN Y is B, trong đó Ai và B là các nhãn ngôn ngữ

FRBSs dạng Mamdani có một vài đặc tính thú vị sẽ được đề cập dưới đây:

Cơ Sở Dữ Liệu Cơ Sở Luật

Cơ Sở Tri Thức

bộ Mờ Hóa bộ Suy Diễn bộ Giải Mờ

Trang 18

 Các hệ thống này được sử dụng trong những ứng dụng thực tế có các giá trị đầu

vào và đầu ra là số thực

 Các hệ thống này cung cấp một khung khổ tự nhiên cho phép kết hợp tri thức của

chuyên gia dưới dạng các luật ngôn ngữ với các luật được xây dựng tự động từ các dữ liệu số, biểu diễn các bài toán trong thế giới thực

 Cuối cùng, các hệ thống dạng này cung cấp nhiều khả năng hơn cho phép chọn

lựa các bộ Mờ hóa, bộ Giải mờ cũng như bộ Suy diễn sao cho có thể thiết kế hệ thống phù hợp hơn cho từng bài toán cụ thể

Bộ Mờ hóa thiết lập một ánh xạ từ các giá trị rõ trong miền U, các giá trị đầu vào, đến các tập mờ được định nghĩa trên cùng miền U đó Mặt khác, bộ Giải mờ thực hiện công việc ngược lại là thiết lập một ánh xạ từ các tập mờ được định nghĩa trên miền V, các giá trị đầu ra, đến đến các giá trị rõ trong cùng miền V đó

Các luật mờ gồm các biến đầu vào và đầu ra ngôn ngữ có giá trị lấy trong tập các giá trị ngôn ngữ có ý nghĩa thực tế trong thế giới thực Do đó, mỗi luật là một mô tả về điều kiện hành động mà con người có thể diễn giải được một cách rõ ràng Điều này làm cho FRBSs dạng Mamdani phù hợp với việc mô hình hóa bằng ngôn ngữ, một lãnh vực con của lãnh vực mô hình hóa bằng logic mờ, trong đó đặc trưng chính

là tính diễn giải được của mô hình [1]-[2], [50], và vấn đề điều khiển hệ thống [51] Một mở rộng của FRBSs dạng Mamdani dựa trên sự thay đổi cấu trúc của luật ngôn ngữ với mục đích là làm cho nó linh hoạt hơn FRBS dạng mở rộng này sử dụng các luật mờ dạng DNF (Disjunctive Normal Form) như sau [52]-[55]:

pháp đầy đủ cho phần tiền đề của là

𝑋1 𝑖𝑠 𝐴̃ = { 𝐴1 11 , , 𝐴1ℓ1} 𝑎𝑛𝑑 … 𝑎𝑛𝑑 𝑋𝑛 𝑖𝑠 𝐴̃ = { 𝐴𝑛 𝑛1 , , 𝐴𝑛ℓ𝑛}

Trang 19

Sau đây là một ví dụ về luật thuộc loại này Giả sử có ba biến đầu vào X1, X2, và

D 1 = {A 11 , A 12 , A 13 }; D 2 = {A 21 , A 22 , A 23 , A 24 , A 25 }; D 3 = {A 31 , A 32 } ;

F = {B 1 , B 2 , B 3 }

Một minh họa về một luật dạng DNF:

IF X 1 is {A 11 or A 13 } and X 2 is {A 23 or A 25 } and X 3 is {A 31 or A 32 } THEN Y is B 2

Gần đây, một KB có cấu trúc mới, linh hoạt hơn cho phép cải thiện tính chính xác của các mô hình sử dụng ngôn ngữ mà không làm mất tính diễn giải được của hệ thống, đã được đề xuất trong [56] Lúc đó, hệ thống với một luật ngôn ngữ có thể có hai phần kết luận khác nhau Điều này giúp các FRBSs có thể cải thiện được tính chính xác trong tìm kiếm cục bộ đối với các không gian tìm kiếm phức tạp, bởi vì đầu ra của luật cuối cùng nằm trong vùng trung gian giữa hai nhãn ngôn ngữ chính

Sự thay đổi này có thể diễn giải như sau:

IF X 1 is A 1 and and X n is A n THEN Y is between B 1 and B 2

Ngoài ra, trong những năm gần đây người ta đã đề nghị một biến thể mới của các

hệ thống thuộc loại này, trong đó độ chính xác của hệ thống được coi trọng hơn tính

diễn giải được của nó Các hệ thống này thường được gọi là các hệ thống FRBSs dạng

Mamdani- xấp xỉ [40], [57]-[60], ngược lại với những hệ thống này là các hệ thống

cổ điển thường được gọi là các hệ thống FRBSs dạng Mamdani-ngôn ngữ hay

Mamdani-miêu tả Ứng dụng chính của các hệ thống FRBSs dạng Mamdani- xấp xỉ

là lãnh vực mô hình hóa mờ [40], trong đó tính chính xác của mô hình là yêu cầu chính, thay vì khả năng mô tả, diễn giải được của nó

Cấu trúc của một FRBS dạng Mamdani-xấp xỉ cũng giống như của một FRBS dạng Mamdani-ngôn ngữ đã được trình bày ở Hình 1.1 Khác biệt duy nhất liên quan

đến loại luật được xem xét trong KB và do đó liên quan đến cấu trúc của các luật Trong trường hợp này, các luật không sử dụng biến ngôn ngữ mà sử dụng trực tiếp các biến mờ Do đó, cấu trúc của các luật mờ trong các hệ thống xấp xỉ như sau:

IF X 1 is A 1 and and X n is A n THEN Y is B, trong đó Ai và B là các tập mờ mà

không cần diễn giải ra các nhãn ngôn ngữ

Trang 20

Vì vậy, trong các hệ thống này, trong cấu trúc của DB không cần lưu trữ các giá trị ngôn ngữ cũng như các tập mờ liên quan định nghĩa ngữ nghĩa của chúng Trong trường hợp này, Cơ sở Tri thức (KB) trong FRBSs, gồm DB và RB trở thành một Cơ

sở luật mờ duy nhất được tạo bởi tập các luật mờ, trong đó mỗi luật mờ chứa trực tiếp ngữ nghĩa mà nó mô tả

1.2.3.2 Các hệ thống luật mờ dạng Takagi-Sugeno-Kang

Thay vì sử dụng các luật ngôn ngữ như hệ thống dạng Mamdani-ngôn ngữ như đã đề cập ở mục trên, Takagi, Sugeno và Kang [61,62] đã giới thiệu một mô hình mới dựa trên luật, trong đó phần tiền đề của luật là các biến ngôn ngữ và phần kết luận là

một hàm của các biến đầu vào

Dạng phổ biến nhất của các luật dạng này thường có phần kết luận là một hàm tuyến tính theo các biến thuộc phần tiền đề của luật như sau:

IF X 1 is A 1 and and X n is A n THEN Y = p 1 X 1 + + p n X n + p 0 ,

hoặc chính là các tập mờ Các luật loại này thường được gọi là luật mờ TSK, đặt theo

tên các tác giả đã đề xuất

Trong một hệ thống FRBS dạng TSK có KB gồm m luật thì đầu ra của hệ thống

được tính bằng cách sử dụng trung bình trọng số của các đầu ra của mỗi luật thứ i là

∑𝑚𝑖=1ℎ𝑖.𝑌𝑖

của luật thứ i với giá trị đầu vào x0 = (x1, , xn) trong đó xi là giá trị của biến Xi với

i=1, ,n và T là một phép toán t-norm

Do đó, FRBSs dạng này dựa trên việc phân chia không gian đầu vào thành một số không gian con mờ và định nghĩa quan hệ tuyến tính giữa đầu vào và đầu ra trong mỗi không gian con này như đã được đề xuất bởi các tác giả trong [61] Trong quá trình suy diễn, các mối quan hệ từng phần này được kết hợp theo cách nói trên để tìm

Trang 21

mối quan hệ toàn cục giữa đầu vào và đầu ra Hình sau đây biểu diễn cấu trúc cơ bản

của FRBSs dạng TSK

Ưu điểm chính của những hệ thống này là phương trình biểu diễn của hệ thống

làm cho việc thiết kế hệ thống dễ dàng hơn Tuy nhiên, nhược điểm chính của hệ thống này lại liên quan đến dạng biểu diễn của phần kết luận của luật, không tạo khung khổ tự nhiên để có thể biểu diễn kiến thức của các chuyên gia Do đó, để khắc phục điều này, để tích hợp tri thức chuyên gia vào hệ thống này, người ta đã thực hiện một thay đổi nhỏ trên phần kết luận của luật, tương tự như các luật ngôn ngữ với phần

kết luận Y is B được cung cấp bởi chuyên gia, phần kết luật được thay thế bằng Y =

loại này thường được gọi các luật TSK bậc 0

1.2.3.3 Các thành phần của hệ thống luật dạng Mamdani

Tóm tắt các khái niệm đã giới thiệu, một FRBS dạng Mamdani gồm các thành phần sau:

Cơ sở Tri thức: chứa các luật ngôn ngữ hướng dẫn các hoạt động của hệ thống

Bộ Mờ hóa: chịu trách nhiệm biến đổi dữ liệu đầu vào rõ thành các giá trị có thể

được xử lý trong quá trình lập luận mờ, nghĩa là tập mờ nào đó

Bộ Suy diễn: sử dụng các giá trị trên và các thông tin chứa trong KB để thực hiện

quá trình suy diễn

Bộ Giải mờ: biến đổi giá trị mờ thu được trong quá trình suy diễn thành giá trị rõ,

tạo ra đầu ra toàn cục cho FRBS

Chúng ta sẽ phân tích kỹ hơn các thành phần trên trong phần sau đây

Cơ sở Tri thức

Như đã đề cập, KB bao gồm hai bộ phận khác nhau:

Trang 22

 RB: Được tạo bởi tập các luật ngôn ngữ “IF-THEN”, trong trường hợp FRBSs

dạng nhiều đầu vào – một đầu ra, thì sẽ có dạng sau:

IF X 1 is A 1 and and X n is A n THEN Y is B

nhãn ngôn ngữ RB gồm tập hợp các luật loại như trên được kết nối nhau bằng

toán tử “also”, có nghĩa là tất cả các luật đều được kích hoạt (“cháy”) khi một đầu

vào xác định được đưa vào hệ thống, sẽ được đề cập chi tiết ở phần sau

 DB: Chứa các định nghĩa của các tập mờ tương ứng với các nhãn ngôn ngữ sử

dụng trong các luật của RB, nghĩa là các tham số của các hàm thuộc

Bộ Mờ hóa

Bộ Mờ hóa là một trong hai thành phần của FRBSs dạng Mamdani làm việc với đầu vào là số thực Bộ này xác định một ánh xạ thiết lập một tương ứng giữa mỗi giá trị trong không gian đầu vào rõ với một tập mờ được xác định trong miền quan tâm của đầu vào đó, có hàm thuộc tương ứng

mờ hóa

Có nhiều cách chọn toán tử F, nhưng có hai cách chọn chính:

1 và độ thuộc của các phần tử còn lại sẽ giảm dần khi các phần tử đó càng xa

Ví dụ: tập mờ dạng tam giác, khi đó hàm thuộc có dạng sau:

Trang 23

Bộ Suy diễn

Bộ này thực hiện quá trình suy diễn mờ bằng cách áp dụng các nguyên lý của

Quá trình suy diễn mờ dựa trên việc áp dụng quy tắc khẳng định tổng quát, còn gọi là quy tắc Modus Ponens tổng quát, một mở rộng của quy tắc Modus Ponens cổ điển, đã được Zadeh đề xuất trong [8] như sau:

Quy tắc Modus Ponens tổng quát (Quy tắc Khẳng định tổng quát)

IF X is A THEN Y is B

Y is B’

Một phát biểu mờ dạng “IF X is A THEN Y is B” biểu diễn một quan hệ mờ giữa

A và B được định nghĩa trong U V Quan hệ mờ này được xác định bởi tập mờ R có

kéo theo mờ biểu diễn quan hệ mờ

Hàm thuộc của tập mờ B’ là kết quả của việc áp dụng quy tắc suy diễn CRI (Compositional Rule of Inference) được Zadeh giới thiệu trong [8] như sau: “Nếu R

là quan hệ mờ được định nghĩa trong U và V, và A’ là một tập mờ được định nghĩa trong U, thì tập mờ B’, suy ra từ A’, thu được từ phép hợp của R và A’, nghĩa là: B’ = A’ R

Do đó, khi áp dụng quy tắc suy diễn CRI vào các luật có phần tiền đề với n biến

đầu vào và phần kết luận với một biến đầu ra, thì kết quả có biểu thức sau:

Trang 24

Như đã đề cập trong mục trước, trong hầu hết các trường hợp bộ Mờ hóa biến đổi

T(1,1) = 1 và T(x,1) = x [63, 64], quy tắc suy diễn CRI cuối cùng rút gọn như sau:

Bộ Giải mờ

Từ phương thức hoạt động của bộ Suy diễn trong một FRBS dạng Mamdani-ngôn ngữ đã đề cập trong mục trên, quá trình suy diễn được thực hiện trên các luật riêng

biệt Do đó, có thể áp dụng quy tắc suy diễn CRI cho m luật trong KB, m tập mờ

Do hệ thống cần phải có đầu ra rõ nên bộ Giải mờ phải thực hiện việc tổng hợp các thông tin của mỗi tập mờ và biến đổi chúng thành một giá trị rõ duy nhất Sau đây là hai phương thức khác nhau để tổng hợp thông tin, đã được đề cập trong [65]:

1) Phương thức A: Tổng hợp trước, giải mờ sau Trong trường hợp này, bộ Giải

mờ thực hiện các việc sau:

hợp mờ G:

là đầu ra của toàn hệ thống:

2) Phương thức B: Giải mờ trước, tổng hợp sau Trong trường hợp này, sử dụng

phép tổng hợp (có thể là lấy trung bình, hoặc trung bình trọng số, hoặc chọn một trong các giá trị, v.v ) để tính đầu ra rõ cuối cùng Phép tổng hợp kết hợp các giá trị đặc trưng của các tập mờ cần suy diễn (trọng tâm, trung bình của giá trị lớn nhất, v.v ) để tính đầu ra rõ cuối cùng Do đó, thực hiện việc tính các giá trị đặc trưng của các tập mờ trước (giải mờ trước), sau đó áp dụng phép

tổng hợp trên các giá trị này để tính đầu ra rõ cuối cùng (tổng hợp sau)

Trong cả hai phương thức trên, toán tử “also” được sử dụng như là phép nối các

luật trong cơ sở luật Hai phương thức này cho thấy hai cách tiếp cận khác nhau trên

Trang 25

cùng một cơ sở luật với phép nối “also” Mamdani đã đề nghị phương thức A trong

các bài báo ban đầu về điều khiển mờ [48], nhưng trong vài năm gần đây, phương thức B được sử dụng nhiều hơn [65, 66]

1.3 Sơ lược về thuật giải di truyền (Genetic Algorithms, GAs)

GAs là các giải thuật tìm kiếm các lời giải cho các bài toán thực tế sử dụng các nguyên lý lấy cảm hứng từ lý thuyết di truyền học tự nhiên [67, 68] Ý tưởng cơ bản

là tạo ra một quần thể gồm các cá thể (biểu diễn các lời giải khả thi cho bài toán cần giải) có thể tiến hóa qua quá trình đấu tranh sinh tồn và chọn lọc GAs thường bắt đầu với một quần thể gồm các cá thể được khởi tạo một cách ngẫu nhiên và tiến hóa dần thành các cá thể tốt hơn thông qua việc áp dụng các toán tử di truyền mô phỏng theo quá trình di truyền trong tự nhiên Quần thể sẽ tiến hóa thông qua quá trình chọn lọc

tự nhiên

Suốt quá trình lặp liên tiếp (được gọi là các thế hệ), các cá thể trong quần thể sẽ được đánh giá theo độ thích nghi của chúng và từ đó sẽ hình thành một quần thể mới thông qua cơ chế chọn lọc và các toán tử di truyền như lai ghép và đột biến Một hàm đánh giá hay hàm thích nghi phải được xác định cho từng vấn đề cần giải quyết Hàm đánh giá hay thích nghi sẽ trả về một số duy nhất ứng với mỗi cá thể (có thể là lời giải cho vấn đề), thể hiện sự thích nghi của cá thể với bài toán đặt ra

Mặc dù GAs không được thiết kế đặc biệt cho máy học, nhưng vì GAs là giải thuật tìm kiếm toàn cục nên có lợi thế khi được áp dụng vào máy học Nhiều phương pháp máy học dùng để tìm kiếm một mô hình tốt trong một không gian các mô hình, chẳng hạn như tìm một cơ sở luật tốt trong không gian các luật Những phương pháp này có thể dùng để giải các vấn đề tìm kiếm hoặc các vấn đề tối ưu cơ bản GAs thực hiện tìm kiếm trong không gian của mô hình bằng cách biểu diễn mỗi mô hình thành một nhiễm sắc thể (cá thể) Các cách biểu diễn khác nhau cho một nhiễm sắc thể làm cho GAs linh hoạt hơn Quá trình học bằng giải thuật di truyền gồm các cấp độ phức tạp khác nhau tùy thuộc những thay đổi về cấu trúc của các giải thuật, từ trường hợp đơn giản nhất là tối ưu hóa các tham số đến trường hợp phức tạp nhất là học các luật của FRBSs

Khi áp dụng GAs để giải một bài toán, ta cần xác định các yếu tố sau:

Trang 26

 Biểu diễn di truyền (vấn đề cần giải quyết) gọi là kiểu gen (genotype) cho

các giải pháp của bài toán gọi là kiểu hình (phenotype)

 Cách khởi tạo quần thể ban đầu của các giải pháp

 Một hàm đánh giá còn gọi là hàm thích nghi (fitness function) trả về giá trị

cho các nhiễm sắc thể

 Các toán tử di truyền sửa đổi các cấu tạo di truyền của các con cháu trong

quá trình sinh sản

 Các giá trị của các tham số cần sử dụng như kích thước của quần thể, xác

suất áp dụng các toán tử di truyền, v.v

Hình 1.3 Minh họa một thuật giải GA căn bản

t := t + 1

Khởi tạo P(t=0) Đánh giá P(t) Chọn các cá thể cha mẹ từ P(t)

Lai ghép các cá thể cha mẹ thành các cá thể con cháu Đột biến các cá thể con cháu

Xuất Phương án/Lời giải

Đưa các cá thể con cháu vào P( t + 1)

Trang 27

Khi xem xét các FRBSs, dựa vào cách học các luật, ta có hai cách tiếp cận sử dụng các thuật giải di truyền khác nhau trong việc mã hóa các luật của quần thể [11]:

 Phương pháp Pittsburgh: trong đó mỗi cá thể đại diện cho một tập luật [69]

 Các phương pháp tiếp cận, trong đó mỗi cá thể mã hóa một luật duy nhất, và tập luật được tạo ra bằng cách kết hợp một vài cá thể trong quần thể

Theo hướng tiếp cận này, có ba phương pháp đã được đề xuất :

 Phương pháp Michigan: trong đó mỗi cá thể được mã hóa thành một luật duy

nhất Các hệ thống thuộc loại này thường được gọi là các hệ thống học phân lớp Các hệ thống này là các hệ thống dựa trên luật, có sử dụng học tăng cường

và sử dụng GAs để học các luật chi phối các hoạt động trong một môi trường nhất định [12]

 Phương pháp IRL (Iterative Rule Learning): trong đó mỗi nhiễm sắc thể đại

diện cho một luật, nhưng giải pháp cuối cùng là cá thể tốt nhất tìm được và là lời giải toàn cục được tìm ra khi thuật toán được chạy nhiều lần để tìm kiếm những cá thể tốt nhất MOGUL [70, 71], SLAVE [72] đề xuất các phương pháp theo hướng này

 Phương pháp "hợp tác-cạnh tranh" (The “cooperative-competitive”

approach): trong đó toàn bộ hoặc một tập hợp con của quần thể tạo thành cơ

sở luật COGIN [73], REGAL [74] là những ví dụ đại diện cho hướng này

1.4 Hệ thống dựa trên luật mờ di truyền

(Genetic Fuzzy Rule-Based Systems, GFRBSs)

Một số bài báo gần đây đã đề cập đến việc tự động tạo ra Cơ sở Tri thức (KB) từ

dữ liệu số cho một FRBS bằng cách sử dụng GAs Vấn đề mấu chốt là sử dụng một quá trình học bằng GAs để tự động hóa việc thiết kế KB và quá trình đó được xem như là một bài toán tìm kiếm tối ưu Việc tìm kiếm một KB thích hợp cho một vấn đề (bài toán) đang quan tâm là tương đương với việc tham số hóa KB (các luật và các hàm thuộc), và tìm kiếm giá trị tối ưu của các tham số đó Các tham số của KB tạo thành một không gian cần tối ưu hóa, sẽ được chuyển đổi thành các biểu diễn gen phù hợp để có thể thực hiện quá trình tìm kiếm trên đó

Trang 28

Bước đầu tiên trong việc thiết kế một GFRBS là quyết định xem các bộ phận nào của KB cần được tối ưu bằng GAs KB của một FRBS thường là sự kết hợp các thành phần khác nhau

Ví dụ: KB của một FRBS theo mô hình Mamdani (xem hình 1.1) bao gồm hai thành phần:

 Cơ sở Dữ Liệu (DB): chứa định nghĩa của các hàm tỷ lệ của các biến đầu vào,

đầu ra và các hàm thuộc của các tập mờ tương ứng với các nhãn ngôn ngữ

 Cơ sở Luật (RB): tập các luật mờ

Quyết định xem thành phần nào của KB cần được tối ưu thì phụ thuộc vào hai mục tiêu mâu thuẫn nhau: kích thước của dữ liệu và tính hiệu quả của việc tìm kiếm bằng GAs Một không gian tìm kiếm có kích thước nhỏ hơn thì sẽ dễ dàng tìm kiếm nhanh hơn và quá trình học cũng đơn giản hơn, nhưng các lời giải đạt được có thể chỉ

là tối ưu cục bộ Nếu không gian tìm kiếm gồm toàn bộ KB và dữ liệu là đầy đủ thì

có nhiều khả năng chứa giải pháp tối ưu hơn, nhưng quá trình tìm kiếm có thể chậm

và kém hiệu quả hơn Với những nhận xét trên thì rõ ràng cần có một sự cân bằng giữa sự đầy đủ và kích thước của không gian tìm kiếm với tính hiệu quả của giải thuật tìm kiếm Điều này dẫn đến các khả năng khác nhau để thiết kế GFRBSs và sẽ được xem xét chi tiết hơn trong các phần dưới đây

Trước hết, cần phân biệt giữa việc tinh chỉnh, việc tinh giản và việc học một FRBS:

 Việc tinh chỉnh có liên quan tới việc tối ưu hóa của một FRBS hiện có, trong khi việc học liên quan tới phương pháp thiết kế tự động ngay từ đầu các luật

mờ Quá trình tinh chỉnh giả định rằng RB đã được xác định trước và mục tiêu

là tìm kiếm một tập hợp các tham số tối ưu của DB cho các hàm thuộc và/hoặc hàm tỷ lệ (Hình 1.5)

 Quá trình học tập thực hiện tìm kiếm phức tạp trong không gian các cơ sở luật (RB) hoặc toàn bộ Cơ sở Tri thức (KB)

Hình 1.4 minh họa một phương pháp dùng GAs để xây dựng FRBS, gọi là phương pháp Pittsburgh Trong phương pháp này, người ta sử dụng một hệ thống phát sinh ra các cơ sở luật (RB) để khởi tạo một quần thể ban đầu để có thể áp dụng

Trang 29

GAs Các RB này sẽ lần lượt được đánh giá bởi một hệ thống đánh gía nhờ đầu vào

từ môi trường và kết quả thực thi của đầu ra trong môi trường thực tế Quá trình này được thực hiện bằng GAs qua nhiều thế hệ của các RB Kết quả cuối cùng là một RB tối ưu cần tìm, cũng từ đó ta có được FRBS tối ưu cho bài toán Một nhược điểm của phương pháp này là chi phí thời gian sẽ nhiều khi không gian tìm kiếm của bài toán lớn

Quần thể các cơ sở luật

Cơ sở luật

Cơ sở Luật

Bộ suy diễn

Sự kiện Đầu ra Đầu vào

Quy trình

tinh chỉnh

Mô-đun đánh giá (DB)

DB

RB (đã xác

định trước)

Hình 1.4 Học theo phương pháp tiếp cận Pittsburgh

Hình 1.5 Sơ đồ quy trình tinh chỉnh DB

Trang 30

Hình 1.6 minh họa một phương pháp khác dùng GAs để xây dựng FRBS, gọi là phương pháp Michigan Trong phương pháp này, người ta sử dụng một cơ chế tạo một cơ sở luật (RB) và một hệ thống phân phối độ tin cậy cho các luật dựa trên cơ chế thưởng phạt và thông tin đầu ra so với môi trường RB sẽ tiến hóa qua nhiều thế

hệ bằng Gas để đạt một RB tối ưu cuối cùng, cũng từ đó ta có được FRBS tối ưu cho bài toán Phương pháp Michigan thường dùng để giải các bài toán phân lớp dữ liệu

1.4.1 Tinh chỉnh bằng GAs

Tinh chỉnh các hàm tỷ lệ và hàm thuộc mờ là một nhiệm vụ quan trọng trong thiết kế FRBSs Hàm tỷ lệ và hàm thuộc được tinh chỉnh bởi GAs theo một hàm thích nghi (hàm fitness) đã được xác định trước Như đã nói ở trên, quá trình tinh chỉnh giả định rằng RB đã được xác định và mục tiêu là tìm kiếm một tập hợp các tham số tối ưu cho các thuộc và/hoặc các hàm tỷ lệ (Hình 1.5)

Bộ suy diễn Engine Các sự kiện Đầu ra

Trang 31

Hàm tỷ lệ được áp dụng cho các biến đầu vào và đầu ra của FRBSs để chuẩn hóa miền xác định, miền giá trị Thông thường, các hàm tỷ lệ gồm một tham số đơn [75] hoặc là gồm hai tham số, một cận trên và một cận dưới [76] trong trường hợp tuyến tính, hoặc gồm một số tham số co/giãn trong trường hợp không tuyến tính [77, 78] Cách tiếp cận thông thường là tinh chỉnh từ một đến bốn tham số (được định nghĩa trong hàm tỷ lệ) cho mỗi biến: một tham số trong hàm tỷ lệ đơn, hai tham số trong hàm tỷ lệ tuyến tính, và từ ba hoặc bốn tham số trong hàm tỷ lệ phi tuyến Hầu hết các công trình nghiên cứu đều xem xét việc mã hóa bằng số thực các tham số của hàm tỷ lệ, nhưng cũng có thể sử dụng mã nhị phân, như trong [75], ba bit nhị phân biểu diễn một tham số của mỗi hàm tỷ lệ được sử dụng Do số lượng các biến, cũng như số lượng các tham số đã được xác định nên cách tiếp cận này sẽ cần một số lượng bit cố định để mã hóa

1.4.3 Tinh chỉnh hàm thuộc

Khi tinh chỉnh hàm thuộc, một cá thể được sử dụng để biểu diễn toàn bộ DB với

tư cách là một nhiễm sắc thể mã hóa các hàm thuộc (tương ứng với các nhãn ngôn ngữ trong mỗi phân vùng mờ của FRBS) Các dạng phổ biến nhất cho các hàm thuộc (trong GFRBSs) là hình tam giác cân trong [78, 79] hoặc không cân trong [58, 80], hình thang [81, 82], hàm Gauss [83, 84] Số lượng các tham số cho mỗi hàm thuộc thường dao động từ một đến bốn, mỗi tham số là có thể được mã hóa thành số nhị phân [85] hoặc số thực [86]

Cấu trúc của nhiễm sắc thể sẽ khác nhau tùy thuộc vào FRBSs đó sử dụng các biến ngôn ngữ (mô hình ngôn ngữ) hoặc sử dụng các biến mờ (mô hình xấp xỉ) Khi tinh chỉnh các hàm thuộc trong một mô hình ngôn ngữ [58], toàn bộ các phân vùng

mờ được mã hóa thành nhiễm sắc thể và được tinh chỉnh sao cho vẫn duy trì ngữ nghĩa trong RB Những cách tiếp cận này thường xem xét một số lượng các nhãn ngôn ngữ được định trước cho mỗi biến (không cần phải là giống nhau cho tất cả các biến) Điều này dẫn đến việc mã hóa hàm thuộc với chiều dài mã cố định Nhưng ngay cả với chiều dài mã cố định, thì số lượng nhãn ngôn ngữ liên quan đến mỗi biến vẫn có thể khác nhau, bằng cách đơn giản là định nghĩa số lượng tối đa chiều dài của

Trang 32

mã này Đây là quan niệm của [87] khi thiết kế một hệ thống TSK (đã đề cập ở mục

1.2.3.2) với các biến đầu vào ngôn ngữ

1.4.4 Học Cơ sở luật bằng GAs

Việc học RB thường giả định rằng tập các hàm thuộc trong DB đã được xác định trước Các hàm này tương ứng với các nhãn ngôn ngữ liên kết với các luật mờ trong

RB (Hình 1.7) Điều này chỉ áp dụng cho FRBSs theo mô hình ngôn ngữ, trong mô hình xấp xỉ, tinh chỉnh các luật tương đương với việc hiệu chỉnh các hàm thuộc (xem phần tiếp theo)

Ba phương pháp học được mô tả trong phần trước có thể được xem xét để học RB: phương pháp Michigan [88, 89, 90], phương pháp Pittsburgh [91, 92, 93], và phương pháp học lặp [58, 70, 72] RB có thể được biểu diễn bởi một ma trận quan hệ [93], một bảng quyết định [92], hoặc một danh sách các luật [91, 94, 95]

Các biểu diễn bằng ma trận quan hệ và bảng quyết định chỉ hữu ích khi hệ thống

đã được rút gọn số lượng của các biến, vì khi có hơn hai hoặc ba biến đầu vào thì có thể sẽ dẫn đến sự cố là kích thước bộ nhớ không còn đủ Do đó các phương pháp Pittsburgh có thể quản lý theo một mã khối Biểu diễn bằng danh sách các luật được

sử dụng nhiều nhất, áp dụng các mã hóa khác nhau cho các luật riêng biệt, và có thể được tinh chỉnh với ba phương pháp học đã đề cập ở trên Thường thì số lượng các luật trong danh sách thay đổi nhưng trong một số trường hợp, số lượng này sẽ được chặn trên Một cách tiếp cận phổ biến để mã hóa các luật là sử dụng dạng nối rời chính tắc (DNF) biểu diễn trong các hình thức của một chuỗi nhị phân chiều dài cố định [54, 72, 95] Để biểu diễn cấu trúc của một danh sách các luật, một nhiễm sắc thể có thể được tạo ra bằng cách nối các mã của các luật riêng biệt Trong cách tiếp cận Pittsburgh, mỗi nhiễm sắc thể mã hóa một Cơ sở luật RB hoặc trong cách tiếp cận Michigan, mỗi nhiễm sắc thể sẽ mã hóa một luật duy nhất

Trang 33

Hình 1.9 Quy trình học RB, sau đó học DB

Quy trình

học

Mô-đun đánh giá (RB)

RB

DB (đã xác định trước)

Qui trình học 1

Mô-đun đánh giá (RB)

RB

DB(đã xác

định trước)

Qui trình học 2

đánh giá (DB)

DB

RB

ed

Chiều dài cố định (Số các biến đầu vào và đầu ra)

Biến đầu vào thứ 1 Biến đầu ra cuối cùng

Giá trị ……… Giá trị

Biến , Giá trị ……… Biến , Giá trị

Chiều dài thay đổi

Trang 34

Hình 1.10 Sơ đồ quy trình học KB

Các luật bao gồm các mệnh đề của các biến dạng giá trị, trong đó biến có thể được xác định bởi vị trí hoặc nhãn (tên biến), và giá trị có thể có các dạng khác nhau (Hình 1.8) Khi sử dụng một mã vị trí (Hình 1.8, hàng đầu), các thông tin (giá trị) liên quan đến biến đó là vị trí của biến đó Khi sử dụng mã phi-vị trí (Hình 1.8, hàng cuối), mã của một luật bao gồm các cặp (tên biến, giá trị) Trong cả hai trường hợp, mã vị trí và

mã phi-vị trí, nội dung của phần giá trị có thể là: nhãn của một từ ngôn ngữ (của biến ngôn ngữ), mã nhị phân của một cấu trúc DNF (của biến ngôn ngữ), tham số xác định tập mờ (biến mờ) hoặc các giá trị thực (các hệ số) của đầu ra tuyến tính (đầu ra biến

của các luật theo mô hình TSK)

Ngoài việc học RB, cách tiếp cận khác nhằm hoàn thiện DB ban đầu sau khi RB

đã được tạo ra [70] Quá trình đó bao gồm một quá trình học để có tạo ra RB với một

DB đã được định nghĩa, tiếp theo là một quá trình học tương tự như mô tả trong ở phần trước đây Trong trường hợp này, quá trình điều chỉnh liên quan đến việc học tập DB được gọi là hậu học DB Hình 1.9 cho thấy cách tiếp cận này

1.4.5 Học Cơ sở Tri thức bằng GAs

Vì việc học KB bằng GAs liên quan đến các không gian tìm kiếm không đồng nhất (Hình 1.10) nên việc mã hóa KB bao gồm các biểu diễn di truyền khác nhau chẳng hạn như các nhiễm sắc thể có chiều dài thay đổi, nhiễm sắc thể gồm nhiều bộ gen và mỗi nhiễm sắc thể chỉ mã hóa một luật duy nhất thay vì mã hóa toàn bộ KB Chi phí tính toán cho việc tìm kiếm bằng giải thuật di truyền sẽ tăng lên, tỷ lệ thuận

Quy trình học

Mô-đun đánh giá (KB)

KB

Trang 35

với sự tăng lên của độ phức tạp của không gian tìm kiếm Trong GFRBs, người ta thường chọn giải pháp mã hóa từng luật riêng biệt hơn là mã hóa toàn bộ KB thành một nhiễm sắc thể, nhằm tạo ra một không gian phức tạp và linh động các luật để việc tìm kiếm một lời giải có thể khả thi và hiệu quả Một lần nữa, việc học có thể xem xét bởi ba phương pháp như: Michigan [96, 97], Pittsburgh [14, 87, 99, 100, 101], và phương pháp học luật lặp [58, 60]

Một số đề xuất học KB bao gồm các FRBSs theo mô hình Mamdani-xấp xỉ với phân hoạch phân tán [15, 97, 98, 102], các FRBSs theo mô hình Mamdani dùng ngôn ngữ (các hàm tỷ lệ và các luật [100] hoặc các hàm thuộc và các luật [101], và hệ thống

mờ dạng TSK [16, 87, 103]

Cách mã hóa KB trong các hệ thống có các biến ngôn ngữ liên quan đến việc mã hóa các luật và các hàm tỷ lệ/các hàm thuộc thành các bộ phận độc lập của một nhiễm sắc thể, hoặc sử dụng lặp đi lặp lại nhiều nhiễm sắc thể khác nhau [104] Việc mã hóa này gồm các bước:

 Mã hóa RB (có thể được xem xét bất kỳ phương pháp cho các biến ngôn ngữ được mô tả ở mục 1.4.4)

 DB sẽ được mã hóa tương tự như mô tả tại các mục (1.4.1-1.4.3)

Liên quan chặt chẽ đến sơ đồ mã hóa, quá trình lai ghép các mã di truyền của hai

cá thể cha mẹ liên quan đến các nhiễm sắc thể có chứa cấu trúc con (các luật và DB)

có thể được xử lý theo các cách khác nhau:

 Hợp nhất các cấu trúc con có cùng kiểu [87]

 Áp dụng một quá trình song song cho hai cấu trúc con thuộc hai bộ phận không liên quan [101]

 Áp dụng một quá trình tuần tự khi hai cấu trúc con liên quan, trong đó hai cấu trúc đó được lai ghép nhau [100]

1.4.6 Tóm tắt các phương pháp tiếp cận cổ điển cho GRBFS

Các cách tiếp cận để tiến hóa FRBSs bằng GAs là:

 Tinh chỉnh DB bằng GAs

 Tinh chỉnh RB bằng GAs

 Tinh chỉnh KB bằng GAs

Trang 36

Mặc dù tóm tắt trên là không đầy đủ, nhưng phần này đã tổng kết các phương pháp tiếp cận quan trọng nhất

1.5 Động cơ nghiên cứu

Hiện nay các nhà nghiên cứu quan tâm đến hai mục tiêu của FRBSs là:

 Tính diễn giải được là tính chất phụ thuộc vào cấu trúc của mô hình (càng đơn giản càng tốt), số luật (càng nhỏ càng tốt), số điều kiện trong phần tiền đề của luật (càng ít càng tốt), số nhãn cho mỗi biến là tối ưu, dạng của hàm thuộc,…

 Tính chính xác cao: sai số nhỏ khi ứng dụng

Tính diễn giải được là khả năng biểu diễn các hệ thống thuộc thế giới thực theo cách mà con người có thể hiểu được, giải thích được và có thể sử dụng các luật của

hệ thống một cách dễ dàng Do đó tính diễn giải được của một hệ thống là một tính

chất mang tính chủ quan, nên cho tới hiện nay người ta vẫn chưa đưa ra được một độ

đo cho tính chất này mà được chấp nhận bởi nhiều nhà nghiên cứu [3] Đây là một

vấn đề vẫn đang được nghiên cứu [1, 2] Vì vậy các nhà nghiên cứu thường chỉ đề

cập đến vài yếu tố đặc trưng cho tính diễn giải được của hệ thống như đã đưa ra ở trên trong các nghiên cứu của mình [1, 2, 3] Đây cũng là cách tiếp cận của đề tài về

tính diễn giải được nên luận án sẽ quan tâm đến một số yếu tố đặc trưng của tính diễn giải được Cụ thể là luận án đưa ra cách thiết kế các FRBSs có tính chính xác cao nhưng lại có cấu trúc đơn giản thể hiện qua bộ luật gọn nhẹ nhưng hiệu quả (số luật

ít, số điều kiện trong phần tiền đề của luật ít), số nhãn cho mỗi biến là tối ưu, dạng của hàm thuộc thống nhất Điều này được thể hiện qua sáu mô hình của luận án Ngoài ra, hai tính chất này thường mâu thuẫn nhau, nghĩa là nếu tính chính xác của FRBSs tăng lên thì tính diễn giải được sẽ bị giảm đi và ngược lại Do đó, vấn đề

là ta cần tìm một thỏa hiệp tốt nhất giữa hai tính chất này Nói một cách khác, ta cần tìm một thỏa hiệp (ranh giới) tối ưu cho hai tính chất này cho mỗi FRBS cụ thể; trong

đó tính chất chính xác và tính diễn giải được đều cùng tương đối tối ưu

Hình dưới đây cho một minh họa về các giai đoạn thiết kế các hệ thống mờ

Trang 37

- Vào đầu thập niên 70-80 [3], các hệ thống mờ được thiết kế bởi các chuyên gia, thường là các hệ dựa trên luật dùng ngôn ngữ tự nhiên, có tính diễn giải được cao nhưng có tính chính xác không cao

- Vào đầu những năm 90 [3], các hệ thống mờ được thiết kế tự động từ dữ liệu

số, có tính chính xác cao nhưng có tính diễn giải được thấp Các nhà nghiên cứu đã đề xuất các phương pháp thiết kế các hệ thống mờ bằng mạng nơron,

GA, v.v…

- Vào cuối những năm 90 và đến hiện nay [3], các nhà nghiên cứu đã đề cập các

hệ thống mờ đa mục tiêu và hai mục tiêu chủ yếu cần đạt được là tính diễn giải được cao và tính chính xác cao Tuy nhiên hai mục tiêu này là mâu thuẫn nhau,

do đó cần tìm một thỏa hiệp (ranh giới) tối ưu cho hai mục tiêu này trong một

hệ thống mờ Cụ thể là làm thế nào để tìm được ngưỡng tối đa e0 của tính chính xác mà không làm giảm tính diễn giải được và tìm được ngưỡng tối đa i0 của tính diễn giải được mà không làm giảm tính chính xác Khi đó cặp (e0, i0) sẽ là ranh giới tối ưu cần tìm

Hình 1.11 Các giai đoạn thiết kế các hệ thống mờ

Hệ thống mờ có tính diễn giải cao

Hệ thống mờ có tính chính xác cao

Xây dựng và huấn luyện hệ thống mờ có tính chính xác cao vào đầu những năm 90s

vào cuối những năm 90s-đến nay

Hệ thống mờ có tính diễn giải cao

được tạo ra và được hiệu chỉnh thủ

công

vào những năm 70s-80s

Trang 38

Để thực hiện điều này, đầu tiên ta cần cụ thể hóa tính chính xác qua một tiêu chuấn

kiểm nghiệm (test data) Giá trị sai số của một mô hình trong các thực nghiệm của luận án là một trong các giá trị MSE, NDEI hay PI tùy thuộc yêu cầu của bài toán đó Tiếp theo, ta cần cụ thể hóa tính diễn giải được qua một tiêu chuẩn cụ thể nào đó để

dễ đánh giá vì như đã đề cập ở trên tính diễn giải được phụ thuộc nhiều yếu tố Giả

số luật thấp hơn thì tính diễn giải sẽ cao hơn

Trong thực tế [3], mỗi bài toán đa mục tiêu thường tồn tại nhiều cặp tối ưu (e, i)

hơn hay bằng cặp (e2, i2), ký hiệu là (e1, i1) ≥ (e2, i2) nếu và chỉ nếu e1 ≥ e2 và i1 ≥ i2

Có thể kiểm tra quan hệ này là một quan hệ thứ tự bộ phận Lưu ý rằng về mặt lý

sánh được với nhau nếu (e1 > e2 mà i2 > i1)hoặc (e2 > e1 mà i1 > i2) Hơn nữa, theo

nó cũng chính là phần tử tối đại của quan hệ đó Ngoài ra trong một quan hệ thứ tự

bộ phận thì có thể có nhiều phần tối đại (nếu tồn tại) nên cũng sẽ có nhiều ranh giới tối ưu (e, i) cần tìm Tuy nhiên vì không gian tìm kiếm củ a các bài toán đa mục tiêu thường rất lớn nên hoàn toàn không dễ gì tìm kiếm một cặp (i, e) tối ưu Do đó nhà các nhà nghiên cứu đưa ra các phương pháp sử dụng GA, mạng nơron, v.v…để tìm

một cặp (i, e) xấp xỉ tối ưu

Đây cũng là hướng tiếp cận của luận án, luận án đã đề xuất sáu mô hình để giải quyết vấn đề này Việc so sánh tính diễn giải được và tính chính xác của sáu mô hình đề xuất với các kết quả của các tác giả khác sẽ được thuyết minh chi tiết trong các thực nghiệm trong chương 2 và chương 3

Trang 39

Các kỹ thuật tính toán thông minh như mạng nơron nhân tạo (Artificial Neural Networks, ANNs)[105], logic mờ (Fuzzy Logic, FL) [106], các thuật giải di truyền (Genetic Algorithms, GAs) [17, 107] là những đề tài đang được nghiên cứu rất phổ biến hiện nay Các kỹ thuật này được nghiên cứu rất nhiều vì cho phép giải được các bài toán phức tạp mà thông thường không giải được bằng các phương pháp cổ điển [18]

Gần đây, các nhà nghiên cứu các kỹ thuật tính toán thông minh đang quan tâm đến các hướng tiếp cận “lai” Một trong các hướng này là sự kết hợp giữa FL và GAs dẫn đến sự ra đời của các hệ thống di truyền mờ (Genetic Fuzzy Systems, GFSs) [11, 58] Hệ thống mờ (Fuzzy Systems, FSs) là một ứng dụng quan trọng nhất của LF FSs là một công cụ quan trọng để mô hình hóa những bài toán thực tế có tính phức tạp và không chính xác cao mà không thể mô hình hóa bằng các phương pháp cổ điển FSs là các hệ thống dựa trên các luật mờ (Fuzzy Rule-Based Systems, FRBSs) FRBSs là sự mở rộng của các hệ thống dựa trên luật cổ điển FRBSs gồm các luật

“IF-THEN” mà phần tiên đề và phần kết luận của luật sử dụng logic mờ FRBSs đã

chứng tỏ có thể giúp giải quyết các bài toán về điều khiển [108], mô hình hóa [43], phân lớp, khai thác dữ liệu ([19, 20]) GAs đã và đang được sử dụng rộng rãi và phổ biến như là một kỹ thuật tìm kiếm toàn cục GAs cho phép tìm kiếm lời giải thích hợp trong những không gian tìm kiếm lớn, phức tạp nhưng GAs chỉ cần một hàm thích nghi (Fitness function) để tối ưu hóa tìm kiếm

Do đó, gần đây GAs được sử dụng trong quá trình học và hiệu chỉnh các thành phần của một FRBS Một hệ thống như vậy gọi là hệ thống dựa trên luật mờ di truyền (Genetic Fuzzy Rule-Based Systems, GFRBSs) [11]

Điều này cho phép xây dựng các GFRBSs vừa tinh giản, vừa hiệu quả để giải các bài toán thực tế trong các hệ thống có tính chất phức tạp và không chắc chắn Đây cũng chính là mục tiêu của luận án, sẽ đề cập chi tiết hơn ở mục tiếp sau đây

1.6 Mục tiêu và phạm vi nghiên cứu

FRBSs cung cấp một công cụ hiệu quả để mô tả và xử lý vấn đề trong thế giới thực có tính chất không chắc chắn và không chính xác Do đó các FRBSs được áp dụng vào các vấn đề điều khiển, phân lớp và mô hình hóa Thành phần quan trọng

Trang 40

nhất của FRBSs là Cơ sở Tri thức (KB) KB bao gồm hai bộ phận: Cơ sở Dữ Liệu (DB) và Cơ sở Luật (RB) DB bao gồm tập các nhãn ngôn ngữ và các hàm thuộc xác định ý nghĩa của chúng RB bao gồm tập các luật mờ “IF-THEN” với tiền đề và kết luận được biểu diễn bằng ngôn ngữ tự nhiên, và các luật này kết nối bằng toán tử

"also" Điều đó có nghĩa là những các luật sẽ được kích hoạt đồng thời với cùng một

dữ liệu đầu vào Nhiều phương pháp đã được đề xuất để xây dựng tự động KB ban đầu từ dữ liệu số

 Các hướng nghiên cứu đầu tiên tập trung vào việc học RB từ một DB được xác định trước [21, 72] Hiệu quả hoạt động của FRBS chịu ảnh hưởng rất nhiều từ

DB được xác định trước

 Các hướng nghiên cứu thứ hai tập trung vào việc cải thiện hiệu suất của FRBS bằng cách tinh chỉnh DB ban đầu sau khi RB đã được tạo ra [58, 109] Quá trình này chỉ điều chỉnh các tham số của các hàm thuộc nhưng không thay đổi số lượng về các nhãn ngôn ngữ trong mỗi phân hoạch mờ nên RB sẽ không bị thay đổi

 Các hướng nghiên cứu thứ ba tập trung vào việc học để tạo ra các thành phần khác nhau cho KB ban đầu từ dữ liệu số [15, 98]

Mỗi phương pháp đều có ưu, nhược điểm thể hiện bằng những công trình nghiên cứu và các thực nghiệm liên quan Từ việc khảo sát phân tích những phương pháp này, dựa trên những giải pháp khả thi đã được công bố trên thế giới, hướng tiếp cận chính của luận án là xây dựng một hệ suy diễn mờ tinh giản nhưng vẫn có tính hiệu quả cao

Để luận án mang tính khả thi cả về lý thuyết lẫn thực tiễn và mang lại kết quả như mong muốn, tác giả đã thực hiện:

1) Nghiên cứu và phát triển Cơ sở lý thuyết cho việc xây dựng một hệ suy diễn

mờ, cụ thể là một hệ thống dựa trên luật mờ di truyền (GFRBSs) với cấu trúc tinh giản nhưng vẫn hiệu quả cao trong ứng dụng thực tế Nói cách khác, hệ thống này thỏa mãn hai mục tiêu là có tính diễn giải cao và có độ chính xác cao

Định dạng
Số trang	148
Dung lượng	7,45 MB