1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tinh giản các luật trong hệ suy diễn với hệ thống có thông tin mờ

148 239 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 148
Dung lượng 7,45 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Tính diễn giải được cao của hệ thống mờ phụ thuộc một số yếu tố như cấu trúc của mô hình của hệ thống, số luật là nhỏ, số điều kiện trong phần tiền đề luật là ít, số nhãn ngôn ngữ ch

Trang 1

HUỲNH MINH TRÍ

TINH GIẢN CÁC LUẬT TRONG HỆ SUY DIỄN VỚI HỆ THỐNG CÓ THÔNG TIN MỜ

Chuyên ngành: KHOA HỌC MÁY TÍNH

Mã số chuyên ngành: 62.48.01.01

Phản biện 1: PGS.TSKH Bùi Công Cường Phản biện 2: PGS.TS Vũ Thanh Nguyên Phản biện 3: PGS.TS Lê Hoàng Thái Phản biện độc lập 1: GS.TS Phan Thị Tươi Phản biện độc lập 2: PGS.TS Trần Đình Khang Phản biện độc lập 3: PGS.TS Đàm Gia Mạnh

NGƯỜI HƯỚNG DẪN KHOA HỌC:

1 PGS.TSKH NGUYỄN XUÂN HUY

2 PGS TS LÊ HOÀI BẮC

TP.HỒ CHÍ MINH – 2014

Trang 2

MỤC LỤC

MỤC LỤC 3

DANH MỤC CÁC HÌNH 8

DANH MỤC CÁC TỪ VIẾT TẮT 9

CAM ĐOAN 10

LỜI CẢM ƠN 11

MỞ ĐẦU 12

Chương 1 TỔNG QUAN VÀ CÁC KIẾN THỨC CƠ SỞ 16

1.1 Giới thiệu 16

1.2 Các kiến thức cơ bản về hệ suy diễn mờ 17

1.2.1 Hệ suy diễn mờ 18

1.2.2 Logic mờ và hệ thống mờ 18

1.2.3 Phân loại các hệ suy diễn mờ 20

1.2.3.1 Các hệ thống luật mờ dạng Mamdani 20

1.2.3.2 Các hệ thống luật mờ dạng Takagi-Sugeno-Kang 23

1.2.3.3 Các thành phần của hệ thống luật dạng Mamdani 24

1.3 Sơ lược về thuật giải di truyền (Genetic Algorithms, GAs) 28

1.4 Hệ thống dựa trên luật mờ di truyền 30

1.4.1 Tinh chỉnh bằng GAs 33

1.4.2 Tinh chỉnh hàm tỷ lệ 33

1.4.3 Tinh chỉnh hàm thuộc 34

1.4.4 Học Cơ sở luật bằng GAs 35

1.4.5 Học Cơ sở Tri thức bằng GAs 37

1.4.6 Tóm tắt các phương pháp tiếp cận cổ điển cho GRBFS 38

1.5 Động cơ nghiên cứu 39

1.6 Mục tiêu và phạm vi nghiên cứu 42

1.7 Cấu trúc của luận án 46

Chương 2 PHƯƠNG PHÁP XÂY DỰNG HỆ SUY DIỄN MỜ TINH GIẢN, HIỆU QUẢ 48

2.1 Giới thiệu 48

2.2 Phương pháp TMH: khởi tạo hệ suy diễn mờ ban đầu từ dữ liệu số 52

2.2.1 Khởi tạo DB ban đầu 52

2.2.2 Khởi tạo RB ban đầu: 62

Trang 3

2.2.3 Mờ hóa và Giải mờ: 63

2.3 Tinh giản, tinh chỉnh Cơ sở Tri thức (KB) ban đầu: 64

2.3.1 Hàm mục tiêu: 65

2.3.2 Mã hóa KB: 66

2.3.3 Quần thể ban đầu: 68

2.3.4 Toán tử lai ghép: 68

2.3.5 Toán tử đột biến: 69

2.4 Phương pháp tìm số nhãn ngôn ngữ tối ưu cho các biến đầu vào, đầu ra 72

2.4.1 Quần thể ban đầu: 73

2.4.2 Toán tử lai ghép: 73

2.4.3 Toán tử đột biến: 74

2.4.4 Hàm mục tiêu: 74

2.4.5 Phương pháp tìm số nhãn tối ưu 1: 74

2.4.6 Phương pháp tìm số nhãn tối ưu 2: 75

2.5 Thực nghiệm và đánh giá: 76

2.5.1 Mô hình 1: 77

2.5.2 Mô hình 2: 79

2.5.3 Mô hình 3: 79

2.5.4 Mô hình 4: 80

2.5.5 Mô hình 5: 81

2.5.6 Mô hình 6: 82

2.5.7 Thực nghiệm 1: Bài toán đánh giá hương vị gạo 84

2.5.8 Thực nghiệm 2: Bài toán nhà máy hóa chất 88

2.5.9 Thực nghiệm 3: Bài toán chuỗi thời gian hỗn loạn 94

2.6 Tổng kết ý nghĩa sáu mô hình đề xuất của luận án 98

2.7 Sự khác biệt và mối quan hệ giữa hai quá trình tinh giản và tinh chỉnh hệ suy diễn trong sáu mô hình của luận án 100

2.7.1 Quá trình tinh giản hệ suy diễn 100

2.7.2 Quá trình tinh chỉnh hệ suy diễn 101

2.7.3 Mối quan hệ giữa tinh giản và tinh chỉnh hệ suy diễn 101

2.8 Kết luận chương 2: 102

Chương 3 PHƯƠNG PHÁP XÂY DỰNG TẬP DỮ LIỆU HUẤN LUYỆN RÚT GỌN 104

3.1 Giới thiệu: 104

3.2 Phương pháp sử dụng phân hoạch rõ để chọn tập RTR 106

Trang 4

3.2.1 Phân hoạch rõ của tập dữ liệu huấn luyện TR 106

3.2.2 Phương pháp dùng phân hoạch rõ để chọn RTR 107

3.3 Phương pháp sử dụng phân hoạch mờ để chọn tập RTR 109

3.3.1 Phân hoạch mờ của tập dữ liệu huấn luyện TR 109

3.3.2 Phương pháp dùng phân hoạch mờ để chọn RTR 111

3.4 Thực nghiệm và đánh giá 112

3.4.1 Thực nghiệm 1: Bài toán ước lượng chi phí bảo trì lưới điện 115

3.4.2 Thực nghiệm 2: Bài toán ước lượng chiều dài của đường dây điện trong lưới điện hạ thế ở các thành phố và nông thôn 120

3.5 Cơ sở về lý luận và ý nghĩa thực nghiệm của hai phương pháp chọn tập RTR bằng phân hoạch rõ và mờ 127

3.5.1 Cơ sở lý luận 127

3.5.2 Ý nghĩa thực nghiệm 128

3.6 Kết luận chương 3 130

Chương 4 KẾT LUẬN 132

4.1 Tổng kết các hướng tiếp cận của đề tài 132

4.1.1 Hướng tiếp cận thứ nhất: 132

4.1.2 Hướng tiếp cận thứ hai: 134

4.2 Các kết quả đạt được 134

4.2.1 Đóng góp thứ nhất: 135

4.2.2 Đóng góp thứ hai: 135

4.2.3 Đóng góp thứ ba: 135

4.2.4 Đóng góp thứ tư: 136

4.2.5 Đóng góp thứ năm: 137

4.3 Hướng phát triển của luận án 137

CÁC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN 138 TÀI LIỆU THAM KHẢO TIẾNG ANH 139

TIẾNG VIỆT 152

Trang 5

DANH MỤC CÁC BẢNG, BIỂU ĐỒ

Bảng 2.1 Các gia tử ngôn ngữ và các hàm tương ứng 67

Bảng 2.2 Các kết quả của các tác giả khác 85

Bảng 2.3 Các kết quả của sáu mô hình đề xuất với hàm thuộc là hàm tam giác 85

Bảng 2.4 Các kết quả của sáu mô hình đề xuất với hàm thuộc dạng hình chuông 86

Bảng 2.5 Các kết quả của sáu mô hình đề xuất với hàm thuộc hình thang 86

Biểu đồ 2.1 So sánh các kết quả của các tác giả khác với các kết quả của sáu mô hình đề xuất với hàm thuộc là hàm tam giác 87

Biểu đồ 2.2 So sánh các kết quả của các tác giả khác với các kết quả của sáu mô hình đề xuất với hàm thuộc dạng hình chuông 87

Biểu đồ 2.3 So sánh các kết quả của các tác giả khác với các kết quả của sáu mô hình đề xuất với hàm thuộc hình thang 88

Bảng 2.6 Các kết quả thực nghiệm bài toán lò đốt bằng gas của mô hình 2 đề xuất và các phương pháp khác (Bài toán Box và Jenkins) 91

Biểu đồ 2.4 Biểu đồ so sánh các giá trị PI* của bài toán lò đốt bằng gas của mô hình 2 đề xuất với các phương pháp khác (Bài toán Box và Jenkins) 91

Bảng 2.7 Các kết quả thực nghiệm bài toán lò đốt bằng gas của sáu mô hình đề xuất và của các phương pháp khác (Bài toán Box và Jenkins) 93

Bảng 2.8 Các kết quả bài toán chuỗi thời gian hỗn loạn của mô hình 2 đề xuất và của các phương pháp khác (Bài toán Mackey và Glass) 95

Biểu đồ 2.5 Biểu đồ so sánh các giá trị NDEI* của bài toán lò đốt bằng gas của mô hình 2 đề xuất và các phương pháp khác (Bài toán Box và Jenkins) 96

Bảng 2.9 Các kết quả bài toán chuỗi thời gian hỗn loạn của sáu mô hình đề xuất và của các phương pháp khác (Bài toán Mackey và Glass) 97

Bảng 3.1 Các kết quả của bài toán ước lượng chi phí bảo trì mạng lưới điện của các tác giả khác so với mô hình 2 của luận án 116

Biểu đồ 3.1 Biểu đồ so sánh các giá trị MSEtra, MSEtst của bài toán ước lượng chi phí bảo trì mạng lưới điện của các tác giả khác và mô hình 2 của luận án với tập huấn luyện RTR được tạo bởi phân hoạch rõ có p=0.3 117

Biểu đồ 3.2 Biểu đồ so sánh số luật (#R) của bài toán ước lượng chi phí bảo trì mạng lưới điện của các tác giả khác và mô hình 2 của luận án 117

Bảng 3.2 Các kết quả của bài toán ước lượng chi phí bảo trì mạng lưới điện của các tác giả khác [123], [93], [86] 118

Bảng 3.3 Các kết quả của bài toán ước lượng chi phí bảo trì mạng lưới điện của 118

sáu mô hình đề xuất với tập huấn luyện RTR được tạo bởi phân hoạch rõ có p=0.3 118

Bảng 3.4 Các kết quả của bài toán ước lượng chi phí bảo trì mạng lưới điện của sáu mô hình đề xuất với tập huấn luyện RTR được tạo bởi phân hoạch mờ có q=0.3 119

Biểu đồ 3.3 Biểu đồ so sánh số luật (#R) của bài toán ước lượng chi phí bảo trì mạng lưới điện của các tác giả khác và các mô hình của luận án 119

Trang 6

Biểu đồ 3.4 Biểu đồ so sánh các giá trị MSEtra, MSEtst của bài toán ước lượng chi phí bảo trì mạng lưới điện của các tác giả khác và các mô hình của luận án với tập huấn luyện RTR được tạo bởi phân hoạch rõ có p=0.3 và phân hoạch mờ có q=0.3 120 Bảng 3.5 Các kết quả của bài toán ước lượng chiều dài của đường dây điện trong lưới điện

hạ thế ở các thành phố và thị trấn của các tác giả khác và mô hình 2 của luận án với tập huấn luyện RTR được tạo bởi phân hoạch rõ có p=0.3 122 Biểu đồ 3.5 Biểu đồ so sánh các giá trị trung bình của MSEtra và MSEtst của bài toán ước lượng chiều dài của đường dây điện trong lưới điện hạ thế ở các thành phố và thị trấn nông thôn của các tác giả khác với mô hình 2 của luận án với tập huấn luyện RTR được tạo bởi phân hoạch rõ có p=0.3 123 Biểu đồ 3.5 Biểu đồ so sánh các kết quả #R (số luật) của bài toán ước lượng chiều dài của đường dây điện trong lưới điện hạ thế ở các thành phố và thị trấn nông thôn của các tác giả khác với mô hình 2 của luận án với tập huấn luyện RTR được tạo bởi phân hoạch rõ có p=0.3 124 Bảng 3.6 Các kết quả của bài toán ước lượng chiều dài của đường dây điện trong lưới điện

hạ thế ở các thành phố và thị trấn của các tác giả khác 124 Bảng 3.7 Các kết quả của bài toán ước lượng chiều dài của đường dây điện trong lưới điện

hạ thế ở các thành phố và nông thôn của các tác giả khác 125 Bảng 3.8 Các kết quả của bài toán ước lượng chiều dài của đường dây điện trong lưới điện

hạ thế ở các thành phố và nông thôn của các tác giả khác 125 Bảng 3.9 Các kết quả của bài toán ước lượng chiều dài của đường dây điện trong lưới điện

hạ thế ở các thành phố và nông thôn của sáu mô hình đề xuất với tập huấn luyện RTR được tạo bởi phân hoạch rõ có p=0.3 126 Biểu đồ 3.6 Biểu đồ so sánh các kết quả số luật #R và số nhãn #Label của bài toán ước lượng chiều dài của đường dây điện trong lưới điện hạ thế ở các thành phố và thị trấn nông thôn của các tác giả khác với sáu mô hình của luận án với tập huấn luyện RTR được tạo bởi phân hoạch rõ có p=0.3 126 Biểu đồ 3.7 Biểu đồ so sánh các kết quả số luật #R và số nhãn #Label của bài toán ước lượng chiều dài của đường dây điện trong lưới điện hạ thế ở các thành phố và thị trấn nông thôn của các tác giả khác với sáu mô hình của luận án với tập huấn luyện RTR được tạo bởi phân hoạch rõ có p=0.3 127

Trang 7

DANH MỤC CÁC HÌNH

Hình 1.1 Cấu trúc cơ bản của FRBSs dạng Mamdani 20

Hình 1.2 Cấu trúc cơ bản của FRBSs dạng TSK 24

Hình 1.3 Minh họa một thuật giải GA căn bản 29

Hình 1.4 Học theo phương pháp tiếp cận Pittsburgh 32

Hình 1.5 Sơ đồ quy trình tinh chỉnh DB 32

Hình 1.6 Học theo phương pháp tiếp cận Michigan 33

Hình 1.7 Sơ đồ quy trình học RB 36

Hình 1.8 Biểu diễn một luật với mã có chiều dài cố định hoặc thay đổi 36

Hình 1.9 Quy trình học RB, sau đó học DB 36

Hình 1.10 Sơ đồ quy trình học KB 37

Hình 1.11 Các giai đoạn thiết kế các hệ thống mờ 40

Hình 1.12 Minh họa phạm vi nghiên cứu của đề tài 44

Hình 2.1 Đồ thị minh họa của một hàm thuộc Gauss với l r 54

Hình 2.2 Đồ thị minh họa của ba hàm thuộc khi dùng hàm Gauss 55

Hình 2.3 Đồ thị minh họa của một hàm thuộc tam giác với l r 56

Hình 2.4 Đồ thị minh họa của ba hàm thuộc khi dùng hàm tam giác 57

Hình 2.5 Đồ thị minh họa của một hàm thuộc hình thang với l r 57

Hình 2.6 Đồ thị minh họa của ba hàm thuộc khi dùng hàm hình thang 59

Hình 2.7 Đồ thị minh họa của một hàm thuộc dạng hình chuông tổng quát với l r 60

Hình 2.8 Đồ thị minh họa của ba hàm thuộc khi dùng hàm dạng hình chuông với b=1 61

Hình 2.9 Sơ đồ minh họa việc khởi tạo DB ban đầu 61

Hình 2.10 Sơ đồ minh họa việc khởi tạo RB ban đầu 63

Hình 2.11 Các thành phần của một nhiễm sắc thể 68

Hình 2.12 Toán tử lai ghép 69

Hình 2.13 Hình minh họa đồ thị các hàm thuộc có miền xác định rời nhau hay giao nhau 70

Hình 2.14 Hình minh họa đồ thị miền biến thiên của các đỉnh của các hàm thuộc 71

Hình 2.15 Biểu diễn mã hóa của phần T 73

Hình 2.16 Đường liền nét biểu diễn dữ liệu đầu ra là số thực và đường chấm-chấm biểu diễn dữ liệu dự đoán bởi mô hình 3 92

Hình 2.17 Kết quả học và dự đoán với P=6 (a) Đường liền nét biểu diễn dữ liệu đầu ra mong muốn và đường chấm-chấm biểu diễn dữ liệu học và dự đoán bởi mô hình 3 (b) Đồ thị biểu diễn sai số học và dự đoán 97

Hình 3.1 Minh họa phương pháp chọn tập huấn luyện đại diện RTR từ tập huấn luyện ban đầu TR 107

Hình 3.2 Minh họa việc chọn tập RTRi từ tập Li 109

Hình 4.1 Hình minh họa hướng tiếp cận thứ 1 của đề tài 133

Hình 4.2 Hình minh họa quá trình tinh giản/tinh chỉnh FRBS của hướng tiếp cận thứ 1 133 Hình 4.3 Hình minh họa hướng tiếp cận thứ 2 của đề tài 134

Trang 8

DANH MỤC CÁC TỪ VIẾT TẮT

STT Từ viết tắt Diễn giải tiếng Anh Diễn giải tiếng Việt

Hệ thống dựa trên luật mờ

di truyền

Phương pháp IRL, PP Học Luật tương tác

Chỉ số sai số không phụ thuộc chiều

Tập dữ liệu huấn luyện đại diện

Phương pháp chọn lọc mẫu ngẫu nhiên cua Baker

Takagi-22 CVT(Rp,er)

Hàm xác định giá trị phủ

Trang 9

MỞ ĐẦU

Từ khi Mamdani đưa ra khái niệm về hệ thống mờ vào năm 1974, việc nghiên cứu

áp dụng lý thuyết điều khiển mờ được xem là lãnh vực sôi động nhất trong logic mờ vào các năm vừa qua Kể từ thập kỷ 80, logic mờ đã góp phần quan trọng trong việc tìm ra các giải pháp đơn giản và thực tế cho các ứng dụng hết sức đa dạng và phong phú trong các ngành khoa học và kỹ thuật [146]-[150] Do tầm quan trọng của logic

mờ trong điều khiển hệ thống, kiểm soát chuyến bay, kiểm soát tốc độ của vệ tinh, và các vấn đề tương tự nên nó đã trở một phần quan trọng không thể thiếu được trong các quá trình sản xuất công nghiệp

Vào thập niên 1970-80, hệ thống mờ thường được thiết kế bởi các chuyên gia Các hệ thống này chủ yếu là các hệ thống dựa trên luật mờ, còn gọi là các hệ suy diễn

mờ (Fuzzy Rule-Based Systems, FRBSs), là việc mô phỏng các quy tắc về hành vi ứng xử của con người dưới dạng các luật mờ Các hệ thống này thường là các hệ thống dựa trên luật mờ, sử dụng các biến ngôn ngữ Chúng đã tạo nên sự bùng nổ các ứng dụng trong công nghệ như máy điều hòa mờ, máy làm sạch không khí mờ, máy ảnh mờ, máy giặt mờ, nồi cơm điện mờ v.v Các hệ thống mờ này thường nhỏ và sử dụng luật mờ dạng ngôn ngữ tự nhiên nên có tính diễn giải được cao, nghĩa là dễ hiểu,

có thể giải thích dễ dàng cho người sử dụng nhưng lại có độ chính xác không cao Tính diễn giải được cao của hệ thống mờ phụ thuộc một số yếu tố như cấu trúc của

mô hình của hệ thống, số luật là nhỏ, số điều kiện trong phần tiền đề luật là ít, số nhãn ngôn ngữ cho mỗi biến là tối ưu, dạng của hàm thuộc v.v [1, 2] Ngoài ra, không phải lúc nào cũng tìm được chuyên gia để thiết kế FRBSs cho một ứng dụng cụ thể nào đó và cũng cần nhiều thời gian để chuyên gia có thể thiết kế thủ công các hệ thống này Do đó nảy sinh yêu cầu thiết kế FRBSs một cách tự động từ dữ liệu số của một ứng dụng cụ thể [130, 131] Vào đầu những năm 1990, các hệ thống mờ phức tạp có độ chính xác cao đã được thiết kế bằng các giải thuật mạng nơron nhân tạo và

di truyền [132]-[136], [148]-[150] Những hệ thống này lại có tính diễn giải được thấp, nghĩa là hệ thống tương đối phức tạp với Cơ sở luật lớn mặc dù có tính chính xác cao

Trang 10

Vào giữa những năm 1990, các nhà nghiên cứu đã đề cập việc tìm kiếm một ranh giới tối ưu giữa tính diễn giải và tính chính xác cho một hệ thống Hai tính chất này thường tỷ lệ nghịch với nhau trong cùng một hệ thống mờ Ý tưởng chính là kết hợp giá trị sai số (biểu thị cho tính chính xác) và số luật trong Cơ sở luật (biểu thị cho tính diễn giải được, cũng liên quan đến độ phức tạp) của hệ thống vào cùng một hàm vô hướng như sau:

f (S) = w1 ⋅ fError(S) + w2 ⋅ fComplexity(S)

trong đó w1, w2 là các giá trị trọng số, fError(S) và fComplexity(S) lần lượt biểu thị giá trị

hướng chọn được các So có độ phức tạp thấp (tính diễn giải được cao) nhưng có độ

chính xác thấp (sai số cao) [137]-[140] Đó chính là các khó khăn khi tìm kiếm một

hệ thống vừa có tính diễn giải cao, vừa có độ chính xác cao khi dùng một hàm duy

nhất f như trên

Do đó, vào cuối những năm 1990 cho đến hiện nay, các nhà nghiên cứu đã đề cập đến việc thiết kế các hệ thống mờ đa mục tiêu Các hệ thống này phải thỏa mãn hai mục tiêu chính là tính diễn giải cao và độ chính xác cao [141]-[145] Cách tiếp cận là

đa mục tiêu, tức là

Cực tiểu {fError(S), fComplexity(S)}

Thông thường, các hệ thống mờ gồm nhiều biến sẽ được xem là các hệ thống phức tạp Đối với các hệ thống như thế, kích thước của cơ sở luật sẽ bùng nổ theo cấp số nhân Ví dụ: một hệ thống điều khiển gồm m thuộc tính và n biến đầu vào, số luật

nghĩa là tối ưu số luật (giảm số luật), tối ưu số điều kiện (giảm số điều kiện) trong phần tiền đề của luật mà hệ thống vẫn còn hiệu quả cao trong ứng dụng Điều này cũng có nghĩa là hệ thống phải thỏa mãn hai mục tiêu là có tính diễn giải được cao đồng thời vẫn có tính chính xác cao [1]-[6], [i]-[ii] Có nhiều phương pháp giải quyết vấn đề này như phương pháp phân cấp, phương pháp nhập biến, phương pháp kết hợp

Trang 11

của hai phương pháp trên [128], phương pháp các điểm dữ liệu đặc trưng và các phương pháp thiết kế hệ thống mờ đa mục tiêu [141]-[145] v.v… Ưu điểm của các cách tiếp cận này là kích thước của cơ sở luật của hệ thống giảm đi nhiều, do đó làm giảm chi phí tính toán và chi phí về thời gian

Để xây dựng một hệ thống mờ thỏa hai mục tiêu là có tính diễn giải cao và độ chính xác cao, luận án đề xuất sử dụng thuật giải di truyền, sẽ được đề cập chi tiết trong chương hai và ba đã công bố trong [i]-[iv]

Các hệ thống mờ thông dụng nhất thường là FRBSs FRBSs dạng ngôn ngữ được chia làm hai loại chính, tùy thuộc vào dạng biểu diễn của luật trong Cơ sở luật Loại thứ nhất là FRBSs dạng Mamdani

Loại thứ hai là FRBSs dạng TSK (Takagi-Sugeno-Kang)

Các FRBSs này sẽ được đề cập chi tiết hơn trong chương 1, mục 1.2.3.1 và 1.2.3.2 Trong luận án này, tác giả đề xuất một phương pháp xây dựng tự động hệ suy diễn

mờ ban đầu từ dữ liệu số, bao gồm cơ sở luật mờ, các hàm thuộc, cơ chế mờ hóa, cơ chế suy diễn và cơ chế giải mờ Phương pháp này được đặt tên là phương pháp TMH (viết tắt theo Tên+Chữ đệm+Họ của nghiên cứu sinh) đã được công bố trong các hội nghị và tạp chí quốc tế [i]-[iv] Một đặc điểm đáng lưu ý của phương pháp này là gồm nhiều bước, trong đó bước đầu tiên là tìm số nhãn ngôn ngữ tối ưu cho mỗi biến đầu vào và đầu ra Điều này cực kỳ quan trọng, nó quyết định sự thành công sau này của việc khởi tạo hệ suy diễn mờ ban đầu, cũng như tạo thuận lợi việc tinh giản, tinh chỉnh hệ thống đó sau này Trong luận án, việc tinh giản hệ thống được hiểu như là tối ưu Cơ sở luật, bao gồm việc rút gọn số luật và số điều kiện trong phần tiền đề của luật một cách tối ưu bằng giải thuật di truyền (Genetic Algorithms, GAs) Việc tinh chỉnh hệ thống được hiểu như là hiệu chỉnh các tham số của các hàm thuộc và thêm các gia tử ngôn ngữ vào luật một cách tối ưu bằng GAs Ngoài ra, luận án còn đề xuất dạng biểu diễn thống nhất cho các hàm thuộc thông dụng như hàm Gauss, hàm tam giác, hàm hình thang, hàm dạng hình chuông tổng quát v.v là nhằm thống nhất cách biểu diễn một nhiểm sắc thể, tạo điều kiện thuận lợi cho việc áp dụng GAs Hơn nữa, với dạng thống nhất này, ý nghĩa của các tham số hàm thuộc trở nên rõ ràng, dễ hiểu hơn

Trang 12

Luận án còn đề xuất một thuật giải di truyền được sử dụng theo nhiều giai đoạn khác nhau và ở hai cấp độ khác nhau như vĩ mô, lẫn vi mô để tinh giản và tinh chỉnh FRBS đã khởi tạo ban đầu bằng phương pháp TMH TMH được viết tắt theo Tên+Chữ đệm+Họ của nghiên cứu sinh đã được công bố trong các hội nghị và tạp chí quốc tế [i]-[iv], sẽ được đề cập chi tiết trong mục 2.2, chương 2 Mục đích của các quá trình này là tối ưu hệ thống và nhưng vẫn đảm bảo tính hiệu quả, tính chính xác trong việc thực thi của hệ thống Từ các đề xuất vừa đề cập ở trên, luận án đưa ra sáu mô hình để xây dựng một hệ suy diễn mờ vừa có tính diễn giải cao, vừa có độ chính xác cao (sẽ đề cập chi tiết trong chương 2) Các kết quả này đã được công bố trong hội nghị và tạp chí quốc tế [i, iv]

Cuối cùng, đối với các dữ liệu thực nghiệm có kích thước lớn và độ phức tạp cao, luận án cũng đề nghị hai phương pháp chọn tập dữ liệu huấn luyện rút gọn từ tập huấn luyện ban đầu Tập con này còn gọi là tập dữ liệu huấn luyện đại diện, ký hiệu RTR (The Representative Training Data Set) Luận án cũng đã trình bày các thực nghiệm trên tập huấn luyện RTR cùng với sáu mô hình đã đề cập ở trên (sẽ đề cập chi tiết trong chương 3) Các kết quả này đã được công bố trong hội nghị và tạp chí quốc tế [ii]-[iii]

Luận án này bao gồm bốn chương Chương 1 giới thiệu các kiến thức cơ sở, động

cơ nghiên cứu, các nghiên cứu của các tác giả khác, các đóng góp của luận án Chương

2 trình bày phương pháp xây dựng hệ suy diễn mờ tinh giản và hiệu quả (mang tính diễn giải cao và có độ chính xác cao) Phương pháp này bao gồm việc xây dựng hệ thống ban đầu, sau đó tinh giản, tinh chỉnh hệ thống bằng sáu mô hình đề xuất Chương 3 trình bày hai phương pháp xây dựng tập dữ liệu huấn luyện rút gọn dựa trên các phân hoạch rõ và mờ Luận án đã thực nghiệm với tập dữ liệu huấn luyện rút gọn, có so sánh kết quả với các kết quả của các tác giả khác Chương 4 tổng kết các kết quả đã thực hiện và hướng phát triển

Trang 13

có thông tin không chắc chắn và không chính xác [41]-[44], [146]-[150] Các hệ thống

mờ dạng luật Mamdani (Mamdani-type Fuzzy Rule Based Systems, FRBSs dạng Mamdani) là một trong những hệ thống thực hiện điều này, cung cấp cho người dùng một mô tả rất dễ hiểu về hệ thống dưới dạng các luật ngôn ngữ, đây cũng là một yêu cầu bắt buộc trong nhiều bài toán thực tế

Một thành phần quan trọng của FRBSs là Cơ sở Tri thức (Knowlelege Base, KB)

KB của FRBSs thường không phải là một cấu trúc đồng nhất mà là sự kết hợp các thành phần khác nhau Ví dụ: KB của một FRBS theo mô hình Mamdani bao gồm hai thành phần:

 Cơ sở Dữ Liệu (Data Base, DB) chứa các định nghĩa của các hàm tỷ lệ cho các biến đầu vào/ra và các hàm thuộc của các tập mờ tương ứng với các nhãn ngôn ngữ

 Cơ sở Luật (Rule Base, RB) tạo thành tập các luật mờ của hệ thống (sẽ đề cập chi tiết hơn ở 1.2.3.1)

Tổng quát một FRBS bao gồm hai thành phần chính:

 Bộ Suy diễn thực hiện quá trình suy diễn cho đầu ra của hệ thống khi một đầu vào được xác định

 Một cơ sở tri thức (KB) biểu diễn các tri thức đã biết của bài toán hay vấn đề cần giải quyết

Trang 14

Trong chương này, luận án sẽ đề cập ngắn gọn về các phiên bản khác nhau hiện có của FRBSs, cùng với các cấu trúc và đặc trưng riêng của chúng, nhưng vẫn chủ yếu tập trung nói về FRBSs dạng Mamdani là FRBSs có các luật dạng ngôn ngữ tự nhiên Tính hiệu quả của một FRBS dạng ngôn ngữ phụ thuộc vào

cơ sở luật và các hàm thuộc tương ứng với các phân hoạch trên các miền dữ liệu của hệ thống Việc thiết kế các thành phần trong FRBSs là một vấn đề phức tạp nên nhiều tác giả đã đề nghị các kỹ thuật khác nhau để thực hiện việc này

Một vài phương pháp học trên các thành phần của RB hay DB và các phương pháp tinh chỉnh trên DB của hệ thống Các phương pháp này dựa trên ý tưởng của ba cách tiếp cận nổi tiếng là phương pháp phủ dữ liệu ad-hoc, mạng nơ ron và thuật giải

di truyền

FRBSs thường được phân làm hai loại là các hệ thống mờ dạng Mamdani và dạng TSK, tùy thuộc vào biểu thức của phần kết luận của các luật trong RB Các luật mờ dạng Mamdani có phần kết luận là một biến ngôn ngữ, trong khi các luật mờ dạng TSK có phần kết luận là một đa thức của các biến đầu vào

Mô hình hóa một bài toán thực tế ở dạng ngôn ngữ thông tự nhiên dựa trên logic

mờ được xem như là việc xây dựng một hệ thống được biểu diễn bằng ngôn ngữ theo

mô hình của FRBSs dạng Mamdani Khi đó khái niệm biến ngôn ngữ sẽ đóng vai trò trung tâm, bởi vì các biến ngôn ngữ có thể được diễn giải thành lời, dễ hiểu và dễ sử dụng Do đó các FRBSs dạng này đã được sử dụng rộng rãi và đã đạt được nhiều kết quả rất tốt trong nhiều ứng dụng khác nhau

Phần này sẽ đề cập ngắn gọn về các FRBSs dạng ngôn ngữ và xem xét các kỹ thuật thiết kế khác nhau Nhiều phương pháp tiếp cận dựa trên nền tảng các giải thuật học, chẳng hạn như các phương pháp ad-hoc, mạng nơron nhân tạo (Artificial Neural Networks, ANNs), thuật giải di truyền (Genetic Algorithms, GAs), clustering v.v Phần này sẽ đề cập các cách tiếp cận nổi tiếng về giải thuật học và tinh chỉnh các FRBSs dạng ngôn ngữ

Trong mục sau sẽ trình bày sơ lượt một số dạng khác nhau của FRBSs Sau đó, sẽ trình bày một số phương pháp học và tinh chỉnh các FRBSs dạng ngôn ngữ

1.2 Các kiến thức cơ bản về hệ suy diễn mờ

Trang 15

1.2.1 Hệ suy diễn mờ

Theo nghĩa rộng, một FRBS là một hệ thống dựa trên luật trong đó logic mờ được

sử dụng như một công cụ để biểu diễn các dạng khác nhau của tri thức về một vấn đề cần giải quyết, cũng như để mô hình hóa sự tương tác và các mối quan hệ giữa các biến của hệ thống Nhờ vào đó, các hệ thống này đã được áp dụng thành công vào một lớp lớn các vấn đề có liên quan đến các hệ thống có thông tin không chắc chắn

và không rõ ràng [41]-[44], [146]-[150]

Trong mục này, sẽ trình bày các khía cạnh cơ bản của FRBSs như các loại FRBSs khác nhau, các thành phần và các chức năng của chúng Tuy nhiên, chúng ta sẽ không đề cập nhiều về logic mờ, có thể tham khảo thêm trong [44]-[45]

1.2.2 Logic mờ và hệ thống mờ

Hệ thống dựa trên luật đã được sử dụng để mô hình hóa các hoạt động của con người trong cách giải quyết một vấn đề, một bài toán, trong đó tri thức của con người

được biểu diễn theo cách cổ điển bằng các luật “IF-THEN” Khi phần tiền đề của

luật được thỏa mãn thì phần kết luận sẽ được thực hiện, trong thực tế sẽ đưa ra một hành động tương ứng Trong cách tiếp cận thông thường, để biểu diễn tri thức, người

ta thường dùng logic nhị nguyên nhưng chính điều này mà hệ thống sẽ không có khả năng giải quyết được những vấn đề có thông tin không chắc chắn và không chính xác

Do đó, các cách tiếp cận cổ điển đã không thể cung cấp một mô hình đầy đủ cho các kiểu lý luận khác nhau và thậm chí cả những lý luận thông thường

Logic mờ được xem như một mở rộng của logic cổ điển, cung cấp một khái niệm hiệu quả để giải quyết vấn đề biểu diễn tri thức trong hai môi trường không chắc chắn

và không chính xác Logic mờ, như tên gọi của nó, là phương tiện để thực hiện các lập luận xấp xỉ gần đúng Tầm quan trọng của logic mờ bắt nguồn từ các sự kiện và các phương thức lập luận của con người, đặc biệt là các lập luận thông thường có bản chất là các lập luận xấp xỉ Người đọc có thể tham khảo mối quan hệ giữa Logic mờ với các lập luận xấp xỉ các sự kiện có thông tin không chắc chắn và không chính xác trong [8], [46], [146]

Trang 16

Trong Logic mờ cùng với lý thuyết tập mờ, độ thuộc của các phần tử nào đó vào một tập hợp sẽ giảm từ từ, không giảm đột ngột như trong logic cổ điển Mô hình hóa các bài toán thực tế thông qua Logic mờ và tập mờ đã cung cấp một quan điểm mới,

mở rộng hơn bằng việc cung cấp các công cụ sáng tạo để giải quyết các bài toán trong các hệ thống phức tạp và khó xác định

Lãnh vực nghiên cứu tập mờ đã được quan tâm nhiều sau các công trình tiên phong của Zadeh [46] và đã đặt nền tảng ban đầu cho việc xây dựng các hệ thống mờ Theo quan điểm tổng quát, một hệ thống mờ là bất kỳ hệ thống nào dựa trên logic

mờ, trong đó logic mờ đươc sử dụng làm Cơ sở để biểu diễn các dạng khác nhau của tri thức hoặc để mô hình hóa các tương tác và mối quan hệ của các biến trong hệ thống Các công cụ cổ điển không thể giải quyết được một số bài toán thực vì độ phức tạp hay không chính xác nên hệ thống mờ đã chứng tỏ là một công cụ quan trọng để

mô hình hóa các hệ thống phức tạp này [40]-[43]

Cụ thể, việc ứng dụng logic mờ vào các hệ thống dựa trên các luật truyền thống

đã dẫn đến các hệ thống dựa trên luật mờ (FRBSs) Những hệ thống này xem xét các

luật dạng “IF-THEN” với phần tiền đề và phần kết luật là các phát biểu mờ, đã cho

thấy có hai ưu thế so hệ thống dựa trên các luật cổ điển như:

 Các tập mờ biểu diễn Cơ sở Tri thức, liên quan đến việc xử lý các thông tin không chắc chắn

 Các phương pháp suy diễn trở nên mạnh hơn và linh hoạt hơn với các phương pháp lập luận xấp xỉ của logic mờ

Việc biểu diễn tri thức được tăng cường bằng cách sử dụng các biến ngôn ngữ và các giá trị ngôn ngữ, được xác định bởi các tập mờ phụ thuộc vào ngữ cảnh của bài toán mà ngữ nghĩa của nó được xác định bởi các hàm thuộc [46] Ngoài ra, các quy tắc suy diễn mới như quy tắc khẳng định tổng quát (còn gọi là quy tắc modus ponens tổng quát) và quy tắc phủ định tổng quát, còn gọi là quy tắc modus tollens tổng quát, v.v , dựa trên logic mờ, hình thành Cơ sở cho lập luận xấp xỉ [46] Do đó, logic mờ cung cấp một khuôn khổ tính toán độc đáo cho cơ chế suy diễn trong các hệ thống dựa trên luật Không như các hệ thống logic truyền thống, mục tiêu của logic mờ là

Trang 17

nhằm cung cấp các phương thức lập luận gần đúng và tương tự, hơn là chính xác [146]-[150]

1.2.3 Phân loại các hệ suy diễn mờ

Các FRBSs thường được phân biệt làm hai loại trong các tài liệu chuyên ngành tùy thuộc vào dạng luật mờ được xem xét và các loại đầu vào và ra được dùng [47], sẽ được giới thiệu trong mục sau

1.2.3.1 Các hệ thống luật mờ dạng Mamdani

Các FRBSs dạng này đã được Mamdani đề nghị trong [48], sử dụng các lý thuyết ban đầu của Zadeh để xây dựng FRBSs và đã được ứng dụng để giải các bài toán điều khiển Từ đó đến nay, các hệ thống mờ loại này được sử dụng nhiều nhất, thường được gọi là FRBSs với bộ Mờ hóa và bộ Giải mờ hay thông dụng hơn được gọi là các

hệ điều khiển mờ (tên gọi này được Mamdani đề nghị trong các bài báo đầu tiên của

mình [49])

Các FRBSs dạng Mamdani gồm có bốn thành phần chính: Cơ sở Tri thức (KB),

bộ Mờ hóa, bộ Suy diễn và bộ Giải mờ KB gồm Cơ sở Dữ Liệu (DB) và Cơ sở Luật

(RB) chứa các tri thức về một vấn đề đang quan tâm dưới dạng các luật “IF-THEN”

Cấu trúc của FRBSs dạng Mamdani được thể hiện trong hình sau

Các luật mờ trong RB của FRBSs dạng Mamdani có dạng như sau:

IF X 1 is A 1 and and X n is A n THEN Y is B, trong đó Ai và B là các nhãn ngôn ngữ

FRBSs dạng Mamdani có một vài đặc tính thú vị sẽ được đề cập dưới đây:

Cơ Sở Dữ Liệu Cơ Sở Luật

Cơ Sở Tri Thức

bộ Mờ Hóa bộ Suy Diễn bộ Giải Mờ

Trang 18

 Các hệ thống này được sử dụng trong những ứng dụng thực tế có các giá trị đầu

vào và đầu ra là số thực

 Các hệ thống này cung cấp một khung khổ tự nhiên cho phép kết hợp tri thức của

chuyên gia dưới dạng các luật ngôn ngữ với các luật được xây dựng tự động từ các dữ liệu số, biểu diễn các bài toán trong thế giới thực

 Cuối cùng, các hệ thống dạng này cung cấp nhiều khả năng hơn cho phép chọn

lựa các bộ Mờ hóa, bộ Giải mờ cũng như bộ Suy diễn sao cho có thể thiết kế hệ thống phù hợp hơn cho từng bài toán cụ thể

Bộ Mờ hóa thiết lập một ánh xạ từ các giá trị rõ trong miền U, các giá trị đầu vào, đến các tập mờ được định nghĩa trên cùng miền U đó Mặt khác, bộ Giải mờ thực hiện công việc ngược lại là thiết lập một ánh xạ từ các tập mờ được định nghĩa trên miền V, các giá trị đầu ra, đến đến các giá trị rõ trong cùng miền V đó

Các luật mờ gồm các biến đầu vào và đầu ra ngôn ngữ có giá trị lấy trong tập các giá trị ngôn ngữ có ý nghĩa thực tế trong thế giới thực Do đó, mỗi luật là một mô tả về điều kiện hành động mà con người có thể diễn giải được một cách rõ ràng Điều này làm cho FRBSs dạng Mamdani phù hợp với việc mô hình hóa bằng ngôn ngữ, một lãnh vực con của lãnh vực mô hình hóa bằng logic mờ, trong đó đặc trưng chính

là tính diễn giải được của mô hình [1]-[2], [50], và vấn đề điều khiển hệ thống [51] Một mở rộng của FRBSs dạng Mamdani dựa trên sự thay đổi cấu trúc của luật ngôn ngữ với mục đích là làm cho nó linh hoạt hơn FRBS dạng mở rộng này sử dụng các luật mờ dạng DNF (Disjunctive Normal Form) như sau [52]-[55]:

pháp đầy đủ cho phần tiền đề của là

𝑋1 𝑖𝑠 𝐴̃ = { 𝐴1 11 , , 𝐴1ℓ1} 𝑎𝑛𝑑 … 𝑎𝑛𝑑 𝑋𝑛 𝑖𝑠 𝐴̃ = { 𝐴𝑛 𝑛1 , , 𝐴𝑛ℓ𝑛}

Trang 19

Sau đây là một ví dụ về luật thuộc loại này Giả sử có ba biến đầu vào X1, X2, và

D 1 = {A 11 , A 12 , A 13 }; D 2 = {A 21 , A 22 , A 23 , A 24 , A 25 }; D 3 = {A 31 , A 32 } ;

F = {B 1 , B 2 , B 3 }

Một minh họa về một luật dạng DNF:

IF X 1 is {A 11 or A 13 } and X 2 is {A 23 or A 25 } and X 3 is {A 31 or A 32 } THEN Y is B 2

Gần đây, một KB có cấu trúc mới, linh hoạt hơn cho phép cải thiện tính chính xác của các mô hình sử dụng ngôn ngữ mà không làm mất tính diễn giải được của hệ thống, đã được đề xuất trong [56] Lúc đó, hệ thống với một luật ngôn ngữ có thể có hai phần kết luận khác nhau Điều này giúp các FRBSs có thể cải thiện được tính chính xác trong tìm kiếm cục bộ đối với các không gian tìm kiếm phức tạp, bởi vì đầu ra của luật cuối cùng nằm trong vùng trung gian giữa hai nhãn ngôn ngữ chính

Sự thay đổi này có thể diễn giải như sau:

IF X 1 is A 1 and and X n is A n THEN Y is between B 1 and B 2

Ngoài ra, trong những năm gần đây người ta đã đề nghị một biến thể mới của các

hệ thống thuộc loại này, trong đó độ chính xác của hệ thống được coi trọng hơn tính

diễn giải được của nó Các hệ thống này thường được gọi là các hệ thống FRBSs dạng

Mamdani- xấp xỉ [40], [57]-[60], ngược lại với những hệ thống này là các hệ thống

cổ điển thường được gọi là các hệ thống FRBSs dạng Mamdani-ngôn ngữ hay

Mamdani-miêu tả Ứng dụng chính của các hệ thống FRBSs dạng Mamdani- xấp xỉ

là lãnh vực mô hình hóa mờ [40], trong đó tính chính xác của mô hình là yêu cầu chính, thay vì khả năng mô tả, diễn giải được của nó

Cấu trúc của một FRBS dạng Mamdani-xấp xỉ cũng giống như của một FRBS dạng Mamdani-ngôn ngữ đã được trình bày ở Hình 1.1 Khác biệt duy nhất liên quan

đến loại luật được xem xét trong KB và do đó liên quan đến cấu trúc của các luật Trong trường hợp này, các luật không sử dụng biến ngôn ngữ mà sử dụng trực tiếp các biến mờ Do đó, cấu trúc của các luật mờ trong các hệ thống xấp xỉ như sau:

IF X 1 is A 1 and and X n is A n THEN Y is B, trong đó Ai và B là các tập mờ mà

không cần diễn giải ra các nhãn ngôn ngữ

Trang 20

Vì vậy, trong các hệ thống này, trong cấu trúc của DB không cần lưu trữ các giá trị ngôn ngữ cũng như các tập mờ liên quan định nghĩa ngữ nghĩa của chúng Trong trường hợp này, Cơ sở Tri thức (KB) trong FRBSs, gồm DB và RB trở thành một Cơ

sở luật mờ duy nhất được tạo bởi tập các luật mờ, trong đó mỗi luật mờ chứa trực tiếp ngữ nghĩa mà nó mô tả

1.2.3.2 Các hệ thống luật mờ dạng Takagi-Sugeno-Kang

Thay vì sử dụng các luật ngôn ngữ như hệ thống dạng Mamdani-ngôn ngữ như đã đề cập ở mục trên, Takagi, Sugeno và Kang [61,62] đã giới thiệu một mô hình mới dựa trên luật, trong đó phần tiền đề của luật là các biến ngôn ngữ và phần kết luận là

một hàm của các biến đầu vào

Dạng phổ biến nhất của các luật dạng này thường có phần kết luận là một hàm tuyến tính theo các biến thuộc phần tiền đề của luật như sau:

IF X 1 is A 1 and and X n is A n THEN Y = p 1 X 1 + + p n X n + p 0 ,

hoặc chính là các tập mờ Các luật loại này thường được gọi là luật mờ TSK, đặt theo

tên các tác giả đã đề xuất

Trong một hệ thống FRBS dạng TSK có KB gồm m luật thì đầu ra của hệ thống

được tính bằng cách sử dụng trung bình trọng số của các đầu ra của mỗi luật thứ i là

∑𝑚𝑖=1ℎ𝑖.𝑌𝑖

của luật thứ i với giá trị đầu vào x0 = (x1, , xn) trong đó xi là giá trị của biến Xi với

i=1, ,n và T là một phép toán t-norm

Do đó, FRBSs dạng này dựa trên việc phân chia không gian đầu vào thành một số không gian con mờ và định nghĩa quan hệ tuyến tính giữa đầu vào và đầu ra trong mỗi không gian con này như đã được đề xuất bởi các tác giả trong [61] Trong quá trình suy diễn, các mối quan hệ từng phần này được kết hợp theo cách nói trên để tìm

Trang 21

mối quan hệ toàn cục giữa đầu vào và đầu ra Hình sau đây biểu diễn cấu trúc cơ bản

của FRBSs dạng TSK

Ưu điểm chính của những hệ thống này là phương trình biểu diễn của hệ thống

làm cho việc thiết kế hệ thống dễ dàng hơn Tuy nhiên, nhược điểm chính của hệ thống này lại liên quan đến dạng biểu diễn của phần kết luận của luật, không tạo khung khổ tự nhiên để có thể biểu diễn kiến thức của các chuyên gia Do đó, để khắc phục điều này, để tích hợp tri thức chuyên gia vào hệ thống này, người ta đã thực hiện một thay đổi nhỏ trên phần kết luận của luật, tương tự như các luật ngôn ngữ với phần

kết luận Y is B được cung cấp bởi chuyên gia, phần kết luật được thay thế bằng Y =

loại này thường được gọi các luật TSK bậc 0

1.2.3.3 Các thành phần của hệ thống luật dạng Mamdani

Tóm tắt các khái niệm đã giới thiệu, một FRBS dạng Mamdani gồm các thành phần sau:

Cơ sở Tri thức: chứa các luật ngôn ngữ hướng dẫn các hoạt động của hệ thống

Bộ Mờ hóa: chịu trách nhiệm biến đổi dữ liệu đầu vào rõ thành các giá trị có thể

được xử lý trong quá trình lập luận mờ, nghĩa là tập mờ nào đó

Bộ Suy diễn: sử dụng các giá trị trên và các thông tin chứa trong KB để thực hiện

quá trình suy diễn

Bộ Giải mờ: biến đổi giá trị mờ thu được trong quá trình suy diễn thành giá trị rõ,

tạo ra đầu ra toàn cục cho FRBS

Chúng ta sẽ phân tích kỹ hơn các thành phần trên trong phần sau đây

Cơ sở Tri thức

Như đã đề cập, KB bao gồm hai bộ phận khác nhau:

Trang 22

 RB: Được tạo bởi tập các luật ngôn ngữ “IF-THEN”, trong trường hợp FRBSs

dạng nhiều đầu vào – một đầu ra, thì sẽ có dạng sau:

IF X 1 is A 1 and and X n is A n THEN Y is B

nhãn ngôn ngữ RB gồm tập hợp các luật loại như trên được kết nối nhau bằng

toán tử “also”, có nghĩa là tất cả các luật đều được kích hoạt (“cháy”) khi một đầu

vào xác định được đưa vào hệ thống, sẽ được đề cập chi tiết ở phần sau

 DB: Chứa các định nghĩa của các tập mờ tương ứng với các nhãn ngôn ngữ sử

dụng trong các luật của RB, nghĩa là các tham số của các hàm thuộc

Bộ Mờ hóa

Bộ Mờ hóa là một trong hai thành phần của FRBSs dạng Mamdani làm việc với đầu vào là số thực Bộ này xác định một ánh xạ thiết lập một tương ứng giữa mỗi giá trị trong không gian đầu vào rõ với một tập mờ được xác định trong miền quan tâm của đầu vào đó, có hàm thuộc tương ứng

mờ hóa

Có nhiều cách chọn toán tử F, nhưng có hai cách chọn chính:

1 và độ thuộc của các phần tử còn lại sẽ giảm dần khi các phần tử đó càng xa

Ví dụ: tập mờ dạng tam giác, khi đó hàm thuộc có dạng sau:

Trang 23

Bộ Suy diễn

Bộ này thực hiện quá trình suy diễn mờ bằng cách áp dụng các nguyên lý của

Quá trình suy diễn mờ dựa trên việc áp dụng quy tắc khẳng định tổng quát, còn gọi là quy tắc Modus Ponens tổng quát, một mở rộng của quy tắc Modus Ponens cổ điển, đã được Zadeh đề xuất trong [8] như sau:

Quy tắc Modus Ponens tổng quát (Quy tắc Khẳng định tổng quát)

IF X is A THEN Y is B

Y is B’

Một phát biểu mờ dạng “IF X is A THEN Y is B” biểu diễn một quan hệ mờ giữa

A và B được định nghĩa trong U V Quan hệ mờ này được xác định bởi tập mờ R có

kéo theo mờ biểu diễn quan hệ mờ

Hàm thuộc của tập mờ B’ là kết quả của việc áp dụng quy tắc suy diễn CRI (Compositional Rule of Inference) được Zadeh giới thiệu trong [8] như sau: “Nếu R

là quan hệ mờ được định nghĩa trong U và V, và A’ là một tập mờ được định nghĩa trong U, thì tập mờ B’, suy ra từ A’, thu được từ phép hợp của R và A’, nghĩa là: B’ = A’ R

Do đó, khi áp dụng quy tắc suy diễn CRI vào các luật có phần tiền đề với n biến

đầu vào và phần kết luận với một biến đầu ra, thì kết quả có biểu thức sau:

Trang 24

Như đã đề cập trong mục trước, trong hầu hết các trường hợp bộ Mờ hóa biến đổi

T(1,1) = 1 và T(x,1) = x [63, 64], quy tắc suy diễn CRI cuối cùng rút gọn như sau:

Bộ Giải mờ

Từ phương thức hoạt động của bộ Suy diễn trong một FRBS dạng Mamdani-ngôn ngữ đã đề cập trong mục trên, quá trình suy diễn được thực hiện trên các luật riêng

biệt Do đó, có thể áp dụng quy tắc suy diễn CRI cho m luật trong KB, m tập mờ

Do hệ thống cần phải có đầu ra rõ nên bộ Giải mờ phải thực hiện việc tổng hợp các thông tin của mỗi tập mờ và biến đổi chúng thành một giá trị rõ duy nhất Sau đây là hai phương thức khác nhau để tổng hợp thông tin, đã được đề cập trong [65]:

1) Phương thức A: Tổng hợp trước, giải mờ sau Trong trường hợp này, bộ Giải

mờ thực hiện các việc sau:

hợp mờ G:

là đầu ra của toàn hệ thống:

2) Phương thức B: Giải mờ trước, tổng hợp sau Trong trường hợp này, sử dụng

phép tổng hợp (có thể là lấy trung bình, hoặc trung bình trọng số, hoặc chọn một trong các giá trị, v.v ) để tính đầu ra rõ cuối cùng Phép tổng hợp kết hợp các giá trị đặc trưng của các tập mờ cần suy diễn (trọng tâm, trung bình của giá trị lớn nhất, v.v ) để tính đầu ra rõ cuối cùng Do đó, thực hiện việc tính các giá trị đặc trưng của các tập mờ trước (giải mờ trước), sau đó áp dụng phép

tổng hợp trên các giá trị này để tính đầu ra rõ cuối cùng (tổng hợp sau)

Trong cả hai phương thức trên, toán tử “also” được sử dụng như là phép nối các

luật trong cơ sở luật Hai phương thức này cho thấy hai cách tiếp cận khác nhau trên

Trang 25

cùng một cơ sở luật với phép nối “also” Mamdani đã đề nghị phương thức A trong

các bài báo ban đầu về điều khiển mờ [48], nhưng trong vài năm gần đây, phương thức B được sử dụng nhiều hơn [65, 66]

1.3 Sơ lược về thuật giải di truyền (Genetic Algorithms, GAs)

GAs là các giải thuật tìm kiếm các lời giải cho các bài toán thực tế sử dụng các nguyên lý lấy cảm hứng từ lý thuyết di truyền học tự nhiên [67, 68] Ý tưởng cơ bản

là tạo ra một quần thể gồm các cá thể (biểu diễn các lời giải khả thi cho bài toán cần giải) có thể tiến hóa qua quá trình đấu tranh sinh tồn và chọn lọc GAs thường bắt đầu với một quần thể gồm các cá thể được khởi tạo một cách ngẫu nhiên và tiến hóa dần thành các cá thể tốt hơn thông qua việc áp dụng các toán tử di truyền mô phỏng theo quá trình di truyền trong tự nhiên Quần thể sẽ tiến hóa thông qua quá trình chọn lọc

tự nhiên

Suốt quá trình lặp liên tiếp (được gọi là các thế hệ), các cá thể trong quần thể sẽ được đánh giá theo độ thích nghi của chúng và từ đó sẽ hình thành một quần thể mới thông qua cơ chế chọn lọc và các toán tử di truyền như lai ghép và đột biến Một hàm đánh giá hay hàm thích nghi phải được xác định cho từng vấn đề cần giải quyết Hàm đánh giá hay thích nghi sẽ trả về một số duy nhất ứng với mỗi cá thể (có thể là lời giải cho vấn đề), thể hiện sự thích nghi của cá thể với bài toán đặt ra

Mặc dù GAs không được thiết kế đặc biệt cho máy học, nhưng vì GAs là giải thuật tìm kiếm toàn cục nên có lợi thế khi được áp dụng vào máy học Nhiều phương pháp máy học dùng để tìm kiếm một mô hình tốt trong một không gian các mô hình, chẳng hạn như tìm một cơ sở luật tốt trong không gian các luật Những phương pháp này có thể dùng để giải các vấn đề tìm kiếm hoặc các vấn đề tối ưu cơ bản GAs thực hiện tìm kiếm trong không gian của mô hình bằng cách biểu diễn mỗi mô hình thành một nhiễm sắc thể (cá thể) Các cách biểu diễn khác nhau cho một nhiễm sắc thể làm cho GAs linh hoạt hơn Quá trình học bằng giải thuật di truyền gồm các cấp độ phức tạp khác nhau tùy thuộc những thay đổi về cấu trúc của các giải thuật, từ trường hợp đơn giản nhất là tối ưu hóa các tham số đến trường hợp phức tạp nhất là học các luật của FRBSs

Khi áp dụng GAs để giải một bài toán, ta cần xác định các yếu tố sau:

Trang 26

 Biểu diễn di truyền (vấn đề cần giải quyết) gọi là kiểu gen (genotype) cho

các giải pháp của bài toán gọi là kiểu hình (phenotype)

 Cách khởi tạo quần thể ban đầu của các giải pháp

 Một hàm đánh giá còn gọi là hàm thích nghi (fitness function) trả về giá trị

cho các nhiễm sắc thể

 Các toán tử di truyền sửa đổi các cấu tạo di truyền của các con cháu trong

quá trình sinh sản

 Các giá trị của các tham số cần sử dụng như kích thước của quần thể, xác

suất áp dụng các toán tử di truyền, v.v

Hình 1.3 Minh họa một thuật giải GA căn bản

t := t + 1

Khởi tạo P(t=0) Đánh giá P(t) Chọn các cá thể cha mẹ từ P(t)

Lai ghép các cá thể cha mẹ thành các cá thể con cháu Đột biến các cá thể con cháu

Xuất Phương án/Lời giải

Đưa các cá thể con cháu vào P( t + 1)

Trang 27

Khi xem xét các FRBSs, dựa vào cách học các luật, ta có hai cách tiếp cận sử dụng các thuật giải di truyền khác nhau trong việc mã hóa các luật của quần thể [11]:

 Phương pháp Pittsburgh: trong đó mỗi cá thể đại diện cho một tập luật [69]

 Các phương pháp tiếp cận, trong đó mỗi cá thể mã hóa một luật duy nhất, và tập luật được tạo ra bằng cách kết hợp một vài cá thể trong quần thể

Theo hướng tiếp cận này, có ba phương pháp đã được đề xuất :

 Phương pháp Michigan: trong đó mỗi cá thể được mã hóa thành một luật duy

nhất Các hệ thống thuộc loại này thường được gọi là các hệ thống học phân lớp Các hệ thống này là các hệ thống dựa trên luật, có sử dụng học tăng cường

và sử dụng GAs để học các luật chi phối các hoạt động trong một môi trường nhất định [12]

 Phương pháp IRL (Iterative Rule Learning): trong đó mỗi nhiễm sắc thể đại

diện cho một luật, nhưng giải pháp cuối cùng là cá thể tốt nhất tìm được và là lời giải toàn cục được tìm ra khi thuật toán được chạy nhiều lần để tìm kiếm những cá thể tốt nhất MOGUL [70, 71], SLAVE [72] đề xuất các phương pháp theo hướng này

 Phương pháp "hợp tác-cạnh tranh" (The “cooperative-competitive”

approach): trong đó toàn bộ hoặc một tập hợp con của quần thể tạo thành cơ

sở luật COGIN [73], REGAL [74] là những ví dụ đại diện cho hướng này

1.4 Hệ thống dựa trên luật mờ di truyền

(Genetic Fuzzy Rule-Based Systems, GFRBSs)

Một số bài báo gần đây đã đề cập đến việc tự động tạo ra Cơ sở Tri thức (KB) từ

dữ liệu số cho một FRBS bằng cách sử dụng GAs Vấn đề mấu chốt là sử dụng một quá trình học bằng GAs để tự động hóa việc thiết kế KB và quá trình đó được xem như là một bài toán tìm kiếm tối ưu Việc tìm kiếm một KB thích hợp cho một vấn đề (bài toán) đang quan tâm là tương đương với việc tham số hóa KB (các luật và các hàm thuộc), và tìm kiếm giá trị tối ưu của các tham số đó Các tham số của KB tạo thành một không gian cần tối ưu hóa, sẽ được chuyển đổi thành các biểu diễn gen phù hợp để có thể thực hiện quá trình tìm kiếm trên đó

Trang 28

Bước đầu tiên trong việc thiết kế một GFRBS là quyết định xem các bộ phận nào của KB cần được tối ưu bằng GAs KB của một FRBS thường là sự kết hợp các thành phần khác nhau

Ví dụ: KB của một FRBS theo mô hình Mamdani (xem hình 1.1) bao gồm hai thành phần:

 Cơ sở Dữ Liệu (DB): chứa định nghĩa của các hàm tỷ lệ của các biến đầu vào,

đầu ra và các hàm thuộc của các tập mờ tương ứng với các nhãn ngôn ngữ

 Cơ sở Luật (RB): tập các luật mờ

Quyết định xem thành phần nào của KB cần được tối ưu thì phụ thuộc vào hai mục tiêu mâu thuẫn nhau: kích thước của dữ liệu và tính hiệu quả của việc tìm kiếm bằng GAs Một không gian tìm kiếm có kích thước nhỏ hơn thì sẽ dễ dàng tìm kiếm nhanh hơn và quá trình học cũng đơn giản hơn, nhưng các lời giải đạt được có thể chỉ

là tối ưu cục bộ Nếu không gian tìm kiếm gồm toàn bộ KB và dữ liệu là đầy đủ thì

có nhiều khả năng chứa giải pháp tối ưu hơn, nhưng quá trình tìm kiếm có thể chậm

và kém hiệu quả hơn Với những nhận xét trên thì rõ ràng cần có một sự cân bằng giữa sự đầy đủ và kích thước của không gian tìm kiếm với tính hiệu quả của giải thuật tìm kiếm Điều này dẫn đến các khả năng khác nhau để thiết kế GFRBSs và sẽ được xem xét chi tiết hơn trong các phần dưới đây

Trước hết, cần phân biệt giữa việc tinh chỉnh, việc tinh giản và việc học một FRBS:

 Việc tinh chỉnh có liên quan tới việc tối ưu hóa của một FRBS hiện có, trong khi việc học liên quan tới phương pháp thiết kế tự động ngay từ đầu các luật

mờ Quá trình tinh chỉnh giả định rằng RB đã được xác định trước và mục tiêu

là tìm kiếm một tập hợp các tham số tối ưu của DB cho các hàm thuộc và/hoặc hàm tỷ lệ (Hình 1.5)

 Quá trình học tập thực hiện tìm kiếm phức tạp trong không gian các cơ sở luật (RB) hoặc toàn bộ Cơ sở Tri thức (KB)

Hình 1.4 minh họa một phương pháp dùng GAs để xây dựng FRBS, gọi là phương pháp Pittsburgh Trong phương pháp này, người ta sử dụng một hệ thống phát sinh ra các cơ sở luật (RB) để khởi tạo một quần thể ban đầu để có thể áp dụng

Trang 29

GAs Các RB này sẽ lần lượt được đánh giá bởi một hệ thống đánh gía nhờ đầu vào

từ môi trường và kết quả thực thi của đầu ra trong môi trường thực tế Quá trình này được thực hiện bằng GAs qua nhiều thế hệ của các RB Kết quả cuối cùng là một RB tối ưu cần tìm, cũng từ đó ta có được FRBS tối ưu cho bài toán Một nhược điểm của phương pháp này là chi phí thời gian sẽ nhiều khi không gian tìm kiếm của bài toán lớn

Quần thể các cơ sở luật

Cơ sở luật

Cơ sở luật

Cơ sở luật

Cơ sở Luật

Bộ suy diễn

Sự kiện Đầu ra Đầu vào

Quy trình

tinh chỉnh

Mô-đun đánh giá (DB)

DB

RB (đã xác

định trước)

Hình 1.4 Học theo phương pháp tiếp cận Pittsburgh

Hình 1.5 Sơ đồ quy trình tinh chỉnh DB

Trang 30

Hình 1.6 minh họa một phương pháp khác dùng GAs để xây dựng FRBS, gọi là phương pháp Michigan Trong phương pháp này, người ta sử dụng một cơ chế tạo một cơ sở luật (RB) và một hệ thống phân phối độ tin cậy cho các luật dựa trên cơ chế thưởng phạt và thông tin đầu ra so với môi trường RB sẽ tiến hóa qua nhiều thế

hệ bằng Gas để đạt một RB tối ưu cuối cùng, cũng từ đó ta có được FRBS tối ưu cho bài toán Phương pháp Michigan thường dùng để giải các bài toán phân lớp dữ liệu

1.4.1 Tinh chỉnh bằng GAs

Tinh chỉnh các hàm tỷ lệ và hàm thuộc mờ là một nhiệm vụ quan trọng trong thiết kế FRBSs Hàm tỷ lệ và hàm thuộc được tinh chỉnh bởi GAs theo một hàm thích nghi (hàm fitness) đã được xác định trước Như đã nói ở trên, quá trình tinh chỉnh giả định rằng RB đã được xác định và mục tiêu là tìm kiếm một tập hợp các tham số tối ưu cho các thuộc và/hoặc các hàm tỷ lệ (Hình 1.5)

Bộ suy diễn Engine Các sự kiện Đầu ra

Trang 31

Hàm tỷ lệ được áp dụng cho các biến đầu vào và đầu ra của FRBSs để chuẩn hóa miền xác định, miền giá trị Thông thường, các hàm tỷ lệ gồm một tham số đơn [75] hoặc là gồm hai tham số, một cận trên và một cận dưới [76] trong trường hợp tuyến tính, hoặc gồm một số tham số co/giãn trong trường hợp không tuyến tính [77, 78] Cách tiếp cận thông thường là tinh chỉnh từ một đến bốn tham số (được định nghĩa trong hàm tỷ lệ) cho mỗi biến: một tham số trong hàm tỷ lệ đơn, hai tham số trong hàm tỷ lệ tuyến tính, và từ ba hoặc bốn tham số trong hàm tỷ lệ phi tuyến Hầu hết các công trình nghiên cứu đều xem xét việc mã hóa bằng số thực các tham số của hàm tỷ lệ, nhưng cũng có thể sử dụng mã nhị phân, như trong [75], ba bit nhị phân biểu diễn một tham số của mỗi hàm tỷ lệ được sử dụng Do số lượng các biến, cũng như số lượng các tham số đã được xác định nên cách tiếp cận này sẽ cần một số lượng bit cố định để mã hóa

1.4.3 Tinh chỉnh hàm thuộc

Khi tinh chỉnh hàm thuộc, một cá thể được sử dụng để biểu diễn toàn bộ DB với

tư cách là một nhiễm sắc thể mã hóa các hàm thuộc (tương ứng với các nhãn ngôn ngữ trong mỗi phân vùng mờ của FRBS) Các dạng phổ biến nhất cho các hàm thuộc (trong GFRBSs) là hình tam giác cân trong [78, 79] hoặc không cân trong [58, 80], hình thang [81, 82], hàm Gauss [83, 84] Số lượng các tham số cho mỗi hàm thuộc thường dao động từ một đến bốn, mỗi tham số là có thể được mã hóa thành số nhị phân [85] hoặc số thực [86]

Cấu trúc của nhiễm sắc thể sẽ khác nhau tùy thuộc vào FRBSs đó sử dụng các biến ngôn ngữ (mô hình ngôn ngữ) hoặc sử dụng các biến mờ (mô hình xấp xỉ) Khi tinh chỉnh các hàm thuộc trong một mô hình ngôn ngữ [58], toàn bộ các phân vùng

mờ được mã hóa thành nhiễm sắc thể và được tinh chỉnh sao cho vẫn duy trì ngữ nghĩa trong RB Những cách tiếp cận này thường xem xét một số lượng các nhãn ngôn ngữ được định trước cho mỗi biến (không cần phải là giống nhau cho tất cả các biến) Điều này dẫn đến việc mã hóa hàm thuộc với chiều dài mã cố định Nhưng ngay cả với chiều dài mã cố định, thì số lượng nhãn ngôn ngữ liên quan đến mỗi biến vẫn có thể khác nhau, bằng cách đơn giản là định nghĩa số lượng tối đa chiều dài của

Trang 32

mã này Đây là quan niệm của [87] khi thiết kế một hệ thống TSK (đã đề cập ở mục

1.2.3.2) với các biến đầu vào ngôn ngữ

1.4.4 Học Cơ sở luật bằng GAs

Việc học RB thường giả định rằng tập các hàm thuộc trong DB đã được xác định trước Các hàm này tương ứng với các nhãn ngôn ngữ liên kết với các luật mờ trong

RB (Hình 1.7) Điều này chỉ áp dụng cho FRBSs theo mô hình ngôn ngữ, trong mô hình xấp xỉ, tinh chỉnh các luật tương đương với việc hiệu chỉnh các hàm thuộc (xem phần tiếp theo)

Ba phương pháp học được mô tả trong phần trước có thể được xem xét để học RB: phương pháp Michigan [88, 89, 90], phương pháp Pittsburgh [91, 92, 93], và phương pháp học lặp [58, 70, 72] RB có thể được biểu diễn bởi một ma trận quan hệ [93], một bảng quyết định [92], hoặc một danh sách các luật [91, 94, 95]

Các biểu diễn bằng ma trận quan hệ và bảng quyết định chỉ hữu ích khi hệ thống

đã được rút gọn số lượng của các biến, vì khi có hơn hai hoặc ba biến đầu vào thì có thể sẽ dẫn đến sự cố là kích thước bộ nhớ không còn đủ Do đó các phương pháp Pittsburgh có thể quản lý theo một mã khối Biểu diễn bằng danh sách các luật được

sử dụng nhiều nhất, áp dụng các mã hóa khác nhau cho các luật riêng biệt, và có thể được tinh chỉnh với ba phương pháp học đã đề cập ở trên Thường thì số lượng các luật trong danh sách thay đổi nhưng trong một số trường hợp, số lượng này sẽ được chặn trên Một cách tiếp cận phổ biến để mã hóa các luật là sử dụng dạng nối rời chính tắc (DNF) biểu diễn trong các hình thức của một chuỗi nhị phân chiều dài cố định [54, 72, 95] Để biểu diễn cấu trúc của một danh sách các luật, một nhiễm sắc thể có thể được tạo ra bằng cách nối các mã của các luật riêng biệt Trong cách tiếp cận Pittsburgh, mỗi nhiễm sắc thể mã hóa một Cơ sở luật RB hoặc trong cách tiếp cận Michigan, mỗi nhiễm sắc thể sẽ mã hóa một luật duy nhất

Trang 33

Hình 1.9 Quy trình học RB, sau đó học DB

Quy trình

học

Mô-đun đánh giá (RB)

RB

DB (đã xác định trước)

Qui trình học 1

Mô-đun đánh giá (RB)

RB

DB(đã xác

định trước)

Qui trình học 2

đánh giá (DB)

DB

RB

ed

Chiều dài cố định (Số các biến đầu vào và đầu ra)

Biến đầu vào thứ 1 Biến đầu ra cuối cùng

Giá trị ……… Giá trị

Biến , Giá trị ……… Biến , Giá trị

Chiều dài thay đổi

Trang 34

Hình 1.10 Sơ đồ quy trình học KB

Các luật bao gồm các mệnh đề của các biến dạng giá trị, trong đó biến có thể được xác định bởi vị trí hoặc nhãn (tên biến), và giá trị có thể có các dạng khác nhau (Hình 1.8) Khi sử dụng một mã vị trí (Hình 1.8, hàng đầu), các thông tin (giá trị) liên quan đến biến đó là vị trí của biến đó Khi sử dụng mã phi-vị trí (Hình 1.8, hàng cuối), mã của một luật bao gồm các cặp (tên biến, giá trị) Trong cả hai trường hợp, mã vị trí và

mã phi-vị trí, nội dung của phần giá trị có thể là: nhãn của một từ ngôn ngữ (của biến ngôn ngữ), mã nhị phân của một cấu trúc DNF (của biến ngôn ngữ), tham số xác định tập mờ (biến mờ) hoặc các giá trị thực (các hệ số) của đầu ra tuyến tính (đầu ra biến

của các luật theo mô hình TSK)

Ngoài việc học RB, cách tiếp cận khác nhằm hoàn thiện DB ban đầu sau khi RB

đã được tạo ra [70] Quá trình đó bao gồm một quá trình học để có tạo ra RB với một

DB đã được định nghĩa, tiếp theo là một quá trình học tương tự như mô tả trong ở phần trước đây Trong trường hợp này, quá trình điều chỉnh liên quan đến việc học tập DB được gọi là hậu học DB Hình 1.9 cho thấy cách tiếp cận này

1.4.5 Học Cơ sở Tri thức bằng GAs

Vì việc học KB bằng GAs liên quan đến các không gian tìm kiếm không đồng nhất (Hình 1.10) nên việc mã hóa KB bao gồm các biểu diễn di truyền khác nhau chẳng hạn như các nhiễm sắc thể có chiều dài thay đổi, nhiễm sắc thể gồm nhiều bộ gen và mỗi nhiễm sắc thể chỉ mã hóa một luật duy nhất thay vì mã hóa toàn bộ KB Chi phí tính toán cho việc tìm kiếm bằng giải thuật di truyền sẽ tăng lên, tỷ lệ thuận

Quy trình học

Mô-đun đánh giá (KB)

KB

Trang 35

với sự tăng lên của độ phức tạp của không gian tìm kiếm Trong GFRBs, người ta thường chọn giải pháp mã hóa từng luật riêng biệt hơn là mã hóa toàn bộ KB thành một nhiễm sắc thể, nhằm tạo ra một không gian phức tạp và linh động các luật để việc tìm kiếm một lời giải có thể khả thi và hiệu quả Một lần nữa, việc học có thể xem xét bởi ba phương pháp như: Michigan [96, 97], Pittsburgh [14, 87, 99, 100, 101], và phương pháp học luật lặp [58, 60]

Một số đề xuất học KB bao gồm các FRBSs theo mô hình Mamdani-xấp xỉ với phân hoạch phân tán [15, 97, 98, 102], các FRBSs theo mô hình Mamdani dùng ngôn ngữ (các hàm tỷ lệ và các luật [100] hoặc các hàm thuộc và các luật [101], và hệ thống

mờ dạng TSK [16, 87, 103]

Cách mã hóa KB trong các hệ thống có các biến ngôn ngữ liên quan đến việc mã hóa các luật và các hàm tỷ lệ/các hàm thuộc thành các bộ phận độc lập của một nhiễm sắc thể, hoặc sử dụng lặp đi lặp lại nhiều nhiễm sắc thể khác nhau [104] Việc mã hóa này gồm các bước:

 Mã hóa RB (có thể được xem xét bất kỳ phương pháp cho các biến ngôn ngữ được mô tả ở mục 1.4.4)

 DB sẽ được mã hóa tương tự như mô tả tại các mục (1.4.1-1.4.3)

Liên quan chặt chẽ đến sơ đồ mã hóa, quá trình lai ghép các mã di truyền của hai

cá thể cha mẹ liên quan đến các nhiễm sắc thể có chứa cấu trúc con (các luật và DB)

có thể được xử lý theo các cách khác nhau:

 Hợp nhất các cấu trúc con có cùng kiểu [87]

 Áp dụng một quá trình song song cho hai cấu trúc con thuộc hai bộ phận không liên quan [101]

 Áp dụng một quá trình tuần tự khi hai cấu trúc con liên quan, trong đó hai cấu trúc đó được lai ghép nhau [100]

1.4.6 Tóm tắt các phương pháp tiếp cận cổ điển cho GRBFS

Các cách tiếp cận để tiến hóa FRBSs bằng GAs là:

 Tinh chỉnh DB bằng GAs

 Tinh chỉnh RB bằng GAs

 Tinh chỉnh KB bằng GAs

Trang 36

Mặc dù tóm tắt trên là không đầy đủ, nhưng phần này đã tổng kết các phương pháp tiếp cận quan trọng nhất

1.5 Động cơ nghiên cứu

Hiện nay các nhà nghiên cứu quan tâm đến hai mục tiêu của FRBSs là:

 Tính diễn giải được là tính chất phụ thuộc vào cấu trúc của mô hình (càng đơn giản càng tốt), số luật (càng nhỏ càng tốt), số điều kiện trong phần tiền đề của luật (càng ít càng tốt), số nhãn cho mỗi biến là tối ưu, dạng của hàm thuộc,…

 Tính chính xác cao: sai số nhỏ khi ứng dụng

Tính diễn giải được là khả năng biểu diễn các hệ thống thuộc thế giới thực theo cách mà con người có thể hiểu được, giải thích được và có thể sử dụng các luật của

hệ thống một cách dễ dàng Do đó tính diễn giải được của một hệ thống là một tính

chất mang tính chủ quan, nên cho tới hiện nay người ta vẫn chưa đưa ra được một độ

đo cho tính chất này mà được chấp nhận bởi nhiều nhà nghiên cứu [3] Đây là một

vấn đề vẫn đang được nghiên cứu [1, 2] Vì vậy các nhà nghiên cứu thường chỉ đề

cập đến vài yếu tố đặc trưng cho tính diễn giải được của hệ thống như đã đưa ra ở trên trong các nghiên cứu của mình [1, 2, 3] Đây cũng là cách tiếp cận của đề tài về

tính diễn giải được nên luận án sẽ quan tâm đến một số yếu tố đặc trưng của tính diễn giải được Cụ thể là luận án đưa ra cách thiết kế các FRBSs có tính chính xác cao nhưng lại có cấu trúc đơn giản thể hiện qua bộ luật gọn nhẹ nhưng hiệu quả (số luật

ít, số điều kiện trong phần tiền đề của luật ít), số nhãn cho mỗi biến là tối ưu, dạng của hàm thuộc thống nhất Điều này được thể hiện qua sáu mô hình của luận án Ngoài ra, hai tính chất này thường mâu thuẫn nhau, nghĩa là nếu tính chính xác của FRBSs tăng lên thì tính diễn giải được sẽ bị giảm đi và ngược lại Do đó, vấn đề

là ta cần tìm một thỏa hiệp tốt nhất giữa hai tính chất này Nói một cách khác, ta cần tìm một thỏa hiệp (ranh giới) tối ưu cho hai tính chất này cho mỗi FRBS cụ thể; trong

đó tính chất chính xác và tính diễn giải được đều cùng tương đối tối ưu

Hình dưới đây cho một minh họa về các giai đoạn thiết kế các hệ thống mờ

Trang 37

- Vào đầu thập niên 70-80 [3], các hệ thống mờ được thiết kế bởi các chuyên gia, thường là các hệ dựa trên luật dùng ngôn ngữ tự nhiên, có tính diễn giải được cao nhưng có tính chính xác không cao

- Vào đầu những năm 90 [3], các hệ thống mờ được thiết kế tự động từ dữ liệu

số, có tính chính xác cao nhưng có tính diễn giải được thấp Các nhà nghiên cứu đã đề xuất các phương pháp thiết kế các hệ thống mờ bằng mạng nơron,

GA, v.v…

- Vào cuối những năm 90 và đến hiện nay [3], các nhà nghiên cứu đã đề cập các

hệ thống mờ đa mục tiêu và hai mục tiêu chủ yếu cần đạt được là tính diễn giải được cao và tính chính xác cao Tuy nhiên hai mục tiêu này là mâu thuẫn nhau,

do đó cần tìm một thỏa hiệp (ranh giới) tối ưu cho hai mục tiêu này trong một

hệ thống mờ Cụ thể là làm thế nào để tìm được ngưỡng tối đa e0 của tính chính xác mà không làm giảm tính diễn giải được và tìm được ngưỡng tối đa i0 của tính diễn giải được mà không làm giảm tính chính xác Khi đó cặp (e0, i0) sẽ là ranh giới tối ưu cần tìm

Hình 1.11 Các giai đoạn thiết kế các hệ thống mờ

Hệ thống mờ có tính diễn giải cao

Hệ thống mờ có tính chính xác cao

Xây dựng và huấn luyện hệ thống mờ có tính chính xác cao vào đầu những năm 90s

vào cuối những năm 90s-đến nay

Hệ thống mờ có tính diễn giải cao

được tạo ra và được hiệu chỉnh thủ

công

vào những năm 70s-80s

Trang 38

Để thực hiện điều này, đầu tiên ta cần cụ thể hóa tính chính xác qua một tiêu chuấn

kiểm nghiệm (test data) Giá trị sai số của một mô hình trong các thực nghiệm của luận án là một trong các giá trị MSE, NDEI hay PI tùy thuộc yêu cầu của bài toán đó Tiếp theo, ta cần cụ thể hóa tính diễn giải được qua một tiêu chuẩn cụ thể nào đó để

dễ đánh giá vì như đã đề cập ở trên tính diễn giải được phụ thuộc nhiều yếu tố Giả

số luật thấp hơn thì tính diễn giải sẽ cao hơn

Trong thực tế [3], mỗi bài toán đa mục tiêu thường tồn tại nhiều cặp tối ưu (e, i)

hơn hay bằng cặp (e2, i2), ký hiệu là (e1, i1) ≥ (e2, i2) nếu và chỉ nếu e1 ≥ e2 và i1 ≥ i2

Có thể kiểm tra quan hệ này là một quan hệ thứ tự bộ phận Lưu ý rằng về mặt lý

sánh được với nhau nếu (e1 > e2 mà i2 > i1)hoặc (e2 > e1 mà i1 > i2) Hơn nữa, theo

nó cũng chính là phần tử tối đại của quan hệ đó Ngoài ra trong một quan hệ thứ tự

bộ phận thì có thể có nhiều phần tối đại (nếu tồn tại) nên cũng sẽ có nhiều ranh giới tối ưu (e, i) cần tìm Tuy nhiên vì không gian tìm kiếm củ a các bài toán đa mục tiêu thường rất lớn nên hoàn toàn không dễ gì tìm kiếm một cặp (i, e) tối ưu Do đó nhà các nhà nghiên cứu đưa ra các phương pháp sử dụng GA, mạng nơron, v.v…để tìm

một cặp (i, e) xấp xỉ tối ưu

Đây cũng là hướng tiếp cận của luận án, luận án đã đề xuất sáu mô hình để giải quyết vấn đề này Việc so sánh tính diễn giải được và tính chính xác của sáu mô hình đề xuất với các kết quả của các tác giả khác sẽ được thuyết minh chi tiết trong các thực nghiệm trong chương 2 và chương 3

Trang 39

Các kỹ thuật tính toán thông minh như mạng nơron nhân tạo (Artificial Neural Networks, ANNs)[105], logic mờ (Fuzzy Logic, FL) [106], các thuật giải di truyền (Genetic Algorithms, GAs) [17, 107] là những đề tài đang được nghiên cứu rất phổ biến hiện nay Các kỹ thuật này được nghiên cứu rất nhiều vì cho phép giải được các bài toán phức tạp mà thông thường không giải được bằng các phương pháp cổ điển [18]

Gần đây, các nhà nghiên cứu các kỹ thuật tính toán thông minh đang quan tâm đến các hướng tiếp cận “lai” Một trong các hướng này là sự kết hợp giữa FL và GAs dẫn đến sự ra đời của các hệ thống di truyền mờ (Genetic Fuzzy Systems, GFSs) [11, 58] Hệ thống mờ (Fuzzy Systems, FSs) là một ứng dụng quan trọng nhất của LF FSs là một công cụ quan trọng để mô hình hóa những bài toán thực tế có tính phức tạp và không chính xác cao mà không thể mô hình hóa bằng các phương pháp cổ điển FSs là các hệ thống dựa trên các luật mờ (Fuzzy Rule-Based Systems, FRBSs) FRBSs là sự mở rộng của các hệ thống dựa trên luật cổ điển FRBSs gồm các luật

“IF-THEN” mà phần tiên đề và phần kết luận của luật sử dụng logic mờ FRBSs đã

chứng tỏ có thể giúp giải quyết các bài toán về điều khiển [108], mô hình hóa [43], phân lớp, khai thác dữ liệu ([19, 20]) GAs đã và đang được sử dụng rộng rãi và phổ biến như là một kỹ thuật tìm kiếm toàn cục GAs cho phép tìm kiếm lời giải thích hợp trong những không gian tìm kiếm lớn, phức tạp nhưng GAs chỉ cần một hàm thích nghi (Fitness function) để tối ưu hóa tìm kiếm

Do đó, gần đây GAs được sử dụng trong quá trình học và hiệu chỉnh các thành phần của một FRBS Một hệ thống như vậy gọi là hệ thống dựa trên luật mờ di truyền (Genetic Fuzzy Rule-Based Systems, GFRBSs) [11]

Điều này cho phép xây dựng các GFRBSs vừa tinh giản, vừa hiệu quả để giải các bài toán thực tế trong các hệ thống có tính chất phức tạp và không chắc chắn Đây cũng chính là mục tiêu của luận án, sẽ đề cập chi tiết hơn ở mục tiếp sau đây

1.6 Mục tiêu và phạm vi nghiên cứu

FRBSs cung cấp một công cụ hiệu quả để mô tả và xử lý vấn đề trong thế giới thực có tính chất không chắc chắn và không chính xác Do đó các FRBSs được áp dụng vào các vấn đề điều khiển, phân lớp và mô hình hóa Thành phần quan trọng

Trang 40

nhất của FRBSs là Cơ sở Tri thức (KB) KB bao gồm hai bộ phận: Cơ sở Dữ Liệu (DB) và Cơ sở Luật (RB) DB bao gồm tập các nhãn ngôn ngữ và các hàm thuộc xác định ý nghĩa của chúng RB bao gồm tập các luật mờ “IF-THEN” với tiền đề và kết luận được biểu diễn bằng ngôn ngữ tự nhiên, và các luật này kết nối bằng toán tử

"also" Điều đó có nghĩa là những các luật sẽ được kích hoạt đồng thời với cùng một

dữ liệu đầu vào Nhiều phương pháp đã được đề xuất để xây dựng tự động KB ban đầu từ dữ liệu số

 Các hướng nghiên cứu đầu tiên tập trung vào việc học RB từ một DB được xác định trước [21, 72] Hiệu quả hoạt động của FRBS chịu ảnh hưởng rất nhiều từ

DB được xác định trước

 Các hướng nghiên cứu thứ hai tập trung vào việc cải thiện hiệu suất của FRBS bằng cách tinh chỉnh DB ban đầu sau khi RB đã được tạo ra [58, 109] Quá trình này chỉ điều chỉnh các tham số của các hàm thuộc nhưng không thay đổi số lượng về các nhãn ngôn ngữ trong mỗi phân hoạch mờ nên RB sẽ không bị thay đổi

 Các hướng nghiên cứu thứ ba tập trung vào việc học để tạo ra các thành phần khác nhau cho KB ban đầu từ dữ liệu số [15, 98]

Mỗi phương pháp đều có ưu, nhược điểm thể hiện bằng những công trình nghiên cứu và các thực nghiệm liên quan Từ việc khảo sát phân tích những phương pháp này, dựa trên những giải pháp khả thi đã được công bố trên thế giới, hướng tiếp cận chính của luận án là xây dựng một hệ suy diễn mờ tinh giản nhưng vẫn có tính hiệu quả cao

Để luận án mang tính khả thi cả về lý thuyết lẫn thực tiễn và mang lại kết quả như mong muốn, tác giả đã thực hiện:

1) Nghiên cứu và phát triển Cơ sở lý thuyết cho việc xây dựng một hệ suy diễn

mờ, cụ thể là một hệ thống dựa trên luật mờ di truyền (GFRBSs) với cấu trúc tinh giản nhưng vẫn hiệu quả cao trong ứng dụng thực tế Nói cách khác, hệ thống này thỏa mãn hai mục tiêu là có tính diễn giải cao và có độ chính xác cao

Ngày đăng: 24/08/2015, 21:27

HÌNH ẢNH LIÊN QUAN

Hình 1.3 Minh họa một thuật giải GA căn bản - Tinh giản các luật trong hệ suy diễn với hệ thống có thông tin mờ
Hình 1.3 Minh họa một thuật giải GA căn bản (Trang 26)
Hình 1.4. Học theo phương pháp tiếp cận Pittsburgh. - Tinh giản các luật trong hệ suy diễn với hệ thống có thông tin mờ
Hình 1.4. Học theo phương pháp tiếp cận Pittsburgh (Trang 29)
Hình 1.12. Minh họa phạm vi nghiên cứu của đề tài. - Tinh giản các luật trong hệ suy diễn với hệ thống có thông tin mờ
Hình 1.12. Minh họa phạm vi nghiên cứu của đề tài (Trang 41)
Hình 2.1. Đồ thị minh họa của một hàm thuộc Gauss với   l    r - Tinh giản các luật trong hệ suy diễn với hệ thống có thông tin mờ
Hình 2.1. Đồ thị minh họa của một hàm thuộc Gauss với  l   r (Trang 51)
Đồ thị của ba hàm này: - Tinh giản các luật trong hệ suy diễn với hệ thống có thông tin mờ
th ị của ba hàm này: (Trang 52)
Hình 2.3. Đồ thị minh họa của một hàm thuộc tam giác với   l    r - Tinh giản các luật trong hệ suy diễn với hệ thống có thông tin mờ
Hình 2.3. Đồ thị minh họa của một hàm thuộc tam giác với  l   r (Trang 53)
Hình 2.4. Đồ thị minh họa của ba hàm thuộc khi dùng hàm tam giác. - Tinh giản các luật trong hệ suy diễn với hệ thống có thông tin mờ
Hình 2.4. Đồ thị minh họa của ba hàm thuộc khi dùng hàm tam giác (Trang 54)
Hình 2.6. Đồ thị minh họa của ba hàm thuộc khi dùng hàm hình thang - Tinh giản các luật trong hệ suy diễn với hệ thống có thông tin mờ
Hình 2.6. Đồ thị minh họa của ba hàm thuộc khi dùng hàm hình thang (Trang 56)
Hình 2.10. Sơ đồ minh họa việc khởi tạo RB ban đầu. - Tinh giản các luật trong hệ suy diễn với hệ thống có thông tin mờ
Hình 2.10. Sơ đồ minh họa việc khởi tạo RB ban đầu (Trang 60)
Hình 2.11. Các thành phần của một nhiễm sắc thể - Tinh giản các luật trong hệ suy diễn với hệ thống có thông tin mờ
Hình 2.11. Các thành phần của một nhiễm sắc thể (Trang 65)
Hình 3.1. Minh họa phương pháp chọn tập huấn luyện đại diện RTR từ tập huấn luyện ban - Tinh giản các luật trong hệ suy diễn với hệ thống có thông tin mờ
Hình 3.1. Minh họa phương pháp chọn tập huấn luyện đại diện RTR từ tập huấn luyện ban (Trang 104)
Hình 3.2. Minh họa việc chọn tập RTR i   từ tập L i . - Tinh giản các luật trong hệ suy diễn với hệ thống có thông tin mờ
Hình 3.2. Minh họa việc chọn tập RTR i từ tập L i (Trang 106)
Hình có số thứ tự là 1 và 7. Khi đó người ta nói rằng mô hình 2 (của luận án) đề xuất - Tinh giản các luật trong hệ suy diễn với hệ thống có thông tin mờ
Hình c ó số thứ tự là 1 và 7. Khi đó người ta nói rằng mô hình 2 (của luận án) đề xuất (Trang 114)
Hình 4.2. Hình minh họa quá trình tinh giản/tinh chỉnh FRBS của hướng tiếp cận thứ 1 - Tinh giản các luật trong hệ suy diễn với hệ thống có thông tin mờ
Hình 4.2. Hình minh họa quá trình tinh giản/tinh chỉnh FRBS của hướng tiếp cận thứ 1 (Trang 130)
Hình 4.1. Hình minh họa hướng tiếp cận thứ 1 của đề tài - Tinh giản các luật trong hệ suy diễn với hệ thống có thông tin mờ
Hình 4.1. Hình minh họa hướng tiếp cận thứ 1 của đề tài (Trang 130)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w