1. Trang chủ
  2. » Luận Văn - Báo Cáo

PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ HỆ PHÂN LỚP TRÊN CƠ SỞ LÝ THUYẾT TẬP MỜ VÀ ĐẠI SỐ GIA TỬ

27 395 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 27
Dung lượng 915,41 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

MỞ ĐẦU Bài toán phân lớp thường thấy trong các lĩnh vực khác nhau của đời sống xã hội như bao gồm y tế, kinh tế, nhận dạng lỗi, xử lý ảnh, xử lý dữ liệu văn bản, lọc dữ liệu Web, loại bỏ

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

Phạm Đình Phong

PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ

HỆ PHÂN LỚP TRÊN CƠ SỞ LÝ THUYẾT TẬP MỜ

Trang 2

Công trình được hoàn thành tại: Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội

Người hướng dẫn khoa học: GS TS Nguyễn Thanh Thủy

PGS TSKH Nguyễn Cát Hồ

Phản biện:

Phản biện:

Phản biện:

Luận án sẽ được bảo vệ trước Hội đồng cấp Đại học Quốc gia chấm luận án tiến sĩ họp tại vào hồi giờ ngày tháng năm

Có thể tìm hiểu luận án tại:

- Thư viện Quốc gia Việt Nam

- Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội

Trang 3

MỞ ĐẦU

Bài toán phân lớp thường thấy trong các lĩnh vực khác nhau của đời sống xã hội như bao gồm y tế, kinh tế, nhận dạng lỗi, xử lý ảnh, xử lý dữ liệu văn bản, lọc dữ liệu Web, loại bỏ thư rác, … Có nhiều hệ phân lớp quan trọng đã được đề xuất như hệ phân lớp thống kê, mạng nơ-ron, phân lớp dựa trên luật ngôn ngữ mờ, …

Hầu hết các kỹ thuật phân lớp thống kê đều dựa trên lý thuyết quyết định Bayesian có hiệu huất phân lớp phụ thuộc vào mô hình xác suất Hệ phân lớp mạng nơ-ron cần một lượng lớn các tham số cần phải ước lượng Mặt khác, kỹ thuật phân lớp thống kê và mạng nơ-ron là những hộp đen nên thiếu tính dễ hiểu đối với người sử dụng Hệ phân lớp dựa trên luật ngôn ngữ mờ (FLRBC) được nghiên cứu rộng rãi do người dùng cuối có thể sử dụng những tri thức dạng luật được trích rút từ dữ liệu có tính dễ hiểu, dễ sử dụng đối với con người như là những tri thức của họ Tiếp cận lý thuyết tập mờ không vận dụng các từ ngôn ngữ nhằm truyền đạt ngữ nghĩa của các từ do thiếu một cầu nối hình thức giữa các từ với các tập mờ tương ứng Đại số gia tử (ĐSGT) cung cấp một cơ chế hình thức sinh các tập mờ từ ngữ nghĩa định tính của các từ ngôn ngữ đã được ứng dụng một cách hiệu quả vào quá trình thiết kế tập giá trị ngôn ngữ cùng với ngữ nghĩa tính toán dựa trên tập mờ tam giác của chúng cho bài toán xây dựng tự động cơ sở luật cho FLRBC

Câu hỏi được đặt ra là việc sử dụng các tập mờ hình thang để biểu diễn ngữ nghĩa tính toán dựa trên tập mờ của các từ ngôn ngữ trong cơ sở luật của FLRBC có hiệu quả hơn việc sử dụng các tập mờ tam giác? Trong các nghiên cứu của mình, Yager đã khẳng định rằng, tập mờ tam giác chỉ là trường hợp đặc biệt của tập mờ hình thang khi điểm mút trái

và điểm mút phải của đáy nhỏ của hình thang trùng nhau Điều này có nghĩa là việc sử dụng các tập mờ hình thang trong biểu diễn ngữ nghĩa tính toán của các từ ngôn ngữ mang tính phổ quát hơn và linh hoạt hơn so với các tập mờ hình tam giác Tuy nhiên, cho tới nay, chưa có một cơ chế hình thức toán học nào cho việc sinh các tập mờ hình thang từ ngữ nghĩa định tính của các từ ngôn ngữ

Mục tiêu đặt ra của luận án: Thứ nhất là xây dựng một cơ chế hình thức toán học cho

việc sinh tự động ngữ nghĩa tính toán dựa trên tập mờ hình thang từ ngữ nghĩa định tính của các từ ngôn ngữ cho bài toán thiết kế tự động cơ sở luật cho hệ phân lớp dựa trên luật ngôn ngữ mờ Thứ hai là nghiên cứu và đề xuất một số cải tiến trong thiết kế tự động hệ phân lớp dựa trên luật ngôn ngữ mờ với ngữ nghĩa tính toán của từ ngôn ngữ được xác định dựa trên ĐSGT nhằm nâng cao chất lượng của hệ phân lớp

Với các mục tiêu đặt ra của luận án, các đóng góp của luận án là:

 Đề xuất mở rộng lý thuyết đại số gia tử mô hình hóa lõi ngữ nghĩa của các từ ngôn ngữ nhằm cung cấp một cơ chế hình thức cho việc sinh tự động ngữ nghĩa tính toán dựa trên tập mờ hình thang của khung nhận thức ngôn ngữ cho bài toán thiết

kế tự động hệ phân lớp dựa trên luật ngôn ngữ mờ

 Đề xuất phương pháp luận, các thuật toán mới trong thiết kế tự động cơ sở luật cho

hệ phân lớp dựa trên luật ngôn ngữ mờ với ngữ nghĩa tính toán dựa trên tập mờ hình thang của từ ngôn ngữ được xác định trên cơ sở lý thuyết ĐSGT mở rộng

Trang 4

 Nghiên cứu các yếu tố ảnh hưởng đến hiệu quả của các phương pháp thiết kế hệ phân lớp dựa trên luật ngôn ngữ mờ với ngữ nghĩa tính toán của từ ngôn ngữ được xác định dựa trên ĐSGT và đề xuất một số cải tiến làm tăng hiệu quả của các tiếp cận thiết kế hệ phân lớp dựa trên ĐSGT

Các nội dung và kết quả nghiên cứu được trình bày trong luận án đã được công bố trong 8 công trình khoa học, bao gồm: 1 bài báo quốc tế trong danh mục SCI; 3 bài báo ở Tạp chí Tin học và Điều khiển học; 1 bài báo ở Tạp chí khoa học, Đại học Quốc gia Hà Nội; 1 bài báo ở Tạp chí Khoa học và Công nghệ, Viện Hàn Lâm Khoa học và Công nghệ Việt Nam; 1 báo cáo trong kỷ yếu hội nghị quốc tế có phản biện được xuất bản bởi IEEE

và 1 báo cáo tại hội nghị quốc gia có phản biện

Cấu trúc của luận án Luận án được bố cục thành các phần: Mở đầu, 4 chương, kết luận

và tài liệu tham khảo

Chương 1 giới thiệu tổng quan về hệ dựa trên tri thức luật ngôn ngữ mờ và ĐSGT và

khả năng ứng dụng của ĐSGT Chương 2 trình bày lý thuyết ĐSGT mở rộng nhằm cung

cấp một cơ chế hình thức sinh lõi ngữ nghĩa và ngữ nghĩa tính toán dựa trên tập mờ hình

thang của khung nhận thức ngôn ngữ và ứng dụng trong thiết kế FLRBC Chương 3 trình

bày các kết quả thực nghiệm và so sánh đánh giá các phương pháp thiết kế FLRBC với ngữ nghĩa tính toán của từ ngôn ngữ được xác định dựa trên ĐSGT mở rộng với các

phương pháp khác Chương 4 trình bày một số cải tiến đối với các phương pháp thiết kế

FLRBC với ngữ nghĩa tính toán của từ ngôn ngữ được xác định dựa trên ĐSGT

CHƯƠNG 1 TỔNG QUAN VỀ HỆ DỰA TRÊN TRI THỨC LUẬT NGÔN NGỮ MỜ 1.1 MỘT SỐ KHÁI NIỆM CƠ BẢN

1.1.1 Tập mờ

1.1.2 Biến ngôn ngữ

1.1.3 Phân hoạch mờ

1.1.4 Luật ngôn ngữ mờ và hệ luật ngôn ngữ mờ

Luật ngôn ngữ mờ hay luật mờ if-then, được gọi tắt là luật mờ, là một phát biểu có điều kiện dưới dạng if A then B Phần if của luật được gọi là giả thuyết hay tiền đề luật, phần then của luật được gọi là phần kết luận

1.1.5 Hệ suy luận mờ

Suy luận xấp xỉ hay suy luận mờ là quá trình suy ra các kết luận dưới dạng các mệnh

đề mờ hay luật mờ trong điều kiện các quy tắc, các luật, các dữ liệu đầu vào cho trước cũng không cần xác định

1.1.6 Bài toán phân lớp dữ liệu

Bài toán phân lớp dữ liệu P được phát biểu như sau: cho một tập dữ liệu mẫu D = {(dp,

Cp), p = 1, …, m}, trong đó m là số mẫu dữ liệu, d p = [d p,1 , d p,2 , , d p,n ] là dòng thứ p trong

m mẫu dữ liệu có n thuộc tính, C = {C s | s = 1, …, M} là một tập gồm M nhãn lớp

Quá trình xây dựng mô hình phân lớp thường được chia thành hai bước:

Trang 5

Bước 1 Huấn luyện: mô hình phân lớp được xây dựng dựa trên các tập dữ liệu mẫu đã

được gán nhãn, được gọi là các tập dữ liệu huấn luyện

Bước 2 Thử nghiệm mô hình: sử dụng mô hình đã được xây dựng tại bước 1 để phân

lớp tập dữ liệu mới đã được gán nhãn được chọn ngẫu nhiên và độc lập với tập dữ liệu huấn luyện

1.2 HỆ DỰA TRÊN TRI THỨC LUẬT NGÔN NGỮ LUẬT MỜ

1.2.1 Cấu trúc của hệ dựa trên luật ngôn ngữ mờ

Hệ dựa trên luật ngôn ngữ mờ bao gồm hai thành phần chính: cơ sở tri thức và hệ suy luận Cơ sở tri thức bao gồm cơ sở dữ liệu và cơ sở luật Cơ sở dữ liệu là miền giá trị của các thuộc tính được phân hoạch thành các vùng mờ sử dụng các tập mờ Cơ sở luật là tập

hợp các tri thức liên quan đến các bài toán cần giải quyết dưới dạng các luật mờ if-then

1.2.2 Bài toán thiết kế hệ phân lớp dựa trên luật ngôn ngữ mờ

Hệ các luật mờ phân lớp bao gồm một tập luật mờ có trọng số dạng:

Luật R q : if X 1 is A q,1 and and X n is A q,n then C q with CF q , với q=1 N (1.1)

trong đó X = {X j , j = 1, , n} là tập n biến ngôn ngữ (thuộc tính) và A q,j (j=1, , n) là các giá trị ngôn ngữ của các điều kiện mờ trong tiền đề, C q là nhãn lớp kết luận của R q và N là

số luật mờ, CF q là trọng số hay độ tin cậy của luật thứ q Luật R q có thể được viết tắt dưới dạng ⟹ with CF q , trong đó A q là tiền đề của luật thứ q

Ký hiệu f p (S), f n (S) và f a (S) lần lượt là hàm đánh giá hiệu suất phân lớp của hệ S đối với tập dữ liệu huấn luyện, số luật trong hệ S và độ dài trung bình hệ S Khi đó, mục tiêu

xây dựng hệ phân lớp thỏa các mục tiêu:

Các mục tiêu trên mâu thuẫn nhau nên các phương pháp giải bài toán phân lớp dựa trên luật mờ phải cân bằng các mục tiêu trên

Các bước của bài toán thiết kế FLRBC theo tiếp cận lý thuyết tập mờ bao gồm:

Bước 1 Phân hoạch mờ (fuzzy partition) trên miền các thuộc tính của tập dữ liệu

thành các vùng mờ bằng các tập mờ tương ứng với các từ ngôn ngữ của biến ngôn ngữ

Bước 2 Trích rút các luật mờ từ các phân hoạch mờ được tạo ở bước 1 sao cho hệ luật

mờ S thu được nhỏ gọn, dễ hiểu và có hiệu suất phân lớp cao

Hai phương pháp phân hoạch mờ thường được sử dụng là phân hoạch lưới lưới và phân hoạch rời rạc Các thước đo đánh giá luật dựa trên độ tin cậy (confidence) và độ hỗ trợ (support) làm tiêu chuẩn sàng để sàng lọc ra các luật ứng viên:

trong đó là độ tương thích hay độ đốt cháy của mẫu dữ liệu d p đối với điều kiện

A q của luật R q và thường được tính bằng biểu thức toán tử nhân như sau:

Trang 6

= ∏ , , , (1.5)

- Độ tin cậy (c), độ hỗ trợ (s) và tích (c × s) đều có thể dùng làm tiêu chuẩn sàng

- Nhãn lớp của từng điều kiện tiền đề A q được xác định như sau:

Hai phương pháp lập luận phân lớp cho một mẫu dữ liệu d p = [d p,1 , d p,2 , , d p,n]:

- Phương pháp lập luận là Single Winner Rule:

- Chưa có cơ chế hình thức đánh giá tính khái quát và tính cụ thể của các từ ngôn ngữ

và bài toán thiết kế các thể hạt (granularity) cho các phân hoạch mờ trên miền các thuộc tính đảm bảo sự cân bằng giữa tính khái quát và tính cụ thể của các từ ngôn ngữ chưa được đặt ra

1.3 Đại số gia tử

1.3.1 Đại số gia tử của biến ngôn ngữ

Định nghĩa 1.4 [49] Giả sử X là một biến ngôn ngữ có miền giá trị là Dom(X) Một ĐSGT

AX tương ứng của X là một bộ 5 thành phần AX = (X, G, C, H, ≤), trong đó: (X, ≤) là cấu

trúc dựa trên quan hệ thứ tự, X là một tập giá trị ngôn ngữ của X với X  Dom(X) và ≤ là quan hệ thứ tự được cảm sinh bởi ngữ nghĩa vốn có của các từ ngôn ngữ trên X; G = {c-,

c+} là tập các phần tử sinh có quan hệ ngữ nghĩa c- ≤ c+, trong đó c- và c+ tương ứng là

phần tử sinh nguyên thủy âm và dương; C = {0, W, 1} là tập các hằng thỏa quan hệ ngữ nghĩa 0 ≤ c- ≤ W ≤ c+ ≤ 1, trong đó 0 và 1 tương ứng là phần tử nhỏ nhất và phần tử lớn nhất trong cấu trúc (X, ≤), W là phần tử trung hòa; H là tập gia tử của biến ngôn ngữ X  Với mỗi x  X, ký hiệu H(x) là tập tất cả các giá trị ngôn ngữ u  X được cảm sinh từ

x bởi các gia tử trong H và được biểu diễn bởi chuỗi u = h n …h1x, với h n , …, h1  H

Trang 7

Trong trường hợp x  {c-, c+} thì chuỗi u = h n …h1c được gọi là một biểu diễn chính tắc

nếu h j+1 …h1c ≠ hj …h1c với mọi j = 1, …, n - 1 và khi đó u có độ dài n + 1, được ký hiệu là

|u| hoặc l(u) Ký hiệu sau: X k là tập tất cả các giá trị ngôn ngữ có độ dài đúng bằng k và X (k)

là tập tất cả các giá trị ngôn ngữ có độ dài nhỏ hơn hoặc bằng k

Trong ĐSGT AX = (X, G, C, H, ≤) nếu X, G và H là tập sắp thứ tự tuyến tính thì AX

được gọi là ĐSGT tuyến tính Một số tính chất của ĐSGT:

- Dấu của c+ là sign(c+) = +1, dấu của c- là sign(c-) = -1

- Tập các gia tử dương là H+ = {h j : 1 ≤ j ≤ p} và có dấu sign(h j) = +1, tập các gia tử là

H- = {h j : -q ≤ j ≤ -1} và có dấu sign(h j ) = -1 và ta có H = H+  H-

- Gia tử k là dương đối với gia tử h nếu k làm tăng ngữ nghĩa của h và khi đó dấu sign(k, h) = +1 Ngược lại, k là âm đối với h nếu k làm giảm ngữ nghĩa của h và có dấu sign(k, h) = -1 Dấu của một hạng từ x với x = h m h m-1 …h 2 h 1 c, trong đó c  {c-, c+} và h j

H, được tính như sau:

Sign(x) = sign(h m , h m-1 ) × … × sign(h 2 , h 1 ) × sign(h 1 ) × sign(c) (1.16)

Ý nghĩa của dấu của từ là: nếu sign(hx) = +1 thì x ≤ hx, và nếu sign(hx) = -1 thì hx ≤ x

- Tính kế thừa trong cảm sinh các giá trị ngôn ngữ của các gia tử Khi một giá trị ngôn ngữ hx được cảm sinh từ x bằng việc tác động gia tử h vào x thì ngữ nghĩa của hx thay đổi nhưng vẫn truyền đạt ngữ nghĩa gốc của x Tính chất này góp phần bảo toàn quan

hệ thứ tự ngữ nghĩa: nếu hx ≤ kx thì h’hx ≤ k’kx, hay h’ và k’ bảo tồn quan hệ ngữ nghĩa của hx và kx một cách tương ứng

Hai từ ngôn ngữ x và y được gọi là độc lập nếu x  H(y) và y  H(x)

Một ĐSGT AX được gọi là tự do nếu với mọi x  H(G) thì hx ≠ x Nghĩa là AX là tự do

nếu và chỉ nếu chỉ có các hằng tử là các phần tử bất động

Định lý 1.1 [49] Cho tập H- và H+ là các tập sắp thứ tự tuyến tính của ĐSGT AX = (X, G,

C, H, ≤) Khi đó ta có các khẳng định sau:

(1) Với mỗi u  X thì H(u) là tập sắp thứ tự tuyến tính

(2) Nếu X được sinh từ G bởi các gia tử và G là tập sắp thứ tự tuyến tính thì X cũng là tập sắp thứ tự tuyến tính Hơn nữa nếu u < v, và u, v là độc lập với nhau, tức là u  H(v)

và v  H(u), thì H(u)  H(v) 

1.3.2 Lượng hóa đại số gia tử

Xét bất kỳ ánh xạ υ của một ĐSGT AX đảm bảo tính bảo toàn cấu trúc thứ tự trên miền giá trị của X Đẳng cấu υ đảm bảo việc cảm sinh ánh xạ của mọi mô hình tính mờ

H(x) của một từ ngôn ngữ x tới một khoảng nằm trong đoạn [0, 1], được gọi là khoảng tính

mờ của x và được ký hiệu là (x) Độ dài của (x) được gọi là độ đo tính mờ của x và được ký hiệu là fm(x) Với ý tưởng trên, độ đo tính mờ được tiên đề hóa như sau:

Định nghĩa 1.5 Một hàm fm: X  [0, 1] được gọi là một độ đo tính mờ của biến ngôn

ngữ X, nếu nó có các tính chất sau:

(FM1) fm là một độ đo đầy đủ trên X, nghĩa là fm(c) + fm(c+) = 1 và, u  X,

Trang 8

(FM3) x, y  X, h  H, ta có fm(hx)/x = fm(hy)/y, nghĩa là tỷ số này không phụ thuộc

vào một phần tử cụ thể nào trong X mà chỉ phụ thuộc vào h được gọi là độ đo tính mờ của

gia tử h và được ký hiệu là (h) 

Công thức tính đệ quy độ đo tính mờ của x = h m h 1 c với c  {c-, c+} như sau:

fm(x) = (h m) (h 1 ) fm(c), trong đó ( ) 1

h H h

c fm c h fm p

i q

x fm x

h fm i p i q

1

)( , với ,  > 0 và  +  = 1 

Định nghĩa 1.6 Ngữ nghĩa số của các từ ngôn ngữ hay ánh xạ định lượng ngữ nghĩa của

AX là ánh xạ bảo toàn thứ tự υ: X  [0,1] thỏa mãn các điều kiện sau:

SQM1) υ bảo toàn thứ tự trên X, tức là x < y  υ(x) < υ(y) và υ(0) = 0, υ(1) = 1;

SQM2) υ là song ánh và ảnh của X, υ(X), là trù mật trong đoạn [0, 1] ; 

Mệnh đề 1.2 Ánh xạ định lượng ngữ nghĩa nhờ tính mờ là ánh xạ υ được xác định:

1) υ(W) =  = fm(c  ), υ(c ) =  - fm(c  ), υ(c +) =  +fm(c +);

x h

)(

()(1

[2

1)

 h j x  Sign h j x Sign h p h j x   

1.3.3 Ý nghĩa ứng dụng của đại số gia tử

ĐSGT đã được ứng dụng thành công trong các lĩnh vực như điều khiển mờ, hồi quy

và dự báo, thiết kế FLRBC, Trong những ứng dụng như vậy, ngữ nghĩa của các từ ngôn ngữ được sử dụng trong biểu diễn các luật ngôn ngữ mờ cần được biểu thị bằng tập mờ

phù hợp với ngữ nghĩa vốn có của chúng Với độ đo tính mờ của |H| - 1 gia tử, độ đo tính

mờ của một phần tử sinh (fm(c-) hoặc fm(c+)) và một số nguyên dương k giới hạn độ dài tối

Trang 9

đa của các từ ngôn ngữ được gọi là các tham số ngữ nghĩa, ký hiệu là Л Khi cho một bộ

giá trị cụ thể của các tham số ngữ nghĩa, các giá trị định lượng của các từ ngôn ngữ được tính toán và ngữ nghĩa tính toán dựa trên tập mờ của chúng được xây dựng Giá trị định lượng của mỗi từ ngôn ngữ là một điểm nằm trong khoảng tính mờ liên kết với độ đo tính

mờ tương ứng xác định đỉnh của tập mờ tam giác Như vậy, ngữ nghĩa tính toán dựa trên tập mờ của các từ ngôn ngữ được tích hợp với nhau dựa trên cơ chế hình thức hóa chặt chẽ, trong đó các tham số tính mờ của ĐSGT sinh ra các tập mờ tam giác của tất cả các từ ngôn ngữ của ĐSGT hay biến ngôn ngữ Nghĩa là các đại lượng xác định các tập mờ bị ràng buộc với nhau và có thể được hiệu chỉnh thích nghi nhờ các tham số tính mờ

1.3.4 Những vấn đề tồn tại

Lý thuyết ĐSGT truyền thống các giả thiết trong các tiên đề khá chặt làm mất đi tính mềm dẻo trong biểu diễn ngữ nghĩa của các từ ngôn ngữ và trong ứng dụng giải các bài

toán thực tế Chẳng hạn, độ đo tính mờ của phần tử trung hòa W và hai phần tử 0 và 1 phải

bằng 0 mặc dù trong các ứng dụng thực tế đều thường xây dựng các tập mờ cho chúng

Do trong cơ chế hình thức sinh ngữ nghĩa tính toán dựa trên tập mờ từ ngữ nghĩa định tính của các từ ngôn ngữ cho FLRBC, ngữ nghĩa số của các từ ngôn ngữ chỉ là một điểm nằm trong khoảng tính mờ tương ứng nên chỉ đủ cơ sở để xây dựng các tập mờ tam giác

1.4 KẾT LUẬN CHƯƠNG 1

Trong chương này, luận án đã hệ thống lại những kiến thức cơ sở liên quan đến các

hệ dựa trên luật ngôn ngữ mờ, đại số gia tử và khả năng ứng dụng

CHƯƠNG 2 LÕI NGỮ NGHĨA VÀ NGỮ NGHĨA HÌNH THANG CỦA KHUNG NHẬN THỨC

NGÔN NGỮ VÀ ỨNG DỤNG GIẢI BÀI TOÁN PHÂN LỚP 2.1 MỞ RỘNG ĐSGT CHO VIỆC MÔ HÌNH HÓA LÕI NGỮ NGHĨA CỦA CÁC

TỪ NGÔN NGỮ

Hình 2.1 Mối quan hệ giữa từ “nhanh” và “rất nhanh” của biến ngôn ngữ TOCDO và

các giá trị của tập nền U được biểu diễn dưới dạng các tập mờ

Mọi từ mang ngữ nghĩa không rõ ràng x của một biến ngôn ngữ với miền tham chiếu

số U biểu diễn mối quan hệ của x với các giá trị của U, tức là mọi giá trị số của U phù hợp

với x ở một độ chắc chắn nhất định Mối quan hệ giữa từ “nhanh” và “rất nhanh” của biến

ngôn ngữ TOCDO và các giá trị của U có thể được biểu diễn dưới dạng các tập mờ như

trong Hình 2.1 Ký hiệu Core(x) là lõi ngữ nghĩa của của x thì Core(x) = {(u,  x (u)):  x (u)

1

200

150

rất nhanh nhanh

lõi

Trang 10

= 1} và ngữ nghĩa của x là tập Sem(x) = {(u,  x (u)):  x (u)  [0, 1]} Lõi ngữ nghĩa của hai

từ ngôn ngữ bất kỳ x, y  X và ngữ nghĩa tương ứng của chúng thỏa các điều kiện sau:

(C1) Core(x)  Sem(x);

(C2) Nếu x ≤ y thì Core(x) ≤ Core(y), Core(x) ≤ Sem(y) và Sem(x) ≤ Core(y)

Trong phương pháp hình thức hóa ĐSGT, lõi ngữ nghĩa của từ ngôn ngữ x cần được sinh từ gia tử nên một gia tử nhân tạo h 0 được bổ sung nhằm cảm sinh lõi ngữ nghĩa của x

là h 0 x Việc mở rộng một ĐSGT tuyến tính AX được thực hiện như sau

Định nghĩa 2.1 Mở rộng ngữ cảnh của một ĐSGT tuyến tính và tự do AX = (X, C, G, H,

) là ĐSGT mở rộng AX mr = (X mr , C, G, H mr , ), trong đó C cũng là tập các hằng tử của

AX mr , H mr = H I  {h0} = H +  H  {I, h0}, ở đó H = {h -q , …, h-2, h -1 }, h -q < < h-2 < h -1

và H + = {h1, h2 , , h p }, h1 < h2 < < h p , nghĩa là H I = H  {I}, X mr = X  {h0x | x  X}

và ≤ là quan hệ thứ tự mở rộng của X trên X mr, nếu nó thỏa các tiên đề sau:

(A1) Toán tử đơn vị V (phần tử lớn nhất) trong H + là dương hoặc âm đối với đối với

mọi gia tử trong H Chẳng hạn V là dương đối với chính nó và đối với L trong H -

(A2) Nếu u, v  X là độc lập, tức là u  H I (v) và v  H I (u) thì x  H I (u)  x  H I (v)

(A3) Kế thừa gia tử: Với x  X, h, k, h’, k’  H, ta có:

(i) x ≠ hx  x  H I (hx)

(ii) h ≠ k & hx  kx  h’hx  k’kx

(iii) hx ≠ kx thì hx và kx là độc lập

(A4) u  X, nếu v  H I (u) và v  u (v ≥ u) thì v  hu (v ≥ hu) với x  H I

(A5mr) Các tiên đề cho lõi ngữ nghĩa của từ ngôn ngữ: với x, y  X mr và x ≠ y,

(i) hh0x = h0x với h  Hmr và với x  X, h0x = x khi và chỉ khi x là hằng,

ngược lại x và h0x là không sánh được

(ii) Với ∀ , ∈ , < ⟹ ℎ < & < ℎ 

Các tiên đề của AX mr được bổ sung nhằm mục đích mô tả các đặc trưng của lõi ngữ nghĩa của các từ ngôn ngữ dưới dạng quan hệ thứ tự

Định lý 2.1 Cho AX mr = (X mr , C, G, H mr, ) là một ĐSGT mở rộng của một ĐSGT tuyến

tính và tự do AX = (X, C, G, H, ) Khi đó,

(i) X mr = X  {h 0 x: x  X \ C } và với x  C, h 0 x  X

(ii) x, y  X mr , x ≠ y, ta có < ⟺ < ℎ ⟺ ℎ < ⟺ ℎ < ℎ Vì vậy

tập {h 0 x: x  X} được sắp tuyến tính

(iii) Tập = ∪ {ℎ : ∈ ( )} được sắp tuyến tính 

Định lý sau khẳng định các tiên đề từ (A2) đến (A4) vẫn đúng đối với AX mr

Định lý 2.2 Cho AX mr = (X mr , C, G, H mr, ) là một ĐSGT mở rộng của một ĐSGT tuyến

tính và tự do AX = (X, C, G, H, ) Nếu các tập X và H xuất hiện trong các tiên đề (A2),

Trang 11

(A3), (A4) được thay thế tương ứng trong bởi X mr và H mr thì các mệnh đề được ký hiệu tương ứng là (A2mr), (A3mr), (A4mr) vẫn đúng đối với AX mr

Định lý 2.3 Mọi từ ngôn ngữ được cảm sinh từ AX mr có biểu diễn chính tắc duy nhất 

2.2 MỞ RỘNG KHÁI NIỆM ĐỘ ĐO TÍNH MỜ

Để bảo đảm tính linh hoạt trong ứng dụng, ta giả thiết độ đo tính mờ của phần tử trung

hòa W là khác 0, tức fm(W) ≠ 0 Khi đó, hệ tiên đề của độ đo tính mờ mở rộng của AX mr

được phát biểu như sau:

Định nghĩa 2.2 Cho AX mr = (X mr , C, G, H mr, ) là một ĐSGT mở rộng của một ĐSGT

tuyến tính và tự do AX Một hàm fm : X mr  [0,1] được gọi là độ đo tính mờ của ĐSGT

AX mr nếu nó thỏa các tính chất sau:

(fm1) fm(c - ) + fm(W) + fm(c +) = 1;

(fm2)  hHmr fm(hu) = fm(u), uH(G);

(fm3) h  H mr và x, y  H(G) thỏa x, y ≠ h 0 z thì

)(

)()

(

)(

y fm

hy fm x

fm

hx fm

2.3 HỆ KHOẢNG TÍNH MỜ LIÊN KẾT VỚI ĐỘ ĐO TÍNH MỜ

Gọi PI([0, 1]) là tập tất cả các khoảng con của đoạn [0, 1] Ta luôn luôn quy ước là các

khoảng đều đóng ở đầu mút trái và mở ở đầu mút phải, trừ khi đầu mút phải là giá trị 1 Ta

có khái niệm khoảng tính mờ  của các từ ngôn ngữ của X mr , (x) với ∈ ( ) ={ ∈ : | | ≤ } = ( ) ∪ {ℎ : ∈ ( )}, dựa trên hệ tiên đề của độ đo tính mờ:

Định nghĩa 2.3 Cho một ĐSGT mở rộng AX mr = (X mr , C, G, H mr, ) của một ĐSGT tuyến

tính và tự do AX và độ đo tính mờ fm: X mr  [0, 1] thỏa các tính chất trong Định nghĩa

2.2 Giả sử mỗi từ ngôn ngữ x  ( ) được liên kết với một khoảng trong PI([0, 1]) Các khoảng này được gọi là các khoảng tính mờ mức k của các từ ngôn ngữ tương ứng của

AX mr và nó được xây dựng quy nạp theo k như sau:

1) Với k = 1, xây dựng các khoảng tính mờ 1(c-), 1(W), 1(c+) với |1(x)| = fm(x), sao cho chúng có thứ tự tương đồng với thứ tự của các hạng từ c-, W, c+

Trang 12

2) Với k > 1 và xC, xây dựng các khoảng tính mờ  k (x) sao cho (i) nếu |x| < k - 1 thì

|k (x)| = | k-1 (x)|, (ii) nếu |x| = k - 1 thì | k (x)| = (h 0 )fm(x), (iii) nếu |x| = k thì | k (x)| =

fm(x), (iv) thứ tự của các khoảng tính mờ tương đồng với thứ tự của các hạng từ x, tức là,

với x, y  {hx: h  H mr }, nếu x ≤ y thì  k (x) ≤  k (y) 

Thuật toán 2.1 Thuật toán xây dựng hệ khoảng tính mờ

Đầu vào: ( ) = {c  , W, c + }, các tham số của AX mr và số k là độ dài tối đa của các từ

Đầu ra:  là tập các khoảng với nhãn là các từ ngôn ngữ trong ( )

Khởi tạo j = 1 và tập  bằng rỗng

Bước 1: Với j = 1, xây dựng các khoảng I(x)  [0,1], với x  ( ) sao cho |I(x)| =

fm(x) và nếu x < x’ thì I(x) < I(x’)  =   I(x), là tập chứa các khoảng của các từ của

( ) có thứ tự tương đồng với thứ tự giữa các từ ngôn ngữ và là phân hoạch của [0,1] Nếu k = 1 thì dừng, ngược lại nếu k > 1 thì thực hiện Bước 2

Bước 2: j = j + 1 Xây dựng các khoảng của các từ ngôn ngữ x  ( ) như sau:

(i) Với các từ ngôn ngữ x thỏa |x| < j – 1, giữ nguyên các khoảng I(x)  ;

(ii) Với mỗi y thỏa |y| = j – 1, xây dựng các khoảng con I(hy)  I(y) với I(y)   sao

cho |I(hy)| = (h)|I(y)|, h  H mr có thứ tự tương đồng với thứ tự của các từ ngôn ngữ

 =   I(y), tập các khoảng được gán tương ứng cho các từ trong ( );

Bước 3 (bước lặp): Lặp lại Bước 2 cho đến khi j = k 

Kết thúc thuật toán, ta thu được  là tập các khoảng với nhãn là các từ trong ( )

Định lý 2.4 Thuật toán 2.1 về xây dựng các khoảng tính mờ là đúng đắn và các khoảng

tính mờ của ( ) có các tính chất sau:

(1) Với mỗi x thỏa |x| = k, khoảng tính mờ mức k của x,  k (x), thỏa | k (x)| = fm(x), còn với x mà |x| < j  k,  k (x) = I(h0x) và |k (x)| = (h0 )fm(x), tức là các hạng từ độ dài ngắn hơn j có mặt trong ngữ cảnh cùng các hạng từ độ dài j sẽ có ngữ nghĩa bị co lại;

(2) Với mọi x  ( ) thỏa |x| = j < k, ta có  k (x) = I(h0x) và | k (x)| = (h0 )fm(x) Với x thỏa |x| = j  k – 2, ta có  k (x) =  k-1 (x)

(3) Tập tất cả các khoảng tính mờ mức k, FI (k) = {k (x), x  ( )}, có các tính chất:

a- Đối với hạng từ hằng W, ta có  k (W) = 1(W);

b- Với mỗi x  H({c  ,c + }) thỏa |x| = k – 1, tập các khoảng tính mờ { k (hx): h  H mr}

là một phân hoạch nhị phân của khoảng tính mờ k-1 (x) mức k – 1 của x

c- Các khoảng tính mờ trong FI(k) có thứ tự tương đồng với thứ tự của các hạng từ của chúng và lập thành một phân hoạch nhị phân của đoạn [0,1] 

2.4 ÁNH XẠ NGỮ NGHĨA ĐỊNH LƯỢNG KHOẢNG

Định nghĩa 2.4 Cho AX mr là ĐSGT mở rộng của AX tuyến tính và tự do, ánh xạ f : X mr

PI([0, 1]) được gọi là ánh xạ định lượng khoảng của AX mr nếu nó thỏa các điều kiện sau:

(IQ1) f bảo toàn thứ tự trên X mr , tức là nếu x  y thì f(x)  f(y), với x, y  X mr ;

(IQ2) f(X mr) là tập trù mật trong [0, 1] 

Trang 13

Định lý 2.5 Cho độ đo tính mờ fm của ĐSGT AX mr và  là tập tất cả các khoảng tính mờ

của các từ ngôn ngữ của AX mr được xác định bởi fm Khi đó ánh xạ f: X mr    PI[0, 1]

được định nghĩa như sau là ánh xạ định lượng khoảng:

f(x) =  |x|+1 (h 0 x)  PI[0, 1], với x, y  X mr (2.5)

với lưu ý rằng, nếu x = h0z thì f(x) = |x|+1(h 0 x) =  |x| (h 0 z) 

2.5 MỞ RỘNG ĐỘ ĐO TÍNH MỜ CỦA CÁC PHẦN TỬ 0 VÀ 1

ĐSGT mở rộng AX mr được mở rộng thành ĐSGT mở rộng toàn phần với độ đo tính mờ

của hai phân tử 0 và 1 khác 0 và được ký hiệu là AX mrtp Khi đó, hệ tiên đề của độ đo tính

mờ mở rộng của AX mrtp được phát biểu như sau:

Định nghĩa 2.5 Cho một ĐSGT mở rộng toàn phần AX mrtp = (X mr , C, G, H mr, ) của một

ĐSGT mở rộng tự do AX mr Một hàm fm : X mr  [0,1] được gọi là độ đo tính mờ của

ĐSGT AX mrtp nếu nó thỏa các tính chất sau:

(fmc1) fm(0) + fm(c - ) + fm(W) + fm(c + ) + fm(1) = 1;

(fmc2)  hHmr fm(hu) = fm(u), uH(G);

(fmc3) h  H mr và x, y  H(G) thỏa x, y ≠ h 0 z thì

)(

)()

(

)(

y fm

hy fm x

fm

hx fm

Từ Định lý 2.4, điểm mút trái của f(x) qua các độ đo tính mờ với k = |x| được tính:

Công thức (2.6) chưa thể hiện mối quan hệ giữa giá trị định lượng và các tham số của

từ Định lý sau cung cấp công thức đệ quy tính L(f(x)) Giả sử H+ = {h j : j = 1, …, p}, H - =

{ h j : j = -1, …, -q}, = ∑ (ℎ ) và = ∑ (ℎ ) Ta có, + + (ℎ ) = 1

Định lý 2.6 Điểm mút trái của giá trị định lượng f được cảm sinh bởi các độ đo tính mờ

fm được tính đệ quy theo thủ tục sau:

Luận án áp dụng phương pháp hai giai đoạn thiết kế FLRBC với ngữ nghĩa tính toán

của các từ được xác định bởi ĐSGT AX mr và AX mrtp , điểm khác biệt so với ĐSGT AX:

1) Thứ nhất, trong bước thiết kế các từ ngôn ngữ cho các thuộc tính của tập dữ liệu

huấn luyện, mỗi thuộc tính được liên kết với một ĐSGT AX mr hoặc AX mrtp thay vì AX Tập các từ mức k trong X k đã bao gồm đầy đủ các hạng từ ngôn ngữ có độ dài nhỏ hơn hoặc

bằng k và tạo thành một phân hoạch trên miền giá trị định lượng chuẩn hóa [0, 1]

Ngày đăng: 13/07/2016, 06:12

HÌNH ẢNH LIÊN QUAN

Hình 2.1. Mối quan hệ giữa từ “nhanh” và “rất nhanh” của biến ngôn ngữ TOCDO và - PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ HỆ PHÂN LỚP TRÊN CƠ SỞ LÝ THUYẾT TẬP MỜ VÀ ĐẠI SỐ GIA TỬ
Hình 2.1. Mối quan hệ giữa từ “nhanh” và “rất nhanh” của biến ngôn ngữ TOCDO và (Trang 9)
Hình 2.5. Các tập mờ được thiết kế theo cấu trúc đơn thể hạt được sinh bởi ĐSGT AX mr - PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ HỆ PHÂN LỚP TRÊN CƠ SỞ LÝ THUYẾT TẬP MỜ VÀ ĐẠI SỐ GIA TỬ
Hình 2.5. Các tập mờ được thiết kế theo cấu trúc đơn thể hạt được sinh bởi ĐSGT AX mr (Trang 14)
Hình 2.7. Các tập mờ được thiết kế theo cấu trúc đa thể hạt được sinh bởi ĐSGT AX mr - PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ HỆ PHÂN LỚP TRÊN CƠ SỞ LÝ THUYẾT TẬP MỜ VÀ ĐẠI SỐ GIA TỬ
Hình 2.7. Các tập mờ được thiết kế theo cấu trúc đa thể hạt được sinh bởi ĐSGT AX mr (Trang 15)
Bảng 3.14. So sánh các kết quả thực nghiệm giữa hệ phân lớp FRBC_AX mrtp  và hai hệ - PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ HỆ PHÂN LỚP TRÊN CƠ SỞ LÝ THUYẾT TẬP MỜ VÀ ĐẠI SỐ GIA TỬ
Bảng 3.14. So sánh các kết quả thực nghiệm giữa hệ phân lớp FRBC_AX mrtp và hai hệ (Trang 18)
Bảng 3.17. So sánh các kết quả thực nghiệm của hệ phân lớp FRBC_AX mr  so với hai hệ - PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ HỆ PHÂN LỚP TRÊN CƠ SỞ LÝ THUYẾT TẬP MỜ VÀ ĐẠI SỐ GIA TỬ
Bảng 3.17. So sánh các kết quả thực nghiệm của hệ phân lớp FRBC_AX mr so với hai hệ (Trang 19)
Bảng 3.23. So sánh các kết quả thực nghiệm của hệ phân lớp FRBC_AX mrtp  và - PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ HỆ PHÂN LỚP TRÊN CƠ SỞ LÝ THUYẾT TẬP MỜ VÀ ĐẠI SỐ GIA TỬ
Bảng 3.23. So sánh các kết quả thực nghiệm của hệ phân lớp FRBC_AX mrtp và (Trang 20)
Bảng 3.20. So sánh các kết quả thực nghiệm của hệ phân lớp FRBC_AX mrtp  so với hai hệ - PHÁT TRIỂN MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ HỆ PHÂN LỚP TRÊN CƠ SỞ LÝ THUYẾT TẬP MỜ VÀ ĐẠI SỐ GIA TỬ
Bảng 3.20. So sánh các kết quả thực nghiệm của hệ phân lớp FRBC_AX mrtp so với hai hệ (Trang 20)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w