1. Trang chủ
  2. » Luận Văn - Báo Cáo

Phương pháp trích rút các luật mờ phân lớp dựa trên đại số gia tử và ứng dụng

67 481 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 67
Dung lượng 2,2 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Định nghĩa 1.5 [1]: Biến ngôn ngữ được xác định bởi một bộ 5 thành phần X, TX, U, R, M trong đó: X – là tên biến TX – là tập các giá trị ngôn ngữ của biến X U – là không gian tham chi

Trang 1

LỜI NÓI ĐẦU

Trong cuộc sống loài người, ngôn ngữ được hình thành một cách tự nhiên

để giải quyết nhu cầu trao đổi thông tin với nhau Hơn thế, nó là công cụ để con người mô tả các sự vật, hiện tượng trong thế giới thực và dựa trên đó để tư duy, lập luận đưa ra những nhận định, phán quyết nhằm phục vụ cho cuộc sống xã hội Ngày nay khoa học và công nghệ đã có những phát triển vượt bậc, nhiều máy móc thiết bị được tạo ra đã góp phần giải phóng sức lao động của con người Trong đó lĩnh vực công nghệ thông tin đã có những đóng góp vô cùng to lớn cho sự phát triển kinh tế - xã hội nói chung và giúp giải phóng sức lao động không chỉ là lao động chân tay mà còn cả lao động trí óc của con người nói riêng Công nghệ thông tin đã góp phần đưa khả năng tư duy, lập luận và sự sáng tạo kiểu như bộ não người vào máy móc thiết bị để “thông minh hơn” Để thực hiện điều này, rất nhiều nhà khoa học đã và đang nghiên cứu cả về lý thuyết lẫn ứng dụng, đưa ra các phương pháp, các quy trình nhằm kế thừa, mô phỏng khả năng của con người vào các thiết bị máy móc Trước hết, các nhà khoa học đã phải hình thức hóa toán học các vấn đề ngôn ngữ và xử lý ngôn ngữ

mà con người vẫn làm Người đi tiên phong trong lĩnh vực này là Lotfi A Zadeh, ông đã đề xuất khái niệm mờ từ những khái niệm mơ hồ, không rõ ràng

Cho đến nay, hệ mờ phân lớp dạng luật (FRBCS) là mô hình được nhiều tác giả quan tâm nghiên cứu và sử dụng trong khai phá dữ liệu, tìm kiếm tri thức

từ dữ liệu cho bài toán phân lớp Thế mạnh của mô hình này là có thể cung cấp được cho người dùng cuối những tri thức dạng luật dễ hiểu, dễ sử dụng đối với con người như là những tri thức của họ Với việc sử dụng tập mờ và lôgic mờ, các nghiên cứu đều tìm kiếm phương pháp xây dựng hệ mờ phân lớp dạng luật nhằm đạt hai mục tiêu chính: thứ nhất, hiệu quả phân lớp của hệ càng cao càng tốt; thứ hai, tính phức tạp của hệ đồng thời càng nhỏ càng tốt

Trang 2

Mô hình xây dựng hệ luật mờ phân lớp dựa trên đại số gia tử được đề xuất với mục tiêu xây dựng hệ luật mờ để ứng dụng phân lớp cho các mẫu dữ liệu sao cho hệ luật phải có hiệu quả phân lớp cao, càng đơn giản, dễ hiểu và tường minh đối với người dùng càng tốt

Tên đề tài được lựa chọn là “Phương pháp trích rút các luật mờ phân lớp dựa trên đại số gia tử và ứng dụng” Nội dung của luận văn được bố cục

thành các phần như sau:

Chương 1 Kiến thức cơ bản về hệ mờ và lập luận xấp xỉ

Chương 2 Phương pháp trích rút luật mờ phân lớp dựa trên đại số gia tử Chương 3 Cài đặt thử nghiệm và đánh giá

Trang 3

CHƯƠNG 1:

KIẾN THỨC CƠ BẢN VỀ HỆ MỜ VÀ LẬP LUẬN XẤP XỈ

1.1 Khái quát về lập luận xấp xỉ (lập luận mờ)

Từ năm 1965 Zadeh đưa ra lý thuyết tập mờ, logic mờ nhưng phải đến những thập niên cuối của thế kỷ XX lý thuyết tập mờ, logic mờ mới được đặc biệt quan tâm nghiên cứu và ứng dụng vào trong lý thuyết điều khiển, hệ thống

và trí tuệ nhân tạo Tập mờ và logic mờ dựa trên các suy luận của con người về các thông tin không đầy đủ để hiểu biết và điều khiển hệ thống Điều khiển mờ chính là mô phỏng cách xử lý thông tin và điều khiển của con người đối với các đối tượng, do vậy điều khiển mờ đã giải quyết thành công rất nhiều vấn đề điều

khiển phức tạp trước đây chưa giải quyết được

1.1.1 Định nghĩa tập mờ

Định nghĩa 1.1: [4] Cho tập vũ trụ U với các phần tử ký hiệu bởi x, U={x} Một tập mờ A trên U là tập được đặc trưng bở một hàm (x) mà nó liên kết mỗi phần tử x U với một số thực trong đoạn [0,1] Giá trị hàm (x) biểu diễn mức độ thuộc của x trong A (x) là một ánh xạ từU vào [0,1] và được gọi

là hàm thuộc của tập mờ A[1]

Hay A được gọi là tập mờ khi và chỉ khi:

A = {(x, (x) x U, (x): U [0,1]} (1) Trong đó (x) được gọi là hàm thuộc của tập mờ A

Giá trị hàm (x) càng gần tới 1 thì mức độ thuộc của x trong A càng cao Tập mờ là sự mở rộng của khái niệm tập hợp kinh điển Khi A là tập hợp kinh điển thì A có thể được biểu diễn như sau

A = {(x, (x) x U, (x): U {0,1}} (2)

Trang 4

Khi đó hàm thuộc (x) chỉ nhận hai giá trị 0 và 1

1.1.2 Số mờ

Định nghĩa 1.2: [4] Tập mờ A trên đường thẳng số thực R là một số mờ,

nếu:

1.A chuẩn hóa, tức là có điểm x’ sao cho (x’) = 1

2 Ứng với mỗi R, tập mức {x: (x) ≥ } là đoạn đóng trên R

Trang 5

Khái niệm về phân hoạch mờ (fuzzy partition) cũng là một trong khái niệm quan trọng trong việc tiếp cận giải quyết bài toán phân lớp

1

0

c

Trang 6

1.1.3 Định nghĩa phân hoạch mờ

Theo [4] Cho p điểm cố định m 1 <m 2 <…<m p trong tập U = [a, b] R Khi

đó tập gồm p tập mờ A 1 , A 2 ,…, A p(với , , …, là các hàm thuộc tương ứng) định nghĩa trên U được gọi là một phân hoạch mờ của U nếu các điều kiện

Trang 7

1.1.4.2 Phép phủ định:

Phủ định (negation) là một trong những phép toán logic cơ bản Để suy rộng chúng ta cần tới toán tử v(Not P) xác định giá trị chân lý của Not P đối với mệnh đề P

Định nghĩa: Hàm n: [0, 1]  [0, 1] không tăng thoả mãn các điều kiện n(0) = 1, n(1) =0 gọi là hàm phủ định

Hàm n là phép phủ định mạnh, nếu n giảm chặt và n(n(x)) = x với mỗi x

Trang 8

Ví dụ: n(x) = 1- x, n(x) = 1- x2

1.1.4.3 Phép hội:

Phép hội (vẫn quen gọi là phép AND – conjunction) là một trong những phép toán cơ bản nhất Nó cũng là cơ sở để định nghĩa phép giao của hai tập mờ

Định nghĩa 1.3: [4] Hàm T: [0, 1] x[0, 1]  [0, 1] là một phép hội hay t –

chuẩn (chuẩn tam giác hay t- norm) nếu thoả mãn các điều kiện sau:

Định nghĩa 1.4: [4] Hàm S : [0, 1]x[0, 1]  [0, 1] gọi là phép tuyển hay

là t - đối chuẩn (t – conorm) nếu thoả mãn các tiên đề sau:

1) S(0, x) = x với mọi 0  x  1

2) S có tính giao hoán: S(x, y) = S(y, x) với mọi 0  x, y  1

3) S không giảm theo nghĩa s(x, y)  s(u, v) với x  u, y  v

4) S có tính kết hợp S(x, S(y,z)) = S(S(x, y), z) với mọi 0  x, y, z  1

Ví dụ: Một số phép tuyển:

Trang 9

Hàm IS(x,y) xác định trên [0, 1]2 bằng biểu thức IS(x,y) =S(n(x),y)

Phép kéo theo thứ hai:

Cho T là t-chuẩn, xác định IT(x,y) =Sup{z | 0  z  1 và T(x,y)  y},x,y [0,1]

Phép kéo theo thứ ba:

Cho (T, S, n) là bộ 3 De Morgan, T là t-chuẩn, S là t-đối chuẩn, n là phép phủ định mạnh

Phép kéo theo thứ ba: Hàm ITS(x,y) xác định trên [0, 1]2 bằng biểu thức

ITS(x,y) =S(n(x),T(x,y))

1.1.5 Biến ngôn ngữ

Biến ngôn ngữ làm một loại biến mà giá trị của nó không phải là số mà là

từ hay mệnh đề dưới dạng ngôn ngữ tự nhiên Biến ngôn ngữ được định nghĩa như sau:

Trang 10

Định nghĩa 1.5 [1]: Biến ngôn ngữ được xác định bởi một bộ 5 thành phần (X, T(X), U, R, M) trong đó:

X – là tên biến

T(X) – là tập các giá trị ngôn ngữ của biến X

U – là không gian tham chiếu hay còn gọi là miền cơ sở của biến X

R – là một số quy tắc cú pháp sinh các giá trị ngôn ngữ trong T(X)

M – là quy tắc gán ngữ nghĩa biểu thị bằng tập mờ trên U cho các từ ngôn ngữ trong T(X)

Ví dụ: Cho biến ngôn ngữ: Chiều cao

X = Chiều cao

T(X) = {Rất thấp, Thấp, Hơi Thấp, Bình thường, Hơi cao, Cao, Rất cao}

U = [50,215] – miền đánh giá chiều cao

R = Nếu chiều cao u là X thì Chiều cao có giá trị như sau:

Rất thấp với hàm thuộc ấ (u) Thấp với hàm thuộc ấ (u) Hơi thấp với hàm thuộc ơ ấ (u) Bình thường với hàm thuộc ì ườ (u) Hơi cao với hàm thuộc ơ (u)

Rất cao với hàm thuộc (u) Một số đặc trưng cơ bản của biến ngôn ngữ:

a)Tính phổ quát: các biến ngôn ngữ khác nhau về các giá trị nguyên thủy nhưng ý nghĩa về mặt cấu trúc miền giá trị của chúng vẫn được giữ Nói cách

Trang 11

khác, cấu trúc miền giá trị của hai biếnngôn ngữ cho trước tồn tại một “đẳng cấu” sai khác nhau bởi giá trị sinh nguyên thủy

b) Tính độc lập ngữ cảnh của giả tử và liên từ như AND, OR…: ngữ nghĩa của các gia tử và lien từ như AND, OR,… hoàn toàn độc lập với ngữ cảnh, khác

với giá trị nguyên thủy của các biến ngôn ngữ phụ thuộc vào ngữ cảnh Do đó,

khi tìm kiếm các mô hình cho các gia tử và liên từ như AND, OR… chúng ta

không phải quan tâm đến giá trị nguyên thủy của biến ngôn ngữ đang xét

Các đặc trưng này cho phép chúng ta sử dụng cùng một tập gia tử và xây dựng một cấu trúc toán học duy nhất cho miền giá trị của các biến ngôn ngữ khác nhau

1.1.6 Suy luận xấp xỉ (suy luận mờ)

Suy luận xấp xỉ hay còn gọi là suy luận mờ, là quá trình suy ra những kết luận dưới dạng các mệnh đề mờ trong điều kiện các quy tắc, các luật, các dữ liệu đầu vào cho trước cũng không hoàn toàn xác định Mỗi luật mờ được biểu diễn bởi một biểu thức “if – then”, được phát biểu dưới dạng ngôn ngữ tự nhiên thể hiện sự phụ thuộc nhân quả giữa các biến

Ví dụ: If chuồn chuồn bay thấp then trời mưa

Trong suy luận mờ, đầu ra thường phụ thuộc vào nhiều yếu tố đầu vào Lúc đó ta có thể biểu diễn luật này dưới dạng luật mờ tổng hợp

Gọi x1, x2, …, xn là các biến đầu vào và y là biến đầu ra (thường là các biến ngôn ngữ) Aki là các tập mờ ứng với các luật Rk trên không gian nền Ui có hàm thuộc ký hiệu là Aki(xi) hoặc Aki(xi) Bk là tập mờ trên không gian nền V có hàm thuộc Bk(y)= Bk(y)

IF (x1 is Ak1) (x2 is Ak2)  … (xi is Aki)  …  (xn is Akn) THEN y is Bk

Ví dụ:

Trang 12

IF (Ngoại ngữ giỏi)  (Tin học giỏi)  (Chuyên môn vững) THEN (Khả năng

Theo phương pháp truyền thống, quy tắc modus ponens tổng quát hóa được

áp dụng cho hệ mờ dạng (1) cùng với việc sử dụng các phép toán lôgíc mờ đã được nhiều tác giả đề cập chi tiết trong [1] Ở đây chúng ta tóm tắt như sau:

Xét mỗi luật mờ trong (1) là một quan hệ mờ R i trên miền tích Đề-các U=

U1U2 U n V với hàm thuộc được xác định bởi:

Ri = I(T n(Ai,1, , Ai,n), Bi) (3) trong đó Ai,j, Bi là các hàm thuộc tương ứng với A i,j , B i , T n là phép t-normn- ngôi và I là phép kéo theo Kết nhập các luật mờ R i (i = 1, , m) của hệ bằng phép t-conorm với hàm thuộc R và áp dụng quy tắc suy diễn hợp thành ta có kết quả:

) ( ' 1 )

, , , 1

(

sup

n j I i j

u j A

n j v

n u

ở đây  là phép t-norm,  là phép t-conorm và  là min hoặc prod

Công thức (4) cho thấy phương pháp lập luận này với những cách chọn các

phép t-norm, t-conorm hay kéo theoI dẫn đến những kết quả tính toán tập mờ B

khác nhau Điều này phù hợp với đặc trưng của lập luận xấp xỉ Câu hỏi về cách chọn các phép trên như thế nào để có một phương pháp lập luận tốt nói chung

Trang 13

không có câu trả lời khẳng định mà phụ thuộc vào từng tình huống ứng dụng cụ thể và được kiểm chứng qua kết quả thực nghiệm

Mặt khác, hệ luật mờ dạng Sugeno với phần kết luận của các luật là một mệnh đề kinh điển chứa hằng cá thể sẽ trở thành một trường hợp riêng của dạng

(1) khi chọn đầu ra B i có hàm thuộc ở dạng đơn tử Tuy nhiên, luật mờ dạng Sugeno với ưu điểm có thể thể hiện các hành vi cục bộ của hệ thống được ứng dụng và không cần giải mờ sau khi lập luận Đây là những lý do thúc đẩy những nghiên cứu hơn nữa về các mô hình ứng dụng hệ luật mờ, đặc biệt trường hợp luật mờ có kết luận chỉ chứa giá trị hằng cá thể sẽ được trình bày tiếp ở những phần sau

1.2.Một số vấn đề cơ bản trong Đại số gia tử

1.2.1 Đại số gia tử

Để mô phỏng các quá trình suy luận của con người, lý thuyết đại số gia tử (ĐSGT) đã cố gắng nhúng tập ngôn ngữ vào một cấu trúc đại số thích hợp và tìm cách xem chúng như là một đại số để tiên đề hoá sao cho cấu trúc thu được

mô phòng tốt ngữ nghĩa ngôn ngữ

Giả sử X là một biến ngôn ngữ và miền giá trị của X là Dom(X) Một đại

số gia tử AX tương ứng của X là một bộ 4 thành phần AX = (Dom(X), G, H, ≤) trong đó G là tập các phần tử sinh, H là tập các gia tử và quan hệ “≤” là quan hệ cảm sinh ngữ nghĩa trên X Giả thiết trong G có chứa các phần tử hằng 0, 1, W với ý nghĩa là phần tử bé nhất, phần tử lớn nhất và phần tử trung hòa trong X Ta gọi mỗi giá trị ngôn ngữ x ∈ X là một hạng từ trong ĐSGT

Trong đại số gia tử AX = (Dom(X), C, H, ≤) nếu Dom(X) và C là tập sắp thứ tự tuyến tính thì AX được gọi là đại số gia tử tuyến tính.Khi được thêm hai gia tử tới hạn là và với ngữ nghĩa là cận trên đúng và cận dưới đúng của tập

Trang 14

H(x) khi tác động lên x, thì ta được ĐSGT tuyến tính đầy đủ, ký hiệu AX = (X,

G, H, , , ≤)

Khi tác động gia tử h H vào phần tử x X, thì thu được phần tử ký hiệu

hx Với mỗi x X, ký hiệu H(x) là tập tất cả các hạng từ u X sinh từ x bằng cách áp dụng các gia tử trong H và viết u = hn…h1x, với hn, …, h1∈H

Tập H gồm các gia tử dương H + và gia tử âm H - Các gia tử dương làm tăng ngữ nghĩa của một hạng từ mà nó tác động, còn gia tử âm làm giảm ngữ

nghĩa của hạng từ Không mất tính tổng quát, ta luôn giả thiết rằng H - = {h -1 < h

Ví dụ: Cho biến ngôn ngữ HOT, có G = {0,COLD, W, HOT, 1}, H - =

{Possible<Little} và H + = {More<Very} Khi đó HOT< More HOT < Very HOT, Little HOT <HOT,…

1.2.2 Tính chất của đại số gia tử tuyến tính

a Tính thứ tự ngữ nghĩa của các hạng từ

Định lý 1.1: [1] Cho tập H- và H + là các tập sắp thứ tự tuyến tính của ĐSGT AX= (X, G, H, ≤) Khi đó ta có các khẳng định sau:

1 Với mỗi u∈X thì H(u) là tập sắp thứ tự tuyến tính

2 Nếu X được sinh từ G bởi các gia tử và G là tập sắp thứ tự tuyến tính

thì X cũng là tập sắp thứ tự tuyến tính Hơn nữa nếu u<v, và u, v là độc lập với nhau, tức là u H(v) và v H(u), thì H(u) ≤ H(v)

b So sánh hai hạng từ trong miền ngôn ngữ

Trang 15

Định lý 1.2: [1] Cho x = h n …h 1 u và y = k m …k 1 u là hai biểu diễn chính tắc của x và y đối với u Khi đó tồn tại chỉ số j ≤ min{n, m} + 1 sao cho h j' = k j' với

mọi j' < j (ở đây nếu j = min {n, m} + 1 thì hoặc h j là toán tử đơn vị I, h j = I, j = n + 1 ≤ m hoặc dk j = I, j = m + 1 ≤ n) và

(1)x < y khi và chỉ khi h j x j < k j x j , trong đó x j = h j-1 h 1 u

(2)x = y khi và chỉ khi m = n và h j x j = k j x j

(3)x và y là không so sánh được với nhau khi và chỉ khi h j x j và k j x jlà không

so sánh được với nhau

1.2.3 Vấn đề định lượng ngữ nghĩa trong đại số gia tử

Hàm H(x) có thể được sử dụng như là một mô hình biểu thị tính mờ của x

và kích thước tập H(x) được xem như độ đo tính mờ của x, và được định nghĩa

như sau:

Định nghĩa 1.6: [1] AX = (X, G, H, , , ≤) là một ĐSGT tuyến tính đầy đủ Ánh xạ fm: X [0,1] được gọi là một độ đo tính mờ của các hạng từ trong X nếu:

(1)fm là đầy đủ, tức là fm(c-) + fm(c+) = 1 và ∑ ∈ ( ) = fm(u), ∀u∈X;

(2)fm(x) = 0, với các x thỏa H(x) = {x} Đặc biệt, fm(0) = fm(W) = fm (1) = 0;

(3)∀x,y ∈ X, h ∈ H, ( )

( ) = ( )

( ) , tỷ số này không phụ thuộc vào x và

y, vì vậy nó được gọi là độ đo tính mờ của các gia tử và được ký hiệu bởi (h)

Trong định nghĩa trên, điều kiện (1) thể hiện tính đầy đủ của các phần tử sinh và các gia tử cho việc biểu diễn ngữ nghĩa của miền thực đối với các biến Điều kiện (2) thể hiện tính rõ của các hạng từ và điều kiện (3) có thể thể được chấp nhận vì chúng ta đã chấp nhận giả thiết rằng các gia tử độc lập với ngữ

cảnh, do vậy khi áp dụng một gia tử h lên các hạng từ thì hiệu quả tác động

tương đối làm thay đổi ngữ nghĩa của các hạng từ đó là như nhau

Trang 16

Hình vẽ sau sẽ minh họa rõ hơn cho khái niệm độ đo tính mờ của biến ngôn ngữ HOT

Hình 1.1: Độ đo tính mờ của biến HOT

Một số tính chất của độ đo tính mờ của các hạng tử và gia tử được thể hiện qua mệnh đề sau:

Mệnh đề 1.1: [1] Với độ đo tính mờ fm và đã được định nghĩa, ta có: (1)fm(c-) + fm(c+) = 1 và ∑ ∈ ( ) = fm(x);

(2)∑ ( ) = , ∑ ( ) = với , > 0 và + = 1;

(3)∑ ∈ ( )= 1, trong đó X k là tập các hạng từ có độ dài đúng k;

(4)fm(hx) = ( ).fm(x) và xX, fm( x) = fm( x) = 0;

(5)Cho fm(c-), fm(c+) và = ( ) với ∀h∈H,khi đó với x = h n …h 1 , ∈

{-,+}, dễ dàng tính được độ do tính mờ của x như sau:

fm(x) = ( )… ( )fm( )

Để thuận tiện cho việc tính toán và xử lý trong nhiều ứng dụng chúng ta cần xác định giá trị định lượng của các hạng từ này Việc định lượng hóa các khái niệm mờ theo phương pháp tiếp cận của tập mờ được thực hiện qua các phương pháp khử mờ Đối với ĐSGT, giá trị định lượng của các hạng từ được

fm(MHot)

fm(Hot)

fm(VeryHot) fm(LittleHot)

Hot

VeryHot More Hot

Poss Hot Little Hot

fm(VVHot) fm(MVHot)

fm(PVHot) fm(LVHot)

fm(PossHot)

fm(LLHot) fm(MLHot)

fm(PLHot) fm(VLHot)

Trang 17

định nghĩa dựa trên cấu trúc thứ tự ngữ nghĩa của miền giá trị của các biến ngôn ngữ, cụ thể là độ đo tính mờ của các hạng từ và gia tử

Định nghĩa 1.7:[1] Cho AX = (X, G, H, , , ≤) là một ĐSGT tuyến tính đầy đủ Ánh xạ v: X→ [0,1] được gọi là một định lượng ngữ nghĩa của AX nếu:

(1)v là ánh xạ 1-1 từ tập X vào đoạn [0,1] và đảm bảo thứ tự trên X, tức là

x,yX, x<y v(x) <v(y) và v(0) = 0, v(1) = 1

(2)v liên tục: x X, v( x) = infimumv(H(x)) và v( x) = supremumv(H(x))

Điều kiện (1) là bắt buộc tối thiểu đối với bất kỳ phương pháp định lượng

nào, điều kiện (2) đảm bảo tính trù mật của H(G) trong X Trước hết ta cần phải định nghĩa về dấu của các hạng từ

Định nghĩa 1.8: [1] Một hàm dấu Sign: X {-1,0,1} là một ánh xạ được

định nghĩa đệ quy như sau:

Mệnh đề 1.2: Với mọi gia tử h và phần tử xX nếu Sign(hx) = +1 thì

hx>x; nếu Sign(hx) = -1 thì hx<x và nếu Sign(hx) = 0 thì hx = x

Định nghĩa 1.9:[1] Khoảng tính mờ của các hạng từ x∈X, ký hiệu fm(x),

là một đoạn con của [0,1], fm(x) ∈ tv([0,1]), nếu nó có độ dài bằng độ đo tính

mờ, | fm (x)| = fm(x), và được xác định bằng qui nạp theo độ dài của x như sau:

Trang 18

(1) Với độ dài của x bằng 1 (l(x)=1), tức là x∈ {c-, c+}, khi đó | fm(c-)| =

fm(c-), | fm(c+)| = fm(c+) và fm(c-) ≤ fm(c+);

(2) Giả sử x có độ dài n (l(x) = n) và khoảng tính mờ fm (x) đã được định

nghĩa với | fm (x)| = fm(x) Khi đó tập các khoảng tính mờ { fm(h j x): -q ≤ j ≤ p

và j ≠ 0} ⊂ Itv([0,1]) được xây dựng sao cho nó là một phân hoạch của fm (x),

và thỏa mãn | fm (h j x)| = fm(h j x) và có thứ tự tuyến tính tương ứng với thứ tự của

tập {h-qx, h-q+1x, , hpx}, tức là nếu h-qx > h-q+1x > > hpx thì fm(h-qx) >fm(h

-q+1x) > > fm(hpx) và ngược lại:

Hình 1.2: Khoảng tính mờ của các hạng từ của biến HOT

Mệnh đề 1.3: [1] Cho A X = (X, G, H, ∑, Φ, ≤) là một ĐSGT tuyến tính đầy đủ:

(1) Nếu Sign(hpx′) = 1, thì ta có (h-qx′) ≤ (h-q+1x′) ≤ ≤ (h-1x′) ≤ (h1x′) ≤ (h2x′) ≤ ≤ (hpx′), và nếu Sign(hpx′) = -1, thì ta có (hpx′) ≤ (hp-1x′) ≤ ≤ (h1x′) ≤ (h-1x′) ≤ (h-2x′) ≤ ≤ (h-qx′);

(2) Tập Ik = { (x): x ∈ Xk} là một tựa phân hoạch của đoạn [0,1];

(3) Cho một số m, tập { (y): y = km k1x, ∀km, , k1∈ H} là một tựa phân hoạch của khoảng tính mờ (x);

(4) Tập Ik = { (x): x ∈ Xk} “mịn” hơn tập Ik-1 = { (x): x ∈ Xk-1}, tức là

v(Hot)

v(MHot) v(VHot) v(LHot) v(PHot)

Trang 19

bất kỳ một khoảng tính mờ trong Ik chắc chắn được chứa bên trong một khoảng của Ik-1;

(5) Với x < y và l(x) = l(y), thì (x) ≤ (y) và (x) ≠ (y)

Theo Định nghĩa 1.7 và 1.8, có một mối liên hệ giữa ánh xạ định lượng ngữnghĩa và khoảng tính mờ của của hạng từ trong một ĐSGT, được thể hiện bằng địnhlý sau :

Định lý 1.3: [1] Cho A X = (X, G, H, ∑, Φ, ≤) là một ĐSGT tuyến tính đầy

đủ và hàm υ được định nghĩa trong Định nghĩa 1.7 Khi đó υ là một ánh xạ định lượng ngữ nghĩa và tập các giá trị của υ đối với H(x), viết là υ(H(x)), trù mật trong đoạn [υ(Φx), υ(∑x)], ∀x ∈ X Hơn nữa, υ(Φx) = infimum υ(H(x)), υ(∑x)

= supremum υ(H(x)) và fm(x) = υ(∑x) - υ(Φx), và như vậy fm(x) = d(υ(H(x))), trong đó d(A) là đường kính của A ⊆ [0,1] Kết quả, υ(H(G)) trù mật trong đoạn [0,1]

Định lý này cũng khẳng định rằng ĐSGT AX cùng với hàm định lượng ngữ nghĩa υ có thể ứng dụng trong mọi quá trình thực

Từ những kết quả trên cho thấy giá trị định lượng ngữ nghĩa υ(x) của một hạng từ x cũng như khoảng tính mờ (x), ∀x ∈ X, phụ thuộc đầy đủ vào các tham số mờ gia tử fm(c-), fm(c+), µ(h) ∀h ∈ H

1.3 Bài toán phân lớp và phương pháp giải quyết dựa trên hệ mờ dạng luật 1.3.1 Bài toán phân lớp

Trong các bài toán về lĩnh vực khai phá dữ liệu thì bài toán phân lớp là một trong những bài toán đặc trưng được nhiều tác giả nghiên cứu, với các phương pháp khác nhau để đạt được hiệu quả phân lớp cao nhất Trong đó có

phương pháp dựa trên hệ mờ dạng luật (fuzzy rule-base classification systems - FRBCS), ngoài việc đạt được hiệu quả phân lớp cao phương pháp này còn được

Trang 20

nghiên cứu để đáp ứng cho người dùng một mô hình phân lớp dễ hiểu trực quan, được người dùng sử dụng như là các tri thức của mình để áp dụng trong thực tế

Bài toán phân lớp mờ có thể được phát biểu như sau: cho một tập các dữ liệu mẫu D = {(P, C)}, trong đó P = {pi = (di,1,…,di,n)| i=1,…,N} là tập dữ liệu,

C = {C1,…,Cm} là tập các nhãn của các lớp, pi ∈ U là dữ liệu thứ i với U = U1 × × Un là tích Đề-các của các miền của n thuộc tính X1, , Xn tương ứng, m là

số lớp và N là số mẫu dữ liệu, để ý rằng P ⊂ U Mỗi dữ liệu pi∈ P thuộc một lớp

ci∈ C tương ứng tạo thành từng cặp (pi, ci) ∈ D Giải bài toán bằng FRBCS chính là xây dựng một hệ các luật mờ, ký hiệu S, để phân lớp đóng vai trò như một ánh xạ từ tập dữ liệu vào tập nhãn:

Như vậy, hệ S phải đạt được các mục tiêu như hiệu quả quả phân lớp cao, tức là sai số phân lớp cho các dữ liệu ít nhất có thể, số lượng các luật nhỏ cũng như số điều kiện tham gia trong vế trái mỗi luật ít Mục tiêu về hiệu quả phân lớp nhằm đáp ứng tính đúng đắn của của hệ đối với tập dữ liệu mẫu được cho của bài toán, các luật mờ trong S phải đơn giản và dễ hiểu đối với người dùng Khi đó mục tiêu xây dựng hệ luật sao cho:

f p (S) → max, f n (S) và f a(S) → min (1.2) trong đó: - f p(S) – hàm đánh giá hiệu quả phân lớp

- f n(S) – là số luật

- f a(S) – là độ dài (số điều kiện tham gia) Tuy nhiên, ta thấy rằng ba mục tiêu xây dựng hệ luật trên không thể đạt được đồng thời Khi số luật giảm thì lượng tri thức về bài toán giảm khi đó nguy

cơ phân lớp sai tăng, khi có quá nhiều luật lại gây nhiễu loạn thông tin trong quá trình phân lớp Số điều kiện của mỗi luật ảnh hưởng đến tính phổ quát của luật,

Trang 21

cụ thể nếu số điều kiện ít sẽ làm tăng tính phổ quát và ngược lại Tính phổ quát

dễ làm tăng khả năng dự đoán của luật nhưng nguy cơ gây sai số lớn, khi tính cá thể tăng làm giảm khả năng dự đoán nhưng lại tăng tính đúng đắn của luật Vì vậy, các phương pháp giải quyết bài toán đều phải thỏa hiệp giữa các mục tiêu

để đạt được kết quả cuối cùng

Dưới dạng tổng quát của hệ mờ dạng luật có n đầu vào thì đầu ra của nó cũng là một tập mờ, khi đó chúng ta cần giải mờ để xác định nhãn phân lớp cho mẫu dữ liệu tương ứng Để đơn giản hơn thì ta sử dụng các luật mờ có phần kết luận của mỗi luật là một giá trị hằng tương ứng với nhãn của một lớp có dạng như sau:

If x1 is Aq1 and …and xn is Aqn then Class Cq with CFq (1.3) trong đó Aqj là giá trị ngôn ngữ của các biến ngôn ngữ tương ứng với các thuộc tính, Cq là nhãn phân lớp và CFq là trọng số của mỗi luật, q= 1,…, M với M là số luật, j=1…n Thông thường CFq [0,1]

Đối với những dữ liệu mẫu của bài toán cho dưới dạng số, tức là U Rn

thì việc xây dựng một hệ luật mờ S gồm hai bước:

Bước 1: Phân hoạch mờ trên miền của các thuộc tính bằng tập các giá trị ngôn ngữ của các biến ngôn ngữ - Dom(x), mỗi giá trị ngôn ngữ được gán một hàm thuộc tương ứng

Bước 2: Xác định các luật mờ từ các phân hoạch ở trên tạo thành hệ S

Bước 1 thường dựa trên các tập mờ tương ứng với các giá trị ngôn ngữ trên miền của các thuộc tính Chúng ta có thể sử dụng phương pháp phân hoạch

dạng lưới (grid-partition) hoặc phân hoạch theo sự phân bố dữ liệu partition)

Trang 22

(scatter-Ví dụ: Cho bài toán phân lớp với tập mẫu có thuộc tính x1, x2 và hai lớp {C1, C2} biểu thị bằng chấm tròn và vuông (hình ):

Hình 1.3: Lưới phân hoạch mờ trên miền của hai thuộc tính

Lưới phân hoạch này chia không gian tích Đề-các của các miền của thuộc tính tạo thành không gian các siêu hộp, ký hiệu Hs, các luật mờ sẽ được hình thành từ các tổ hợp của các giá trị ngôn ngữ trong không gian phân hoạch tương ứng với mỗi siêu hộp mà tại đó có hỗ trợ bởi các mẫu dữ liệu

Trực quan từ ví dụ trong hình 1.3, các hệ luật có thể được chọn như sau:

- Hệ S1 gồm 7 luật mờ sau:

If x 1 is Small and x 2 is Small then Class C 1,

If x 1 is Small and x 2 is Large then Class C 1,

If x 1 is Large and x 2 is Medium then Class C 1,

If x 1 is Large and x 2 is Small then Class C 2,

If x 1 is Medium and x 2 is Small then Class C 2,

If x 1 is Medium and x 2 is Medium then Class C 2,

If x 1 is Medium and x 2 is Large then Class C 2

- Hệ S2 gồm 4 luật mờ sau:

Trang 23

If x 1 is Small then Class C 1,

If x 1 is Large and x 2 is Medium then Class C 1,

If x 1 is Medium then Class C 2,

If x 1 is Large and x 2 is Small then Class C 2

1.3.2 Mô hình hệ mờ dạng luật giải bài toán phân lớp

Luật mờ dạng (1.3) có thể được viết gọn lại như sau:

(pi) = , (di,1) , (di,2) … , (di,n) (1.7)

Để đánh giá trọng số của luật dạng (1.4), một số tác giả đã đề xuất phương pháp đánh giá trọng số luật như sau:

Trang 24

CF1(Aq Cq) = cq’ (1.8)

CF2(Aq Cq) = cq – cq,Ave, (1.9)

CF3(Aq ⇒ Cq) = cq – cq,2nd, (1.10)

CF4(Aq Cq) = cq – cq,Sum (1.11) trong đó :

cq,Ave là độ tin cậy trung bình của các luật có cùng điều kiện Aq nhưng kết luận khác Cq:

Với hệ luật mờ S dạng (1.4) ta có thường sử dụng phương pháp chọn luật

có mức đốt cháy lớp nhất đối với dữ liệu để đưa vào và phân lớp tương ứng với kết luận của luật đó (SWR – single winner rule):

Trang 25

W ( ') arg hmax{ h(p').CF | Aw C S}

Classify p     (1.15) trong đó w là chỉ số tương ứng trọng số luật được chọn, w {1,2,3,4}, hoặc có thể áp dụng với trọng số đồng nhất bằng 1 cho mọi luật, kí hiệu CF0 = 1

Trong không gian các siêu hộp Hs của phương pháp sinh luật dựa trên lưới phân hoạch mờ của các miền thuộc tính, mỗi (Aq,1, …, Aq,n) Hs sẽ dùng để xây dựng một luật mờ bằng cách đặt điều kiện của luật tương ứng với siêu hộp đó Aq= (Aq,1, …, Aq,n), phần kết luận được chọn là nhãn phân lớp sao cho luật đạt

SR3(Aq ⇒ Cq) = cq.sq (1.19) Một phương pháp khác được sử dụng là thiết kết các thuật toán tìm kiếm

hệ luật tối ưu dựa trên giải thuật di truyền (GA) Trong đó các luật mờ được mã hóa bằng các cá thể trong GA bời một trong 2 phương pháp là Michigan hoặc Pittsburgh mã hóa tập các luật mờ thành một cá thể

1.4 Kết luận

Chương này đã trình bày một số khái niệm cơ bản về lập luận mờ: khái niệm về tập mờ, số mờ, khái niệm về biến ngôn ngữ và các phép toán trên tập

Trang 26

mờ Bên cạnh đó Chương 1 còn trình bày các khái niệm về ĐSGT, các tính chất của ĐSGT, vấn đề định lượng ngữ nghĩa trong ĐSGT, các khái niệm về khoảng

mờ của các giá trị ngôn ngữ

Trong chương này còn trình bày về bài toán phân lớp và các phương pháp tiếp cận giải bài toán của một số tác giả Từ đó ta thấy các phương pháp này còn gặp trở ngại vì số luật sinh ra có thể rất lớn đòi hỏi khối lượng tính toán lớn, hoặc các hàm thuộc của các giá trị ngôn ngữ có thể gần như đồng nhất với nhau khi sử dụng biện pháp điều chỉnh tham số

Trang 27

CHƯƠNG 2:

PHƯƠNG PHÁP TRÍCH RÚT LUẬT MỜ PHÂN LỚP

DỰA TRÊN ĐẠI SỐ GIA TỬ 2.1 Phương pháp sinh các từ ngôn ngữ trong Đại số gia tử

2.1.1.Phương pháp sinh tập giá trị ngôn ngữ trong đại số gia tử

Trong [1] đã chứng minh miền ngôn ngữ X = Dom(X) của một biến ngôn

ngữ X có thể được tiên đề hóa và được gọi là đại số gia tử và được ký hiệu là

AX = (X, G, H, ) trong đó G là tập các phần tử sinh, H là tập các gia tử (hedge) còn “” là quan hệ cảm sinh ngữ nghĩa trên X Giả thiết trong G có chứa các phần tử hằng 0, 1, W với ý nghĩa là phần tử bé nhất, phần tử lớn nhất và phần tử trung hòa (neutral) trong X Ta gọi mỗi giá trị ngôn ngữ xX là một hạng từ

(term) trong ĐSGT

Nếu tập X và H là các tập sắp thứ tự tuyến tính, khi đó AX = (X, G, H, )

là ĐSGT tuyến tính Hơn nữa, nếu được trang bị thêm hai gia tử tới hạn là  và

với ngữ nghĩa là cận trên đúng và cận dưới đúng của tập H(x) khi tác động lên

x, thì ta được ĐSGT truyến tính đầy đủ, ký hiệu AX = (X, G, H, , , ) Vì trong luận án chỉ quan tâm đến ĐSGT tuyến tính, kể từ đây nói ĐSGT cũng có nghĩa là ĐSGT tuyến tính

Khi tác động gia tử hH vào phần tử xX, thì thu được phần tử ký hiệu

hx Với mỗi xX, ký hiệu H(x) là tập tất cả các hạng từ uX sinh từ x bằng cách

áp dụng các gia tử trong H và viết u = h n …h1x, với h n , …, h1H

Tập H gồm các gia tử dương H + và gia tử âm H - Các gia tử dương làm tăng ngữ nghĩa của một hạng từ mà nó tác động, còn gia tử âm làm giảm ngữ

nghĩa của hạng từ Không mất tính tổng quát, ta luôn giả thiết rằng H - = {h-1<h

-2< <h -q } và H + = {h1<h2< <h p}

Trang 28

Để ý rằng biểu thức h n h1u được gọi là một biểu diễn chính tắc của một hạng từ x đối với u nếu x = h n h1u và h i h1uh i-1 h1u với i nguyên và in Ta gọi độ dài của một hạng từ x là số gia tử trong biểu diễn chính tắc của nó đối với phần tử sinh cộng thêm 1, ký hiệu l(x)

Ví dụ:Cho biến ngôn ngữ BIG, có G = {0, SMALL, W, BIG, 1}, H - = {

Possible<Little } và H + = { More<Very } Khi đó ta có hạng từBIG<More BIG<

= ((x), (x)] cho xX k , xx k,0, trong đó quy ước khoảng tính mờ luôn đóng ở điểm mút phải Hơn nữa, nếu ký hiệu k là độ dài lớn nhất của các

khoảng tính mờ trong I k và  là độ đo tính mờ lớn nhất của các gia tử trong H,

thì theo [1] ta có k+1kk1 Do < 1 nên ta luôn tìm được khoảng tính mờ

của x cho dù khoảng cần tìm bé đến mức nào.

Điều này cho phép xây dựng các thuật toán xác định các khoảng tính mờ

của mọi hạng từ trong ĐSGT Theo [1] xX, {(hx): hH} là một phân

hoạch của khoảng tính mờ (x) và được tính toán bằng thuật toán sau

Thuật toán 2.1:[1] Tính phân hoạch các khoảng tính mờ độ sâu k+1 của khoảng tính mờ độ sâu k (k (x))

Inputs: xX k, k (x) và (h) h H = {h -q , h -q+1 , , h-1, h1, h2, , h p}

Trang 29

Outputs: {(hx): hH} tập phân hoạch các khoảng tính mờ độ sâu k+1

p

p q

q

, , 1 , 1 , , 1 ,

, , 1 , 1 , , 1 ,

Không xét chỉ số 0, ký hiệu j i J với i=1, , p+q

(Step2) Tính khoảng tính mờ xuất phát,

Trong đó rmp và lmp là điểm mút phải và điểm mút trái của khoảng tính

mờ Kết quả tập phân hoạch {k+1 (hx) : hH} gồm các khoảng tính mờ độ sâu

k+1 có thứ tự tương ứng với thứ tự ngữ nghĩa các hạng từ sinh bằng cách tác

động các gia tử lên x Bước 3 của thuật toán 2.1 trên lặp trên các gia tử trong H theo thứ tự tương ứng với thứ tự ngữ nghĩa của các hạng từ sinh {hx : hH}

(xác định bởi bước 1) Điểm mút trái của khoảng tính mờ tiếp theo chính là điểm mút phải của khoảng tính mờ trước đó, khoảng tính mờ xuất phát tương ứng với hạng từ có ngữ nghĩa bé nhất được tính trong bước 2

nếu Sign(h p x)=1,

ngược lại

Trang 30

Dựa trên hệ khoảng tính mờ, miền của mỗi thuộc tính Xj được phân hoạch

bởi một tập hạng từ mức k j , tức X kj = { x kj x kj x kj  } trong ĐSGT AX j

Mỗi hạng từ xX kj được thiết kế hàm định lượng ngữ nghĩa dựa trên nguyên tắc càng gần tâm ((x kj ) - upsilon) giá trị hàm càng lớn và bằng 1 tại tâm, hàm sẽ

giảm dần về hai phía và không vượt khỏi tâm của hai hạng từ láng giềng (x kj)

và (x kj) Điều này nhằm đảm bảo tính thứ tự ngữ nghĩa của các hạng từ trong ĐSGT Có thế thiết kế hàm dạng tam giác hay dạng hình chuông Tuy nhiên thực tế để mềm dẻo và dễ dàng trong khi áp dụng, luận văn xây dựng hàm dạng tam giác (Hình 2.1) với hai tham số L, R để xác định giá trị hàm tại hai điểm đầu mút của khoảng tính mờ tương ứng (L, R> 0), công thức tính như sau:

( )) ( (

) ( ) 1 (

)) ( ( max

, 0 , ))

( ( ) (

).

( )) ( ( ) 1 (

max min

)

(

x x

rmp

x v

x rmp

x lmp x

x x

lmp v

v

R R

L L

Trang 31

2.2 Phương pháp định lượng ngữ nghĩa trong Đại số gia tử

2.2.1 Định lượng ánh xạ ngữ nghĩa SQM

Trong phần này chúng ta xem xét ba vấn đề cơ bản đó là độ đo tính mờ của các giá trị ngôn ngữ (hạng từ), phương pháp định lượng ngữ nghĩa và khoảng tính mờ của các khái niệm mờ

Tính mờ của các giá trị ngôn ngữ xuất phát từ thực tế rằng một giá trị ngôn ngữ mang ý nghĩa mô tả cho nhiều sự vật và hiện tượng trong thế giới thực, với

lý do tập hữu hạn các giá trị ngôn ngữ không đủ để phản ánh thế giới vô hạn các

sự vật hiện tượng Như vậy khái niệm tính mờ và độ đo tính mờ của một giá trị ngôn ngữ được hình thành và nó là một khái niệm rất khó xác định, đặc biệt trong lý thuyết tập mờ Tuy nhiên, trong ĐSGT các tác giả đã cho thấy độ đo

tính mờ được xác định một cách hợp lý: “tính mờ của một hạng từ x được hiểu như là ngữ nghĩa của nó vẫn có thể được thay đổi khi tác động vào nó bằng các gia tử” Do đó, tập các hạng từ sinh từ x bằng các gia tử sẽ thể hiện cho tính mờ

của x và do đó, H(x) có thể sử dụng như là một mô hình biểu thị tính mờ của x

và kích thước tập H(x) được xem như độ đo tính mờ của x Ta có định nghĩa sau

về độ đo tính mờ

Định nghĩa 2.2:[1] Cho AX = (X, G, H, , , ) là một ĐSGT tuyến tính

đầy đủ Ánh xạ fm : X [0,1] được gọi là một đo tính mờ của các hạng từ trong

X nếu:

(1) fm là đầy đủ, tức là fm(c - ) + fm(c +) =1 và hH fm(hu) = fm(u), uX;

(2) fm(x) = 0, với các x thỏa H(x) = {x} Đặc biệt, fm(0) = fm(W) = fm(1) = 0;

(3) x,y X, h H,

) (

) ( )

(

) (

y fm

hy fm x

fm

hx fm

, tỷ số này không phụ thuộc vào x và y, vì

vậy nó được gọi là độ đo tính mờ của các gia tử và được ký hiệu bởi (h)

Trang 32

Trong đó, điều kiện (1) thể hiện tính đầy đủ của các phần tử sinh và các gia

tử cho việc biểu diễn ngữ nghĩa của miền thực đối với các biến (2) thể hiện tính

rõ của các hạng từ và (3) có thể được chấp nhận vì chúng ta đã chấp nhận giả

thiết rằng các gia tử là độc lập với ngữ cảnh và, do vậy, khi áp dụng một gia tử h

lên các hạng từ thì hiệu quả tác động tương đối làm thay đổi ngữ nghĩa của các hạng từ đó là như nhau

Thông thường, ngữ nghĩa của các hạng từ thuần túy mang tính định tính Tuy nhiên, trong nhiều ứng dụng, chúng ta cần giá trị định lượng của các hạng

từ này cho việc tính toán và xử lý Theo tiếp cận của tập mờ, việc định lượng hóa các khái niệm mờ được thực hiện qua các phương pháp khử mờ

(defuzzification) Đối với ĐSGT, giá trị định lượng của các hạng từ được định

nghĩa dựa trên cấu trúc thứ tự ngữ nghĩa của miền giá trị của các biến ngôn ngữ,

cụ thể là độ đo tính mờ của các hạng từ và gia tử Tuy có nhiều phương pháp xác định giá trị định lượng của các hạng từ dựa trên các tham số này nhưng phải thỏa mãn một số ràng buộc nhất định và được thể hiện trong định nghĩa sau

Định nghĩa 2.3:[1] Cho AX = (X, G, H, , , ) là một ĐSGT tuyến tính đầy đủ Ánh xạ  : X [0,1] được gọi là một hàm định lượng ngữ nghĩa (SQM)

của AX nếu:

(1)  là ánh xạ 1-1 từ tập X vào đoạn [0,1] và đảm bảo thứ tự trên X, tức là

x,yX, x<y(x) <(y) và (0) = 0, (1) = 1

(2)  liên tục: xX, (x) = infimum (H(x)) và (x) = supremum(H(x))

Điều kiện (1) là bắt buộc tối thiểu đối với bất kỳ phương pháp định lượng

nào, còn điều kiện (2) đảm bảo tính trù mật của H(G) trong X Dựa trên những

Trang 33

ràng buộc này, các tác giả đã xây dựng một phương pháp định lượng ngữ nghĩa của các hạng từ trong ĐSGT

2.2.2 Xây dựng hàm định lượng ngữ nghĩa cho các giá trị ngôn ngữ

Đối với việc áp dụng ĐSGT trong hệ luật mờ phân lớp, ngoài việc thiết kế các giá trị ngôn ngữ và ngữ nghĩa của chúng cho từng bài toán dựa trên việc tìm kiếm tối ưu các tham số mờ ngữ nghĩa, nhằm đảm bảo các mục tiêu của hệ luật, các giá trị ngôn ngữ biểu diễn khái niệm mờ sẽ được thiết kế hàm định lượng ngữ nghĩa mà nó biểu diễn Rõ ràng, với tập mờ chúng ta có các thiết kế dạng tam giác, dạng hình chuông, hình thang,… và ở đây mỗi trường hợp thiết kế cho giá trị ngôn ngữ sẽ cho kết quả ảnh hưởng đến hiệu quả của hệ luật phân lớp Sử dụng hệ khoảng tương tự của giá trị ngôn ngữ để thiết kế dựa trên nguyên tắc tâm (giá trị định lượng - SQM) của hai giá trị ngôn ngữ liền kề trong thứ tự ngữ nghĩa làm giới hạn thiết kế của hàm định lượng ngữ nghĩa cho giá trị ngôn ngữ

đó và càng gần về tâm của nó thì giá trị hàm càng lớn, đạt đỉnh bằng 1 tại tâm của chính nó Hình vẽ 2.2 minh họa cho thiết kế này ở mức phân hoạch kj

Công thức tính cho dạng hàm định lượng theo thiết kế này:

) ( max

min

)

, 1 , 1 , 1

, , 1 , ,

i i i i

i i

v x x

x x v v

trong đó  là giá trị định lượng (SQM) hay tâm của giá trị ngôn ngữ

Hình 2.2: Thiết kế hàm định lượng dựa trên hệ khoảng tính mờ

T(x j,i )

(x j,i )

(x j,i-1 ) (x j,i+1 )

T(x j,i+1 ) T(x j,i-1 )

1

X (kj)

) (

Ngày đăng: 23/08/2016, 15:04

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Dương Thăng Long (2010), Phương pháp xây dựng hệ mờ dạng luật với ngữ nghĩa dựa trên đại số gia tử và ứng dụng trong bài toán phân lớp, Luận án tiến sĩ toán học, Viện Công nghệ Thông tin Sách, tạp chí
Tiêu đề: Phương pháp xây dựng hệ mờ dạng luật với ngữ nghĩa dựa trên đại số gia tử và ứng dụng trong bài toán phân lớp
Tác giả: Dương Thăng Long
Năm: 2010
[3] Nguyễn Cát Hồ, Dương Thăng Long, Trần Thái Sơn (2009), “Tiếp cận đại số gia tử cho phân lớp mờ”, Tạp chí tin học và điều khiển học, Tập 25(1), tr 53-68 Sách, tạp chí
Tiêu đề: Tiếp cận đại số gia tử cho phân lớp mờ”, "Tạp chí tin học và điều khiển học
Tác giả: Nguyễn Cát Hồ, Dương Thăng Long, Trần Thái Sơn
Năm: 2009
[4] Nguyễn Ngọc Hoan (2008), Tiếp cận mờ và tiếp cận đại số gia tử trong điều khiển hệ quạt gió – cánh nhôm, Luận văn thạc sĩ khoa học máy tính, Trường ĐH Công nghệ thông tin và truyền thông Thái Nguyên Sách, tạp chí
Tiêu đề: Tiếp cận mờ và tiếp cận đại số gia tử trong điều khiển hệ quạt gió – cánh nhôm, Luận văn thạc sĩ khoa học máy tính
Tác giả: Nguyễn Ngọc Hoan
Năm: 2008
[5] Nguyễn Cát Hồ (2008), Cơ sở dữ liệu mờ với ngữ nghĩa đại số gia tử, Bài giảng Trường thu – hệ mờ và ứng dụng, Viện Toán học Việt Nam.Tiếng Anh Sách, tạp chí
Tiêu đề: Cơ sở dữ liệu mờ với ngữ nghĩa đại số gia tử
Tác giả: Nguyễn Cát Hồ
Năm: 2008
[6] A. Fernández, F. Herrera (2012), “Linguistic Fuzzy Rules in Data Mining: Follow-Up Mamdani Fuzzy Modeling Principle”, STUDFUZZ, vol. 221, pp 103-122.Website Sách, tạp chí
Tiêu đề: Linguistic Fuzzy Rules in Data Mining: Follow-Up Mamdani Fuzzy Modeling Principle”, "STUDFUZZ
Tác giả: A. Fernández, F. Herrera
Năm: 2012
[7] The Machine Learning Repository of University of California - Irvinehttp://archive.ics.uci.edu/ml/datasets.html?format=&amp;task=cla&amp;att=&amp;area=&amp;numAtt =&amp;numIns=&amp;type=&amp;sort=nameUp&amp;view=table [8] http://archive.ics.uci.edu/ml/datasets/Ecoli Link
[2] Dương Thăng Long, Trương Tiến Tùng, Trần Tiến Dũng (2013), A HA based Fuzzy Association Rule Extracting Method for Classification on High-Dimensional Datasets, Kỷ yếu hội nghị quốc gia lần thứ VI về nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR) Khác

HÌNH ẢNH LIÊN QUAN

Hình  vẽ  sau  sẽ  minh  họa  rõ  hơn  cho  khái  niệm  độ  đo  tính  mờ  của  biến  ngôn ngữ HOT - Phương pháp trích rút các luật mờ phân lớp dựa trên đại số gia tử và ứng dụng
nh vẽ sau sẽ minh họa rõ hơn cho khái niệm độ đo tính mờ của biến ngôn ngữ HOT (Trang 16)
Hình 1.3: Lưới phân hoạch mờ trên miền của hai thuộc tính - Phương pháp trích rút các luật mờ phân lớp dựa trên đại số gia tử và ứng dụng
Hình 1.3 Lưới phân hoạch mờ trên miền của hai thuộc tính (Trang 22)
Hình 2.1: Hàm định lượng dạng tam giác của các hạng từ - Phương pháp trích rút các luật mờ phân lớp dựa trên đại số gia tử và ứng dụng
Hình 2.1 Hàm định lượng dạng tam giác của các hạng từ (Trang 30)
Hình 2.4: Thiết kế hàm định lượng tam giác dựa trên khoảng tính mờ - Phương pháp trích rút các luật mờ phân lớp dựa trên đại số gia tử và ứng dụng
Hình 2.4 Thiết kế hàm định lượng tam giác dựa trên khoảng tính mờ (Trang 35)
Hình 3.1: Sơ đồ phân bố dữ liệu giữa các lớp của bài toán Ecoli - Phương pháp trích rút các luật mờ phân lớp dựa trên đại số gia tử và ứng dụng
Hình 3.1 Sơ đồ phân bố dữ liệu giữa các lớp của bài toán Ecoli (Trang 46)
Bảng 3.2: Bảng tham số mờ gia tử cho bài toán Ecoli - Phương pháp trích rút các luật mờ phân lớp dựa trên đại số gia tử và ứng dụng
Bảng 3.2 Bảng tham số mờ gia tử cho bài toán Ecoli (Trang 47)
Hình 3.3: Kết quả chạy chương trình, cho kết quả hệ luật được sinh ra 85 hệ - Phương pháp trích rút các luật mờ phân lớp dựa trên đại số gia tử và ứng dụng
Hình 3.3 Kết quả chạy chương trình, cho kết quả hệ luật được sinh ra 85 hệ (Trang 48)
Hình 3.4: Phân lớp dữ liệu mẫu, tỉ lệ lỗi phân lớp là 77/336, tỉ lệ phân lớp đúng - Phương pháp trích rút các luật mờ phân lớp dựa trên đại số gia tử và ứng dụng
Hình 3.4 Phân lớp dữ liệu mẫu, tỉ lệ lỗi phân lớp là 77/336, tỉ lệ phân lớp đúng (Trang 48)
Hình 3.6: Không sử dụng phương pháp sàng luật, thì số luật sinh ra 119 hệ luật. - Phương pháp trích rút các luật mờ phân lớp dựa trên đại số gia tử và ứng dụng
Hình 3.6 Không sử dụng phương pháp sàng luật, thì số luật sinh ra 119 hệ luật (Trang 55)
Bảng 3.8: Kết quả phân lớp giữa phương pháp IFRG1 với phương pháp Bayes - Phương pháp trích rút các luật mờ phân lớp dựa trên đại số gia tử và ứng dụng
Bảng 3.8 Kết quả phân lớp giữa phương pháp IFRG1 với phương pháp Bayes (Trang 56)
Hình 3.9: Sơ đồ phân bố dữ liệu của bài toán đánh giá trợ giảng (TAE) - Phương pháp trích rút các luật mờ phân lớp dựa trên đại số gia tử và ứng dụng
Hình 3.9 Sơ đồ phân bố dữ liệu của bài toán đánh giá trợ giảng (TAE) (Trang 58)
Bảng 3.9: Bảng tham số mờ gia tử cho bài toán đánh giá trợ giảng - Phương pháp trích rút các luật mờ phân lớp dựa trên đại số gia tử và ứng dụng
Bảng 3.9 Bảng tham số mờ gia tử cho bài toán đánh giá trợ giảng (Trang 59)
Hình 3.11: Kết quả chạy phân lớp dữ liệu, tỉ lệ lỗi phân lớp là 37/151, - Phương pháp trích rút các luật mờ phân lớp dựa trên đại số gia tử và ứng dụng
Hình 3.11 Kết quả chạy phân lớp dữ liệu, tỉ lệ lỗi phân lớp là 37/151, (Trang 60)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w