Tiểu luận môn toán học cho khoa học máy tính Tìm hiểu về cơ sở lý thuyết Logic mờ, ứng dụng Logic mờ trong khai phá dữ liệu

Ý tưởng liên kết luật kết hợp với lý thuyết mờ đã xuất hiện, ý tưởng ban đầu xuất phát từ nỗ lực để xử lý các thuộc tính số trong CSDL, trong đó việc phân chia các giá trị số vào các tập

Trang 1

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

BÀI THU HOẠCH MÔN TOÁN HỌC CHO KHOA HỌC MÁY TÍNH

TÊN ĐỀ TÀI : Tìm hiểu về cơ sở lý thuyết Logic mờ, ứng dụng

Logic mờ trong khai phá dữ liệu

Trang 2

1

Mục lục

MỞ ĐẦU 1

CHƯƠNG 1 LOGIC MỜ 2

1.1 Logic mệnh đề 2

1.2 Tập mờ 3

1.2.1 Khái niệm tập mờ 3

1.2.2 Các dạng hàm thuộc tiêu biểu 4

1.2.3 Các khái niệm liên quan 5

1.2.4 Các toán tử logic trên tập mờ 6

1.2.5 Các phép toán mở rộng 8

1.3 Logic mờ 11

1.3.1 Khái niệm logic mờ 12

1.3.2 Biến ngôn ngữ 12

1.3.3 Mệnh đề mờ 13

1.3.4 Các phép toán mệnh đề mờ 14

1.3.5 Phép toán kéo theo mờ 14

1.3.6 Luật mờ 15

1.3.7 Luật Modus Ponens hay Modus Tollens 16

1.4 Số mờ 17

1.4.1 Định nghĩa 17

1.4.2 Các số học mờ 18

CHƯƠNG 2 TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 19

2.1 Phát hiện tri thức và khai phá dữ liệu 19

2.2 Quá trình phát hiện tri thức từ cơ sở dữ liệu 19

2.2.1 Xác định vấn đề 20

2.2.2 Thu thập và tiền xử lý dữ liệu 20

2.2.3 Khai thác dữ liệu 20

2.2.4 Minh họa và đánh giá 20

2.2.5 Đưa kết quả vào thực tế 21

2.3 Khai phá dữ liệu 21

2.3.1 Khái niệm về khai phá dữ liệu 21

2.3.2 Nhiệm vụ của khai phá dữ liệu 21

2.3.3 Một số ứng dụng khai phá dữ liệu 21

2.3.4 Các kỹ thuật khai phá dữ liệu 22

2.3.4.1 Khai phá dữ liệu dự đoán 22

2.3.4.2 Khai phá dữ liệu mô tả 22

2.3.5 Kiến trúc của hệ thống khai phá dữ liệu 23

2.4 Luật kết hợp 23

2.4.1 Ý nghĩa thực tiễn của luật kết hợp 23

2.4.2 Một số khái niệm 24

2.4.3 Tìm luật kết hợp 25

2.4.4 Thuật toán tìm luật kết hợp Apriori: 25

CHƯƠNG 3 PHƯƠNG PHÁP TÌM LUẬT KẾT HỢP MỜ VÀ MINH HỌA BẰNG ỨNG DỤNG THỰC TẾ 27

3.1 Mờ hóa dữ liệu 27

3.2 Khai phá luật mờ 30

3.3 Thuật toán khai phá luật kết hợp mờ 33

3.4 Ứng dụng 36

KẾT LUẬN 40

Tài liệu tham khảo : 41

Trang 3

MỞ ĐẦU

Logic mờ ra đời đã cung cấp một công cụ để nghiên cứu và xây dựng các hệ thống có khả năng xử lý thông tin không chính xác Nhờ có Logic mờ mà con người xây dựng được những hệ điều khiển có tính linh động rất cao Logic mờ có phạm vi ứng dụng rộng rãi trên thế giới, từ những hệ thống cao cấp phức tạp như những hệ dự báo, nhận dạng, robos, vệ tinh, du thuyền, máy bay,… đến những đồ dùng hằng ngày như máy giặt, máy điều hoà không khí, máy chụp hình tự động

Cùng với sự ra đời của logic mờ thì khai phá dữ liệu (data mining), hiện nay

đang được rất nhiều người chú ý Nó thực sự đã đem lại những lợi ích đáng kể trong việc cung cấp những thông tin tiềm ẩn trong các cơ sở dữ liệu lớn Những phương pháp thống kê truyền thống, phần lớn đều đã được định trước mục đích của công việc,

và sau đó chỉ việc sử dụng những phương pháp thích hợp để có được những thông tin

mà chúng ta cần Khai phá dữ liệu như là một công cụ, giúp chúng ta tìm ra “mỏ” trong những “dãy núi khổng lồ”

Ý tưởng liên kết luật kết hợp với lý thuyết mờ đã xuất hiện, ý tưởng ban đầu xuất phát từ nỗ lực để xử lý các thuộc tính số trong CSDL, trong đó việc phân chia các giá trị số vào các tập rõ có thể dẫn đến việc đánh giá cao hơn hoặc thấp hơn các giá trị

ở gần biên Tập mờ có thể khắc phục vấn đề này bằng cách cho phép một phần tử có thể thuộc vào các tập khác nhau Lý thuyết mờ cung cấp những công cụ cần thiết để thực hiện các tính toán trên các cấu trúc dữ liệu khác nhau

Việc sử dụng logic mờ trong mô hình quan hệ cung cấp một cách hiệu quả để

xử lý dữ liệu số với các thông tin không chính xác, không chắc chắn hoặc không đầy

đủ Lý thuyết tập mờ ngày càng được sử dụng nhiều và thường xuyên hơn trong các hệ thống thông minh bởi vì mối quan hệ của nó với cách lập luận của con người Một số nghiên cứu đã chứng minh được hiệu suất vượt trội của logic mờ trong khai phá dữ liệu và kho dữ liệu

Sau khi học xong học phần logic mờ do thầy Đỗ Văn Nhơn phụ trách, em đã nghiên cứu và xây dựng phương pháp tìm luật kết hợp mờ dựa vào cơ sở dữ liệu là kết quả thi tuyển sinh đầu vào khối A trường cao đẳng Phát thanh – Truyền hình II thành phố Hồ Chí Minh và điểm thi tốt nghiệp của sinh viên sau 3 năm học

Trang 4

Từ 2 cơ sở chính này ta suy ra được 2 giá trị chân lý đó là: đúng (1) và sai (0)

Như vậy logic mệnh đề luôn tuân theo 2 giá trị giả thuyết như sau:

- Giả thuyết 1 là tính thành viên của tập hợp: Với một phần tử và một tập hợp bất

kỳ, thì phần tử hoặc là thuộc tập hợp đó, hoặc thuộc phần bù của tập đó

- Giả thuyết 2 là định luật loại trừ trung gian, khẳng định một phần tử không thể vừa thuộc một tập hợp vừa thuộc phần bù của nó

Ví dụ 1.1: Ta có những lập luận như sau thì không thể áp dụng logic mệnh đề được:

Nếu có một bài toán nào đó có áp dụng logic mệnh đề, mà bài toán lại có giá trị đúng (1) cũng không hẳn là đúng, mà sai (0) cũng không hẳn là sai như vậy ta không thể áp dụng logic mệnh đề để tính toán

Ví dụ 1.2: Nếu nhiệt độ dưới 20 độ C thì lạnh, còn nhiệt độ từ 21 độ C đến 32 độ C là

bình thường, ngược lại từ 32 độ C trở lên là nóng Hình 1.2 bên dưới minh họa tập hợp

“LẠNH” gồm tất cả các nhiệt độ từ 20 độ C trở xuống, còn “NÓNG” gồm tất cả các nhiệt độ từ 32 độ C trở lên

Hình 1.2: Biểu diễn tập nhiệt độ “Lạnh”, “Bình thường” và “Nóng”

Qua biểu diễn của hình trên ta thấy không thể áp dụng logic mệnh đề để phân biệt các thành phần trong cùng một tập hợp Giả sử ta xét trường hợp về nhiệt độ lạnh giữa hai nhiệt độ 10 độ C và 8 độ C, thì logic mệnh đề không thể hiện được nhiệt độ nào lạnh hơn nhiệt độ nào, còn giả sử ta xét trường hợp nhiệt độ nóng giữa hai nhiệt độ 40 độ C

Trang 5

và 50 độ C, thì logic mệnh đề cũng không thể hiện được nhiệt độ nào nóng hơn nhiệt

độ nào

Như vậy đối với logic mệnh đề thì không thể giải quyết được các dữ kiện mang tính

mơ hồ, không chính xác, mà trong thực tế lại có rất nhiều phát biểu bằng ngôn ngữ

tự nhiên ở dạng này

 Quy tắc tính toán của logic mệnh đề: Trong logic mệnh đề để tính toán suy luận ta

có 5 phép toán cơ bản sau:

lý thuyết tập hợp cổ điển cần phải được mở rộng

Ta xét tập hợp những người trẻ Ta thấy rằng người dưới 26 tuổi thì rõ ràng là trẻ và người trên 60 tuổi thì rõ ràng là không trẻ Nhưng những người có tuổi từ 26 đến

60 thì có thuộc tập hợp những người trẻ hay không? Nếu áp dụng khái niệm tập hợp cổ điển thì ta phải định ra một ranh giới rõ ràng và mang tính chất áp đặt, chẳng hạn là 45 tuổi để xác định tập hợp những người trẻ Và trong thực tế thì có một ranh giới mờ để ngăn cách những người trẻ và những người không trẻ đó là những người trung niên Như vậy, những người trung niên là những người có một “độ trẻ” nào đó Nếu coi “độ trẻ” của người dưới 26 tuổi là hoàn toàn đúng tức là có giá trị là 1 và coi “độ trẻ” của người trên 60 tuổi là hoàn toàn sai tức là có giá trị là 0, thì “độ trẻ” của người trung niên sẽ có giá trị p nào đó thoả 0 < p < 1 (có nghĩa là: p  [0, 1])

Trang 6

4

Như vậy nhu cầu mở rộng khái niệm tập hợp và lý thuyết tập hợp là hoàn toàn

tự nhiên Các công trình nghiên cứu về lý thuyết tập mờ và logic mờ đã được L.Zadeh công bố đầu tiên năm 1965, và sau đó liên tục phát triển mạnh mẽ

Định nghĩa: Cho không gian nền U, tập A  U được gọi là tập mờ nếu A được xác định bởi hàm:

A

 :X->[0,1]

- A được gọi là hàm thuộc, hàm liên thuộc hay hàm thành viên (membership function)

- Với xX thì A(x) được gọi là mức độ thuộc của x vào A

Như vậy ta có thể coi tập rõ là một trường hợp đặc biệt của tập mờ, trong đó hàm thuộc chỉ nhận 2 giá trị 0 và 1

Ký hiệu tập mờ, ta có các dạng ký hiệu sau:

 Liệt kê phần tử: giả sử U={a,b,c,d} ta có thể xác định một tập mờ A=

d c b a

02.03.01

A x

 trong trường hợp U là không gian liên tục

Lưu ý là các ký hiệu  và  không phải là các phép tính tổng hay tích phân, mà chỉ

1.2.2 Các dạng hàm thuộc tiêu biểu

Theo lý thuyết thì hàm thuộc có thể là một hàm bất kỳ thoả A:X->[0,1] Nhưng trong thực tế thì có các dạng hàm thuộc sau đây là quan trọng và có tính ứng dụng cao hơn cả

Trang 7

 Nhóm hàm đơn điệu

Nhóm này gồm đơn điệu tăng và đơn điệu giảm Ví dụ tập hợp người già có hàm thuộc đơn điệu tăng theo tuổi trong khi đó tập hợp người trẻ có hàm thuộc đơn điệu giảm theo tuổi Ta xét thêm ví dụ minh họa sau:

- Cho tập vũ trụ E = Tốc độ = {20, 50, 80, 100, 120} đơn vị là km/h

- Xét tập mờ F=Tốc độ nhanh xác định bởi hàm thuộc nhanh như đồ thị

Như vậy tốc độ dưới 20km/h được coi là không nhanh Tốc độ càng cao thì độ thuộc của nó vào tập F càng cao Khi tốc độ là 100km/h trở lên thì độ thuộc là 1

50 / ) 100 (

50 20

30 / ) 20 (

100 20

0

x khi

x

x khi

x

x x

khi

trungbình

1.2.3 Các khái niệm liên quan

Giả sử A là tập mờ trên vũ trụ U, có hàm thuộc A thì ta có các khái niệm sau:

1 0.85 0.5

Trang 8

1.2.4 Các toán tử logic trên tập mờ

Cho X,Y là hai tập mờ trên không gian nền B, có các hàm thuộc tương ứng

là μX , μ Y , khi đó:

- Phép hợp hai tập mờ : X∪Y

+ Theo luật Max μX ∪Y (b) = Max{ μX(b) , μY(b) }

+ Theo luật Sum μX ∪Y (b) = Min{ 1, μX(b) + μY(b) }

+ Tổng trực tiếp μX ∪Y (b) = μX(b) + μY(b) - μX(b).μY(b)

- Phép giao hai tập mờ : X ∩ Y

+ Theo luật Min μX ∪Y(b) = Min{ μX(b) , μY(b) }

+ Theo luật Lukasiewicz μX∪Y(b) = Max{0, μX(b)+μY(b)-1}

+ Theo luật Prod μX∪Y (b) = μ X (b).μ Y (b)

Trang 9

 Phép hợp (hay toán tử OR)

Khái niệm: Hợp của hai tập mờ (A∪B) thể hiện mức độ một phần tử

thuộc về một trong hai tập là bao nhiêu

Trẻ ∨ Trung Niên(An) = max( 0.8, 0.3) = 0.8

 Phép giao (hay toán tử AND)

Khái niệm: Giao của hai tập mờ (A∩B) thể hiện mức độ một phần tử

thuộc về cả hai tập là bao nhiêu

Trang 10

8

 Phép bù (hay toán tử NOT)

 A

Khái niệm: Bù của một tập mờ thể hiện mức độ một phần tử không

thuộc về tập đó là bao nhiêu

Trang 11

nghĩa: Phần bù mờ của tập mờ A là tập mờ A với hàm thuộc được xác định bởi A

(x) = C(A(x)), trong đó C là một hàm số thoả các điều kiện sau:

i Tiên đề C1 (điều kiện biên): C(0) = 1, C(1) = 0

ii Tiên đề C2 (đơn điệu giảm): a, b  [0,1] Nếu a < b thì C(a)  C(b)

Hàm C thoả các điều kiện trên được gọi là hàm phần bù

Ta thấy rằng hàm thuộc của phần bù chuẩn là một hàm đặc biệt trong họ các hàm phần

Hàm phần bù Yager C(a) = w w

a

1)1(  trong đó w là tham số thoả w > 0 Hàm bù chuẩn là trường hợp đặc biệt của hàm Yager khi w = 1

 Hợp mờ – các phép toán S-norm

Phép toán max trong công thức hàm hợp mờ chuẩn có thể được tổng quát hoá thành các hàm S-norm:

Một hàm số S: [0,1]x[0,1] -> [0,1] được gọi là một S-norm nếu thoả các điều kiện sau:

i Tiên đề S1 (điều kiện biên): S(0,a) = a, a[0,1]

ii Tiên đề S2 (giao hoán): S(a,b) = S(b,a), a,b[0,1]

iii Tiên đề S3 (kết hợp): S(S(a,b),c) = S(a,S(b,c)), a,b,c[0,1]

iv Tiên đề S4 (đơn điệu tăng): Nếu ab và cd thì S(a,c)S(b,d), a,b,c,d[0,1]

S-norm còn được gọi là co-norm hoặc T-đối chuẩn

Hợp của tập mờ A và tập mờ B là tập mờ AB với hàm thuộc được xác định bởi:

B

A

 (x) = S(A(x), B(x)) trong đó S là một S-norm

 Ngoài hàm max, ta có một số hàm S-norm quan trọng sau đây:

0 0

b a if

a if

b

b if

a b a

Trang 12

, 1 min ) , (

Trong đó w là tham số thoả w > 0

 Giao mờ – các phép toán T-norm

Ta có định nghĩa hàm T-norm là tổng quát hoá của hàm min:

Một hàm số T: [0,1]x[0,1] -> [0,1] đƣợc gọi là một T-norm nếu thoả các điều kiện:

i Tiên đề T1 (điều kiện biên): T(1,a) = a, a[0,1]

ii Tiên đề T2 (giao hoán): T(a,b) = T(b,a), a,b[0,1]

iii Tiên đề T3 (kết hợp): T(T(a,b),c) = T(a,T(b,c)), a,b,c[0,1]

iv Tiên đề T4 (đơn điệu tăng): Nếu ab và cd thì T(a,c)T(b,d), a,b,c,d[0,1]

T-norm còn đƣợc gọi là T-chuẩn hoặc chuẩn tam giác

Giao của tập mờ A và tập mờ B là tập mờ AB với hàm thuộc đƣợc xác định nhƣ sau:

B

A

 (x) = T(A(x), B(x)) Trong đó T là một T-norm

Ngoài hàm min, ta có một số hàm T-norm quan trọng sau đây:

1 1

b a if

a if b

b if a b a

, 1 min 1 ) , (Trong đó w là tham số thoả w>0

Trang 13

Định lý: Với mọi T-norm bất kỳ T và S-norm bất kỳ S ta có:

ab  T(a,b)  min(a,b)  max(a,b)  S(a,b)  ab

 Tích đề-các mờ

Tích đề-các của tập mờ A1, A2, …, A n trên các vũ trụ U1, U2, …, U n tương ứng là tập

mờ A = A1 A2 …  A n trên không gian tích U1 U2 … U n với hàm thuộc được xác định như sau:

Khi U = V ta nói R là quan hệ trên U

Tổng quát một quan hệ mờ R giữa các tập U1, U2, …, U n là tập mờ A = A1 A2 …

 A n trên không gian tích U1 U2 … U n Trong đó A i U i, i = 1 n

 Hàm hợp max-tích (hay max-prod):

RoS

 (u,w) =

V

vmax  R(u,v) Z(v,w) 

Trang 14

12

1.3.1 Khái niệm logic mờ

Để khắc phục khuyết điểm của logic truyền thống (logic mệnh đề), Lotfi

Zadeh đã đưa ra lý thuyết mới về logic gọi là logic mờ (fuzzy logic) Lý thuyết của Zadeh biểu diễn tính mờ hay tính thiếu chính xác trong các phát biểu ở trên, theo cách định lượng bằng cách đưa ra một hàm tư cách thành viên tập hợp (set membership function - hay còn được gọi là hàm thuộc) nhận gi trị thực giữa 0 và

1

1.3.2 Biến ngôn ngữ

Ta xét một biến nhận giá trị trong một miền giá trị nào đó, chẳng hạn “nhiệt độ”

có thể nhận giá trị số là 1C, 2C, … là các giá trị chính xác Khi đó, với một giá trị

cụ thể gán vào biến sẽ giúp chúng ta xác định được tính chất, quy mô của biến Ngoài

ra chúng ta còn biết được những thông tin khác liên quan đến biến đó Ví dụ chúng ta hiểu là không nên chạm tay trần vào vật có “nhiệt độ” là 80C trở lên Nhưng trong thực tế thì chúng ta thường nói “không nên chạm vào vật có nhiệt độ cao” chứ ít khi nói “không nên chạm vào vật có nhiệt độ là 80C trở lên” Thực tế là lời khuyên đầu thì có ích hơn bởi vì nếu nhận được lời khuyên sau thì ta dễ bị ngộ nhận là có thể chạm tay vào vật có nhiệt độ là 79C trong khi đó vật có nhiệt độ 80C trở lên thì không Nhưng vấn đề đặt ra là nếu nghe theo lời khuyên đầu thì ta có thể xác định rõ là nhiệt

độ bằng bao nhiêu thì có thể chạm tay vào? Câu trả lời là tuỳ vào ý kiến của từng người Với nhiệt độ là 60C thì có người cho là cao trong khi người khác thì không Tuy các ý kiến là khác nhau nhưng có một điều chắc chắn là khi giá trị của biến nhiệt

độ càng tăng thì càng dễ dàng được chấp nhận là “cao” Như vậy nếu xét hàm cao

nhận biến nhiệt độ và trả về tỷ lệ ý kiến đồng ý là “cao” thì cao sẽ là hàm thuộc của

tập mờ “nhiệt độ cao” trên vũ trụ “nhiệt độ”, xem hình b.1 bên dưới

1 0.9

Trang 15

Hình b.1: Biểu diễn thang nhiệt độ

Biến nhiệt độ có thể nhận giá trị “cao” là một giá trị của ngôn ngữ tự nhiên nên nó

được gọi là một biến ngôn ngữ (linguistic variable)

Khái niệm biến ngôn ngữ đã được Zadeh đưa ra năm 1973 như sau:

 Một biến ngôn ngữ được xác định bởi bộ (x, T, U, M)

trong đó: x là tên biến Ví dụ: “nhiệt độ”, “tốc độ”, “độ ẩm”,…

 T là tập các từ là các giá trị ngôn ngữ tự nhiên mà x có thể nhận

Ví dụ: x là “tốc độ” thì T có thể là {“chậm”, “trung bình”, “nhanh”}

 U là miền các giá trị vật lý mà x có thể nhận

Ví dụ: x là “tốc độ” thì U có thể là {0km/h,1km/h, …, 150km/h}

 M là luật ngữ nghĩa, ứng mỗi từ trong T với một tập mờ At trong U

Từ định nghĩa trên chúng ta có thể nói rằng biến ngôn ngữ là biến có thể nhận giá trị là các tập mờ trên một vũ trụ nào đó

1.3.3 Mệnh đề mờ

Trong logic cổ điển (logic vị từ cấp một), một mệnh đề phân tử P(x) là một phát

biểu có dạng “x là P” trong đó x là một đối tượng trong một vũ trụ U nào đó thoả tính chất P Ví dụ “x là số chẵn” thì U là tập các số nguyên và P là tính chất chia hết cho 2 Như vậy ta có thể đồng nhất một mệnh đề phân tử “x là P” với một tập (rõ) A =  x

U | P(x) 

Từ đó ta có:

P(x) = (x) Trong đó  là hàm đặc trưng của tập A ( xA  (x) = 1) Giá trị chân lý của P(x) chỉ nhận một trong hai giá trị 1 và 0 (true và false) tương ứng với sự kiện x thuộc A hoặc không

Trong trường hợp P là một tính chất mờ chẳng hạn như “số lớn” thì ta sẽ có một mệnh

đề logic mờ phần tử Khi đó tập hợp các phần tử trong vũ trụ U thoả P là một tập mờ B

có hàm thuộc Bsao cho:

P(x) = B(x)

Lúc này P(x) có thể nhận các giá trị tuỳ ý trong [0,1] Và ta thấy có thể đồng nhất các hàm thuộc với các mệnh đề logic mờ

Trang 16

P(x)  Q(y) = min(P(x), Q(y))

P(x)  Q(y) = max(P(x), Q(y))

P(x) =>Q(y) =  P(x)  Q(y) = max(1-P(x), Q(y))

P(x) =>Q(y) =  P(x)  (P(x)  Q(y)) = max(1-P(x), min(P(x), Q(y))) Như vậy, ta sẽ có mở rộng một cách tự nhiên từ logic cổ điển sang logic mờ với quy tắc tổng quát hoá dùng hàm bù mờ cho phép phủ định, hàm T-norm cho phép giao ()

và S-norm cho phép hợp () Sự mở rộng này dựa trên sự tương quan giữa mệnh đề logic mờ với hàm mờ và các phép toán trên tập mờ Ta có:

Trong đó C là hàm bù mờ (hay phủ định mờ), T là hàm T-norm, S là hàm S-norm

1.3.5 Phép toán kéo theo mờ

Các phép toán kéo theo có vai trò quan trọng trong logic mờ Chúng tạo nên các luật mờ để thực hiện các phép suy diễn trong tất cả các hệ mờ Do một mệnh đề mờ tương ứng với một tập mờ nên ta có thể dùng hàm thuộc thay cho các mệnh đề

 Sau đây là một số phép kéo theo quan trọng được sử dụng rộng rãi:

 Phép kéo theo Dienes – Rescher

Nếu áp dụng công thức (1) với S-norm max và C là hàm bù chuẩn cho ta có phép kéo

theo Dienes – Rescher

A

 (x) =>B(y) = max(1-A(x), B(y))

 Phép kéo theo Lukasiewicz

Nếu áp dụng công thức (1) với S-norm là hàm hợp Yager với w=1 và C là hàm bù

chuẩn cho ta có phép kéo theo Lukasiewicz:

Trang 17

 (x) =>B(y) = min(1, 1-A(x)+B(y))

 Phép kéo theo Zadeh

Nếu áp dụng công thức (2) với S-norm là max, T-norm min hoặc tích và C là hàm bù

chuẩn cho ta có phép kéo theo Zadeh:

A

 (x) =>B(y) = max( 1-A(x), min(A(x),B(y))) (a)

A

 (x) =>B(y) = max( 1-A(x), A(x).B(y)) (b)

 Kéo theo Mamdani

Ta có thể coi mệnh đề A(x) =>B(y) xác định một quan hệ 2 ngôi R  UxV Trong

đó U là không gian nền của x (vũ trụ chứa x), V là không gian nền của y (vũ trụ chứa y) Khi đó giá trị chân lý của mệnh đề A(x) =>B(y) là giá trị hàm thuộc của cặp (x,y) vào R Theo công thức xác định hàm thuộc của quan hệ mờ ta có:

- „nhiệt độ‟, „giá dầu‟ và „sưởi ấm‟ là các biến

- „lạnh‟, „rẻ‟, „nhiều‟ là các giá trị hay chính là các tập mờ

Hoặc: If một người có chiều cao là cao và cơ bắp là lực lưỡng Then chơi bóng

rổ hay

- Các biến ở đây sẽ là: „chiều cao‟, „cơ bắp‟, „chơi bóng rổ‟

- Các giá trị hay tập mờ là: „cao‟, „lực lưỡng‟, „hay‟

Trang 18

16

1.3.7 Luật Modus Ponens hay Modus Tollens

 Thông thường, suy diễn mờ (suy luận mờ) hay sử dụng luật Modus Ponen hoặc

Modus Tollens Trong logic cổ điển, Modus Ponens diễn đạt như sau:

Mệnh đề 1 (Luật hoặc tri thức) : P → Q

 Tương tự logic cổ điển, trong logic mờ (suy diễn mờ hay suy luận mờ) cũng có luật

Modus Ponens như sau:

Giả thiết 1 (luật mờ) : Nếu x là A thì y là B

Giả thiết 1 (sự kiện mờ) : x là A‟

Trong đó A, B, A‟, B‟ là các biến ngôn ngữ (có nghĩa là các tập mờ) A và A‟

là các tập mờ trên không gian nền U, còn B và B‟ là các tập mờ trên không gian nền V

Ví dụ :

Luật mờ : Nếu góc quay tay ga lớn thì xe đi nhanh

Sự kiện mờ : Góc quay tay ga khá lớn

Kết luận : Xe đi khá nhanh

 Trong logic cổ điển, Modus Tollens diễn đạt như sau:

Mệnh đề 1 (Luật hoặc tri thức) : P → Q

 Tương tự logic cổ điển, trong logic mờ (suy diễn mờ hay suy luận mờ) luật được

diễn đạt như sau :

Giả thiết 1 (Luật mờ hoặc tri thức mờ) : P → Q

Trang 19

 Công thức tính kết luận của luật Modus Ponens như sau:

mà ta có cách tính kết quả của luật Modus Ponens khác nhau

Trong phần số mờ này ta tập trung vào 2 vấn đề quan trọng đó là: Giới thiệu về

số mờ và các tính toán của số mờ Khái niệm số mờ thực chất là dựa trên khái niệm về

tập mờ và từ định nghĩa của tập mờ dẫn đến định nghĩa số mờ

1.4.1 Định nghĩa

Cơ sở khoa học của số mờ là tập mờ trên trục thực thỏa 2 điều kiện, ta có định nghĩa về số mờ như sau: Tập mờ M trên đường thẳng số thực R1 là tập số mờ nếu thỏa

2 điều kiện sau:

a) M là chuẩn số, tức là có điểm x‟ sao cho M(x‟) = 1

b) Ứng với mỗi   R1, tập mức {x:M(x)≥} là đoạn đóng trên R1

Người ta thường dùng các số mờ dạng tam giác, hình thang và dạng Gauss

Và dẫn đến các qui tắc là ta giả định rằng tập mờ đó là dạng đặc biệt mà đường biểu

diễn tạo thành tam giác cân trên biểu đồ, do đó ta có các qui tắc tính toán số mờ như

sau:

Các phép toán (dùng để tính toán) trên số mờ:

 Cộng : [a,b] + [d,e] = [a+d, b+e]

 Trừ : [a,b] - [d,e] = [a-e, b-d]

 Nhân : [a,b] * [d,e] = [min(ad,ae, bd, be), max(ad,ae, bd, be)]

 Chia : [a,b] / [d,e] = [min(a/d,a/e, b/d, b/e), max(a/d,a/e, b/d, b/e)]

b Nguyên lý suy rộng của Zadeh

Để làm việc với các hệ thống có nhiều biến vào, nguyên lý suy rộng của Zadeh là rất quan trọng

Định nghĩa: Cho Ai là tập mờ với các hàm thuộc Ai trên không gian nền Xi, (i=1 n) Khi đó tích A1xA2x An là tập mờ trên X=X1xX2x Xn với hàm thuộc:

Trang 20

18

A(x)=min{Ai(xi); i=1 n} Trong đó x=(x1,x2, xn)

Giả sử mỗi biến đầu vào xi lấy giá trị là Ai(i=1 n) Hàm f: X->Y chuyển các giá trị đầu vào là Ai thành giá trị đầu ra B Khi đó B là tập mờ trên Y với hàm thuộc xác định bởi:

B(x)=max{min(Ai(xi)); i=1 n : xf 1(y)} nếu f 1(y)  

B(x)=0 nếu f 1(y) =

Trong đó f 1(y) = {x X : f(x)=y}

Ta có thể áp dụng nguyên lý suy rộng cho định nghĩa suy rộng của phép cộng như một hàm 2 biến mờ Tương tự cho các phép toán trừ, nhân, chia

1.4.2 Các số học mờ

Từ các phép toán cơ bản (Các phép toán trên số mờ) người ta xây dựng nên số học mờ Có nhiều cách xây dựng một số học mờ Sau đây là số học mờ dựa trên khái niêm  -cuts (lát cắt alpha)  -cuts của số mờ là khoảng đóng thực với mọi 0< 

<=1 Gọi * là một trong 4 phép toán sau: {+, -, , /}

Trang 21

CHƯƠNG 2 TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU

Việc thu thập và lưu trữ các kho chứa dữ liệu khổng lồ dẫn tới một yêu cầu cấp thiết là cần có những kỹ thuật và công cụ mới để tự động chuyển đổi lượng dữ liệu khổng lồ thành các tri thức có ích Do vậy, khai phá dữ liệu (KPDL) nhằm phát hiện các tri thức mới giúp ích cho hoạt động của con người đã trở thành một lĩnh vực quan trọng của ngành Công nghệ thông tin

Thông tin là một khái niệm trừu tượng, được thể hiện dưới nhiều dạng thức khác nhau Thông tin có thể được phát sinh, lưu trữ, biến đổi trong những vật mang tin Dữ liệu là sự biểu diễn thông tin và được thể hiện bằng các tín hiệu vật lý Dữ liệu

là một dãy các bit các số, sử dụng các bit để đo lường các thông tin và xem nó như là các dữ liệu đã được lọc bỏ các dư thừa, được rút gọn tới mức tối thiểu để đặc trưng một cách cơ bản cho dữ liệu

Có thể xem tri thức như là các thông tin tích hợp, bao gồm các sự kiện và các mối quan hệ giữa chúng Các mối quan hệ này có thể được hiểu ra, có thể được phát hiện, hoặc có thể được học

Mục đích của phát hiện tri thức và KPDL là tìm ra các mẫu và các mô hình đang tồn tại trong các cơ sở dữ liệu nhưng vẫn còn bị che khuất bởi hàng “núi” dữ liệu Quá trình phát hiện tri thức được mô tả tóm tắt trên Hình 1.1:

Hình 1.1: Quy trình phát hiện tri thức từ cơ sở dữ liệu

Định dạng
Số trang	43
Dung lượng	1,58 MB

Tài liệu tham khảo	Loại	Chi tiết
[1]. Bài giảng cao học môn toán cho khoa học máy tính; PGS.TS Đỗ Văn Nhơn. Trường ĐH CNTT, ĐHQG TP.HCM	Khác
[2]. Bài giảng cao học môn học công nghệ tri thức và ứng dụng, GS.TSKH. Hoàng Kiếm, Trường ĐH KHTN, ĐHQG TP.HCM , 2004	Khác
[3]. Chuyên đề khai phá dữ liệu và nhà kho dữ liệu, PGS.TS. Đỗ Phúc, Trường ĐH CNTT, ĐHQG TP.HCM, 2007	Khác
[4]Application of Data Mining to Intensive Care Unit Microbiologic Data1Stephen A. Moser, Warren T. Jones, and Stephen E. Brossette The University of Alabama at Birmingham, Birmingham, Alabama, USA	Khác
[6]Fuzzy Association Rules An Implementation in R Author Bakk. Lukas Helm	Khác