Ý tưởng liên kết luật kết hợp với lý thuyết mờ đã xuất hiện, ý tưởng ban đầu xuất phát từ nỗ lực để xử lý các thuộc tính số trong CSDL, trong đó việc phân chia các giá trị số vào các tập
Trang 1ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
BÀI THU HOẠCH MÔN TOÁN HỌC CHO KHOA HỌC MÁY TÍNH
TÊN ĐỀ TÀI : Tìm hiểu về cơ sở lý thuyết Logic mờ, ứng dụng
Logic mờ trong khai phá dữ liệu
Trang 21
Mục lục
MỞ ĐẦU 1
CHƯƠNG 1 LOGIC MỜ 2
1.1 Logic mệnh đề 2
1.2 Tập mờ 3
1.2.1 Khái niệm tập mờ 3
1.2.2 Các dạng hàm thuộc tiêu biểu 4
1.2.3 Các khái niệm liên quan 5
1.2.4 Các toán tử logic trên tập mờ 6
1.2.5 Các phép toán mở rộng 8
1.3 Logic mờ 11
1.3.1 Khái niệm logic mờ 12
1.3.2 Biến ngôn ngữ 12
1.3.3 Mệnh đề mờ 13
1.3.4 Các phép toán mệnh đề mờ 14
1.3.5 Phép toán kéo theo mờ 14
1.3.6 Luật mờ 15
1.3.7 Luật Modus Ponens hay Modus Tollens 16
1.4 Số mờ 17
1.4.1 Định nghĩa 17
1.4.2 Các số học mờ 18
CHƯƠNG 2 TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 19
2.1 Phát hiện tri thức và khai phá dữ liệu 19
2.2 Quá trình phát hiện tri thức từ cơ sở dữ liệu 19
2.2.1 Xác định vấn đề 20
2.2.2 Thu thập và tiền xử lý dữ liệu 20
2.2.3 Khai thác dữ liệu 20
2.2.4 Minh họa và đánh giá 20
2.2.5 Đưa kết quả vào thực tế 21
2.3 Khai phá dữ liệu 21
2.3.1 Khái niệm về khai phá dữ liệu 21
2.3.2 Nhiệm vụ của khai phá dữ liệu 21
2.3.3 Một số ứng dụng khai phá dữ liệu 21
2.3.4 Các kỹ thuật khai phá dữ liệu 22
2.3.4.1 Khai phá dữ liệu dự đoán 22
2.3.4.2 Khai phá dữ liệu mô tả 22
2.3.5 Kiến trúc của hệ thống khai phá dữ liệu 23
2.4 Luật kết hợp 23
2.4.1 Ý nghĩa thực tiễn của luật kết hợp 23
2.4.2 Một số khái niệm 24
2.4.3 Tìm luật kết hợp 25
2.4.4 Thuật toán tìm luật kết hợp Apriori: 25
CHƯƠNG 3 PHƯƠNG PHÁP TÌM LUẬT KẾT HỢP MỜ VÀ MINH HỌA BẰNG ỨNG DỤNG THỰC TẾ 27
3.1 Mờ hóa dữ liệu 27
3.2 Khai phá luật mờ 30
3.3 Thuật toán khai phá luật kết hợp mờ 33
3.4 Ứng dụng 36
KẾT LUẬN 40
Tài liệu tham khảo : 41
Trang 3MỞ ĐẦU
Logic mờ ra đời đã cung cấp một công cụ để nghiên cứu và xây dựng các hệ thống có khả năng xử lý thông tin không chính xác Nhờ có Logic mờ mà con người xây dựng được những hệ điều khiển có tính linh động rất cao Logic mờ có phạm vi ứng dụng rộng rãi trên thế giới, từ những hệ thống cao cấp phức tạp như những hệ dự báo, nhận dạng, robos, vệ tinh, du thuyền, máy bay,… đến những đồ dùng hằng ngày như máy giặt, máy điều hoà không khí, máy chụp hình tự động
Cùng với sự ra đời của logic mờ thì khai phá dữ liệu (data mining), hiện nay
đang được rất nhiều người chú ý Nó thực sự đã đem lại những lợi ích đáng kể trong việc cung cấp những thông tin tiềm ẩn trong các cơ sở dữ liệu lớn Những phương pháp thống kê truyền thống, phần lớn đều đã được định trước mục đích của công việc,
và sau đó chỉ việc sử dụng những phương pháp thích hợp để có được những thông tin
mà chúng ta cần Khai phá dữ liệu như là một công cụ, giúp chúng ta tìm ra “mỏ” trong những “dãy núi khổng lồ”
Ý tưởng liên kết luật kết hợp với lý thuyết mờ đã xuất hiện, ý tưởng ban đầu xuất phát từ nỗ lực để xử lý các thuộc tính số trong CSDL, trong đó việc phân chia các giá trị số vào các tập rõ có thể dẫn đến việc đánh giá cao hơn hoặc thấp hơn các giá trị
ở gần biên Tập mờ có thể khắc phục vấn đề này bằng cách cho phép một phần tử có thể thuộc vào các tập khác nhau Lý thuyết mờ cung cấp những công cụ cần thiết để thực hiện các tính toán trên các cấu trúc dữ liệu khác nhau
Việc sử dụng logic mờ trong mô hình quan hệ cung cấp một cách hiệu quả để
xử lý dữ liệu số với các thông tin không chính xác, không chắc chắn hoặc không đầy
đủ Lý thuyết tập mờ ngày càng được sử dụng nhiều và thường xuyên hơn trong các hệ thống thông minh bởi vì mối quan hệ của nó với cách lập luận của con người Một số nghiên cứu đã chứng minh được hiệu suất vượt trội của logic mờ trong khai phá dữ liệu và kho dữ liệu
Sau khi học xong học phần logic mờ do thầy Đỗ Văn Nhơn phụ trách, em đã nghiên cứu và xây dựng phương pháp tìm luật kết hợp mờ dựa vào cơ sở dữ liệu là kết quả thi tuyển sinh đầu vào khối A trường cao đẳng Phát thanh – Truyền hình II thành phố Hồ Chí Minh và điểm thi tốt nghiệp của sinh viên sau 3 năm học
Trang 4Từ 2 cơ sở chính này ta suy ra được 2 giá trị chân lý đó là: đúng (1) và sai (0)
Như vậy logic mệnh đề luôn tuân theo 2 giá trị giả thuyết như sau:
- Giả thuyết 1 là tính thành viên của tập hợp: Với một phần tử và một tập hợp bất
kỳ, thì phần tử hoặc là thuộc tập hợp đó, hoặc thuộc phần bù của tập đó
- Giả thuyết 2 là định luật loại trừ trung gian, khẳng định một phần tử không thể vừa thuộc một tập hợp vừa thuộc phần bù của nó
Ví dụ 1.1: Ta có những lập luận như sau thì không thể áp dụng logic mệnh đề được:
Nếu có một bài toán nào đó có áp dụng logic mệnh đề, mà bài toán lại có giá trị đúng (1) cũng không hẳn là đúng, mà sai (0) cũng không hẳn là sai như vậy ta không thể áp dụng logic mệnh đề để tính toán
Ví dụ 1.2: Nếu nhiệt độ dưới 20 độ C thì lạnh, còn nhiệt độ từ 21 độ C đến 32 độ C là
bình thường, ngược lại từ 32 độ C trở lên là nóng Hình 1.2 bên dưới minh họa tập hợp
“LẠNH” gồm tất cả các nhiệt độ từ 20 độ C trở xuống, còn “NÓNG” gồm tất cả các nhiệt độ từ 32 độ C trở lên
Hình 1.2: Biểu diễn tập nhiệt độ “Lạnh”, “Bình thường” và “Nóng”
Qua biểu diễn của hình trên ta thấy không thể áp dụng logic mệnh đề để phân biệt các thành phần trong cùng một tập hợp Giả sử ta xét trường hợp về nhiệt độ lạnh giữa hai nhiệt độ 10 độ C và 8 độ C, thì logic mệnh đề không thể hiện được nhiệt độ nào lạnh hơn nhiệt độ nào, còn giả sử ta xét trường hợp nhiệt độ nóng giữa hai nhiệt độ 40 độ C
Trang 5và 50 độ C, thì logic mệnh đề cũng không thể hiện được nhiệt độ nào nóng hơn nhiệt
độ nào
Như vậy đối với logic mệnh đề thì không thể giải quyết được các dữ kiện mang tính
mơ hồ, không chính xác, mà trong thực tế lại có rất nhiều phát biểu bằng ngôn ngữ
tự nhiên ở dạng này
Quy tắc tính toán của logic mệnh đề: Trong logic mệnh đề để tính toán suy luận ta
có 5 phép toán cơ bản sau:
lý thuyết tập hợp cổ điển cần phải được mở rộng
Ta xét tập hợp những người trẻ Ta thấy rằng người dưới 26 tuổi thì rõ ràng là trẻ và người trên 60 tuổi thì rõ ràng là không trẻ Nhưng những người có tuổi từ 26 đến
60 thì có thuộc tập hợp những người trẻ hay không? Nếu áp dụng khái niệm tập hợp cổ điển thì ta phải định ra một ranh giới rõ ràng và mang tính chất áp đặt, chẳng hạn là 45 tuổi để xác định tập hợp những người trẻ Và trong thực tế thì có một ranh giới mờ để ngăn cách những người trẻ và những người không trẻ đó là những người trung niên Như vậy, những người trung niên là những người có một “độ trẻ” nào đó Nếu coi “độ trẻ” của người dưới 26 tuổi là hoàn toàn đúng tức là có giá trị là 1 và coi “độ trẻ” của người trên 60 tuổi là hoàn toàn sai tức là có giá trị là 0, thì “độ trẻ” của người trung niên sẽ có giá trị p nào đó thoả 0 < p < 1 (có nghĩa là: p [0, 1])
Trang 64
Như vậy nhu cầu mở rộng khái niệm tập hợp và lý thuyết tập hợp là hoàn toàn
tự nhiên Các công trình nghiên cứu về lý thuyết tập mờ và logic mờ đã được L.Zadeh công bố đầu tiên năm 1965, và sau đó liên tục phát triển mạnh mẽ
Định nghĩa: Cho không gian nền U, tập A U được gọi là tập mờ nếu A được xác định bởi hàm:
A
:X->[0,1]
- A được gọi là hàm thuộc, hàm liên thuộc hay hàm thành viên (membership function)
- Với xX thì A(x) được gọi là mức độ thuộc của x vào A
Như vậy ta có thể coi tập rõ là một trường hợp đặc biệt của tập mờ, trong đó hàm thuộc chỉ nhận 2 giá trị 0 và 1
Ký hiệu tập mờ, ta có các dạng ký hiệu sau:
Liệt kê phần tử: giả sử U={a,b,c,d} ta có thể xác định một tập mờ A=
d c b a
02.03.01
A x
trong trường hợp U là không gian liên tục
Lưu ý là các ký hiệu và không phải là các phép tính tổng hay tích phân, mà chỉ
1.2.2 Các dạng hàm thuộc tiêu biểu
Theo lý thuyết thì hàm thuộc có thể là một hàm bất kỳ thoả A:X->[0,1] Nhưng trong thực tế thì có các dạng hàm thuộc sau đây là quan trọng và có tính ứng dụng cao hơn cả
Trang 7 Nhóm hàm đơn điệu
Nhóm này gồm đơn điệu tăng và đơn điệu giảm Ví dụ tập hợp người già có hàm thuộc đơn điệu tăng theo tuổi trong khi đó tập hợp người trẻ có hàm thuộc đơn điệu giảm theo tuổi Ta xét thêm ví dụ minh họa sau:
- Cho tập vũ trụ E = Tốc độ = {20, 50, 80, 100, 120} đơn vị là km/h
- Xét tập mờ F=Tốc độ nhanh xác định bởi hàm thuộc nhanh như đồ thị
Như vậy tốc độ dưới 20km/h được coi là không nhanh Tốc độ càng cao thì độ thuộc của nó vào tập F càng cao Khi tốc độ là 100km/h trở lên thì độ thuộc là 1
50 / ) 100 (
50 20
30 / ) 20 (
100 20
0
x khi
x
x khi
x
x x
khi
trungbình
1.2.3 Các khái niệm liên quan
Giả sử A là tập mờ trên vũ trụ U, có hàm thuộc A thì ta có các khái niệm sau:
1 0.85 0.5
Trang 81.2.4 Các toán tử logic trên tập mờ
Cho X,Y là hai tập mờ trên không gian nền B, có các hàm thuộc tương ứng
là μX , μ Y , khi đó:
- Phép hợp hai tập mờ : X∪Y
+ Theo luật Max μX ∪Y (b) = Max{ μX(b) , μY(b) }
+ Theo luật Sum μX ∪Y (b) = Min{ 1, μX(b) + μY(b) }
+ Tổng trực tiếp μX ∪Y (b) = μX(b) + μY(b) - μX(b).μY(b)
- Phép giao hai tập mờ : X ∩ Y
+ Theo luật Min μX ∪Y(b) = Min{ μX(b) , μY(b) }
+ Theo luật Lukasiewicz μX∪Y(b) = Max{0, μX(b)+μY(b)-1}
+ Theo luật Prod μX∪Y (b) = μ X (b).μ Y (b)
Trang 9 Phép hợp (hay toán tử OR)
Khái niệm: Hợp của hai tập mờ (A∪B) thể hiện mức độ một phần tử
thuộc về một trong hai tập là bao nhiêu
Trẻ ∨ Trung Niên(An) = max( 0.8, 0.3) = 0.8
Phép giao (hay toán tử AND)
Khái niệm: Giao của hai tập mờ (A∩B) thể hiện mức độ một phần tử
thuộc về cả hai tập là bao nhiêu
Trang 108
Phép bù (hay toán tử NOT)
A
Khái niệm: Bù của một tập mờ thể hiện mức độ một phần tử không
thuộc về tập đó là bao nhiêu
Trang 11nghĩa: Phần bù mờ của tập mờ A là tập mờ A với hàm thuộc được xác định bởi A
(x) = C(A(x)), trong đó C là một hàm số thoả các điều kiện sau:
i Tiên đề C1 (điều kiện biên): C(0) = 1, C(1) = 0
ii Tiên đề C2 (đơn điệu giảm): a, b [0,1] Nếu a < b thì C(a) C(b)
Hàm C thoả các điều kiện trên được gọi là hàm phần bù
Ta thấy rằng hàm thuộc của phần bù chuẩn là một hàm đặc biệt trong họ các hàm phần
Hàm phần bù Yager C(a) = w w
a
1)1( trong đó w là tham số thoả w > 0 Hàm bù chuẩn là trường hợp đặc biệt của hàm Yager khi w = 1
Hợp mờ – các phép toán S-norm
Phép toán max trong công thức hàm hợp mờ chuẩn có thể được tổng quát hoá thành các hàm S-norm:
Một hàm số S: [0,1]x[0,1] -> [0,1] được gọi là một S-norm nếu thoả các điều kiện sau:
i Tiên đề S1 (điều kiện biên): S(0,a) = a, a[0,1]
ii Tiên đề S2 (giao hoán): S(a,b) = S(b,a), a,b[0,1]
iii Tiên đề S3 (kết hợp): S(S(a,b),c) = S(a,S(b,c)), a,b,c[0,1]
iv Tiên đề S4 (đơn điệu tăng): Nếu ab và cd thì S(a,c)S(b,d), a,b,c,d[0,1]
S-norm còn được gọi là co-norm hoặc T-đối chuẩn
Hợp của tập mờ A và tập mờ B là tập mờ AB với hàm thuộc được xác định bởi:
B
A
(x) = S(A(x), B(x)) trong đó S là một S-norm
Ngoài hàm max, ta có một số hàm S-norm quan trọng sau đây:
0 0
b a if
a if
b
b if
a b a
Trang 12, 1 min ) , (
Trong đó w là tham số thoả w > 0
Giao mờ – các phép toán T-norm
Ta có định nghĩa hàm T-norm là tổng quát hoá của hàm min:
Một hàm số T: [0,1]x[0,1] -> [0,1] đƣợc gọi là một T-norm nếu thoả các điều kiện:
i Tiên đề T1 (điều kiện biên): T(1,a) = a, a[0,1]
ii Tiên đề T2 (giao hoán): T(a,b) = T(b,a), a,b[0,1]
iii Tiên đề T3 (kết hợp): T(T(a,b),c) = T(a,T(b,c)), a,b,c[0,1]
iv Tiên đề T4 (đơn điệu tăng): Nếu ab và cd thì T(a,c)T(b,d), a,b,c,d[0,1]
T-norm còn đƣợc gọi là T-chuẩn hoặc chuẩn tam giác
Giao của tập mờ A và tập mờ B là tập mờ AB với hàm thuộc đƣợc xác định nhƣ sau:
B
A
(x) = T(A(x), B(x)) Trong đó T là một T-norm
Ngoài hàm min, ta có một số hàm T-norm quan trọng sau đây:
1 1
b a if
a if b
b if a b a
, 1 min 1 ) , (Trong đó w là tham số thoả w>0
Trang 13Định lý: Với mọi T-norm bất kỳ T và S-norm bất kỳ S ta có:
ab T(a,b) min(a,b) max(a,b) S(a,b) ab
Tích đề-các mờ
Tích đề-các của tập mờ A1, A2, …, A n trên các vũ trụ U1, U2, …, U n tương ứng là tập
mờ A = A1 A2 … A n trên không gian tích U1 U2 … U n với hàm thuộc được xác định như sau:
Khi U = V ta nói R là quan hệ trên U
Tổng quát một quan hệ mờ R giữa các tập U1, U2, …, U n là tập mờ A = A1 A2 …
A n trên không gian tích U1 U2 … U n Trong đó A i U i, i = 1 n
Hàm hợp max-tích (hay max-prod):
RoS
(u,w) =
V
vmax R(u,v) Z(v,w)
Trang 1412
1.3.1 Khái niệm logic mờ
Để khắc phục khuyết điểm của logic truyền thống (logic mệnh đề), Lotfi
Zadeh đã đưa ra lý thuyết mới về logic gọi là logic mờ (fuzzy logic) Lý thuyết của Zadeh biểu diễn tính mờ hay tính thiếu chính xác trong các phát biểu ở trên, theo cách định lượng bằng cách đưa ra một hàm tư cách thành viên tập hợp (set membership function - hay còn được gọi là hàm thuộc) nhận gi trị thực giữa 0 và
1
1.3.2 Biến ngôn ngữ
Ta xét một biến nhận giá trị trong một miền giá trị nào đó, chẳng hạn “nhiệt độ”
có thể nhận giá trị số là 1C, 2C, … là các giá trị chính xác Khi đó, với một giá trị
cụ thể gán vào biến sẽ giúp chúng ta xác định được tính chất, quy mô của biến Ngoài
ra chúng ta còn biết được những thông tin khác liên quan đến biến đó Ví dụ chúng ta hiểu là không nên chạm tay trần vào vật có “nhiệt độ” là 80C trở lên Nhưng trong thực tế thì chúng ta thường nói “không nên chạm vào vật có nhiệt độ cao” chứ ít khi nói “không nên chạm vào vật có nhiệt độ là 80C trở lên” Thực tế là lời khuyên đầu thì có ích hơn bởi vì nếu nhận được lời khuyên sau thì ta dễ bị ngộ nhận là có thể chạm tay vào vật có nhiệt độ là 79C trong khi đó vật có nhiệt độ 80C trở lên thì không Nhưng vấn đề đặt ra là nếu nghe theo lời khuyên đầu thì ta có thể xác định rõ là nhiệt
độ bằng bao nhiêu thì có thể chạm tay vào? Câu trả lời là tuỳ vào ý kiến của từng người Với nhiệt độ là 60C thì có người cho là cao trong khi người khác thì không Tuy các ý kiến là khác nhau nhưng có một điều chắc chắn là khi giá trị của biến nhiệt
độ càng tăng thì càng dễ dàng được chấp nhận là “cao” Như vậy nếu xét hàm cao
nhận biến nhiệt độ và trả về tỷ lệ ý kiến đồng ý là “cao” thì cao sẽ là hàm thuộc của
tập mờ “nhiệt độ cao” trên vũ trụ “nhiệt độ”, xem hình b.1 bên dưới
1 0.9
Trang 15Hình b.1: Biểu diễn thang nhiệt độ
Biến nhiệt độ có thể nhận giá trị “cao” là một giá trị của ngôn ngữ tự nhiên nên nó
được gọi là một biến ngôn ngữ (linguistic variable)
Khái niệm biến ngôn ngữ đã được Zadeh đưa ra năm 1973 như sau:
Một biến ngôn ngữ được xác định bởi bộ (x, T, U, M)
trong đó: x là tên biến Ví dụ: “nhiệt độ”, “tốc độ”, “độ ẩm”,…
T là tập các từ là các giá trị ngôn ngữ tự nhiên mà x có thể nhận
Ví dụ: x là “tốc độ” thì T có thể là {“chậm”, “trung bình”, “nhanh”}
U là miền các giá trị vật lý mà x có thể nhận
Ví dụ: x là “tốc độ” thì U có thể là {0km/h,1km/h, …, 150km/h}
M là luật ngữ nghĩa, ứng mỗi từ trong T với một tập mờ At trong U
Từ định nghĩa trên chúng ta có thể nói rằng biến ngôn ngữ là biến có thể nhận giá trị là các tập mờ trên một vũ trụ nào đó
1.3.3 Mệnh đề mờ
Trong logic cổ điển (logic vị từ cấp một), một mệnh đề phân tử P(x) là một phát
biểu có dạng “x là P” trong đó x là một đối tượng trong một vũ trụ U nào đó thoả tính chất P Ví dụ “x là số chẵn” thì U là tập các số nguyên và P là tính chất chia hết cho 2 Như vậy ta có thể đồng nhất một mệnh đề phân tử “x là P” với một tập (rõ) A = x
U | P(x)
Từ đó ta có:
P(x) = (x) Trong đó là hàm đặc trưng của tập A ( xA (x) = 1) Giá trị chân lý của P(x) chỉ nhận một trong hai giá trị 1 và 0 (true và false) tương ứng với sự kiện x thuộc A hoặc không
Trong trường hợp P là một tính chất mờ chẳng hạn như “số lớn” thì ta sẽ có một mệnh
đề logic mờ phần tử Khi đó tập hợp các phần tử trong vũ trụ U thoả P là một tập mờ B
có hàm thuộc Bsao cho:
P(x) = B(x)
Lúc này P(x) có thể nhận các giá trị tuỳ ý trong [0,1] Và ta thấy có thể đồng nhất các hàm thuộc với các mệnh đề logic mờ
Trang 16P(x) Q(y) = min(P(x), Q(y))
P(x) Q(y) = max(P(x), Q(y))
P(x) =>Q(y) = P(x) Q(y) = max(1-P(x), Q(y))
P(x) =>Q(y) = P(x) (P(x) Q(y)) = max(1-P(x), min(P(x), Q(y))) Như vậy, ta sẽ có mở rộng một cách tự nhiên từ logic cổ điển sang logic mờ với quy tắc tổng quát hoá dùng hàm bù mờ cho phép phủ định, hàm T-norm cho phép giao ()
và S-norm cho phép hợp () Sự mở rộng này dựa trên sự tương quan giữa mệnh đề logic mờ với hàm mờ và các phép toán trên tập mờ Ta có:
Trong đó C là hàm bù mờ (hay phủ định mờ), T là hàm T-norm, S là hàm S-norm
1.3.5 Phép toán kéo theo mờ
Các phép toán kéo theo có vai trò quan trọng trong logic mờ Chúng tạo nên các luật mờ để thực hiện các phép suy diễn trong tất cả các hệ mờ Do một mệnh đề mờ tương ứng với một tập mờ nên ta có thể dùng hàm thuộc thay cho các mệnh đề
Sau đây là một số phép kéo theo quan trọng được sử dụng rộng rãi:
Phép kéo theo Dienes – Rescher
Nếu áp dụng công thức (1) với S-norm max và C là hàm bù chuẩn cho ta có phép kéo
theo Dienes – Rescher
A
(x) =>B(y) = max(1-A(x), B(y))
Phép kéo theo Lukasiewicz
Nếu áp dụng công thức (1) với S-norm là hàm hợp Yager với w=1 và C là hàm bù
chuẩn cho ta có phép kéo theo Lukasiewicz:
Trang 17 (x) =>B(y) = min(1, 1-A(x)+B(y))
Phép kéo theo Zadeh
Nếu áp dụng công thức (2) với S-norm là max, T-norm min hoặc tích và C là hàm bù
chuẩn cho ta có phép kéo theo Zadeh:
A
(x) =>B(y) = max( 1-A(x), min(A(x),B(y))) (a)
A
(x) =>B(y) = max( 1-A(x), A(x).B(y)) (b)
Kéo theo Mamdani
Ta có thể coi mệnh đề A(x) =>B(y) xác định một quan hệ 2 ngôi R UxV Trong
đó U là không gian nền của x (vũ trụ chứa x), V là không gian nền của y (vũ trụ chứa y) Khi đó giá trị chân lý của mệnh đề A(x) =>B(y) là giá trị hàm thuộc của cặp (x,y) vào R Theo công thức xác định hàm thuộc của quan hệ mờ ta có:
- „nhiệt độ‟, „giá dầu‟ và „sưởi ấm‟ là các biến
- „lạnh‟, „rẻ‟, „nhiều‟ là các giá trị hay chính là các tập mờ
Hoặc: If một người có chiều cao là cao và cơ bắp là lực lưỡng Then chơi bóng
rổ hay
- Các biến ở đây sẽ là: „chiều cao‟, „cơ bắp‟, „chơi bóng rổ‟
- Các giá trị hay tập mờ là: „cao‟, „lực lưỡng‟, „hay‟
Trang 1816
1.3.7 Luật Modus Ponens hay Modus Tollens
Thông thường, suy diễn mờ (suy luận mờ) hay sử dụng luật Modus Ponen hoặc
Modus Tollens Trong logic cổ điển, Modus Ponens diễn đạt như sau:
Mệnh đề 1 (Luật hoặc tri thức) : P → Q
Tương tự logic cổ điển, trong logic mờ (suy diễn mờ hay suy luận mờ) cũng có luật
Modus Ponens như sau:
Giả thiết 1 (luật mờ) : Nếu x là A thì y là B
Giả thiết 1 (sự kiện mờ) : x là A‟
Trong đó A, B, A‟, B‟ là các biến ngôn ngữ (có nghĩa là các tập mờ) A và A‟
là các tập mờ trên không gian nền U, còn B và B‟ là các tập mờ trên không gian nền V
Ví dụ :
Luật mờ : Nếu góc quay tay ga lớn thì xe đi nhanh
Sự kiện mờ : Góc quay tay ga khá lớn
Kết luận : Xe đi khá nhanh
Trong logic cổ điển, Modus Tollens diễn đạt như sau:
Mệnh đề 1 (Luật hoặc tri thức) : P → Q
Tương tự logic cổ điển, trong logic mờ (suy diễn mờ hay suy luận mờ) luật được
diễn đạt như sau :
Giả thiết 1 (Luật mờ hoặc tri thức mờ) : P → Q
Trang 19 Công thức tính kết luận của luật Modus Ponens như sau:
mà ta có cách tính kết quả của luật Modus Ponens khác nhau
Trong phần số mờ này ta tập trung vào 2 vấn đề quan trọng đó là: Giới thiệu về
số mờ và các tính toán của số mờ Khái niệm số mờ thực chất là dựa trên khái niệm về
tập mờ và từ định nghĩa của tập mờ dẫn đến định nghĩa số mờ
1.4.1 Định nghĩa
Cơ sở khoa học của số mờ là tập mờ trên trục thực thỏa 2 điều kiện, ta có định nghĩa về số mờ như sau: Tập mờ M trên đường thẳng số thực R1 là tập số mờ nếu thỏa
2 điều kiện sau:
a) M là chuẩn số, tức là có điểm x‟ sao cho M(x‟) = 1
b) Ứng với mỗi R1, tập mức {x:M(x)≥} là đoạn đóng trên R1
Người ta thường dùng các số mờ dạng tam giác, hình thang và dạng Gauss
Và dẫn đến các qui tắc là ta giả định rằng tập mờ đó là dạng đặc biệt mà đường biểu
diễn tạo thành tam giác cân trên biểu đồ, do đó ta có các qui tắc tính toán số mờ như
sau:
Các phép toán (dùng để tính toán) trên số mờ:
Cộng : [a,b] + [d,e] = [a+d, b+e]
Trừ : [a,b] - [d,e] = [a-e, b-d]
Nhân : [a,b] * [d,e] = [min(ad,ae, bd, be), max(ad,ae, bd, be)]
Chia : [a,b] / [d,e] = [min(a/d,a/e, b/d, b/e), max(a/d,a/e, b/d, b/e)]
b Nguyên lý suy rộng của Zadeh
Để làm việc với các hệ thống có nhiều biến vào, nguyên lý suy rộng của Zadeh là rất quan trọng
Định nghĩa: Cho Ai là tập mờ với các hàm thuộc Ai trên không gian nền Xi, (i=1 n) Khi đó tích A1xA2x An là tập mờ trên X=X1xX2x Xn với hàm thuộc:
Trang 2018
A(x)=min{Ai(xi); i=1 n} Trong đó x=(x1,x2, xn)
Giả sử mỗi biến đầu vào xi lấy giá trị là Ai(i=1 n) Hàm f: X->Y chuyển các giá trị đầu vào là Ai thành giá trị đầu ra B Khi đó B là tập mờ trên Y với hàm thuộc xác định bởi:
B(x)=max{min(Ai(xi)); i=1 n : xf 1(y)} nếu f 1(y)
B(x)=0 nếu f 1(y) =
Trong đó f 1(y) = {x X : f(x)=y}
Ta có thể áp dụng nguyên lý suy rộng cho định nghĩa suy rộng của phép cộng như một hàm 2 biến mờ Tương tự cho các phép toán trừ, nhân, chia
1.4.2 Các số học mờ
Từ các phép toán cơ bản (Các phép toán trên số mờ) người ta xây dựng nên số học mờ Có nhiều cách xây dựng một số học mờ Sau đây là số học mờ dựa trên khái niêm -cuts (lát cắt alpha) -cuts của số mờ là khoảng đóng thực với mọi 0<
<=1 Gọi * là một trong 4 phép toán sau: {+, -, , /}
Trang 21CHƯƠNG 2 TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU
Việc thu thập và lưu trữ các kho chứa dữ liệu khổng lồ dẫn tới một yêu cầu cấp thiết là cần có những kỹ thuật và công cụ mới để tự động chuyển đổi lượng dữ liệu khổng lồ thành các tri thức có ích Do vậy, khai phá dữ liệu (KPDL) nhằm phát hiện các tri thức mới giúp ích cho hoạt động của con người đã trở thành một lĩnh vực quan trọng của ngành Công nghệ thông tin
Thông tin là một khái niệm trừu tượng, được thể hiện dưới nhiều dạng thức khác nhau Thông tin có thể được phát sinh, lưu trữ, biến đổi trong những vật mang tin Dữ liệu là sự biểu diễn thông tin và được thể hiện bằng các tín hiệu vật lý Dữ liệu
là một dãy các bit các số, sử dụng các bit để đo lường các thông tin và xem nó như là các dữ liệu đã được lọc bỏ các dư thừa, được rút gọn tới mức tối thiểu để đặc trưng một cách cơ bản cho dữ liệu
Có thể xem tri thức như là các thông tin tích hợp, bao gồm các sự kiện và các mối quan hệ giữa chúng Các mối quan hệ này có thể được hiểu ra, có thể được phát hiện, hoặc có thể được học
Mục đích của phát hiện tri thức và KPDL là tìm ra các mẫu và các mô hình đang tồn tại trong các cơ sở dữ liệu nhưng vẫn còn bị che khuất bởi hàng “núi” dữ liệu Quá trình phát hiện tri thức được mô tả tóm tắt trên Hình 1.1:
Hình 1.1: Quy trình phát hiện tri thức từ cơ sở dữ liệu