Đặc biệt là việc ứng dụng các kỹ thuật như hệ hỗ trợ quyết định, khai phá dữ liệu, hệ chuyêngia, logic mờ để xây dựng các hệ thống chẩn đoán bệnh đã giúp các bác sỹ chuyênkhoa có thể ti
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO
CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH
Trang 2LỜI CAM ĐOAN
Tôi xin cam đoan những kiến thức trình bày trong luận văn này là do tôi tìmhiểu, nghiên cứu và trình bày lại theo cách hiểu của tôi Trong quá trình làm luậnvăn tôi có tham khảo các tài liệu có liên quan và đã ghi rõ nguồn tài liệu tham khảo
đó Phần lớn những kiến thức tôi trình bày trong luận văn này chưa được trình bàyhoàn chỉnh trong bất cứ tài liệu nào
Luận văn này chưa bao giờ được nộp để nhận bất kỳ bằng cấp nào tại cáctrường đại học hoặc cơ sở đào tạo khác
Thừa Thiên Huế, tháng 09 năm 2018
Học viên
Trần Thị Thu Huyền
Trang 3LỜI CẢM ƠN
Để hoàn thành được luận văn này, trước hết tôi xin gửi lời cảm ơn sâu sắcnhất tới PGS TS Lê Mạnh Thạnh, Khoa CNTT trường Đại học khoa học - Đại HọcHuế đã tận tình hướng dẫn, chỉ bảo, định hướng, đóng góp những ý kiến quý báutrong suốt quá trình tôi thực hiện luận văn
Tôi cũng bày tỏ lòng biết ơn các điều dưỡng và các bác sỹ chuyên khoa tạiBệnh viện đa khoa tỉnh Quảng Trị Các anh, chị đã rất nhiệt tình giải thích vấn đềchuyên môn giúp tôi hoàn thành tốt công việc của mình
Tôi xin chân thành cảm ơn quý thầy, cô trong Khoa Công nghệ thông tin,Phòng Đào tạo Sau đại học, Trường Đại học Khoa học - Đại học Huế đã tạo mọiđiều kiện tốt nhất để tôi hoàn thành khóa học này
Cuối cùng, tôi xin chân thành cảm ơn cơ quan và các đồng nghiệp đã hết sứctạo điều kiện cho tôi trong suốt quá trình học tập và làm luận văn Đồng thời, chânthành cảm ơn gia đình, bạn bè, những người luôn khuyến khích và giúp đỡ tôi trongnhững lúc khó khăn để tôi có thể hoàn thành tốt luận văn của mình
Thừa Thiên Huế, tháng 09 năm 2018
Học viên
Trần Thị Thu Huyền
Trang 4MỤC LỤC
Lời cam đoan I Lời cảm ơn II Mục lục III Danh mục các bảng VI Danh mục các hình VII Danh mục các chữ viết tắt VIII
MỞ ĐẦU 1
1 Lý do chọn đề tài 1
2 Mục tiêu nghiên cứu 3
3 Đối tượng và phạm vi nghiên cứu 3
4 Phương pháp nghiên cứu 3
5 Ý nghĩa khoa học và thực tiễn của luận văn 4
6 Bố cục luận văn 4
CHƯƠNG 1 CƠ SỞ LÝ THUYẾT 5
1.1 LÝ THUYẾT TẬP MỜ 5
1.1.1 Tập kinh điển 6
1.1.2 Định nghĩa tập mờ 6
1.1.3 Các thông số đặc trưng cho tập mờ 9
1.1.4 Biến ngôn ngữ 9
1.1.5 Các phép tính trên tập mờ 11
1.1.6 Quan hệ mờ 14
1.2 CÂY QUYẾT ĐỊNH 15
1.2.1 Định nghĩa cây quyết định 15
1.2.2 Ưu điểm của cây quyết định 16
1.2.3 Vấn đề xây dựng cây quyết định 17
1.2.4 Rút ra các luật từ cây quyết định 17
1.2.5 Thuật toán xây dựng cây quyết định C4.5 17
1.3 CÂY QUYẾT ĐỊNH MỜ 19
Trang 51.3.1 Định nghĩa cây quyết định mờ 19
1.3.2 Dữ liệu mẫu với biểu diễn mờ 19
1.4 TIỂU KẾT CHƯƠNG 1 23
CHƯƠNG 2 LOGIC MỜ VÀ LẬP LUẬN MỜ 24
2.1 LOGIC MỜ 24
2.1.1 Mệnh đề mờ 24
2.1.2 Tập luật mờ 25
2.1.3 Phép toán kéo theo mờ 26
2.2 PHƯƠNG PHÁP LẬP LUẬN XẤP XỈ DỰA TRÊN TẬP MỜ 26
2.3 PHÉP SUY DIỄN MỜ 29
2.4 HỆ MỜ 31
2.4.1 Cấu trúc và hoạt động của hệ mờ tổng quát 31
2.4.2 Cơ sở luật mờ 32
2.4.3 Bộ suy diễn mờ 33
2.4.4 Bộ mờ hoá 35
2.4.5 Bộ giải mờ 36
2.5 TIỂU KẾT CHƯƠNG 2 37
CHƯƠNG 3 XÂY DỰNG HỆ DỰ ĐOÁN BỆNH ĐÁI THÁO ĐƯỜNG 38
3.1 TỔNG QUAN VỀ BỆNH ĐÁI THÁO ĐƯỜNG 38
3.1.1 Thực trạng bệnh đái tháo đường 38
3.1.2 Định nghĩa bệnh đái tháo đường 39
3.1.3 Nguyên nhân, các yếu tố nguy cơ của bệnh đái tháo đường 39
3.1.4 Triệu chứng đặc trưng của bệnh đái tháo đường 40
3.1.5 Chẩn đoán và phân loại bệnh đái tháo đường 42
3.2 QUY TRÌNH CHẨN ĐOÁN BỆNH 47
3.2.1 Lập luận chẩn đoán bệnh: 47
3.2.2 Các kiểu triệu chứng 48
3.2.3 Quy trình chẩn đoán bệnh 48
3.2.4 Các quy luật chẩn đoán 49
Trang 63.3 QUY TRÌNH ỨNG DỤNG LOGIC MỜ VÀO CHẨN ĐOÁN
BỆNH ĐÁI THÁO ĐƯỜNG 49
3.3.1 Mô tả bài toán 49
3.3.2 Mô hình kiến trúc hệ thống 49
3.3.3 Thu thập dữ liệu 50
3.3.4 Xây dựng và biểu diễn tri thức mờ 52
3.4 THIẾT KẾ HỆ THỐNG 63
3.5 THỬ NGHIỆM VÀ ĐÁNH GIÁ 66
3.6 TIỂU KẾT CHƯƠNG 3 67
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 68
TÀI LIỆU THAM KHẢO 70 PHỤ LỤC
Trang 7DANH MỤC CÁC BẢNG
Bảng 1.1 Bảng dữ liệu phân lớp mức lương 16
Bảng 1.2 Dữ liệu mẫu về việc tự lái xe đi làm (Car Driving) 20
Bảng 1.3 Biểu diễn mờ của tập mẫu 22
Bảng 3.1 Bảng dữ liệu huấn luyện 54
Bảng 3.2 Bảng phân loại chức năng 63
Trang 8DANH MỤC CÁC HÌNH
Hình 1.1 Hàm thuộc µ A (x) của tập kinh điển A 6
Hình 1.2 Hàm thuộc µ B (x) của tập mờ B 7
Hình 1.3 Ba tập mờ Cold (lạnh), Warm (ấm) và Hot (nóng) dạng hình thang 8
Hình 1.4 Đồ thị hàm thuộc của tập mờ A với các số tự nhiên nhỏ hơn 5 8
Hình 1.5 Độ cao, miền xác định, miền tin cậy của tập mờ 9
Hình 1.6 Biến ngôn ngữ 10
Hình 1.7 Hợp của hai tập mờ 11
Hình 1.8 Giao của hai tập mờ 12
Hình 1.9 Bù của một tập mờ 12
Hình 1.10 Cây quyết định phân lớp mức lương 16
Hình 1.11 Hình biểu diễn hàm thuộc của thuộc tính Tắc đường (MF) 21
Hình 1.12 Quá trình phát triển cây của thuật toán Fuzzy ID3 23
Hình 2.1 Cấu trúc của mô hình mờ 31
Hình 2.2 Mô hình hệ mờ nhiều đầu vào – một đầu ra 32
Hình 2.3 Các dạng hàm thuộc thường được sử dụng trong hệ mờ 36
Hình 2.4 Phương pháp giải mờ cực đại 37
Hình 2.5 Phương pháp giải mờ trọng tâm 37
Hình 3.1 Mô hình kiến trúc hệ thống chẩn đoán bệnh 50
Hình 3.2 Các hàm thuộc của mức độ tiểu 55
Hình 3.3 Các hàm thuộc của mức độ uống nước 56
Hình 3.4 Các hàm thuộc của mức độ ăn 57
Hình 3.5 Các hàm thuộc của mức độ giảm cân 58
Hình 3.6 Các hàm thuộc biểu diễn nồng độ Glucose máu lúc đói 59
Hình 3.8 Form chẩn đoán bệnh đái tháo đường 64
Hình 3.9 Form chẩn đoán bệnh đái tháo đường với bộ dữ liệu cụ thể 64
Hình 3.10 Form chỉ dẫn cách phòng bệnh đái tháo đường 65
Hình 3.11 Form chỉ dẫn cách điều trị bệnh đái tháo đường 66
Trang 9DANH MỤC CÁC CHỮ VIẾT TẮTWHO (World Health Organization): Tổ chức Y tế Thế giới
IDF (International Diabetes Federation): Liên đoàn Đái tháo đường quốc tế OGTT (Oral glucose tolerance test): Nghiệm pháp dung nạp glucose
FPG (fasting plasma glucose): Glucose máu lúc đói
Trang 10MỞ ĐẦU
1 Lý do chọn đề tài
Chuẩn đoán bệnh trong y học là một lĩnh vực tương đối phức tạp, lĩnh vực này
có những đặc điểm khác biệt đó là mối quan hệ tương hỗ giữa lý thuyết và thựchành Đối tượng của lĩnh vực này là những bệnh nhân, những con người thực sự Kiến thức y học cũng khá phức tạp Để tìm ra những kiến thức mới, phươngpháp truyền thống là dựa trên sự mô tả của các hồ sơ bệnh án, nhật ký y khoa, cơ sở
dữ liệu đề tài nghiên cứu,… Chính vì thế, người bác sỹ thường bị tràn ngập trongnúi dữ liệu khổng lồ Và đặc biệt là những dữ liệu đó ở mỗi bệnh nhân lại có sự mơ
hồ khác nhau, gắn với cảm xúc của mỗi người Người bác sỹ luôn phải làm việctrong trạng thái căng thẳng trong khi yêu cầu phải đưa ra được những quyết địnhđúng đắn hiệu quả nhất
Hiện nay, Đái tháo đường là bệnh nhận được sự quan tâm đặc biệt trong giới ykhoa Bệnh này nằm trong số 10 nguyên nhân gây tử vong và tàn phế hàng đầu ở cảhai giới, gây ra các biến chứng nặng nề về tim mạch, tổn thương thần kinh, mù mắt,suy thận, nhiễm trùng và gây tổn thương bàn chân có thể dẫn đến phải cắt cụt chi.Bệnh đã và đang trở thành vấn đề mang tính xã hội cao ở nhiều quốc gia bởi sựbùng phát nhanh chóng, mức độ nguy hại đến sức khoẻ ĐTĐ còn trở thành lực cảncủa sự phát triển, gánh nặng cho toàn xã hội khi mà mỗi năm thế giới phải chi sốtiền khổng lồ từ 232 tỷ đến 430 tỷ USD cho việc phòng chống và điều trị
Theo Tổ chức y tế thế giới (WHO), năm 1985 có khoảng 30 triệu người mắcđái tháo đường trên toàn cầu, năm 2004 có khoảng 98,9 triệu người mắc, đến năm
2009 có khoảng 180 triệu người và con số đó có thể tăng gấp đôi lên tới 366 triệungười vào năm 2030
Hiện Việt Nam có trên 5 triệu người mắc bệnh đái tháo đường Theo Bộ y tế,con số này được dự báo tiếp tục gia tăng trong thời gian tới Theo thống kê trong 10năm qua, số lượng bệnh nhân mắc bệnh đái tháo đường ở nước ta tăng 211%, và vớicon số này, Việt Nam nằm trong số các quốc gia có tốc độ tăng bệnh nhân đái tháo
Trang 11đường cao nhất thế giới Thống kê của Liên đoàn Đái tháo đường quốc tế (IDF) chothấy, trên 50% bệnh nhân đái tháo đường ở Việt Nam chết vì căn bệnh này trướcnăm 60 tuổi
Biện pháp hữu hiệu để làm giảm tiến triển và biến chứng của bệnh, chi phíchữa bệnh ít tốn kém nhất là phải phát hiện sớm và điều trị cho bệnh nhân kịp thời.Tuy nhiên, công tác phát hiện sớm, chăm sóc và điều trị bệnh đái tháo đường còngặp rất nhiều khó khăn do kết quả chẩn đoán phụ thuộc rất nhiều vào kinh nghiệmcủa bác sỹ cũng như suy luận tại thời điểm chẩn đoán, chứ không dựa trên quy tắctiêu chuẩn nào
Một hệ thống chẩn đoán bệnh, sẽ hỗ trợ cho bác sỹ rất nhiều trong việc đưa rakết quả chẩn đoán cuối cùng Với việc áp dụng CNTT, ngành y tế hiện nay đã đạtđược nhiều thành tựu to lớn trong việc vận hành hệ thống khám chữa bệnh Đặc biệt
là việc ứng dụng các kỹ thuật như hệ hỗ trợ quyết định, khai phá dữ liệu, hệ chuyêngia, logic mờ để xây dựng các hệ thống chẩn đoán bệnh đã giúp các bác sỹ chuyênkhoa có thể tiếp cận và đưa ra chẩn đoán bệnh một cách nhanh chóng, chính xác Từ
đó, có thể đưa ra phương pháp điều trị bệnh hiệu quả, đồng thời tiết giảm chi phíđiều trị
Trong lĩnh vực y tế tri thức chuyên gia là rất quan trọng và những tri thức này
phần lớn được phát biểu bằng ngôn ngữ với các thông tin mờ và không chắc chắn,chuyên gia càng làm việc lâu năm thì càng tích luỹ nhiều kinh nghiệm, nhưng kinhnghiệm này không tồn tại mãi mãi với thời gian, vì vòng đời của con người là cógiới hạn Vì vậy, nghiên cứu phát triển phương pháp luận nhằm thu thập, duy trì vàkhai thác để phát huy được các tri thức chuyên gia này là một nhu cầu rất cần thiết
Chính vì vậy, tôi chọn đề tài nghiên cứu: “Tìm hiểu phương pháp lập luận
mờ và ứng dụng để xây dựng hệ dự đoán bệnh đái tháo đường”, nhằm góp phần
phát triển phương pháp luận phục vụ việc thu thập các tri thức chuyên gia y tế trongmôi trường thông tin mờ, không chắc chắn và xây dựng một hệ hỗ trợ chẩn đoángiúp các y bác sỹ chuyên khoa có thể đưa ra chẩn đoán bệnh đái tháo đường chínhxác hơn và có cách điều trị phù hợp
Trang 122 Mục tiêu nghiên cứu
- Mục tiêu chung: Tìm hiểu Logic mờ, phương pháp lập luận mờ và ứng dụngmột số kỹ thuật tổng hợp trong hệ hỗ trợ quyết định để xây dựng hệ dự đoán bệnhđái tháo đường
- Các mục tiêu cụ thể: Ứng dụng cấu trúc của hệ hỗ trợ ra quyết định, logic
mờ, các phương pháp xây dựng cơ sở dữ liệu; Kết hợp thu thập ý kiến chuyên gia,khai phá hồ sơ bệnh án và các nguồn dữ liệu khác để xây dưng tập luật, đánh giá tậpluật nhằm phục vụ cho việc xây dựng hệ dự đoán bệnh
3 Đối tượng và phạm vi nghiên cứu
- Về lý thuyết: Nghiên cứu về Logic mờ, phương pháp mờ hóa, hệ hỗ trợquyết định (hệ mờ), phân lớp dữ liệu bằng cây quyết định để xây dựng hệ chẩn đoánbệnh đái tháo đường
- Về thực hành: Địa bàn tỉnh Quảng Trị, khảo sát các bệnh nhân tuổi từ 30 đến
65 nhập viện điều trị bệnh đái tháo đường tại bệnh viện đa khoa tỉnh Quảng Trị,thời gian khảo sát một năm từ tháng 12/2016 - 12/2017
4 Phương pháp nghiên cứu
- Phương pháp nghiên cứu lý thuyết: Tổng hợp, phân tích các công trình
nghiên cứu liên quan đến logic mờ, hệ hỗ trợ quyết định; hồ sơ bệnh án, hướng dẫnchẩn đoán và điều trị bệnh đái tháo đường của Bộ y tế Lựa chọn các kỹ thuật ứngdụng cho bài toán thực tế
- Phương pháp kế thừa: các thông tin và các số liệu thống kê đã được thu thập;
- Phương pháp chuyên gia: Hỏi ý kiến chuyên gia về các lĩnh vực chuyên
môn: Y tế, giáo dục, khoa học môi trường,
- Phương pháp nghiên cứu thực tiễn: tìm hiểu kết quả khám và chữa bệnh của
các bệnh nhân đái tháo đường tại một số bệnh viện trên địa bàn
- Phương pháp tổng hợp thu thập thông tin, phân tích thông tin: xác định cấu trúc
và tính chất của thông tin, để tìm ra phương pháp thu thập, xử lý số liệu thích hợp
Trang 135 Ý nghĩa khoa học và thực tiễn của luận văn
- Biết các yếu tố cơ bản của logic mờ và ứng dụng
- Hiểu được phương pháp chẩn đoán bệnh đái tháo đường
- Ứng dụng được lý thuyết logic mờ trong CNTT vào hệ hỗ trợ chẩn đoánbệnh đái tháo đường
- Luận văn mang tính nhân văn và xã hội
6 Bố cục luận văn
Nội dung chính của luận văn gồm 3 chương:
Chương 1 Cơ sở lý thuyết về tập mờ và cây quyết định.
Nội dung của Chương này chủ yếu giới thiệu cơ sở lý thuyết về tập mờ, biếnngôn ngữ, quan hệ mờ, cây quyết định và cây quyết định mờ
Chương 2 Logic mờ và lập luận mờ.
Nội dung của Chương 2 trình bày tổng quan về Logic mờ, các phương pháplập luận xấp xỉ, lập luận mờ và hệ mờ tổng quát
Chương 3 Xây dựng hệ dự đoán bệnh đái tháo đường
Nội dung của Chương là trình bày tổng quan về bệnh đái tháo đường, quytrình chẩn đoán bệnh và ứng dụng logic mờ, cây quyết định mờ để xây dựng hệ dựđoán bệnh đái tháo đường
Trang 14CHƯƠNG 1 CƠ SỞ LÝ THUYẾT
Logic mờ được giáo sư L.A.Zadeh công bố lần đầu tiên tại Mỹ vào năm 1965.Ứng dụng đầu tiên của logic mờ vào công nghiệp được thực hiện ở Châu Âu,khoảng sau năm 1970 Tại trường Queen Mary ở Luân Đôn – Anh, EbrahimMamdani dùng logic mờ để điều khiển một máy hơi nước mà trước đây ông ấykhông thể điều khiển được bằng các kỹ thuật cổ điển Ở Đức, Hans Zimmermanndùng logic mờ cho các hệ ra quyết định và liên tiếp sau đó, logic mờ được áp dụngvào các lĩnh vực khác nhau Kể từ năm 1980, logic mờ đạt được nhiều thành côngtrong các ứng dụng ra quyết định và phân tích dữ liệu ở Châu Âu Nhiều kỹ thuậtlogic mờ cao cấp được nghiên cứu và phát triển trong lĩnh vực này
Các công ty của Nhật bắt đầu dùng logic mờ vào kỹ thuật điều khiển từ năm
1980 Nó được ứng dụng trong nhà máy xử lý nước của Fuji Electric vào năm 1983,
hệ thống xe điện ngầm của Hitachi vào năm 1987 Những thành công đầu tiên đãtạo ra nhiều quan tâm ở Nhật Có nhiều lý do để giải thích tại sao logic mờ được ưachuộng Thứ nhất, logic mờ cho phép tạo nhanh các bản mẫu rồi tiến đến việc tối
ưu Thứ hai, các hệ dùng logic mờ đơn giản và dễ hiểu Logic mờ cung cấp cho họmột phương tiện rất minh bạch để thiết kế hệ thống Do đó, logic mờ được dùngnhiều trong các ứng dụng thuộc lĩnh vực điều khiển thông minh hay xử lý dữ liệu.Ngoài ra, logic mờ cũng được dùng để tối ưu nhiều quá trình hóa học và sinh học
Từ những thành công tại Nhật Bản, Mỹ và các nước Châu Âu đã bắt đầu quantâm đến logic mờ và ứng dụng chúng trong các lĩnh vực điều khiển tự động, côngnghiệp dân dụng và cũng từ đó logic mờ đã trở thành một kỹ thuật thiết kế “chuẩn”
và được chấp nhận rộng rãi trong cộng đồng
1.1 LÝ THUYẾT TẬP MỜ
Ý tưởng nổi bật của khái niệm tập mờ của Zadeh là từ những khái niệm trừu
tượng về ngữ nghĩa của thông tin mờ, không chắc chắn như trẻ, nhanh, cao-thấp, xinh đẹp, Ông đã tìm ra cách biểu diễn nó bằng một khái niệm toán học, được
gọi là tập mờ, như là một sự khái quát trực tiếp của khái niệm tập hợp kinh điển
Trang 151.1.1 Tập kinh điển
Khái niệm tập hợp được hình thành trên nền tảng lôgic và được định nghĩanhư là sự sắp xếp chung các đối tượng có cùng tính chất, được gọi là phần tử củatập hợp đó
Cho một tập hợp A, một phần tử x thuộc A được ký hiệu: x ∈ A Thông thường
ta dùng hai cách để biểu diễn tập hợp kinh điển, đó là: Liệt kê các phần tử của tập
Trang 16
Tập hợp mờ là tập hợp mà mỗi thành phần là một bộ số ( , ( ))x x Như vậy, ta
nói A là tập mờ nếu A có biểu diễn: A = {(x, µ A (x)) | x ∈ X}
A là tập mờ trên không gian nền X nếu A được xác định bởi hàm:
.Trong đó:
X : là tập nền hay được gọi là tập vũ trụ của tập mờ A;
là hàm thuộc (membership function);
là độ thuộc của x vào tập mờ A.
Các tập mờ được coi là một mở rộng của lý thuyết tập hợp cổ điển là vì, với
một universe (Không gian tham chiếu hay không gian nền) nhất định, một hàm thuộc có thể giữ vai trò của một hàm đặc trưng (indicator function) ánh xạ mỗi
phần tử tới một giá trị 0 hoặc 1 như trong khái niệm cổ điển
Trong khái niệm tập hợp kinh điển hàm thuộc µ A (x) của tập A, chỉ có một trong hai giá trị là "1" nếu x ∈ A hoặc "0" nếu x ∉ A.
Ví dụ 1.2 Cách biểu diễn hàm thuộc như trên sẽ không phù hợp với những tập được mô tả "mờ" như tập B gồm các số thực gần bằng 5:
B = { x ∈ R | x ≈5 }.
Khi đó ta không thể khẳng định chắc chắn số 4 có thuộc B hay không? mà chỉ
có thể nói nó thuộc B bao nhiêu phần trăm Để trả lời được câu hỏi này, ta phải coi
hàm thuộc có giá trị trong khoảng từ 0 đến 1 tức là: 1
Trang 17Hình 1.2 Hàm thuộc µ B (x) của tập mờ B
Từ phân tích trên ta có định nghĩa: Tập mờ B xác định trên tập kinh điển M là
tập mà một phần tử của nó được biểu diễn bởi một cặp giá trị
Trong đó x ∈ M và là ánh xạ Ánh xạ được gọi là hàm thuộc của
tập mờ B Tập kinh điển M được gọi là cơ sở của tập mờ B.
Như vậy về phương diện giải tích mỗi tập mờ ứng với một hàm số và hàm số
có đồ thị của nó Những tập mờ thường gặp đồ thị của hàm thuộc (membershipfunction) có hình dạng là hình tam giác hoặc hình thang mà người ta thường gọi vắntắt là “tập mờ hình thang” hoặc “tập mờ hình tam giác” như hình vẽ dưới đây:
Hình 1.3 Ba tập mờ Cold (lạnh), Warm (ấm) và Hot (nóng) dạng hình thang.
Theo hình vẽ này tại điểm h 1 trên trục nhiệt độ (temperature) chiếu lên đầu
tiên ta thấy cắt tập mờ warm tại điểm mà ta có thể thấy được là “hơi ấm”, đồng
thời cắt tập mờ cold tại điểm mà ta thấy là “tương đối lạnh” Tóm lại ở nhiệt độ h 1
có thể xem là “hơi ấm” hoặc “tương đối lạnh”
h 1
Trang 18Ví dụ 1.3 Một tập mờ A với các số tự nhiên nhỏ hơn 5 được mô tả bằng hàm
thuộc có đồ thị như sau:
Hình 1.4 Đồ thị hàm thuộc của tập mờ A với các số tự nhiên nhỏ hơn 5
Số tự nhiên 1 và 2 có độ phụ thuộc là 1;
Số tự nhiên 3 và 4 có độ phụ thuộc thấp hơn 1;
Các số không liệt kê có độ phụ thuộc là 0
1.1.3 Các thông số đặc trưng cho tập mờ
Các thông số đặc trưng cho tập mờ là độ cao, miền xác định và miền tin cậy
Hình 1.5 Độ cao, miền xác định, miền tin cậy của tập mờ
- Độ cao của một tập mờ B (Định nghĩa trên cơ sở M), ký hiệu là H(B), là cận
trên đúng (giá trị lớn nhất) của hàm thuộc µ B trên M, có nghĩa:
H(B) = sup{µ B (x)| x ∈ M}.
Một tập mờ B được gọi là tập mờ chuẩn nếu H(B) = 1 Ngược lại, tập mờ B được gọi là dưới chuẩn (H(B) < 1)
Trang 19- Miền xác định (Giá) của tập mờ B (Định nghĩa trên cơ sở M), ký hiệu là
S(B), là tập con của M có giá trị hàm thuộc khác không, có nghĩa:
S(B) = {x ∈ M|µ B (x) > 0}.
- Miền tin cậy của tập mờ B (định nghĩa trên cơ sở M), ký hiệu là T(B), là tập
con của M có giá trị hàm thuộc bằng 1:
T(B) = {x ∈ M|µ B (x) = 1}.
1.1.4 Biến ngôn ngữ
Biến ngôn ngữ là phần chủ đạo trong các hệ thống dùng logic mờ Các biếnngôn ngữ được xác định thông qua các tập giá trị mờ của nó
Ví dụ các tập mờ mô tả biến nhiệt độ là “rất nóng”, “hơi nóng”, “trung bình”,
“hơi lạnh” và “rất lạnh” Chúng được gọi là các tập ngôn ngữ, mang một khoảng giátrị nào đó của biến ngôn ngữ và được thể hiện trong cùng một không gian nền U
Hình 1.6 Biến ngôn ngữCác luật trong hệ logic mờ mô tả tri thức của hệ Chúng dùng các biến ngônngữ như là từ vựng để mô tả các tầng điều khiển trong hệ Việc giải thích các luật
mờ cũng là việc trình bày cách tính các khái niệm ngôn ngữ
Khái niệm biến ngôn ngữ [5], [13]:
Một biến ngôn ngữ được xác định bởi bộ năm (X, T(X), U, R, M), trong đó:
- X là tên biến
Ví dụ 1.4 Các biến ngôn ngữ: “nhiệt độ”, “tốc độ”, “độ ẩm”,…
- T(X) là tập các giá trị ngôn ngữ của biến X
Trang 20Ví dụ 1.5 T(tốc độ)={rất chậm, hơi chậm, trung bình, hơi nhanh, rất nhanh}.
- U là không gian tham chiếu của biến cơ sở u, mỗi giá trị ngôn ngữ xem như
là một biến mờ trên U kết hợp với biến cơ sở u (các giá trị mà biến X có thể nhận).
Ví dụ 1.6 X là “tốc độ” thì U = [0, 150] (km/h).
- R là tập luật cú pháp sinh các giá trị ngôn ngữ của T(X).
Ví dụ 1.7 R phát sinh tên các phần tử trong T(tốc độ) là hoàn toàn trực giác.
- M là tập các luật ngữ nghĩa gán mỗi giá trị ngôn ngữ trong T(X) với một tập mờ trên U.
Trang 21Ví dụ 1.8 Luật ngữ ngĩa M được định nghĩa là :
M (rất chậm) = tập mờ đối với tốc độ là 0 km/h và có hàm thuộc là µ rất chậm;
M (hơi chậm) = tập mờ đối với tốc độ là 20 km/h và có hàm thuộc là µ hơi chậm;
M (trung bình) = tập mờ đối với tốc độ là 40 km/h và có hàm thuộc là µ trung bình;
M (hơi nhanh) = tập mờ đối với tốc độ là 60 km/h và có hàm thuộc là µ hơi nhanh;
M (rất nhanh) = tập mờ đối với tốc độ là 80 km/h và có hàm thuộc là µ rất nhanh
Từ định nghĩa trên chúng ta có thể nói rằng biến ngôn ngữ là biến có thể nhậngiá trị là các tập mờ trên một vũ trụ nào đó Để biểu diễn sự nhấn mạnh một biếnngôn ngữ, người ta hay dùng các từ như rất, hơi, ít, nhiều,… gọi là các gia tử
1.1.5 Các phép tính trên tập mờ [5], [14]
Phép hợp mờ (Union)
Cho A, B là hai tập mờ xác định trên tập vũ trụ X và có các hàm thuộc lần lượt
là µ A , µ B Hợp của hai tập mờ A và B là một tập mờ, ký hiệu A∪B, với hàm thuộc
µ A ∪B được định nghĩa như sau:
.
Hình 1.7 Hợp của hai tập mờ
Phép giao mờ (Intersection)
Cho A, B là hai tập mờ xác định trên tập vũ trụ X và có các hàm thuộc lần luợt
là µ A , µ B Giao của hai tập mờ A và B là một tập mờ, ký hiệu A∩B, với hàm thuộc
được định nghĩa như sau:
Trang 22Hình 1.8 Giao của hai tập mờ
Phép lấy phần bù của một tập mờ
Cho A là tập mờ xác định trên tập vũ trụ X, có hàm thuộc µ A Phép lấy bù của
tập A là một tập mờ, ký hiệu ~A, với hàm thuộc được định nghĩa như sau:
µ~A = 1- µA, ∀x ∈ X.
Hình 1.9 Bù của một tập mờ
Tích đại số của hai tập mờ
Cho A, B là hai tập mờ xác định trên tập vũ trụ X và có các hàm thuộc lần lượt
là Tích đại số của hai tập mờ A và B là một tập mờ, ký hiệu A.B, với
hàm thuộc được định nghĩa như sau:
µA.B(x) = µA(x).µB(x), ∀x∈X.
Tổng đại số của hai tập mờ
Trang 23Cho A, B là hai tập mờ xác định trên tập vũ trụ X và có các hàm thuộc lần lượt
là , Tổng đại số của hai tập mờ A và B là một tập mờ, ký hiệu , với hàm
thuộc được định nghĩa như sau:
∀x ∈ X
Tích Descartes của hai tập mờ
Cho A, B là hai tập mờ xác định trên tập vũ trụ tương ứng X và Y Tích
Descartes của hai tập mờ A và B trong X, ký hiệu AxB là một tập mờ trên tập vũ trụ
XxYcó hàm thuộc được xác định như sau:
µA x B (x, y) = min{µA(x), µB(y)}, ∀(x, y) ∈ XxY.
Phép T-norm
Định nghĩa : Một hàm 2 biến T: [0,1]x[0,1] [0,1] được gọi là phép t-norm
nếu thỏa mãn các tính chất sau với ∀x, x’, y, z ∈ [0,1] :
1) Tính chất điều kiện biên : T(x, 1) = x (Tồn tại phần tử đơn vị);
2) Tính chất giao hoán : T(x, y) = T(y, x) ;
3) Tính chất đơn điệu : x ≤ x’ � T(x, y) ≤ T(x’, y) ;
4) Tính chất kết hợp : T(T(x, y),z) = T(x, T(y, z)).
Dễ dàng kiểm chứng phép min và phép tích đại số là các phép t-norm, chúng
được ký hiệu là T m và T p Phép t-norm T m được gọi là phép giao mờ chuẩn
Một số phép t-norm hay được sử dụng :
- Phép giao mờ chuẩn: T m = min{x, y} ;
- Phép tích đại số: x.y ;
- Phép hiệu giới nội: T(x, y) = max{0, x + y - 1} ;
Trang 241) Tính chất giới nội : S(x, 0) = x (Tồn tại phần tử đơn vị) ;
2) Tính chất giao hoán : S(x, y) = S(y, x) ;
Khái niệm về quan hệ mờ:
Cho X và Y là hai không gian nền, R được gọi là một quan hệ mờ trên X x Y nếu R là một tập mờ trên X x Y, tức là có một hàm thuộc :
Trang 25Các phép tính trên quan hệ mờ :
Vì quan hệ mờ cũng là tập mờ nên các phép tính trên tập mờ cũng là phép tínhtrên quan hệ mờ Tuy nhiên, trên quan hệ mờ có những phép tính đặc thù riêng màtrên tập mờ nói chung không có, chẳng hạn :
Phép đảo của quan hệ mờ R(X,Y) là R-1(Y, X) cho bởi: R-1(y, x) = R(x, y) ;
Phép hợp thành của hai quan hệ mờ R1 và R2
Cho R1 là quan hệ mờ trên X x Y và R2 là quan hệ mờ trên Y x Z, thì phép hợp
thành R1 o R2 là một quan hệ mờ trên X x Z.
Có 3 phép hợp thành thông dụng :
1.2 CÂY QUYẾT ĐỊNH
Kỹ thuật cây quyết định là một công cụ mạnh và hiệu quả trong việc phân lớp
và dự báo Các đối tượng dữ liệu được phân thành các lớp Các giá trị của đối tượng
Trang 26dữ liệu chưa biết sẽ được dự đoán, dự báo Tri thức được rút ra trong kỹ thuật nàythường được mô tả dưới dạng tường minh, đơn giản, trực quan, dễ hiểu đối vớingười sử dụng.
1.2.1 Định nghĩa cây quyết định
Trong lĩnh vực học máy, cây quyết định là một kiểu mô hình dự báo(predictive model), nghĩa là một ánh xạ từ các quan sát về một sự vật, hiện tượng tới các kết luận về giá trị mục tiêu của sự vật, hiện tượng Mỗi nút trong (internal node) tương ứng với một biến; đường nối giữa nó với nút con của nó thể hiện giá trị
cụ thể cho biến đó Mỗi nút lá đại diện cho giá trị dự đoán của biến mục tiêu, chotrước các giá trị dự đoán của các biến được biểu diễn bởi đường đi từ nút gốc tới nút
lá đó Kỹ thuật học máy dùng trong cây quyết định được gọi là học bằng cây quyếtđịnh, hay chỉ gọi với cái tên ngắn gọn là cây quyết định [8], [9], [10], [16]
Ví dụ 1.9 Để xác định mức lương cao hay thấp ứng với một độ tuổi nào đó,
qua khảo sát ta có bảng dữ liệu như sau:
Bảng 1.1 Bảng dữ liệu phân lớp mức lương
Trang 27Hình 1.10 Cây quyết định phân lớp mức lương
1.2.2 Ưu điểm của cây quyết định
So với các phương pháp khai phá dữ liệu khác, cây quyết định có một số ưuđiểm sau:
- Cây quyết định tương đối dễ hiểu;
- Đòi hỏi mức tiền xử lý dữ liệu đơn giản;
- Có thể xử lý với cả các dữ liệu rời rạc và liên tục;
- Kết quả dự đoán bằng cây quyết định có thể thẩm định lại bằng cách kiểm trathống kê
1.2.3 Vấn đề xây dựng cây quyết định
Có nhiều thuật toán khác nhau để xây dựng cây quyết định như: CLS, ID3,C4.5, SLIQ, SPRINT, EC4.5, C5.0,…Nhưng nói chung quá trình xây dựng câyquyết định đều được chia ra làm 3 giai đoạn cơ bản:
- Xây dựng cây: Thực hiện chia một cách đệ quy tập mẫu dữ liệu huấn luyệncho đến khi các mẫu ở mối nút lá thuộc cùng một lớp;
- Cắt tỉa cây: Là việc làm dùng để tối ưu hoá cây Cắt tỉa cây chính là việc trộnmột cây con vào trong một nút lá;
Trang 28- Đánh giá cây: Dùng để đánh giá độ chính xác của cây kết quả Tiêu chí đánhgiá là tổng số mẫu được phân lớp chính xác trên tổng số mẫu đưa vào
1.2.4 Rút ra các luật từ cây quyết định.
Có thể chuyển đổi qua lại giữa mô hình cây quyết định và mô hình dạng luật(IF …THEN…) Hai mô hình này là tương đương nhau
Ví dụ 1.10 Từ cây quyết định ở Hình 1.10 ta có thể rút ra được các luật sau:
IF (Tuổi <= 35) AND (Lương <= 30) THEN mức lương = Thấp;
IF (Tuổi <= 35) AND (Lương > 30) THEN mức lương = Cao;
IF (Tuổi > 35) AND (Lương <= 50 ) THEN mức lương = Thấp;
IF (Tuổi > 35) AND (Lương > 50) THEN mức lương = Cao
1.2.5 Thuật toán xây dựng cây quyết định C4.5
Thuật toán C4.5 (thuật toán cải tiến của ID3) là một thuật toán phân lớp tạo racây quyết định được phát triển bởi J Ross Quinlan vào năm 1996 Cây quyết địnhđược tạo ra bởi thuật toán C4.5 có đặc điểm đơn giản, dễ sử dụng, dễ hiểu bởi cácluật tạo ra ở nút lá của cây có thể biểu diễn dưới dạng câu lệnh If- then Chính vìthế, trong luận văn này dùng thuật toán C4.5 để xây dựng cây quyết định phân lớp
dữ liệu (khả năng mắc bệnh đái tháo đường)
Thuật toán xây dựng cây quyết định C4.5
Input: Tập dữ liệu huấn luyện (tập các thuộc tính);
Output: Cây quyết định phân lớp dữ liệu.
Mô tả thuật toán dưới dạng giả mã như sau:
Function C45_builder(tập_A, tập_thuộc_tính)
{ if (mọi record trong tập_A đều nằm trong cùng một lớp)
{ return một nút lá được gán nhãn bởi lớp đó;}
else
{ if (tập_thuộc_tính là rỗng )
Trang 29{ return nút lá được gán nhãn bởi tuyển của tất
cả các
lớp trong tập_A; } else
{ Chọn một thuộc tính P, lấy nó làm gốc cho cây
hiện tại;
Xóa P ra khỏi tập_thuộc_tính;
For each (giá trị V của P)
{Tạo một nhánh của cây gán nhãn V;
Đặt vào phân_vùng V các ví dụ trong tập_A có
giá trị V tại thuộc tính P;
Gọi C45_builder (phân_vùng V, tập_thuộc_tính), gắn kết quả vào nhánh V; }
} }
}
1.3 CÂY QUYẾT ĐỊNH MỜ
Điểm không thuận lợi của cây quyết định là tính không ổn định của nó Câyquyết định được thừa nhận như một cách phân lớp dễ thay đổi nhất về khía cạnhphụ thuộc vào dữ liệu huấn luyện Cấu trúc của cây quyết định có thể khác hoàntoàn nếu có thay đổi nào đó trong tập dữ liệu huấn luyện Để khắc phục vấn đề nàymột số nhà nghiên cứu đã đưa ra cây quyết định mờ bằng cách sử dụng lý thuyết tập
mờ để diễn tả mức độ quan hệ của các giá trị thuộc tính, điều này có thể phân biệtchính xác sự phù hợp của các quan hệ phụ thuộc giữa các ví dụ huấn luyện khácnhau và mọi giá trị của thuộc tính
1.3.1 Định nghĩa cây quyết định mờ
Cây quyết định mờ là sự mở rộng của cây quyết định cổ điển và là mộtphương pháp hiệu quả để rút ra tri thức trong các bài toán phân loại không chắc
Trang 30chắn Nó áp dụng lý thuyết tập mờ để biểu diễn tập dữ liệu và kết hợp trong pháttriển cây và tỉa cành để xác định cấu trúc của cây [8].
1.3.2 Dữ liệu mẫu với biểu diễn mờ
Nhìn chung, dữ liệu tồn tại hai loại thuộc tính khác nhau là rời rạc và liên tục.Nhiều thuật toán đòi hỏi dữ liệu với các giá trị rời rạc Không dễ dàng gì để thaythế một miền liên tục với một miền rời rạc Điều này đòi hỏi sự phân vùng vàgộp nhóm Và cũng rất khó để định nghĩa ranh giới của các thuộc tính liên tục
Ví dụ, làm thế nào để định nghĩa đoạn tắc đường là dài hay ngắn? Có thể chorằng đoạn tắc đường 3km là dài và 2,9 km là ngắn? Có thể nói rằng trời lạnh vớinhiệt độ là 9OC, trời ấm áp với nhiệt độ là 10OC? Do vậy, một số nhà nghiêncứu đã đưa khái niệm mờ vào thuật toán ID3, thay thế dữ liệu mẫu với biểu diễn
mờ và hình thành nên thuật toán Fuzzy ID3
Ví dụ 1.11 việc một người quyết định tự lái xe ôtô (Car Driving) hay dùng
phương tiện công cộng khác để đi làm phụ thuộc vào thời tiết như nhiệt độ(Tempereture), gió (Wind) và tình hình giao thông có tắc đường (Traffic-Jam)dài không Ta có tập dữ liệu mẫu như bảng dưới:
Bảng 1.2 Dữ liệu mẫu về việc tự lái xe đi làm (Car Driving)
Trang 31Hình 1.11 Hình biểu diễn hàm thuộc của thuộc tính Tắc đường (MF)
Với thuộc tính Nhiệt độ là Mát mẻ, Ấm áp hay Nóng, ta có thể định nghĩa các hàm thuộc tương ứng (µ c , µ m hayµ h) như sau:
Trang 32Với thuộc tính Gió là Yếu hay Mạnh ta có thể định nghĩa các hàm thuộc tương ứng (µ w hay µ w) như sau:
Ta thu được biểu diễn mờ của tập mẫu như bảng dưới đây (Ký hiệu: Membership Function là hàm thuộc, N: Không, Y: Có):
MF-Bảng 1.3 Biểu diễn mờ của tập mẫu
Trang 33Như ví dụ ở trên, ta đã phân vùng tập mẫu thành những khoảng khácnhau Sự phân vùng này là đầy đủ (mỗi giá trị trong miền là thuộc vào ít nhất một tập con) và là không nhất quán (một giá trị trong miền có thể tìm thấy trong nhiều hơn một tập con).
Chẳng hạn: Nếu đoạn đường tắc Traffic-Jam là <3 km, giá trị của hàm thuộc Dài (MF(l)) là 0, còn giá trị của hàm thuộc Ngắn (MF(sh)) là 1
Áp dụng thuật toán thuật toán Fuzzy ID3 với Entropy mờ và độ đo thôngtin mờ, ta thu được cây như sau:
Trang 34Hình 1.12 Quá trình phát triển cây của thuật toán Fuzzy ID3
1.4 TIỂU KẾT CHƯƠNG 1
Chương 1 đã trình bày các nội dung chính về tập mờ, biến ngôn ngữ, quan hệ
mờ làm cơ sở cho lập luận mờ ở chương 2 và trình bày thêm lý thuyết về cây quyếtđịnh, cây quyết định mờ và thuật toán xây dựng cây quyết định C4.5 để làm cơ sởcho việc xây dựng các tập luật mờ từ dữ liệu huấn luyện trong chương 3
Chương tiếp theo sẽ trình bày tổng quan về logic mờ, phương pháp lập luậnxấp xỉ trên tập mờ và phép suy diễn mờ, đó là cơ sở để áp dụng vào bài toán chẩnđoán bệnh đái tháo đường trong chương 3
Trang 35CHƯƠNG 2 LOGIC MỜ VÀ LẬP LUẬN MỜ
Logic mờ (Fuzzy logic) được phát triển từ lý thuyết tập mờ để thực hiện lập
luận một cách xấp xỉ thay vì lập luận chính xác theo logic vị từ cổ điển Người tahay nhầm lẫn mức độ đúng với xác suất Tuy nhiên, hai khái niệm này khác hẳnnhau; độ đúng đắn của logic mờ biểu diễn độ thuộc với các tập được định nghĩakhông rõ ràng, chứ không phải khả năng xảy ra một biến cố hay điều kiện nào đó.Logic mờ cho phép độ thuộc có giá trị trong khoảng [0, 1], và ở hình thức ngôn từ,
các khái niệm không chính xác như "hơi hơi", "gần như", "khá là" và "rất".
Suy luận xấp xỉ hay còn gọi là suy diễn mờ là quá trình suy ra những kết luậndưới dạng các mệnh đề mờ trong điều kiện các quy tắc, các luật, các dữ liệu đầu vàokhông hoàn toàn xác định
2.1 LOGIC MỜ
2.1.1 Mệnh đề mờ
Trong logic cổ điển (logic vị từ cấp một), một mệnh đề phân tử P(x) là một phát biểu có dạng “x là P” trong đó x là một đối tượng trong một vũ trụ U nào đó thoả tính chất P Ví dụ “x là số chẵn” thì U là tập các số nguyên và P là tính chất chia hết cho 2 Như vậy, ta có thể đồng nhất một mệnh đề phân tử “x là P” với một tập (rõ) A = {xU | P(x)}
Từ đó, ta có: P(x) = (x) ;
Trong đó là hàm đặc trưng của tập A ( xA (x) = 1) Giá trị chân lý của P(x) chỉ nhận một trong hai giá trị 1 và 0 (true và false) tương ứng với sự kiện x thuộc A hoặc không.
Trong trường hợp P là một tính chất mờ chẳng hạn như “số lớn” thì ta sẽ có một mệnh đề logic mờ phần tử Khi đó tập hợp các phần tử trong vũ trụ U thoả P là một tập mờ B có hàm thuộc B sao cho: P(x) = B (x).
Lúc này P(x) có thể nhận các giá trị tuỳ ý trong [0,1] Và ta thấy có thể đồng
nhất các hàm thuộc với các mệnh đề logic mờ
Trang 36Trong logic mờ, người ta thường dùng các phát biểu dưới dạng mệnh đề cócấu trúc [5], [14]:
NẾU (mệnh đề điều kiện)…THÌ (mệnh đề kết luận).
(hay IF (Clause)…THEN (clause))
Ta ký hiệu: p→q (Từ p suy ra q).
Ví dụ 2.1 Cho mệnh đề mờ sau:
NẾU nhiệt độ cao THÌ độ ẩm thấp.
- Các biến ở đây sẽ là: “nhiệt độ”, “độ ẩm”;
- Các giá trị hay tập mờ là: “cao”, “thấp”
Mệnh đề trên là ví dụ đơn giản về điều khiển mờ, nó cho phép từ một giá trị
đầu vào x o (hoặc độ thuộc µ A (x o ) của x o trên tập mờ A) xác định được hệ số thỏa mãn mệnh đề kết luận q của giá trị đầu ra y.
NẾU x = A THÌ y = B tức là AB là một giá trị mờ.
2.1.2 Tập luật mờ
Tập luật mờ là sự kết hợp của nhiều mệnh đề mờ có dạng NẾU - THÌ như đãnói ở trên
Cho x1, x2, …, xm là các biến vào của hệ thống, y là biến ra Các tập Aij, Bj (với i
= 1, 2, …, m và j = 1, 2, …, n) là các tập mờ trong không gian nền tương ứng của
các biến vào và biến ra, các Rj là các suy diễn mờ thì ta có tập luật mờ [12]:
R1 : NẾU x1 là A11 và …và xm là Am1 THÌ y là B1 ;
R2 : NẾU x1 là A12 và …và xm là Am2 THÌ y là B2 ;
………
Rn : NẾU x1 là A1n và …và xm là Amn THÌ y là Bn
Bài toán : Cho : NẾU x1 là e1* và …và xm là em* Tính: Giá trị y là u*
Ở đây e1*, e2*, …, em* là các giá trị đầu vào Giá trị u* tính được nhờ phép suy
luận từ tập luật mờ Ri
Trang 372.1.3 Phép toán kéo theo mờ
Các phép toán kéo theo có vai trò quan trọng trong logic mờ Chúng tạo nêncác luật mờ để thực hiện các phép suy diễn trong tất cả các hệ mờ Do một mệnh đề
mờ tương ứng với một tập mờ nên ta có thể dùng hàm thuộc thay cho các mệnh đề:
A
(x) =>B (y)
Sau đây là một số phép kéo theo quan trọng được sử dụng phổ biến:
- Phép kéo theo Dienes – Rescher:
µ D (x, y) = max(1-A (x), B (y)).
- Phép kéo theo Lukasiewicz :
µ L (x, y) = min(1, 1-A (x)+B (y)).
- Phép kéo theo Zadeh:
µ Z (x, y) = max(1-A (x), min(A (x),B (y))) ; (a) hoặc
µ Z (x, y) = max( 1-A (x), A (x).B (y)) (b)
- Phép kéo theo Goedel:
µ G (x, y) = 1 nếu A (x) ≤ B (y),
B
(y) nếu A (x) > B (y).
- Kéo theo Mamdani:
µ M (x, y) = min(A (x),B (y)) ; (a) hoặc
µ M (x, y) = A (x).B (y). (b)
2.2 PHƯƠNG PHÁP LẬP LUẬN XẤP XỈ DỰA TRÊN TẬP MỜ
Phương pháp lập luận xấp xỉ là một thành tố rất đặc trưng của quá trình lấyquyết định, chúng có khả năng mô phỏng quá trình lập luận trong môi trường thôngtin không đầy đủ, không chắc chắn và vì vậy bản chất của phương pháp lập luận xấp
xỉ là gần đúng
Trang 38Trong công trình nghiên cứu của mình, Zadeh đưa ra khái niệm sơ đồ lập luậnxấp xỉ như sau [5], [14]:
Tiên đề 1: NẾU màu của quả cà chua nào đó là đỏ THÌ quả cà chua đó là chín; Tiên đề 2: Màu quả cà chua Q là rất đỏ;
Kết luận: Quả cà chua là rất chín.
Chúng ta thấy sơ đồ này tương tự như luật Modus ponens trong logic cổ điển :
từ A B.
Luật Modus Ponens hay Modus Tollen :
Thông thường, suy diễn mờ (suy luận mờ) hay sử dụng luật Modus Ponen
hoặc Modus Tollens Trong logic cổ điển, Modus Ponens diễn đạt như sau:
Mệnh đề 1 (Luật hoặc tri thức) : P → Q ; Mệnh đề 2 (sự kiện) : P đúng ;
Tương tự logic cổ điển, trong logic mờ (suy diễn mờ hay suy luận mờ) cũng có
luật Modus Ponens như sau:
Giả thiết 1 (luật mờ) : Nếu x là A thì y là B ;
Giả thiết 1 (sự kiện mờ) : x là A' ;
Kết luận : y là B'.
Trong đó A, B, A', B' là các biến ngôn ngữ (có nghĩa là các tập mờ) A và A' là các tập mờ trên không gian nền U, còn B và B' là các tập mờ trên không gian nền V.
Ví dụ 2.2 Luật mờ : Nếu quả cà chua đỏ thì quả cà chua đó chín ;
Sự kiện mờ : Quả cà chua khá đỏ ;
Kết luận : Quả cà chua đó khá chín
Trang 39Trong logic cổ điển, Modus Tollens diễn đạt như sau:
Mệnh đề 1 (Luật hoặc tri thức) : P → Q ; Mệnh đề 2 (sự kiện) : ¬Q đúng ;
Tương tự logic cổ điển, trong logic mờ (suy diễn mờ hay suy luận mờ) luật
được diễn đạt như sau :
Giả thiết 1 (Luật mờ hoặc tri thức mờ) : P → Q ; Giả thiết 2 (Sự kiện mờ) : ¬Q khá đúng ;
Ví dụ 2.3 Luật mờ: Nếu quả cà chua đỏ thì quả cà chua đó chín ;
Sự kiện mờ : Quả cà chua không chín lắm ;
Kết luận : Quả cà chua đó không đỏ lắm.
Để ứng dụng suy diễn mờ (suy luận mờ) vào trong bài toán thực tế thì vấn đềmấu chốt cần thực hiện là xây dựng cơ chế lập luận xấp xỉ để có thể đưa ra kết luậnhay quyết định mờ
Công thức tính kết luận của luật Modus Ponens như sau:
'
B
(y) = sup
x T(R (x,y), A'(x)) (*) Trong đó T là một hàm T-norm và R là quan hệ hai ngôi xác định bởi phép kéo
theo Cách tính R (x,y), chính là cách tính giá trị chân lý của phép kéo theo trình
bày ở phần trước Như vậy tuỳ theo cách chọn cách tính luật kéo theo khác nhau mà
ta có cách tính kết quả của luật Modus Ponens khác nhau
Ví dụ 2.4 Giả sử quan hệ giữa nhiệt độ và áp suất cho bởi luật sau:
Nếu nhiệt độ là cao thì áp suất là lớn
Nhiệt độ nhận các giá trị trong U = {30, 35, 40, 45} ;
Trang 40Áp suất nhận các giá trị trong V = {50, 55, 60, 65}.
Ta có các tập mờ xác định bởi biến ngôn ngữ nhiệt độ và áp suất như sau:
A = “nhiệt độ cao” =
45
140
9.035
3.030
155
5.050
45 40 35 30
1 1 5 0 0
9 0 9 0 45 0 0
3 0 3 0 15 0 0
0 0 0 0
8.035
130
6.0
Phép suy diễn mờ dùng để kết hợp các luật mờ dạng NẾU - THÌ trong cơ sở
luật mờ thành một phép ánh xạ từ một tập mờ A' trong U đến một tập mờ B' trong V.
Có 2 cách suy diễn: suy diễn dựa trên toàn bộ luật và suy diễn dựa trên từng luật
Các cơ chế suy diễn thông dụng:
- Cơ chế suy diễn tích số: