Tìm hiểu phương pháp lập luận mờ và ứng dụng để xây dựng hệ dự đoán bệnh đái tháo đường

Đặc biệt là việc ứng dụng các kỹ thuật như hệ hỗ trợ quyết định, khai phá dữ liệu, hệ chuyêngia, logic mờ để xây dựng các hệ thống chẩn đoán bệnh đã giúp các bác sỹ chuyênkhoa có thể ti

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO

CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH

Trang 2

LỜI CAM ĐOAN

Tôi xin cam đoan những kiến thức trình bày trong luận văn này là do tôi tìmhiểu, nghiên cứu và trình bày lại theo cách hiểu của tôi Trong quá trình làm luậnvăn tôi có tham khảo các tài liệu có liên quan và đã ghi rõ nguồn tài liệu tham khảo

đó Phần lớn những kiến thức tôi trình bày trong luận văn này chưa được trình bàyhoàn chỉnh trong bất cứ tài liệu nào

Luận văn này chưa bao giờ được nộp để nhận bất kỳ bằng cấp nào tại cáctrường đại học hoặc cơ sở đào tạo khác

Thừa Thiên Huế, tháng 09 năm 2018

Học viên

Trần Thị Thu Huyền

Trang 3

LỜI CẢM ƠN

Để hoàn thành được luận văn này, trước hết tôi xin gửi lời cảm ơn sâu sắcnhất tới PGS TS Lê Mạnh Thạnh, Khoa CNTT trường Đại học khoa học - Đại HọcHuế đã tận tình hướng dẫn, chỉ bảo, định hướng, đóng góp những ý kiến quý báutrong suốt quá trình tôi thực hiện luận văn

Tôi cũng bày tỏ lòng biết ơn các điều dưỡng và các bác sỹ chuyên khoa tạiBệnh viện đa khoa tỉnh Quảng Trị Các anh, chị đã rất nhiệt tình giải thích vấn đềchuyên môn giúp tôi hoàn thành tốt công việc của mình

Tôi xin chân thành cảm ơn quý thầy, cô trong Khoa Công nghệ thông tin,Phòng Đào tạo Sau đại học, Trường Đại học Khoa học - Đại học Huế đã tạo mọiđiều kiện tốt nhất để tôi hoàn thành khóa học này

Cuối cùng, tôi xin chân thành cảm ơn cơ quan và các đồng nghiệp đã hết sứctạo điều kiện cho tôi trong suốt quá trình học tập và làm luận văn Đồng thời, chânthành cảm ơn gia đình, bạn bè, những người luôn khuyến khích và giúp đỡ tôi trongnhững lúc khó khăn để tôi có thể hoàn thành tốt luận văn của mình

Thừa Thiên Huế, tháng 09 năm 2018

Học viên

Trần Thị Thu Huyền

Trang 4

MỤC LỤC

Lời cam đoan I Lời cảm ơn II Mục lục III Danh mục các bảng VI Danh mục các hình VII Danh mục các chữ viết tắt VIII

MỞ ĐẦU 1

1 Lý do chọn đề tài 1

2 Mục tiêu nghiên cứu 3

3 Đối tượng và phạm vi nghiên cứu 3

4 Phương pháp nghiên cứu 3

5 Ý nghĩa khoa học và thực tiễn của luận văn 4

6 Bố cục luận văn 4

CHƯƠNG 1 CƠ SỞ LÝ THUYẾT 5

1.1 LÝ THUYẾT TẬP MỜ 5

1.1.1 Tập kinh điển 6

1.1.2 Định nghĩa tập mờ 6

1.1.3 Các thông số đặc trưng cho tập mờ 9

1.1.4 Biến ngôn ngữ 9

1.1.5 Các phép tính trên tập mờ 11

1.1.6 Quan hệ mờ 14

1.2 CÂY QUYẾT ĐỊNH 15

1.2.1 Định nghĩa cây quyết định 15

1.2.2 Ưu điểm của cây quyết định 16

1.2.3 Vấn đề xây dựng cây quyết định 17

1.2.4 Rút ra các luật từ cây quyết định 17

1.2.5 Thuật toán xây dựng cây quyết định C4.5 17

1.3 CÂY QUYẾT ĐỊNH MỜ 19

Trang 5

1.3.1 Định nghĩa cây quyết định mờ 19

1.3.2 Dữ liệu mẫu với biểu diễn mờ 19

1.4 TIỂU KẾT CHƯƠNG 1 23

CHƯƠNG 2 LOGIC MỜ VÀ LẬP LUẬN MỜ 24

2.1 LOGIC MỜ 24

2.1.1 Mệnh đề mờ 24

2.1.2 Tập luật mờ 25

2.1.3 Phép toán kéo theo mờ 26

2.2 PHƯƠNG PHÁP LẬP LUẬN XẤP XỈ DỰA TRÊN TẬP MỜ 26

2.3 PHÉP SUY DIỄN MỜ 29

2.4 HỆ MỜ 31

2.4.1 Cấu trúc và hoạt động của hệ mờ tổng quát 31

2.4.2 Cơ sở luật mờ 32

2.4.3 Bộ suy diễn mờ 33

2.4.4 Bộ mờ hoá 35

2.4.5 Bộ giải mờ 36

CHƯƠNG 3 XÂY DỰNG HỆ DỰ ĐOÁN BỆNH ĐÁI THÁO ĐƯỜNG 38

3.1 TỔNG QUAN VỀ BỆNH ĐÁI THÁO ĐƯỜNG 38

3.1.1 Thực trạng bệnh đái tháo đường 38

3.1.2 Định nghĩa bệnh đái tháo đường 39

3.1.3 Nguyên nhân, các yếu tố nguy cơ của bệnh đái tháo đường 39

3.1.4 Triệu chứng đặc trưng của bệnh đái tháo đường 40

3.1.5 Chẩn đoán và phân loại bệnh đái tháo đường 42

3.2 QUY TRÌNH CHẨN ĐOÁN BỆNH 47

3.2.1 Lập luận chẩn đoán bệnh: 47

3.2.2 Các kiểu triệu chứng 48

3.2.3 Quy trình chẩn đoán bệnh 48

3.2.4 Các quy luật chẩn đoán 49

Trang 6

3.3 QUY TRÌNH ỨNG DỤNG LOGIC MỜ VÀO CHẨN ĐOÁN

BỆNH ĐÁI THÁO ĐƯỜNG 49

3.3.1 Mô tả bài toán 49

3.3.2 Mô hình kiến trúc hệ thống 49

3.3.3 Thu thập dữ liệu 50

3.3.4 Xây dựng và biểu diễn tri thức mờ 52

3.4 THIẾT KẾ HỆ THỐNG 63

3.5 THỬ NGHIỆM VÀ ĐÁNH GIÁ 66

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 68

TÀI LIỆU THAM KHẢO 70 PHỤ LỤC

Trang 7

DANH MỤC CÁC BẢNG

Bảng 1.1 Bảng dữ liệu phân lớp mức lương 16

Bảng 1.2 Dữ liệu mẫu về việc tự lái xe đi làm (Car Driving) 20

Bảng 1.3 Biểu diễn mờ của tập mẫu 22

Bảng 3.1 Bảng dữ liệu huấn luyện 54

Bảng 3.2 Bảng phân loại chức năng 63

Trang 8

DANH MỤC CÁC HÌNH

Hình 1.1 Hàm thuộc µ A (x) của tập kinh điển A 6

Hình 1.2 Hàm thuộc µ B (x) của tập mờ B 7

Hình 1.3 Ba tập mờ Cold (lạnh), Warm (ấm) và Hot (nóng) dạng hình thang 8

Hình 1.4 Đồ thị hàm thuộc của tập mờ A với các số tự nhiên nhỏ hơn 5 8

Hình 1.5 Độ cao, miền xác định, miền tin cậy của tập mờ 9

Hình 1.6 Biến ngôn ngữ 10

Hình 1.7 Hợp của hai tập mờ 11

Hình 1.8 Giao của hai tập mờ 12

Hình 1.9 Bù của một tập mờ 12

Hình 1.10 Cây quyết định phân lớp mức lương 16

Hình 1.11 Hình biểu diễn hàm thuộc của thuộc tính Tắc đường (MF) 21

Hình 1.12 Quá trình phát triển cây của thuật toán Fuzzy ID3 23

Hình 2.1 Cấu trúc của mô hình mờ 31

Hình 2.2 Mô hình hệ mờ nhiều đầu vào – một đầu ra 32

Hình 2.3 Các dạng hàm thuộc thường được sử dụng trong hệ mờ 36

Hình 2.4 Phương pháp giải mờ cực đại 37

Hình 2.5 Phương pháp giải mờ trọng tâm 37

Hình 3.1 Mô hình kiến trúc hệ thống chẩn đoán bệnh 50

Hình 3.2 Các hàm thuộc của mức độ tiểu 55

Hình 3.3 Các hàm thuộc của mức độ uống nước 56

Hình 3.4 Các hàm thuộc của mức độ ăn 57

Hình 3.5 Các hàm thuộc của mức độ giảm cân 58

Hình 3.6 Các hàm thuộc biểu diễn nồng độ Glucose máu lúc đói 59

Hình 3.8 Form chẩn đoán bệnh đái tháo đường 64

Hình 3.9 Form chẩn đoán bệnh đái tháo đường với bộ dữ liệu cụ thể 64

Hình 3.10 Form chỉ dẫn cách phòng bệnh đái tháo đường 65

Hình 3.11 Form chỉ dẫn cách điều trị bệnh đái tháo đường 66

Trang 9

DANH MỤC CÁC CHỮ VIẾT TẮTWHO (World Health Organization): Tổ chức Y tế Thế giới

IDF (International Diabetes Federation): Liên đoàn Đái tháo đường quốc tế OGTT (Oral glucose tolerance test): Nghiệm pháp dung nạp glucose

FPG (fasting plasma glucose): Glucose máu lúc đói

Trang 10

MỞ ĐẦU

1 Lý do chọn đề tài

Chuẩn đoán bệnh trong y học là một lĩnh vực tương đối phức tạp, lĩnh vực này

có những đặc điểm khác biệt đó là mối quan hệ tương hỗ giữa lý thuyết và thựchành Đối tượng của lĩnh vực này là những bệnh nhân, những con người thực sự Kiến thức y học cũng khá phức tạp Để tìm ra những kiến thức mới, phươngpháp truyền thống là dựa trên sự mô tả của các hồ sơ bệnh án, nhật ký y khoa, cơ sở

dữ liệu đề tài nghiên cứu,… Chính vì thế, người bác sỹ thường bị tràn ngập trongnúi dữ liệu khổng lồ Và đặc biệt là những dữ liệu đó ở mỗi bệnh nhân lại có sự mơ

hồ khác nhau, gắn với cảm xúc của mỗi người Người bác sỹ luôn phải làm việctrong trạng thái căng thẳng trong khi yêu cầu phải đưa ra được những quyết địnhđúng đắn hiệu quả nhất

Hiện nay, Đái tháo đường là bệnh nhận được sự quan tâm đặc biệt trong giới ykhoa Bệnh này nằm trong số 10 nguyên nhân gây tử vong và tàn phế hàng đầu ở cảhai giới, gây ra các biến chứng nặng nề về tim mạch, tổn thương thần kinh, mù mắt,suy thận, nhiễm trùng và gây tổn thương bàn chân có thể dẫn đến phải cắt cụt chi.Bệnh đã và đang trở thành vấn đề mang tính xã hội cao ở nhiều quốc gia bởi sựbùng phát nhanh chóng, mức độ nguy hại đến sức khoẻ ĐTĐ còn trở thành lực cảncủa sự phát triển, gánh nặng cho toàn xã hội khi mà mỗi năm thế giới phải chi sốtiền khổng lồ từ 232 tỷ đến 430 tỷ USD cho việc phòng chống và điều trị

Theo Tổ chức y tế thế giới (WHO), năm 1985 có khoảng 30 triệu người mắcđái tháo đường trên toàn cầu, năm 2004 có khoảng 98,9 triệu người mắc, đến năm

2009 có khoảng 180 triệu người và con số đó có thể tăng gấp đôi lên tới 366 triệungười vào năm 2030

Hiện Việt Nam có trên 5 triệu người mắc bệnh đái tháo đường Theo Bộ y tế,con số này được dự báo tiếp tục gia tăng trong thời gian tới Theo thống kê trong 10năm qua, số lượng bệnh nhân mắc bệnh đái tháo đường ở nước ta tăng 211%, và vớicon số này, Việt Nam nằm trong số các quốc gia có tốc độ tăng bệnh nhân đái tháo

Trang 11

đường cao nhất thế giới Thống kê của Liên đoàn Đái tháo đường quốc tế (IDF) chothấy, trên 50% bệnh nhân đái tháo đường ở Việt Nam chết vì căn bệnh này trướcnăm 60 tuổi

Biện pháp hữu hiệu để làm giảm tiến triển và biến chứng của bệnh, chi phíchữa bệnh ít tốn kém nhất là phải phát hiện sớm và điều trị cho bệnh nhân kịp thời.Tuy nhiên, công tác phát hiện sớm, chăm sóc và điều trị bệnh đái tháo đường còngặp rất nhiều khó khăn do kết quả chẩn đoán phụ thuộc rất nhiều vào kinh nghiệmcủa bác sỹ cũng như suy luận tại thời điểm chẩn đoán, chứ không dựa trên quy tắctiêu chuẩn nào

Một hệ thống chẩn đoán bệnh, sẽ hỗ trợ cho bác sỹ rất nhiều trong việc đưa rakết quả chẩn đoán cuối cùng Với việc áp dụng CNTT, ngành y tế hiện nay đã đạtđược nhiều thành tựu to lớn trong việc vận hành hệ thống khám chữa bệnh Đặc biệt

là việc ứng dụng các kỹ thuật như hệ hỗ trợ quyết định, khai phá dữ liệu, hệ chuyêngia, logic mờ để xây dựng các hệ thống chẩn đoán bệnh đã giúp các bác sỹ chuyênkhoa có thể tiếp cận và đưa ra chẩn đoán bệnh một cách nhanh chóng, chính xác Từ

đó, có thể đưa ra phương pháp điều trị bệnh hiệu quả, đồng thời tiết giảm chi phíđiều trị

Trong lĩnh vực y tế tri thức chuyên gia là rất quan trọng và những tri thức này

phần lớn được phát biểu bằng ngôn ngữ với các thông tin mờ và không chắc chắn,chuyên gia càng làm việc lâu năm thì càng tích luỹ nhiều kinh nghiệm, nhưng kinhnghiệm này không tồn tại mãi mãi với thời gian, vì vòng đời của con người là cógiới hạn Vì vậy, nghiên cứu phát triển phương pháp luận nhằm thu thập, duy trì vàkhai thác để phát huy được các tri thức chuyên gia này là một nhu cầu rất cần thiết

Chính vì vậy, tôi chọn đề tài nghiên cứu: “Tìm hiểu phương pháp lập luận

mờ và ứng dụng để xây dựng hệ dự đoán bệnh đái tháo đường”, nhằm góp phần

phát triển phương pháp luận phục vụ việc thu thập các tri thức chuyên gia y tế trongmôi trường thông tin mờ, không chắc chắn và xây dựng một hệ hỗ trợ chẩn đoángiúp các y bác sỹ chuyên khoa có thể đưa ra chẩn đoán bệnh đái tháo đường chínhxác hơn và có cách điều trị phù hợp

Trang 12

2 Mục tiêu nghiên cứu

- Mục tiêu chung: Tìm hiểu Logic mờ, phương pháp lập luận mờ và ứng dụngmột số kỹ thuật tổng hợp trong hệ hỗ trợ quyết định để xây dựng hệ dự đoán bệnhđái tháo đường

- Các mục tiêu cụ thể: Ứng dụng cấu trúc của hệ hỗ trợ ra quyết định, logic

mờ, các phương pháp xây dựng cơ sở dữ liệu; Kết hợp thu thập ý kiến chuyên gia,khai phá hồ sơ bệnh án và các nguồn dữ liệu khác để xây dưng tập luật, đánh giá tậpluật nhằm phục vụ cho việc xây dựng hệ dự đoán bệnh

3 Đối tượng và phạm vi nghiên cứu

- Về lý thuyết: Nghiên cứu về Logic mờ, phương pháp mờ hóa, hệ hỗ trợquyết định (hệ mờ), phân lớp dữ liệu bằng cây quyết định để xây dựng hệ chẩn đoánbệnh đái tháo đường

- Về thực hành: Địa bàn tỉnh Quảng Trị, khảo sát các bệnh nhân tuổi từ 30 đến

65 nhập viện điều trị bệnh đái tháo đường tại bệnh viện đa khoa tỉnh Quảng Trị,thời gian khảo sát một năm từ tháng 12/2016 - 12/2017

4 Phương pháp nghiên cứu

- Phương pháp nghiên cứu lý thuyết: Tổng hợp, phân tích các công trình

nghiên cứu liên quan đến logic mờ, hệ hỗ trợ quyết định; hồ sơ bệnh án, hướng dẫnchẩn đoán và điều trị bệnh đái tháo đường của Bộ y tế Lựa chọn các kỹ thuật ứngdụng cho bài toán thực tế

- Phương pháp kế thừa: các thông tin và các số liệu thống kê đã được thu thập;

- Phương pháp chuyên gia: Hỏi ý kiến chuyên gia về các lĩnh vực chuyên

môn: Y tế, giáo dục, khoa học môi trường,

- Phương pháp nghiên cứu thực tiễn: tìm hiểu kết quả khám và chữa bệnh của

các bệnh nhân đái tháo đường tại một số bệnh viện trên địa bàn

- Phương pháp tổng hợp thu thập thông tin, phân tích thông tin: xác định cấu trúc

và tính chất của thông tin, để tìm ra phương pháp thu thập, xử lý số liệu thích hợp

Trang 13

5 Ý nghĩa khoa học và thực tiễn của luận văn

- Biết các yếu tố cơ bản của logic mờ và ứng dụng

- Hiểu được phương pháp chẩn đoán bệnh đái tháo đường

- Ứng dụng được lý thuyết logic mờ trong CNTT vào hệ hỗ trợ chẩn đoánbệnh đái tháo đường

- Luận văn mang tính nhân văn và xã hội

6 Bố cục luận văn

Nội dung chính của luận văn gồm 3 chương:

Chương 1 Cơ sở lý thuyết về tập mờ và cây quyết định.

Nội dung của Chương này chủ yếu giới thiệu cơ sở lý thuyết về tập mờ, biếnngôn ngữ, quan hệ mờ, cây quyết định và cây quyết định mờ

Chương 2 Logic mờ và lập luận mờ.

Nội dung của Chương 2 trình bày tổng quan về Logic mờ, các phương pháplập luận xấp xỉ, lập luận mờ và hệ mờ tổng quát

Chương 3 Xây dựng hệ dự đoán bệnh đái tháo đường

Nội dung của Chương là trình bày tổng quan về bệnh đái tháo đường, quytrình chẩn đoán bệnh và ứng dụng logic mờ, cây quyết định mờ để xây dựng hệ dựđoán bệnh đái tháo đường

Trang 14

CHƯƠNG 1 CƠ SỞ LÝ THUYẾT

Logic mờ được giáo sư L.A.Zadeh công bố lần đầu tiên tại Mỹ vào năm 1965.Ứng dụng đầu tiên của logic mờ vào công nghiệp được thực hiện ở Châu Âu,khoảng sau năm 1970 Tại trường Queen Mary ở Luân Đôn – Anh, EbrahimMamdani dùng logic mờ để điều khiển một máy hơi nước mà trước đây ông ấykhông thể điều khiển được bằng các kỹ thuật cổ điển Ở Đức, Hans Zimmermanndùng logic mờ cho các hệ ra quyết định và liên tiếp sau đó, logic mờ được áp dụngvào các lĩnh vực khác nhau Kể từ năm 1980, logic mờ đạt được nhiều thành côngtrong các ứng dụng ra quyết định và phân tích dữ liệu ở Châu Âu Nhiều kỹ thuậtlogic mờ cao cấp được nghiên cứu và phát triển trong lĩnh vực này

Các công ty của Nhật bắt đầu dùng logic mờ vào kỹ thuật điều khiển từ năm

1980 Nó được ứng dụng trong nhà máy xử lý nước của Fuji Electric vào năm 1983,

hệ thống xe điện ngầm của Hitachi vào năm 1987 Những thành công đầu tiên đãtạo ra nhiều quan tâm ở Nhật Có nhiều lý do để giải thích tại sao logic mờ được ưachuộng Thứ nhất, logic mờ cho phép tạo nhanh các bản mẫu rồi tiến đến việc tối

ưu Thứ hai, các hệ dùng logic mờ đơn giản và dễ hiểu Logic mờ cung cấp cho họmột phương tiện rất minh bạch để thiết kế hệ thống Do đó, logic mờ được dùngnhiều trong các ứng dụng thuộc lĩnh vực điều khiển thông minh hay xử lý dữ liệu.Ngoài ra, logic mờ cũng được dùng để tối ưu nhiều quá trình hóa học và sinh học

Từ những thành công tại Nhật Bản, Mỹ và các nước Châu Âu đã bắt đầu quantâm đến logic mờ và ứng dụng chúng trong các lĩnh vực điều khiển tự động, côngnghiệp dân dụng và cũng từ đó logic mờ đã trở thành một kỹ thuật thiết kế “chuẩn”

và được chấp nhận rộng rãi trong cộng đồng

1.1 LÝ THUYẾT TẬP MỜ

Ý tưởng nổi bật của khái niệm tập mờ của Zadeh là từ những khái niệm trừu

tượng về ngữ nghĩa của thông tin mờ, không chắc chắn như trẻ, nhanh, cao-thấp, xinh đẹp, Ông đã tìm ra cách biểu diễn nó bằng một khái niệm toán học, được

gọi là tập mờ, như là một sự khái quát trực tiếp của khái niệm tập hợp kinh điển

Trang 15

1.1.1 Tập kinh điển

Khái niệm tập hợp được hình thành trên nền tảng lôgic và được định nghĩanhư là sự sắp xếp chung các đối tượng có cùng tính chất, được gọi là phần tử củatập hợp đó

Cho một tập hợp A, một phần tử x thuộc A được ký hiệu: x ∈ A Thông thường

ta dùng hai cách để biểu diễn tập hợp kinh điển, đó là: Liệt kê các phần tử của tập

Trang 16

Tập hợp mờ là tập hợp mà mỗi thành phần là một bộ số ( , ( ))x  x Như vậy, ta

nói A là tập mờ nếu A có biểu diễn: A = {(x, µ A (x)) | x ∈ X}

A là tập mờ trên không gian nền X nếu A được xác định bởi hàm:

.Trong đó:

X : là tập nền hay được gọi là tập vũ trụ của tập mờ A;

là hàm thuộc (membership function);

là độ thuộc của x vào tập mờ A.

Các tập mờ được coi là một mở rộng của lý thuyết tập hợp cổ điển là vì, với

một universe (Không gian tham chiếu hay không gian nền) nhất định, một hàm thuộc có thể giữ vai trò của một hàm đặc trưng (indicator function) ánh xạ mỗi

phần tử tới một giá trị 0 hoặc 1 như trong khái niệm cổ điển

Trong khái niệm tập hợp kinh điển hàm thuộc µ A (x) của tập A, chỉ có một trong hai giá trị là "1" nếu x ∈ A hoặc "0" nếu x ∉ A.

Ví dụ 1.2 Cách biểu diễn hàm thuộc như trên sẽ không phù hợp với những tập được mô tả "mờ" như tập B gồm các số thực gần bằng 5:

B = { x ∈ R | x ≈5 }.

Khi đó ta không thể khẳng định chắc chắn số 4 có thuộc B hay không? mà chỉ

có thể nói nó thuộc B bao nhiêu phần trăm Để trả lời được câu hỏi này, ta phải coi

hàm thuộc có giá trị trong khoảng từ 0 đến 1 tức là: 1

Trang 17

Hình 1.2 Hàm thuộc µ B (x) của tập mờ B

Từ phân tích trên ta có định nghĩa: Tập mờ B xác định trên tập kinh điển M là

tập mà một phần tử của nó được biểu diễn bởi một cặp giá trị

Trong đó x ∈ M và là ánh xạ Ánh xạ được gọi là hàm thuộc của

tập mờ B Tập kinh điển M được gọi là cơ sở của tập mờ B.

Như vậy về phương diện giải tích mỗi tập mờ ứng với một hàm số và hàm số

có đồ thị của nó Những tập mờ thường gặp đồ thị của hàm thuộc (membershipfunction) có hình dạng là hình tam giác hoặc hình thang mà người ta thường gọi vắntắt là “tập mờ hình thang” hoặc “tập mờ hình tam giác” như hình vẽ dưới đây:

Hình 1.3 Ba tập mờ Cold (lạnh), Warm (ấm) và Hot (nóng) dạng hình thang.

Theo hình vẽ này tại điểm h 1 trên trục nhiệt độ (temperature) chiếu lên đầu

tiên ta thấy cắt tập mờ warm tại điểm mà ta có thể thấy được là “hơi ấm”, đồng

thời cắt tập mờ cold tại điểm mà ta thấy là “tương đối lạnh” Tóm lại ở nhiệt độ h 1

có thể xem là “hơi ấm” hoặc “tương đối lạnh”

h 1

Trang 18

Ví dụ 1.3 Một tập mờ A với các số tự nhiên nhỏ hơn 5 được mô tả bằng hàm

thuộc có đồ thị như sau:

Hình 1.4 Đồ thị hàm thuộc của tập mờ A với các số tự nhiên nhỏ hơn 5

 Số tự nhiên 1 và 2 có độ phụ thuộc là 1;

 Số tự nhiên 3 và 4 có độ phụ thuộc thấp hơn 1;

 Các số không liệt kê có độ phụ thuộc là 0

1.1.3 Các thông số đặc trưng cho tập mờ

Các thông số đặc trưng cho tập mờ là độ cao, miền xác định và miền tin cậy

Hình 1.5 Độ cao, miền xác định, miền tin cậy của tập mờ

- Độ cao của một tập mờ B (Định nghĩa trên cơ sở M), ký hiệu là H(B), là cận

trên đúng (giá trị lớn nhất) của hàm thuộc µ B trên M, có nghĩa:

H(B) = sup{µ B (x)| x ∈ M}.

Một tập mờ B được gọi là tập mờ chuẩn nếu H(B) = 1 Ngược lại, tập mờ B được gọi là dưới chuẩn (H(B) < 1)

Trang 19

- Miền xác định (Giá) của tập mờ B (Định nghĩa trên cơ sở M), ký hiệu là

S(B), là tập con của M có giá trị hàm thuộc khác không, có nghĩa:

S(B) = {x ∈ M|µ B (x) > 0}.

- Miền tin cậy của tập mờ B (định nghĩa trên cơ sở M), ký hiệu là T(B), là tập

con của M có giá trị hàm thuộc bằng 1:

T(B) = {x ∈ M|µ B (x) = 1}.

1.1.4 Biến ngôn ngữ

Biến ngôn ngữ là phần chủ đạo trong các hệ thống dùng logic mờ Các biếnngôn ngữ được xác định thông qua các tập giá trị mờ của nó

Ví dụ các tập mờ mô tả biến nhiệt độ là “rất nóng”, “hơi nóng”, “trung bình”,

“hơi lạnh” và “rất lạnh” Chúng được gọi là các tập ngôn ngữ, mang một khoảng giátrị nào đó của biến ngôn ngữ và được thể hiện trong cùng một không gian nền U

Hình 1.6 Biến ngôn ngữCác luật trong hệ logic mờ mô tả tri thức của hệ Chúng dùng các biến ngônngữ như là từ vựng để mô tả các tầng điều khiển trong hệ Việc giải thích các luật

mờ cũng là việc trình bày cách tính các khái niệm ngôn ngữ

Khái niệm biến ngôn ngữ [5], [13]:

Một biến ngôn ngữ được xác định bởi bộ năm (X, T(X), U, R, M), trong đó:

- X là tên biến

Ví dụ 1.4 Các biến ngôn ngữ: “nhiệt độ”, “tốc độ”, “độ ẩm”,…

- T(X) là tập các giá trị ngôn ngữ của biến X

Trang 20

Ví dụ 1.5 T(tốc độ)={rất chậm, hơi chậm, trung bình, hơi nhanh, rất nhanh}.

- U là không gian tham chiếu của biến cơ sở u, mỗi giá trị ngôn ngữ xem như

là một biến mờ trên U kết hợp với biến cơ sở u (các giá trị mà biến X có thể nhận).

Ví dụ 1.6 X là “tốc độ” thì U = [0, 150] (km/h).

- R là tập luật cú pháp sinh các giá trị ngôn ngữ của T(X).

Ví dụ 1.7 R phát sinh tên các phần tử trong T(tốc độ) là hoàn toàn trực giác.

- M là tập các luật ngữ nghĩa gán mỗi giá trị ngôn ngữ trong T(X) với một tập mờ trên U.

Trang 21

Ví dụ 1.8 Luật ngữ ngĩa M được định nghĩa là :

M (rất chậm) = tập mờ đối với tốc độ là 0 km/h và có hàm thuộc là µ rất chậm;

M (hơi chậm) = tập mờ đối với tốc độ là 20 km/h và có hàm thuộc là µ hơi chậm;

M (trung bình) = tập mờ đối với tốc độ là 40 km/h và có hàm thuộc là µ trung bình;

M (hơi nhanh) = tập mờ đối với tốc độ là 60 km/h và có hàm thuộc là µ hơi nhanh;

M (rất nhanh) = tập mờ đối với tốc độ là 80 km/h và có hàm thuộc là µ rất nhanh

Từ định nghĩa trên chúng ta có thể nói rằng biến ngôn ngữ là biến có thể nhậngiá trị là các tập mờ trên một vũ trụ nào đó Để biểu diễn sự nhấn mạnh một biếnngôn ngữ, người ta hay dùng các từ như rất, hơi, ít, nhiều,… gọi là các gia tử

1.1.5 Các phép tính trên tập mờ [5], [14]

Phép hợp mờ (Union)

Cho A, B là hai tập mờ xác định trên tập vũ trụ X và có các hàm thuộc lần lượt

là µ A , µ B Hợp của hai tập mờ A và B là một tập mờ, ký hiệu A∪B, với hàm thuộc

µ A ∪B được định nghĩa như sau:

.

Hình 1.7 Hợp của hai tập mờ

Phép giao mờ (Intersection)

Cho A, B là hai tập mờ xác định trên tập vũ trụ X và có các hàm thuộc lần luợt

là µ A , µ B Giao của hai tập mờ A và B là một tập mờ, ký hiệu A∩B, với hàm thuộc

được định nghĩa như sau:

Trang 22

Hình 1.8 Giao của hai tập mờ

Phép lấy phần bù của một tập mờ

Cho A là tập mờ xác định trên tập vũ trụ X, có hàm thuộc µ A Phép lấy bù của

tập A là một tập mờ, ký hiệu ~A, với hàm thuộc được định nghĩa như sau:

µ~A = 1- µA, ∀x ∈ X.

Hình 1.9 Bù của một tập mờ

Tích đại số của hai tập mờ

là Tích đại số của hai tập mờ A và B là một tập mờ, ký hiệu A.B, với

hàm thuộc được định nghĩa như sau:

µA.B(x) = µA(x).µB(x), ∀x∈X.

Tổng đại số của hai tập mờ

Trang 23

là , Tổng đại số của hai tập mờ A và B là một tập mờ, ký hiệu , với hàm

thuộc được định nghĩa như sau:

∀x ∈ X

Tích Descartes của hai tập mờ

Cho A, B là hai tập mờ xác định trên tập vũ trụ tương ứng X và Y Tích

Descartes của hai tập mờ A và B trong X, ký hiệu AxB là một tập mờ trên tập vũ trụ

XxYcó hàm thuộc được xác định như sau:

µA x B (x, y) = min{µA(x), µB(y)}, ∀(x, y) ∈ XxY.

Phép T-norm

Định nghĩa : Một hàm 2 biến T: [0,1]x[0,1]  [0,1] được gọi là phép t-norm

nếu thỏa mãn các tính chất sau với ∀x, x’, y, z ∈ [0,1] :

1) Tính chất điều kiện biên : T(x, 1) = x (Tồn tại phần tử đơn vị);

2) Tính chất giao hoán : T(x, y) = T(y, x) ;

3) Tính chất đơn điệu : x ≤ x’ � T(x, y) ≤ T(x’, y) ;

4) Tính chất kết hợp : T(T(x, y),z) = T(x, T(y, z)).

Dễ dàng kiểm chứng phép min và phép tích đại số là các phép t-norm, chúng

được ký hiệu là T m và T p Phép t-norm T m được gọi là phép giao mờ chuẩn

Một số phép t-norm hay được sử dụng :

- Phép giao mờ chuẩn: T m = min{x, y} ;

- Phép tích đại số: x.y ;

- Phép hiệu giới nội: T(x, y) = max{0, x + y - 1} ;

Trang 24

1) Tính chất giới nội : S(x, 0) = x (Tồn tại phần tử đơn vị) ;

2) Tính chất giao hoán : S(x, y) = S(y, x) ;

Khái niệm về quan hệ mờ:

Cho X và Y là hai không gian nền, R được gọi là một quan hệ mờ trên X x Y nếu R là một tập mờ trên X x Y, tức là có một hàm thuộc :

Trang 25

Các phép tính trên quan hệ mờ :

Vì quan hệ mờ cũng là tập mờ nên các phép tính trên tập mờ cũng là phép tínhtrên quan hệ mờ Tuy nhiên, trên quan hệ mờ có những phép tính đặc thù riêng màtrên tập mờ nói chung không có, chẳng hạn :

 Phép đảo của quan hệ mờ R(X,Y) là R-1(Y, X) cho bởi: R-1(y, x) = R(x, y) ;

 Phép hợp thành của hai quan hệ mờ R1 và R2

Cho R1 là quan hệ mờ trên X x Y và R2 là quan hệ mờ trên Y x Z, thì phép hợp

thành R1 o R2 là một quan hệ mờ trên X x Z.

Có 3 phép hợp thành thông dụng :

1.2 CÂY QUYẾT ĐỊNH

Kỹ thuật cây quyết định là một công cụ mạnh và hiệu quả trong việc phân lớp

và dự báo Các đối tượng dữ liệu được phân thành các lớp Các giá trị của đối tượng

Trang 26

dữ liệu chưa biết sẽ được dự đoán, dự báo Tri thức được rút ra trong kỹ thuật nàythường được mô tả dưới dạng tường minh, đơn giản, trực quan, dễ hiểu đối vớingười sử dụng.

1.2.1 Định nghĩa cây quyết định

Trong lĩnh vực học máy, cây quyết định là một kiểu mô hình dự báo(predictive model), nghĩa là một ánh xạ từ các quan sát về một sự vật, hiện tượng tới các kết luận về giá trị mục tiêu của sự vật, hiện tượng Mỗi nút trong (internal node) tương ứng với một biến; đường nối giữa nó với nút con của nó thể hiện giá trị

cụ thể cho biến đó Mỗi nút lá đại diện cho giá trị dự đoán của biến mục tiêu, chotrước các giá trị dự đoán của các biến được biểu diễn bởi đường đi từ nút gốc tới nút

lá đó Kỹ thuật học máy dùng trong cây quyết định được gọi là học bằng cây quyếtđịnh, hay chỉ gọi với cái tên ngắn gọn là cây quyết định [8], [9], [10], [16]

Ví dụ 1.9 Để xác định mức lương cao hay thấp ứng với một độ tuổi nào đó,

qua khảo sát ta có bảng dữ liệu như sau:

Bảng 1.1 Bảng dữ liệu phân lớp mức lương

Trang 27

Hình 1.10 Cây quyết định phân lớp mức lương

1.2.2 Ưu điểm của cây quyết định

So với các phương pháp khai phá dữ liệu khác, cây quyết định có một số ưuđiểm sau:

- Cây quyết định tương đối dễ hiểu;

- Đòi hỏi mức tiền xử lý dữ liệu đơn giản;

- Có thể xử lý với cả các dữ liệu rời rạc và liên tục;

- Kết quả dự đoán bằng cây quyết định có thể thẩm định lại bằng cách kiểm trathống kê

1.2.3 Vấn đề xây dựng cây quyết định

Có nhiều thuật toán khác nhau để xây dựng cây quyết định như: CLS, ID3,C4.5, SLIQ, SPRINT, EC4.5, C5.0,…Nhưng nói chung quá trình xây dựng câyquyết định đều được chia ra làm 3 giai đoạn cơ bản:

- Xây dựng cây: Thực hiện chia một cách đệ quy tập mẫu dữ liệu huấn luyệncho đến khi các mẫu ở mối nút lá thuộc cùng một lớp;

- Cắt tỉa cây: Là việc làm dùng để tối ưu hoá cây Cắt tỉa cây chính là việc trộnmột cây con vào trong một nút lá;

Trang 28

- Đánh giá cây: Dùng để đánh giá độ chính xác của cây kết quả Tiêu chí đánhgiá là tổng số mẫu được phân lớp chính xác trên tổng số mẫu đưa vào

1.2.4 Rút ra các luật từ cây quyết định.

Có thể chuyển đổi qua lại giữa mô hình cây quyết định và mô hình dạng luật(IF …THEN…) Hai mô hình này là tương đương nhau

Ví dụ 1.10 Từ cây quyết định ở Hình 1.10 ta có thể rút ra được các luật sau:

IF (Tuổi <= 35) AND (Lương <= 30) THEN mức lương = Thấp;

IF (Tuổi <= 35) AND (Lương > 30) THEN mức lương = Cao;

IF (Tuổi > 35) AND (Lương <= 50 ) THEN mức lương = Thấp;

IF (Tuổi > 35) AND (Lương > 50) THEN mức lương = Cao

1.2.5 Thuật toán xây dựng cây quyết định C4.5

Thuật toán C4.5 (thuật toán cải tiến của ID3) là một thuật toán phân lớp tạo racây quyết định được phát triển bởi J Ross Quinlan vào năm 1996 Cây quyết địnhđược tạo ra bởi thuật toán C4.5 có đặc điểm đơn giản, dễ sử dụng, dễ hiểu bởi cácluật tạo ra ở nút lá của cây có thể biểu diễn dưới dạng câu lệnh If- then Chính vìthế, trong luận văn này dùng thuật toán C4.5 để xây dựng cây quyết định phân lớp

dữ liệu (khả năng mắc bệnh đái tháo đường)

Thuật toán xây dựng cây quyết định C4.5

Input: Tập dữ liệu huấn luyện (tập các thuộc tính);

Output: Cây quyết định phân lớp dữ liệu.

Mô tả thuật toán dưới dạng giả mã như sau:

Function C45_builder(tập_A, tập_thuộc_tính)

{ if (mọi record trong tập_A đều nằm trong cùng một lớp)

{ return một nút lá được gán nhãn bởi lớp đó;}

else

{ if (tập_thuộc_tính là rỗng )

Trang 29

{ return nút lá được gán nhãn bởi tuyển của tất

cả các

lớp trong tập_A; } else

{ Chọn một thuộc tính P, lấy nó làm gốc cho cây

hiện tại;

Xóa P ra khỏi tập_thuộc_tính;

For each (giá trị V của P)

{Tạo một nhánh của cây gán nhãn V;

Đặt vào phân_vùng V các ví dụ trong tập_A có

giá trị V tại thuộc tính P;

Gọi C45_builder (phân_vùng V, tập_thuộc_tính), gắn kết quả vào nhánh V; }

} }

}

1.3 CÂY QUYẾT ĐỊNH MỜ

Điểm không thuận lợi của cây quyết định là tính không ổn định của nó Câyquyết định được thừa nhận như một cách phân lớp dễ thay đổi nhất về khía cạnhphụ thuộc vào dữ liệu huấn luyện Cấu trúc của cây quyết định có thể khác hoàntoàn nếu có thay đổi nào đó trong tập dữ liệu huấn luyện Để khắc phục vấn đề nàymột số nhà nghiên cứu đã đưa ra cây quyết định mờ bằng cách sử dụng lý thuyết tập

mờ để diễn tả mức độ quan hệ của các giá trị thuộc tính, điều này có thể phân biệtchính xác sự phù hợp của các quan hệ phụ thuộc giữa các ví dụ huấn luyện khácnhau và mọi giá trị của thuộc tính

1.3.1 Định nghĩa cây quyết định mờ

Cây quyết định mờ là sự mở rộng của cây quyết định cổ điển và là mộtphương pháp hiệu quả để rút ra tri thức trong các bài toán phân loại không chắc

Trang 30

chắn Nó áp dụng lý thuyết tập mờ để biểu diễn tập dữ liệu và kết hợp trong pháttriển cây và tỉa cành để xác định cấu trúc của cây [8].

1.3.2 Dữ liệu mẫu với biểu diễn mờ

Nhìn chung, dữ liệu tồn tại hai loại thuộc tính khác nhau là rời rạc và liên tục.Nhiều thuật toán đòi hỏi dữ liệu với các giá trị rời rạc Không dễ dàng gì để thaythế một miền liên tục với một miền rời rạc Điều này đòi hỏi sự phân vùng vàgộp nhóm Và cũng rất khó để định nghĩa ranh giới của các thuộc tính liên tục

Ví dụ, làm thế nào để định nghĩa đoạn tắc đường là dài hay ngắn? Có thể chorằng đoạn tắc đường 3km là dài và 2,9 km là ngắn? Có thể nói rằng trời lạnh vớinhiệt độ là 9OC, trời ấm áp với nhiệt độ là 10OC? Do vậy, một số nhà nghiêncứu đã đưa khái niệm mờ vào thuật toán ID3, thay thế dữ liệu mẫu với biểu diễn

mờ và hình thành nên thuật toán Fuzzy ID3

Ví dụ 1.11 việc một người quyết định tự lái xe ôtô (Car Driving) hay dùng

phương tiện công cộng khác để đi làm phụ thuộc vào thời tiết như nhiệt độ(Tempereture), gió (Wind) và tình hình giao thông có tắc đường (Traffic-Jam)dài không Ta có tập dữ liệu mẫu như bảng dưới:

Bảng 1.2 Dữ liệu mẫu về việc tự lái xe đi làm (Car Driving)

Trang 31

Hình 1.11 Hình biểu diễn hàm thuộc của thuộc tính Tắc đường (MF)

Với thuộc tính Nhiệt độ là Mát mẻ, Ấm áp hay Nóng, ta có thể định nghĩa các hàm thuộc tương ứng (µ c , µ m hayµ h) như sau:

Trang 32

Với thuộc tính Gió là Yếu hay Mạnh ta có thể định nghĩa các hàm thuộc tương ứng (µ w hay µ w) như sau:

Ta thu được biểu diễn mờ của tập mẫu như bảng dưới đây (Ký hiệu: Membership Function là hàm thuộc, N: Không, Y: Có):

MF-Bảng 1.3 Biểu diễn mờ của tập mẫu

Trang 33

Như ví dụ ở trên, ta đã phân vùng tập mẫu thành những khoảng khácnhau Sự phân vùng này là đầy đủ (mỗi giá trị trong miền là thuộc vào ít nhất một tập con) và là không nhất quán (một giá trị trong miền có thể tìm thấy trong nhiều hơn một tập con).

Chẳng hạn: Nếu đoạn đường tắc Traffic-Jam là <3 km, giá trị của hàm thuộc Dài (MF(l)) là 0, còn giá trị của hàm thuộc Ngắn (MF(sh)) là 1

Áp dụng thuật toán thuật toán Fuzzy ID3 với Entropy mờ và độ đo thôngtin mờ, ta thu được cây như sau:

Trang 34

Hình 1.12 Quá trình phát triển cây của thuật toán Fuzzy ID3

1.4 TIỂU KẾT CHƯƠNG 1

Chương 1 đã trình bày các nội dung chính về tập mờ, biến ngôn ngữ, quan hệ

mờ làm cơ sở cho lập luận mờ ở chương 2 và trình bày thêm lý thuyết về cây quyếtđịnh, cây quyết định mờ và thuật toán xây dựng cây quyết định C4.5 để làm cơ sởcho việc xây dựng các tập luật mờ từ dữ liệu huấn luyện trong chương 3

Chương tiếp theo sẽ trình bày tổng quan về logic mờ, phương pháp lập luậnxấp xỉ trên tập mờ và phép suy diễn mờ, đó là cơ sở để áp dụng vào bài toán chẩnđoán bệnh đái tháo đường trong chương 3

Trang 35

CHƯƠNG 2 LOGIC MỜ VÀ LẬP LUẬN MỜ

Logic mờ (Fuzzy logic) được phát triển từ lý thuyết tập mờ để thực hiện lập

luận một cách xấp xỉ thay vì lập luận chính xác theo logic vị từ cổ điển Người tahay nhầm lẫn mức độ đúng với xác suất Tuy nhiên, hai khái niệm này khác hẳnnhau; độ đúng đắn của logic mờ biểu diễn độ thuộc với các tập được định nghĩakhông rõ ràng, chứ không phải khả năng xảy ra một biến cố hay điều kiện nào đó.Logic mờ cho phép độ thuộc có giá trị trong khoảng [0, 1], và ở hình thức ngôn từ,

các khái niệm không chính xác như "hơi hơi", "gần như", "khá là" và "rất".

Suy luận xấp xỉ hay còn gọi là suy diễn mờ là quá trình suy ra những kết luậndưới dạng các mệnh đề mờ trong điều kiện các quy tắc, các luật, các dữ liệu đầu vàokhông hoàn toàn xác định

2.1 LOGIC MỜ

2.1.1 Mệnh đề mờ

Trong logic cổ điển (logic vị từ cấp một), một mệnh đề phân tử P(x) là một phát biểu có dạng “x là P” trong đó x là một đối tượng trong một vũ trụ U nào đó thoả tính chất P Ví dụ “x là số chẵn” thì U là tập các số nguyên và P là tính chất chia hết cho 2 Như vậy, ta có thể đồng nhất một mệnh đề phân tử “x là P” với một tập (rõ) A = {xU | P(x)}

Từ đó, ta có: P(x) = (x) ;

Trong đó  là hàm đặc trưng của tập A ( xA  (x) = 1) Giá trị chân lý của P(x) chỉ nhận một trong hai giá trị 1 và 0 (true và false) tương ứng với sự kiện x thuộc A hoặc không.

Trong trường hợp P là một tính chất mờ chẳng hạn như “số lớn” thì ta sẽ có một mệnh đề logic mờ phần tử Khi đó tập hợp các phần tử trong vũ trụ U thoả P là một tập mờ B có hàm thuộc B sao cho: P(x) = B (x).

Lúc này P(x) có thể nhận các giá trị tuỳ ý trong [0,1] Và ta thấy có thể đồng

nhất các hàm thuộc với các mệnh đề logic mờ

Trang 36

Trong logic mờ, người ta thường dùng các phát biểu dưới dạng mệnh đề cócấu trúc [5], [14]:

NẾU (mệnh đề điều kiện)…THÌ (mệnh đề kết luận).

(hay IF (Clause)…THEN (clause))

Ta ký hiệu: p→q (Từ p suy ra q).

Ví dụ 2.1 Cho mệnh đề mờ sau:

NẾU nhiệt độ cao THÌ độ ẩm thấp.

- Các biến ở đây sẽ là: “nhiệt độ”, “độ ẩm”;

- Các giá trị hay tập mờ là: “cao”, “thấp”

Mệnh đề trên là ví dụ đơn giản về điều khiển mờ, nó cho phép từ một giá trị

đầu vào x o (hoặc độ thuộc µ A (x o ) của x o trên tập mờ A) xác định được hệ số thỏa mãn mệnh đề kết luận q của giá trị đầu ra y.

NẾU x = A THÌ y = B tức là AB là một giá trị mờ.

2.1.2 Tập luật mờ

Tập luật mờ là sự kết hợp của nhiều mệnh đề mờ có dạng NẾU - THÌ như đãnói ở trên

Cho x1, x2, …, xm là các biến vào của hệ thống, y là biến ra Các tập Aij, Bj (với i

= 1, 2, …, m và j = 1, 2, …, n) là các tập mờ trong không gian nền tương ứng của

các biến vào và biến ra, các Rj là các suy diễn mờ thì ta có tập luật mờ [12]:

R1 : NẾU x1 là A11 và …và xm là Am1 THÌ y là B1 ;

R2 : NẾU x1 là A12 và …và xm là Am2 THÌ y là B2 ;

………

Rn : NẾU x1 là A1n và …và xm là Amn THÌ y là Bn

Bài toán : Cho : NẾU x1 là e1* và …và xm là em* Tính: Giá trị y là u*

Ở đây e1*, e2*, …, em* là các giá trị đầu vào Giá trị u* tính được nhờ phép suy

luận từ tập luật mờ Ri

Trang 37

2.1.3 Phép toán kéo theo mờ

Các phép toán kéo theo có vai trò quan trọng trong logic mờ Chúng tạo nêncác luật mờ để thực hiện các phép suy diễn trong tất cả các hệ mờ Do một mệnh đề

mờ tương ứng với một tập mờ nên ta có thể dùng hàm thuộc thay cho các mệnh đề:

A

 (x) =>B (y)

Sau đây là một số phép kéo theo quan trọng được sử dụng phổ biến:

- Phép kéo theo Dienes – Rescher:

µ D (x, y) = max(1-A (x), B (y)).

- Phép kéo theo Lukasiewicz :

µ L (x, y) = min(1, 1-A (x)+B (y)).

- Phép kéo theo Zadeh:

µ Z (x, y) = max(1-A (x), min(A (x),B (y))) ; (a) hoặc

µ Z (x, y) = max( 1-A (x), A (x).B (y)) (b)

- Phép kéo theo Goedel:

µ G (x, y) = 1 nếu A (x) ≤ B (y),

B

 (y) nếu A (x) > B (y).

- Kéo theo Mamdani:

µ M (x, y) = min(A (x),B (y)) ; (a) hoặc

µ M (x, y) = A (x).B (y). (b)

2.2 PHƯƠNG PHÁP LẬP LUẬN XẤP XỈ DỰA TRÊN TẬP MỜ

Phương pháp lập luận xấp xỉ là một thành tố rất đặc trưng của quá trình lấyquyết định, chúng có khả năng mô phỏng quá trình lập luận trong môi trường thôngtin không đầy đủ, không chắc chắn và vì vậy bản chất của phương pháp lập luận xấp

xỉ là gần đúng

Trang 38

Trong công trình nghiên cứu của mình, Zadeh đưa ra khái niệm sơ đồ lập luậnxấp xỉ như sau [5], [14]:

Tiên đề 1: NẾU màu của quả cà chua nào đó là đỏ THÌ quả cà chua đó là chín; Tiên đề 2: Màu quả cà chua Q là rất đỏ;

Kết luận: Quả cà chua là rất chín.

Chúng ta thấy sơ đồ này tương tự như luật Modus ponens trong logic cổ điển :

từ A B.

Luật Modus Ponens hay Modus Tollen :

Thông thường, suy diễn mờ (suy luận mờ) hay sử dụng luật Modus Ponen

hoặc Modus Tollens Trong logic cổ điển, Modus Ponens diễn đạt như sau:

Mệnh đề 1 (Luật hoặc tri thức) : P → Q ; Mệnh đề 2 (sự kiện) : P đúng ;

Tương tự logic cổ điển, trong logic mờ (suy diễn mờ hay suy luận mờ) cũng có

luật Modus Ponens như sau:

Giả thiết 1 (luật mờ) : Nếu x là A thì y là B ;

Giả thiết 1 (sự kiện mờ) : x là A' ;

Kết luận : y là B'.

Trong đó A, B, A', B' là các biến ngôn ngữ (có nghĩa là các tập mờ) A và A' là các tập mờ trên không gian nền U, còn B và B' là các tập mờ trên không gian nền V.

Ví dụ 2.2 Luật mờ : Nếu quả cà chua đỏ thì quả cà chua đó chín ;

Sự kiện mờ : Quả cà chua khá đỏ ;

Kết luận : Quả cà chua đó khá chín

Trang 39

Trong logic cổ điển, Modus Tollens diễn đạt như sau:

Mệnh đề 1 (Luật hoặc tri thức) : P → Q ; Mệnh đề 2 (sự kiện) : ¬Q đúng ;

Tương tự logic cổ điển, trong logic mờ (suy diễn mờ hay suy luận mờ) luật

được diễn đạt như sau :

Giả thiết 1 (Luật mờ hoặc tri thức mờ) : P → Q ; Giả thiết 2 (Sự kiện mờ) : ¬Q khá đúng ;

Ví dụ 2.3 Luật mờ: Nếu quả cà chua đỏ thì quả cà chua đó chín ;

Sự kiện mờ : Quả cà chua không chín lắm ;

Kết luận : Quả cà chua đó không đỏ lắm.

Để ứng dụng suy diễn mờ (suy luận mờ) vào trong bài toán thực tế thì vấn đềmấu chốt cần thực hiện là xây dựng cơ chế lập luận xấp xỉ để có thể đưa ra kết luậnhay quyết định mờ

Công thức tính kết luận của luật Modus Ponens như sau:

'

B

 (y) = sup

x T(R (x,y), A'(x)) (*) Trong đó T là một hàm T-norm và R là quan hệ hai ngôi xác định bởi phép kéo

theo Cách tính R (x,y), chính là cách tính giá trị chân lý của phép kéo theo trình

bày ở phần trước Như vậy tuỳ theo cách chọn cách tính luật kéo theo khác nhau mà

ta có cách tính kết quả của luật Modus Ponens khác nhau

Ví dụ 2.4 Giả sử quan hệ giữa nhiệt độ và áp suất cho bởi luật sau:

Nếu nhiệt độ là cao thì áp suất là lớn

Nhiệt độ nhận các giá trị trong U = {30, 35, 40, 45} ;

Trang 40

Áp suất nhận các giá trị trong V = {50, 55, 60, 65}.

Ta có các tập mờ xác định bởi biến ngôn ngữ nhiệt độ và áp suất như sau:

A = “nhiệt độ cao” =

45

140

9.035

3.030

155

5.050

45 40 35 30

1 1 5 0 0

9 0 9 0 45 0 0

3 0 3 0 15 0 0

0 0 0 0

8.035

130

6.0

Phép suy diễn mờ dùng để kết hợp các luật mờ dạng NẾU - THÌ trong cơ sở

luật mờ thành một phép ánh xạ từ một tập mờ A' trong U đến một tập mờ B' trong V.

Có 2 cách suy diễn: suy diễn dựa trên toàn bộ luật và suy diễn dựa trên từng luật

Các cơ chế suy diễn thông dụng:

- Cơ chế suy diễn tích số:

Định dạng
Số trang	96
Dung lượng	4,74 MB