Hệ logic mờ với bài toán dự báo trong y học

Với các mô tả không chắc chắn và số liệu đôi khi có độ lệch thì việc nghiên cứu và ứng dụng Logic mờ trong bài toán chuẩn đoán hoặc dự báo sẽ mang lại nhiều kết quả thực tiễn.. Bài toán

Trang 1

VÕ DUY THANH

HỆ LOGIC MỜ VỚI BÀI TOÁN DỰ BÁO TRONG Y HỌC

Chuyên ngành: Công nghệ thông tin

Mã số: 60.48.02.01

LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN

NGHỆ AN, 2017

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC VINH

VÕ DUY THANH

HỆ LOGIC MỜ VỚI BÀI TOÁN DỰ BÁO TRONG Y HỌC

Chuyên ngành: Công nghệ thông tin

Mã số: 60.48.02.01

LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN

Người hướng dẫn: TS Phan Anh Phong

NGHỆ AN, 2017

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi Các

số liệu và kết quả nghiên cứu trong luận văn là trung thực và chưa hề được sử dụng để bảo vệ một học vị nào Các thông tin được lược trích từ nguồn tài liệu chính thống và được chỉ rõ nguồn gốc rõ ràng Nếu sai tôi hoàn toàn chịu trách nhiệm

Tác giả luận văn

Võ Duy Thanh

Trang 4

LỜI CẢM ƠN

Đầu tiên, tôi xin gửi lời cảm ơn sâu sắc nhất đến nhà khoa học TS

Phan Anh Phong, thầy đã tận tình chỉ bảo, giúp đỡ, định hướng và tạo

điều kiện cho tôi hoàn thành luận văn này

Tôi xin trân trọng cảm ơn sự giúp đỡ của các nhà khoa học, thầy,

cô trường Đại học Vinh, Trường Đại học Đồng Tháp đã giảng dạy,

truyền đạt kiến thức và hỗ trợ các điều kiện học tập cho tôi

Mặc dù, tác giả đã nỗ lực và cố gắng để hoàn thành luận văn,

nhưng do trình độ và kinh nghiệm trong nghiên cứu khoa học còn hạn

chế Nên chắc chắn luận văn này không tránh khỏi những thiếu sót Tác

giả kính mong nhận được sự đóng góp và chỉ dẫn của các nhà khoa học,

bạn bè, đồng nghiệp giúp cho luận văn được hoàn thiện hơn

Để có được kết quả như hôm nay, tôi cũng xin tỏ lòng biết ơn đến

gia đình, bạn bè, đồng nghiệp đã động viên, giúp đỡ, chia sẻ những khó

khăn để tôi hoàn thành nhiệm vụ học tập, nghiên cứu của mình

Xin chân thành cảm ơn!

Nghệ An, ngày……tháng……năm 2017

Học viên thực hiện

Võ Duy Thanh

Trang 5

MỤC LỤC

LỜI CAM ĐOAN i

LỜI CẢM ƠN ii

MỤC LỤC iii

DANH MỤC CÁC TỪ VIẾT TẮT vi

DANH MỤC HÌNH vii

DANH MỤC BẢNG ix

MỞ ĐẦU 1

1 Sự cần thiết của vấn đề nghiên cứu 1

2 Lịch sử của vấn đề nghiên cứu: 2

3 Mục tiêu nghiên cứu 2

4 Đối tượng và phạm vi nghiên cứu 2

5 Nội dung nghiên cứu 3

6 Đóng góp của luận văn 3

7 Kết cấu của luận văn 3

Chương 1 GIỚI THIỆU BÀI TOÁN DỰ BÁO TRONG Y HỌC 5

1.1 Đặt vấn đề 5

1.2 Các nghiên cứu liên quan đến bài toán dự báo trong y học 7

1.3 Bài toán dự báo bệnh nhân viêm tủy 8

Bài toán 8

1.3.1. Các tiếp cận nghiên cứu và kết quả đạt được 9

1.3.2. 1.4 Kết luận chương 1 9

Chương 2 TỔNG QUAN VỀ TẬP MỜ VÀ HỆ LOGIC MỜ 10

Trang 6

2.1 Đặt vấn đề 102.2 Lý thuyết tập mờ 10

Các khái niệm cơ bản 10

Chương 3 XÂY DỰNG HỆ LOGIC MỜ DỰ BÁO THỜI GIAN SỐNG CỦA BỆNH NHÂN VIÊM TỦY 28

3.1 Đặt vấn đề 283.2 Xây dựng cơ sở luật từ dữ liệu bằng phương pháp của Wang –

3.3 Thiết kế hệ logic mờ cho bài toán dự báo 35

Xác định các thuộc tính của mô hình và các giá trị ngôn ngữ 35

Trang 7

Chương 4 NÂNG CAO HIỆU QUẢ DỰ BÁO CỦA HỆ MỜ VỚI

THUẬT TOÁN TỐI ƯU HÓA BẦY ĐÀN 49

4.1 Đặt vấn đề 49

4.2 Giải thuật tối ưu hóa bầy đàn (PSO) 49

Tổng quan giải thuật PSO 49

4.2.1. Các bước thực hiện của giải thuật 50

4.2.2. Hạn chế của PSO 52

4.2.3. 4.3 Áp dụng giải thuật tối ưu hóa bầy đàn 52

Hàm mục tiêu 53

4.3.1. Biểu biến cá thể: 55

4.3.2. Khởi tạo quần thể 55

4.3.3. 4.4 Kết quả thử nghiệm 55

4.5 Kiểm tra kết quả dự báo của hệ mờ đề xuất với Tool box của Matlab 56

4.6 Kết luận chương 4 62

KẾT LUẬN 63

TÀI LIỆU THAM KHẢO 64

Phụ lục 66

Trang 8

DANH MỤC CÁC TỪ VIẾT TẮT Các chữ viết tắt: Giải nghĩa

PSO Particle Swarm Optimization MISO Multi Input Single Output

MIMO Multi Input Multi Output

GA Genetic AlgorithmLOM Largest of MaximumMOM Middle of MaximumSOM Smallest of Maximum

Trang 9

DANH MỤC HÌNH

Hình 2.1 Hàm thuộc µA( x) có mức chuyển đổi tuyến tính 11

Hình 2.2 Hàm thuộc của tập B 11

Hình 2.3 Miền xác định và miền tin cậy của tập mờ A 12

Hình 2.4 Biểu diễn tập mờ chiều cao 14

Hình 2.5 Hợp hai tập mờ có cùng tập vũ trụ 14

Hình 2.6 Giao hai tập mờ có cùng tập vũ trụ 15

Hình 2.7 Tập bù A của tập mờ A 16

Hình 2.8 Giải mờ bằng phương pháp điểm cực đại 25

Hình 2.9 Giải mờ bằng phương pháp điểm trọng tâm 27

Hình 3.1 Biểu diễn hàm thuộc cho các thuộc tính x1, x2, y 34

Hình 3.2 Sơ đồ thuật toán xây dựng hệ mờ 36

Hình 3.3 Tập tham số của các hàm thuộc cho biến ngôn ngữ LogBun 38 Hình 3.4 Tập tham số của các hàm thuộc cho biến ngôn ngữ HGB 39

Hình 3.5 Tập tham số của các hàm thuộc cho biến ngôn ngữ LogTime 40 Hình 3.6 Mô hình của hệ thống 41

Hình 3.7 Suy diễn và giải mờ dựa trên cơ sở luật 44

Hình 3.8 Đồ thị biểu thị kết quả tìm được từ hệ mờ và kết quả thực tế 46 Hình 4.1 Sơ đồ giải thuật PSO áp dụng cho tối ưu tham số hàm thuộc của hệ logic mờ 54

Hình 4.2 Mô hình hệ thống 57 Hình 4.3 Thiết lập các tham số cho các giá trị ngôn ngữ của biến ngôn

Trang 10

ngữ LogBun 58Hình 4.4 Thiết lập các tham số cho các giá trị ngôn ngữ của biến ngôn ngữ HGB 58Hình 4.5 Thiết lập các tham số cho các giá trị ngôn ngữ của biến ngôn ngữ LogTime 59Hình 4.6 Thêm vào tập cơ sở các luật 59Hình 4.7 Tính kết quả với đầu vào của bản ghi 19 trong bộ dữ liệu kiểm tra 60Hình 4.8 Đồ thị biểu thị kết quả tìm được từ hệ mờ và kết quả thực tế 61

Trang 11

DANH MỤC BẢNG

Bảng 3.1 Tham số của các hàm thuộc cho thuộc tính LogBun 40Bảng 3.2 Tham số của các hàm thuộc cho thuộc tính HGB 40Bảng 3.3 Tham số của các hàm thuộc cho thuộc tính LogTime 40Bảng 3.4 Tập luật và trọng số mỗi luật tương ứng với các bảng ghi trong

bộ dữ liệu huấn luyện 42Bảng 3.5 Cơ sở luật xây dựng bằng phương pháp của Wang và Mendel trong trường hợp chưa tối ưu các tham số của hàm thuộc 43Bảng 3.6 Kết quả dữ liệu LogTime tìm được của hệ mờ và dữ liệu mẫu45Bảng 4.1 Tham số của các hàm thuộc cho thuộc tính LogBun 55Bảng 4.2 Tham số của các hàm thuộc cho thuộc tính HGB 56Bảng 4.3 Tham số của các hàm thuộc cho thuộc tính LogTime 56Bảng 4.4 Cơ sở luật xây dựng bằng phương pháp của Wang và Mendel trong trường hợp đã tối ưu các tham số của hàm thuộc 56Bảng 4.5 Kết quả dữ liệu LogTime tìm được của hệ mờ và dữ liệu mẫu60

Trang 12

MỞ ĐẦU

1 Sự cần thiết của vấn đề nghiên cứu

Chuẩn đoán, dự báo về tình trạng sức khỏe của người bệnh trong y học là một lĩnh vực tương đối phức tạp Đối tượng của lĩnh vực này là những bệnh nhân, những con người thực sự Đó là những thực thể sống được tổ chức rất phức tạp về mặt sinh học kèm theo đó là hàng loạt những quá trình sống tác động qua lại, ảnh hưởng lẫn nhau Những quá trình này luôn bị chi phối bởi điều kiện môi trường như: xuất hiện đối kháng mới, mầm bệnh, nguồn bệnh Kiến thức y học cũng khá phức tạp Để tìm ra những đáp án cho tình trạng bệnh, bằng kinh nghiệm và kiến thức người bác sĩ phải dựa trên sự mô tả về bệnh án và các số liệu xét nghiệm để đưa ra đáp án có độ chính xác cao nhất Với các mô tả không chắc chắn và số liệu đôi khi có độ lệch thì việc nghiên cứu và ứng dụng Logic mờ trong bài toán chuẩn đoán hoặc dự báo sẽ mang lại nhiều kết quả thực tiễn

Bài toán dự báo thời gian sống của bệnh nhân viêm tủy là bài toán căn cứ vào các số liệu xét nghiệm liên quan đến công thức máu và một

số dữ liệu khác để đưa ra kết quả về thời gian còn sống của người bệnh

về tủy Do trong lĩnh vực y tế phần lớn các thông tin được phát biểu bằng ngôn ngữ mờ và không chắc chắn Vì vậy, việc nghiên cứu và xây dựng một hệ chuyên gia dùng để thu thập, phân tích dữ liệu và đưa ra những dự báo một cách đúng nhất sẽ hỗ trợ rất nhiều cho việc xây dựng phác đồ điều trị cho bệnh nhân

Logic mờ được công bố lần đầu tiên tại Mỹ vào năm 1965 do giáo

sư Lotfi Zadeh Kể từ đó, logic mờ đã có nhiều phát triển qua các chặng đường sau: phát minh ở Mỹ, áp dụng ở Châu Âu và đưa vào các sản

Trang 13

phẩm thương mại ở Nhật Với đầu vào là những dữ liệu không chắc chắn, nhiều nghiên cứu và ứng dụng thành công về Logic mờ như: Hệ thống hỗ trợ điều kiển xe ôtô, hệ thống điều khiển máy giặt, hệ thống dự báo về lượng nước mưa…Như vậy ngoài cách dự báo bằng kỹ thuật hồi quy thì logic mờ còn là một cách tiếp cận mới và đặt biệt phù hợp với những dữ liệu đầu vào chưa rõ

Xuất phát từ nhu cầu đưa ra một dự báo có tính đúng nhất về thời gian còn sống của người bệnh viêm tủy căn cứ vào các mô tả, dấu hiệu

và các số liệu xét nghiệm có độ sai lệch Đó là lý do tôi chọn đề tài “Hệ logic mờ với bài toán dự báo trong y học” nhằm tìm hiểu logic mờ, xem

xét hiệu quả của logic mờ khi ứng dụng vào bài toán dự báo và thử nghiệm các phương pháp tối ưu để nâng cao độ chính xác của dự báo

2 Lịch sử của vấn đề nghiên cứu:

Bài toán đã được xây dựng bằng phương pháp hồi quy [13], hệ mờ loại khoảng thống kê [14] và hệ mờ loại hai đại số gia tử [3]

3 Mục tiêu nghiên cứu

Nghiên cứu về lý thuyết tập mờ và thuật toán tối ưu hóa bầy đàn

để ứng dụng cho mô hình dự báo sử dụng tập mờ

4 Đối tượng và phạm vi nghiên cứu

4.1 Đối tượng nghiên cứu

Trang 14

Nghiên cứu hệ logic mờ và ứng dụng vào bài toán dự báo thời gian sống của bệnh nhân viêm tủy

5 Nội dung nghiên cứu

Khảo sát các ứng dụng dự báo sử dụng logic mờ từ đó xác định được ưu điểm và nhược điểm của hệ thống

Nghiên cứu ngôn ngữ lập trình Matlab để cài đặt mô phỏng các giải thuật trên máy tính

Nghiên cứu hệ logic mờ

Nghiên cứu xây dựng bộ luật cho hệ mờ từ dữ liệu mẫu

Nghiên cứu giải thuật tối ưu hóa bầy đàn

Lập trình cho bài toán dự báo trong y học bằng hệ mờ

6 Đóng góp của luận văn

Luận văn sẽ cung cấp cách tiếp cận việc xây dựng cơ sở luật từ dữ liệu

Ứng dụng giải thuật tối ưu hóa bầy đàn, một giải thuật còn nhiều mới mẻ vào việc tối ưu các tham số của bài toán

7 Kết cấu của luận văn

Ngoài phần mở đầu và kết luận bố cục của luận văn bao gồm 4 chương như sau:

Chương 1: Giới thiệu bài toán dự báo trong y học

Chương 2: Tổng quan về tập mờ và hệ logic mờ

Chương 3: Xây dựng hệ logic mờ dự báo thời gian sống của bệnh nhân viêm tủy

Trang 15

Chương 4: Nâng cao hiệu quả dự báo của hệ mờ với thuật toán tối

ưu hóa bầy đàn

Trang 16

CHƯƠNG 1 GIỚI THIỆU BÀI TOÁN DỰ BÁO TRONG Y HỌC 1.1 Đặt vấn đề

Trong nền y học hiện nay, việc chuẩn đoán hay dự báo chính xác tình trạng bệnh sẽ góp phần không nhỏ cho quá trình theo dõi và điều trị

Thông qua việc phân tích các thông tin y tế, hồ sơ bệnh án, quá trình xét nghiệm, khám bệnh, thông tin bác sĩ điều trị… sẽ đưa ra thông tin kịp thời về nhu cầu của bệnh nhân, báo cáo dự đoán

Hiện tại một số hệ thống đã được xây dựng để phục vụ trong lĩnh vực y học như: các phần mềm của IBM (gồm có phần mềm NEXT dự báo và phân loại bệnh thận, phần mềm HYCONES dự báo và phân loại bệnh tim), phần mềm phân tích của SAS/STAS, phần mềm của dự đoán bệnh từ xa Intouch Health Về cơ bản các hệ thống này đã được triển khai và ứng dụng thành công trong các trường hợp nhất định góp phần

hỗ trợ cho bác sĩ và nâng cao chất lượng cuộc sống cho người bệnh Việc khai phá dữ liệu và các phân tích dự báo đang giúp các bác sĩ chăm sóc y

tế tạo ra các biện pháp điều trị hợp lý cho các nhóm người khác nhau Ví

dụ, trong trường hợp của bệnh tim mạch, nhờ bắt tay làm việc chặt chẽ với các bệnh nhân được xác định bằng một giải pháp dự báo là có nguy

cơ cao, các biện pháp phòng ngừa đơn giản có thể được thực hiện như cắt giảm lượng chất béo bão hòa vào cơ thể, giảm cân và bỏ hút thuốc lá,

có thể làm giảm đáng kể nguy cơ của một cơn đau tim Theo cách này, các bác sĩ chăm sóc y tế có thể đưa ra những hướng dẫn khác nhau để giữ cho bệnh nhân có nguy cơ thấp vẫn giữ ở mức nguy cơ thấp, trong khi giảm thiểu các nguy cơ liên quan đến các bệnh nhân có nguy cơ cao

Ngoài những căn bệnh nguy hiểm thường được biết đến như bệnh

Trang 17

về các chức năng gan, thận… một trong số những căn bệnh không kém phần quan trọng quyết định đến thể trạng và sinh mạng của người bệnh

đó là căn bệnh viêm tủy Căn bệnh này tiến triển nhanh chóng hàng ngày hàng giờ lan dần từ thấp lên cao và có thể tổn thương lên não, gây tử vong nhanh Như vậy việc cần thiết là phải có một dự báo chính xác về thời gian sống của bệnh nhân để đưa ra những phương pháp xử lý theo đúng định hướng trong điều trị Tuy nhiên, hiện nay đối với một bài toán

dự báo việc đưa ra kết quả dự báo có tính chính xác còn gặp phải những thách thức sau:

Đầu tiên, để xây dựng một mô hình dự báo, trước tiên bạn cần phải chuẩn bị các dữ liệu sẽ được sử dụng để huấn luyện Để làm điều đó, một tập hợp các thuộc tính đại diện cho một đối tượng được tổ chức lại với nhau thành một bản ghi Khi tất cả các bản ghi được tập hợp với nhau, chúng trở thành một tập dữ liệu có thể chứa hàng triệu bản ghi Việc cần thiết là phải lựa chọn trong tập hợp các thuộc tính của đối tượng cần phân tích những thuộc tính nào có ảnh hưởng lớn nhất, quyết định đến kết quả

dự đoán và số lượng thuộc tính cần sử dụng là bao nhiêu để đem lại hiệu quả dự đoán tốt nhất

Tiếp theo, cần phải kết hợp dữ liệu và một mô hình toán học để từ

đó làm nền tảng cho cơ sở lập luận Hiện nay một số phương pháp mô hình hóa bài toán bao gồm: hồi quy, xác suất, mạng nơ ron, lan truyền-ngược, máy véc tơ hỗ trợ, cây quyết định, phân cụm, hệ logic mờ… Mỗi một mô hình kể trên đều có những ưu điểm và hạn chế riêng Như vậy, vấn đề đặt ra là lựa chọn một mô hình phù hợp đối với bài toán

Kế đến, trên cơ sở mô hình được chọn cần tìm ra những tham số thích hợp cho việc xây dựng mô hình bài toán Trong bước này các kỹ

Trang 18

thuật tối ưu sẽ mang tính chất quyết định đầu ra dựa vào việc tìm kiếm nghiệm cho các tham số

Cuối cùng, một vấn đề quan trọng quyết định lớn nhất đến kết quả bài toán đó chính là bộ dữ liệu thí nghiệm bị nhiễu khi thu thập Ta nhận thấy việc đầu tiên là nếu không có bộ dữ liệu thì sẽ không có cơ sở để phân tích và cũng không thể nào phân tích dự báo Đối với một số mô hình dự báo để có thể học và tổng quát hóa, phải cần đến hàng ngàn bản ghi hoặc nhiều hơn Nếu dữ liệu không đủ cho việc huấn luyện một mô hình, có thể không có khả năng phân tích một cách tổng quát Nếu dữ liệu có sẵn đã đủ cho việc phân tích, thì tiếp theo là vấn đề dữ liệu tốt đến mức nào Chất lượng của dữ liệu sẽ trực tiếp phản ánh vào chất lượng của mô hình dự báo Có thể nói rằng, chất lượng đầu ra của dự báo dựa vào chất lượng của dữ liệu đầu vào

Đối với bệnh nhân viêm tủy, một căn bệnh nguy hiểm đến tính mạng, việc dự báo thời gian sống chính xác sẽ hỗ trợ cho phác đồ điều trị của bác sĩ và việc chuẩn bị tâm lý của bệnh nhân Trong phần 1.3 sẽ trình bày cụ thể hơn về bài toán này

1.2 Các nghiên cứu liên quan đến bài toán dự báo trong y học

Hiện nay một số hệ thống dự báovề lĩnh vực y học đã được nghiên cứu như:

- Hệ thống chuẩn đoán dựa trên phần mềm phân tích số liệu SAS/STAT [13]

- Hệ thống dự đoán bệnh lâm sàng của Y Zhang và Y Zhao [14]

- Ví dụ về bài toán dự báo trong tài liệu tham khảo tập mờ loại 2 đại số gia tử của TS Phan Anh Phong [3]

Trang 19

- Hệ thống chuẩn đoán bệnh tâm thần [5]

- Hệ thống chuẩn đoán bệnh đau co thắt ngực [4]

1.3 Bài toán dự báo bệnh nhân viêm tủy

Mặc dù các tham số trong bài toán trên đều liên quan đến thời gian sống của bệnh nhân nhưng trong các nghiên cứu, hai nhân tố có ảnh hưởng lớn nhất là LOGBUN và HGB Vì vậy, khi thiết kế hệ lôgic mờ,

ta chọn 2 tham số này làm 2 đầu vào, và đầu ra là log thời gian sống của các bệnh nhân

Dữ liệu được lấy từ User’s Guide The PHREG Procedure 2008,

Trang 20

sau đó tính logarit cơ số 10 của hai tham số BUN và TIME, chi tiết về bộ

dữ liệu được trình bày trong [phụ lục 1]

Các tiếp cận nghiên cứu và kết quả đạt được

1.3.2.

Trong các nghiên cứu đã kể ở phần 1.2 nhiều phương pháp đã được ứng dụng như: kỹ thuật phân tích hồi quy, hệ mờ loại 1, hệ mờ lại 2 khoảng thống kê, hệ mờ loại 2 đại số gia tử Bên cạnh đó 2 phương pháp

sử dụng hệ mờ này đều dùng giải thuật di truyền (GA) dùng để tối ưu các tham số của hệ mờ Các kỹ thuật hồi quy đòi hỏi phải tìm một hàm biểu diễn phù hợp, trong khi đó khó tìm được hàm cho kết quả chuẩn xác Các phương pháp áp dụng hệ logic mờ về cơ bản đã thể hiện được tổng quan bài toán Trong đó các phương pháp sử dụng hệ mờ loại 2 đã đem đến 1 số kết quả dự đoán như mong đợi

Trang 21

CHƯƠNG 2 TỔNG QUAN VỀ TẬP MỜ VÀ HỆ LOGIC MỜ

2.1 Đặt vấn đề

Chương này sẽ nhắc lại các khái niệm về tập mờ, các phép toán hỗ trợ cho việc thực hiện tính toán trên tập mờ, về quan hệ mờ, và các phép hợp thành Từ đó để làm cơ sở để tìm hiểu cách xây dựng hệ logic mờ [1,7,11]

2.2 Lý thuyết tập mờ

Các khái niệm cơ bản

2.2.1.

Định nghĩa tập mờ 2.2.1.1

Tập mờ A xác định trên tập vũ trụ X là một tập mà mỗi phần tử của

Các hàm thuộc µA(x) có dạng “trơn” được gọi là hàm thuộc kiểu

S Đối với hàm thuộc kiểu S, do các công thức biểu diễn µA(x) có độ

Trang 22

phức tạp lớn nên thời gian tính độ phụ thuộc cho một phần tử lớn Trong

kỹ thuật điều khiển mờ thông thường, các hàm thuộc kiểu S thường được thay gần đúng bằng một hàm tuyến tính từng đoạn

Một hàm thuộc có dạng tuyến tính từng đoạn được gọi là hàm thuộc có mức chuyển đổi tuyến tính

Hình 2.1 Hàm thuộc µA( x) có mức chuyển đổi tuyến tính

Hàm thuộc như trên với m 1 = m 2 và m 3 = m 4 chính là hàm thuộc

của một tập vũ trụ

Ví dụ 2.1: Một tập mờ B của các số tự nhiên nhỏ hơn 5 với hàm

thuộc µ B (x) có dạng như Hình 2.2 định nghĩa trên tập vũ trụ X sẽ chứa các

Trang 23

µB(1) = µB(2) = 1, µB(3) = 0.95, µB(4) = 0.7

Những số không được liệt kê đều có độ phụ thuộc bằng 0

Ví dụ 2.2: Xét X là tập các giá trị trong thang điểm 10 đánh giá kết

quả học tập của học sinh về môn Toán, X = {1, 2, …, 10} Khi đó khái niệm mờ về năng lực học môn toán giỏi có thể được biểu thị bằng tập

Miền xác định: Biên giới tập mờ A, ký hiệu là supp(A), là tập rõ

gồm các phần tử của X có mức độ phụ thuộc của x vào tập mờ A lớn hơn

0

supp(A) = {x | µ A (x) > 0}

Miền tin cậy: Lõi tập mờ A, ký hiệu là core(A), là tập rõ gồm

các phần tử của X có mức độ phụ thuộc của x vào tập mờ A bằng 1 core(A) = {x | µ A (x) = 1}

Hình 2.3 Miền xác định và miền tin cậy của tập mờ A

Trang 24

Độ cao tập mờ: Độ cao tập mờ A, ký hiệu: h(A), là mức độ phụ

thuộc cao nhất của x vào tập mờ A

h(A) = sup µ A (x) x∈X

Một tập mờ có ít nhất một phần tử có độ phụ thuộc bằng 1 được

gọi là tập mờ chính tắc, tức là h(A) = 1, ngược lại một tập mờ A với h(A)

< 1 được gọi là tập mờ không chính tắc

Biểu diễn tập mờ: Tập mờ A trên tập vũ trụ X là tập mà các phần

tử x ∈ X với mức độ phụ thuộc của x vào tập mờ A tương ứng Có ba

phương pháp biểu diễn tập mờ: phương pháp ký hiệu, phương pháp tích phân và phương pháp đồ thị

Phương pháp ký hiệu: Liệt kê các phần tử và các thành viên tương ứng theo ký hiệu

Trang 25

µ C (x) = u (µ A (x), µ B (x))

Hình 2.4 Biểu diễn tập mờ chiều cao

Trang 26

µ I (x) = i (µ A (x), µ B (x))

Hình 2.6 Giao hai tập mờ có cùng tập vũ trụ Phần bù của một tập mờ

2.2.2.3

Cho tập mờ A trên tập vũ trụ X, tập mờ bù của A là tập mờ 𝐴, hàm thuộc µ A (x) được tính từ hàm thuộc µ A (x)

µ A (x) = 1 - µ A (x)

Trang 27

Nếu x 1 là A1 và x 2 là A2 và … và x n là An thì y là B

Trang 28

Trong đó, các x i là các biến ngôn ngữ (vì giá trị của nó là các ngôn ngữ được xem như là nhãn của các tập mờ) và A i là các tập mờ trên tập

vũ trụ X i của biến x i Hầu hết các phương pháp giải liên quan đến các luật

“nếu-thì” trên đều đòi hỏi việc tích hợp các dữ liệu trong phần tiền tố

“nếu” nhờ toán tử kết nhập, một trong những toán tử như vậy là lấy tích

Trang 29

Trong định nghĩa các phép tính hợp và giao trên tập mờ, chúng ta

đã sử dụng hai cặp phép tính 2-ngôi trên [0;1] là cặp min () và max (

) và cặp phép tính tích (.) a.b và tổng đại số () a b = a +b – a.b Bây giờ chúng ta sẽ đưa ra một họ các cặp t-norm và t-conorm

T-norms

2.2.3.1

Một hàm 2-biến T : [0;1] × [0;1] → [0;1] được gọi là phép t-norm nếu nó thỏa các tính chất sau  a, a’, b, c  [0;1]:

(T1) Tính chất điều kiện biên: T(a, 1) = a

(T2) Tính chất giao hoán: T(a, b) = T(b, a)

(T3) Tính chất đơn điệu: a  a’  T(a, b)  T(a’, b)

(T4) Tính chất kết hợp: T(T(a, b), c) = T(a, T(b, c))

Dễ dàng kiểm chứng phép min () và phép tích đại số (.) là các

Trang 30

phép t-norm Phép t-norm min () được gọi là phép giao mờ chuẩn

(S1) Tính chất giới nội : S(a, 0) = a

(S2) Tính chất giao hoán: S(a, b) = S(b, a)

(S3) Tính chất đơn điệu: a ≤ a’ => S(a, b) ≤S(a’, b)

Trang 31

1], ở đây μR(x, y) = R(x, y) là độ thuộc (membership degree) của (x, y) vào quan hệ R

Định nghĩa 2.2:

Cho R1và R2 là hai quan hệ mờ trên X×Y, ta có định nghĩa

1) Quan hệ R1∪R2 với μR1∪R2(x, y) = max {μR1(x, y), μR2(x, y)},

∀(x, y) ∈X×Y

2) Quan hệ R1∩R2 với μR1∩R2(x, y) = min {μR1(x, y), μR2(x, y)}

∀(x, y) ∈X×Y

Định nghĩa 2.3: Quan hệ mờ trên những tập mờ

Cho tập mờ A với μA(x) trên X, tập mờ B với μB(y) trên Y Quan

hệ mờ trên các tập mờ A và B là quan hệ mờ R trên X×Y thoả mãn điều kiện:

Hợp thành max-min (max-min composition) được xác định bởi

μR1oR2(x, z) = maxy{min(μR1(x, y), μR2(y, z))}, ∀(x, z)

∈X×Z

Hợp thành max-prod cho bởi

μR1oR2(x, z) = maxy{μR1(x, y).μR2(y, z)}∀(x, z) ∈X×Z

Trang 32

Hợp thành max-∗ được xác định bởi toán tử*: [0, 1]2→[0, 1]

μR1oR2(x, z) = maxy{μR1(x, y) * μR2(y, z)}∀(x, z) ∈X×Z Giả thiết (T, S, n) là bộ ba De Morgan, trong đó: T là T –norm, S

- Mờ hóa đơn trị (Singleton fuzzifier) Mờ hóa đơn trị là từ

Trang 33

các điểm giá trị thực x*∈ U lấy các giá trị đơn của tập mờ A

và hàm thuộc có dạng:

𝜇𝐴 = {10 các trường hợp khác nếu x = x*

- Mờ hóa Gaus (Gaussian fuzzifier) Mờ hóa Gaus là từ các điểm giá trị thực x* ∈U lấy các giá trị trong tập mờ

A với hàm thuộc Gaus

- Mờ hóa hình tam giác (Triangular fuzzifier) Mờ hóa hình tam giác là từ các điểm giá trị thực x* ∈U lấy các giá trị trong tập mờ A với hàm thuộc dạng hình tam giác (hoặc hình thang)

Ta thấy mờ hóa đơn trị cho phép tính toán về sau rất đơn giản nhưng không khử được nhiễu đầu vào, trong khi mờ hóa Gaus hoặc mờ hóa hình tam giác không những cho phép tính toán về sau tương đối đơn giản mà còn đồng thời có thể khử nhiễu đầu vào

Cơ sở luật

2.3.2.

Cơ sở luật (rule base) nơi chứa đựng tập các luật mờ IF-THEN,

thực chất là một tập các phát biểu hay quy tắc mà con người có thể hiểu được, mô tả hành vi của hệ thống, chẳng hạn:

"Nếu nhiệt độ là lạnh thì chỉnh nhiệt đầu ra lò sưởi cao"

"Nếu nhiệt độ là ấm thì chỉnh nhiệt đầu ra lò sưởi về zero"

Hai luật trên mô tả quan hệ điển hình giữa nhiệt độ phòng và nhiệt đầu ra tương ứng của lò sưởi

Một cách hình thức, với mô hình mờ n đầu vào - một đầu ra, mỗi

luật mờ có thể được mô tả như sau:

) (

ij IF x is A AND AND x is A THEN y is B

Trang 34

Trong đó, A i k n

k,  1 , , và j

B lần lượt là các giá trị ngôn ngữ được định nghĩa trên các biến đầu vào và đầu ra mô hình Phần giả thiết của luật được hình thành từ sự giao nhau (intersection) (thực hiện bởi phép hội mờ - fuzzy AND) giữa các phát biểu dạng ngôn ngữ ,

n k

A

is

x k k i,  1 , , , gọi là các tiền đề thành phần Phần kết luận của luật được ánh xạ từ phần giả thiết thông qua phép kéo theo mờ (IF ( ) THEN ( )) Tương ứng với mỗi luật, ta có một độ tin cậy luật c ij  [ 0 0 ; 1 0 ] Độ tin cậy của luật phản ánh tính đúng đắn của luật, c ij 0chứng tỏ luật không tham gia vào việc xác định đầu ra của mô hình Mỗi cơ sở luật là

sự kết hợp (union) (bằng phép tuyển mờ - fuzzy OR) của tất cả các luật

mờ

Các luật có thể được hình thành từ tri thức của chuyên gia con người hoặc rút ra từ các mẫu thực nghiệm Cơ sở luật là thành phần quan trọng nhất của bất kỳ mô hình mờ nào

Nếu thay phép min (˄) trong công thức 2.1 bằng một phép t-norm

T nào đó, ta có quy tắc suy luận hợp thành max-T được ký hiệu là oT tức là:

𝜇𝐵′(˅′) = ˅𝑢′ ∈𝑈𝑇(𝜇𝐴′(𝑢′), 𝜇𝑅(𝑢′, ˅′)), ∀ ˅′ ∈ 𝑉 (2.3)

Trang 35

Căn cứ theo những quan niệm khác nhau về phần tử đại diện xứng đáng mà ta sẽ có các phương pháp giải mờ khác nhau Trong điều khiển người ta thường dùng hai phương pháp chính:

o Phương pháp điểm cực đại

o Phương pháp điểm trọng tâm

* Phương pháp điểm cực đại (LOM)

Tư tưởng chính của phương pháp giải mờ điểm cực đại là tìm trong tập mờ có hàm thuộc 𝜇𝑅( y), một phần tử y0 với độ phụ thuộc lớn

nhất, tức là:

𝑦0 = arg max

Tuy nhiên, việc tìm y0 theo công thức (2.4) có thể đưa đến vô số

nghiệm (hình 2.9b), nên ta phải đưa thêm những yêu cầu cho phép chọn

trong số các nghiệm đó một giá trị y0 cụ thể chấp nhận được Việc giải

mờ theo phương pháp cực đại gồm hai bước:

Trang 36

- Xác định miền chứa giá trị rõ y0 Giá trị rõ y0 là giá trị mà tại đó hàm thuộc đạt giá trị cực đại (bằng độ thỏa mãn đầu vào H), tức là miền:

Nếu các hàm thuộc đều có dạng hình tam giác hoặc hình thang thì

điểm y0 xác định theo phương pháp này sẽ không quá bị nhạy cảm với

sự thay đổi của giá trị đầu vào rõ x0 Do đó rất thích hợp với các bài toán

có nhiễu biên độ nhỏ tại đầu vào

2/ Xác định điểm cận trái hoặc phải

𝑦0 = inf𝑦∈𝐺(𝑦) hoặc 𝑦0 = sup𝑦∈𝐺(𝑦)

Nếu các hàm thuộc đều có dạng hình tam giác hoặc hình thang thì

điểm y0 sẽ phụ thuộc tuyến tính vào giá trị rõ x0 tại đầu vào

Hình 2.8 Giải mờ bằng phương pháp điểm cực đại

* Phương pháp điểm trọng tâm (Centroid)

Trang 37

Phương pháp điểm trọng tâm sẽ cho kết quả y0 là hoành độ của

điểm trọng tâm, miền được bao phủ bởi trục hoành và đường µR (y) - Hình

2.9a Phương pháp điểm trọng tâm xuất phát từ ý tưởng mọi giá trị của S

đều được đóng góp với trọng số vào việc xác định giá trị khử mờ của tập

mờ R, ở đây trọng số của nó là độ thuộc của phần tử vào tập mờ R Theo

nghĩa thông thường của trọng tâm, công thức tính giá trị khử mờ có dạng sau:

Với S = sup µ R (y) = {y | µ R (y) ≠ 0} là miền xác định của tập mờ R

Đây là phương pháp ưa được sử dụng nhất Nó cho phép ta xác

định giá trị y0 với sự tham gia của tất cả các tập mờ đầu ra của luật điều

khiển một cách bình đẳng và chính xác Tuy nhiên, phương pháp này lại không để ý được tới độ thỏa mãn của mệnh đề điều khiển cũng như thời gian tính lâu Ngoài ra một trong những nhược điểm cơ bản của phương

pháp này là giá trị y0 xác định được lại có độ thuộc nhỏ nhất, thậm chí bằng 0 (hình 2.10b)

Trang 38

Hình 2.9 Giải mờ bằng phương pháp điểm trọng tâm

dữ kiện đòi hỏi có độ chính xác cao và là tiền đề cho việc suy luận

Cơ chế suy diễn và phương pháp giải mờ hiện tại đang theo nhiều hướng gây phân vân trong quá trình lựa chọn

2.5 Kết luận chương 2

Chương 2 đã trình bày được toàn bộ cơ sở lý thuyết trên tập mờ

Từ đó làm nền tảng xây dựng nên hệ logic mờ Chương tiếp theo sẽ ứng dụng hệ logic vào bài toán thực tế

Trang 39

CHƯƠNG 3 XÂY DỰNG HỆ LOGIC MỜ DỰ BÁO

THỜI GIAN SỐNG CỦA BỆNH NHÂN VIÊM TỦY

Trong chương 3, sẽ tập trung giải quyết các vấn đề sau: Bắt đầu bằng việc giới thiệu phương pháp xây dựng cơ sở luật của Wang – Mengdel dựa trên bộ dữ liệu huấn luyện sẵn có; Tiếp theo, xây dựng các hàm thuộc căn cứ trên dữ liệu huấn luyện, cách sử dụng các phép giao (T- norm), phép hội (T – conorm), phép mờ hóa và giải mờ thích hợp đối với bài toán

3.2 Xây dựng cơ sở luật từ dữ liệu bằng phương pháp của Wang – Mendel

Theo phương pháp của Wang – Mendel [10], để góp phần quyết định được tính chất thành công của hệ logic mờ thì ta cần xác định được các luật Đây là cơ sở để đưa ra những phán đoán, xử lý chính xác từ dữ kiện đầu vào Hiện tại có 2 loại để đưa ra một cơ sở các luật:

- Dựa vào kinh nghiệm của chuyên gia

- Dựa vào kết quả phân tích của các cặp dữ liệu đầu vào – đầu ra

Những chuyên gia có kinh nghiệm sẽ căn cứ vào các tình trạng và

Định dạng
Số trang	79
Dung lượng	1,58 MB