Với các mô tả không chắc chắn và số liệu đôi khi có độ lệch thì việc nghiên cứu và ứng dụng Logic mờ trong bài toán chuẩn đoán hoặc dự báo sẽ mang lại nhiều kết quả thực tiễn.. Bài toán
Trang 1VÕ DUY THANH
HỆ LOGIC MỜ VỚI BÀI TOÁN DỰ BÁO TRONG Y HỌC
Chuyên ngành: Công nghệ thông tin
Mã số: 60.48.02.01
LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN
NGHỆ AN, 2017
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC VINH
VÕ DUY THANH
HỆ LOGIC MỜ VỚI BÀI TOÁN DỰ BÁO TRONG Y HỌC
Chuyên ngành: Công nghệ thông tin
Mã số: 60.48.02.01
LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN
Người hướng dẫn: TS Phan Anh Phong
NGHỆ AN, 2017
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi Các
số liệu và kết quả nghiên cứu trong luận văn là trung thực và chưa hề được sử dụng để bảo vệ một học vị nào Các thông tin được lược trích từ nguồn tài liệu chính thống và được chỉ rõ nguồn gốc rõ ràng Nếu sai tôi hoàn toàn chịu trách nhiệm
Tác giả luận văn
Võ Duy Thanh
Trang 4LỜI CẢM ƠN
Đầu tiên, tôi xin gửi lời cảm ơn sâu sắc nhất đến nhà khoa học TS
Phan Anh Phong, thầy đã tận tình chỉ bảo, giúp đỡ, định hướng và tạo
điều kiện cho tôi hoàn thành luận văn này
Tôi xin trân trọng cảm ơn sự giúp đỡ của các nhà khoa học, thầy,
cô trường Đại học Vinh, Trường Đại học Đồng Tháp đã giảng dạy,
truyền đạt kiến thức và hỗ trợ các điều kiện học tập cho tôi
Mặc dù, tác giả đã nỗ lực và cố gắng để hoàn thành luận văn,
nhưng do trình độ và kinh nghiệm trong nghiên cứu khoa học còn hạn
chế Nên chắc chắn luận văn này không tránh khỏi những thiếu sót Tác
giả kính mong nhận được sự đóng góp và chỉ dẫn của các nhà khoa học,
bạn bè, đồng nghiệp giúp cho luận văn được hoàn thiện hơn
Để có được kết quả như hôm nay, tôi cũng xin tỏ lòng biết ơn đến
gia đình, bạn bè, đồng nghiệp đã động viên, giúp đỡ, chia sẻ những khó
khăn để tôi hoàn thành nhiệm vụ học tập, nghiên cứu của mình
Xin chân thành cảm ơn!
Nghệ An, ngày……tháng……năm 2017
Học viên thực hiện
Võ Duy Thanh
Trang 5MỤC LỤC
LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
MỤC LỤC iii
DANH MỤC CÁC TỪ VIẾT TẮT vi
DANH MỤC HÌNH vii
DANH MỤC BẢNG ix
MỞ ĐẦU 1
1 Sự cần thiết của vấn đề nghiên cứu 1
2 Lịch sử của vấn đề nghiên cứu: 2
3 Mục tiêu nghiên cứu 2
4 Đối tượng và phạm vi nghiên cứu 2
5 Nội dung nghiên cứu 3
6 Đóng góp của luận văn 3
7 Kết cấu của luận văn 3
Chương 1 GIỚI THIỆU BÀI TOÁN DỰ BÁO TRONG Y HỌC 5
1.1 Đặt vấn đề 5
1.2 Các nghiên cứu liên quan đến bài toán dự báo trong y học 7
1.3 Bài toán dự báo bệnh nhân viêm tủy 8
Bài toán 8
1.3.1. Các tiếp cận nghiên cứu và kết quả đạt được 9
1.3.2. 1.4 Kết luận chương 1 9
Chương 2 TỔNG QUAN VỀ TẬP MỜ VÀ HỆ LOGIC MỜ 10
Trang 62.1 Đặt vấn đề 102.2 Lý thuyết tập mờ 10
Các khái niệm cơ bản 10
Chương 3 XÂY DỰNG HỆ LOGIC MỜ DỰ BÁO THỜI GIAN SỐNG CỦA BỆNH NHÂN VIÊM TỦY 28
3.1 Đặt vấn đề 283.2 Xây dựng cơ sở luật từ dữ liệu bằng phương pháp của Wang –
3.3 Thiết kế hệ logic mờ cho bài toán dự báo 35
Xác định các thuộc tính của mô hình và các giá trị ngôn ngữ 35
Trang 7Chương 4 NÂNG CAO HIỆU QUẢ DỰ BÁO CỦA HỆ MỜ VỚI
THUẬT TOÁN TỐI ƯU HÓA BẦY ĐÀN 49
4.1 Đặt vấn đề 49
4.2 Giải thuật tối ưu hóa bầy đàn (PSO) 49
Tổng quan giải thuật PSO 49
4.2.1. Các bước thực hiện của giải thuật 50
4.2.2. Hạn chế của PSO 52
4.2.3. 4.3 Áp dụng giải thuật tối ưu hóa bầy đàn 52
Hàm mục tiêu 53
4.3.1. Biểu biến cá thể: 55
4.3.2. Khởi tạo quần thể 55
4.3.3. 4.4 Kết quả thử nghiệm 55
4.5 Kiểm tra kết quả dự báo của hệ mờ đề xuất với Tool box của Matlab 56
4.6 Kết luận chương 4 62
KẾT LUẬN 63
TÀI LIỆU THAM KHẢO 64
Phụ lục 66
Trang 8DANH MỤC CÁC TỪ VIẾT TẮT Các chữ viết tắt: Giải nghĩa
PSO Particle Swarm Optimization MISO Multi Input Single Output
MIMO Multi Input Multi Output
GA Genetic AlgorithmLOM Largest of MaximumMOM Middle of MaximumSOM Smallest of Maximum
Trang 9DANH MỤC HÌNH
Hình 2.1 Hàm thuộc µA( x) có mức chuyển đổi tuyến tính 11
Hình 2.2 Hàm thuộc của tập B 11
Hình 2.3 Miền xác định và miền tin cậy của tập mờ A 12
Hình 2.4 Biểu diễn tập mờ chiều cao 14
Hình 2.5 Hợp hai tập mờ có cùng tập vũ trụ 14
Hình 2.6 Giao hai tập mờ có cùng tập vũ trụ 15
Hình 2.7 Tập bù A của tập mờ A 16
Hình 2.8 Giải mờ bằng phương pháp điểm cực đại 25
Hình 2.9 Giải mờ bằng phương pháp điểm trọng tâm 27
Hình 3.1 Biểu diễn hàm thuộc cho các thuộc tính x1, x2, y 34
Hình 3.2 Sơ đồ thuật toán xây dựng hệ mờ 36
Hình 3.3 Tập tham số của các hàm thuộc cho biến ngôn ngữ LogBun 38 Hình 3.4 Tập tham số của các hàm thuộc cho biến ngôn ngữ HGB 39
Hình 3.5 Tập tham số của các hàm thuộc cho biến ngôn ngữ LogTime 40 Hình 3.6 Mô hình của hệ thống 41
Hình 3.7 Suy diễn và giải mờ dựa trên cơ sở luật 44
Hình 3.8 Đồ thị biểu thị kết quả tìm được từ hệ mờ và kết quả thực tế 46 Hình 4.1 Sơ đồ giải thuật PSO áp dụng cho tối ưu tham số hàm thuộc của hệ logic mờ 54
Hình 4.2 Mô hình hệ thống 57 Hình 4.3 Thiết lập các tham số cho các giá trị ngôn ngữ của biến ngôn
Trang 10ngữ LogBun 58Hình 4.4 Thiết lập các tham số cho các giá trị ngôn ngữ của biến ngôn ngữ HGB 58Hình 4.5 Thiết lập các tham số cho các giá trị ngôn ngữ của biến ngôn ngữ LogTime 59Hình 4.6 Thêm vào tập cơ sở các luật 59Hình 4.7 Tính kết quả với đầu vào của bản ghi 19 trong bộ dữ liệu kiểm tra 60Hình 4.8 Đồ thị biểu thị kết quả tìm được từ hệ mờ và kết quả thực tế 61
Trang 11DANH MỤC BẢNG
Bảng 3.1 Tham số của các hàm thuộc cho thuộc tính LogBun 40Bảng 3.2 Tham số của các hàm thuộc cho thuộc tính HGB 40Bảng 3.3 Tham số của các hàm thuộc cho thuộc tính LogTime 40Bảng 3.4 Tập luật và trọng số mỗi luật tương ứng với các bảng ghi trong
bộ dữ liệu huấn luyện 42Bảng 3.5 Cơ sở luật xây dựng bằng phương pháp của Wang và Mendel trong trường hợp chưa tối ưu các tham số của hàm thuộc 43Bảng 3.6 Kết quả dữ liệu LogTime tìm được của hệ mờ và dữ liệu mẫu45Bảng 4.1 Tham số của các hàm thuộc cho thuộc tính LogBun 55Bảng 4.2 Tham số của các hàm thuộc cho thuộc tính HGB 56Bảng 4.3 Tham số của các hàm thuộc cho thuộc tính LogTime 56Bảng 4.4 Cơ sở luật xây dựng bằng phương pháp của Wang và Mendel trong trường hợp đã tối ưu các tham số của hàm thuộc 56Bảng 4.5 Kết quả dữ liệu LogTime tìm được của hệ mờ và dữ liệu mẫu60
Trang 12MỞ ĐẦU
1 Sự cần thiết của vấn đề nghiên cứu
Chuẩn đoán, dự báo về tình trạng sức khỏe của người bệnh trong y học là một lĩnh vực tương đối phức tạp Đối tượng của lĩnh vực này là những bệnh nhân, những con người thực sự Đó là những thực thể sống được tổ chức rất phức tạp về mặt sinh học kèm theo đó là hàng loạt những quá trình sống tác động qua lại, ảnh hưởng lẫn nhau Những quá trình này luôn bị chi phối bởi điều kiện môi trường như: xuất hiện đối kháng mới, mầm bệnh, nguồn bệnh Kiến thức y học cũng khá phức tạp Để tìm ra những đáp án cho tình trạng bệnh, bằng kinh nghiệm và kiến thức người bác sĩ phải dựa trên sự mô tả về bệnh án và các số liệu xét nghiệm để đưa ra đáp án có độ chính xác cao nhất Với các mô tả không chắc chắn và số liệu đôi khi có độ lệch thì việc nghiên cứu và ứng dụng Logic mờ trong bài toán chuẩn đoán hoặc dự báo sẽ mang lại nhiều kết quả thực tiễn
Bài toán dự báo thời gian sống của bệnh nhân viêm tủy là bài toán căn cứ vào các số liệu xét nghiệm liên quan đến công thức máu và một
số dữ liệu khác để đưa ra kết quả về thời gian còn sống của người bệnh
về tủy Do trong lĩnh vực y tế phần lớn các thông tin được phát biểu bằng ngôn ngữ mờ và không chắc chắn Vì vậy, việc nghiên cứu và xây dựng một hệ chuyên gia dùng để thu thập, phân tích dữ liệu và đưa ra những dự báo một cách đúng nhất sẽ hỗ trợ rất nhiều cho việc xây dựng phác đồ điều trị cho bệnh nhân
Logic mờ được công bố lần đầu tiên tại Mỹ vào năm 1965 do giáo
sư Lotfi Zadeh Kể từ đó, logic mờ đã có nhiều phát triển qua các chặng đường sau: phát minh ở Mỹ, áp dụng ở Châu Âu và đưa vào các sản
Trang 13phẩm thương mại ở Nhật Với đầu vào là những dữ liệu không chắc chắn, nhiều nghiên cứu và ứng dụng thành công về Logic mờ như: Hệ thống hỗ trợ điều kiển xe ôtô, hệ thống điều khiển máy giặt, hệ thống dự báo về lượng nước mưa…Như vậy ngoài cách dự báo bằng kỹ thuật hồi quy thì logic mờ còn là một cách tiếp cận mới và đặt biệt phù hợp với những dữ liệu đầu vào chưa rõ
Xuất phát từ nhu cầu đưa ra một dự báo có tính đúng nhất về thời gian còn sống của người bệnh viêm tủy căn cứ vào các mô tả, dấu hiệu
và các số liệu xét nghiệm có độ sai lệch Đó là lý do tôi chọn đề tài “Hệ logic mờ với bài toán dự báo trong y học” nhằm tìm hiểu logic mờ, xem
xét hiệu quả của logic mờ khi ứng dụng vào bài toán dự báo và thử nghiệm các phương pháp tối ưu để nâng cao độ chính xác của dự báo
2 Lịch sử của vấn đề nghiên cứu:
Bài toán đã được xây dựng bằng phương pháp hồi quy [13], hệ mờ loại khoảng thống kê [14] và hệ mờ loại hai đại số gia tử [3]
3 Mục tiêu nghiên cứu
Nghiên cứu về lý thuyết tập mờ và thuật toán tối ưu hóa bầy đàn
để ứng dụng cho mô hình dự báo sử dụng tập mờ
4 Đối tượng và phạm vi nghiên cứu
4.1 Đối tượng nghiên cứu
Trang 14Nghiên cứu hệ logic mờ và ứng dụng vào bài toán dự báo thời gian sống của bệnh nhân viêm tủy
5 Nội dung nghiên cứu
Khảo sát các ứng dụng dự báo sử dụng logic mờ từ đó xác định được ưu điểm và nhược điểm của hệ thống
Nghiên cứu ngôn ngữ lập trình Matlab để cài đặt mô phỏng các giải thuật trên máy tính
Nghiên cứu hệ logic mờ
Nghiên cứu xây dựng bộ luật cho hệ mờ từ dữ liệu mẫu
Nghiên cứu giải thuật tối ưu hóa bầy đàn
Lập trình cho bài toán dự báo trong y học bằng hệ mờ
6 Đóng góp của luận văn
Luận văn sẽ cung cấp cách tiếp cận việc xây dựng cơ sở luật từ dữ liệu
Ứng dụng giải thuật tối ưu hóa bầy đàn, một giải thuật còn nhiều mới mẻ vào việc tối ưu các tham số của bài toán
7 Kết cấu của luận văn
Ngoài phần mở đầu và kết luận bố cục của luận văn bao gồm 4 chương như sau:
Chương 1: Giới thiệu bài toán dự báo trong y học
Chương 2: Tổng quan về tập mờ và hệ logic mờ
Chương 3: Xây dựng hệ logic mờ dự báo thời gian sống của bệnh nhân viêm tủy
Trang 15Chương 4: Nâng cao hiệu quả dự báo của hệ mờ với thuật toán tối
ưu hóa bầy đàn
Trang 16CHƯƠNG 1 GIỚI THIỆU BÀI TOÁN DỰ BÁO TRONG Y HỌC 1.1 Đặt vấn đề
Trong nền y học hiện nay, việc chuẩn đoán hay dự báo chính xác tình trạng bệnh sẽ góp phần không nhỏ cho quá trình theo dõi và điều trị
Thông qua việc phân tích các thông tin y tế, hồ sơ bệnh án, quá trình xét nghiệm, khám bệnh, thông tin bác sĩ điều trị… sẽ đưa ra thông tin kịp thời về nhu cầu của bệnh nhân, báo cáo dự đoán
Hiện tại một số hệ thống đã được xây dựng để phục vụ trong lĩnh vực y học như: các phần mềm của IBM (gồm có phần mềm NEXT dự báo và phân loại bệnh thận, phần mềm HYCONES dự báo và phân loại bệnh tim), phần mềm phân tích của SAS/STAS, phần mềm của dự đoán bệnh từ xa Intouch Health Về cơ bản các hệ thống này đã được triển khai và ứng dụng thành công trong các trường hợp nhất định góp phần
hỗ trợ cho bác sĩ và nâng cao chất lượng cuộc sống cho người bệnh Việc khai phá dữ liệu và các phân tích dự báo đang giúp các bác sĩ chăm sóc y
tế tạo ra các biện pháp điều trị hợp lý cho các nhóm người khác nhau Ví
dụ, trong trường hợp của bệnh tim mạch, nhờ bắt tay làm việc chặt chẽ với các bệnh nhân được xác định bằng một giải pháp dự báo là có nguy
cơ cao, các biện pháp phòng ngừa đơn giản có thể được thực hiện như cắt giảm lượng chất béo bão hòa vào cơ thể, giảm cân và bỏ hút thuốc lá,
có thể làm giảm đáng kể nguy cơ của một cơn đau tim Theo cách này, các bác sĩ chăm sóc y tế có thể đưa ra những hướng dẫn khác nhau để giữ cho bệnh nhân có nguy cơ thấp vẫn giữ ở mức nguy cơ thấp, trong khi giảm thiểu các nguy cơ liên quan đến các bệnh nhân có nguy cơ cao
Ngoài những căn bệnh nguy hiểm thường được biết đến như bệnh
Trang 17về các chức năng gan, thận… một trong số những căn bệnh không kém phần quan trọng quyết định đến thể trạng và sinh mạng của người bệnh
đó là căn bệnh viêm tủy Căn bệnh này tiến triển nhanh chóng hàng ngày hàng giờ lan dần từ thấp lên cao và có thể tổn thương lên não, gây tử vong nhanh Như vậy việc cần thiết là phải có một dự báo chính xác về thời gian sống của bệnh nhân để đưa ra những phương pháp xử lý theo đúng định hướng trong điều trị Tuy nhiên, hiện nay đối với một bài toán
dự báo việc đưa ra kết quả dự báo có tính chính xác còn gặp phải những thách thức sau:
Đầu tiên, để xây dựng một mô hình dự báo, trước tiên bạn cần phải chuẩn bị các dữ liệu sẽ được sử dụng để huấn luyện Để làm điều đó, một tập hợp các thuộc tính đại diện cho một đối tượng được tổ chức lại với nhau thành một bản ghi Khi tất cả các bản ghi được tập hợp với nhau, chúng trở thành một tập dữ liệu có thể chứa hàng triệu bản ghi Việc cần thiết là phải lựa chọn trong tập hợp các thuộc tính của đối tượng cần phân tích những thuộc tính nào có ảnh hưởng lớn nhất, quyết định đến kết quả
dự đoán và số lượng thuộc tính cần sử dụng là bao nhiêu để đem lại hiệu quả dự đoán tốt nhất
Tiếp theo, cần phải kết hợp dữ liệu và một mô hình toán học để từ
đó làm nền tảng cho cơ sở lập luận Hiện nay một số phương pháp mô hình hóa bài toán bao gồm: hồi quy, xác suất, mạng nơ ron, lan truyền-ngược, máy véc tơ hỗ trợ, cây quyết định, phân cụm, hệ logic mờ… Mỗi một mô hình kể trên đều có những ưu điểm và hạn chế riêng Như vậy, vấn đề đặt ra là lựa chọn một mô hình phù hợp đối với bài toán
Kế đến, trên cơ sở mô hình được chọn cần tìm ra những tham số thích hợp cho việc xây dựng mô hình bài toán Trong bước này các kỹ
Trang 18thuật tối ưu sẽ mang tính chất quyết định đầu ra dựa vào việc tìm kiếm nghiệm cho các tham số
Cuối cùng, một vấn đề quan trọng quyết định lớn nhất đến kết quả bài toán đó chính là bộ dữ liệu thí nghiệm bị nhiễu khi thu thập Ta nhận thấy việc đầu tiên là nếu không có bộ dữ liệu thì sẽ không có cơ sở để phân tích và cũng không thể nào phân tích dự báo Đối với một số mô hình dự báo để có thể học và tổng quát hóa, phải cần đến hàng ngàn bản ghi hoặc nhiều hơn Nếu dữ liệu không đủ cho việc huấn luyện một mô hình, có thể không có khả năng phân tích một cách tổng quát Nếu dữ liệu có sẵn đã đủ cho việc phân tích, thì tiếp theo là vấn đề dữ liệu tốt đến mức nào Chất lượng của dữ liệu sẽ trực tiếp phản ánh vào chất lượng của mô hình dự báo Có thể nói rằng, chất lượng đầu ra của dự báo dựa vào chất lượng của dữ liệu đầu vào
Đối với bệnh nhân viêm tủy, một căn bệnh nguy hiểm đến tính mạng, việc dự báo thời gian sống chính xác sẽ hỗ trợ cho phác đồ điều trị của bác sĩ và việc chuẩn bị tâm lý của bệnh nhân Trong phần 1.3 sẽ trình bày cụ thể hơn về bài toán này
1.2 Các nghiên cứu liên quan đến bài toán dự báo trong y học
Hiện nay một số hệ thống dự báovề lĩnh vực y học đã được nghiên cứu như:
- Hệ thống chuẩn đoán dựa trên phần mềm phân tích số liệu SAS/STAT [13]
- Hệ thống dự đoán bệnh lâm sàng của Y Zhang và Y Zhao [14]
- Ví dụ về bài toán dự báo trong tài liệu tham khảo tập mờ loại 2 đại số gia tử của TS Phan Anh Phong [3]
Trang 19- Hệ thống chuẩn đoán bệnh tâm thần [5]
- Hệ thống chuẩn đoán bệnh đau co thắt ngực [4]
1.3 Bài toán dự báo bệnh nhân viêm tủy
Mặc dù các tham số trong bài toán trên đều liên quan đến thời gian sống của bệnh nhân nhưng trong các nghiên cứu, hai nhân tố có ảnh hưởng lớn nhất là LOGBUN và HGB Vì vậy, khi thiết kế hệ lôgic mờ,
ta chọn 2 tham số này làm 2 đầu vào, và đầu ra là log thời gian sống của các bệnh nhân
Dữ liệu được lấy từ User’s Guide The PHREG Procedure 2008,
Trang 20sau đó tính logarit cơ số 10 của hai tham số BUN và TIME, chi tiết về bộ
dữ liệu được trình bày trong [phụ lục 1]
Các tiếp cận nghiên cứu và kết quả đạt được
1.3.2.
Trong các nghiên cứu đã kể ở phần 1.2 nhiều phương pháp đã được ứng dụng như: kỹ thuật phân tích hồi quy, hệ mờ loại 1, hệ mờ lại 2 khoảng thống kê, hệ mờ loại 2 đại số gia tử Bên cạnh đó 2 phương pháp
sử dụng hệ mờ này đều dùng giải thuật di truyền (GA) dùng để tối ưu các tham số của hệ mờ Các kỹ thuật hồi quy đòi hỏi phải tìm một hàm biểu diễn phù hợp, trong khi đó khó tìm được hàm cho kết quả chuẩn xác Các phương pháp áp dụng hệ logic mờ về cơ bản đã thể hiện được tổng quan bài toán Trong đó các phương pháp sử dụng hệ mờ loại 2 đã đem đến 1 số kết quả dự đoán như mong đợi
Trang 21CHƯƠNG 2 TỔNG QUAN VỀ TẬP MỜ VÀ HỆ LOGIC MỜ
2.1 Đặt vấn đề
Chương này sẽ nhắc lại các khái niệm về tập mờ, các phép toán hỗ trợ cho việc thực hiện tính toán trên tập mờ, về quan hệ mờ, và các phép hợp thành Từ đó để làm cơ sở để tìm hiểu cách xây dựng hệ logic mờ [1,7,11]
2.2 Lý thuyết tập mờ
Các khái niệm cơ bản
2.2.1.
Định nghĩa tập mờ 2.2.1.1
Tập mờ A xác định trên tập vũ trụ X là một tập mà mỗi phần tử của
Các hàm thuộc µA(x) có dạng “trơn” được gọi là hàm thuộc kiểu
S Đối với hàm thuộc kiểu S, do các công thức biểu diễn µA(x) có độ
Trang 22phức tạp lớn nên thời gian tính độ phụ thuộc cho một phần tử lớn Trong
kỹ thuật điều khiển mờ thông thường, các hàm thuộc kiểu S thường được thay gần đúng bằng một hàm tuyến tính từng đoạn
Một hàm thuộc có dạng tuyến tính từng đoạn được gọi là hàm thuộc có mức chuyển đổi tuyến tính
Hình 2.1 Hàm thuộc µA( x) có mức chuyển đổi tuyến tính
Hàm thuộc như trên với m 1 = m 2 và m 3 = m 4 chính là hàm thuộc
của một tập vũ trụ
Ví dụ 2.1: Một tập mờ B của các số tự nhiên nhỏ hơn 5 với hàm
thuộc µ B (x) có dạng như Hình 2.2 định nghĩa trên tập vũ trụ X sẽ chứa các
Trang 23µB(1) = µB(2) = 1, µB(3) = 0.95, µB(4) = 0.7
Những số không được liệt kê đều có độ phụ thuộc bằng 0
Ví dụ 2.2: Xét X là tập các giá trị trong thang điểm 10 đánh giá kết
quả học tập của học sinh về môn Toán, X = {1, 2, …, 10} Khi đó khái niệm mờ về năng lực học môn toán giỏi có thể được biểu thị bằng tập
Miền xác định: Biên giới tập mờ A, ký hiệu là supp(A), là tập rõ
gồm các phần tử của X có mức độ phụ thuộc của x vào tập mờ A lớn hơn
0
supp(A) = {x | µ A (x) > 0}
Miền tin cậy: Lõi tập mờ A, ký hiệu là core(A), là tập rõ gồm
các phần tử của X có mức độ phụ thuộc của x vào tập mờ A bằng 1 core(A) = {x | µ A (x) = 1}
Hình 2.3 Miền xác định và miền tin cậy của tập mờ A
Trang 24Độ cao tập mờ: Độ cao tập mờ A, ký hiệu: h(A), là mức độ phụ
thuộc cao nhất của x vào tập mờ A
h(A) = sup µ A (x) x∈X
Một tập mờ có ít nhất một phần tử có độ phụ thuộc bằng 1 được
gọi là tập mờ chính tắc, tức là h(A) = 1, ngược lại một tập mờ A với h(A)
< 1 được gọi là tập mờ không chính tắc
Biểu diễn tập mờ: Tập mờ A trên tập vũ trụ X là tập mà các phần
tử x ∈ X với mức độ phụ thuộc của x vào tập mờ A tương ứng Có ba
phương pháp biểu diễn tập mờ: phương pháp ký hiệu, phương pháp tích phân và phương pháp đồ thị
Phương pháp ký hiệu: Liệt kê các phần tử và các thành viên tương ứng theo ký hiệu
Trang 25µ C (x) = u (µ A (x), µ B (x))
Hình 2.4 Biểu diễn tập mờ chiều cao
Trang 26µ I (x) = i (µ A (x), µ B (x))
Hình 2.6 Giao hai tập mờ có cùng tập vũ trụ Phần bù của một tập mờ
2.2.2.3
Cho tập mờ A trên tập vũ trụ X, tập mờ bù của A là tập mờ 𝐴, hàm thuộc µ A (x) được tính từ hàm thuộc µ A (x)
µ A (x) = 1 - µ A (x)
Trang 27Nếu x 1 là A1 và x 2 là A2 và … và x n là An thì y là B
Trang 28Trong đó, các x i là các biến ngôn ngữ (vì giá trị của nó là các ngôn ngữ được xem như là nhãn của các tập mờ) và A i là các tập mờ trên tập
vũ trụ X i của biến x i Hầu hết các phương pháp giải liên quan đến các luật
“nếu-thì” trên đều đòi hỏi việc tích hợp các dữ liệu trong phần tiền tố
“nếu” nhờ toán tử kết nhập, một trong những toán tử như vậy là lấy tích
Trang 29Trong định nghĩa các phép tính hợp và giao trên tập mờ, chúng ta
đã sử dụng hai cặp phép tính 2-ngôi trên [0;1] là cặp min () và max (
) và cặp phép tính tích (.) a.b và tổng đại số () a b = a +b – a.b Bây giờ chúng ta sẽ đưa ra một họ các cặp t-norm và t-conorm
T-norms
2.2.3.1
Một hàm 2-biến T : [0;1] × [0;1] → [0;1] được gọi là phép t-norm nếu nó thỏa các tính chất sau a, a’, b, c [0;1]:
(T1) Tính chất điều kiện biên: T(a, 1) = a
(T2) Tính chất giao hoán: T(a, b) = T(b, a)
(T3) Tính chất đơn điệu: a a’ T(a, b) T(a’, b)
(T4) Tính chất kết hợp: T(T(a, b), c) = T(a, T(b, c))
Dễ dàng kiểm chứng phép min () và phép tích đại số (.) là các
Trang 30phép t-norm Phép t-norm min () được gọi là phép giao mờ chuẩn
(S1) Tính chất giới nội : S(a, 0) = a
(S2) Tính chất giao hoán: S(a, b) = S(b, a)
(S3) Tính chất đơn điệu: a ≤ a’ => S(a, b) ≤S(a’, b)
Trang 311], ở đây μR(x, y) = R(x, y) là độ thuộc (membership degree) của (x, y) vào quan hệ R
Định nghĩa 2.2:
Cho R1và R2 là hai quan hệ mờ trên X×Y, ta có định nghĩa
1) Quan hệ R1∪R2 với μR1∪R2(x, y) = max {μR1(x, y), μR2(x, y)},
∀(x, y) ∈X×Y
2) Quan hệ R1∩R2 với μR1∩R2(x, y) = min {μR1(x, y), μR2(x, y)}
∀(x, y) ∈X×Y
Định nghĩa 2.3: Quan hệ mờ trên những tập mờ
Cho tập mờ A với μA(x) trên X, tập mờ B với μB(y) trên Y Quan
hệ mờ trên các tập mờ A và B là quan hệ mờ R trên X×Y thoả mãn điều kiện:
Hợp thành max-min (max-min composition) được xác định bởi
μR1oR2(x, z) = maxy{min(μR1(x, y), μR2(y, z))}, ∀(x, z)
∈X×Z
Hợp thành max-prod cho bởi
μR1oR2(x, z) = maxy{μR1(x, y).μR2(y, z)}∀(x, z) ∈X×Z
Trang 32Hợp thành max-∗ được xác định bởi toán tử*: [0, 1]2→[0, 1]
μR1oR2(x, z) = maxy{μR1(x, y) * μR2(y, z)}∀(x, z) ∈X×Z Giả thiết (T, S, n) là bộ ba De Morgan, trong đó: T là T –norm, S
- Mờ hóa đơn trị (Singleton fuzzifier) Mờ hóa đơn trị là từ
Trang 33các điểm giá trị thực x*∈ U lấy các giá trị đơn của tập mờ A
và hàm thuộc có dạng:
𝜇𝐴 = {10 các trường hợp khác nếu x = x*
- Mờ hóa Gaus (Gaussian fuzzifier) Mờ hóa Gaus là từ các điểm giá trị thực x* ∈U lấy các giá trị trong tập mờ
A với hàm thuộc Gaus
- Mờ hóa hình tam giác (Triangular fuzzifier) Mờ hóa hình tam giác là từ các điểm giá trị thực x* ∈U lấy các giá trị trong tập mờ A với hàm thuộc dạng hình tam giác (hoặc hình thang)
Ta thấy mờ hóa đơn trị cho phép tính toán về sau rất đơn giản nhưng không khử được nhiễu đầu vào, trong khi mờ hóa Gaus hoặc mờ hóa hình tam giác không những cho phép tính toán về sau tương đối đơn giản mà còn đồng thời có thể khử nhiễu đầu vào
Cơ sở luật
2.3.2.
Cơ sở luật (rule base) nơi chứa đựng tập các luật mờ IF-THEN,
thực chất là một tập các phát biểu hay quy tắc mà con người có thể hiểu được, mô tả hành vi của hệ thống, chẳng hạn:
"Nếu nhiệt độ là lạnh thì chỉnh nhiệt đầu ra lò sưởi cao"
"Nếu nhiệt độ là ấm thì chỉnh nhiệt đầu ra lò sưởi về zero"
Hai luật trên mô tả quan hệ điển hình giữa nhiệt độ phòng và nhiệt đầu ra tương ứng của lò sưởi
Một cách hình thức, với mô hình mờ n đầu vào - một đầu ra, mỗi
luật mờ có thể được mô tả như sau:
) (
) (
) (
ij IF x is A AND AND x is A THEN y is B
Trang 34Trong đó, A i k n
k, 1 , , và j
B lần lượt là các giá trị ngôn ngữ được định nghĩa trên các biến đầu vào và đầu ra mô hình Phần giả thiết của luật được hình thành từ sự giao nhau (intersection) (thực hiện bởi phép hội mờ - fuzzy AND) giữa các phát biểu dạng ngôn ngữ ,
n k
A
is
x k k i, 1 , , , gọi là các tiền đề thành phần Phần kết luận của luật được ánh xạ từ phần giả thiết thông qua phép kéo theo mờ (IF ( ) THEN ( )) Tương ứng với mỗi luật, ta có một độ tin cậy luật c ij [ 0 0 ; 1 0 ] Độ tin cậy của luật phản ánh tính đúng đắn của luật, c ij 0chứng tỏ luật không tham gia vào việc xác định đầu ra của mô hình Mỗi cơ sở luật là
sự kết hợp (union) (bằng phép tuyển mờ - fuzzy OR) của tất cả các luật
mờ
Các luật có thể được hình thành từ tri thức của chuyên gia con người hoặc rút ra từ các mẫu thực nghiệm Cơ sở luật là thành phần quan trọng nhất của bất kỳ mô hình mờ nào
Nếu thay phép min (˄) trong công thức 2.1 bằng một phép t-norm
T nào đó, ta có quy tắc suy luận hợp thành max-T được ký hiệu là oT tức là:
𝜇𝐵′(˅′) = ˅𝑢′ ∈𝑈𝑇(𝜇𝐴′(𝑢′), 𝜇𝑅(𝑢′, ˅′)), ∀ ˅′ ∈ 𝑉 (2.3)
Trang 35Căn cứ theo những quan niệm khác nhau về phần tử đại diện xứng đáng mà ta sẽ có các phương pháp giải mờ khác nhau Trong điều khiển người ta thường dùng hai phương pháp chính:
o Phương pháp điểm cực đại
o Phương pháp điểm trọng tâm
* Phương pháp điểm cực đại (LOM)
Tư tưởng chính của phương pháp giải mờ điểm cực đại là tìm trong tập mờ có hàm thuộc 𝜇𝑅( y), một phần tử y0 với độ phụ thuộc lớn
nhất, tức là:
𝑦0 = arg max
Tuy nhiên, việc tìm y0 theo công thức (2.4) có thể đưa đến vô số
nghiệm (hình 2.9b), nên ta phải đưa thêm những yêu cầu cho phép chọn
trong số các nghiệm đó một giá trị y0 cụ thể chấp nhận được Việc giải
mờ theo phương pháp cực đại gồm hai bước:
Trang 36- Xác định miền chứa giá trị rõ y0 Giá trị rõ y0 là giá trị mà tại đó hàm thuộc đạt giá trị cực đại (bằng độ thỏa mãn đầu vào H), tức là miền:
Nếu các hàm thuộc đều có dạng hình tam giác hoặc hình thang thì
điểm y0 xác định theo phương pháp này sẽ không quá bị nhạy cảm với
sự thay đổi của giá trị đầu vào rõ x0 Do đó rất thích hợp với các bài toán
có nhiễu biên độ nhỏ tại đầu vào
2/ Xác định điểm cận trái hoặc phải
𝑦0 = inf𝑦∈𝐺(𝑦) hoặc 𝑦0 = sup𝑦∈𝐺(𝑦)
Nếu các hàm thuộc đều có dạng hình tam giác hoặc hình thang thì
điểm y0 sẽ phụ thuộc tuyến tính vào giá trị rõ x0 tại đầu vào
Hình 2.8 Giải mờ bằng phương pháp điểm cực đại
* Phương pháp điểm trọng tâm (Centroid)
Trang 37Phương pháp điểm trọng tâm sẽ cho kết quả y0 là hoành độ của
điểm trọng tâm, miền được bao phủ bởi trục hoành và đường µR (y) - Hình
2.9a Phương pháp điểm trọng tâm xuất phát từ ý tưởng mọi giá trị của S
đều được đóng góp với trọng số vào việc xác định giá trị khử mờ của tập
mờ R, ở đây trọng số của nó là độ thuộc của phần tử vào tập mờ R Theo
nghĩa thông thường của trọng tâm, công thức tính giá trị khử mờ có dạng sau:
Với S = sup µ R (y) = {y | µ R (y) ≠ 0} là miền xác định của tập mờ R
Đây là phương pháp ưa được sử dụng nhất Nó cho phép ta xác
định giá trị y0 với sự tham gia của tất cả các tập mờ đầu ra của luật điều
khiển một cách bình đẳng và chính xác Tuy nhiên, phương pháp này lại không để ý được tới độ thỏa mãn của mệnh đề điều khiển cũng như thời gian tính lâu Ngoài ra một trong những nhược điểm cơ bản của phương
pháp này là giá trị y0 xác định được lại có độ thuộc nhỏ nhất, thậm chí bằng 0 (hình 2.10b)
Trang 38Hình 2.9 Giải mờ bằng phương pháp điểm trọng tâm
dữ kiện đòi hỏi có độ chính xác cao và là tiền đề cho việc suy luận
Cơ chế suy diễn và phương pháp giải mờ hiện tại đang theo nhiều hướng gây phân vân trong quá trình lựa chọn
2.5 Kết luận chương 2
Chương 2 đã trình bày được toàn bộ cơ sở lý thuyết trên tập mờ
Từ đó làm nền tảng xây dựng nên hệ logic mờ Chương tiếp theo sẽ ứng dụng hệ logic vào bài toán thực tế
Trang 39CHƯƠNG 3 XÂY DỰNG HỆ LOGIC MỜ DỰ BÁO
THỜI GIAN SỐNG CỦA BỆNH NHÂN VIÊM TỦY
Trong chương 3, sẽ tập trung giải quyết các vấn đề sau: Bắt đầu bằng việc giới thiệu phương pháp xây dựng cơ sở luật của Wang – Mengdel dựa trên bộ dữ liệu huấn luyện sẵn có; Tiếp theo, xây dựng các hàm thuộc căn cứ trên dữ liệu huấn luyện, cách sử dụng các phép giao (T- norm), phép hội (T – conorm), phép mờ hóa và giải mờ thích hợp đối với bài toán
3.2 Xây dựng cơ sở luật từ dữ liệu bằng phương pháp của Wang – Mendel
Theo phương pháp của Wang – Mendel [10], để góp phần quyết định được tính chất thành công của hệ logic mờ thì ta cần xác định được các luật Đây là cơ sở để đưa ra những phán đoán, xử lý chính xác từ dữ kiện đầu vào Hiện tại có 2 loại để đưa ra một cơ sở các luật:
- Dựa vào kinh nghiệm của chuyên gia
- Dựa vào kết quả phân tích của các cặp dữ liệu đầu vào – đầu ra
Những chuyên gia có kinh nghiệm sẽ căn cứ vào các tình trạng và