1. Trang chủ
  2. » Luận Văn - Báo Cáo

Kết hợp phương pháp wang mendel với thuật toán FCM cho bài toán sinh luật mờ

94 8 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 94
Dung lượng 2,17 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Nội dung nghiên cứu - Khảo sát các ứng dụng của hệ mờ dựa trên luật trong y học - Nghiên cứu các phương pháp xây dựng tập luật cho hệ mờ từ dữ liệu... Kết cấu của luận văn Ngoài phần m

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC VINH

LÊ THỊ THANH HƯƠNG

ĐỀ CƯƠNG LUẬN VĂN THẠC SĨ Chuyên ngành: Công nghệ thông tin

Trang 2

i

NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN

Kết luận: đồng ý/ không đồng ý cho bảo vệ Đề cương CHTS đợt tháng /2018

Vinh, ngày …… tháng …… năm 20…

Giáo viên hướng dẫn

(Ký và ghi rõ họ và tên)

Trang 3

ii

NHẬN XÉT CỦA HỘI ĐỒNG XÉT DUYỆT

Kết luận: đồng ý/ không đồng ý cho tiếp tục triển khai đề tài CHTS để bảo vệ đợt tháng /2018

Vinh, ngày …… tháng …… năm 2018

Hội đồng xét duyệt Thƣ ký

Trang 4

iii

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi Các số liệu và kết quả nghiên cứu trong luận văn là trung thực Các thông tin được lược trích từ nguồn tài liệu chính thống và được chỉ rõ nguồn gốc rõ ràng Nếu sai tôi hoàn toàn chịu trách nhiệm

Tác giả luận văn

Lê Thị Thanh Hương

Trang 5

iv

LỜI CẢM ƠN

Đầu tiên, tôi xin gửi lời cảm ơn sâu sắc nhất đến nhà khoa học TS Phan Anh Phong, thầy đã tận tình chỉ bảo, giúp đỡ, định hướng và tạo điều kiện cho tôi hoàn thành luận văn này

Tôi xin trân trọng cảm ơn sự giúp đỡ của các nhà khoa học, thầy, cô trường Đại học Vinh đã giảng dạy, truyền đạt kiến thức và hỗ trợ các điều kiện học tập cho tôi

Để có được kết quả như hôm nay, tôi xin tỏ lòng biết ơn đến gia đình, bạn bè, đồng nghiệp đã động viên, giúp đỡ, chia sẻ những khó khăn để tôi hoàn thành nhiệm vụ học tập, nghiên cứu của mình

Mặc dù, tác giả đã nỗ lực và cố gắng để hoàn thành luận văn, nhưng do trình độ và kinh nghiệm trong nghiên cứu khoa học còn hạn chế nên chắc chắn luận văn này không tránh khỏi những thiếu sót Tác giả kính mong nhận được sự đóng góp và chỉ dẫn của các nhà khoa học, bạn bè, đồng nghiệp giúp cho luận văn được hoàn thiện hơn

Xin chân thành cảm ơn!

Nghệ An, ngày……tháng……năm 2018

Học viên thực hiện

Lê Thị Thanh Hương

Trang 6

v

MỤC LỤC

Trang

CHƯƠNG 2 KỸ THUẬT SINH LUẬT MỜ SỬ DỤNG PHƯƠNG

PHÁP WANG-MENDEL VỚI THUẬT TOÁN FCM CẢI TIẾN

2.1 Các tiếp cận sinh luật mờ

21

21

2.4 Điểm yếu về tính đầy đủ và khả năng chịu nhiễu dữ liệu của phương pháp WM

2.4.1 Mô tả vấn đề

38

2.5 Thuật toán phân cụm AFCM

2.5.1 Thuật toán FCM

41

41

2.6 Phương pháp sinh luật mờ kết hợp WM và AFCM (FCAWM)

2.6.1 Phân cụm dữ liệu vào ra bằng AFCM

48

48

Trang 7

3.2.4 Thử nghiệm với tập dữ liệu không đầy đủ và không chứa nhiễu 68 3.2.5 Thử nghiệm với tập dữ liệu không đầy đủ và chứa nhiễu 68

Trang 8

WM và AFCM

Trang 9

Hình 2.1 Biểu diễn hàm thuộc cho các thuộc tính x1, x2, y 37

Hình 3 4 Tập mẫu huấn luyện không đầy đủ,

và không chứa nhiễu

68

Hình 3.6 So sánh các hệ thống mờ đƣợc tạo bởi WM, COWM, DM,

FCMcoWM và FCAWM và mô hình thực tế (a) Mô hình thực tế, (b) hệ

thống mờ tạo bởi WM, (c) hệ thống mờ đƣợc tạo ra bởi COWM, (d) hệ

thống mờ đƣợc tạo ra bởi DM, (e) hệ thống mờ đƣợc tạo bởi

FCMcoWM, (e) hệ thống mờ tạo bởi FCAWM

70

Trang 10

ix

DANH MỤC BẢNG

Trang

Trang 11

1

MỞ ĐẦU

1 Sự cần thiết của vấn đề nghiên cứu

Hệ logic mờ là một trong những công cụ thích hợp để mô hình hóa các bài toán mà dữ liệu thu được là mờ, không chắc chắn Hiệu năng của các hệ logic mờ thường phụ thuộc vào các thành phần cơ bản trong hệ thống, trong

đó hàm thuộc các tập mờ và cơ sở luật đóng vai trò quyết định

Hiện nay có nhiều tiếp cận xây dựng cơ sở luật như sử dụng ý kiến chuyên gia hoặc/và sử dụng kết quả phân tích dữ liệu vào – ra Phương pháp tạo luật của Wang – Mendel (WM) được đề xuất lần đầu vào năm 1992, là sự kết hợp cả hai tiếp cận trên Phương pháp này được rất nhiều nghiên cứu quan tâm vì sự đơn giản của thuật toán và tránh được sự xung đột của các luật Năm 2003, Wang tiếp tục hoàn thiện phương pháp này nhằm nâng cao khả năng ứng dụng vào thực tiễn Tuy nhiên, các tập mờ được xây dựng theo phương pháp WM là ngẫu nhiên hoặc dựa vào chuyên gia nên đã ảnh hưởng nhiều đến sự ổn định và hiệu năng của hệ mờ Gần đây, trong một số tài liệu

đã chỉ ra rằng phương pháp WM phụ thuộc nhiều vào tập dữ liệu, nếu tập dữ liệu huấn luyện không tốt thì cơ sở luật tạo sẽ không đầy đủ

Thuật toán FCM là một kỹ thuật phân cụm dữ liệu dựa trên khoảng cách dữ liệu, như vậy, thông qua FCM ta có thể quan sát được đặc trưng của

dữ liệu Theo cách nhìn đó luận văn này kết hợp phương pháp WM với FCM

để tạo ra cơ sở luật cho hệ mờ, trong đó đặc biệt quan tâm đến tính bám dính của các đối tượng trong mỗi cụm

Bài toán dự báo thời gian sống của bệnh nhân viêm tủy là bài toán căn

cứ vào các số liệu xét nghiệm máu và một số dữ liệu khác để đưa ra kết quả

về thời gian sống của người bệnh Do trong lĩnh vực y tế phần lớn các thông tin được phát biểu bằng ngôn ngữ và dữ liệu thu được sẽ có nhiễu Vì vậy, việc nghiên cứu và xây dựng một hệ mờ dùng để phân tích dữ liệu và đưa ra

Trang 12

2 Mục tiêu nghiên cứu

Kết hợp cách tạo luật của Wang – Mendel với thuật toán FCM cho bài toán sinh luật mở và ứng dụng

3 Đối tượng và phạm vi nghiên cứu

3.1 Đối tượng nghiên cứu

- Hệ mờ và ứng dụng trong chẩn đoán y tế

- Phương pháp tạo luật từ dữ liệu của Wang - Mendel

- Thuật toán phân cụm FCM

- Bệnh viêm tủy và chỉ số xét nghiệm máu

3.2 Phạm vi nghiên cứu

- Nghiên cứu phương pháp sinh luật của Wang – Mendel

- Nghiên cứu thuật toán FCM và FCM cải tiến

- Kết hợp phương pháp sinh luật của Wang – Mendel và thuật toán FCM để xây dựng tập luật

- Ứng dụng phương pháp đề nghị dự báo thời gian sống của bệnh nhân viêm tủy dựa vào các chỉ số xét nghiệm

4 Nội dung nghiên cứu

- Khảo sát các ứng dụng của hệ mờ dựa trên luật trong y học

- Nghiên cứu các phương pháp xây dựng tập luật cho hệ mờ từ dữ liệu

Trang 13

3

- Nghiên cứu phương pháp xây dựng tập luật của WM

- Nghiên cứu thuật toán phân cụm FCM cải tiến

- Nghiên cứu ngôn ngữ lập trình Matlab để cài đặt mô phỏng các thuật toán trên máy tính

5 Kết cấu của luận văn

Ngoài phần mở đầu và kết luận bố cục của luận văn bao gồm 3 chương như sau:

Chương 1: Tổng quan về hệ mờ dựa trên luật

Chương 2: Kỹ thuật sinh luật mờ sử dụng phương pháp Wang-Mendel với thuật toán FCM cải tiến

Chương 3: Xây dựng hệ mờ dự báo thời gian sống của bệnh nhân viêm tủy

Nội dung chính của chương 1 là nhắc lại các khái niệm về tập mờ, các phép toán hỗ trợ cho việc thực hiện tính toán trên tập mờ, về quan hệ mờ, và các phép hợp thành Từ đó để làm cơ sở để tìm hiểu cách xây dựng hệ logic

mờ

Trong chương 2 đề cập đến các phương pháp tiếp cận sinh luật mờ gồm

dữ liệu vào ra, hệ chuyên gia và phương pháp lai; trình bày quy trình tạo luật

mờ bằng phương pháp Wang-Mendel và phân tích ưu nhược điểm của phương pháp này; trình bày thuật toán phân cụm tiêu biểu là thuật toán FCM (Fuzzy c-Means), FCM cải tiến Để khắc phục các nhược điểm của phương pháp WM, luận văn nghiên cứu về sự kết hợp của WM và FCM cải tiến (FCAWM) và các phương pháp sinh luật trên WM

Để đánh giá phương pháp sinh luật mờ từ dữ liệu đã trình bày trong chương 2, chương 3 thực hiện ba thử nghiệm khác nhau Thử nghiệm I và thử nghiệm II tiến hành trên các bộ dữ liệu nhân tạo, còn thử nghiệm III áp dụng

Trang 14

rõ hơn về hệ mờ dựa trên luật

1.1.1 Tập mờ và các khái niệm cơ bản

Tập mờ A xác định trên tập vũ trụ X là một tập mà mỗi phần tử của nó

Các hàm thuộc µA(x) có dạng “trơn” được gọi là hàm thuộc kiểu S Đối

với hàm thuộc kiểu S, do các công thức biểu diễn µA(x) có độ phức tạp lớn nên thời gian tính độ phụ thuộc cho một phần tử lớn Trong kỹ thuật điều khiển mờ thông thường, các hàm thuộc kiểu S thường được thay gần đúng bằng một hàm tuyến tính từng đoạn

Trang 15

Ví dụ 1.1: Một tập mờ B của các số tự nhiên nhỏ hơn 5 với hàm thuộc

µ B (x) có dạng nhƣ Hình 2.2 định nghĩa trên tập vũ trụ X sẽ chứa các phần tử

sau:

B = {(1,1),(2,1),(3,0.95),(4,0.7)}

Các số tự nhiên 1, 2, 3 và 4 có độ phụ thuộc nhƣ sau:

µB(1) = µB(2) = 1, µB(3) = 0.95, µB(4) = 0.7

Những số không đƣợc liệt kê đều có độ phụ thuộc bằng 0

Ví dụ 1.2: Xét X là tập các giá trị trong thang điểm 10 đánh giá kết quả

học tập của học sinh về môn Toán, X = {1, 2, …, 10} Khi đó khái niệm mờ

Hình 1.6 Hàm thuộc µA( x) có mức chuyển đổi tuyến tính

Hình 1.7 Hàm thuộc của tập B

Trang 16

6

về năng lực học môn toán giỏi có thể được biểu thị bằng tập mờ A sau:

A = 0.1/4 + 0.2/5 + 0.4/6 + 0.7/7 + 0.9/8 + 1.0/9 +1.0/10 Trong trường hợp tập mờ rời rạc ta có thể biểu diễn tập mờ ở dạng bảng

Một số khái niệm cơ bản của tập mờ

Miền xác định: Biên giới tập mờ A, ký hiệu là supp(A), là tập rõ gồm

các phần tử của X có mức độ phụ thuộc của x vào tập mờ A lớn hơn 0

supp(A) = {x | µ A (x) > 0}

Miền tin cậy: Lõi tập mờ A, ký hiệu là core(A), là tập rõ gồm các

phần tử của X có mức độ phụ thuộc của x vào tập mờ A bằng 1 core(A) = {x |

µ A (x) = 1}

Độ cao tập mờ: Độ cao tập mờ A, ký hiệu: h(A), là mức độ phụ thuộc

cao nhất của x vào tập mờ A

h(A) = sup µ A (x) x X

Một tập mờ có ít nhất một phần tử có độ phụ thuộc bằng 1 được gọi là

tập mờ chính tắc, tức là h(A) = 1, ngược lại một tập mờ A với h(A) < 1 được gọi là tập mờ không chính tắc

Biểu diễn tập mờ: Tập mờ A trên tập vũ trụ X là tập mà các phần tử x

Hình 1.8 Miền xác định và miền tin cậy của tập mờ A

Trang 17

7

X với mức độ phụ thuộc của x vào tập mờ A tương ứng Có ba phương pháp

biểu diễn tập mờ: phương pháp ký hiệu, phương pháp tích phân và phương pháp đồ thị

Phương pháp ký hiệu: Liệt kê các phần tử và các thành viên tương ứng theo ký hiệu

Phương pháp đồ thị:

1.1.2 Các phép toán trên tập mờ

a Hợp của các tập mờ

Cho tập mờ A, B trên tập vũ trụ X, tập mờ hợp của A và B là một tập

Hình 1.9 Biểu diễn tập mờ chiều cao

Trang 18

µ I (x) = i (µ A (x), µ B (x))

Hình 1.10 Hợp hai tập mờ có cùng tập không gian

Trang 19

A1× A2 ×…× An = ∫

Hình 1.6 Giao hai tập mờ có cùng tập không gian

Hình 1.7 Tập bù A của tập mờ A

Trang 20

trên đều đòi hỏi việc tích hợp các dữ liệu trong phần tiền tố “nếu” nhờ toán tử kết nhập, một trong những toán tử nhƣ vậy là lấy tích Descartes

A1×A2×…×An

1.1.3 T-norm và T-cornorm

Trong định nghĩa các phép tính hợp và giao trên tập mờ, chúng ta đã sử dụng hai cặp phép tính 2-ngôi trên [0;1] là cặp min () và max () và cặp phép tính tích (.) a.b và tổng đại số () a b = a +b – a.b Bây giờ chúng ta

sẽ đƣa ra một họ các cặp t-norm và t-conorm

a T-norms

Một hàm 2-biến T : [0;1] × [0;1] → [0;1] đƣợc gọi là phép t-norm nếu

nó thỏa các tính chất sau  a, a’, b, c  [0;1]:

(T1) Tính chất điều kiện biên: T(a, 1) = a

Trang 21

11

(T2) Tính chất giao hoán: T(a, b) = T(b, a)

(T3) Tính chất đơn điệu: a  a’  T(a, b)  T(a’, b)

(S1) Tính chất giới nội : S(a, 0) = a

(S2) Tính chất giao hoán: S(a, b) = S(b, a)

(S3) Tính chất đơn điệu: a a’ => S(a, b) S(a’, b)

Trang 22

12

đây μR(x, y) = R(x, y) là độ thuộc của (x, y) vào quan hệ R

Cho R1và R2 là hai quan hệ mờ trên X×Y, ta có :

1) Quan hệ R1 R2 với μR1 R2(x, y) = max {μR1(x, y), μR2(x, y)}, ∀(x, y) X×Y

2) Quan hệ R1∩R2 với μR1∩R2(x, y) = min {μR1(x, y), μR2(x, y)} ∀(x, y) X×Y

1.1.5 Hợp thành mờ

Cho R1 là quan hệ mờ trên X×Y, R2 là quan hệ mờ trên Y×Z Hợp thành R 1°R2 của R1, R2 là quan hệ mờ trên X×Z

Hợp thành max-min (max-min composition) đƣợc xác định bởi

μR1oR2(x, z) = maxy{min(μR1(x, y), μR2(y, z))}, ∀(x, z) X×Z Hợp thành max-prod cho bởi

μR1oR2(x, z) = maxy{μR1(x, y).μR2(y, z)}∀(x, z) X×Z

Hợp thành max-∗ đƣợc xác định bởi toán tử*: [0, 1]2→[0, 1]

μR1oR2(x, z) = maxy{μR1(x, y) * μR2(y, z)}∀(x, z) X×Z

Giả thiết (T, S, n) là bộ ba De Morgan, trong đó: T là T –norm, S là T –Conorm, n là phép phủ định

Cho R1, R2 là quan hệ mờ trên X×X, phép T- tích hợp thành cho một quan hệ R 1°T R2trên X×X xác định bởi

R 1°T R2(x, z) = supy XT(R1(x, y), R2(y, z))

Cho R1, R2, R3là những quan hệ mờ trên X×X, khi đó:

R 1°T (R 2°T R 3) = (R 1°T R2) °T R3Nếu R1 ⊆ R2thì R 1°TR3 ⊆ R 2°T R 3và R 3°TR1 ⊆ R 3°TR2

1.2 Hệ mờ dựa trên luật

Trang 23

13

Mục này trình bày việc sử dụng tập mờ trong các hệ thống tính toán dựa trên lôgic mờ Hiện nay, có một số thuật ngữ có thể đƣợc sử dụng về hệ thống này nhƣ hệ mờ, hệ lôgic mờ, hệ chuyên gia mờ, hệ dựa trên tri thức mờ hay hệ lôgic mờ dựa trên luật Luận văn này sử dụng thuật ngữ hệ lôgic mờ hoặc hệ mờ để mô tả một hệ thống tính toán sử dụng tập mờ trong các luật IF

- THEN

Về hình thức, một hệ lôgic mờ loại một có thể xem nhƣ một ánh xạ phi tuyến từ không gian đầu vào tới không gian đầu ra Các thành phần chính trong hệ lôgic mờ loại một đƣợc minh họa trong Hình 1.8

1.2.1 Mờ hóa

Mờ hóa đƣợc định nghĩa nhƣ là sự ánh xạ từ tập các giá trị thực x* U

⊂ Rn thành tập các giá trị mờ A ở trong U Nguyên tắc chung việc thực hiện

Tập mờ đầu vào

Tập mờ đầu ra

Hình 1.8 Các thành phần của một hệ mờ

Trang 24

14

Việc mờ hóa phải tạo điều kiện đơn giản cho tính toán sau này

Thông thường dùng ba phương pháp mờ hóa sau đây:

- Mờ hóa đơn trị (Singleton fuzzifier) Mờ hóa đơn trị là từ các điểm giá trị thực x* U lấy các giá trị đơn của tập mờ A và hàm thuộc có dạng:

- Mờ hóa Gaus (Gaussian fuzzifier) Mờ hóa Gaus là từ các điểm giá trị thực x* U lấy các giá trị trong tập mờ A với hàm thuộc Gaus

- Mờ hóa hình tam giác (Triangular fuzzifier) Mờ hóa hình tam giác là từ các điểm giá trị thực x* U lấy các giá trị trong tập mờ

A với hàm thuộc dạng hình tam giác (hoặc hình thang)

Ta thấy mờ hóa đơn trị cho phép tính toán về sau rất đơn giản nhưng không khử được nhiễu đầu vào, trong khi mờ hóa Gaus hoặc mờ hóa hình tam giác không những cho phép tính toán về sau tương đối đơn giản mà còn đồng thời có thể khử nhiễu đầu vào

1.2.2 Cơ sở luật

Cơ sở luật (rule base) nơi chứa đựng tập các luật mờ IF-THEN, thực

chất là một tập các phát biểu hay luật mà con người có thể hiểu được, mô tả hành vi của hệ thống, chẳng hạn:

"Nếu nhiệt độ là lạnh thì chỉnh nhiệt đầu ra lò sưởi cao"

"Nếu nhiệt độ là ấm thì chỉnh nhiệt đầu ra lò sưởi về zero"

Hai luật trên mô tả quan hệ điển hình giữa nhiệt độ phòng và nhiệt đầu

ra tương ứng của lò sưởi

Một cách hình thức, với mô hình mờ n đầu vào - một đầu ra, mỗi luật

mờ có thể được mô tả như sau:

Trang 25

15

) (

) (

) (

0

ij

c chứng tỏ luật không tham gia vào việc xác định đầu ra của mô hình

Mỗi cơ sở luật là sự kết hợp (union) (bằng phép tuyển mờ - fuzzy OR) của tất

cả các luật mờ

Các luật có thể được hình thành từ tri thức của chuyên gia con người hoặc rút ra từ các mẫu thực nghiệm Cơ sở luật là thành phần quan trọng nhất của bất kỳ mô hình mờ nào

1.2.3 Suy diễn mờ

Công thức 1.1 khái quát trong suy luận mờ

[ ] ∀ (1.1) Công thức 1.1 có thể được biễu diễn ở dạng ma trận như sau

Trang 26

Căn cứ theo những quan niệm khác nhau về phần tử đại diện xứng đáng

mà ta sẽ có các phương pháp giải mờ khác nhau Trong điều khiển người ta thường dùng hai phương pháp chính:

o Phương pháp điểm cực đại

o Phương pháp điểm trọng tâm

* Phương pháp điểm cực đại (LOM)

Tư tưởng chính của phương pháp giải mờ điểm cực đại là tìm trong tập

mờ có hàm thuộc ( y), một phần tử y0 với độ phụ thuộc lớn nhất, tức là:

Tuy nhiên, việc tìm y0 theo công thức (1.4) có thể đưa đến vô số

nghiệm (hình 1.9b), nên ta phải đưa thêm những yêu cầu cho phép chọn trong

số các nghiệm đó một giá trị y0 cụ thể chấp nhận được Việc giải mờ theo

phương pháp cực đại gồm hai bước:

- Xác định miền chứa giá trị rõ y0 Giá trị rõ y0 là giá trị mà tại đó hàm thuộc đạt giá trị cực đại (bằng độ thỏa mãn đầu vào H), tức là miền:

- Xác định y0 có thể chấp nhận được từ G

Trong

Trang 27

Nếu các hàm thuộc đều có dạng hình tam giác hoặc hình thang thì điểm

y0 xác định theo phương pháp này sẽ không quá bị nhạy cảm với sự thay đổi của giá trị đầu vào rõ x0 Do đó rất thích hợp với các bài toán có nhiễu biên

độ nhỏ tại đầu vào

2/ Xác định điểm cận trái hoặc phải

hoặc

Nếu các hàm thuộc đều có dạng hình tam giác hoặc hình thang thì điểm

y0 sẽ phụ thuộc tuyến tính vào giá trị rõ x0 tại đầu vào

* Phương pháp điểm trọng tâm (Centroid)

Phương pháp điểm trọng tâm sẽ cho kết quả y0 là hoành độ của điểm

trọng tâm, miền được bao phủ bởi trục hoành và đường µR (y) - Hình 1.10a

Phương pháp điểm trọng tâm xuất phát từ ý tưởng mọi giá trị của S đều được

Hình 1.9 Giải mờ bằng phương pháp điểm cực đại

Trang 28

Với S = sup µ R (y) = {y | µ R (y) ≠ 0} là miền xác định của tập mờ R

Đây là phương pháp ưa được sử dụng nhất Nó cho phép ta xác định giá

trị y0 với sự tham gia của tất cả các tập mờ đầu ra của luật điều khiển một

cách bình đẳng và chính xác Tuy nhiên, phương pháp này lại không để ý được tới độ thỏa mãn của mệnh đề điều khiển cũng như thời gian tính lâu Ngoài ra một trong những nhược điểm cơ bản của phương pháp này là giá trị

y0 xác định được lại có độ thuộc nhỏ nhất, thậm chí bằng 0 (hình 1.10b)

1.3 Những khó khăn khi xây dựng một hệ mờ

Lý thuyết tập mờ áp dụng trên các lớp hay các nhóm dữ liệu mà trong

đó ranh giới giữa chúng không phân định rõ ràng Lợi ích của việc mở rộng lý thuyết và các phương pháp giải tích rõ thành các các kỹ thuật mờ là khả năng giải quyết các bài toán trong thế giới thực, nơi luôn tồn tại các yếu tố tác động

có bản chất không chính xác và có nhiễu, hệ quả của quá trình đo đạc và xử lý trong thực tế Việc xây dựng một hệ mờ đòi hỏi phải xác định được các biến ngôn ngữ và các hàm thuộc từ đó làm cơ sở cho việc mờ hóa

Hình 1.10 Giải mờ bằng phương pháp điểm trọng tâm

Trang 29

19

Biến ngôn ngữ là phần chủ đạo trong các hệ thống dùng Logic mờ Biến ngôn ngữ là các biến mà giá trị của chúng không phải là số mà là các từ hoặc các câu trong ngôn ngữ tự nhiên hoặc nhân tạo Các giá trị của biến ngôn ngữ được sử dụng “khi có sự thiếu hụt tính chính xác bề ngoài của những vấn

đề phức tạp cố hữu” Ở đây, các thành phần ngôn ngữ mô tả cùng một ngữ cảnh được kết hợp lại Ví dụ như, có rất nhiều trường hợp để mô tả nhiệt độ, không chỉ có “rất nóng” mà còn “hơi nóng”, “trung bình”, “hơi lạnh” và “rất lạnh” … Chúng được gọi là các tập ngôn ngữ, mang một khoảng giá trị nào

đó của biến ngôn ngữ và được vẽ trên cùng một đồ thị Các luật trong hệ logic

mờ mô tả tri thức của hệ mờ Chúng dùng các biến ngôn ngữ như là từ vựng

để mô tả các tầng điều khiển trong hệ Khó khăn dễ dàng nhận ra là khái niệm ngôn ngữ không những mơ hồ mà còn phụ thuộc vào ngữ cảnh, vào không gian thời gian và các yếu tố khách quan khác

Một thách thức khác đặt ra khi xây dựng sở luật của hệ mờ Các luật

mờ được xây dựng dựa trên ý kiến chuyên gia thuộc lĩnh vực chuyên ngành hoặc được suy luận từ dữ liệu hoặc từ quan sát, thực nghiệm hoặc sử dụng các

kỹ thuật học máy để sinh trực tiếp từ các mẫu dữ liệu thu thập được Từ đó rút

ra được các tập dữ liệu mẫu đầu vào và ra tương ứng, từ đó dùng các kỹ thuật khai phá dữ liệu để rút ra các luật Đây là dữ kiện đòi hỏi có độ chính xác cao

và là tiền đề cho việc suy luận Tuy nhiên, không phải bài toán nào cũng có chuyên gia với các ý kiến đủ để xây dựng một hệ luật, thường phải kết hợp các phương pháp sinh luật đảm bảo tính đầy đủ cho hệ luật đó Các phương pháp này gặp trở ngại là số luật sinh ra có thể rất lớn do vậy đòi hỏi một khối lượng tính toán khổng lồ, hoặc các hàm thuộc của các giá trị ngôn ngữ có thể gần như đồng nhất với nhau khi sử dụng các biện pháp điều chỉnh tham số

Cơ chế suy diễn và phương pháp giải mờ hiện tại đang theo nhiều hướng gây phân vân trong quá trình lựa chọn Chúng ta đang ở trong môi trường thông tin mờ, không chắc chắn, nên không có một phương pháp lập

Trang 30

20

luận chính xác và duy nhất Mỗi phương pháp sẽ xuất phát từ một quan sát trực quan nào đó Câu hỏi về cách chọn các phép trên như thế nào để có một phương pháp lập luận tốt nói chung không có câu trả lời khẳng định mà phụ thuộc vào từng tình huống ứng dụng cụ thể và được kiểm chứng qua kết quả thực nghiệm Một tập mờ có thể gần như nằm bên trong một tập mờ khác Các luật mờ kết quả không trực quan, khó hiểu đối với người dùng trong khi người dùng cần đến các tri thức này để phán đoán, ra quyết định trong ứng dụng thực tế

1.4 Kết luận chương 1

Chương 1 đã trình bày được toàn bộ cơ sở lý thuyết trên tập mờ gồm các khái niệm về tập mờ, các phép toán trên tập mờ, quan hệ mờ, và các phép hợp thành, từ đó để làm cơ sở để hiểu rõ hơn về hệ mờ dựa trên luật, phân tích những khó khăn thách thức khi xây dựng một hệ mờ Đó là nền tảng để nghiên cứu, cải tiến các phương pháp xây dựng hệ mờ sao cho tối ưu nhất

Trang 31

21

CHƯƠNG 2 KỸ THUẬT SINH LUẬT MỜ SỬ DỤNG PHƯƠNG PHÁP

WANG-MENDEL VỚI THUẬT TOÁN FCM 2.1 Các tiếp cận sinh luật mờ

Ở mức tổng quát cấu trúc của một mô hình mờ thường bao gồm: đầu vào, đầu ra cùng với một bộ xử lý Bộ xử lý thực chất là một ánh xạ phản ánh

sự phụ thuộc của biến đầu ra của hệ thống đối với các biến đầu vào Đối với

mô hình mờ, các yếu tố đầu vào nhận giá trị số rõ, còn đầu ra có thể là một tập mờ hoặc một giá trị số rõ Quan hệ ánh xạ của đầu ra đối với các đầu vào của mô hình mờ được mô tả bằng một tập luật mờ, thay vì một hàm số tường minh Thông thường, một mô hình mờ tổng quát sẽ có nhiều đầu vào và nhiều đầu ra, tuy nhiên, một mô hình nhiều đầu ra luôn có thể được chia thành một tập các mô hình một đầu ra nên ở đây chúng ta chỉ xem xét trường hợp mô hình mờ nhiều đầu vào - một đầu ra Cụ thể, cấu trúc cơ bản của một mô hình

mờ bao gồm 5 thành phần như dưới đây (Li-Xin Wang, 1996)

Phần 1 Cơ sở luật mờ: gồm một tập các luật mờ IF-THEN, là thành

phần cốt lõi của mô hình mờ theo ý nghĩa tất cả các thành phần khác trong mô hình mờ được sử dụng để thực thi các luật mờ này một cách hợp lý và hiệu quả Cụ thể, các luật mờ IF-THEN có dạng:

Trong đó và là các tập mờ có các tập nền ⊂ và V ⊂ tương ứng và và là các biến (ngôn ngữ đầu vào và đầu ra tương ứng của mô hình mờ

Phần 2 Bộ tham số mô hình: quy định hình dạng hàm thuộc của giá

trị ngôn ngữ được sử dụng để biểu diễn các biến mờ và các luật mờ Giá trị các tham số có thể được đánh giá bằng kinh nghiệm của các chuyên gia hoặc

là kết quả của quá trình khai phá tri thức từ thực nghiệm

Phần 3 Cơ chế suy diễn: có nhiệm vụ thực hiện thủ tục suy diễn mờ

Trang 32

22

dựa trên cơ sở tri thức và các giá trị đầu vào để đƣa ra một giá trị dự đoán ở đầu ra Trong một cơ chế suy diễn mờ, các nguyên tắc logic mờ đƣợc sử dụng

để kết hợp các luật mờ IF-THEN trong cơ sở luật mờ thành một ánh xạ từ một

tập mờ A' nằm trong U tới một tập mờ B' nằm trong V Ở đây mỗi một luật

mờ IF-THEN đƣợc hiểu nhƣ là một quan hệ mờ trong không gian tích vào –

ra

Phần 4 Module mờ hóa (hay giao diện mờ hóa): thực hiện việc

chuyển đổi các đầu vào rõ thành mức độ trực thuộc các giá trị ngôn ngữ Mờ hóa đƣợc định nghĩa nhƣ là một ánh xạ từ một điểm giá trị thực ∗ ⊂

tới một tập mờ A' trong U

Phần 5 Module khử mờ (hay giao diện khử mờ): thực hiện chuyển

đổi kết quả suy diễn mờ thành giá trị đầu ra rõ ràng Khử mờ đƣợc định nghĩa

nhƣ là một ánh xạ từ tập mờ B' nằm trong V ⊂ (đầu ra của cơ chế suy diễn

mờ) tới điểm rõ ∗

2.1.1 Sử dụng tri thức chuyên gia

Trong thực tế, có rất nhiều tình huống chúng ta phải rút ra những kết luận tốt từ những bằng chứng không chắc chắn thông qua việc sử dụng những suy diễn không vững chắc Đây không phải là một nhiệm vụ không thể thực hiện đƣợc, trái lại chúng ta thực hiện chúng rất thành công trong hầu hết mọi khía cạnh của cuộc sống; chẳng hạn nhƣ chúng ta phát biểu những chẩn đoán

y học đúng đắn và đề xuất cách điều trị từ những triệu chứng không rõ ràng; phân tích những trục trặc của xe ôtô từ những biểu hiện của nó; nhận ra bạn

bè chỉ qua giọng nói hoặc điệu bộ của họ,…

Ở đây ta có hai loại thông tin không chắc chắn: một là dữ liệu ban đầu đƣợc cho là không chắc chắn, không đủ, không đáng tin cậy,… hai là các luật

mà ta sử dụng để suy luận không hợp logic, suy luận ngƣợc từ kết luận về

điều kiện, hay có thể gọi là suy luận theo kiểu phỏng đoán (abduction)

Trang 33

23

Hệ chuyên gia là một chương trình thông minh nhằm dạy cho máy tính biết các hoạt động của một chuyên gia thực thụ Hệ chuyên gia đầu tiên là DENDRAL, xuất hiện vào giữa thập niên 70, sau đó vào năm 1975 hệ chuyên gia MYCIN ra đời đã thành công trong việc áp dụng khoa học trí tuệ nhân tạo vào lĩnh vực Y học, cụ thể là lĩnh vực chẩn đoán và điều trị bệnh nhiễm trùng máu Đây là hệ chuyên gia tương đối lớn, thực hiện ở mức chuyên gia con người, bên cạnh đó còn cung cấp cơ chế giải thích các bước suy luận Vào cuối năm 80, tại Viện Công nghệ Thông tin đã bước đầu xây dựng hệ trợ giúp khám chữa bệnh nội khoa, châm cứu và chẩn trị đông y, đã có tiếp cận ra quyết định trong việc chẩn đoán lâm sàng,…

L A Zadeh đã phát triển một lý thuyết lập luận lập luận mờ nhằm đưa

ra một phương pháp biễu diễn và lập luận với các thông tin ngôn ngữ không chính xác Trong tiếp cận của Zadeh, lập luận xấp xỉ dựa trên cơ sở logic mờ giá trị ngôn ngữ Các giá trị chân lý của mệnh đề là các giá trị ngôn ngữ của biến TRUTH

Mỗi giá trị chân lý ngôn ngữ có ngữ nghĩa tương ứng với một tập mờ xác định trong đoạn [0, 1] Trên cơ sở đại số gia tử, ta xây dựng cơ chế lập luận suy diễn mờ dựa trên biến ngôn ngữ thông qua dạng tập mờ loại hai để từ

đó xây dựng cơ chế chuyển đổi từ tập mờ loại hai thành tập mờ loại một và nhận giá trị trong đoạn [0, 1] Đối với hệ cơ sở tri thức ta xây dựng dựa trên các luật IF THEN, còn đối với cơ chế lập luận suy diễn ta sẽ dựa trên việc lập luận ngôn ngữ tự nhiên của miền giá trị của biến ngôn ngữ đã được xây dựng trên nền tảng đại số gia tử

2.1.2 Dựa vào dữ liệu vào – ra

Khi xây dựng mô hình mờ để giải quyết các bài toán thực tế, không phải lúc nào cơ sở tri thức cũng được tích lũy sẵn từ kinh nghiệm của chuyên gia và phát biểu dưới dạng các luật, các quy tắc mà trong nhiều trường hợp chúng ta phải tích lũy, tổng hợp và hoàn thiện cơ sở tri thức từ các thực

Trang 34

24

nghiệm trên các hệ thống thực (thông qua tập dữ liệu vào - ra đo được)

Xét bài toán: Cho N cặp dữ liệu vào - ra: ( ) trong đó:

[ ] [ ] ⊂

và [ ] ⊂

Mục tiêu đặt ra là cần thiết kê được một mô hình mờ f(x) dựa trên N

cặp dữ liệu vào - ra này Một số tiếp cận như sau chính như sau

Phương pháp bảng tra cứu

Ý tưởng của phương pháp này là sinh các luât mờ IF-THEN từ các cặp

dữ liệu đầu vào đầu ra, sau đó xây dựng mô hình mờ từ các luật này dựa theo những lựa chọn nhất định của bộ suy diễn mờ, mờ hóa, và khử mờ Quá trình thực hiện gồm các bước sau:

Bước 1 Xác định các tập mờ bao phủ các không gian dữ liệu đầu vào

và đầu ra Cụ thể, đối với từng cặp [ ] , xác định N i tập mờ

là đầy đủ trong [ ] tức là đối với bấy kỳ [ ], sẽ tồn tại mà ) ; tương tự, xác định Ny tập mờ

là đầy đủ trong [ ]

Bước 2 Sinh một luật từ một cặp dữ liệu vào - ra Với mỗi cặp vào - ra

( ) xác định các giá trị độ thuộc của trong các tập mờ và các giá trị độ thuộc của trong các tập mờ Tức là, thực hiện tính toán ( )

và ( ) Sau đó, với mỗi biến đầu vào , xác định các tập mờ mà tại đó có giá trị

độ thuộc lớn nhất, tức là xác định ∗ mà ∗( ) ( ) Tương tự, xác định ∗ mà ∗( ) ( )

Trang 35

25

Cuối cùng, thu được một luật mờ dạng:

∗ ∗ (2.1)

Bước 3 Chỉ định một mức độ cho từng luật được sinh trong Bước 2

Giả sử rằng luật mờ ở Bước 2 được tạo ra từ cặp vào – ra , khi đó mức độ tin cậy của nó được định nghĩa là:

∏ ∗( ) ∗( ) (2.2) Nếu các cặp vào - ra có mức độ tin cậy khác nhau và chúng ta có thể xác định một số để đánh giá nó, khi đó ta có thể kết hợp thông tin này vào thành mức độ tin cậy của các luật Cụ thể, giả sử cặp vào – ra có mức độ tin cậy [ ] , khi đó mức độ tin cậy của luật được sinh bởi

- Tập các luật ngôn ngữ từ các chuyên gia (nhờ các tri thức có ý thức)

Bước 5 Xây dựng mô hình mờ dựa trên cơ sở luật mờ Có thể sử dụng

phương pháp bất kỳ để xây dựng mô hình mờ dựa trên cơ sở luật mờ được tạo

từ Bước 4 Ví dụ, có thể chọn mô hình mờ với cơ chế suy n dạng tích (product inference), mờ hóa duy nhất (singleton fuzzifier), và khử mờ trọng tâm (center of gravity defuzzifier)

Trang 36

26

Tiếp cận dựa trên học máy

Tiếp cận này sử dụng các thuật toán học có giám sát hoặc không giám sát để tạo ra tập luật

huấn luyện làm cực tiểu tổng các sai số kết hợp Jp cho tất cả các cặp

đầu vào - đầu ra đến p, nghĩa là mô hình mờ f(x) đƣợc cực tiểu hóa:

∑ [ ( ) ] (2.4)

Bước 1 Giả sử rằng [ ] [ ] ⊂ Đối với mỗi [ ] ; xác định tập mờ hoàn toàn thuộc trong [ ]

Giả sử, chọn là các tập mờ dạng giả hình thang

( ) ( ) Trong đó:

cơ chế suy diễn dạng tích, mờ hóa duy nhất và khử trọng tâm mờ Mô hình mời đƣợc thiết kế là:

∑ ∑ [∏ ]

∑ ∑ [∏ ]

(2.6)

Trang 37

27

Trong đó là các tham số tự do được thiết kế, và được thiết

kế trong Bước 1 Thu thập các tham số do vào trong vector ∏ chiều:

(2.7)

và viết lại công thức (2.6) thành:

(2.8) Trong đó:

(2.10)

Bước 3 Chọn các tham số ban đầu theo cách: Nếu có các luật

ngôn ngữ từ các chuyên gia (tri thức có ý thức) mà các phần IF của chúng nhất quán với các phân IF của công thức (2.5), khi đó chọn làm các trọng tâm của các tập mờ phân kết luận THEN trong các luật ngôn ngữ này, nếu không, chọn tùy ý trong không gian đầu ra ⊂ (ví dụ, chọn = 0 hoặc các phần tử của được phân bố đồng đều trên V)

Bước 4 Đối với p = 1, 2, ., tính toán các tham số bằng cách sử

dụng thuật toán đệ quy bình phương tối thiểu:

Trang 38

Trong đó được chọn tại Bước 3, và P(0) = trong đó là một hằng số

lớn Mô hình mờ được thiết kế tuân theo dạng công thức (2.6) với các tham số

bằng các thành phân tương ứng trong

Phương pháp sử dụng kỹ thuật phân cụm

Phương pháp này xem số lượng các luật trong mô hình mờ như một

tham số thiết kế và xác định nó dựa trên các cặp đầu vào-đầu ra Giả sử có N

cặp đầu vào - đầu ra ( với l=1,2, N, N là nhỏ, ví dụ N = 20 Nhiệm vụ

đặt ra là phải xây dựng một mô hình mờ f(x) có thể phù hợp tất cả N cặp với

độ chính xác tùy ý, có nghĩa là, với bất kỳ cho trước thì | ( ) |

∑ * | |

+

k

) ,

với k = 2, 3, ., ta đã có M cụm với các điểm trọng tâm tại x x1c, c2, ,x c M

Tính toán các khoảng cách của x0k tới M điểm trọng tâm của các cụm này,

Trang 39

Và thiết lập (2.17)

(2.18)

Bước 3 Nếu x0k

không thành lập một cụm mới, khi đó mô hình mờ

đƣợc thiết kế dựa trên k cặp đầu vào - đầu ra (x y0

j

, 0

j ), j = 1, 2, , k, là:

∑ * | |

+

∑ * | |

+

∑ * | |

+

Trang 40

30

chắn, các mô hình mờ là lựa chọn thích hợp trong các bài toán nhận dạng hệ thống mà đầu ra phụ thuộc vào các yếu tố khó được định lượng một cách chính xác hoặc hàm ánh xạ giữa đầu vào - đầu ra rất phức tạp, khó có thể xây dựng một cách tường minh Khi sử dụng mô hình mờ để diễn tả tri thức của con người, cần lưu ý hai dạng tri thức: tri thức có ý thức (có thể diễn tả bằng lời một cách rõ ràng) và tri thức tiềm thức (liên quan tới các tình huống mà các chuyên gia biết những việc cần làm, nhưng lại không thể diễn tả chính xác cách thực hiện chúng) Đối với tri thức có ý thức, các chuyên gia diễn tả nó bằng nhóm các luật mờ IF-THEN và đặt chúng vào trong các mô hình mờ Đối với tri thức tiềm thức, các chuyên gia chỉ có thể minh họa, chỉ ra những

gì họ làm trong một số tình huống điển hình, khi đó họ được xem như một hộp đen và được đo lường các đầu vào và các đầu ra, từ đó thu được một tập hợp các cặp dữ liệu vào - ra Bằng cách này, các tri thức tiềm thức được chuyển đổi thành một tập các cặp vào - ra Vấn đề đặt ra là phải xây dựng được các mô hình mờ từ các cặp dữ liệu vào - ra đó Khi xây dựng mô hình

mờ để giải quyết các bài toán thực tế, không phải lúc nào cơ sở tri thức cũng được tích lũy sẵn từ kinh nghiệm của chuyên gia và phát biểu dưới dạng các luật, các quy tắc mà trong nhiều trường hợp chúng ta phải tích lũy, tổng hợp

và hoàn thiện cơ sở tri thức từ các thực nghiệm trên các hệ thống thực (thông qua tập dữ liệu vào - ra đo được)

Bản chất đa dạng của các miền ứng dụng cũng đòi hỏi tầm quan trọng của việc xây dựng các phương pháp lai Nhiều miền phức tạp có nhiều vấn đề thành phần khác nhau, mỗi vấn đề có thể yêu cầu các loại xử lý khác nhau Nếu có một ứng dụng phức tạp có hai vấn đề phụ riêng biệt, của hai loại khác nhau thì mạng nơron và logic mờ tương ứng có thể được sử dụng để giải quyết các nhiệm vụ riêng biệt này Việc sử dụng các hệ thống lai thông minh

là với các ứng dụng thành công trong nhiều lĩnh vực bao gồm chẩn đoán y tế

Thế mạnh thực sự của phương pháp lai mang nơron và logic mờ là nắm

Ngày đăng: 27/01/2021, 11:49

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w