Sử dụng kỹ thuật mô hình hóa mờ trong dự báo tài chính có ý nghĩathực tiễn rất lớn, đặc biệt trong lĩnh vực thị trường chứng khoán, và việc sử dụng phươngpháp mới này góp phần làm tăng đ
Trang 1Lời cảm ơn
Lời đầu tiên, em xin được gửi lời cám ơn chân thành tới các thày cô giáo thuộc trường Đại học Bách Khoa Hà Nội, những người đã tận tình chỉ dạy tất cả kiến thức đại cương và chuyên ngành cho em trong suốt quá trình học tập và nghiên cứu tại trường
Trong quá trình thực hiện đồ án tốt nghiệp em đã học hỏi được thêm rất nhiều điều, đó cũng là cơ hội để em tổng kết những kiến thức đã được học, đồng thời rút
ra những kinh nghiệm quý báu Mặc dù có một số khó khăn và vướng mắc trong thời gian hoàn thiện đồ án, nhưng nhờ sự chỉ bảo, hướng dẫn tận tình của thầy giáo, PGS TS Trần Đình Khang - bộ môn Hệ thống thông tin – Viện Công Nghệ Thông Tin và Truyền Thông - trường Đại học Bách Khoa Hà Nội, em đã kịp thời khắc phục và có thể nói đồ án được hoàn thành ở một mức độ nhất định Bên cạnh những kết quả đã đạt được, chắc chắn em sẽ không tránh khỏi những thiếu sót và hạn chế Sự phê bình, nhận xét của thầy cô là những bài học quý báu cho công việc và nghiên cứu của em sau này
Một lần nữa em xin chân thành cảm ơn sự giúp đỡ của các thầy cô, đặc biệt là PGS TS Trần Đình Khang đã giúp đỡ em hoàn thành đồ án tốt nghiệp này Em cũng xin được gửi lời cảm ơn sâu sắc đến gia đình, bạn bè đã luôn ở bên, ủng hộ, động viên tinh thần cho em trong suốt quá trình thực hiện đồ án.
Xin kính chúc quý thầy cô mạnh khỏe, hạnh phúc, tiếp tục đạt được nhiều thành công trong nghiên cứu khoa học cũng như trong sự nghiệp trồng người.
Trang 2TÓM TẮT NỘI DUNG ĐỒ ÁN TỐT NGHIỆP
Đồ án giới thiệu một phương pháp mô hình hóa mờ mới sử dụng tập mờ loại hai ứngdụng trong dự báo trong điều khiển tài chính cụ thể là dự báo giá của cổ phiếu trong thịtrường chứng khoán Sử dụng kỹ thuật mô hình hóa mờ trong dự báo tài chính có ý nghĩathực tiễn rất lớn, đặc biệt trong lĩnh vực thị trường chứng khoán, và việc sử dụng phươngpháp mới này góp phần làm tăng độ chính xác trong kết quả tính toán so với các phươngpháp đã từng được sử dụng trước đây với tập mờ loại một thông thường Mô hình xây
dựng trong đồ án dựa trên nền tảng Hệ suy diễn mờ Mamdani, được kết cấu từ một bộ các
mô hình mờ nhúng; sau đó lựa chọn ra mô hình phù hợp nhất để suy diễn với bất cứ một
dữ liệu đầu vào cho trước nào Kết qủa thực nghiệm trên dữ liệu cổ phiếu do Michio
Sugeno và Takahiro Yasukawa cung cấp trong “A Fuzzy-Logic-Based Approach to
Qualitative Modeling” lEEE TRANSACTIONS ON FUZZY SYSTEMS, VOL I, NO.
I FEBRUARY 1993
Trang 3ABSTRACT OF THE THESIS
My project introduces a new fuzzy system modeling method, that using Type 2 fuzzy
sets in finance control, specifically, is stock price prediction in securities market.
Applying fuzzy system modelling technology in finance prediction has a major practicalmeaning Especially, in securities market area, and the usage of this new method cancontribute to increasing degree of accuracy in calculating result in compared with the
methods have used before with normal Type 1 fuzzy sets The built model in project was
based on the foundation of “ Mamdani Fuzzy Deducing System”, that was compositedfrom a set of embedding fuzzy model; then choose the most appropriate model to deducewith any given input data The experimental result on stock data supported by MichioSugeno and Takahiro Yasukawa in “ A Fuzzy-Logic-Based Approach to QualitativeModeling” LEEE TRANSACTIONS ON FUZZY SYSTEM, VOL I NO I.FEBRUARY 1993
Trang 4PHIẾU GIAO NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP
1 Thông tin về sinh viên
Họ và tên sinh viên:
Điện thoại liên lạc: 0904 572 594 Email: son.workingnow@gmail.com
Lớp: HTTTB - K50 Hệ đào tạo: Đại học chính quy
Đồ án tốt nghiệp được thực hiện tại: Bộ môn HTTT – Viện CNTT & Truyền Thông
Thời gian làm ĐATN: Từ ngày 16 / 02 /2010 đến 28 / 05 /2010
2 Mục đích nội dung của ĐATN
Tìm hiểu về logic mờ và mô hình hóa mờ Xây dựng bộ mô hình mờ nhúng từ bộ dữ liệu luyệntập, mô phỏng hệ thống dự báo giá cổ phiếu trong thị trường chứng khoán
3 Các nhiệm vụ cụ thể của ĐATN
- Tìm hiểu về logic mờ và mô hình hóa mờ:
+ Tìm hiểu về logic mờ: các khái niệm trong lý thuyết tập mờ có liên quan đến mô hình
hóa mờ
+ Tìm hiểu về mô hình hóa mờ sử dụng tập mờ loại một thông thường và tập mờ loại hai
rời rạc
- Xây dựng hệ suy diễn mờ sử dụng công cụ Fuzzy Logic Toolbox của Matlab
- Xây dựng hệ thống dự báo giá cổ phiếu bằng Matlab với mục đích nghiên cứu, có giao diện dễ
sử dụng
- Đánh giá kết quả và so sánh với các phương pháp khác
4 Lời cam đoan của sinh viên:
Tôi Đào Mạnh Sơn cam kết ĐATN là công trình nghiên cứu của bản thân tôi dưới sự hướng dẫncủa PGS.TS Trần Đình Khang
Các kết quả nêu trong ĐATN là trung thực, không phải là sao chép toàn văn của bất kỳ côngtrình nào khác
5 Xác nhận của giáo viên hướng dẫn về mức độ hoàn thành của ĐATN và cho phép bảo vệ:
Hà Nội, ngày tháng năm
Trang 5MỤC LỤC
Lời cảm ơn 1
TÓM TẮT NỘI DUNG ĐỒ ÁN TỐT NGHIỆP 2
ABSTRACT OF THE THESIS 3
PHIẾU GIAO NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP 4
MỤC LỤC 5 DANH MỤC BẢNG VÀ HÌNH VẼ 7
THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT LỜI MỞ ĐẦU 8
LỜI MỞ ĐẦU 9 CHƯƠNG I: GIỚI THIỆU ĐỀ TÀI 10
1.1 GIỚI THIỆU ĐỀ TÀI 10
1.2 MỤC TIÊU VÀ GIẢ I PHÁP 10
1.2.1 Mục tiêu 10
1.2.2 Giải pháp 10
1.2.2.1 Tìm hiểu về logic mờ và mô hình hóa 10
1.2.2.2 Xây dựng bộ mô hình mờ loại một nhúng 10
1.2.2.3 Xây dựng mô hình mờ loại hai 11
1.3 NỘI DUNG ĐỒ ÁN 11
1.4 KẾT LUẬN 12
CHƯƠNG II: CÁC KHÁI NIỆM CƠ BẢN 13
2.1 GIỚI THIỆU 13
2.2 CÁC KHÁI NIỆM CƠ BẢN 13
2.2.1 Tập mờ loại một (type 1 fuzzy sets) 13
2.2.2 Một số dạng hàm thuộc loại một và các tính chất 15
2.2.3 Luật mờ if-then (if then rules) 18
2.3 MÔ HÌNH HÓA MỜ 21
2.4 MÔ HÌNH MỜ SỬ DỤNG TẬP MỜ LOẠI MỘT 25
2.4.1 Kiến trúc 25
2.4.2 Hoạt động của mô hình mờ sử dụng tập mờ loại một 26
2.4.3 Mô hình mờ Mamdani 27
2.5 MÔ HÌNH MỜ SỬ DỤNG TẬP MỜ LOẠI HAI KHOẢNG RỜI RẠC 28
2.5.1 Phương pháp phân cụm FCM (Fuzzy C-Means Clustering) 30
2.5.2 Sinh hàm thuộc 36
2.6 KIẾN TRÚC VÀ NGUYÊN LÝ HOẠT ĐỘNG CỦA HỆ MỜ TRONG DỰ BÁO GIÁ CỔ PHIẾU 37
2.7 KẾT LUẬN 38
CHƯƠNG III: XÂY DỰNG MÔ HÌNH MỜ 40
3.1 XÂY DỰNG CÁC MÔ HÌNH MỜ NHÚNG 40
3.2 XÂY DỰNG MÔ HÌNH MỜ NHÚNG SỬ DỤNG TẬP MỜ LOẠI HAI RỜI RẠC 40
Trang 63.2.1 Tối ưu mô hình mờ loại hai 40
3.2.2 Xây dựng bảng tra cứu m 41
3.2.3 Các bước suy diễn 41
3.2.4 Bộ dữ liệu huấn luyện 44
3.3 KẾT LUẬN 47
CHƯƠNG IV: XÂY DỰNG HỆ THỐNG DỰ BÁO GIÁ CỔ PHIẾU TRONG THỊ TRƯỜNG CHỨNG KHOÁN 48
48 4.1.1 Xây dựng mô hình mờ với Fuzzy Logic Toolbox của Matlab 48
4.1.1.1 FIS Editor 49
4.1.1.2 Membership Function Editor 50
4.1.1.3 Rule editor 52
4.1.1.4 The Rule Viewer 54
4.1.1.5 The Surface Viewer 55
4.2.1 Xây dựng hệ suy diễn bằng công cụ của Matlab 57
4.2.2 Xây dựng hệ thống dự báo giá cổ phiếu 61
4.2.2.1 Chức năng và phạm vi ứng dụng 61
4.2.2.3 Thiết kế chương trình 65
4.3 KẾT LUẬN 68
CHƯƠNG V: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 69
5.1 KẾT LUẬN 69
5.2 PHƯƠNG HƯỚNG PHÁT TRIỂN 69
TÀI LIỆU THAM KHẢO 71
Trang 7
DANH MỤC BẢNG VÀ HÌNH VẼ
Hình 2.1: Một số dạng hàm thuộc thông dụng……… 16 Hình 2.2: Hàm thuộc có mức chuyển đổi tuyến tính……… 16 Hình 2.3: Miền xác định và miền tin cậy của một tập mờ……… 17 Hình 2.4: Hàm thuộc tuyến tính từng khúc dạng tam giác (trimf) và dạng hình thang
(trapmf) ……….18
Hình 2.5: Một số dạng hàm thuộc trơn……… 19 Hình 2.6: Ví dụ về hàm thuộc loại hai.……….21 Hình 2.7: Sơ đồ chu trình nhận dạng hệ thống tổng quát 22
Hình 2.8: Sơ đồ quá trình mô hình hoá mờ và ba giai đoạn chính của nó 24
Hình 2.9: Cơ chế suy diễn mờ 26
Hình 2.10: Mô hình mờ Mamdani sử dụng product và max lần lượt cho phép toán AND
Hình 2.14: Phân cụm dữ liệu theo phương pháp K-means 33
Hình 2.15 : Phân cụm dữ liệu theo phương pháp Fuzzy C-means 33
Hình 2.16: Phân cụm 20 dữ liêu thô 35
Hình 2.17: Phân cụm dữ liệu với m = 2 35
Hình 2.18: Tối ưu phân cụm dữ liệu 36
Hình 2.19: Dạng hàm thuộc của các biến đầu vào và biến đầu ra 37
Hình 2.20: Kiến trúc mô hình mờ loại hai được sử dụng 38
Hình 2.21: Kiến trúc và nguyên tắc hoạt động của mô hình mờ nhúng 39
Hình 3.1: Bộ dữ liệu cổ phiếu luyện tập của cổ phiếu A 44
Hình 3.2: Bộ dữ liệu kiểm thử của cổ phiếu A 45
Hình 3.3: biểu đồ mức độ thay đổi giá của cổ phiếu A 46
Hình 3.4: Tập luật cơ sở của Michio Sugeno và Takahiro Yasukawa 47
Hình 4.1: Giao diện đồ họa của Matlab mô phỏng hệ suy diễn mờ 50
Hình 4.2: Cửa sổ giao diện (Fuzzy Inference system) 51
Hình 4.3: Khai báo các tham số vào ra hệ thống 52
Hình 4.4: Hàm thuộc tương ứng với các biến vào ra 53
Trang 8Hình 4.5: Định nghĩa hàm thuộc cho từng biến 54
Hình 4.6: Xây dựng cơ sở luật 55
Hình 4.7: Sơ đồ của quá trình suy diễn 55
Hình 4.8: Surface Viewer 56
Hình 4.9: Fuzzy C-means Clustering Demo 57
Hình 4.10: Khai báo số biến vào ra mô hình 58
Hình 4.11: Dạng hàm thuộc tương ứng với các biến vào ra 59
Hình 4.12: Tập luật được học từ tập dữ liệu huấn luyện 59
Hình 4.13: Cấu trúc mô hình suy diễn, hàm thuộc của các biến vào ra và tập luật của mô
Hình 4.17: Thiết kế form giao diện chương trình 63
Hình 4.18: Hàm Callback của button “Setup System” 64
Hình 4.19: Giao diện chương trình 65
Hình 4.20: Chọn bộ dữ liệu huấn luyện 65
Hình 4.21: Chức năng Optimal c 67
Hình 4.22: Thực hiện kiểm thử và hiện mô hình mờ nhúng tương ứng 67
Hình 4.23 : Bộ dữ liệu mẫu và dữ liệu huấn luyện mô hình theo giải thuật FDT 68
Hình 4.24 : Cây quyết định dự báo giá cổ phiếu 68
Hình 4.25 : Hệ suy diễn mờ Anfis 69
Hình 4.26 : Kiến trúc mạng nơron 70
Hình 4.27 : Các bộ dữ liệu kiểm thử và kết quả cho mô hình Anfis 70
Hình 4.28: Kết quả sai số của các phương pháp khác đánh giá theo RMSE 71
Trang 9THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT
Thuật ngữ Giải thích
FCM Viết tắt của Fuzzy C-Means, là phương pháp phân cụm mờ giúp chúng ta
xác định các tâm cụm dữ liệu và độ thuộc của từng dữ liệu đối với từngcụm mờ
LFR Viết tắt của Linguistic Fuzzy Rulebase là cơ sở luật ngữ nghĩa dùng cho
các mô hình mờ điển hình là mô hình Mamdani
FT2FS Viết tắt của Full Type 2 Fuzzy Sets, FT2FS là một bộ mờ đặc trưng với
một hàm thuộc mờ hơn là với một giá trị vô hướng trong khoảng đơn vị
IVT2FS Viết tắt của Interval Type 2 Fuzzy Sets, IVT2FS là một trường hợp đặc
biệt của FT2FS khi có độ thuộc thứ cấp bằng 1
DT2FS Viết tắt của Discrete Type 2 Fuzzy Sets, giống với IVT2FS nhưng với các
giá trị rời rạc
RMSE Viết tắt của Root Mean Square Error, sai số bình phương tiêu chuẩn là chỉ
tiêu được dùng để đánh giá sai số trong đồ án
FDT Viết tắt của Fuzzy Decision Tree, là giải thuật cây quyết định dùng trong lo
– gic mờ được Mohd Noor Md Sap và Rashid Hafeez Khokhar sử dụng để
dự báo chiều tăng giảm của giá cổ phiếu
ANFIS Viết tắt của Adaptive Neuro-Fuzzy Inference System, là một kỹ thuật ghép
nối giữa điều khiển mờ và mạng nơ-ron đã mang lại nhiều thành công trong
kỹ thuật điều khiển
NN Viết tắt của Notron Network, là phương pháp mạng nơ-ron.
LR Viết tắt của Linear Regression, là phương pháp hồi quy tuyến tính
Trang 10LỜI MỞ ĐẦU
Kỹ thuật mô hình hóa trải qua thời gian đã chứng tỏ được thế mạnh và tầm quan trọngcủa mình, nó giúp con người mô phỏng lại hệ thống thực, có thể bắt chước đủ chính xáchành vi của hệ thống đó, thể hiện qua phản ứng đầu ra của mô hình khi có tác động phíađầu vào so với thực nghiệm Mô hình được xây dựng có ý nghĩa rất quan trọng trong thựctiễn, nó giúp con người tiết kiệm được chi phí cũng như hạn chế những tổn thất so vớithực nghiệm trong thế giới thực Bằng việc tiến hành kiểm thử trên mô hình chúng ta sẽtiêu tốn ít thời gian hơn, công việc phải làm đơn giản hơn ví dụ như thay vì việc phảichờ đợi một thời gian dài để quan sát một phản ứng hóa học trơ, ta có thể tiến hành trênmột mô hình phản ứng mà công việc phải làm chỉ là cung cấp thông tin về lượng và chấttham gia phản ứng rồi quan sát kết quả thu được Yếu tố thời gian ở đây coi như đã bịloại bỏ
Kĩ thuật mô hình hóa dựa trên công nghệ logic mờ cũng hội tụ đầy đủ các đặc trưngtrên Tuy nhiên, lý thuyết tập mờ thông thường tiềm ẩn những mẫu thuẫn nhất định Đó là
để phát triển bất cứ mô hình logic mờ nào, người thiết kế phải xây dựng hàm thuộc chocác tập mờ trong hệ, hay là phải mô tả sự không chắc chắn bằng các hàm thuộc rõ ràng,chắc chắn Điều đó có nghĩa là việc biểu diễn sự không chắc chắn lại sử dụng các độthuộc mà bản thân chúng là các số thực chính xác
Năm 1975, Zadeh giới thiệu khỏi niệm tập mờ loại hai nhằm giải quyết vấn đề trên Đó
là thay vì độ thuộc là một số thực như với tập mờ thông thường, với tập mờ loại hai, độthuộc là một tập mờ loại một trên đoạn [0, 1] Tập mờ loại hai thường được sử dụng trongnhững trường hợp khó xác định chính xác giá trị độ thuộc của các phần tử trong khônggian nền Trong báo cáo Đồ án tốt nghiệp này, em xin được trình bày về một kĩ thuật môhình hóa mờ sử dụng tập mờ loại hai, một sự mở rộng của mô hình hóa mờ sử dụng tập
mờ loại một, từ đó ứng dụng vào hệ thống dự báo giá cổ phiếu trong thị trường chứngkhoán
Em xin chân thành cảm ơn.
Trang 11CHƯƠNG I: GIỚI THIỆU ĐỀ TÀI 1.1 GIỚI THIỆU ĐỀ TÀI
Đề tài “Ứng dụng mô hình hóa mờ trong dự báo giá cổ phiếu” là một trong những ứngdụng của logic mờ trong bài toán dự đoán Đồ án giúp hiểu rõ hơn về lí thuyết tập mờloại hai là sự phát triển nâng cao của tập mờ loại một, và ứng dụng trong việc dự đoán giá
cổ phiếu thị trường chứng khoán
Đồ án không chỉ giúp ta hiểu được về lí thuyết tập mờ nâng cao, xây dựng được môhình mờ mà còn giúp ta có thề mở rộng hướng phát triển, xây dựng được mô hình với độchính xác cao hơn có thể áp dụng được vào bài toán thực tế
1.2.2.1 Tìm hiểu về logic mờ và mô hình hóa.
Tìm hiểu các lí thuyết cơ bản về logic mờ loại một Các bước của một quá trình môhình hóa mờ sử dụng tập mờ loại hai rời rạc
1.2.2.2 Xây dựng bộ mô hình mờ loại một nhúng
Mô hình suy diễn mờ nhúng loại một dựa trên cơ sở mô hình mờ Mamdani với ba đầuvào và một đầu ra Biến vào thể hiện thông tin giá cổ phiếu ngày cần dự báo Thông tinđầu vào đã qua xử lí thô trước khi đưa vào học luật
Xây dựng tập luật cho mỗi mô hình mờ loại một nhúng từ dữ liệu thực nghiệm dựatheo phương pháp phân cụm Fuzzy C-Means với các giá trị độ mờ ( kí hiệu m- xác định
độ chồng chéo giữa các cụm mờ ), và với số cụm mờ ( kí hiệu c ) khác nhau
Trang 121.2.2.3 Xây dựng mô hình mờ loại hai
Sau khi xây dựng được bộ các mô hình mờ loại một nhúng, chúng được kết hợp với nhau tạo thành mô hình mờ loại hai, mỗi quan hệ thông qua bảng tra cứu m ( m-lookup table )
Sau khi xây dựng được tập luật bằng việc học từ dữ liệu thực nghiệm, sử dụng công
cụ Matlab để xây dựng lại hệ suy diễn mờ cho bài toán
Hoạt động của mô hình: Từ một vector giá trị rõ đầu vào biểu thị thông tin cho giá cổphiếu, lựa chọn mô hình mờ nhúng phù hợp, qua quá trình suy diễn ta có được thông tingiá cổ phiếu
Công cụ dự kiến sử dụng Fuzzy logic toolbox của Matlab
1.3 NỘI DUNG ĐỒ ÁN
Đồ án Chia làm năm chương và phụ lục các bảng và hình vẽ và kết quả tập luật thuđược từ thuật toán Nội dung gồm có:
Chương I: Giới thiệu đề tài
Chương này nhằm giới thiệu nội dung của đề tài, mục tiêu và giải pháp cho đề tài
Chương II: Các khái niệm cơ bản
Giới thiệu các khái niệm cơ bản về logic mờ cũng như mô hình hóa mờ
Chương III: Xây dựng mô hình mờ sử dụng tập mờ loại hai cho bài toán dự báo thị
trường chứng khoán
Đưa ra thuật toán xây dựng tập các mô hình mờ sử dụng tập mờ loại một nhúng
mờ dự trên tập dữ liệu thực nghiệm Kết hợp bộ các mô hình mờ nhúng đó thành
mô hình mờ loại hai
Chương IV: Xây dựng hệ thống dự đoán giá cổ phiếu trong thị trường chứng khoán
Thực hiện mô phỏng hệ thống bằng công cụ Matlab So sánh và đánh giá vớicác phương pháp khác
Trang 13Chương V: Kết luận và hướng phát triển
Đưa ra kết luận những kết quả đạt được, những kết quả hướng tới và so sánh vớikết quả khi sử dụng những phương pháp khác Từ đó đề ra phương hướng pháttriển đề tài để ứng dụng vào thực tế
1.4 KẾT LUẬN
Chương I đã đưa ra được nội dung đề tài cũng như cái nhìn chung cho hướng triểnkhai của đồ án Giúp người đọc dễ theo dõi và nắm bắt vấn đề Các chương sau sẽ đi vàophân tích cụ thể về lí thuyết và cách triển khai
Trang 14CHƯƠNG II: CÁC KHÁI NIỆM CƠ BẢN 2.1 GIỚI THIỆU
Kỹ thuật mô hình hóa mờ là một hướng tiếp cận của bài toán mô hình hóa Để trình
bày một cách có hệ thống, đồ án đưa ra các khái niệm cơ bản trong lý thuyết tập mờ cóliên quan Tiếp theo sẽ trình bày các vấn đề về mô hình hóa nói chung và xoay quanh vần
đề chính - mô hình mờ.
2.2 CÁC KHÁI NIỆM CƠ BẢN
Mô hình mờ là cơ cấu tính toán dựa trên các khái niệm của lý thuyết tập mờ, các tập
luật if-then mờ, cùng với cơ chế suy diễn mờ Lý thuyết tập mờ lần đầu tiên được
Lotfi.A.Zadeh, một giáo sư thuộc trường Đại học Caliornia, Berkley, giới thiệu trong một
công trình nghiên cứu vào năm 1965 Lý thuyết tập mờ bao gồm logic mờ, số học mờ,
quy hoạch toán học mờ, hình học tôpô mờ, lý thuyết đồ thị mờ, và phân tích dữ liệu mờ,
mặc dù thuật ngữ logic mờ thường được dùng chung cho tất cả.
Logic mờ là siêu tập hợp các phép toán thông thường Đại số Boolean để mở rộng
chấp nhận khái niệm gần đúng nằm giữa hai khái niệm tương ứng với hai mức logic hoàntoàn đúng và hoàn toàn sai
2.2.1 Tập mờ loại một (type 1 fuzzy sets)
Về mặt toán học: Một tập mờ F xác định trên một tập kinh điển X là một tập mà mỗi
phần tử của nó là các cặp giá trị (x, F (x) ) trong đó x X mà F(x) là ánh xạ:
F(x): X [0.0;1.0] (2-1)Ánh xạ F được gọi là hàm thuộc của tập mờ F Tập kinh điển X được gọi là tập nền
hay tập vũ trụ của tập mờ F
Trong đó:
F là nhãn mờ biến x, thường mang một ý nghĩa ngôn ngữ nào đó, mô tả định tính thuộc tính của đối tượng , chẳng hạn như già, trung niên, trẻ, cao, trung bình, thấp…
Trang 15x là một biến ngôn ngữ Biến ngôn ngữ là một biến nhận các giá trị ngôn ngữ(linguistic tems) Trong đó mỗi giá trị ngôn ngữ là một tập mờ được xác định bằng hàmthuộc và một khoảng giá trị xác định Lý thuyết mờ cho phép các tập mờ này có thể phủlên nhau
Về mặt logic: Tập mờ diễn đạt mức độ chân lí của một phát biểu (mệnh đề) với 0.0
đại diện cho mức hoàn toàn sai và 1.0 đại diện cho mức hoàn toàn đúng
Chẳng hạn khi đưa ra mệnh đề:
“Ông Minh đã già”
Nếu như ông Minh đang ở tuổi 72, chúng ta có thể gán cho phát biểu trên một giá trịchân lý là 0.80
Về phương diện lý thuyết tập hợp, tập mờ biểu thị mức độ trực thuộc khác nhau của các cá thể trong một tập hợp Trở lại ví dụ trên, ta có thể hiểu là: “Ông Minh là một
thành viên của tập những người già với độ thuộc là 0.8”.
Diễn đạt hình thức ta có :
Mem OLD ( Mr.Minh ) = 0.8
Trong đó, Mem OLD ( ) là một hàm thuộc dùng để biểu diễn tập mờ Người già, trả về
giá trị nằm trong khoảng [0.0, 1.0] ở đây, cần lưu ý tới sự khác biệt giữa hệ mờ với xác
suất Cả hai đều xác định trên cùng một khoảng số, những giá trị tương tự nhau : 0.0 đại
diện cho trạng thái Sai ( hay không thuộc ), và 1.0 tượng trưng cho trạng thái Đúng ( hay
thuộc ) Tuy nhiên, cùng ví dụ nêu trên, nếu diễn đạt bằng ngôn ngữ tự nhiên, theo quan
điểm xác suất ta nói : " Có 80% cơ hội để kết luận ông Minh đã già ", trong khi đó, theo quan điểm lý thuyết tập mờ ta nói : " Ông Minh có mức độ trực thuộc nhóm những người
già là 0.8 "
Xét về ngữ nghĩa rõ ràng có sự khác biệt : Phát biểu đầu cho biết ông Minh có thể già hoặc không già ( nghĩa là vẫn tuân theo logic hai trị kinh điển); ta chỉ chắc chắn 80% về việc ông Minh đã già Ngược lại, phát biểu thứ hai cho phép ta khẳng định ông Minh ít
nhiều đã già, và mức độ già của ông được đánh giá bằng một con số tương ứng là 0.8.
Trang 162.2.2 Một số dạng hàm thuộc loại một và các tính chất
Hàm thuộc là đường cong định nghĩa mỗi điểm tương ứng ở không gian đầu vào ánh
xạ tương ứng sang mức trực thuộc một giá trị ngôn ngữ nằm giữa 0.0 và 1.0 ( page 37
Fuzzy Logic Toolbox User’s Guide)
Hình 2.1: Một số dạng hàm thuộc thông dụng
Các hàm thuộc F(x) có dạng “trơn” được gọi là các hàm thuộc kiểu S Đối với hàm
liên thuộc kiểu S do các công thức biểu diễn F (x) có độ phức tạp lớn nên thời gian tínhtoán cho độ thuộc của một phần tử lâu Một hàm thuộc tuyến tính từng đoạn gọi là hàmthuộc có mức chuyển đổi tuyến tính
Hình 2.2: Hàm thuộc
có mức chuyển đổi tuyến tính
Hàm thuộc có mứcchuyển đổi tuyến tínhtừng mức được xácđịnh bởi các đặc tính như:
Trang 17Độ cao của tập mờ F (trên tập nền X) là giá trị:
h = supx M F(x) (2-2)
Kí hiệu supx M F(x) chỉ giá nhỏ nhất trong tất cả các giá trị chặn trên của F Mộttập mờ có ít nhất một phần tử có độ thuộc bằng 1 được gọi là tập mờ chính tắc tức là h=1.Ngược lại tập mờ có h<1 là tập mờ không chính tắc
Miền xác định của tập mờ F trên tập nền X được kí hiệu bởi S là tập con của X
Hình 2.3: Miền xác định và miền tin cậy của một tập mờ
Một số dạng hàm thuộc trong logic mờ:
Trang 18Hình 2.4 Hàm thuộc tuyến tính từng khúc dạng tam giác (trimf) và dạng hình thang (trapmf)
Trang 19Hình 2.5: Một số dạng hàm thuộc trơn
2.2.3 Luật mờ if-then (if then rules)
Hầu hết các hệ thống hoạt động dựa trên nền tảng logic mờ đều dùng luật để biểu diễnmối quan hệ giữa các biến ngôn ngữ và để rút ra hành động tương ứng đối với đầu vào Luật mờ là biểu thức điều kiện có dạng “Nếu A thì B” trong đó A và B là nhãn củacác tập mờ được mô tả bằng cách xấp xỉ các hàm thành viên Nhờ vào dạng rút gọn, luật
mờ thường được dùng để thiết lập những phương thức lập luận không chính xác nhằmthực hiện tính đa dạng của con người
Một luật bao gồm hai phần : phần điều kiện (nếu) và phần kết luận (thì) Phần điềukiện có thể gồm nhiều điều kiện, kết hợp với nhau bằng các liên từ như và (and) , hoặc
Luật mờ do Tagaki và Sugeno đề xuất:
Ví dụ: Nếu lưu lượng dòng chảy cao thì mực nước sông = k* lưu lượng dòng chảy
Trong đó cao là phần giả thiết được mô tả bời hàm thành viên xấp xỉ Tuy nhiên phần
kết luận được định nghĩa theo biến lưu lượng dòng chảy
2.4.4 Tập mờ loại hai (type 2 fuzzy sets)
Lý thuyết tập mờ thông thường (tập mờ loại một) luôn tiềm ẩn những mâu thuẫn nhấtđịnh Đó là để phát triển bất cứ hệ logic mờ nào, người thiết kế phải xây dựng hàm thuộccho các tập mờ sử dụng trong hệ, hay là phải mô tả sự không chắc chắn bằng các hàmthuộc rõ ràng, chắc chắn Điều đó có nghĩa là việc biểu diễn sự không chắc chắn lại sửdụng các độ thuộc mà bản thân chúng là các số thực chính xác
Trang 20Năm 1975, Zadeh giới thiệu khái niệm tập mờ loại hai nhằm giải quyết vấn đề trên Đó
là thay vì độ thuộc là một số thực như với tập mờ thông thường, với tập mờ loại hai, độthuộc là một tập mờ loại một trên đoạn [0, 1] Tập mờ loại hai thường được sử dụng trongnhững trường hợp khó xác định chính xác giá trị độ thuộc của các phần tử trong khônggian nền
Trong mục này, ta sẽ giải thích tập mờ loại hai mở rộng sử dụng trong cơ sở luật mờngữ nghĩa (Linguistic Fuzzy Rulebase – LFR)
Cấu trúc LFR có thể được hình thức hóa bằng biểu thức
Nó có thể mở rộng tập mô hình LFR với các tập mờ loại hai bằng cách sử dụng :
i) Tập mờ loại hai đầy đủ ( Full Type 2 Fuzzy Sets - FT2FS )
ii) Tập mờ loại hai khoảng ( Interval Type 2 Fuzzy Sets - IVT2FS )
iii) Tập mờ loại hai rời rạc ( Discrete Type 2 Fuzzy Sets - DT2FS )
Mendel đã kí hiệu cho ba kiểu tập mờ loại hai trên như là một bộ để chọn lựa FT2FS
là một bộ mờ đặc trưng với một hàm thuộc mờ hơn là là với một giá trị vô hướng trong khoảng đơn vị Do đó, FT2FS A, được kí hiệu Ã, có thể được hình thức hóa như sau :
Với Jx là một tập con của khoảng đơn vị, X RNV là miền của x, u Jx là độ thuộc
sơ cấp kết hợp với xX, f x (u) là hàm thuộc thứ cấp ánh xạ từ độ thuộc sơ cấp sang
khoảng đơn vị ( ví dụ, fx(u): [0,1] [0,1] và NV là số các biến đầu vào trong mô hình hệ thống
Tương tự, IVT2FS có thể được giảng giải đơn giản như là việc ánh xạ từ tập vũ trụ củamột biến sang khoảng đơn vị [0,1] Do vậy, IVT2FS là một trường hợp đặc biệt của FT2FS với fx(u): [0,1] 1 và có thể biểu diễn như sau :
Trang 21i=1, ,NM , với NM là số các giá trị thành phần được liên kết với một giá trị đặc biệt xX.
Khi fx(u) = 1 u jx [0, 1] thì các hàm thuộc thứ cấp là các tập khoảng nếu điều này là đúng với mọi x X, khi đó chúng ta gọi tập mờ loại hai này là tập mờ loại hai khoảng và chúng ta có hàm thuộc lọai hai khoảng
Các nghiên cứu gần đây chỉ ra rằng các trường hợp không chắc chắn có thể được kiểm soát tốt hơn bằng cách sử dụng các tập mờ ở mức độ cao hơn, ví dụ như tập mờ loại hai,
nó có thể nén và xử lí thông tin, dữ liệu tốt hơn
2.3 MÔ HÌNH HÓA MỜ
Bản chất của mô hình là một hình thái mô phỏng của hệ thống thực, có thể bắt chước
đủ chính xác hành vi của một hệ thống, thể hiện qua phản ứng đầu ra của mô hình khi cótác động từ phía đầu vào so với thực nghiệm
Mô hình hoá hay nhận dạng hệ thống là quá trình đi từ việc xác lập các tham số mô
hình cho tới khi điều chỉnh được mô hình " ăn khớp " với hoạt động của hệ thống thực
Chu trình tổng quát của quá trình nhận dạng hệ thống hay mô hình hoá:
00.20.40.60.81
(
~ x u A
1
Hình 2.6: Ví dụ về hàm thuộc loại hai
Trang 22Bước khởi tạo, cấu trúc mô hình được lựa chọn theo tri thức tiên nghiệm Kế đến giaiđoạn điều khiển thích nghi được tiến hành trên tập dữ liệu mẫu Tiếp theo, hiệu nănghoạt động của mô hình được kiểm thử, thông thường là kết hợp cả phương pháp địnhtính và phương pháp thống kê Nếu mô hình sinh ra không đáp ứng được yêu cầu, thiết
kế ban đầu sẽ được sửa lại, và quá trình trên lặp lại cho tới khi một mô hình chấp nhậnđược ra đời Để tới đích, quá trình có thể trải qua một lượng đáng kể các bước lặp và do
đó chi phí tính toán cũng như thời gian là khá lớn
Hình 2.7: Sơ đồ chu trình nhận dạng hệ thống tổng quát.
Mô hình hóa mờ:
Nhìn chung, quá trình mô hình hoá mờ liên quan tới ba giai đoạn, Giai đoạn đầu tiên
thực hiện việc lựa chọn cấu trúc mô hình Cấu trúc mô hình chứa đựng đặc tả cơ bản của
mô hình mờ bao gồm các thông tin về đầu vào, đầu ra mô hình, các giá trị ngôn ngữbiểu diễn mỗi biến mờ, các định nghĩa hàm thuộc đặc trưng cho mỗi giá trị ngôn ngữ,định nghĩa toán tử hợp thành sử dụng trong suy diễn, cơ chế mờ hoá và khử mờ, vân vân.Các thông tin này có thể thu thập từ tri thức về vật lý hệ thống, thông thường được biểudiễn dưới dạng công thức toán học Cũng có khi, các thông tin này được khai thác từnhững dữ liệu thực nghiệm trên hệ thống thực Kinh nghiệm của những thao tác viên hệ
Dữ liệu thống kê kiểm thử Các yêu cầu định
Đúng
Sai
Lựa chọn cấu trúc mô hình
Lựa chọn cấu trúc mô hình
Điều khiển thích nghi
Trang 23thống biểu diễn dưới dạng các luật ngôn ngữ IF-THEN cũng là nguồn tri thức quan trọng
để xây dựng lên cấu trúc cơ sở của một mô hình mờ
Giai đoạn thứ hai gắn liền với thuật toán học áp dụng cho mô hình Trên cơ sơ cấu
trúc mô hình cơ bản hình thành trong giai đoạn một, giai đoạn hai thực hiện quá trìnhbiên dịch các mẫu học và chuyển đổi chúng thành các luật mờ trong cơ sở tri thức(cơ sởluật )
Giai đoạn ba thực hiện quá trình suy diễn dựa trên các luật mờ đã được đúc rút, với
đầu vào là chính tập dữ liệu mẫu, và tạo ra một "tác động " nào đó ở đầu ra của mô hình
lên môi trường hoạt động của hệ thống, và như vậy đã khép lại một chu trình kín
Hình 2.8: Sơ đồ quá trình mô hình hoá mờ và ba giai đoạn chính của nó
Tri thức kinh nghiệm ( các luật ngôn ngữ )
Tập mẫu học
Giai đoạn I:
Xác lập cấu trúc mô hình mờ
Giai đoạn I:
Xác lập cấu trúc mô hình mờ
Giai đoạn II:
Xây dựng cơ sở luật mờ
Giai đoạn II:
Xây dựng cơ sở luật mờ
Giai đoạn III:
Suy diễn mờ
Giai đoạn III:
Suy diễn mờ Môi trường xử lý của
hệ thống thực
Trang 24Hình 2.7 cho thấy đằng sau tất cả các giai đoạn nói trên là tập mẫu học (training set).
Bằng việc xử lý trước tập mẫu học, có thể xác định được các biến quan trọng nhất của hệthống, ước lượng sơ bộ về các phân đoạn mờ mô tả mỗi biến Thêm vào đó, tập mẫu họctốt còn cho phép giảm thời gian hội tụ của các thuật toán mô hình hoá mờ để đạt tới cấutrúc mô hình đích thực Do vậy, lựa chọn tập mẫu học là một khâu quan trọng trong quátrình mô hình hoá mờ Một tập mẫu học tốt phải hội đủ các yếu tố sau:
Các yếu tố thực nghiệm phải được lựa chọn thích đáng, nghĩa là các đầu vào được lựachọn phải có ảnh hưởng tương đối rõ tới đầu ra Ngược lại, nếu như tồn tại các yếu
tố không tác động hoặc tác động không đáng kể tới đầu ra, thì: thứ nhất, làm tăng chiphí thực nghiệm; thứ hai, làm tăng không gian đầu vào bài toán và do đó, làm tăngthời gian tính toán của quá trình mô hình hoá Rõ ràng, điều này đòi hỏi phải có các trithức tiên nghiệm về hệ thống
Các thực nghiệm phải bao trùm mọi dải hành vi của hệ thống thực Điều này ảnhhưởng tới tính toàn diện của cơ sở tri thức của mô hình Chỉ khi được trang bị một trithức đầy đủ, mô hình thu được mới có khả năng phản ứng đúng đắn với mọi tác động
có thể từ phía đầu vào
Số lần thực nghiệm phải đủ lớn Điều này sẽ góp phần hạn chế ảnh hưởng của các yếu
tố nhiễu trong quá trình học
Những vấn đề chính đặt ra trong quá trình mô hình hoá mờ.
Để xây dựng một mô hình mờ mới cho một hệ thống cho trước, người thiết kế cần trảlời những câu hỏi sau đây:
Phải định nghĩa các hàm thuộc như thế nào ? Làm sao để mô tả một biến cho trướcbằng các giá trị ngôn ngữ ? Mỗi giá trị ngôn ngữ được xác lập thế nào là phù hợp ?
Làm thế nào để xây dựng nên cơ sở luật mờ ? Trong mô hình hoá hệ thống kỹ thuật,thông thường, không chuyên gia con người nào có đủ kinh nghiệm để cung cấp một
cơ sở tri thức toàn diện về một hệ thống phức tạp Hơn thế nữa, dưới tác động củayếu tố chủ quan, các tri thức do con người thường gây bàn cãi và phần lớn khônghoàn toàn được công nhận
Cơ chế khử mờ nào là thích hợp đối với một bài toán cho trước ?
Làm cách nào đê nâng cao tính chính xác về mặt tính toán của mô hình ?
Trang 25Vì một mô hình mờ không có nghĩa là một mô hình không chính xác Ít nhất, độ chính
xác phải là chấp nhận được xét về bản chất của bài toán
2.4 MÔ HÌNH MỜ SỬ DỤNG TẬP MỜ LOẠI MỘT
2.4.1 Kiến trúc
Một hệ mờ gồm năm thành phần cơ bản sau:
Cơ sở luật(rules base): là nơi chứa tập các luật mờ if then, thực chất là một tập các
phát biểu hay quy tắc mà con người có thể hiểu được, mô tả hành vi của hệ thống
Tương ứng với mỗi luật ta có một độ tin cậy luật Cij (0.0;1.0) Độ tin cậy của luậtphản ánh sự đúng đắn của luật khi tham gia vào mô hình Nếu độ tin cậy bằng 0.0 tươngứng với việc luật đó không tham gia vào mô hình Mỗi cơ sở luật là sự kết hợp bằng phéptuyển mờ (fuzzy or) của tất cả các luật mờ
Các luật có thể hình thành từ tri thức chuyên gia hay rút ra từ các mẫu thực nghiệm
Cơ sở luật là phần quan trọng nhất của tất cả các mô hình
Bộ tham số mô hình: Bộ tham số mô hình quy định hàm thuộc của các giá trị ngôn ngữ được dung để biểu diễn các biến mờ và luật mờ Giá trị các tham số có thể đánh giá
bằng kinh nghiệm các chuyên gia hay kết quả của quá trình khai phá tri thức từ thựcnghiệm Thông thường cơ sở luật và bộ tham số mô hình được gọi chung là cơ sở tri thức
Cơ chế suy diễn: ( reasoning mechanism) có nhiệm vụ thực hiện thủ tục suy diễn mờ
dựa trên cơ sở tri thức và các giá trị đầu vào để đưa ra một giá trị dự đoán ở đầu ra
Trang 26Hình 2.9: Cơ chế suy diễn mờ Giao diện mờ hoá ( fuzzification interface ) thực hiện chuyển đổi các đầu vào rõ thành
mức độ thuộc các giá trị ngôn ngữ
Giao diện khử mờ ( defuzzification interface ) thực hiện chuyển đổi kết quả suy diễn
mờ thành giá trị đầu ra rõ
2.4.2 Hoạt động của mô hình mờ sử dụng tập mờ loại một
Hoạt động suy diễn của một mô hình mờ có thể tóm tắt thành ba (hoặc bốn) bước nhưsau:
1 Mờ hoá - Các giá trị rõ đầu vào mô hình được dùng làm đối số cho các hàm thuộc
ứng với các giá trị ngôn ngữ tương ứng xuất hiện trong phần giả thiết mỗi luật mờ THEN Kết quả, mô hình thu được độ thuộc của giá trị rõ đối với mỗi giá trị ngôn ngữ( mà thực chất là một tập mờ ) tương ứng trong phần giả thiết mỗi luật Sau bước này, xét
IF-về mặt suy diễn mờ, mô hình đã xác định được giá trị chân lý của các tiền đề nằm trongphần giả thiết của mỗi luật ( ứng với bộ số rõ cụ thể đầu vào) Giá trị chân lý của toàn bộ
phần giả thiết mỗi luật được xác định thông qua phép Hội mờ giữa giá trị chân lý của các
tiền đề thành phần
2 Suy diễn - Giá trị chân lý của phần giả thiết mỗi luật được áp dụng lên phần kết
luận của luật đó thông qua phép Kéo theo mờ Theo đó, với mỗi luật, mô hình thu được ở phần kết luận một tập con mờ Phép Kéo theo mờ thông thường dựa trên hai toán tử là
Min hoặc Product Khi suy diễn theo toán tử Min, tập mờ kết quả suy diễn được hình
thành từ hàm thuộc của giá trị ngôn ngữ phần kết luận bị cắt bởi một đường ngang mà độ
cao tương ứng với mức chân lý phần giả thiết Trong khi đó, với toán tử Product , tập
mờ kết quả suy diễn có hàm thuộc dựa trên hàm thuộc đầu ra của kết luận được co giãntheo một tỉ lệ ứng với mức chân lý của phần giả thiết
3 Kết nhập - Tất cả các tập con mờ ứng với đầu ra của mỗi luật được kết hợp với
nhau ( thông qua phép Hợp mờ ) tạo thành một tập con mờ duy nhất biểu diễn biến mờ
đầu ra cơ chế suy diễn Quá trình tính toán kết nhập thông thường dựa trên hai toán tử là
Max hoặc Sum Với Max, tập mờ tổng hợp đầu ra có giá trị hàm thuộc tại mỗi điểm trên
Trang 27tập nền bằng giá trị hàm thuộc lớn nhất của tất cả các tập con mờ tương ứng ở đầu ra mỗi
luật tại điểm đó Trong khi đó, với Sum, tập mờ tổng hợp đầu ra có giá trị hàm thuộc tại
mỗi điểm trên tập nền bằng tổng giá trị hàm thuộc của tất cả các tập con mờ tương ứng ởđầu ra mỗi luật tại điểm đó
4 Khử mờ - Công đoạn này là tuỳ chọn và được sử dụng khi cần chuyển đổi giá trị
biến ngôn ngữ đầu ra thành một giá trị số rõ ( điều này thường gặp với các mô hình hệthống điều khiển) Có rất nhiều kỹ thuật khử mờ nhưng phổ biến được sử dụng là phương
pháp xác định trọng tâm và phương pháp xác định vùng cực đại ở phương pháp xác định
trọng tâm, giá trị rõ của biến đầu ra được tính toán bằng cách tìm giá trị trọng tâm hàmthuộc của giá trị mờ Còn đối với phương pháp tìm cực đại, giá trị rõ được chọn là giá trị
mà tại đó tập con mờ đạt giá trị chân lý cực đại Nói chung, các phương pháp khử mờ nàyđòi hỏi nhiều chi phí tính toán và không có cách nào để phân tích chúng một cách chínhxác ngoại trừ việc thông qua các nghiên cứu thực nghiệm
2.4.3 Mô hình mờ Mamdani.
Dựa trên loại cơ chế suy diễn mờ và các dạng luật mờ được sử dụng, phần lớn các môhình mờ có thể được xếp vào một trong ba loại mô hình sau: Mô hình mờ Mamdani, môhình mờ Takagi-Sugeno, mô hình mờ Tsukamoto Tuy nhiên để thuận lợi cho việc trìnhbày mô hình hóa mờ, sau đây sẽ trình bày sơ lược về mô hình mờ Mamdani
Mô hình mờ Mamdani (còn gọi là mô hình ngôn ngữ - linguistic models ) được đề
xuất với mục tiêu ban đầu là điều khiển tổ hợp nồi hơi và động cơ hơi nước thông quamột tập luật dạng ngôn ngữ thu được từ những thao tác viên con người có kinh nghiệm
Đây là dạng mô hình điển hình nhất, với bộ luật bao gồm các luật mà phần tiền đề và
phần kết luận đều là các tập mờ Hình 2.5 minh hoạ mô hình Mamdani hai luật điển hình
với một đầu ra z, chịu tác động của hai đầu vào rõ x và y với phép hợp thành product –max và hình 2.6 minh họa với phép hợp thành min-max
Rõ ràng, khả năng diễn đạt luật bằng ngôn ngữ tự nhiên đối với mô hình mamdani rất
dễ dàng và tường minh Tuy nhiên, kết quả của mô hình Mamdani lại là tập mờ tổ hợp từmỗi luật được sử dụng, do đó, khi muốn chiết xuất một giá trị rõ ở đầu ra mô hình, ta cầnchọn một cơ chế khử mờ phù hợp Điều này ít nhiều ảnh hưởng tới chi phí tính toán
Trang 28Hình 2.10: Mô hình mờ Mamdani sử dụng product và max lần lượt cho phép toán AND mờ và
OR mờ
Hình 2 11: Mô hình mờ Mamdani sử dụng min và max lần lượt cho phép toán AND mờ và
OR mờ
2.5 MÔ HÌNH MỜ SỬ DỤNG TẬP MỜ LOẠI HAI KHOẢNG RỜI RẠC
Mendel đề xuất rằng mô hình sử dụng tập mờ loại hai khoảng (IVT2FS) dựa trên các
mô hình loại một được xem như là một bộ các mô hình hệ mờ nhúng Nếu số lượng của
mô hình hệ mờ nhúng loại một xấp xỉ đến vô hạn thì bộ các mô hình đó sẽ cấu thành môhình hệ mờ loại 2 khoảng cơ sở
Trang 29
Hình 2.12: Kiến trúc mô hình mờ sử dụng tập mờ loại hai.
Với mỗi một mô hình mờ loại một nhúng có cấu trúc giống như mô hình mờ Mamdani
định cho m giá trị khác nhau Một bộ các mô hình hệ mờ nhúng loại một sẽ đại diện cho
mô hình hệ mờ loại hai rời rạc
Vì vậy, cấu trúc cơ sở luật mờ loại hai đề xuất, R~ có thể được biểu diễn như sau:
*
~
1 1
i i
Trong đó NM là số các giá trị m được sử dụng trong cấu trúc nhận dạng mr là cấp độ
mờ thứ r ( rth level ) của giá trị mờ, Rir là luật thứ i ( ith rule) xác định bởi việc thực thi giảithuật phân cụm FCM với mr Rir có thể được viết rõ ra như sau :
Trang 30Như vậy với mỗi một mô hình mờ nhúng xác định được chúng ta có một bộ luật cơ sở
và kết hợp lại tạo thành bộ luật cơ sở chung cho cả mô hình mờ loại hai
Theo như ở trên, chúng ta có thể thấy nó không giống như cấu trúc luật mờ cơ sở thôngthường trong đó tiền đề được biểu diễn bởi sự kết tập của các bộ mờ tương ứng với mỗi
một biến đầu vào, tiền đề của cấu trúc đề xuất được biểu diễn với tập mờ W- chiều.
Với việc sử dụng tập mờ W- chiều thay vì phải biểu diễn tập luật là :
Rule 1 : IF X 1 isr A 1,1 AND AND X W isr A 1,W THEN Y isr B 1
……….
Rule c : IF X 1 isr A c,1 AND AND X W isr A 1,W THEN Y isr B c
Thì chúng ta chỉ biểu diễn ngắn gọn như sau :
Rule 1: IF X isr A 1 THEN Y isr B 1
………
Rule c: IF X isr A c THEN Y isr B c
Như vậy các biến đầu vào X1,X2,…,XW sẽ được thay bằng tập không gian đầu vào Wchiều X=(X1,…,XW) và các tập mờ A1…Ac cũng là các tập mờ W chiều
2.5.1 Phương pháp phân cụm FCM (Fuzzy C-Means Clustering)
Giải thuật phân cụm FCM đóng một vai trò quan trọng trong việc xây dựng mô hình
mờ sử dụng tập mờ loại rời rạc Nó giúp chúng ta xác định các tâm cụm dữ liệu và độthuộc của từng dữ liệu đối với từng cụm mờ Từ đó chúng ta có thể gán nhãn được chomỗi cụm mờ để có thể sinh tập luật cơ sở khi cho dữ liệu luyện tập để huấn luyện môhình
Trang 31Việc phân vùng mờ được thực hiện thông qua tối ưu lặp của hàm mục tiêu được trìnhbày ở trên, với những cập nhật của uij thành viên và các trung tâm cụm , cj bởi:
2 1 1
ij i i
m ij i
u x c
ij uij uij , với là giá trị nằm trong khoảng
từ 0 đến 1, và k là số bước lặp Thủ tục này hội tụ tới miền cực tiểu địa phương hay mộtđiểm yên của Jm
Giải thuật phân cụm bao gồm các bước sau:
1 Initialize U=[u ij ] matrix, U (0)
2 At k-step: calculate the centers vectors C (k) =[c j ] with U (k)
Trang 321
N m
ij i i
m ij i
u x c
Trang 33Hình 2.14: Phân cụm dữ liệu theo phương pháp K-means
Thay vào đó, nếu ta sử dụng phương pháp FCM, vẫn là các dữ liệu đó nhưng chúngkhông thuộc hoàn toàn vào một cụm xác định mà có thể thuộc cụm này hoặc cụm kia Trong trường hợp này, hàm thuộc sẽ có đường cong mượt để chỉ ra rằng tất cả dữ liệu
có thể thuộc ở một vài cụm khác nhau với các giá trị độ thuộc vào các cụm là khác nhau
Hình 2.15: Phân cụm dữ liệu theo phương pháp Fuzzy C-means
Ở hình trên, điểm hiển thị dữ liệu đánh dấu màu đỏ thuộc về cụm B nhiều hơn là thuộc
về cụm A Giá trị 0.2 chỉ ra độ thuộc với cụm A cho các dữ liệu Bây giờ, thay cho việc
sử dụng đồ họa, chúng ta sẽ dùng một ma trận U mà các phần tử của nó được lấy từ cáchàm thuộc :
Trang 341 0
0 1
1 0
0.9 0.1
N CU
Ở đây ta vẫn xem xét trường hợp đơn giản với ứng dụng có dữ liệu đầu vào một chiều,
sử dụng phương pháp phân cụm FCM Khởi tạo ban đầu là 20 dữ liệu và 3 cụm để tínhtoán các phần tử của ma trận U Hình dưới cho thấy độ thuộc của mỗi dữ liệu và các cụm.Các dữ liệu cùng màu là thuộc về cùng một cụm phân theo giá trị độ thuộc
Trang 35Hình 2.16: Phân cụm 20 dữ liêu thô
Trong mô phỏng được hiển thị ở trên, chúng ta đã sử dụng giá trị cấp độ mờ m=2, vàthuật toán kết thúc khi max | (k 1) ( )k 0.3
ij u ij u ij
Hình 2.17: Phân cụm dữ liệu với m = 2
Chúng ta có thể tối ưu thuật toán tốt hơn, khi nâng cao độ chính xác nhưng điều đóđồng nghĩa với việc khối lượng tính toán cũng sẽ lơn hơn gấp nhiều lần Hình tiếp theođây cho chúng ta thấy một kết quả tốt hơn khi sử dụng cùng một điều kiện ban đầu, với
=0.01, thì số lượng vòng lặp là 37
Trang 36Hình 2.18: Tối ưu phân cụm dữ liệu
Như vậy, với các khởi tạo ban đầu khác nhau sẽ dẫn đến các tiến triển khác nhau củagiải thuật Trong thực tế, nó có thể hội tụ về kết quả tương tự, nhưng với một số khácnhau các bước lặp
Thực hiện xong giải thuật phân cụm chúng ta sẽ thu được các tâm cụm dữ liệu cùng
ma trận U với các giá trị là độ thuộc của từng dữ liệu đối với từng cụm mờ Chúng ta cóthể gán nhãn cho từng cụm mờ để hỗ trợ cho việc sinh ra tập luật cơ sở đối với bộ dữ liệuluyện tập
2.5.2 Sinh hàm thuộc
Trong mục này chúng ta sẽ đề cập tới vấn đề sinh hàm thuộc cho mô hình mờ nhúng
loại một Để đơn dễ dàng cho việc biểu diễn trong Matlab sau này, ta sẽ xây dựng hàm
thuộc có dạng tam giác như đã được trình bày ở trên
Sau khi dùng giải thuật phân cụm mờ FCM cho bộ dữ liệu luyện tập, ta gán nhãn chotừng cụm mờ Xét bộ dữ liệu luyện tập có ba đầu vào X={x1,x2,x3} và một đầu ra y ta códạng hàm thuộc tam giác như sau:
x1
1
Trang 37x3
y
Hình 2.19: Dạng hàm thuộc của các biến đầu vào và biến đầu ra
Hàm thuộc dạng tam giác được xác định bởi 3 điểm: đỉnh hàm thuộc với giá trị độthuộc bằng 1 đặt tại tâm cụm mờ, còn hai điểm tại đáy tam giác được xác định bằng hai