Các nơron có nhiều đặc điểm chung với các tế bào khác trong cơ thể, ngoài ra chúng còn có những khả năng mà các tế bào khác không có được, đó là khả năng nhận, xử lý và truyền các tín hi
Trang 1LỜI CAM ĐOAN
Tôi xin cam đoan tất cả các nội dung của luận văn này hoàn toàn được hình thành và phát triển từ quan điểm của chính cá nhân tôi, dưới sự hướng dẫn chỉ bảo của PGS.TS Lê Bá Dũng Các số liệu kết quả có được trong luận văn tốt nghiệp là hoàn toàn trung thực
Học viên
Nguyễn Tô Hoán
Trang 2LỜI CẢM ƠN
Để hoàn thành chương trình cao học và viết luận văn này, tôi đã nhận được sự hướng dẫn, giúp đỡ và chỉ bảo nhiệt tình của thầy giáo, cô giáo Trường Đại học Công nghệ thông tin và Truyền thông- Đại học Thái Nguyên Đặc biệt là các thầy của Viện công nghệ thông tin Hà Nội đã tận tình dạy bảo cho tôi trong suốt thời gian học tập tại trường
Tôi xin gửi lời cảm ơn đến PGS.TS Lê Bá Dũng đã dành nhiều thời gian và tâm huyết hướng dẫn tôi hoàn thành luận văn này
Mặc dù tôi đã cố gắng hoàn thiện luận văn bằng tất cả năng lực của mình, song không thể tránh khỏi những thiếu sót, rất mong nhận được sự đóng góp quý báu của các thầy giáo, cô giáo và các bạn
Tôi xin chân thành cảm ơn!
Trang 3MỤC LỤC
LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
MỤC LỤC iii
DANH MỤC CÁC HÌNH VẼ v
DANH MỤC CÁC BẢNG BIỂU vi
DANH MỤC CÁC TỪ VIẾT TẮT vii
MỞ ĐẦU 1
Chương 1 TỔNG QUAN VỀ MẠNG NƠRON NHÂN TẠO VÀ HỆ MỜ 3
1.1 Cấu trúc và mô hình mạng nơron 3
1.1.1 Mô hình một nơron sinh học 3
1.1.2 Mô hình một nơron nhân tạo 4
1.2 Cấu tạo và phương thức làm việc của mạng nơron 7
1.2.1 Mạng nơron truyền thẳng một lớp 8
1.2.2 Mạng nơron truyền thẳng nhiều lớp 9
1.2.3 Mạng nơron phản hồi 9
1.2.4 Mạng nơron hồi quy 10
1.3 Các luật học 10
1.3.1 Học có giám sát 11
1.3.2 Học không có giám sát 12
1.3.3 Học củng cố 13
1.4 Hệ mờ và mạng nơron 14
1.4.1 Kiến trúc của hệ mờ tổng quát 14
1.4.2 Sự kết hợp giữa logic mờ và mạng neural 20
1.5 Kết luận chương 22
Chương 2 MÔ HÌNH MẠNG ANFIS VÀ KHẢ NĂNG ỨNG DỤNG 22
2.1 Hệ suy diễn mờ dựa trên mạng thích nghi 23
Trang 42.1.1 Các mô hình kết hợp giữa hệ mờ và mạng nơron 23
2.1.2 Luật mờ if then và hệ thống suy diễn mờ 24
2.1.3 Mạng thích nghi 26
2.1.4 Cấu trúc mạng ANFIS 27
2.2 Thuật toán ANFIS 29
2.2.1 Thuật toán học lan truyền ngược 29
2.2.2 Thuật toán học lai 35
2.3 Khả năng ứng dụng của mạng ANFIS 37
Chương 3 ỨNG DỤNG MÔ HÌNH MẠNG ANFIS TRONG BÀI TOÁN PHÂN TÍCH ĐÁNH GIÁ DỰ BÁO MỰC NƯỚC VÀ THỬ NGHIỆM 39
3.1 Bài toán dự báo mực nước 39
3.1.1 Một số khái quát cơ bản về khí hậu, môi trường tự nhiên 39
3.1.2 Sự cần thiết của việc dự báo mực nước 41
3.1.3 Cần phải thích nghi 43
3.2 Ứng dụng mạng ANFIS trong dự báo mực nước 45
3.2.1 Thiết kế suy diễn nơron mờ thích nghi 45
3.2.2 Xây dựng mô hình ANFIS cho xử lý số liệu 50
3.3 Đánh giá kết quả thực hiện chương trình 57
3.4 Kết luận và hướng phát triển 58
3.4.1 Kết luận 58
3.4.2 Hướng phát triển 59
TÀI LIỆU THAM KHẢO 60
Trang 5DANH MỤC CÁC HÌNH VẼ
Hình 1.1 Cấu trúc của một nơron sinh học điển hình 3
Hình 1.2 Mô hình một nơron nhân tạo 4
Hình 1.3 Đồ thị các dạng hàm truyền 7
Hình 1.4 Mạng truyền thẳng một lớp 8
Hình 1.5 Mô hình cấu trúc của mạng nơron truyền thẳng nhiều lớp 9
Hình 1.6 Mạng nơron phản hồi 9
Hình 1.7 Mạng hồi quy một lớp có nối ngược 10
Hình 1.8 Mạng quy hồi nhiều lớp có nối ngược 10
Hình 1.9 Sơ đồ học tham số có giám sát 12
Hình 1.10 Sơ đồ học tham số không có giám sát 13
Hình 1.11 Kiến trúc của hệ mờ tổng quát 14
Hình 1.12 Hệ mờ nhiều đầu vào - một đầu ra 15
Hình 1.13 Hàm thuộc hệ mờ một đầu vào – một luật 17
Hình 1.14 Hàm thuộc hệ mờ hai đầu vào - một luật 18
Hình 1.15 Mô hình hệ mờ - neural 22
Hình 2.1 Hệ thống suy luận mờ 25
Hình 2.2 Mạng thích nghi 26
Hình 2.3 Cấu trúc của ANFIS 27
Hình 2.4 Mạng ba lớp lan truyền ngược 29
Hình 3.1 Hình ảnh đập Hồ thủy điện Thác Bà 43
Hình 3.2 Các phương trình minh họa cho việc thực thi mạng 50
Hình 3.3 Biểu diễn đồ thị các dữ liệu vào ra 51
Hình 3.4 Biểu diễn kết quả mực nước thực tế dự báo qua mô hình A 52
Hình 3.5 Biểu diễn kết quả mực nước thực tế dự báo qua mô hình B 52
Hình 3.6 Biểu diễn kết quả mực nước thực tế dự báo qua mô hình C 53
Hình 3.7 Biểu diễn kết quả mực nước thực tế dự báo qua mô hình D 54
Hình 3.8 Biểu diễn kết quả mực nước thực tế dự báo qua mô hình E 54
Trang 6DANH MỤC CÁC BẢNG BIỂU
Bảng 3.1 Lưu lượng dòng chảy đến các hồ sẽ biến đổi chậm trong 12 tháng45 Bảng 3.3 Các mô hình dự báo đầu ra mực nước hồ với các đầu vào khác nhau 51 Bảng 3.4 Biểu diễn số liệu đo thực và các dự báo theo mô hình bảng 3.3 55 Bảng 3.5 Mô hình dự báo theo ANFIS so sánh với các số liệu dự báo 56 của hồ Thác Bà theo tài liệu công bố 56
Trang 7DANH MỤC CÁC TỪ VIẾT TẮT
ANN Artificial Neural Network
Mạng nơron nhân tạo
ANFIS Adaptive Neural Fuzzy Insference System
Hệ suy luận mờ
MIMO Multi Input Multi Output
Hệ mờ nhiều đầu vào - nhiều đầu ra
MISO Multi Input Single Output
Hệ mờ nhiều đầu vào - một đầu ra LSE Least Squara Error
Phương pháp ước lượng sai số bình phương cực tiểu
Trang 8cụ thống kê là các phương pháp khác nhau được sử dụng trong các bài toán dự báo như dự báo các chỉ số kinh tế, tài chính Các mạng nơron chứa một số lượng lớn các thông số đầu vào cho phép việc học bên trong các quan hệ không tuyến tính hiện tại trong chuỗi thời gian, tăng cường khả năng dự báo
Trong những năm gần đây, nhiều bài toán dự báo được các chuyên gia
đã tin tưởng và sử dụng các hệ thống thông minh khác nhau, trong đó Mạng Nơron nhân tạo và hệ suy luận mờ - nơron (ANFIS) cũng được ứng dụng trong lĩnh vực này Bài toán dự báo mực nước hồ thủy điện là một trong những yêu cầu của sự phát triển kinh tế xã hội của tỉnh Yên Bái
Trong luận văn này, mực nước của hồ thủy điện được dự báo bằng cách
sử dụng hệ suy luận mờ dựa trên mạng thích nghi (ANFIS), luận văn bao gồm các nội dung sau:
Chương 1 Tổng quan về mạn nơron nhân tạo và hệ mờ
Chương 2 Mô hình mạng Anfis và khả năng ứng dụng
Chương 3 Ứng dụng mô hình mạng Anfis trong bài toán phân tích đánh giá dự báo mực nước và thử nghiệm
Do các yêu cầu trên nên em chọn làm đề tài “Mạng ANFIS và ứng
Trang 9dụng cho dự báo mực nước hồ thủy điện Thác Bà” cho luận văn tốt nghiệp của mình Đề tài này, em trình bày một hệ thống suy luận mờ dựa trên mạng thích nghi ANFIS để dự báo mực nước lâu dài, dự báo mực nước hàng năm, phục vụ cho phát triển kinh tế xã hội của tỉnh Yên Bái
Trang 10Chương 1
TỔNG QUAN VỀ MẠNG NƠRON NHÂN TẠO VÀ HỆ MỜ
1.1 Cấu trúc và mô hình mạng nơron
1.1.1 Mô hình một nơron sinh học
Qua quá trình nghiên cứu về bộ não, người ta thấy rằng: bộ não con người bao gồm khoảng 1011 nơron tham gia vào khoảng 1015 kết nối trên các đường truyền Mỗi đường truyền này dài khoảng hơn một mét Các nơron có nhiều đặc điểm chung với các tế bào khác trong cơ thể, ngoài ra chúng còn có những khả năng mà các tế bào khác không có được, đó là khả năng nhận, xử
lý và truyền các tín hiệu điện hóa trên các đường mòn nơron, các con đường này tạo nên hệ thống giao tiếp của bộ não
Hình 1.1 Cấu trúc của một nơron sinh học điển hình
Mỗi nơron sinh học có 3 thành phần cơ bản:
• Các nhánh vào hình cây (dendrites)
• Thân tế bào (cell body)
Trang 11• Sợi trục ra (axon)
Các nhánh hình cây truyền tín hiệu vào đến thân tế bào Thân tế bào tổng hợp và xử lý cho tín hiệu đi ra Sợi trục truyền tín hiệu ra từ thân tế bào này sang nơron khác Điểm liên kết giữa sợi trục của nơron này với nhánh hình cây của nơron khác gọi là synapse Liên kết giữa các nơron và độ nhạy của mỗi synapse được xác định bởi quá trình hóa học phức tạp Một số cấu trúc của nơron được xác định trước lúc sinh ra Một số cấu trúc được phát triển thông qua quá trình học Trong cuộc đời cá thể, một số liên kết mới được hình thành, một số khác bị hủy bỏ
Như vậy nơron sinh học hoạt động theo cách thức sau: nhận tín hiệu đầu vào, xử lý các tín hiệu này và cho ra một tín hiệu output Tín hiệu output này sau đó được truyền đi làm tín hiệu đầu vào cho các nơron khác
Dựa trên những hiểu biết về nơron sinh học, con người xây dựng nơron nhân tạo với hy vọng tạo nên một mô hình có sức mạnh như bộ não
1.1.2 Mô hình một nơron nhân tạo
Mô hình toán học của mạng nơron sinh học được đề xuất bởi McCulloch và Pitts, thường được gọi là nơron M-P, ngoài ra nó còn được gọi
là phần tử xử lý và được ký hiệu là PE (Processing Element)
Mô hình nơron có m đầu vào x1, x2,…,xm, và một đầu ra yi như sau:
Hình 1.2 Mô hình một nơron nhân tạo
Trang 12 Bộ tổng (Hàm tổng - Summing function): Thường dùng để tính tổng của tích các đầu vào với trọng số liên kết của nó
Ngưỡng (còn gọi là một độ lệch - bias): Ngưỡng này thường được đưa vào như một thành phần của hàm truyền
Hàm truyền (Transfer function): Hàm này dùng để giới hạn phạm vi đầu ra của mỗi nơron Nó nhận đầu vào là kết quả của hàm tổng và ngưỡng đã cho Thông thường, phạm vi đầu ra của mỗi nơron được giới hạn trong đoạn [0,1] hoặc [-1,1] Các hàm truyền rất đa dạng, có thể là các hàm tuyến tính hoặc phi tuyến Việc lựa chọn hàm truyền tùy thuộc vào từng bài toán và kinh nghiệm của người thiết kế mạng
Đầu ra: Là tín hiệu đầu ra của một nơron, với mỗi nơron sẽ có tối đa một đầu ra
Xét về mặt toán học, cấu trúc của một nơron i được mô tả bằng cặp biểu thức sau:
i w x net
1
Trang 13Trong đó:
x1, x2, …xm là các tín hiệu đầu vào, còn wi1, wi2,…,wim là các trọng số kết nối của nơron thứ i, neti là hàm tổng, f là hàm truyền, θi là một ngưỡng, yi
là tín hiệu đầu ra của nơron
Như vậy, tương tự như nơron sinh học, nơron nhân tạo cũng nhận các tín hiệu đầu vào, xử lý (nhân các tín hiệu này với trọng số liên kết, tính tổng các tích thu được rồi gửi kết quả đến hàm truyền), và cho một tín hiệu đầu ra (là kết quả của hàm truyền)
Hàm truyền có thể có các dạng sau:
khi x y
Trang 14Đồ thị các dạng hàm truyền được biểu diễn như sau:
Hình 1.3 Đồ thị các dạng hàm truyền
1.2 Cấu tạo và phương thức làm việc của mạng nơron
Mạng nơron nhân tạo (Artificial Neural Network) là một cấu trúc mạng được hình thành nên bởi số lượng các nơron nhân tạo liên kết với nhau Mỗi nơron có các đặc tính đầu vào, đầu ra và thực hiện một số chức năng tính toán cục bộ
Với việc giả lập các hệ thống sinh học, các cấu trúc tính toán, mạng nơron có thể giải quyết được các lớp bài toán nhất định như: Bài toán xếp loại, bài toán lập lịch, bài toán tìm kiếm, bài toán nhận dạng mẫu Các bài toán phức tạp cao, không xác định Tuy nhiên, sự liên kết giữa một bài toán bất kỳ trong thực tế với một giải pháp mạng nơron lại là một việc không dễ dàng
Xét một cách tổng quát, mạng nơron là một cấu trúc xử lý song song thông tin phân tán mang các đặc tính nổi bật sau:
- Là một mô hình tính toán dựa trên bản chất của nơron
- Bao gồm một số lượng rất lớn các nơron liên kết với nhau
- Mạng nơron có khả năng học, khái quát hóa tập dữ liệu học thông qua
Trang 15việc gán và hiệu chỉnh các trọng số liên kết
- Tổ chức theo kiểu tập hợp mang lại cho mạng nơron khả năng tính toán rất lớn, trong đó không có rron nào mang thông tin riêng biệt
1.2.1 Mạng nơron truyền thẳng một lớp
Mô hình mạng nơron truyền thẳng một lớp là mô hình liên kết cơ bản và đơn giản nhất Các nơron tổ chức lại với nhau tạo thành một lớp, đường truyền
tín hiệu được truyền theo một hướng nhất định nào đó Các đầu vào được nối với
các nơron theo các trọng số khác nhau, sau quá trình xử lý cho ra một chuỗi các tín hiệu ra Mạng nơron là mô hình LTU thì nó được gọi là mạng Perception, còn
mạng nơron là mô hình LGU thì nó được gọi là mạng Adaline
Hình 1.4 Mạng truyền thẳng một lớp
Với mỗi giá trị đầu vào x = [ x1,x2, ,xn]T Qua quá trình xử lý của mạng ta sẽ thu được một bộ tương ứng các giá trị đầu ra là y = [y1,y2, ,yn]T được xác định như sau:
i j ij i
y
1
, 1 ).
Trang 161.2.2 Mạng nơron truyền thẳng nhiều lớp
Với mạng nơron truyền thẳng một lớp ở trên khi phân tích một bài toán phức tạp sẽ gặp rất nhiều khó khăn, để khắc phục vấn đề này người ta đưa ra
mô hình mạng nơron truyền thẳng nhiều lớp bằng việc kết hợp với một số lớp nơron lại với nhau Lớp nhận tín hiệu vào gọi là lớp vào, lớp đưa ra tín hiệu ra của mạng được gọi là lớp ra Các lớp ở giữa lớp vào và lớp ra được gọi là các lớp ẩn
Hình 1.5 Mô hình cấu trúc của mạng nơron truyền thẳng nhiều lớp
1.2.3 Mạng nơron phản hồi
Kiến trúc phản hồi (Feedback architecture): Là kiểu kiến trúc mạng có các kết nối từ nơron đầu ra tới nơron đầu vào Mạng lưu lại các trạng thái trước đó, và trạng thái tiếp theo không chỉ phụ thuộc vào các tín hiệu đầu vào
mà còn phụ thuộc vào các trạng thái trước đó của mạng Mạng Hopfield thuộc loại này
Hình 1.6 Mạng nơron phản hồi
Trang 171.2.4 Mạng nơron hồi quy
Mạng quy hồi một lớp có nối ngược
Hình 1.7 Mạng hồi quy một lớp có nối ngược
Mạng quy hồi nhiều lớp có nối ngược
Hình 1.8 Mạng quy hồi nhiều lớp có nối ngược
1.3 Các luật học
Mạng nơron có một số ưu điểm so với máy tính truyền thống Cấu trúc song song của mạng nơron rất thích hợp cho nhưng ứng dụng đòi hỏi tốc độ nhanh theo thời gian thực Khả năng huấn luyện của mạng nơron có thể khai thác để phát triển hệ học thích nghi Mặt khác, với khả năng tổng quát hóa của mạng nơron, nó có thể áp dụng để điều khiển nhiều tham số phức tạp đồng thời từ đó giải quyết dễ dàng một số bài toán NP - đầy đủ (NP - Complete)
Các luật học đóng vai trò quan trọng trong việc xác định một mạng ron nhân tạo Một cách đơn giản về khái niệm học của mạng nơron là cập nhật trọng số trên cơ sở các mẫu Theo nghĩa rộng thì học có thể được chia thành hai loại: Học tham số và học cấu trúc
Trang 18nơ-Trong luận văn chúng ta chỉ đề cập tới luật học tham số (Parameter Learning): là các tham số về trọng số cập nhật kết nối giữa các nơron
Các thủ tục học này nhằm tìm kiếm ma trận trọng số sao cho mạng có khả năng đưa ra dự báo sát với thực tế Dạng chung của luật học tham số có thể được mô tả như sau:
M j N i rx
Là quá trình học dựa vào sai số giữa đầu ra thực và đầu ra mong muốn
để làm cơ sở cho việc hiệu chỉnh trọng số Sai số này chính là hằng số học r Luật học điển hình của nhóm này là luật học Della của Widrow (1962) nêu ra đầu tiên dùng xấp xỉ trọng số của Adaline dựa trên nguyên tắc gradient
Trong nhóm luật học này cũng cần kể đến luật học Perceptron của Rosenblatt (1958) Về cơ bản luật học này thay đổi các giá trị trọng trong thời gian học, còn Perceptron thì thêm hoặc bỏ trọng tùy theo giá trị sai số là dương hay âm
Một loạt các luật học khác cũng được dựa trên tư tưởng này Luật oja là cải tiến và nâng cấp của luật Delta Luật truyền ngược là luật mở rộng của luật Delta cho mạng nhiều lớp Đối với mạng truyền thẳng thường sử dụng
Trang 19luật truyền ngược để chỉnh trọng số với tín hiệu chỉ đạo từ bên ngoài và người
ta gọi mạng này là mạng lan truyền ngược
Hình 1.9 Sơ đồ học tham số có giám sát
1.3.2 Học không có giám sát
Luật học này sử dụng đầu ra của mạng làm cơ sở để hiệu chỉnh các
trọng số liên kết Hay trong luật này chính là tín hiệu ra của mạng Điển hình
là luật Hebb (1949) thường dùng cho các mạng tự liên kết, luật LVQ (Learning Vector Quantization) dùng cho mạng tự tổ chức một lớp thuộc lớp mạng ánh xạ đặc trưng của Kohonen
Luật học Hebb là luật sinh học xuất phát từ tiên đề của Hebb cho rằng: Giữa hai nơron có quan hệ và có thay đổi thế năng mạng thì giữa chúng có sự thay đổi trọng số liên kết Nói cách khác, trọng số được điều chỉnh theo mối tương quan trước và sau, nghĩa là:
M j N i x y
Tín hiệu ra mong muốn Tín hiệu vào
Trang 20mạng mà không cần tín hiệu chỉ đạo từ bên ngoài Hopfield cũng cải tiến luật Hebb cho các mạng tự liên kết thành 16 dạng khác nhau theo kiểu luật Hebb, luật đối Hebb, luật Hopfield
Như vậy, ứng với mỗi nhóm mạng thường áp dụng một luật học nhất định Nếu tồn tại hàng chục loại mạng khác nhau thì các luật học dùng trong mạng nơron có thể tăng lên rất nhiều lần
Đối với mạng phản hồi thường sử dụng luật Hebb và các luật cải tiến của nó để chỉnh trọng số mà không cần tín hiệu chỉ đạo từ bên ngoài
Hình 1.10 Sơ đồ học tham số không có giám sát
1.3.3 Học củng cố
Tín hiệu tăng cường có thể lấy từ môi trường bên ngoài, nhưng tín hiệu này không được đầy đủ mà chỉ có tính chất kiểm tra quá trình tốt hay xấu Học củng cố cũng là một dạng của học giám sát, bởi vì vẫn nhận được một số tín hiệu từ bê ngoài Nhưng tín hiệu phản hồi chỉ mang tính chất đánh giá hơn
là mang tính chất chỉ dẫn Nó cho biết mức độ tốt hay xấu của một đầu ra cụ thể Tín hiệu củng cố bên ngoài thường được xử lý bằng máy phát tín hiệu đánh giá để tạo ra nhiều hơn nữa các thông tin tín hiệu đánh giá, sau đó dùng
để điều chỉnh các trọng số với mục đích đạt được tín hiệu đánh giá tốt hơn
Mạng nơron
Tín hiệu ra Tín hiệu
vào
Trang 211.4 Hệ mờ và mạng nơron
1.4.1 Kiến trúc của hệ mờ tổng quát
Một hệ mờ tiêu biểu có kiến trúc như hình vẽ:
Hình 1.11 Kiến trúc của hệ mờ tổng quát
Thành phần trung tâm của hệ mờ cơ sở luật mờ (fuzzy rule base) Cơ sở luật mờ bao gồm các luật mờ if-then biểu diễn tri thức của chuyên gia trong lĩnh vực nào đó Trong trường hợp một hệ điều khiển mờ cụ thể thì cơ sở luật mờ chính là tri thức và kinh nghiệm của các chuyên gia trong việc điều khiển khi chưa
áp dụng hệ mờ [2]
Thành phần quan trọng kế tiếp là bộ suy diễn mờ (fuzzy inference engine) Nhiệm vụ của bộ phận này là kết hợp các luật trong cơ sở luật mờ, áp dụng vào tập mờ đầu vào theo các phương pháp suy diễn mờ để xác định tập
mờ đầu ra
Dữ liệu đầu vào của hệ điều khiển mờ là các tín hiệu do các bộ phận cảm biến môi trường cung cấp sau khi đã số hóa nên có tính chất rõ (khái niệm rõ ở đây có nghĩa là các tín hiệu đó không phải là các tập mờ, chứ không
có nghĩa là các tín hiệu không có nhiễu) Vì vậy cần phải có bộ mờ hóa (fuzzier) để chuyển các dữ liệu số đầu vào thành các tập mờ để bộ suy diễn
mờ có thể thao tác được
Dữ liệu đầu ra của bộ suy diễn mờ ở dạng các tập mờ sẽ được bộ giải
mờ (defuzzier) chuyển thành tín hiệu số trước khi truyền đến các cơ quan
Cơ sở luật mờ
Bộ suy diễn mờ
Bộ
mờ hóa
Bộ giải mờ
Đầu vào
(số)
Đầu vào (tập mờ)
Đầu ra (tập mờ)
Đầu ra (số) Tham khảo
luật mờ
Trang 22chấp hành như tay máy, công tắc, van điều khiển
Do các dữ liệu đầu vào và đầu ra được số hóa nên ta chỉ cần xem xét các hệ mờ làm việc với các biến số Trường hợp tổng quát, hệ mờ nhận một vector n chiều ở đầu vào và cho ra một vector n chiều ở đầu ra Hệ mờ như thế được gọi là hệ mờ nhiều đầu vào - nhiều đầu ra (MIMO) Nếu m bằng 1,
ta có hệ mờ nhiều đầu vào - một đầu ra (MISO) Một hệ mờ nhiều đầu vào - nhiều đầu ra có thể phân tích thành nhiều hệ nhiều đầu vào - một đầu ra Do
đó ta chỉ cần tìm hiểu kĩ về hệ mờ nhiều đầu vào một đầu ra với các biến số
Khi chỉ nói về hệ mờ nhiều - một thì ta sẽ ngầm hiểu là một hệ mờ
nhiều đầu vào - một đầu ra với các biến số Kí hiệu
n i
n
i R U U
1
, V R, trong đó U ilà miền xác định của các biến vào i, i = 1 n và V là miền giá trị của biến ra y, ta có mô hình hệ mờ nhiều đầu vào - một đầu ra như hình vẽ:
Hình 1.12 Hệ mờ nhiều đầu vào - một đầu ra 1.4.1.1 Cơ sở luật mờ
Cơ sở luật mờ của hệ mờ n đầu vào - một đầu ra gồm m luật if -then mờ có dạng:
If “x1 là Ak1” và “x2 là Ak2” và…và “xn là Akn” then “y là Bk”, k
= 1…m (*)
Trong đó k là chỉ số của luật (luật thứ k trong tập luật), xi là các biến đầu vào, Aki là các tập mờ trên Ui (i=1 n), y là biến đầu ra và Bk là tập mờ
Hệ mờ nhiều đầu vào
Trang 23trên V (k=1 m)
Các luật mờ dạng (*) được gọi là các luật If-then mờ chuẩn tắc Các luật
mờ không chuẩn tắc có thể biến đổi để đưa về dạng chuẩn tắc tương đương
Có nhiều phương pháp để xác định các luật mờ để đưa vào cơ sở luật
mờ Các phương pháp thông dụng là nhờ các chuyên gia trong lĩnh vực áp dụng, hoặc từ quan sát, thực nghiệm thống kê để có được các tập dữ liệu mẫu đầu vào và ra tương ứng, từ đó dùng các kĩ thuật khai dữ liệu để rút ra các luật
1.4.1.2 Bộ suy diễn mờ
Phương pháp thiết kế bộ suy diễn trong trường hợp cơ sở luật mờ gồm
m luật if-then mờ chuẩn tắc, nhiều đầu vào và một đầu ra (MISO)
Các luật if-then trong thực tế thì thường được tính bằng công thức Mamdani max-min hoặc max-tích (max-prod)
Ta xét kĩ kiến trúc bộ suy diễn mờ sử dụng phương pháp suy diễn min Khi chuyển qua phương pháp suy diễn max-tich thì chỉ cần thay min bằng phép nhân trong các công thức
max-Cho A, A’, B lần lượt là các tập mờ trên vũ trụ X, X, Y Luật if A then
B được thể hiện như một quan hệ mờ R = A x B trên X x Y Khi đó tập mờ B’
suy ra từ A’ được xác định bởi:
Trang 24 minh A'A, B(y)
Trong đó: h A'Alà độ cao của tập mờ A’A
Hình 1.13 Hàm thuộc hệ mờ một đầu vào – một luật
Trường hợp hai đầu vào và một luật
Đây là trường hợp luật được phát biểu “Nếu x là A và y là B thì z là C” Luật: Nếu x là A và y là B thì z là C
Sự kiện: x là A’ và y là B’
Kết luận: z là C’
Luật mờ với điều kiện có 2 mệnh đề như trên có thể biểu diễn ở dạng A
x B => C Suy luận tương tự trường hợp một đầu vào và một luật ta có:
min )
Trang 25Minh họa:
Hình 1.14 Hàm thuộc hệ mờ hai đầu vào - một luật
Trường hợp nhiều đầu vào và nhiều luật
Trong trường hợp nhiều đầu vào và nhiều luật, ta tính kế quả đầu ra cho từng luật sau đó kết quả của hệ sẽ là các phép giao hoặc hợp các kết quả riêng
đó tùy theo bảo chất của hệ là hội hay tuyển các luật
Nếu trong một luật có dạng: “nếu x là A hoặc y là B thì z là C” ta tách thanh hai luật riêng biệt “Nếu x là A thì z là C” và “Nếu x là B thì z là C” để tính
Điểm dữ liệu x phải có độ cao phụ thuộc vào A’
Vector x thu nhận từ môi trường ngoài có thể sai lệch do nhiễu nên A’ phải phản ánh được tính gần đúng của dữ liệu thực
Hiệu quả tính toán: Đơn giản cho các tính toán trong bộ suy diễn Sau đây là một số phương pháp mờ hóa thông dụng
+ Mờ hóa đơn trị
Mỗi điểm dữ liệu x được xem như một tập mờ đơn trị tức là tập mờ A
có hàm thuộc xác định như sau:
Trang 26x u if u
A
0
1 ) (
a x u i i
A u e
+ Mờ hóa tam giác
Mỗi giá trị xi được biểu diễn thành một số mờ A’i tập A’ là tích đề-các của các A’i
i i i i
i i i
i A
b x u if
b x u if b
x u u
0
1 ) (
Điểm y là đại diện tốt nhất cho B’ Trực quan y là điểm có độ thuộc cáo nhất vào B’ ở trung tâm tập giá đỡ của B’
Hiệu quả tính toán nhanh
Tính toán liên tục: Khi B’ thay đổi ít thì y cũng thay đổi ít
Sau đây là phương pháp giải mờ thông dụng:
- Phương pháp lấy max:
Phương pháp này chọn y là điểm có độ thuộc cao nhất vào B’
Trang 27 Y là trung điểm của H
- Phương pháp lấy trọng tâm
Phương pháp này chọn y là điểm trọng tâm của tập B’
y =
v B v B
dv v
dv v v
) (
) (
- Phương pháp lấy trung bình tâm
Vì B’ thường là hợp hoặc giao của m tập mờ thành phần do vậy ta có thể tính gần đúng giá trị y là bình quân có trọng số của tâm m tập mờ thành phần Giả sử xi và hi là tâm và độ cao của tập m thành phần B’I ta có:
m i i i
h
h x
1.4.2 Sự kết hợp giữa logic mờ và mạng neural
Khi khảo sát mạng nơron và logic mờ, ta thấy mỗi loại đều có điểm mạnh, điểm yếu riêng của nó Đối với logic mờ, ta dễ dàng thiết kế một hệ thống mong muốn chỉ bằng các luật Nếu-thì (If-then) gần với việc xử lý của con người Với đa số ứng dụng thì điều này cho phép tạo ra lời giải đơn giản hơn trong khoảng thời gian ngắn hơn Thêm nữa, ta dễ dàng sử dụng những hiểu biết của mình về đối tượng để tối ưu hệ thống một cách trực tiếp [3]
Tuy nhiên, đôi khi với các ưu điểm hệ điều khiển mờ còn tồn tại một số khuyết như việc thiết kế và tối ưu hóa hệ logic mờ đòi hỏi phải có một số kinh nghiệm về diều khiển đối tượng, đối với những người mới thiết kế lần đầu điều đó hoàn toàn không đơn giản Mặt khác còn hàng loạt những câu hỏi
Trang 28khác đặt ra cho người thiết kế mà nếu chỉ dừng lại ở tư duy logic mờ thì hầu như chưa có lời giải, ví dụ: số tập mờ trong mỗi biến ngôn ngữ cần chọn bao nhiêu là tối ưu? Hình dạng các tập mờ thế nào? Vị trí mỗi tập mờ ở đâu? Việc kết hợp các tập mờ như thế nào? Trọng số của mỗi luật điều khiển bằng bao nhiêu? Nếu như tri thức cần đưa vào hệ được thể hiện dưới dạng các tập dữ liệu (điều này thường gặp khi thu thập và xử lý dữ liệu để nhận dạng đối tượng) thì làm thế nào?
Đối với mạng nơron, chúng có một số ưu điểm như xử lý song song nên tốc độ xử lý rất nhanh Mạng nơron có khả năng học hỏi, ta có thể huấn luyện mạng để xấp xỉ một hàm phi tuyến bất ky, đặc biệt khi đã biết một tập
dữ liệu vào/ra…Song nhược điểm cơ bản của mạng nơron là khó giải thích rõ ràng hoạt động của mạng nơron như thế nào Do vậy việc chỉnh sửa trong mạng nơron rất khó khăn
Hai tiêu chí cơ bản trợ giúp cho người thiết kế ở logic mờ và ở mạng nơron hiện trái ngược nhau:
Thể hiện tri thức Không tường minh, khó
giải thích và khó sửa đổi
Tường minh, dễ kiểm chứng hoạt động và dễ sửa đổi
Khả năng học
Có khả năng học thông qua các tập dữ liệu
Không có khả năng học, người thiết kế phải tự thiết kế tất cả
Từ những phân tích trên, ta thấy nếu kết hợp logic mờ và mạng nơron,
ta sẽ có một hệ lai với ưu điểm của cả hai: logic mờ cho phép thiết kế hệ dễ dàng, tường minh trong khi mạng nơron cho phép học những gì mà ta yêu cầu
về bộ điều khiển
Nó sửa đổi các hàm phụ thuộc về hình dạng, vị trí và sự kết hợp,…hoàn toàn tự động Điều này làm giảm bớt thời gian cũng như làm giảm bớt chi phí
Trang 29ta sẽ nghiên cứu các thuật toán anfis và ứng dụng thuật toán để giải bài toán
dự báo mực nước hồ thủy điện Thác Bà
Trang 30
Chương 2
MÔ HÌNH MẠNG ANFIS VÀ KHẢ NĂNG ỨNG DỤNG
2.1 Hệ suy diễn mờ dựa trên mạng thích nghi
2.1.1 Các mô hình kết hợp giữa hệ mờ và mạng nơron
Một mạng nơron với các trọng số được điều chỉnh có thể xem như là một thiết bị điều khiển tự động nhờ vào tính chất hồi quy phi tuyến của các đối tượng rời rạc Tuy nhiên, tri thức được lưu trữ trong mạng không rõ ràng, không mô tả được những mối liên hệ giữa dữ liệu nhập và dữ liệu xuất, mà chỉ có thể xác định các mối liên hệ này thông qua những tham số thích nghi của mạng Trái lại, một luật mờ nếu - thì lại có thể diễn tả được các mối liên
hệ đó dưới dạng ngôn ngữ tự nhiên, nhưng lại không có khả năng điều chỉnh luật cho phù hợp Hai vấn đề này được kết hợp lại tạo thành một hệ thống nơron - mờ nhằm đạt được khả năng “đọc” và “học” cùng một lúc Các luật thu được từ hệ thống này có thể điều chỉnh phù hợp với dữ liệu phát sinh mô hình, và đối với các ứng dụng điều khiển tự động, mô hình nơron - mờ có thể tích hợp với các luật chuyên gia nhằm đưa ra những kết quả chính xác
Bên cạnh các luật chuyên gia, các luật trích ra từ dữ liệu cũng là một hình thức mô hình hóa hệ thống điều khiển tự động, chẳng hạn như trong
Nhận dạng, khai mỏ dữ liệu,… Mục tiêu đưa ra các luật này là nhằm giảm độ
phức tạp của vấn đề cũng như lượng dữ liệu liên quan đến vấn đề Có rất
nhiều phương pháp phân tích dữ liệu để đưa ra hệ thống các luật để có thể thực hiện một sự kết hợp tối ưu giữa logic mờ và mạng nơron
Các nghiên cứu về mạng nơron đã bắt đầu từ thập niên 40 và logic mờ
từ thập niên 60, nhưng mô hình nơron - mờ là một lĩnh vực mới Năm 1992, Roger Jang đã đề xuất mô hình ANFIS nhằm đáp ứng việc xây dựng một tập luật mờ nếu - thì với các hàm thành viên xấp xỉ dữ liệu nhập - xuất đích Kết
Trang 31quả là một hệ thống suy luận mờ dựa trên mạng thích nghi không chỉ thể hiện tốt thông tin ngôn ngữ (các luật ngôn ngữ) từ các chuyên gia, mà còn phù hợp với việc sử dụng dữ liệu dạng số để thu được mức độ thực hiện tốt hơn
2.1.2 Luật mờ if then và hệ thống suy diễn mờ
2.1.2.1 Luật mờ
Luật mờ là biểu thức điều kiện có dạng “NẾU A THÌ B”, trong đó A và
B là nhãn của các tập mờ được mô tả bằng cách xấp xỉ các hàm thành viên Nhờ vào dạng rút gọn, luật mờ thường được dùng để thiết lập những phương thức lập luận không chính xác, nhằm thể hiện tính đa dạng trong tri thức của con người Ví dụ sau mô tả một sự kiện đơn giản là (đây là luật mờ loại Mamdani):
Nếu nhiệt độ cao thì giá máy lạnh tăng
Trong đó nhiệt độ và giá máy lạnh là các biến ngôn ngữ, cao và tăng là các giá trị ngôn ngữ hoặc các nhãn được mô tả bởi các hàm thành viên
Một dạng khác của luật mờ do Takagi và Sugeno đề xuất, có các tập
mờ chỉ xuất hiện trong phần giả thuyết của luật Ví dụ (đây là luật mờ loại Sugeno):
Nếu lưu lượng dòng chảy cao thì mực nước sông=k*lưu lượng dòng chảy trong đó cao là phần giả thuyết được mô tả bởi hàm thành viên xấp xỉ Tuy nhiên, phần kết luận được định nghĩa bởi phương trình theo biến lưu lượng dòng chảy
Cả hai loại luật mờ trên đều được mở rộng trong cả hai lĩnh vực mô hình hóa và điều khiển tự động Bởi vì lợi ích của các nhãn ngôn ngữ và các hàm thành viên mà một luật mờ có thể nắm bắt dễ dàng qui luật điều khiển của con người
Trang 322.1.2.2 Hệ suy luận mờ
Một hệ thống suy luận mờ gồm 5 khối cơ bản sau (Hình 2.1):
Hình 2.1 Hệ thống suy luận mờ
Một cơ sở luật chứa các luật mờ nếu - thì
Một cơ sở dữ liệu định nghĩa các hàm thành viên của các tập mờ được sử dụng trong các luật mờ
Một đơn vị thực hiện quyết định thực hiện phép toán suy luận trên
1 So sánh giá trị đầu vào với hàm thành viên của phần giả thiết để có được giá trị thành viên (hay những độ đo tương tự) của những tập ngữ nghĩa (bước này được gọi là bước mờ hóa)
2 Kết nối (qua toán tử chuẩn T-norm, thường là nhân hay lấy tối tiểu) giá trị tạo thành viên của phần giả thiết để có được trọng số vào của luật
3 Tạo kết luận đang tính toán (có thể là mờ hay rõ) cho mỗi luật dựa
Cơ sơ tri thức
Cơ sở
dữ liệu Cơ sở luật
Mờ khóa
Khử
mờ khóa
Đơn vị thực hiện quyết định
Dữ
liệu
Dữ liệu
Trang 33vào trọng sổ của luật
4 Tổng hợp các giá trị kết luận này để tạo kết quả rõ (bước này được gọi là giải mờ)
Có một số suy diễn mờ được sử dụng trong lĩnh vực này, dựa vào loại của lập luận mờ và loại sử dụng luật mờ if-then mà các hệ suy diễn mờ được chia ra làm ba loại như sau:
Loại 1: Toàn bộ dữ liệu xuất là trung bình trọng số các dữ liệu xuất thô của mỗi luật có được do ngưỡng kích hoạt của luật (toán tử tích hoặc min tổ
hợp các giả thuyết) và các hàm thành viên dữ liệu xuất
Loại 2: Toàn bộ dữ liệu xuất thu được bằng cách dùng toán tử max cho các dữ liệu xuất mờ đủ tiêu chuẩn (cực tiểu hóa độ ngưỡng kích hoạt và hàm
thành viên dữ liệu xuất của mỗi luật) Các ý tưởng khác nhau được đề xuất để chọn lựa dữ liệu xuất thô cuối cùng dựa trên toàn bộ dữ liệu xuất mờ; một số trong chúng là tâm của diện tích, đường phân giác của diện tích, trung bình cực đại, tiêu chuẩn cực đại,…
Loại 3: Các luật mờ loại Takagi và Sugeno được sử dụng Dữ liệu xuất của mỗi luật là một tổ hợp tuyến tính các dữ liệu nhập, cộng với một số hạng không đổi, và dữ liệu xuất cuối cùng chính là trung bình trọng số các dữ liệu xuất trong mỗi luật