Mạng ANFIS và ứng dụng cho dự báo mực nước hồ thủy điện thác bà

Các nơron có nhiều đặc điểm chung với các tế bào khác trong cơ thể, ngoài ra chúng còn có những khả năng mà các tế bào khác không có được, đó là khả năng nhận, xử lý và truyền các tín hi

Trang 1

LỜI CAM ĐOAN

Tôi xin cam đoan tất cả các nội dung của luận văn này hoàn toàn được hình thành và phát triển từ quan điểm của chính cá nhân tôi, dưới sự hướng dẫn chỉ bảo của PGS.TS Lê Bá Dũng Các số liệu kết quả có được trong luận văn tốt nghiệp là hoàn toàn trung thực

Học viên

Nguyễn Tô Hoán

Trang 2

LỜI CẢM ƠN

Để hoàn thành chương trình cao học và viết luận văn này, tôi đã nhận được sự hướng dẫn, giúp đỡ và chỉ bảo nhiệt tình của thầy giáo, cô giáo Trường Đại học Công nghệ thông tin và Truyền thông- Đại học Thái Nguyên Đặc biệt là các thầy của Viện công nghệ thông tin Hà Nội đã tận tình dạy bảo cho tôi trong suốt thời gian học tập tại trường

Tôi xin gửi lời cảm ơn đến PGS.TS Lê Bá Dũng đã dành nhiều thời gian và tâm huyết hướng dẫn tôi hoàn thành luận văn này

Mặc dù tôi đã cố gắng hoàn thiện luận văn bằng tất cả năng lực của mình, song không thể tránh khỏi những thiếu sót, rất mong nhận được sự đóng góp quý báu của các thầy giáo, cô giáo và các bạn

Tôi xin chân thành cảm ơn!

Trang 3

MỤC LỤC

LỜI CAM ĐOAN i

LỜI CẢM ƠN ii

MỤC LỤC iii

DANH MỤC CÁC HÌNH VẼ v

DANH MỤC CÁC BẢNG BIỂU vi

DANH MỤC CÁC TỪ VIẾT TẮT vii

MỞ ĐẦU 1

Chương 1 TỔNG QUAN VỀ MẠNG NƠRON NHÂN TẠO VÀ HỆ MỜ 3

1.1 Cấu trúc và mô hình mạng nơron 3

1.1.1 Mô hình một nơron sinh học 3

1.1.2 Mô hình một nơron nhân tạo 4

1.2 Cấu tạo và phương thức làm việc của mạng nơron 7

1.2.1 Mạng nơron truyền thẳng một lớp 8

1.2.2 Mạng nơron truyền thẳng nhiều lớp 9

1.2.3 Mạng nơron phản hồi 9

1.2.4 Mạng nơron hồi quy 10

1.3 Các luật học 10

1.3.1 Học có giám sát 11

1.3.2 Học không có giám sát 12

1.3.3 Học củng cố 13

1.4 Hệ mờ và mạng nơron 14

1.4.1 Kiến trúc của hệ mờ tổng quát 14

1.4.2 Sự kết hợp giữa logic mờ và mạng neural 20

1.5 Kết luận chương 22

Chương 2 MÔ HÌNH MẠNG ANFIS VÀ KHẢ NĂNG ỨNG DỤNG 22

2.1 Hệ suy diễn mờ dựa trên mạng thích nghi 23

Trang 4

2.1.1 Các mô hình kết hợp giữa hệ mờ và mạng nơron 23

2.1.2 Luật mờ if then và hệ thống suy diễn mờ 24

2.1.3 Mạng thích nghi 26

2.1.4 Cấu trúc mạng ANFIS 27

2.2 Thuật toán ANFIS 29

2.2.1 Thuật toán học lan truyền ngược 29

2.2.2 Thuật toán học lai 35

2.3 Khả năng ứng dụng của mạng ANFIS 37

Chương 3 ỨNG DỤNG MÔ HÌNH MẠNG ANFIS TRONG BÀI TOÁN PHÂN TÍCH ĐÁNH GIÁ DỰ BÁO MỰC NƯỚC VÀ THỬ NGHIỆM 39

3.1 Bài toán dự báo mực nước 39

3.1.1 Một số khái quát cơ bản về khí hậu, môi trường tự nhiên 39

3.1.2 Sự cần thiết của việc dự báo mực nước 41

3.1.3 Cần phải thích nghi 43

3.2 Ứng dụng mạng ANFIS trong dự báo mực nước 45

3.2.1 Thiết kế suy diễn nơron mờ thích nghi 45

3.2.2 Xây dựng mô hình ANFIS cho xử lý số liệu 50

3.3 Đánh giá kết quả thực hiện chương trình 57

3.4 Kết luận và hướng phát triển 58

3.4.1 Kết luận 58

3.4.2 Hướng phát triển 59

TÀI LIỆU THAM KHẢO 60

Trang 5

DANH MỤC CÁC HÌNH VẼ

Hình 1.1 Cấu trúc của một nơron sinh học điển hình 3

Hình 1.2 Mô hình một nơron nhân tạo 4

Hình 1.3 Đồ thị các dạng hàm truyền 7

Hình 1.4 Mạng truyền thẳng một lớp 8

Hình 1.5 Mô hình cấu trúc của mạng nơron truyền thẳng nhiều lớp 9

Hình 1.6 Mạng nơron phản hồi 9

Hình 1.7 Mạng hồi quy một lớp có nối ngược 10

Hình 1.8 Mạng quy hồi nhiều lớp có nối ngược 10

Hình 1.9 Sơ đồ học tham số có giám sát 12

Hình 1.10 Sơ đồ học tham số không có giám sát 13

Hình 1.11 Kiến trúc của hệ mờ tổng quát 14

Hình 1.12 Hệ mờ nhiều đầu vào - một đầu ra 15

Hình 1.13 Hàm thuộc hệ mờ một đầu vào – một luật 17

Hình 1.14 Hàm thuộc hệ mờ hai đầu vào - một luật 18

Hình 1.15 Mô hình hệ mờ - neural 22

Hình 2.1 Hệ thống suy luận mờ 25

Hình 2.2 Mạng thích nghi 26

Hình 2.3 Cấu trúc của ANFIS 27

Hình 2.4 Mạng ba lớp lan truyền ngược 29

Hình 3.1 Hình ảnh đập Hồ thủy điện Thác Bà 43

Hình 3.2 Các phương trình minh họa cho việc thực thi mạng 50

Hình 3.3 Biểu diễn đồ thị các dữ liệu vào ra 51

Hình 3.4 Biểu diễn kết quả mực nước thực tế dự báo qua mô hình A 52

Hình 3.5 Biểu diễn kết quả mực nước thực tế dự báo qua mô hình B 52

Hình 3.6 Biểu diễn kết quả mực nước thực tế dự báo qua mô hình C 53

Hình 3.7 Biểu diễn kết quả mực nước thực tế dự báo qua mô hình D 54

Hình 3.8 Biểu diễn kết quả mực nước thực tế dự báo qua mô hình E 54

Trang 6

DANH MỤC CÁC BẢNG BIỂU

Bảng 3.1 Lưu lượng dòng chảy đến các hồ sẽ biến đổi chậm trong 12 tháng45 Bảng 3.3 Các mô hình dự báo đầu ra mực nước hồ với các đầu vào khác nhau 51 Bảng 3.4 Biểu diễn số liệu đo thực và các dự báo theo mô hình bảng 3.3 55 Bảng 3.5 Mô hình dự báo theo ANFIS so sánh với các số liệu dự báo 56 của hồ Thác Bà theo tài liệu công bố 56

Trang 7

DANH MỤC CÁC TỪ VIẾT TẮT

ANN Artificial Neural Network

Mạng nơron nhân tạo

ANFIS Adaptive Neural Fuzzy Insference System

Hệ suy luận mờ

MIMO Multi Input Multi Output

Hệ mờ nhiều đầu vào - nhiều đầu ra

MISO Multi Input Single Output

Hệ mờ nhiều đầu vào - một đầu ra LSE Least Squara Error

Phương pháp ước lượng sai số bình phương cực tiểu

Trang 8

cụ thống kê là các phương pháp khác nhau được sử dụng trong các bài toán dự báo như dự báo các chỉ số kinh tế, tài chính Các mạng nơron chứa một số lượng lớn các thông số đầu vào cho phép việc học bên trong các quan hệ không tuyến tính hiện tại trong chuỗi thời gian, tăng cường khả năng dự báo

Trong những năm gần đây, nhiều bài toán dự báo được các chuyên gia

đã tin tưởng và sử dụng các hệ thống thông minh khác nhau, trong đó Mạng Nơron nhân tạo và hệ suy luận mờ - nơron (ANFIS) cũng được ứng dụng trong lĩnh vực này Bài toán dự báo mực nước hồ thủy điện là một trong những yêu cầu của sự phát triển kinh tế xã hội của tỉnh Yên Bái

Trong luận văn này, mực nước của hồ thủy điện được dự báo bằng cách

sử dụng hệ suy luận mờ dựa trên mạng thích nghi (ANFIS), luận văn bao gồm các nội dung sau:

Chương 1 Tổng quan về mạn nơron nhân tạo và hệ mờ

Chương 2 Mô hình mạng Anfis và khả năng ứng dụng

Chương 3 Ứng dụng mô hình mạng Anfis trong bài toán phân tích đánh giá dự báo mực nước và thử nghiệm

Do các yêu cầu trên nên em chọn làm đề tài “Mạng ANFIS và ứng

Trang 9

dụng cho dự báo mực nước hồ thủy điện Thác Bà” cho luận văn tốt nghiệp của mình Đề tài này, em trình bày một hệ thống suy luận mờ dựa trên mạng thích nghi ANFIS để dự báo mực nước lâu dài, dự báo mực nước hàng năm, phục vụ cho phát triển kinh tế xã hội của tỉnh Yên Bái

Trang 10

Chương 1

TỔNG QUAN VỀ MẠNG NƠRON NHÂN TẠO VÀ HỆ MỜ

1.1 Cấu trúc và mô hình mạng nơron

1.1.1 Mô hình một nơron sinh học

Qua quá trình nghiên cứu về bộ não, người ta thấy rằng: bộ não con người bao gồm khoảng 1011 nơron tham gia vào khoảng 1015 kết nối trên các đường truyền Mỗi đường truyền này dài khoảng hơn một mét Các nơron có nhiều đặc điểm chung với các tế bào khác trong cơ thể, ngoài ra chúng còn có những khả năng mà các tế bào khác không có được, đó là khả năng nhận, xử

lý và truyền các tín hiệu điện hóa trên các đường mòn nơron, các con đường này tạo nên hệ thống giao tiếp của bộ não

Hình 1.1 Cấu trúc của một nơron sinh học điển hình

Mỗi nơron sinh học có 3 thành phần cơ bản:

• Các nhánh vào hình cây (dendrites)

• Thân tế bào (cell body)

Trang 11

• Sợi trục ra (axon)

Các nhánh hình cây truyền tín hiệu vào đến thân tế bào Thân tế bào tổng hợp và xử lý cho tín hiệu đi ra Sợi trục truyền tín hiệu ra từ thân tế bào này sang nơron khác Điểm liên kết giữa sợi trục của nơron này với nhánh hình cây của nơron khác gọi là synapse Liên kết giữa các nơron và độ nhạy của mỗi synapse được xác định bởi quá trình hóa học phức tạp Một số cấu trúc của nơron được xác định trước lúc sinh ra Một số cấu trúc được phát triển thông qua quá trình học Trong cuộc đời cá thể, một số liên kết mới được hình thành, một số khác bị hủy bỏ

Như vậy nơron sinh học hoạt động theo cách thức sau: nhận tín hiệu đầu vào, xử lý các tín hiệu này và cho ra một tín hiệu output Tín hiệu output này sau đó được truyền đi làm tín hiệu đầu vào cho các nơron khác

Dựa trên những hiểu biết về nơron sinh học, con người xây dựng nơron nhân tạo với hy vọng tạo nên một mô hình có sức mạnh như bộ não

1.1.2 Mô hình một nơron nhân tạo

Mô hình toán học của mạng nơron sinh học được đề xuất bởi McCulloch và Pitts, thường được gọi là nơron M-P, ngoài ra nó còn được gọi

là phần tử xử lý và được ký hiệu là PE (Processing Element)

Mô hình nơron có m đầu vào x1, x2,…,xm, và một đầu ra yi như sau:

Hình 1.2 Mô hình một nơron nhân tạo

Trang 12

 Bộ tổng (Hàm tổng - Summing function): Thường dùng để tính tổng của tích các đầu vào với trọng số liên kết của nó

 Ngưỡng (còn gọi là một độ lệch - bias): Ngưỡng này thường được đưa vào như một thành phần của hàm truyền

 Hàm truyền (Transfer function): Hàm này dùng để giới hạn phạm vi đầu ra của mỗi nơron Nó nhận đầu vào là kết quả của hàm tổng và ngưỡng đã cho Thông thường, phạm vi đầu ra của mỗi nơron được giới hạn trong đoạn [0,1] hoặc [-1,1] Các hàm truyền rất đa dạng, có thể là các hàm tuyến tính hoặc phi tuyến Việc lựa chọn hàm truyền tùy thuộc vào từng bài toán và kinh nghiệm của người thiết kế mạng

 Đầu ra: Là tín hiệu đầu ra của một nơron, với mỗi nơron sẽ có tối đa một đầu ra

Xét về mặt toán học, cấu trúc của một nơron i được mô tả bằng cặp biểu thức sau:

i w x net

1

Trang 13

Trong đó:

x1, x2, …xm là các tín hiệu đầu vào, còn wi1, wi2,…,wim là các trọng số kết nối của nơron thứ i, neti là hàm tổng, f là hàm truyền, θi là một ngưỡng, yi

là tín hiệu đầu ra của nơron

Như vậy, tương tự như nơron sinh học, nơron nhân tạo cũng nhận các tín hiệu đầu vào, xử lý (nhân các tín hiệu này với trọng số liên kết, tính tổng các tích thu được rồi gửi kết quả đến hàm truyền), và cho một tín hiệu đầu ra (là kết quả của hàm truyền)

Hàm truyền có thể có các dạng sau:

khi x y

Trang 14

Đồ thị các dạng hàm truyền được biểu diễn như sau:

Hình 1.3 Đồ thị các dạng hàm truyền

1.2 Cấu tạo và phương thức làm việc của mạng nơron

Mạng nơron nhân tạo (Artificial Neural Network) là một cấu trúc mạng được hình thành nên bởi số lượng các nơron nhân tạo liên kết với nhau Mỗi nơron có các đặc tính đầu vào, đầu ra và thực hiện một số chức năng tính toán cục bộ

Với việc giả lập các hệ thống sinh học, các cấu trúc tính toán, mạng nơron có thể giải quyết được các lớp bài toán nhất định như: Bài toán xếp loại, bài toán lập lịch, bài toán tìm kiếm, bài toán nhận dạng mẫu Các bài toán phức tạp cao, không xác định Tuy nhiên, sự liên kết giữa một bài toán bất kỳ trong thực tế với một giải pháp mạng nơron lại là một việc không dễ dàng

Xét một cách tổng quát, mạng nơron là một cấu trúc xử lý song song thông tin phân tán mang các đặc tính nổi bật sau:

- Là một mô hình tính toán dựa trên bản chất của nơron

- Bao gồm một số lượng rất lớn các nơron liên kết với nhau

- Mạng nơron có khả năng học, khái quát hóa tập dữ liệu học thông qua

Trang 15

việc gán và hiệu chỉnh các trọng số liên kết

- Tổ chức theo kiểu tập hợp mang lại cho mạng nơron khả năng tính toán rất lớn, trong đó không có rron nào mang thông tin riêng biệt

1.2.1 Mạng nơron truyền thẳng một lớp

Mô hình mạng nơron truyền thẳng một lớp là mô hình liên kết cơ bản và đơn giản nhất Các nơron tổ chức lại với nhau tạo thành một lớp, đường truyền

tín hiệu được truyền theo một hướng nhất định nào đó Các đầu vào được nối với

các nơron theo các trọng số khác nhau, sau quá trình xử lý cho ra một chuỗi các tín hiệu ra Mạng nơron là mô hình LTU thì nó được gọi là mạng Perception, còn

mạng nơron là mô hình LGU thì nó được gọi là mạng Adaline

Hình 1.4 Mạng truyền thẳng một lớp

Với mỗi giá trị đầu vào x = [ x1,x2, ,xn]T Qua quá trình xử lý của mạng ta sẽ thu được một bộ tương ứng các giá trị đầu ra là y = [y1,y2, ,yn]T được xác định như sau:

i j ij i

y

1

, 1 ).

Trang 16

1.2.2 Mạng nơron truyền thẳng nhiều lớp

Với mạng nơron truyền thẳng một lớp ở trên khi phân tích một bài toán phức tạp sẽ gặp rất nhiều khó khăn, để khắc phục vấn đề này người ta đưa ra

mô hình mạng nơron truyền thẳng nhiều lớp bằng việc kết hợp với một số lớp nơron lại với nhau Lớp nhận tín hiệu vào gọi là lớp vào, lớp đưa ra tín hiệu ra của mạng được gọi là lớp ra Các lớp ở giữa lớp vào và lớp ra được gọi là các lớp ẩn

Hình 1.5 Mô hình cấu trúc của mạng nơron truyền thẳng nhiều lớp

1.2.3 Mạng nơron phản hồi

Kiến trúc phản hồi (Feedback architecture): Là kiểu kiến trúc mạng có các kết nối từ nơron đầu ra tới nơron đầu vào Mạng lưu lại các trạng thái trước đó, và trạng thái tiếp theo không chỉ phụ thuộc vào các tín hiệu đầu vào

mà còn phụ thuộc vào các trạng thái trước đó của mạng Mạng Hopfield thuộc loại này

Hình 1.6 Mạng nơron phản hồi

Trang 17

1.2.4 Mạng nơron hồi quy

Mạng quy hồi một lớp có nối ngược

Hình 1.7 Mạng hồi quy một lớp có nối ngược

Mạng quy hồi nhiều lớp có nối ngược

Hình 1.8 Mạng quy hồi nhiều lớp có nối ngược

1.3 Các luật học

Mạng nơron có một số ưu điểm so với máy tính truyền thống Cấu trúc song song của mạng nơron rất thích hợp cho nhưng ứng dụng đòi hỏi tốc độ nhanh theo thời gian thực Khả năng huấn luyện của mạng nơron có thể khai thác để phát triển hệ học thích nghi Mặt khác, với khả năng tổng quát hóa của mạng nơron, nó có thể áp dụng để điều khiển nhiều tham số phức tạp đồng thời từ đó giải quyết dễ dàng một số bài toán NP - đầy đủ (NP - Complete)

Các luật học đóng vai trò quan trọng trong việc xác định một mạng ron nhân tạo Một cách đơn giản về khái niệm học của mạng nơron là cập nhật trọng số trên cơ sở các mẫu Theo nghĩa rộng thì học có thể được chia thành hai loại: Học tham số và học cấu trúc

Trang 18

nơ-Trong luận văn chúng ta chỉ đề cập tới luật học tham số (Parameter Learning): là các tham số về trọng số cập nhật kết nối giữa các nơron

Các thủ tục học này nhằm tìm kiếm ma trận trọng số sao cho mạng có khả năng đưa ra dự báo sát với thực tế Dạng chung của luật học tham số có thể được mô tả như sau:

M j N i rx

Là quá trình học dựa vào sai số giữa đầu ra thực và đầu ra mong muốn

để làm cơ sở cho việc hiệu chỉnh trọng số Sai số này chính là hằng số học r Luật học điển hình của nhóm này là luật học Della của Widrow (1962) nêu ra đầu tiên dùng xấp xỉ trọng số của Adaline dựa trên nguyên tắc gradient

Trong nhóm luật học này cũng cần kể đến luật học Perceptron của Rosenblatt (1958) Về cơ bản luật học này thay đổi các giá trị trọng trong thời gian học, còn Perceptron thì thêm hoặc bỏ trọng tùy theo giá trị sai số là dương hay âm

Một loạt các luật học khác cũng được dựa trên tư tưởng này Luật oja là cải tiến và nâng cấp của luật Delta Luật truyền ngược là luật mở rộng của luật Delta cho mạng nhiều lớp Đối với mạng truyền thẳng thường sử dụng

Trang 19

luật truyền ngược để chỉnh trọng số với tín hiệu chỉ đạo từ bên ngoài và người

ta gọi mạng này là mạng lan truyền ngược

Hình 1.9 Sơ đồ học tham số có giám sát

1.3.2 Học không có giám sát

Luật học này sử dụng đầu ra của mạng làm cơ sở để hiệu chỉnh các

trọng số liên kết Hay trong luật này chính là tín hiệu ra của mạng Điển hình

là luật Hebb (1949) thường dùng cho các mạng tự liên kết, luật LVQ (Learning Vector Quantization) dùng cho mạng tự tổ chức một lớp thuộc lớp mạng ánh xạ đặc trưng của Kohonen

Luật học Hebb là luật sinh học xuất phát từ tiên đề của Hebb cho rằng: Giữa hai nơron có quan hệ và có thay đổi thế năng mạng thì giữa chúng có sự thay đổi trọng số liên kết Nói cách khác, trọng số được điều chỉnh theo mối tương quan trước và sau, nghĩa là:

M j N i x y

Tín hiệu ra mong muốn Tín hiệu vào

Trang 20

mạng mà không cần tín hiệu chỉ đạo từ bên ngoài Hopfield cũng cải tiến luật Hebb cho các mạng tự liên kết thành 16 dạng khác nhau theo kiểu luật Hebb, luật đối Hebb, luật Hopfield

Như vậy, ứng với mỗi nhóm mạng thường áp dụng một luật học nhất định Nếu tồn tại hàng chục loại mạng khác nhau thì các luật học dùng trong mạng nơron có thể tăng lên rất nhiều lần

Đối với mạng phản hồi thường sử dụng luật Hebb và các luật cải tiến của nó để chỉnh trọng số mà không cần tín hiệu chỉ đạo từ bên ngoài

Hình 1.10 Sơ đồ học tham số không có giám sát

1.3.3 Học củng cố

Tín hiệu tăng cường có thể lấy từ môi trường bên ngoài, nhưng tín hiệu này không được đầy đủ mà chỉ có tính chất kiểm tra quá trình tốt hay xấu Học củng cố cũng là một dạng của học giám sát, bởi vì vẫn nhận được một số tín hiệu từ bê ngoài Nhưng tín hiệu phản hồi chỉ mang tính chất đánh giá hơn

là mang tính chất chỉ dẫn Nó cho biết mức độ tốt hay xấu của một đầu ra cụ thể Tín hiệu củng cố bên ngoài thường được xử lý bằng máy phát tín hiệu đánh giá để tạo ra nhiều hơn nữa các thông tin tín hiệu đánh giá, sau đó dùng

để điều chỉnh các trọng số với mục đích đạt được tín hiệu đánh giá tốt hơn

Mạng nơron

Tín hiệu ra Tín hiệu

vào

Trang 21

1.4 Hệ mờ và mạng nơron

1.4.1 Kiến trúc của hệ mờ tổng quát

Một hệ mờ tiêu biểu có kiến trúc như hình vẽ:

Hình 1.11 Kiến trúc của hệ mờ tổng quát

Thành phần trung tâm của hệ mờ cơ sở luật mờ (fuzzy rule base) Cơ sở luật mờ bao gồm các luật mờ if-then biểu diễn tri thức của chuyên gia trong lĩnh vực nào đó Trong trường hợp một hệ điều khiển mờ cụ thể thì cơ sở luật mờ chính là tri thức và kinh nghiệm của các chuyên gia trong việc điều khiển khi chưa

áp dụng hệ mờ [2]

Thành phần quan trọng kế tiếp là bộ suy diễn mờ (fuzzy inference engine) Nhiệm vụ của bộ phận này là kết hợp các luật trong cơ sở luật mờ, áp dụng vào tập mờ đầu vào theo các phương pháp suy diễn mờ để xác định tập

mờ đầu ra

Dữ liệu đầu vào của hệ điều khiển mờ là các tín hiệu do các bộ phận cảm biến môi trường cung cấp sau khi đã số hóa nên có tính chất rõ (khái niệm rõ ở đây có nghĩa là các tín hiệu đó không phải là các tập mờ, chứ không

có nghĩa là các tín hiệu không có nhiễu) Vì vậy cần phải có bộ mờ hóa (fuzzier) để chuyển các dữ liệu số đầu vào thành các tập mờ để bộ suy diễn

mờ có thể thao tác được

Dữ liệu đầu ra của bộ suy diễn mờ ở dạng các tập mờ sẽ được bộ giải

mờ (defuzzier) chuyển thành tín hiệu số trước khi truyền đến các cơ quan

Cơ sở luật mờ

Bộ suy diễn mờ

Bộ

mờ hóa

Bộ giải mờ

Đầu vào

(số)

Đầu vào (tập mờ)

Đầu ra (tập mờ)

Đầu ra (số) Tham khảo

luật mờ

Trang 22

chấp hành như tay máy, công tắc, van điều khiển

Do các dữ liệu đầu vào và đầu ra được số hóa nên ta chỉ cần xem xét các hệ mờ làm việc với các biến số Trường hợp tổng quát, hệ mờ nhận một vector n chiều ở đầu vào và cho ra một vector n chiều ở đầu ra Hệ mờ như thế được gọi là hệ mờ nhiều đầu vào - nhiều đầu ra (MIMO) Nếu m bằng 1,

ta có hệ mờ nhiều đầu vào - một đầu ra (MISO) Một hệ mờ nhiều đầu vào - nhiều đầu ra có thể phân tích thành nhiều hệ nhiều đầu vào - một đầu ra Do

đó ta chỉ cần tìm hiểu kĩ về hệ mờ nhiều đầu vào một đầu ra với các biến số

Khi chỉ nói về hệ mờ nhiều - một thì ta sẽ ngầm hiểu là một hệ mờ

nhiều đầu vào - một đầu ra với các biến số Kí hiệu 







n i

n

i R U U

1

, V  R, trong đó U ilà miền xác định của các biến vào i, i = 1 n và V là miền giá trị của biến ra y, ta có mô hình hệ mờ nhiều đầu vào - một đầu ra như hình vẽ:

Hình 1.12 Hệ mờ nhiều đầu vào - một đầu ra 1.4.1.1 Cơ sở luật mờ

Cơ sở luật mờ của hệ mờ n đầu vào - một đầu ra gồm m luật if -then mờ có dạng:

If “x1 là Ak1” và “x2 là Ak2” và…và “xn là Akn” then “y là Bk”, k

= 1…m (*)

Trong đó k là chỉ số của luật (luật thứ k trong tập luật), xi là các biến đầu vào, Aki là các tập mờ trên Ui (i=1 n), y là biến đầu ra và Bk là tập mờ

Hệ mờ nhiều đầu vào

Trang 23

trên V (k=1 m)

Các luật mờ dạng (*) được gọi là các luật If-then mờ chuẩn tắc Các luật

mờ không chuẩn tắc có thể biến đổi để đưa về dạng chuẩn tắc tương đương

Có nhiều phương pháp để xác định các luật mờ để đưa vào cơ sở luật

mờ Các phương pháp thông dụng là nhờ các chuyên gia trong lĩnh vực áp dụng, hoặc từ quan sát, thực nghiệm thống kê để có được các tập dữ liệu mẫu đầu vào và ra tương ứng, từ đó dùng các kĩ thuật khai dữ liệu để rút ra các luật

1.4.1.2 Bộ suy diễn mờ

Phương pháp thiết kế bộ suy diễn trong trường hợp cơ sở luật mờ gồm

m luật if-then mờ chuẩn tắc, nhiều đầu vào và một đầu ra (MISO)

Các luật if-then trong thực tế thì thường được tính bằng công thức Mamdani max-min hoặc max-tích (max-prod)

Ta xét kĩ kiến trúc bộ suy diễn mờ sử dụng phương pháp suy diễn min Khi chuyển qua phương pháp suy diễn max-tich thì chỉ cần thay min bằng phép nhân trong các công thức

max-Cho A, A’, B lần lượt là các tập mờ trên vũ trụ X, X, Y Luật if A then

B được thể hiện như một quan hệ mờ R = A x B trên X x Y Khi đó tập mờ B’

suy ra từ A’ được xác định bởi:

Trang 24

 minh A'A, B(y)

Trong đó: h A'Alà độ cao của tập mờ A’A

Hình 1.13 Hàm thuộc hệ mờ một đầu vào – một luật

Trường hợp hai đầu vào và một luật

Đây là trường hợp luật được phát biểu “Nếu x là A và y là B thì z là C” Luật: Nếu x là A và y là B thì z là C

Sự kiện: x là A’ và y là B’

Kết luận: z là C’

Luật mờ với điều kiện có 2 mệnh đề như trên có thể biểu diễn ở dạng A

x B => C Suy luận tương tự trường hợp một đầu vào và một luật ta có:

min )



Trang 25

Minh họa:

Hình 1.14 Hàm thuộc hệ mờ hai đầu vào - một luật

Trường hợp nhiều đầu vào và nhiều luật

Trong trường hợp nhiều đầu vào và nhiều luật, ta tính kế quả đầu ra cho từng luật sau đó kết quả của hệ sẽ là các phép giao hoặc hợp các kết quả riêng

đó tùy theo bảo chất của hệ là hội hay tuyển các luật

Nếu trong một luật có dạng: “nếu x là A hoặc y là B thì z là C” ta tách thanh hai luật riêng biệt “Nếu x là A thì z là C” và “Nếu x là B thì z là C” để tính

 Điểm dữ liệu x phải có độ cao phụ thuộc vào A’

 Vector x thu nhận từ môi trường ngoài có thể sai lệch do nhiễu nên A’ phải phản ánh được tính gần đúng của dữ liệu thực

 Hiệu quả tính toán: Đơn giản cho các tính toán trong bộ suy diễn Sau đây là một số phương pháp mờ hóa thông dụng

+ Mờ hóa đơn trị

Mỗi điểm dữ liệu x được xem như một tập mờ đơn trị tức là tập mờ A

có hàm thuộc xác định như sau:

Trang 26

x u if u

A

0

1 ) (

a x u i i

A u e

+ Mờ hóa tam giác

Mỗi giá trị xi được biểu diễn thành một số mờ A’i tập A’ là tích đề-các của các A’i

i i i i

i i i

i A

b x u if

b x u if b

x u u

0

1 ) (

 Điểm y là đại diện tốt nhất cho B’ Trực quan y là điểm có độ thuộc cáo nhất vào B’ ở trung tâm tập giá đỡ của B’

 Hiệu quả tính toán nhanh

 Tính toán liên tục: Khi B’ thay đổi ít thì y cũng thay đổi ít

Sau đây là phương pháp giải mờ thông dụng:

- Phương pháp lấy max:

Phương pháp này chọn y là điểm có độ thuộc cao nhất vào B’

Trang 27

 Y là trung điểm của H

- Phương pháp lấy trọng tâm

Phương pháp này chọn y là điểm trọng tâm của tập B’

y =



v B v B

dv v

dv v v

) (

- Phương pháp lấy trung bình tâm

Vì B’ thường là hợp hoặc giao của m tập mờ thành phần do vậy ta có thể tính gần đúng giá trị y là bình quân có trọng số của tâm m tập mờ thành phần Giả sử xi và hi là tâm và độ cao của tập m thành phần B’I ta có:

m i i i

h

h x

1.4.2 Sự kết hợp giữa logic mờ và mạng neural

Khi khảo sát mạng nơron và logic mờ, ta thấy mỗi loại đều có điểm mạnh, điểm yếu riêng của nó Đối với logic mờ, ta dễ dàng thiết kế một hệ thống mong muốn chỉ bằng các luật Nếu-thì (If-then) gần với việc xử lý của con người Với đa số ứng dụng thì điều này cho phép tạo ra lời giải đơn giản hơn trong khoảng thời gian ngắn hơn Thêm nữa, ta dễ dàng sử dụng những hiểu biết của mình về đối tượng để tối ưu hệ thống một cách trực tiếp [3]

Tuy nhiên, đôi khi với các ưu điểm hệ điều khiển mờ còn tồn tại một số khuyết như việc thiết kế và tối ưu hóa hệ logic mờ đòi hỏi phải có một số kinh nghiệm về diều khiển đối tượng, đối với những người mới thiết kế lần đầu điều đó hoàn toàn không đơn giản Mặt khác còn hàng loạt những câu hỏi

Trang 28

khác đặt ra cho người thiết kế mà nếu chỉ dừng lại ở tư duy logic mờ thì hầu như chưa có lời giải, ví dụ: số tập mờ trong mỗi biến ngôn ngữ cần chọn bao nhiêu là tối ưu? Hình dạng các tập mờ thế nào? Vị trí mỗi tập mờ ở đâu? Việc kết hợp các tập mờ như thế nào? Trọng số của mỗi luật điều khiển bằng bao nhiêu? Nếu như tri thức cần đưa vào hệ được thể hiện dưới dạng các tập dữ liệu (điều này thường gặp khi thu thập và xử lý dữ liệu để nhận dạng đối tượng) thì làm thế nào?

Đối với mạng nơron, chúng có một số ưu điểm như xử lý song song nên tốc độ xử lý rất nhanh Mạng nơron có khả năng học hỏi, ta có thể huấn luyện mạng để xấp xỉ một hàm phi tuyến bất ky, đặc biệt khi đã biết một tập

dữ liệu vào/ra…Song nhược điểm cơ bản của mạng nơron là khó giải thích rõ ràng hoạt động của mạng nơron như thế nào Do vậy việc chỉnh sửa trong mạng nơron rất khó khăn

Hai tiêu chí cơ bản trợ giúp cho người thiết kế ở logic mờ và ở mạng nơron hiện trái ngược nhau:

Thể hiện tri thức Không tường minh, khó

giải thích và khó sửa đổi

Tường minh, dễ kiểm chứng hoạt động và dễ sửa đổi

Khả năng học

Có khả năng học thông qua các tập dữ liệu

Không có khả năng học, người thiết kế phải tự thiết kế tất cả

Từ những phân tích trên, ta thấy nếu kết hợp logic mờ và mạng nơron,

ta sẽ có một hệ lai với ưu điểm của cả hai: logic mờ cho phép thiết kế hệ dễ dàng, tường minh trong khi mạng nơron cho phép học những gì mà ta yêu cầu

về bộ điều khiển

Nó sửa đổi các hàm phụ thuộc về hình dạng, vị trí và sự kết hợp,…hoàn toàn tự động Điều này làm giảm bớt thời gian cũng như làm giảm bớt chi phí

Trang 29

ta sẽ nghiên cứu các thuật toán anfis và ứng dụng thuật toán để giải bài toán

dự báo mực nước hồ thủy điện Thác Bà

Trang 30

Chương 2

MÔ HÌNH MẠNG ANFIS VÀ KHẢ NĂNG ỨNG DỤNG

2.1 Hệ suy diễn mờ dựa trên mạng thích nghi

2.1.1 Các mô hình kết hợp giữa hệ mờ và mạng nơron

Một mạng nơron với các trọng số được điều chỉnh có thể xem như là một thiết bị điều khiển tự động nhờ vào tính chất hồi quy phi tuyến của các đối tượng rời rạc Tuy nhiên, tri thức được lưu trữ trong mạng không rõ ràng, không mô tả được những mối liên hệ giữa dữ liệu nhập và dữ liệu xuất, mà chỉ có thể xác định các mối liên hệ này thông qua những tham số thích nghi của mạng Trái lại, một luật mờ nếu - thì lại có thể diễn tả được các mối liên

hệ đó dưới dạng ngôn ngữ tự nhiên, nhưng lại không có khả năng điều chỉnh luật cho phù hợp Hai vấn đề này được kết hợp lại tạo thành một hệ thống nơron - mờ nhằm đạt được khả năng “đọc” và “học” cùng một lúc Các luật thu được từ hệ thống này có thể điều chỉnh phù hợp với dữ liệu phát sinh mô hình, và đối với các ứng dụng điều khiển tự động, mô hình nơron - mờ có thể tích hợp với các luật chuyên gia nhằm đưa ra những kết quả chính xác

Bên cạnh các luật chuyên gia, các luật trích ra từ dữ liệu cũng là một hình thức mô hình hóa hệ thống điều khiển tự động, chẳng hạn như trong

Nhận dạng, khai mỏ dữ liệu,… Mục tiêu đưa ra các luật này là nhằm giảm độ

phức tạp của vấn đề cũng như lượng dữ liệu liên quan đến vấn đề Có rất

nhiều phương pháp phân tích dữ liệu để đưa ra hệ thống các luật để có thể thực hiện một sự kết hợp tối ưu giữa logic mờ và mạng nơron

Các nghiên cứu về mạng nơron đã bắt đầu từ thập niên 40 và logic mờ

từ thập niên 60, nhưng mô hình nơron - mờ là một lĩnh vực mới Năm 1992, Roger Jang đã đề xuất mô hình ANFIS nhằm đáp ứng việc xây dựng một tập luật mờ nếu - thì với các hàm thành viên xấp xỉ dữ liệu nhập - xuất đích Kết

Trang 31

quả là một hệ thống suy luận mờ dựa trên mạng thích nghi không chỉ thể hiện tốt thông tin ngôn ngữ (các luật ngôn ngữ) từ các chuyên gia, mà còn phù hợp với việc sử dụng dữ liệu dạng số để thu được mức độ thực hiện tốt hơn

2.1.2 Luật mờ if then và hệ thống suy diễn mờ

2.1.2.1 Luật mờ

Luật mờ là biểu thức điều kiện có dạng “NẾU A THÌ B”, trong đó A và

B là nhãn của các tập mờ được mô tả bằng cách xấp xỉ các hàm thành viên Nhờ vào dạng rút gọn, luật mờ thường được dùng để thiết lập những phương thức lập luận không chính xác, nhằm thể hiện tính đa dạng trong tri thức của con người Ví dụ sau mô tả một sự kiện đơn giản là (đây là luật mờ loại Mamdani):

Nếu nhiệt độ cao thì giá máy lạnh tăng

Trong đó nhiệt độ và giá máy lạnh là các biến ngôn ngữ, cao và tăng là các giá trị ngôn ngữ hoặc các nhãn được mô tả bởi các hàm thành viên

Một dạng khác của luật mờ do Takagi và Sugeno đề xuất, có các tập

mờ chỉ xuất hiện trong phần giả thuyết của luật Ví dụ (đây là luật mờ loại Sugeno):

Nếu lưu lượng dòng chảy cao thì mực nước sông=k*lưu lượng dòng chảy trong đó cao là phần giả thuyết được mô tả bởi hàm thành viên xấp xỉ Tuy nhiên, phần kết luận được định nghĩa bởi phương trình theo biến lưu lượng dòng chảy

Cả hai loại luật mờ trên đều được mở rộng trong cả hai lĩnh vực mô hình hóa và điều khiển tự động Bởi vì lợi ích của các nhãn ngôn ngữ và các hàm thành viên mà một luật mờ có thể nắm bắt dễ dàng qui luật điều khiển của con người

Trang 32

2.1.2.2 Hệ suy luận mờ

Một hệ thống suy luận mờ gồm 5 khối cơ bản sau (Hình 2.1):

Hình 2.1 Hệ thống suy luận mờ

 Một cơ sở luật chứa các luật mờ nếu - thì

 Một cơ sở dữ liệu định nghĩa các hàm thành viên của các tập mờ được sử dụng trong các luật mờ

 Một đơn vị thực hiện quyết định thực hiện phép toán suy luận trên

1 So sánh giá trị đầu vào với hàm thành viên của phần giả thiết để có được giá trị thành viên (hay những độ đo tương tự) của những tập ngữ nghĩa (bước này được gọi là bước mờ hóa)

2 Kết nối (qua toán tử chuẩn T-norm, thường là nhân hay lấy tối tiểu) giá trị tạo thành viên của phần giả thiết để có được trọng số vào của luật

3 Tạo kết luận đang tính toán (có thể là mờ hay rõ) cho mỗi luật dựa

Cơ sơ tri thức

Cơ sở

dữ liệu Cơ sở luật

Mờ khóa

Khử

mờ khóa

Đơn vị thực hiện quyết định

Dữ

liệu

Dữ liệu

Trang 33

vào trọng sổ của luật

4 Tổng hợp các giá trị kết luận này để tạo kết quả rõ (bước này được gọi là giải mờ)

Có một số suy diễn mờ được sử dụng trong lĩnh vực này, dựa vào loại của lập luận mờ và loại sử dụng luật mờ if-then mà các hệ suy diễn mờ được chia ra làm ba loại như sau:

Loại 1: Toàn bộ dữ liệu xuất là trung bình trọng số các dữ liệu xuất thô của mỗi luật có được do ngưỡng kích hoạt của luật (toán tử tích hoặc min tổ

hợp các giả thuyết) và các hàm thành viên dữ liệu xuất

Loại 2: Toàn bộ dữ liệu xuất thu được bằng cách dùng toán tử max cho các dữ liệu xuất mờ đủ tiêu chuẩn (cực tiểu hóa độ ngưỡng kích hoạt và hàm

thành viên dữ liệu xuất của mỗi luật) Các ý tưởng khác nhau được đề xuất để chọn lựa dữ liệu xuất thô cuối cùng dựa trên toàn bộ dữ liệu xuất mờ; một số trong chúng là tâm của diện tích, đường phân giác của diện tích, trung bình cực đại, tiêu chuẩn cực đại,…

Loại 3: Các luật mờ loại Takagi và Sugeno được sử dụng Dữ liệu xuất của mỗi luật là một tổ hợp tuyến tính các dữ liệu nhập, cộng với một số hạng không đổi, và dữ liệu xuất cuối cùng chính là trung bình trọng số các dữ liệu xuất trong mỗi luật

Định dạng
Số trang	67
Dung lượng	815,26 KB