Từ 20 năm nay, lý thuyết tập mờ và mạng nơron nhân tạo đã phát triển rất nhanh và đa dạng. Công nghệ mờ và công nghệ mạng nơron đã cung cấp những công nghệ mới cho các ngành công nghiệp làm ra nhiều sản phẩm thông minh, đáp ứng nhu cầu thị trường cần có những bộ điều khiển linh hoạt hơn.
Trang 22.2 Mạng nơron nhân tạo
2.2.1 Mô hình nơron nhân tạo
2.2.2 Định nghĩa và phân loại mạng nơron nhân tạo
2.3 Thủ tục học của mạng nơron nhân tạo
Từ 20 năm nay, lý thuyết tập mờ và mạng nơron nhân tạo đã phát triển rất nhanh và
đa dạng Công nghệ mờ và công nghệ mạng nơron đã cung cấp những công nghệ mới chocác ngành công nghiệp làm ra nhiều sản phẩm thông minh, đáp ứng nhu cầu thị trường cần
có những bộ điều khiển linh hoạt hơn Hệ mờ và mạng nơron được kết hợp với nhau đểcùng phát huy những ưu điểm của chúng Một trong những dạng kết hợp đó là mạng nơron
mờ, nhờ có nó mà chúng ta đã giải quyết được rất nhiều bài toán khó mà với thuật giảithông thì không thực hiện được hoặc nếu có thì cũng rất phức tạp và mất nhiều thời gian.Với bài toán xác định quan hệ giữa không gian vào và không gian ra dựa trên các cặpphần tử vào ra đã biết Cụ thể cho không gian vào , không gian ra và các cặp phần tử
2
Trang 3vào ra đã biết , tức là cho một phần tử thì có một phần tử ra tương ứng Yêu cầu bài toán đặt ra là xác định quan hệ giữa và Một trong nhữngphương pháp thường được sử dụng để giải quyết bài toán trên đó là phương pháp bìnhphương bé nhất Để giảm độ phức tạp và thời gian tính toán trong báo cào này tôi sử dụngmột phương pháp mới đó là dùng mạng nơron nhân tạo Và quan hệ giữa không gian vào và
ra xác định được không phải là quan hệ bình thường mà là quan hệ mờ
Bài nghiên cứu gồm những phần sau:
I Tổng quan lý thuyết tập mờ và quan hệ mờ
Giới thiệu về khái niệm tập mờ, các phép toán trên tập mờ, quan hệ mờ
II Giới thiệu về mạng nơron nhân tạo
Giới thiệu cấu trúc của một nơron, định nghĩa và phân loại mạng nơron, các thủ họcmạng nơron, thuật toán lan truyền ngược
III Bài toán xác định quan hệ mờ bằng mạng nơron nhân tạo
Ánh xạ bài toán xác định quan hệ mờ lên mạng nơron nhân tạo, đưa ra cách huấnluyện mạng Cuối cùng là demo thuật toán xác định quan hệ mờ bằng mạng nơron nhân tạo
I Tổng quan lý thuyết tập mờ và quan hệ mờ
được gọi là hàm thuộc của tập Tập là tập kinh điển, là không gian nền Như vậy
hàm thuộc của tập cổ điển chỉ nhận hai giá trị là 0 hoặc 1 Giá trị 1 của hàm thuộc
còn được gọi là giá trị đúng, ngược lại 0 là giá trị sai của Một tập luôn có
, với mọi
được gọi là không gian nền (tập nền).
Một tập có dạng
Trang 4Tập , như vậy được gọi là các tập mờ.
Lý do là với những định nghĩa “mờ” như vậy chưa đủ để xác định được một sốchẳng hạn như có thuộc hoặc có thuộc hay không Nên chúng takhông thể dùng hàm thuộc của tập cổ điển chỉ có hai giá trị 1 và 0 để định nghĩa tập và trong trường hợp này
Vì vậy người ta nghĩ rằng: tại sao lại không mở rộng miền giá trị cho hàm thuộc của tập cổ điển, tức là hàm thuộc sẽ có nhiều hơn hai giá trị Khi đó thay vì việc trả lời câu
hỏi có thuộc hay không, ngưòi ta sẽ trả lời câu hỏi là: vậy thì thuộc
1
Trang 5bao nhiêu phần trăm? Giả sử rằng có câu trả lời thì lúc này hàm thuộc tại điểm phải có một giá trị trong đoạn , tức là
Ánh xạ được gọi là hàm thuộc (hàm phụ thuộc hay hàm thành viên ) của tập mờ
Tập kinh điển được gọi là tập nền (hay tập vũ trụ) của tập mờ
Ví dụ một tập mờ của các số tự nhiên nhỏ hơn 6 với hàm phụ thuộc có
dạng như hình 1.2a định nghĩa trên nền sẽ chứa các phần tử sau
Số tự nhiên 1 và 2 có độ phụ thuộc
Trang 6,các số tự nhiên 3 và 4 có độ phụ thuộc nhỏ hơn 1
là việc xác định các hàm thuộc cho phép hợp, giao , bù từ những tập mờ Một nguyên tắc
cơ bản trong việc xây dựng các phép toán trên tập mờ là không được mâu thuẫn với nhữngphép toán đã có trong lý thuyết tập hợp kinh điển
Trang 7Hình 1.3 Hàm thuộc của hai tập mờ có cùng không gian nền
a) Hàm thuộc của hai tập mờ và b) Hợp của hai tập mờ và theo luật max
Một cách tổng quát thì bất cứ một ánh xạ dạng
nếuthoả mãn 5 tiêu chuẩn đã nêu trong định nghĩa hợp hai tập mờ đều được xem như là hợpcủa hai tập mờ và có chung một không gian nền
Công thức trên cũng được mở rộng để áp dụng cho việc xác định hợp của hai tập mờkhông cùng không gian nền, bằng cách đưa cả hai tập mờ về chung một không gian nền làtích của hai tập nền đã cho
Ví dụ cho tập mờ xác định trên không gian nền và tập mờ xác định trênkhông gian nền Do hai tập nền và độc lập với nhau nên hàm thuộc ,
của tập mờ sẽ không phụ thuộc vào và ngược lại , của tập cũng sẽ không phụ thuộc vào Điều đó thể hiện ở chỗ trên không gian nền mới là tậptích hàm phải là một mặt “cong” dọc theo trục và là một mặt
“cong” dọc theo trục (hình 1.4) Tập mờ như vậy được định nghĩa trên hai không
gian nền và Để phân biệt được chúng, sau đây kí hiệu sẽ được dùng để chỉtập mờ trên không gian nền Đối với các tập mờ khác cũng được kí hiệu tương
Trang 8Hình 1.4 Phép hợp hai tập mờ không cùng nền
a Hàm thuộc của hai tập mờ và
b Đưa hai tập mờ về chung một nền
c Hợp hai tập mờ trên nền
Sau khi đã đưa được hai tập mờ và về chung một không gian nền là
thành và thì hàm thuộc của tập mờ được xác định theo côngthức (1.8)
Hợp hai tập mờ theo luật max
Cho tập mờ xác định trên không gian nền và tập mờ xác định trên khônggian nền , có hàm thuộc lần lượt là , Hợp của hai tập mờ và theoluật max là một tập mờ xác định trên không gian nền với hàm thuộc
Trang 9Một cách tổng quát, do hàm thuộc của hợp hai tập mờ , không cùngkhông gian nền chỉ phụ thuộc vào và nên ta có thể xem
là hàm của hai biến , được định nghĩa như sau
(1.10)
Ta đi đến định nghĩa về hàm thuộc của hợp hai tập mờ không cùng khônggian nền:
Định nghĩa 1.3
Hàm thuộc của hợp giữa hai tập mờ với định nghĩa trên không gian nền
và với định nghĩa trên không gian nền là một hàm hai biến
Một hàm hai biến thoả mãn các điều kiện của định nghĩa
trên còn được gọi là hàm t-đối chuẩn (t-conorm).
Trang 10v Nếu thì hay có tính chất không giảm, tức
Tương tự như đã trình bày về phép hợp hai tập mờ, có nhiều công thức khác nhau
để tính hàm thuộc của giao hai tập mờ và bất cứ một ánh xạ
nào thoả mãn 5 tiêu chuẩn đã nêu trong định nghĩa trên đều được xem như là hàm thuộccủa giao hai tập mờ và có chung một không gian nền Sau đây là một trongnhững công thức để tính hàm thuộc của phép giao gồm:
(Luật min) (1.11)Công thức trên cũng áp dụng được cho hợp hai tập mờ không cùng không gian nềnbằng cách đưa cả hai tập mờ về chung một không gian nền là tích của hai không gian nền
đã cho
Hình 1.5 Phép giao của hai tập mờ
a) Hàm thuộc của hai tập mờ và
b) Phép giao hai tập mờ cùng không gian nền theo luật min
c) Phép giao hai tập mờ cùng không gian nền theo luật tích đại số
d) Phép giao hai tập mờ không cùng khôn gian nền
Trang 11Giao của hai tập mờ theo luật min
Giao của hai tập mờ với hàm thuộc định nghĩa trên không gian nền và với hàm thuộc định nghĩa trên không gian nền là một tập mờ xác định trênkhông gian nền có hàm thuộc
(1.12)Trong đó
với mọi
Với ví dụ về tập mờ , có hàm đặc tính như trong hình 1.5a thì tập giao của
chúng trên tập nền chung sẽ có hàm thuộc mô tả như trong hình 1.5d.
Trong ví dụ trên ta thấy hàm thuộc của giao hai tập mờ , khôngcùng không gian nền chỉ phụ thuộc vào và Do đó khôngmất tính tổng quát nếu ta xem là hàm của hai biến , được định nghĩanhư sau
(1.13)
Ta đi đến định nghĩa về hàm thuộc của hợp hai tập mờ không cùng khônggian nền như sau:
Định nghĩa 1.4
Hàm thuộc của hợp giữa hai tập mờ với định nghĩa trên không gian nền
và với định nghĩa trên không gian nền là một hàm hai biến
xác định trên nền thoả mãn:
Trang 12h) , tức là có tính không giảm.Một hàm hai biến thoả mãn các điều kiện của định nghĩa
trên còn được gọi là hàm t- chuẩn (t-norm).
1.2.3 Phép bù
Cho tập mờ trên không gian nền Phép bù của là một tập mờ cũng xácđịnh trên không gian nền , kí hiệu là , nó có hàm thuộc thoả mãn:
i chỉ phụ thuộc vào
iii Nếu thì , hay
iv.Nếu thì , tức là
Do hàm thuộc của chỉ phụ thuộc vào nên ta có thể xem
như là một hàm của trong Từ đó đưa ra định nghĩa tổng quát hơn về phép bù
Trang 13Định nghĩa: Quan hệ mờ R trên gọi là:
a) Min-chuyển tiếp nếu
b) Bắc cầu yếu nếu có
Trang 14Tác động của đầu vào với hệ sẽ là phép hợp thành sẽ cho ở đầu ra (output)một tập mờ trên không gian nền , kí hiệu là Khi ấy ta có
II Giới thiệu về mạng nơron nhân tạo
Mạng nơron hay mạng nơron nhân tạo là sự tái tạo bằng kỹ thuật những chức năngcủa hệ thần kinh con người Trong quá trình tái tạo không phải tất cả các chức năng của bộnão con người có đều được tái tạo, mà chỉ có những chức năng cần thiết Bên cạnh đó còn
có những chức năng mới được tạo ra nhằm giải quyết một bài toán điều khiển đã địnhhướng trước Trước khi tìm hiểu về mạng nơron chúng ta giới thiệu sơ lược về mạng nơronsinh học
2.1 Mạng nơron sinh học
Não người là tổ chức vật chất cấp cao, có cấu tạo vô cùng phức tạp, dày đặc các mốiliên kết giữa các nơron nhưng xử lý thông tin rất linh hoạt trong môi trường bất định
Hình 2.1 Mô hình mạng nơron sinh học
Trong bộ não người có khoảng tế bào thần kinh được gọi là các nơron
và mỗi nơron có thể liên kết với nơron khác thông qua các khớp nối thần kinh(synapse) Dưới con mắt của những người làm tin học cấu tạo của mỗi nơron gồm cácthành phần cơ bản sau:
- Thân nơron được giới hạn trong một màng membran và trong cùng là nhân Từthân nơron còn có rất nhiều đường rẽ nhánh tạm gọi là rễ
14
Trang 15- “Bus” liên kết nơron này với các nơron khác được gọi là axon, trên axon có cácđường rẽ nhánh Nơron còn có thể liên kết với các nơron khác qua các rễ Chính vì cáchliên kết đa dạng như vậy nên mạng nơron có độ liên kết rất cao.
Các rễ của noron được chia làm hai loại: loại nhận thông tin từ các nơron khác qua
axon, mà ta sẽ gọi là rễ đầu vào và loại đưa thông tin qua axon tới các nơron khác, gọi là rễ đầu ra Một nơron có thể có nhiều rễ đầu vào, nhưng chỉ có một rễ đầu ra Bởi vậy nếu coi
nơron như một khâu điều khiển thì nó chính là khâu có nhiều đầu vào, một đầu ra Mộtnơron sẽ ở trạng thái kích thích khi tại đầu vào xuất hiện một tín hiệu tác động vượt quángưỡng cân bằng của nơron
Một tính chất rất cơ bản của mạng nơron sinh học là các đáp ứng theo kích thích cókhả năng thay đổi theo thời gian Các đáp ứng có thể tăng lên, giảm đi hoặc hoàn toàn biếnmất Qua các nhánh axon liên kết tế bào nơron này với các nơron khác, sự thay đổi trạngthái của một nơron cũng dẫn theo sự thay đổi trạng thái của những nơron khác và do đó là
sự thay đổi của toàn bộ mạng nơron Việc thay đổi trạng thái của mạng nơron có thể thựchiện qua một quá trình “dạy” hoặc do khả năng “học” tự nhiên
Cấu trúc của mạng nơron luôn luôn phát triển và thay đổi để thích nghi dần với môitrường, làm cho cấu trúc bộ não ngày càng trở nên phức tạp sau mỗi lần học Một số cấutrúc của nơron được xác định trước, một số sau này mới được hình thành và một số thì bịhuỷ bỏ qua quá trình chọn lọc tự nhiên, học và thích nghi
Các nhà khoa học đã và đang xây dựng và phát triển các mô hình xử lý thông tin môphỏng hoạt dộng của bộ não người Đó chính là mô hình mạng nơron nhân tạo
2.2 Mạng nơron nhân tạo
2.2.1 Mô hình nơron nhân tạo
Một nơron nhân tạo phản ánh các tính chất cơ bản của nơron sinh học Mỗinơron nhân tạo là một đơn vị xử lí thông tin làm cơ sở cho hoạt động của một mạngnơron Nó có chức năng nhận tín hiệu vào, tổng hợp và xử lý các tín hiệu vào để tính tínhiệu ra Dưới đây là một mô hình của một nơron nhân tạo
Trang 16Hình 2.2 Mô hình một nơron nhân tạo
Trong đó:
- với : các tín hiệu đầu vào
- với : các trọng số tương ứng với đầu vào
- : ngưỡng kích hoạt của nơron
- : tín hiệu tổng hợp đầu vào
- : Hàm kích hoạt
- : tín hiệu ra của nơron Đầu vào của nơron nhân tạo gồm n tín hiệu với Mỗi tín hiệu đầuvào tương ứng với một trọng số với , nó thể hiện mức độ ảnh hưởng củatín hiệu đến nơron
Một nơron có thể có nhiều đầu vào nhưng chỉ có một tín hiệu đầu ra Tín hiệu đầuvào của một nơron có thể là dữ liệu từ bên ngoài mạng, hoặc đầu ra của một nơron khác,hoặc là đầu ra của chính nó
Nhằm tăng khả năng thích nghi của mạng nơron trong quá trình học, người ta sử dụnggán thêm một tham số (Bias) cho mỗi nơron nhân tạo Tham số đó còn gọi là trọng số củanơron, ta kí hiệu trọng số của nơron thứ là
Mỗi một nơron trong một mạng kết hợp các giá trị đưa vào nó thông qua các liên kếtvới nơron khác, sinh ra một giá trị gọi là Hàm thực hiện nhiệm vụ này gọi là hàm kếthợp (combination function), được định nghĩa bởi một luật lan truyền cụ thể Trong phần lớncác mạng nơron, chúng ta giả sử rằng mỗi một nơron cung cấp một bộ cộng như là đầu vào
Trang 17cho đơn vị mà nó liên kết Để tính tổng hợp tín hiệu đầu vào , ta giả định là hàmcủa các tín hiệu và các trọng số
Sau khi tổng hợp được tín hiệu đầu vào , sử dụng hàm kích hoạt biến đổi
để thu được tín hiệu đầu ra
(2.2)Tóm lại có thể xem nơron là một hàm phi tuyến nhiều đầu vào, một đầu ra
Hàm kích hoạt phải thoả mãn các điều kiện sau:
- Tín hiệu đầu ra phải không âm với mọi giá trị của
- Hàm phải liên tục và bị chặn trong khoảng
Hàm kích hoạt hay còn được gọi là hàm nén vì chúng nén tín hiệu đầu ra vào mộtkhoảng nhỏ Hàm kích hoạt hay được sử dụng là:
1)Hàm đồng nhất (Linear function, Identity function)
(2.3)Nếu coi các đầu vào là một đơn vị thì chúng ta sẽ sử dụng hàm này Đôi khi một hằng
số được nhân với để tạo ra một hàm đồng nhất
Hình 2.3 Hàm đồng nhất
2)Hàm bước nhị phân (Binary step function, Hard limit function)
01
Trang 18Hàm này còn được gọi là hàm ngưỡng (Threshold function hay Heaviside function).
Đầu ra của hàm này chỉ giới hạn trong hai giá trị:
4)Hàm sigmoid lưỡng cực (Bipolar sigmoid function (tansig))
-1
f(x)
18
Trang 19độ liên kết giữa các phần tử và quá trình xử lý bên trong các phần tử Hệ thống này có thểhọc số liệu và có khả năng tổng quát hoá từ các số liệu được học”.
Trong định nghĩa trên, các phần tử xử lý được nhắc đến chính là các nơron
2.2.2.2 Phân loại
Liên kết các đầu vào và ra của nhiều nơron với nhau ta được một mạng nơron Nguyên
lý cấu tạo của một mạng nơron bao gồm một hoặc nhiều lớp Mỗi lớp bao gồm nhiều nơron
có cùng một chức năng trong mạng
Mạng nơron nhân tạo có thể được chế tạo bằng nhiều cách khác nhau vì vậy trongthực tế tồn tại rất nhiều kiểu mạng nơron nhân tạo Dựa vào số lớp hay sự liên kết giữa cáclớp trong mạng mà người ta phân mạng nơron nhân tạo thành các nhóm khác nhau
* Phân loại theo số lớp
Phân loại theo số lớp thì mạng nơron nhân tạo gồm có hai nhóm: mạng một lớp vàmạng nhiều lớp
- Mạng một lớp
Mạng một lớp cấu thành từ một lớp mạng, nó vừa là lớp vào vừa là lớp trung gian
và cũng là lớp ra Một lớp mạng bao gồm một nhóm các nơron được tổ chức theo một cáchsao cho tất cả chúng đều nhận cùng một véc tơ đầu vào để xử lý cùng thời điểm Việc sảnsinh ra đầu vào, biến đổi thành tín hiệu đầu ra xuất hiện cùng một lúc trong tất cảcác nơron
Hình 2.5 Mô hình mạng một lớp.
- Mạng nhiều lớp
Mạng nhiều lớp được cấu thành từ nhiều lớp liên kết với nhau, bao gồm một lớp
vào, lớp ẩn và một lớp ra Trong đó, lớp nhận tín hiệu đầu vào được gọi là lớp vào Các tín hiệu đầu ra của mạng được sản sinh bởi lớp ra của mạng Các lớp nằm giữa lớp vào và lớp
ra được gọi là lớp ẩn Lớp ẩn là thành phần nội tại của mạng, nó không có bất kỳ tiếp xúc
nào với môi trường bên ngoài Số lượng lớp ẩn có thể dao động từ 0 đến một vài lớp Tuy