NHIỆM VỤ VÀ NỘI DUNG - Tìm hiểu cấu trúc và giải thuật học của mạng nơron mờ hồi quy RFNN - Nghiên cứu và thực hiện các bộ điều khiển thích nghi hệ tay máy hai bậc tự do với mô hình phi
Trang 1NGUYỄN KHẮC NGUYÊN
CHUYÊN NGÀNH: TỰ ĐỘNG HÓA
MÃ SỐ: 60.52.60
TP HỒ CHÍ MINH , 07-2010
Trang 2ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
Cán bộ hướng dẫn khoa học: PGS.TS NGUYỄN THỊ PHƯƠNG HÀ
Cán bộ chấm nhận xét 1: TS NGUYỄN VĨNH HẢO
Cán bộ chấm nhận xét 2: TS TRƯƠNG ĐÌNH CHÂU
Luận văn thạc sĩ được bảo vệ tại
HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC SĨ TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày 23 tháng 07 năm 2010
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:
Xác nhận của Chủ tịch Hội đồng đánh giá luận văn và Bộ môn quản lý chuyên ngành sau khi luận văn đã được sửa chữa ( nếu có).
Trang 3Họ và tên học viên: NGUYỄN KHẮC NGUYÊN Phái: Nam
I TÊN ĐỀ TÀI:
ĐIỀU KHIỂN THÍCH NGHI HỆ TAY MÁY HAI BẬC TỰ DO
DÙNG MẠNG NƠRON MỜ HỒI QUY
II NHIỆM VỤ VÀ NỘI DUNG
- Tìm hiểu cấu trúc và giải thuật học của mạng nơron mờ hồi quy (RFNN)
- Nghiên cứu và thực hiện các bộ điều khiển thích nghi hệ tay máy hai bậc tự do với mô hình phi tuyến theo các mô hình điều khiển sau:
online
Mô hình điều khiển thích nghi trực tiếp, gián tiếp dùng mạng RFNN
- Mô phỏng các mô hình điều khiển trên MATLAB( viết bằng M-file)
- Phân tích, đánh giá so sánh kết quả mô phỏng của các mô hình điều khiển.
- Khảo sát tín ổn định và bền vững của bộ điều khiển thông qua việc thay đổi các kiểu tín hiệu tham khảo, thêm nhiễu và thay đổi tải của hệ tay máy 2 bậc tự do
III NGÀY GIAO NHIỆM VỤ:
.IV NGÀY HOÀN THÀNH NHIỆM VỤ:
V CÁN BỘ HƯỚNG DẪN: PGS.TS NGUYỄN THỊ PHƯƠNG HÀ
QL CHUYÊN NGÀNH
Đề cương và nội dung luận án thạc sĩ đã được hội đồng chuyên ngành thông qua.
Ngày…tháng…năm 2010
Trang 4LỜI CẢM ƠN
Trước hết tôi xin chân thành cảm ơn đến tất cả Quý Thầy Cô thuộc Bộ Môn
Điều Khiển Tự Động, Khoa Điện-Điện Tử, Trường Đại Học Bách Khoa TPHCM
đã trang bị những kiến thức nền tảng, các phương pháp nghiên cứu và đã giúp đỡ tôi trong suốt quá trình học tập cũng như nghiên cứu đề tài.
Tôi xin cảm ơn các bạn lớp cao học Tự Động Hóa K17 đã động viên và nhiệt
tình giúp đỡ khi gặp khó khăn.
Tôi xin cảm ơn Quý Thầy Cô thuộc Bộ Môn Viễn Thông và Kỹ Thuật Điều
Khiển, Khoa Công Nghệ Thông Tin và Truyền Thông, Đại Học Cần Thơ (nay là
Bộ Môn Tự Động Hóa, Khoa Công Nghệ, Đại Học Cần Thơ) đã tạo mọi điều kiện
thuận lợi để tôi có thể yên tâm học tập.
Tôi xin cảm ơn thầy Nguyễn Chí Ngôn (Phó Trưởng Khoa Công Nghệ ĐHCT), thầy Lương Vinh Quốc Danh (Bộ Môn Điện Tử Viễn Thông, Khoa Công
-Nghệ, Đại Học Cần Thơ) đã giúp đỡ tôi trong suốt quá trình thực hiện đề tài.
Đặc biệt tôi xin chân thành cảm ơn Cô PGS.TS Nguyễn Thị Phương Hà đã
tận tình hướng dẫn để tôi hoàn thành đề tài.
Tôi cũng xin gửi lời cảm ơn đến các tác giả của các bài báo mà tôi đã sử dụng làm tài liệu tham khảo trong luận văn này.
Và cuối cùng tôi muốn gửi lời biết ơn sâu sắc nhất đến những người thân trong gia đình tôi; đã không ngừng động viên, thông cảm và giúp đỡ tôi rất nhiều trong cuộc sống hàng ngày để tôi có thể an tâm học tập và hoàn thành được luận văn thạc sĩ của mình.
Học viên Cao Học Lớp TĐH K17
Nguyễn Khắc Nguyên
Trang 5TÓM TẮT
Nghiên cứu này đề cập đến việc sử dụng mạng nơ-ron mờ hồi quy (Recurrent Fuzzy Neural Network - RFNN) để nhận dạng và điều khiển hệ phi tuyến tay máy hai bậc tự do Mô hình toán học của hệ tay máy được xây dựng dựa vào phương trình Euler-Lagrange và biến đổi đưa về hệ phương trình trạng thái cho mục đích khảo sát tính hiệu quả của mạng RFNN
Mạng RFNN bản thân đã là mạng liên kết nhiều lớp có hồi qui dùng để thực hiện suy diễn mờ sử dụng các luật mờ động Các liên kết tạm được nhúng vào bên trong mạng bằng cách thêm các kết nối hồi tiếp tại lớp thứ hai của mạng nơ-ron mờ(Fuzzy Neural Network - FNN) Mạng RFNN mở rộng khả năng cơ bản của mạng FNN nhằm giải quyết các vấn đề về thời gian Hơn nữa, các kết quả đối với suydiễn mờ mạng FNN, phương pháp xấp xỉ tổng quát, và phân tích hội tụ còn được
mở rộng cho mạng RFNN
Bên cạnh nhiều phương pháp điều khiển hệ tay máy như điều khiển PID kinh điển, điều khiển trực tiếp dùng logic mờ, mạng nơ-ron … nghiên cứu này, sử dụng mạng nơ-ron mờ hồi quy để nhận dạng mô hình thuận và nhận dạng mô hình ngược của đối tượng Phương pháp ổn định Lyapunov cũng được áp dụng để đảm bảo sựhội tụ của mạng RFNN qua việc lựa chọn tốc độ học thích hợp Trên cơ sở đó, đềtài đã xây dựng bộ điều khiển thích nghi trực tiếp và gián tiếp sử dụng mạng RFNN cho đối tượng tay máy hai bậc tự do Bên cạnh đó, luận văn còn thực hiện mô phỏng các phương pháp điều khiển thông thường khác như: điều khiển PID, điều khiển mờ, nơ-ron nhằm so sánh, đánh giá và khẳng định tính ưu việt của phương pháp đã chọn
Trang 6This paper proposes a recurrent fuzzy neural network (RFNN) for identifying and controlling a two link manipulator nonlinear system The arm dynamics are given according to Lagrange’s equation Then they are transformed to state variable representations for evaluating the effectiveness of RFNN
The RFNN is inherently a recurrent multilayered connectionist network for realizing fuzzy inference using dynamic fuzzy rules Temporal relations are embedded in the network by adding feedback connections in the second layer of the fuzzy neural network (FNN) The RFNN expands the basic ability of the FNN to cope with temporal problems In addition, results for the FNN fuzzy inference engine, universal approximation, and convergence analysis are extended to the RFNN
Among many approaches for controlling two link manipulator nonlinear system, this research uses RFNN for model identifying and inverse model identifying The Lyapunov stability approach is also applied to guarantee the convergence of the RFNN by choosing appropriate learning rates All of that, the direct and indirect adaptive controllers based on RFNN are designed for this dynamic sytem Moreover, this thesis also compares several simulation results onother normal controllers such as PID controller, Fuzzy-based controller, and neural network controller to evaluate the effectiveness of the proposed RFNN approach
Trang 7MỤC LỤC
CHƯƠNG 1 1
GIỚI THIỆU TỔNG QUAN 1
1 Các vấn đề và công trình có liên quan 1
1.1 Tổng quan về điều khiển thích nghi dùng mạng nơ-ron mờ 1
1.2 Tình hình nghiên cứu điều khiển tay máy hai bậc tự do 3
2 Nhiệm vụ của luận văn 3
3 Nội dung của luận văn 4
3.1 Chương 1: Tổng quan 4
3.2 Chương 2: Cơ sở lý thuyết 4
3.3 Chương 3: Đối tượng tay máy hai bậc tự do 4
3.4 Chương 4: Điều khiển tay máy hai bậc tự do 4
3.5 Chương 5: Mô phỏng 5
3.6 Chương 6: Kết luận và hướng phát triển 5
CHƯƠNG 2 6
CƠ SỞ LÝ THUYẾT 6
1 Đặt vấn đề 6
2 Logic mờ 7
2.1 Khái niệm cơ bản 8
2.2 Luật hợp thành 11
2.3 Bộ điều khiển mờ 17
3 Mạng nơ-ron nhân tạo 20
3.1 Cấu trúc cơ bản của mạng nơ-ron sinh học 21
3.2 Mô hình toán của mạng nơ ron nhân tạo 22
3.3 Phân loại mạng nơ-ron nhân tạo 25
4 Điều khiển tích hợp 32
4.1 Khái niệm 32
4.2 Bài toán điều khiển thích nghi 33
4.3 Cơ sở lý thuyết mạng nơ-ron mờ 35
5 Tóm tắt chương 38
CHƯƠNG 3 39
ĐỐI TƯỢNG TAY MÁY HAI BẬC TỰ DO 39
1 Giới thiệu 39
2 Mô hình vật lý hệ tay máy hai bậc tự do 39
3 Đặc tính động học của đối tượng 41
4 Mô hình không gian trạng thái của mô hình tay máy 44
5 Quỹ đạo đầu mút của hệ tay máy hai bậc tự do 46
Trang 86 Ảnh hưởng của các thông số mô hình và phụ tải 47
6.1 Ảnh hưởng của thông số mô hình cánh tay 47
6.2 Ảnh hưởng của vật nặng đầu cánh tay m3 50
6.3 Ảnh hưởng của nhiễu ngoài 51
7 Tóm tắt chương 52
CHƯƠNG 4 53
ĐIỀU KHIỂN THÍCH NGHI 53
HỆ PHI TUYẾN DÙNG MẠNG RFNN 53
1 Giới thiệu 53
2 Mạng nơ-ron mờ hồi qui RFNN 53
2.1 Cấu trúc mạng RFNN 53
2.2 Sự phân lớp của mạng RFNN 55
2.3 Lập luận mờ 57
3 Sơ đồ nhận dạng hệ phi tuyến 59
3.1 Nhận dạng mô hình thuận: 60
3.2 Nhận dạng mô hình ngược 62
4 Sơ đồ điều khiển thích nghi hệ phi tuyến 64
5 Giải thuật học lan truyền ngược 66
6 Phân tích sự ổn định của mạng 69
6.1 Phân tích sự ổn định cho sự nhận dạng 69
6.2 Phân tích sự ổn định cho điều khiển gián tiếp 72
7 Thí dụ minh họa về nhận dạng và điều khiển 75
7.1 Nhận dạng online hệ phi tuyến với nhiều tape delay 75
7.2 Mô hình dự báo Mackey-Glass 78
7.3 Điều khiển thích nghi trực tiếp hệ phi tuyến SISO 79
8 Tóm tắt chương 81
CHƯƠNG 5 82
KẾT QUẢ MÔ PHỎNG 82
1 Đặt vấn đề 82
2 Điều khiển kinh điển hệ tay máy dùng PID 82
2.1 Giải thuật điều khiển 82
2.2 Các bước thực hiện bộ điều khiển PID 83
2.3 Kết quả mô phỏng: 83
2.4 Nhận xét 86
3 Điều khiển hệ tay máy dùng logic mờ 86
3.1 Thiết kế bộ điều khiển mờ trực tiếp 86
3.2 Thiết kế bộ điều khiển mờ cho hệ tay máy hai bậc tự do 87
3.3 Kết quả mô phỏng trên Matlab 89
3.4 Nhận xét 91
4 Nhận dạng hệ tay máy dùng mạng RFNN 92
4.1 Nhận dạng mô hình đối tượng tay máy(mô hình thuận) 92
Trang 94.2 Nhận dạng mô hình ngược đối tượng tay máy 97
5 Điều khiển thích nghi trực tiếp hệ tay máy dùng mạng RFNN 101
5.1 Sơ đồ điều khiển 101
5.2 Kết quả mô phỏng 103
5.3 Nhận xét 113
6 Điều khiển thích nghi gián tiếp hệ tay máy dùng mạng RFNN 114
6.1 Mô hình điều khiển gián tiếp hệ tay máy hai bậc tự do 114
6.2 Kết quả mô phỏng 116
6.3 Nhận xét 123
7 Điều khiển thích nghi trực tiếp con lắc ngược dùng RFNN 124
7.1 Đối tượng con lắc ngược trên xe 124
7.2 Mô hình điều khiển cân bằng con lắc ngược trên xe dùng RFNN 126
7.3 Kết quả mô phỏng 127
8 Tóm tắt chương 128
CHƯƠNG 6 129
KẾT LUẬN & HƯỚNG PHÁT TRIỂN 129
1 Nội dung đã thực hiện 129
2 Kết luận 131
3 Hướng phát triển 132
TÀI LIỆU THAM KHẢO VÀ TRÍCH DẪN 133
PHỤ LỤC 135
LÝ LỊCH TRÍCH NGANG 137
Trang 10DANH SÁCH CÁC HÌNH VẼ
Hình 2.1: Mô tả hàm liên thuộc 9
Hình 2.2: Các dạng hàm liên thuộc thường sử dụng 9
Hình 2.3: Minh họa các hàm liên thuộc của các biến ngôn ngữ 10
Hình 2.4: Mô tả nguyên tắc giải mờ 14
Hình 2.5: Mô tả giải mờ bằng phương pháp trọng tâm 15
Hình 2.6: Sơ đồ khối bộ điều khiển mờ 17
Hình 2.7: mô hình mờ với các hàm liên thuộc 17
Hình 2.8: Mô hình bộ điều khiển mờ 18
Hình 2.9: Cấu trúc của một nơ-ron sinh học 21
Hình 2.10: Cấu trúc của một nơ-ron nhân tạo 22
Hình 2.11 Mạng nơ-ron một lớp 25
Hình 2.12: Cấu trúc của mạng nơ-ron ba lớp 27
Hình 2.13: Cấu trúc của mạng hồi quy nơ-ron ba lớp 27
Hình 2.14 Biểu diễn hàm năng lượng sai số một chiều 29
Hình 2.15: Mạng hồi quy toàn phần 31
Hình 2.16: Mạng hồi quy bán phần Jordan 31
Hình 2.17: Mạng hồi quy bán phần Elman 32
Hình 2.18: Cấu trúc của mạng nơ-ron mờ dựa trên giải thuật FHEA 37
Hình 3.1: Hình vẽ mô tả cánh tay máy hai bậc tự do 39
Hình 3.2 Đầu mút của cánh tay trong hệ tọa độ Descartes 46
Hình 3.3 Đáp ứng của hệ tay máy với điều kiện góc ban đầu 1 2 0 0 47
Hình 3.4 Đáp ứng của hệ tay máy với khi giảm hệ số ma sát nhớt 48
Hình 3.5 Đáp ứng của hệ tay máy với khi tăng hệ số ma sát nhớt 48
Hình 3.6 Đáp ứng của hệ tay máy với khi giảm hệ số ma sát động k1, k2 49
Hình 3.7 Đáp ứng của hệ tay máy với khi tăng hệ số ma sát động k1,k2 49
Hình 3.8 Đáp ứng của hệ tay máy với khối lượng vật nặng m3 = 0.5kg 50
Hình 3.9 Đáp ứng của hệ tay máy với khối lượng vật nặng m3 = 10kg 50
Hình 3.10 Đáp ứng của hệ tay máy tại điểm cân bằng 1 2 pi/ 2 0, không nhiễu 51
Hình 3.11 Đáp ứng của hệ tay máy tại điểm cân bằng 1 2 pi/ 2 0, có nhiễu 51 Hình 4.1: Cấu trúc mạng nơron mờ hồi quy(RFNN) 54
Hình 4.2: Cấu trúc kết nối của một luật mờ thứ j 58
Hình 4.3: Cấu trúc nhận dạng mô hình động phi tuyến dùng mạng RFNN 60
Hình 4.4 : Phương pháp nhận dạng mô hình cấu trúc song song 61
Hình 4.5 : Phương pháp nhận dạng mô hình cấu trúc nối tiếp 62
Hình 4.6 : Phương pháp huấn luyện tổng quát nhận dạng mô hình ngược 63
Hình 4.7: Cấu trúc bộ điều khiển trực tiếp dùng mạng RFNN 65
Hình 4.8: Cấu trúc bộ điều khiển gián tiếp dùng mạng RFNN 65
Hình 4.9: Kết quả kiểm tra bằng tín hiệu ngẫu nhiên 76
Hình 4.10: Kết quả kiểm tra bằng tín hiệu sin 76
Hình 4.11: Kết quả kiểm tra bằng tín hiệu sin+vuông 77
Hình 4.12: Kết quả đánh giá dự báo mô hình Mackey-Glass 78
Trang 11Hình 4.14: Kết quả điều khiển với tín hiệu vào Sin 79
Hình 4.15: Kết quả điều khiển với tín hiệu vào ngẫu nhiên 80
Hình 4.16: Kết quả điều khiển với tín hiệu vào Sin+vuông 80
Hình 5.1: Cấu trúc bộ điều khiển PID 82
Hình 5.2: Mô hình mô phỏng dùng PID kinh điển 83
Hình 5.3: Đáp ứng không nhiễu, khối lượng vật nặng m 3 =1kg 84
Hình 5.4: Đáp ứng không nhiễu, khối lượng vật nặng m 3 =5kg 84
Hình 5.5: Đáp ứng có nhiễu xung , khối lượng vật nặng m 3 =1kg 85
Hình 5.6: Đáp ứng có nhiễu xung , khối lượng vật nặng m 3 =1kg 85
Hình 5.7: Các tập mờ chuẩn hóa của các biến vào/ra 88
Hình 5.8: Sơ đồ mô phỏng hệ tay máy dùng logic mờ trực tiếp 89
Hình 5.9: Kết quả mô phỏng với tín hiệu vào sin, không có nhiễu 89
Hình 5.10: Kết quả mô phỏng với tín hiệu vào vuông, không có nhiễu 90
Hình 5.11: Kết quả mô phỏng với tín hiệu vào vuông, nhiễu trắng(0.00001) 90
Hình 5.12: Kết quả mô phỏng với tín hiệu vào vuông, nhiễu xung(1) 91
Hình 5.13: Mô hình nhận dạng hệ tay máy hai bậc tự do 92
Hình 5.14: Lưu đồ chương trình nhận dạng hệ tay máy hai bậc tự do 94
Hình 5.15: Kết quả nhận dạng(link 1)- tín hiệu vào: sin 94
Hình 5.16: Kết quả nhận dạng(link 2)- tín hiệu vào: sin 95
Hình 5.17: Kết quả nhận dạng(link 1)- tín hiệu vào: random 95
Hình 5.18: Kết quả nhận dạng(link 2)- tín hiệu vào: random 96
Hình 5.19: Mô hình nhận dạng mô hình ngược của hệ tay máy 97
Hình 5.20: Lưu đồ nhận dạng mô hình ngược của hệ tay máy 98
Hình 5.21: Kết quả nhận dạng(link 1)- tín hiệu vào: sin 99
Hình 5.22: Kết quả nhận dạng(link 2)- tín hiệu vào: sin 99
Hình 5.23: Kết quả nhận dạng(link 1)- tín hiệu vào: random 100
Hình 5.24: Kết quả nhận dạng(link 2)- tín hiệu vào: random 100
Hình 5.25: Mô hình điều khiển trực tiếp hệ tay máy dùng mạng RFNN 101
Hình 5.26: Tín hiệu đặt hình hoa văn 1 103
Hình 5.27(a): Đáp ứng của hệ tay máy với tín hiệu đặt: hoa văn 1 103
Hình 5.27(b): Đáp ứng của link 1 với tín hiệu đặt: hoa văn 1 104
Hình 5.27(c): Đáp ứng của link 2 với tín hiệu đặt: hoa văn 1 104
Hình 5.28: Tín hiệu đặt hình hoa văn 2 105
Hình 5.29(a): Đáp ứng của hệ tay máy với tín hiệu đặt: hoa văn 2 105
Hình 5.29(b): Đáp ứng của link 1 với tín hiệu đặt: hoa văn 2 106
Hình 5.29(c): Đáp ứng của link 2 với tín hiệu đặt: hoa văn 2 106
Hình 5.30(a): Đáp ứng của hệ tay máy với tín hiệu đặt: xung vuông 107
Hình 5.30(b): Đáp ứng của link 1 với tín hiệu đặt: xung vuông 107
Hình 5.30(c): Đáp ứng của link 2 với tín hiệu đặt: xung vuông 108
Hình 5.31(a): Đáp ứng của hệ tay máy với tín hiệu đặt: xung vuông+nhiễu 108
Hình 5.31(b): Đáp ứng của link 1 với tín hiệu đặt: xung vuông+nhiễu 109
Hình 5.31(c): Đáp ứng của link 2 với tín hiệu đặt: xung vuông+nhiễu 109
Hình 5.32(a): Đáp ứng của hệ tay máy với tín hiệu đặt: sin+vuông 110
Hình 5.32(b): Đáp ứng của link 1 với tín hiệu đặt: sin+vuông 110
Hình 5.32(c): Đáp ứng của link 2 với tín hiệu đặt: sin+vuông 111
Hình 5.33(a): Đáp ứng của hệ tay máy với tín hiệu đặt: sin+vuông_nhiễu 111
Hình 5.33(b): Đáp ứng của link 1 với tín hiệu đặt: sin+vuông_nhiễu 112
Trang 12Hình 5.33(c): Đáp ứng của link 2 với tín hiệu đặt: sin+vuông_nhiễu 112
Hình 5.34: Mô hình điều khiển thích nghi gián tiếp hệ tay máy 114
Hình 5.35(a): Tín hiệu đặt hình hoa văn 3 116
Hình 5.35(b): Đáp ứng hệ tay máyvới tín hiệu đặt: hoa văn 3 117
Hình 5.35(c): Đáp ứng của link 1 với tín hiệu đặt: hoa văn 3 117
Hình 5.35(d): Đáp ứng của link 2 với tín hiệu đặt: hoa văn 3 118
Hình 5.36(a): Tín hiệu đặt hình hoa văn 4 118
Hình 5.36(b): Đáp ứng hệ tay máy với tín hiệu đặt: hoa văn 4 119
Hình 5.36(c): Đáp ứng của link 1 với tín hiệu đặt: hoa văn 4 119
Hình 5.36(d): Đáp ứng của link 2 với tín hiệu đặt: hoa văn 4 120
Hình 5.37(a): Đáp ứng hệ tay máy với tín hiệu đặt: xung hình vuông 120
Hình 5.37(b): Đáp ứng của link 1 với tín hiệu đặt: xung hình vuông 121
Hình 5.37(c): Đáp ứng của link 2 với tín hiệu đặt: xung hình vuông 121
Hình 5.38(a): Đáp ứng hệ tay máy với tín hiệu đặt: xung hình vuông_nhiễu 122
Hình 5.38(b): Đáp ứng của link 1 với tín hiệu đặt: xung hình vuông_nhiễu 122
Hình 5.38(c): Đáp ứng của link 2 với tín hiệu đặt: xung hình vuông_nhiễu 123
Hình 5.39: Mô hình vật lý con lắc ngược trên xe 124
Hình 5.40: Mô hình điều khiển cân bằng con lắc ngược 126
Hình 5.41(a): Kết quả đáp ứng vị trí xe và góc lệch (không nhiễu) 127
Hình 5.41(b): Kết quả đáp ứng vị trí xe và góc lệch (có nhiễu) 127
Trang 13CHƯƠNG 1 GIỚI THIỆU TỔNG QUAN
1 Các vấn đề và công trình có l ên quan
1.1 Tổng quan v điều khiển thích nghi dùng mạng nơ-ron mờ
Đầu thập niên 1950, từ nhu cầu thiết kế các hệ thống lái máy bay tự động, các nhà khoa học đã nghiên cứu và tạo dựng những cơ sở ban đầu cho lĩnh vực lý thuyết điều khiển thích nghi ra đời và phát triển Hệ thống cần điều khiển là máy bay, với các đặc tính động học có liên quan, chịu nhiều tác động bởi sự thay đổi lớn về độ cao và tốc độ đưa đến những khó khăn và vấn đề phức tạp buộc các nhà khoa học phải giải quyết triệt để Điều này đòi hỏi phải có bộ điều khiển sao cho có thể cập nhật liên tục và thay đổi đủ nhanh các thông số để kịp thời thích ứng với các đặc tính động học tức thời của hệ thống Do đó, mô hình chuẩn MRAC cho bộ điều khiển thích nghi đã được tạo ra nhằm giải quyết vấn đề kỹ thuật này
Nhiều sơ đồ điều khiển thích nghi cho các hệ thống đặc thù đã ra đời vào những năm 1970 tiếp theo Đó là kết quả của sự kết hợp linh hoạt của các sơ đồ ước lược thông số và các phương pháp thiết kế bộ điều khiển Nhiều nghiên cứu mang tính ứng dụng đã được triển khai và bổ khuyết cho lý thuyết điều khiển thích nghi Tuy nhiên hầu hết những nghiên cứu với các sơ đồ điều khiển này chỉ ổn định trong điều kiện nhiễu cụ thể và trong phạm vi hạn chế Tiếp đến các sai số mô hình và nhiễu bị chặn từ các ví dụ vào đầu thập niên 1980 tiếp tục chỉ ra sự thiếu ổn định, không mang tính bền vững của các điều khiển thích này Đến nửa cuối thập niên 1980, một
số ứng dụng điều khiển cho các hệ thống tuyến tính với thông số bất định và thay đổi theo thời gian dần được nghiên cứu theo hướng thích nghi bền vững
Từ thập niên 1990 đến nay, hệ thống điều khiển thích nghi được thực hiện theo hướng nghiên cứu chất lượng của hệ điều khiển và phát triển các kết quả đạt được trong thập niên 1980 đối với các hệ thống phi tuyến mang các thông số chưa
Trang 14biết Từ đó, lý thuyết điều khiển phi tuyến có được các lớp sơ đồ điều khiển thích nghi phù hợp Các nghiên cứu ban đầu điều khiển thích nghi cho hệ phi tuyến hầu hết có đối tượng là dạng hệ SISO (một ngõ vào – một ngõ ra) Tiếp theo những thành công đó cho đến nay, nhiều công trình nghiên cứu điều khiển thích nghi hệ phi tuyến MIMO (nhiều ngõ vào – nhiều ngõ ra) đã được triển khai mang lại nhiều lợi ích thiết thực.
Nhiều nghiên cứu đã áp dụng thành công mạng nơron truyền thẳng trong nhận dạng và điều khiển hệ thống động [1]-[3] Các kết quả này cũng được mở rộng ra đối với mạng nơron hồi quy [4]-[6]
Logic mờ và mạng nơron được sử dụng nhằm mục đích khai thác kiến thức của con nguời về khả năng xử lý Việc kết hợp giữa logic mờ và mạng nơron sẽ mở
ra nhiều ứng dụng rộng rãi trong nhận dạng và điều khiển đối tượng phi tuyến động [7]-[8] Hai công trình quan trọng có thể kể đến là:
Yang Gao và Meng Joo Er [7] đã đề nghị mô hình nơron mờ để nhận dạng và điều khiển thích nghi cho hệ phi tuyến MIMO
Lin và Lee [8] cũng đề nghị một mô hình nơron tổng quát cho bộ điều khiển và quyết định logic mờ cho mô hình xe không người lái
Mạng nơron mờ (FNN) có thể thực hiện một cấu trúc mô hình điều khiển tham chiếu, quá trình thiết kế mạng FNN được kết hợp giữa các khâu trễ và giải thuật học lan truyền ngược để giải quyết vấn đề cấu trúc mô hình động [9], [10]
Lee and Teng [11] đề xuất một mô hình mạng nơron mờ hồi quy (RFNN) dựa
trên giải thuật học giám sát, đây là một cấu trúc mạng động phù hợp cho việc diễn
tả một hệ thống động với ưu điểm nổi trội là khả năng giải quyết vấn đề biến thiên của ngõ vào hoặc ngõ ra bằng các mối quan hệ thời gian tại các nút mạng hồi quy;
do mạng RFNN có khả năng lưu trữ thông tin tạm thời nên cấu trúc mạng dùng nhận dạng và điều khiển hệ thống trở nên đơn giản vì cần rất ít nút mạng
Mạng RFNN là một phiên bản bổ sung của mạng FNN được dùng để nhận dạng và điều khiển hệ thống phi tuyến động [12]-[14] Mạng RFNN là một mạngnhiều lớp hồi quy, thực hiện suy diễn mờ và được tạo nên nhờ một bộ luật mờ Các
Trang 15mối quan hệ thời gian được nhúng trong mạng được thực hiện nhờ cộng thêm vòng hồi tiếp ở lớp thứ hai của mạng FNN Sự bổ sung này cung cấp các phần tử nhớ cho mạng RFNN và mở rộng những khả năng cơ bản của mạng FNN cho những vấn đề
về sự biến thiên của hệ thống Bởi vì mỗi nơron hồi quy có một vòng hồi tiếp nội,
có thể lưu những đáp ứng động của hệ thống nên mô hình mạng đơn giản Tất cả những đặc tính của mạng FNN – suy diễn mờ, xấp xỉ hàm và những đặc tính hội tụ -đều được mở rộng cho mạng RFNN
Với những ưu điểm nổi trội của mạng RFNN về cấu trúc mạng và giải thuật học thích nghi trực tuyến nên trong luận văn này, tác giả sử dụng cấu trúc mạng RFNN để nhận dạng và điều khiển thích nghi đối tượng phi tuyến động mà cụ thể là
hệ tay máy hai bậc tự do
1.2 Tình hình nghiên cứu điều khiển tay máy hai bậc tự do
Hệ tay máy hai bậc tự do là một hệ thống phi tuyến động phù hợp cho việc nghiên cứu các giải thuật, thuật toán điều khiển tự động [18], [19] sử dụng logic
mờ và mạng nơron để điều khiển, tuy nhiên khả năng điều khiển còn hạn chế và chỉ giới hạn ở mức cân bằng cánh tay máy Với sự phát triển của công nghệ tính toán mềm và tốc độ xử lý của PC, nhiều phương pháp điều khiển thông minh đối tượng phi tuyến động ra đời, đặc biệt là sự kết hợp giữa logic mờ và mạng nơron cùng với các giải thuật học trực tuyến và thích nghi [7], [9], [12], [15]
2 Nhiệm vụ của luận văn
Tìm hiểu cấu trúc và giải thuật học của mạng nơron mờ hồi quy (RFNN) [2],
[3], [4], [5]
Khảo sát đối tượng hệ tay máy hai bậc tự do
Nghiên cứu và thực hiện các bộ điều khiển thích nghi hệ tay máy hai bậc tự do với mô hình phi tuyến theo các mô hình điều khiển sau:[1], [12], [14]
Mô hình điều khiển dùng PID và logic mờ
Mô hình nhận dạng đối tượng phi tuyến dùng mạng RFNN với giải thuật học online
Trang 16 Mô hình điều khiển thích nghi trực tiếp, gián tiếp dùng mạng RFNN
Mô phỏng các mô hình điều khiển trên MATLAB( viết bằng M-file)
Phân tích, đánh giá so sánh kết quả mô phỏng của các mô hình điều khiển.Khảo sát tín ổn định và bền vững của bộ điều khiển thông qua việc thay đổi các kiểu tín hiệu tham khảo, thêm nhiễu và thay đổi tải của hệ tay máy 2 bậc tự do
3 Nội dung của luận văn
Với nhiệm vụ thực hiện luận văn ở trên, bố cục của luận văn gồm 6 chương:
3.1 Chương 1: Tổng quan
Giới thiệu khái quát lịch sử phát triển và các ưu điểm nổi bậc của mạng RFNN; giới thiệu một số công trình đã được công bố có liên quan đến điều khiển hệtay máy hai bậc tự do và ý nghĩa ứng dụng của mô hình này trong thực tế; mục đích nghiên cứu; nhiệm vụ thực hiện và nội dung sơ lược của luận văn
3.2 Chương 2: Cơ sở lý thuy t
Giới thiệu lý thuyết cơ bản về logic mờ, mạng nơron, mạng nơron mờ và điều khiển thích nghi Những vấn đề này làm cơ sở nền tảng để tiếp cận những vấn
đề được đề cập ở nhũng chương sau
3.3 Chương 3: Đối tượng tay máy hai bậc tự do
Đối tượng hệ tay máy hai bậc tự do là một hệ phi tuyến động rất phù hợp cho việc nghiên cứu khảo sát các bộ điều khiển hệ phi tuyến động nói chung
Trong phần này ta tìm hiểu mô hình toán phi tuyến hệ tay máy hai bậc tự do
mô hình không gian trạng thái, khảo sát đặc tính động học của hệ
3.4 Chương 4: Điều khiển tay máy hai bậc tự do
Tìm hiểu cấu trúc mạng nơ-ron mờ hồi quy, cấu trúc và giải thuật học lan truyền ngược online của mạng neuron mờ hồi quy Cấu trúc nhận dạng và điều khiển Đây là cơ sở cho việc xây dựng các mô hình nhận dạng và điều khiển các đối tượng phi tuyến động, cụ thể là hệ tay máy hai bậc tự do
Đây là phần nội dung chính của đề tài, trong phần này sẽ đề cập đến phương pháp xây dựng các bộ điều khiển thích nghi cho hệ phi tuyến động ,cụ thể:
Trang 17 Mô hình điều khiển dùng PID và Logic mờ.
Mô hình nhận dạng đối tượng phi tuyến dùng mạng RFNN với giải thuật học online
Mô hình điều khiển thích nghi trực tiếp, gián tiếp dùng mạng RFNN
3.5 Chương 5: Mô phỏng
Ứng dụng các thuật toán nhận dạng và điều khiển được đề cập ở chương 4 để
mô phỏng hệ tay máy hai bậc tự do Từ kết quả mô phỏng, đánh giá, so sánh với các phương pháp khác, giới hạn phạm vi ứng dụng của thuật toán
3.6 Chương 6: Kết luận và hướng phát triển
Phân tích, đánh giá các kết quả đã thực hiện, khẳng định tính ưu việt của phương pháp được lựa chọn cho mô hình này Rút ra những vấn đề chưa thực hiện được trong luận văn và đề xuất hướng phát triển của đề tài
Trang 18mờ và mạng nơ-ron cả hai đều là hệ thống động, các bộ xấp xỉ số không dựa trên
mô hình nên cho phép xử lý các thông tin không chắc chắn và có nhiễu Hai phương pháp này có điểm khác biệt đáng kể: ở cách xấp xỉ hàm mẫu, biểu diễn và mã hóacác tri thức cũng như cách suy dễn hay ánh xạ từ dữ liệu vào sang dữ liệu ra
Mạng nơ-ron dựa trên nhiều đơn vị xử lý cơ sở, được liên kết chặt chẽ với nhau tạo ra tính mềm dẻo và khả năng học tốt Các hệ mờ ra quyết định ngõ ra bằng cách xử lý thông tin đầu vào dưới dạng các biến ngôn ngữ, qua đó dùng các hàm liên thuộc tương ứng với các biến vào theo hệ qui tắc mờ dựa vào kinh nghiệm của các chuyên gia với phương pháp suy diễn mờ và giải mờ phù hợp Vì vậy, hệ mờ cho phép xấp xỉ hàm dựa trên các tập mờ, trong khí đó các mẫu học của mạng nơ-ron là các giá trị đơn lẻ
Do đó, hai cách tiếp cận này được sử dụng để bổ sung cho nhau Mạng ron nhân tạo cung cấp các thuật toán tính toán ở mức thấp, cho phép thực hiện truy xuất thông tin từ các hệ thống cần điều khiển Còn các hệ mờ cho phép tận dụng các tri thức và kinh nghiệm của các chuyên gia Từ đó, có thể sử dụng kết hợp hai phương pháp này hoặc để dịch chuyển khả năng tính toán và học ở mức thấp của các mạng nơ-ron sang các hệ mờ, hoặc có thể tích hợp khả năng suy diễn dựa trên
nơ-luật mờ “nếu … thì …” của các hệ mờ ở mức cao sang mạng nơ-ron Có 3 hướng
cơ bản để kết hợp mạng nơ-ron và hệ mờ:
Các hệ mờ nơ-ron (Neural Fuzzy Systems) sử dụng công cụ nơ-ron nhúng trong mô hình mờ
Trang 19 Các mạng nơ-ron mờ (Fuzzy Neural Networks) thực hiện mờ hóa mạng nơ-ron truyền thống.
Các hệ lai giữa mạng nơ-ron và hệ mờ (Fuzzy Neural Hybrid Systems).Nhờ sự tích hợp khả năng tổng quát hóa của hệ logic mờ và khả năng tự học, cập nhật thông số của mạng nơ-ron mà hệ thống sẽ linh hoạt hơn nhiều nhờ thừa kế những ưu điểm của từng phương pháp Như vậy, với cùng một thuật toán, hệ thống nơ-ro mờ có thể thích nghi và hoạt động hiệu quả với nhiều hệ thống khác nhau.Cho đến nay, đã có nhiều công trình nghiên cứu kết hợp mạng nơ-ron và hệ
mờ trong nhận dạng và điều khiển hệ thống phi tuyến, đồng thời đã chứng tỏ được những ưu điểm vượt trội như công bố trong [1], [3], [7], [11]
Năm 1970, tại Trường Mary Queen, London - Anh, Ebrahim Mamdani đã dùng logic mờ để điều khiển một máy hơi nước mà ông không thể điều khiển được bằng kỹ thuật cổ điển Đến năm 1975 Mamdani đã thành công trong việc ứng dụng logic mờ vào điều khiển Tại Đức Hann Zimmermann đã dùng logic mờ cho các hệ
ra quyết định Tại Nhật, logic mờ được ứng dụng vào nhà máy xử lý nước của Fuji Electronic vào 1983, hệ thống xe điện ngầm của Hitachi vào 1987
Lý thuyết mờ ra đời ở Mỹ, ứng dụng đầu tiên ở Anh nhưng phát triển mạnh
mẽ nhất là ở Nhật Trong lĩnh vực Tự động hóa logic mờ ngày càng được ứng dụng rộng rãi Nó thực sự hữu dụng với các đối tượng phức tạp mà ta chưa biết rõ hàm truyền, logic mờ có thể giải quyết các vấn đề mà điều khiển kinh điển không làm được
Trang 20Theo xu hướng đó, các hệ thống phức tạp (như hệ cánh tay máy nhiều bậc tự
do, con lắc ngược, thiết bị tự cân bằng, …) có đặc tính động có thể được mô tả bằng các phát biểu ngôn ngữ tương tự như các kinh nghiệm của các chuyên gia Và như thế, để tổng hợp các phát biểu ngôn ngữ này cần có phương pháp tích hợp thông tindưới dạng các phát biểu ngôn ngữ
2.1 Khái niệm cơ bản
Một cách tổng quát, một hệ thống mờ là một tập hợp các qui tắc dưới dạng
“Nếu … thì …” (If … Then …) để tái tạo hành vi ra quyết định của con người
được tích hợp vào cấu trúc điều khiển của hệ thống Trong đó, các tập mờ có biến không rõ ràng, chứa đựng các thông tin không rõ ràng Việc thiết kế một hệ thống
mờ mang rất nhiều tính chất chủ quan, nó tùy thuộc vào kinh nghiệm và kiến thức của người thiết kế Ngày nay, tuy kỹ thuật mờ đã phát triển vượt bậc nhưng vẫn chưa có một cách thức chính quy và hiệu quả để thiết kế một hệ thống mờ Việc thiết kế vẫn phải dựa trên một kỹ thuật cổ điển là thử − sai và đòi hỏi phải đầu tư nhiều thời gian để có thể đi tới một kết quả có thể chấp nhận được
Để hiểu rõ khái niệm “MỜ” là gì, ta hãy thực hiện phép so sánh sau:
Trong toán học phổ thông, ta đã học khá nhiều về tập hợp, ví dụ như tập các số thực
R, tập các số nguyên tố P = {2,3,5, }… Những tập hợp như vậy được gọi là tập hợp kinh
điển hay tập rõ, tính “RÕ” ở đây được hiểu là với một tập xác định S chứa n phần tử thì
ứng với phần tử x ta xác định được một giá trị y = S(x).
Giờ ta xét phát biểu thông thường về tốc độ một chiếc xe môtô: chậm, trung
bình, hơi nhanh, rất nhanh Phát biểu “CHẬM” ở đây không được chỉ rõ là bao nhiêu km/h, như vậy từ “CHẬM” có miền giá trị là một khoảng nào đó, ví dụ 5km/h
– 20km/h chẳng hạn Tập hợp L = {chậm, trung bình, hơi nhanh, rất nhanh} như
vậy được gọi là một tập các biến ngôn ngữ Với mỗi thành phần ngôn ngữ x k củaphát biểu trên nếu nó nhận được một khả năng (xk ) thì tập hợp F gồm các cặp (x,
(x k)) được gọi là tập mờ
Trang 212.1.1 Định nghĩa tập mờ
Tập mờ F xác định trên tập kinh điển B là một tập mà mỗi phần tử của nó là
một cặp giá trị (x,F (x)), với x X vàF (x) là một ánh xạ:
F (x): B [0 1]
trong đóF gọi là hàm liên thuộc, B gọi là tập nền, x là giá trị vật lý
2.1.2 Các thuật ngữ trong logic mờ
- Độ cao tập mờ F là giá trị h = SupF (x), trong đó supF (x) chỉ giá trị nhỏ
nhất trong tất cả các chặn trên của hàmF (x).
- Miền xác định của tập mờ F, ký hiệu là
S là tập con thỏa mãn:
S = F (x) = { x B | F (x) > 0 }
- Miền tin cậy của tập mờ F, ký hiệu là T
là tập con thỏa mãn:
T = { x B | F (x) = 1 } Hình 2.1: Mô tả hàm liên thuộc.
- Các dạng hàm liên thuộc (membership function) trong logic mờ: có rất nhiều dạng hàm liên thuộc như: Gaussian, PI-shape, S-shape, Sigmoidal, Z-shape…
Hình 2.2: Các dạng hàm liên thuộc thường sử dụng.
1
Trang 222.1.3 Biến ngôn ngữ
Biến ngôn ngữ là phần tử chủ đạo trong các hệ thống dùng logic mờ Ở đây các thành phần ngôn ngữ của cùng một ngữ cảnh được kết hợp lại với nhau
Để minh họa về hàm liên thuộc và biến ngôn ngữ, ta xét ví dụ sau:
Xét tốc độ của một chiếc xe môtô, ta có thể phát biểu xe đang chạy: rất chậm
(VS); chậm (S); trung bình (M); nhanh (F); rất nhanh (VF).
Những phát biểu như vậy gọi là biến ngôn ngữ của tập mờ Gọi x là giá trị của biến tốc độ, ví dụ x = 10km/h, x = 60km/h… Hàm liên thuộc tương ứng của các
biến ngôn ngữ trên được ký hiệu lần lượt là:
VS (x), S (x), M (x), F (x), VF (x)
Hình 2.3: Minh họa các hàm liên thuộc của các biến ngôn ngữ.
Như vậy biến tốc độ có hai miền giá trị:
- Miền các giá trị ngôn ngữ:
N = { rất chậm, chậm, trung bình, nhanh, rất nhanh }
Trang 232.1.4 Các phép toán trên tập mờ
Cho X,Y là hai tập mờ trên không gian nền B, có các hàm thuộc tương ứng là
X , Y, khi đó:
- Phép hợp hai tập mờ (or) XY
+ Theo luật Max: X Y (b) = Max{ X (b), Y (b) }
+ Theo luật Sum: X Y (b) = Min{ 1, X (b) + Y (b) }
+ Tổng trực tiếp: X Y (b) = X (b) + Y (b) -X (b).Y (b)
- Phép giao hai tập mờ (and) XY
+ Theo luật Min: XY (b) = Min{ X (b), Y (b) }
+ Theo luật Lukasiewicz: XY (b) = Max{0, X (b)+Y (b)-1}
+ Theo luật Prod: XY (b) = X (b).Y (b)
- Phép bù tập mờ (not): X c (b) = 1-X (b)
2.2 Luật hợp thành
2.2.1 Mệnh đề hợp thành
Ví dụ điều khiển mực nước trong bồn chứa, ta quan tâm đến hai yếu tố:
+ Mực nước trong bồn L = {rất thấp, thấp, vừa}
+ Góc mở van ống dẫn G = {đóng, nhỏ, lớn}
Ta có thể suy diễn cách thức điều khiển như thế này:
Nếu mực nước = rất thấp thì góc mở van = lớn
Nếu mực nước = thấp thì góc mở van = nhỏ
Nếu mực nước = vừa thì góc mở van = đóng
Trong ví dụ trên, ta thấy có cấu trúc chung là “Nếu A thì B” Cấu trúc này gọi
là mệnh đề hợp thành, A là mệnh đề điều kiện, C = AB là mệnh đề kết luận.
Trang 24Định lý Mamdani: “Độ phụ thuộc của kết luận không được lớn hơn độ phụ thuộc
+ Luật Max – Min;
+ Luật Max – Prod;
+ Luật Sum – Min;
+ Luật Sum – Prod
a) Thuật toán xây dựng mệnh đề hợp thành cho hệ SISO
Luật mờ cho hệ SISO có dạng “If A Then B”
Chia hàm thuộcA (x) thành n điểm x i , i = 1,2,…,n
Chia hàm thuộcB (y) thành m điểm y j , j = 1,2,…,m
) 1 , (
) 1 , 2 (
) , 1 (
) 1 , 1 (
ym xn y
xn
ym x y
x
ym x y
x
R R
R R
R R
m r r
m r r
21
1
Trang 25Trong trường hợp đầu vào là giá trị mờ A’ thìB’ (y) là:
B’ (y) = { l 1 ,l 2 ,l 3 ,…,l m } với l k = maxmin{a i ,r ik }
b) Thuật toán xây dựng mệnh đề hợp thành cho hệ MISO
Luật mờ cho hệ MISO có dạng:
“If cd 1 = A 1 and cd 2 = A 2 and … Then rs = B”
Các bước xây dựng luật hợp thành R:
- Rời rạc các hàm thuộcA1 (x 1 ), A2 (x 2 ), …,An (x n ),B (y)
- Xác định độ thỏa mãn H cho từng vector giá trị rõ đầu vào x ={c 1 ,c 2 ,…,c n }, trong
đó c i là một trong các điểm mẫu của Ai (x i ) Từ đó suy ra:
Giải mờ là quá trình xác định giá trị rõ ở đầu ra từ hàm thuộc B’ (y) của tập
mờ B’ Có hai phương pháp giải mờ:
Trang 26+ Nguyên lý cận phải.
Hình 2.4: Mô tả nguyên tắc giải mờ.
- Nguyên lý trung bình: y’ =
2
2
1 y
y
- Nguyên lý cận trái: chọn y’ = y1
- Nguyên lý cận phải: chọn y’ = y2
2.2.5 Phương pháp trọng tâm
Điểm y’ được xác định là hoành độ của điểm trọng tâm miền được bao bởi
trục hoành và đườngB’ (y).
y dy y
, trong đó S là miền xác định của tập mờ B’
Phương pháp trọng tâm cho luật Sum-Min
Giả sử có m luật suy diễn được triển khai, ký hiệu các giá trị mờ đầu ra của luật điều khiển thứ k là B’k (y) thì với quy tắc Sum-Min hàm thuộc sẽ là B’ (y) =
Trang 27m k k m
k S
y B
m k
k B
S
m k k B S
m k k B
A
M dy
y
dy y y dy
y
dy y y
1
1
1 '
1 '
1 '
1 '
) (
) (
) (
) (
(2.1)
trong đó: M i =
S k
B y dy
y ' ( ) và A i =
S k
B' (y) dy ; i = 1,2,…,m
Hình 2.5: Mô tả giải mờ bằng phương pháp trọng tâm.
Xét riêng cho trường hợp các hàm thuộc dạng hình thang như hình trên:
2 2 2 1
k k
H
H y
1
1 với H k =B’k (y k )
Đây là công thức giải mờ theo phương pháp độ cao
2.2.6 Mô hình mờ Tagaki-Sugeno
Trang 28Mô hình mờ mà ta nói đến trong các phần trước là mô hình Mamdani Ưu điểm của mô hình Mamdani là đơn giản, dễ thực hiện nhưng khả năng mô tả hệthống không tốt Trong kỹ thuật điều khiển, người ta thường sử dụng mô hình mờTagaki-Sugeno (TS).
Tagaki-Sugeno đưa ra mô hình mờ sử dụng cả không gian trạng thái mờ lẫn
mô tả linh hoạt hệ thống Theo Tagaki/Sugeno thì một vùng mờ LX kđược mô tả bởiluật:
R sk : If x = LX k Then x A(x k)xB(x k)u (2.2)
Luật này có nghĩa là: nếu vector trạng thái x nằm trong vùng LX k thì hệ thốngđược mô tả bởi phương trình vi phân cục bộ x A(x k)xB(x k)u Nếu toàn bộ cácluật của hệ thống được xây dựng thì có thể mô tả toàn bộ trạng thái của hệ trong
toàn cục Trong (2.2) ma trận A(x k ) và B(x k ) là những ma trận hằng của hệ thống ở
trọng tâm của miền LX kđược xác định từ các chương trình nhận dạng Từ đó rút ra được:
w (A(x )x B(x )u)
với w k (x) [0, 1] là độ thỏa mãn đã chuẩn hóa của x* đối với vùng mờ LX k
Luật điều khiển tương ứng với (2.2) sẽ là:
x k( ) l( )( ( k) ( k) ( l))
Trang 292.3 Bộ điều khiển mờ
2.3.1 Cấu trúc một bộ điều khiển mờ
Hình 2.6: Sơ đồ khối bộ điều khiển mờ
Một bộ điều khiển mờ gồm ba khâu cơ bản:
u1 2
Hình 2.7: mô hình mờ với các hàm liên thuộc
2.3.2 Nguyên lý điều khiển mờ
Trang 30Hình 2.8: Mô hình bộ điều khiển mờ
Các bước thiết kế hệ thống điều khiển mờ:
- Giao diện đầu vào gồm các khâu: mờ hóa và các khâu hiệu chỉnh như tỷ lệ, tích phân, vi phân …;
- Thiếp bị hợp thành: sự triển khai luật hợp thành R;
- Giao diện đầu ra gồm: khâu giải mờ và các khâu giao diện trực tiếp với đốitượng
2.3.3 Thiết kế bộ điều khiển mờ
Các bước thiết kế:
B1: Định nghĩa tất cả các biến ngôn ngữ vào/ra
B2: Xác định các tập mờ cho từng biến vào/ra (mờ hóa)
- Miền giá trị vật lý của các biến ngôn ngữ;
- Số lượng tập mờ;
- Xác định hàm thuộc;
- Rời rạc hóa tập mờ
Trang 31B3: Xây dựng luật hợp thành.
B4: Chọn thiết bị hợp thành
B5: Giải mờ và tối ưu hóa
Những lưu ý khi thiết kế bộ điều khiển mờ:
- Không bao giờ dùng điều khiển mờ để giải quyết bài toán mà có thể dễ dàngthực hiện bằng bộ điều khiển kinh điển;
- Không nên dùng bộ điều khiển mờ cho các hệ thống cần độ an toàn cao;
- Thiết kế bộ điều khiển mờ phải được thực hiện qua thực nghiệm
Phân loại các bộ điều khiển mờ:
i Điều khiển Mamdani (MCFC)
ii Điều khiển mờ trượt (SMFC)
iii Điều khiển tra bảng (CMFC)
iv Điều khiển Tagaki/Sugeno (TSFC)
Trang 323 Mạng nơ-ron nhân tạo
Từ những năm 40 của thế kỷ 20, các nhà nghiên cứu đã phát triển mô hình phần cứng và phần mềm đơn giản phỏng theo các nơ-ron sinh học (bao gồm các cơ chế tương tác của chúng) với mong muốn chế tạo ra những cỗ máy thông minh có khả năng ra quyết định như bộ não người Vào năm 1944, những người đặt nền móng đầu tiên trong lĩnh vực này là Mc Culloh và Pitts đã xuất bản công trình nghiên cứu có tính hệ thống về mạng nơ-ron nhân tạo
Đến những năm 50 và 60 của thế kỷ 20, một nhóm các nhà nghiên cứu đã kết hợp những kiến thức về sinh học và tâm thần học để tạo ra một mạng nơ-ron nhân tạo hoàn chỉnh đầu tiên dưới dạng một mạch điện tử Sau đó các mạng nơ-ron được chuyển thành các chương trình mô phỏng trên máy tính với mức độ linh hoạt cao hơn
Tuy nhiên việc nghiên cứu về mạng nơ-ron thực sự phát triển mạnh mẽ từnhững năm 1980, với sự đóng góp quan trọng bởi những nghiên cứu mở rộng của Rosenblatt, Widrow và Hoff về các mạng nơ-ron nhiều lớp phức tạp Hơn nữa, sựphát triển của lĩnh vực nghiên cứu về mạng nơ-ron nhân tạo còn được sự hỗ trợkhông nhỏ từ sự phát triển vượt bậc và liên tục của ngành khoa học máy tính (phần cứng và phần mềm) đã giúp cho các nhà nghiên cứu có thể tạo ra, kiểm chứng và ứng dụng vào thực tế các hệ thống dựa trên mạng nơ-ron nhân tạo phức tạp và linh hoạt Mạng nơ-ron nhân tạo được ứng dụng trong nhiều lĩnh vực như: nhận dạng, phân loại, xử lý ảnh, các hệ thống điều khiển, dự báo …
Cho đến nay, nhiều vấn đề điều khiển đã được các nhà nghiên cứu giải quyết
và công bố bằng nhiều dạng cấu hình mạng nơ-ron với các thuật toán huấn luyện phù hợp Phương mạng nơ-ron thích nghi dựa trên tiêu chuẩn ổn định Lyapunov giúp giải quyết vấn đề hội tụ và sự không ổn định của vòng kín thường xuất hiện trong điều khiển bám theo của các hệ thống động phi tuyến có sự tham gia của nhiễu
Trang 333.1 Cấu trúc cơ bản của mạng nơ-ron sinh học
Hệ thống thần kinh của con người là một mạng nơ-ron cực kỳ phức tạp,trong đó bộ não có khoảng 1011 1012 nơ-ron Mỗi nơ-ron có thể liên kết với 104
nơ-ron khác thông qua các khớp nối (dendrite) và các mạng lưới phụ Mỗi nơ-ron trong bộ não người gồm một thân nơ-ron, một trục nơ-ron (axon) và nhiều khớp nối
Các khớp nối nhận tín hiệu từ các nơ-ron khác, trục nơ-ron có thể xem như là một ống dài với các nhánh ở cuối ống Các nhánh này được nối với các nơ ron khácthông qua các mối nối Tùy thuộc vào vai trò cua nơ-ron mà số lượng mối nối có thểdao động từ vài trăm đến vài ngàn mối nối
Hình 2.9: Cấu trúc của một nơ-ron sinh học
Thân nơ-ron tổng hợp các tín hiệu thu thập được từ các khớp nối cũng như từcác mối nối trên bề mặt của nó Nếu các tín hiệu tổng hợp này vượt quá một mức ngưỡng cho phép thì nơ-ron sẽ truyền một xung điện tới các trục nơ-ron của nó.Trong trường hợp ngược lại, các tín hiệu vào sẽ bị bỏ qua và không có xung điện ởngõ ra nơ-ron Mô hình và cách thức hoạt động nơ-ron sinh học là nền tảng cho nguyên lý hoạt động của các nơ-ron nhân tạo
Hai đặc tính cơ bản của mạng nơ-ron là:
- Quá trình tính toán được tiến hành song song và phân tán trên nhiều nơ-ron gần như đồng thời.
Trang 34- Tính toán thực chất là quá trình học, chứ không phải theo sơ đồ định sẵn từ trước.
Luật học trong mạng nơ-ron nhân tạo có 2 loại chính: học thông số và học cấu trúc Học thông số có nghĩa là cập nhật các trọng số kết nối trong mạng nơ-ron Trong khi đó, học cấu trúc là tập trung vào việc thay đổi cấu trục của mạng (bao gồm số đơn vị xử lý và loại kết nối) Hai dạng học này có thể thực hiện đồng thời hoặc tách rời
3.2 Mô hình toán của mạng nơ ron nhân tạo.
Mạng nơ ron nhân tạo là mạng được thiết kế dựa trên việc mô phỏng cấu trúc
hệ thần kinh sinh học của con người Cấu trúc của mạng gồm nhiều lớp: lớp vào, nhiều lớp ẩn và lớp ra Các nơ-ron của lớp vào được kết nối với các phần tử cảm biến như tai, mắt Các nơ-ron lớp ẩn là các đơn vị xử lý Các nơ-ron của lớp ra được kết nối với các phần tử chấp hành như tay,chân Tín hiệu truyền từ nơ-ron này tới các nơ-ron khác dưới dạng tín hiệu điện Nếu tín hiệu truyền là tín hiệu dương thì tín hiệu đó được gọi là tín hiệu kích hoạt Nếu tín hiệu truyền là điện áp
âm thì tín hiệu đó là tín hiệu ức chế Nếu tín hiệu truyền là zero thì không có sự kết nối giữa các nơ-ron
Nơ-ron nhân tạo là một thành phần cơ bản của một mạng nơ-ron nhân tạo Một nơ-ron nhân tạo có 3 thuộc tính cơ bản: Trọng số kết nối, ngưỡng và hàm kích hoạt
Hình 2.10: Cấu trúc của một nơ-ron nhân tạo
Trang 35Các giá trị W w , w , w 1 2 nT là các trọng số kết nối của các nơ-ron với các
nơ-ron khác, nó được dùng để xác định cường độ của các vector ngõ vào
X = [x1,x2…xn] Do đó giá trị ngõ vào của hàm kích hoạt được xác định là XTW
Tùy thuộc vào dạng hàm kích hoạt, nếu trọng số kết nối là dương thì XTW sẽ kích
thích nơ-ron ở ngõ ra và ngược lại
Giá trị ngưỡng bên trong của nơ-ron (ký hiệu θ) là giá trị biên độ ảnh hưởng
đến sự kích hoạt ngõ ra theo công thức:
Trong đó u là hàm tổng, dùng để kết hợp và xử lý các thông tin ở đầu vào, y là
tín hiệu ngõ ra của nơ-ron có được từ hàm kích hoạt f(u).
j
j x w u
1 2
Hàm cầu (spherical function):
2 1
Thông thường, hàm tổng được sử dụng nhiều nhất là hàm tuyến tính
Hàm kích hoạt f thực thi một biểu thức toán học dựa trên tín hiệu ngõ vào để
tạo tín hiệu ngõ ra cho nơ-ron Có nhiều dạng hàm kích hoạt được sử dụng tùy
thuộc vào bài toán mà mạng nơ-ron được dùng để giải quyết
Hàm nấc:
Trang 36j 1
j j net net j
1
1 w
2 )
f
Hàm Ram:
j 1
j 1
n j j
n j j
Trang 373.3 Phân loại mạng nơ-ron nhân tạo
Các loại mạng nơ-ron nhân tạo có thể được phân loại dựa trên các tính chất của nó
Theo số lớp:
- Mạng nơ-ron một lớp: mạng chỉ gồm 1 lớp nơ-ron
- Mạng nơ-ron nhiều lớp: mạng gồm nhiều lớp nơ-ron
- Mạng nơ-ron truyền thẳng: các tín hiệu trong mạng chỉ truyền theo một chiều
Thuật toán huấn luyện cho mạng nơ-ron một lớp có đặc điểm
+ Giá trị ban đầu của trọng số và ngưỡng là những giá trị ngẫu nhiên
+ Tính toán theo từng mẫu ngõ vào và ngõ ra mong muốn
+ Ngõ ra của mạng được tính theo phương trình:
Y f X W
+ Luật cập nhật trọng số theo biểu thức:
Trang 38( 1) ( ) [ ( ) ( )] ( )
ij ij i i j
w t w t d t y t x t (2.5)Trong đó: -là tốc độ học
- d t i( ) là ngõ ra mong muốn thứ i
Có nhiều thuật toán huấn luyện cho mạng nơ-ron một lớp như thuật toán Perceptron, thuật toán Widrow-Hoff Nhưng thuật toán Widrow-Hoff hay được sửdụng hơn, thuật toán này tính toán sai lệch giữa ngõ ra mong muốn với ngõ ra thực
sự của mạng d t( ) y t( ) với d(t) là ngõ ra mong muốn của mạng và y(t) là ngõ ra của mạng Sau đó luật cập nhật trọng số của mạng được tính theo:
ij ij i i j
w t w t d t y t x t (2.6)Tuy vậy trong thực tế có nhiều bài toán mà mạng nơ-ron một lớp không thểgiải quyết được
3.3.2 Mạng nơ-ron nhiều lớp
Để khắc phục hạn chế của mạng nơ-ron một lớp người ta thường hay sửdụng mạng nơ-ron nhiều lớp (hay còn gọi là mạng truyền thẳng) kết hợp với các hàm kích hoạt phi tuyến
Một trong các cấu trúc cơ bản và phổ biến của mạng nơ-ron nhiều lớp là một mạng bao gồm một lớp vào, một lớp ẩn và một lớp ra được biểu diễn trong hình 2.12 Các nơ-ron của lớp vào làm nhiệm vụ chuyển tín hiệu từ ngõ vào đến lớp ẩn của mạng Lớp ẩn chứa các nơ-ron được xem như các đơn vị xử lý và lớp ra chứa các nơ-ron để ra quyết định Lớp ẩn và lớp ra có cấu trúc giống mạng nơ-ron một lớp
Trang 39Hình 2.12: Cấu trúc của mạng nơ-ron ba lớp
Hình 2.13: Cấu trúc của mạng hồi quy nơ-ron ba lớp
Giải thuật lan truyền ngược được phát minh bởi Rumelhart, McClelland và Williams vào những năm 80 của thế kỷ 20, là giải thuật phổ biến được áp dụng đểhuấn luyện mạng nơ-ron nhiều lớp Với giải thuật này ngõ vào được cung cấp cho mạng sau đó ngõ ra được tính toán và so sánh với ngõ ra mong muốn Trọng số kết nối của mạng được cập nhật sao cho sai số ngõ ra sẽ được giảm trong lần tính toán tiếp theo Kiểu học này còn được gọi là kiểu học có giám sát, vì giải thuật học đòi hỏi phải cung cấp một tập mẫu huấn luyện đầy đủ (gồm các ngõ vào và ngõ ramong muốn) Trọng số kết nối của mạng được chỉnh định theo hướng tỉ lệ với sai
số, việc lan truyền ngược những sai số này từ ngõ ra đến ngõ vào của mạng có thểchỉnh định tất cả các trọng số kết nối của mạng
Trang 40Giải thuật lan truyền ngược huấn luyện mạng nơ-ron nhiều lớp có thể tóm tắt như sau:
+ Các trọng số kết nối và ngưỡng ban đầu được khởi tạo bởi các giá trị ngẫu nhiên nhỏ
+ Tập mẫu huấn luyện được đưa vào mạng bao gồm các ngõ vào x t( ) và ngõ
ra mong muốn d t( )
+ Tín hiệu lan truyền thuận trong mạng theo các công thức sau:
Tín hiệu vào đơn vị thứ q của lớp ẩn:
1
( 1, )
m
q qj j j
Tín hiệu ra đơn vị thứ q của lớp ẩn: