Điều khiển thích nghi hệ tay máy hai bậc tự do dùng mạng nơron mờ hồi quy

NHIỆM VỤ VÀ NỘI DUNG - Tìm hiểu cấu trúc và giải thuật học của mạng nơron mờ hồi quy RFNN - Nghiên cứu và thực hiện các bộ điều khiển thích nghi hệ tay máy hai bậc tự do với mô hình phi

Trang 1

NGUYỄN KHẮC NGUYÊN

CHUYÊN NGÀNH: TỰ ĐỘNG HÓA

MÃ SỐ: 60.52.60

TP HỒ CHÍ MINH , 07-2010

Trang 2

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH

Cán bộ hướng dẫn khoa học: PGS.TS NGUYỄN THỊ PHƯƠNG HÀ

Cán bộ chấm nhận xét 1: TS NGUYỄN VĨNH HẢO

Cán bộ chấm nhận xét 2: TS TRƯƠNG ĐÌNH CHÂU

Luận văn thạc sĩ được bảo vệ tại

HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC SĨ TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày 23 tháng 07 năm 2010

Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:

Xác nhận của Chủ tịch Hội đồng đánh giá luận văn và Bộ môn quản lý chuyên ngành sau khi luận văn đã được sửa chữa ( nếu có).

Trang 3

Họ và tên học viên: NGUYỄN KHẮC NGUYÊN Phái: Nam

I TÊN ĐỀ TÀI:

ĐIỀU KHIỂN THÍCH NGHI HỆ TAY MÁY HAI BẬC TỰ DO

DÙNG MẠNG NƠRON MỜ HỒI QUY

II NHIỆM VỤ VÀ NỘI DUNG

- Tìm hiểu cấu trúc và giải thuật học của mạng nơron mờ hồi quy (RFNN)

- Nghiên cứu và thực hiện các bộ điều khiển thích nghi hệ tay máy hai bậc tự do với mô hình phi tuyến theo các mô hình điều khiển sau:

online

 Mô hình điều khiển thích nghi trực tiếp, gián tiếp dùng mạng RFNN

- Mô phỏng các mô hình điều khiển trên MATLAB( viết bằng M-file)

- Phân tích, đánh giá so sánh kết quả mô phỏng của các mô hình điều khiển.

- Khảo sát tín ổn định và bền vững của bộ điều khiển thông qua việc thay đổi các kiểu tín hiệu tham khảo, thêm nhiễu và thay đổi tải của hệ tay máy 2 bậc tự do

III NGÀY GIAO NHIỆM VỤ:

.IV NGÀY HOÀN THÀNH NHIỆM VỤ:

V CÁN BỘ HƯỚNG DẪN: PGS.TS NGUYỄN THỊ PHƯƠNG HÀ

QL CHUYÊN NGÀNH

Đề cương và nội dung luận án thạc sĩ đã được hội đồng chuyên ngành thông qua.

Ngày…tháng…năm 2010

Trang 4

LỜI CẢM ƠN

Trước hết tôi xin chân thành cảm ơn đến tất cả Quý Thầy Cô thuộc Bộ Môn

Điều Khiển Tự Động, Khoa Điện-Điện Tử, Trường Đại Học Bách Khoa TPHCM

đã trang bị những kiến thức nền tảng, các phương pháp nghiên cứu và đã giúp đỡ tôi trong suốt quá trình học tập cũng như nghiên cứu đề tài.

Tôi xin cảm ơn các bạn lớp cao học Tự Động Hóa K17 đã động viên và nhiệt

tình giúp đỡ khi gặp khó khăn.

Tôi xin cảm ơn Quý Thầy Cô thuộc Bộ Môn Viễn Thông và Kỹ Thuật Điều

Khiển, Khoa Công Nghệ Thông Tin và Truyền Thông, Đại Học Cần Thơ (nay là

Bộ Môn Tự Động Hóa, Khoa Công Nghệ, Đại Học Cần Thơ) đã tạo mọi điều kiện

thuận lợi để tôi có thể yên tâm học tập.

Tôi xin cảm ơn thầy Nguyễn Chí Ngôn (Phó Trưởng Khoa Công Nghệ ĐHCT), thầy Lương Vinh Quốc Danh (Bộ Môn Điện Tử Viễn Thông, Khoa Công

-Nghệ, Đại Học Cần Thơ) đã giúp đỡ tôi trong suốt quá trình thực hiện đề tài.

Đặc biệt tôi xin chân thành cảm ơn Cô PGS.TS Nguyễn Thị Phương Hà đã

tận tình hướng dẫn để tôi hoàn thành đề tài.

Tôi cũng xin gửi lời cảm ơn đến các tác giả của các bài báo mà tôi đã sử dụng làm tài liệu tham khảo trong luận văn này.

Và cuối cùng tôi muốn gửi lời biết ơn sâu sắc nhất đến những người thân trong gia đình tôi; đã không ngừng động viên, thông cảm và giúp đỡ tôi rất nhiều trong cuộc sống hàng ngày để tôi có thể an tâm học tập và hoàn thành được luận văn thạc sĩ của mình.

Học viên Cao Học Lớp TĐH K17

Nguyễn Khắc Nguyên

Trang 5

TÓM TẮT

Nghiên cứu này đề cập đến việc sử dụng mạng nơ-ron mờ hồi quy (Recurrent Fuzzy Neural Network - RFNN) để nhận dạng và điều khiển hệ phi tuyến tay máy hai bậc tự do Mô hình toán học của hệ tay máy được xây dựng dựa vào phương trình Euler-Lagrange và biến đổi đưa về hệ phương trình trạng thái cho mục đích khảo sát tính hiệu quả của mạng RFNN

Mạng RFNN bản thân đã là mạng liên kết nhiều lớp có hồi qui dùng để thực hiện suy diễn mờ sử dụng các luật mờ động Các liên kết tạm được nhúng vào bên trong mạng bằng cách thêm các kết nối hồi tiếp tại lớp thứ hai của mạng nơ-ron mờ(Fuzzy Neural Network - FNN) Mạng RFNN mở rộng khả năng cơ bản của mạng FNN nhằm giải quyết các vấn đề về thời gian Hơn nữa, các kết quả đối với suydiễn mờ mạng FNN, phương pháp xấp xỉ tổng quát, và phân tích hội tụ còn được

mở rộng cho mạng RFNN

Bên cạnh nhiều phương pháp điều khiển hệ tay máy như điều khiển PID kinh điển, điều khiển trực tiếp dùng logic mờ, mạng nơ-ron … nghiên cứu này, sử dụng mạng nơ-ron mờ hồi quy để nhận dạng mô hình thuận và nhận dạng mô hình ngược của đối tượng Phương pháp ổn định Lyapunov cũng được áp dụng để đảm bảo sựhội tụ của mạng RFNN qua việc lựa chọn tốc độ học thích hợp Trên cơ sở đó, đềtài đã xây dựng bộ điều khiển thích nghi trực tiếp và gián tiếp sử dụng mạng RFNN cho đối tượng tay máy hai bậc tự do Bên cạnh đó, luận văn còn thực hiện mô phỏng các phương pháp điều khiển thông thường khác như: điều khiển PID, điều khiển mờ, nơ-ron nhằm so sánh, đánh giá và khẳng định tính ưu việt của phương pháp đã chọn

Trang 6

This paper proposes a recurrent fuzzy neural network (RFNN) for identifying and controlling a two link manipulator nonlinear system The arm dynamics are given according to Lagrange’s equation Then they are transformed to state variable representations for evaluating the effectiveness of RFNN

The RFNN is inherently a recurrent multilayered connectionist network for realizing fuzzy inference using dynamic fuzzy rules Temporal relations are embedded in the network by adding feedback connections in the second layer of the fuzzy neural network (FNN) The RFNN expands the basic ability of the FNN to cope with temporal problems In addition, results for the FNN fuzzy inference engine, universal approximation, and convergence analysis are extended to the RFNN

Among many approaches for controlling two link manipulator nonlinear system, this research uses RFNN for model identifying and inverse model identifying The Lyapunov stability approach is also applied to guarantee the convergence of the RFNN by choosing appropriate learning rates All of that, the direct and indirect adaptive controllers based on RFNN are designed for this dynamic sytem Moreover, this thesis also compares several simulation results onother normal controllers such as PID controller, Fuzzy-based controller, and neural network controller to evaluate the effectiveness of the proposed RFNN approach

Trang 7

MỤC LỤC

CHƯƠNG 1 1

GIỚI THIỆU TỔNG QUAN 1

1 Các vấn đề và công trình có liên quan 1

1.1 Tổng quan về điều khiển thích nghi dùng mạng nơ-ron mờ 1

1.2 Tình hình nghiên cứu điều khiển tay máy hai bậc tự do 3

2 Nhiệm vụ của luận văn 3

3 Nội dung của luận văn 4

3.1 Chương 1: Tổng quan 4

3.2 Chương 2: Cơ sở lý thuyết 4

3.3 Chương 3: Đối tượng tay máy hai bậc tự do 4

3.4 Chương 4: Điều khiển tay máy hai bậc tự do 4

3.5 Chương 5: Mô phỏng 5

3.6 Chương 6: Kết luận và hướng phát triển 5

CHƯƠNG 2 6

CƠ SỞ LÝ THUYẾT 6

1 Đặt vấn đề 6

2 Logic mờ 7

2.1 Khái niệm cơ bản 8

2.2 Luật hợp thành 11

2.3 Bộ điều khiển mờ 17

3 Mạng nơ-ron nhân tạo 20

3.1 Cấu trúc cơ bản của mạng nơ-ron sinh học 21

3.2 Mô hình toán của mạng nơ ron nhân tạo 22

3.3 Phân loại mạng nơ-ron nhân tạo 25

4 Điều khiển tích hợp 32

4.1 Khái niệm 32

4.2 Bài toán điều khiển thích nghi 33

4.3 Cơ sở lý thuyết mạng nơ-ron mờ 35

5 Tóm tắt chương 38

CHƯƠNG 3 39

ĐỐI TƯỢNG TAY MÁY HAI BẬC TỰ DO 39

1 Giới thiệu 39

2 Mô hình vật lý hệ tay máy hai bậc tự do 39

3 Đặc tính động học của đối tượng 41

4 Mô hình không gian trạng thái của mô hình tay máy 44

5 Quỹ đạo đầu mút của hệ tay máy hai bậc tự do 46

Trang 8

6 Ảnh hưởng của các thông số mô hình và phụ tải 47

6.1 Ảnh hưởng của thông số mô hình cánh tay 47

6.2 Ảnh hưởng của vật nặng đầu cánh tay m3 50

6.3 Ảnh hưởng của nhiễu ngoài 51

CHƯƠNG 4 53

ĐIỀU KHIỂN THÍCH NGHI 53

HỆ PHI TUYẾN DÙNG MẠNG RFNN 53

1 Giới thiệu 53

2 Mạng nơ-ron mờ hồi qui RFNN 53

2.1 Cấu trúc mạng RFNN 53

2.2 Sự phân lớp của mạng RFNN 55

2.3 Lập luận mờ 57

3 Sơ đồ nhận dạng hệ phi tuyến 59

3.1 Nhận dạng mô hình thuận: 60

3.2 Nhận dạng mô hình ngược 62

4 Sơ đồ điều khiển thích nghi hệ phi tuyến 64

5 Giải thuật học lan truyền ngược 66

6 Phân tích sự ổn định của mạng 69

6.1 Phân tích sự ổn định cho sự nhận dạng 69

6.2 Phân tích sự ổn định cho điều khiển gián tiếp 72

7 Thí dụ minh họa về nhận dạng và điều khiển 75

7.1 Nhận dạng online hệ phi tuyến với nhiều tape delay 75

7.2 Mô hình dự báo Mackey-Glass 78

7.3 Điều khiển thích nghi trực tiếp hệ phi tuyến SISO 79

CHƯƠNG 5 82

KẾT QUẢ MÔ PHỎNG 82

1 Đặt vấn đề 82

2 Điều khiển kinh điển hệ tay máy dùng PID 82

2.1 Giải thuật điều khiển 82

2.2 Các bước thực hiện bộ điều khiển PID 83

2.3 Kết quả mô phỏng: 83

2.4 Nhận xét 86

3 Điều khiển hệ tay máy dùng logic mờ 86

3.1 Thiết kế bộ điều khiển mờ trực tiếp 86

3.2 Thiết kế bộ điều khiển mờ cho hệ tay máy hai bậc tự do 87

3.3 Kết quả mô phỏng trên Matlab 89

3.4 Nhận xét 91

4 Nhận dạng hệ tay máy dùng mạng RFNN 92

4.1 Nhận dạng mô hình đối tượng tay máy(mô hình thuận) 92

Trang 9

4.2 Nhận dạng mô hình ngược đối tượng tay máy 97

5 Điều khiển thích nghi trực tiếp hệ tay máy dùng mạng RFNN 101

5.1 Sơ đồ điều khiển 101

5.2 Kết quả mô phỏng 103

5.3 Nhận xét 113

6 Điều khiển thích nghi gián tiếp hệ tay máy dùng mạng RFNN 114

6.1 Mô hình điều khiển gián tiếp hệ tay máy hai bậc tự do 114

6.3 Nhận xét 123

7 Điều khiển thích nghi trực tiếp con lắc ngược dùng RFNN 124

7.1 Đối tượng con lắc ngược trên xe 124

7.2 Mô hình điều khiển cân bằng con lắc ngược trên xe dùng RFNN 126

CHƯƠNG 6 129

KẾT LUẬN & HƯỚNG PHÁT TRIỂN 129

1 Nội dung đã thực hiện 129

2 Kết luận 131

3 Hướng phát triển 132

TÀI LIỆU THAM KHẢO VÀ TRÍCH DẪN 133

PHỤ LỤC 135

LÝ LỊCH TRÍCH NGANG 137

Trang 10

DANH SÁCH CÁC HÌNH VẼ

Hình 2.1: Mô tả hàm liên thuộc 9

Hình 2.2: Các dạng hàm liên thuộc thường sử dụng 9

Hình 2.3: Minh họa các hàm liên thuộc của các biến ngôn ngữ 10

Hình 2.4: Mô tả nguyên tắc giải mờ 14

Hình 2.5: Mô tả giải mờ bằng phương pháp trọng tâm 15

Hình 2.6: Sơ đồ khối bộ điều khiển mờ 17

Hình 2.7: mô hình mờ với các hàm liên thuộc 17

Hình 2.8: Mô hình bộ điều khiển mờ 18

Hình 2.9: Cấu trúc của một nơ-ron sinh học 21

Hình 2.10: Cấu trúc của một nơ-ron nhân tạo 22

Hình 2.11 Mạng nơ-ron một lớp 25

Hình 2.12: Cấu trúc của mạng nơ-ron ba lớp 27

Hình 2.13: Cấu trúc của mạng hồi quy nơ-ron ba lớp 27

Hình 2.14 Biểu diễn hàm năng lượng sai số một chiều 29

Hình 2.15: Mạng hồi quy toàn phần 31

Hình 2.16: Mạng hồi quy bán phần Jordan 31

Hình 2.17: Mạng hồi quy bán phần Elman 32

Hình 2.18: Cấu trúc của mạng nơ-ron mờ dựa trên giải thuật FHEA 37

Hình 3.1: Hình vẽ mô tả cánh tay máy hai bậc tự do 39

Hình 3.2 Đầu mút của cánh tay trong hệ tọa độ Descartes 46

Hình 3.3 Đáp ứng của hệ tay máy với điều kiện góc ban đầu  1 2  0 0 47

Hình 3.4 Đáp ứng của hệ tay máy với khi giảm hệ số ma sát nhớt 48

Hình 3.5 Đáp ứng của hệ tay máy với khi tăng hệ số ma sát nhớt 48

Hình 3.6 Đáp ứng của hệ tay máy với khi giảm hệ số ma sát động k1, k2 49

Hình 3.7 Đáp ứng của hệ tay máy với khi tăng hệ số ma sát động k1,k2 49

Hình 3.8 Đáp ứng của hệ tay máy với khối lượng vật nặng m3 = 0.5kg 50

Hình 3.9 Đáp ứng của hệ tay máy với khối lượng vật nặng m3 = 10kg 50

Hình 3.10 Đáp ứng của hệ tay máy tại điểm cân bằng  1 2  pi/ 2 0, không nhiễu 51

Hình 3.11 Đáp ứng của hệ tay máy tại điểm cân bằng  1 2  pi/ 2 0, có nhiễu 51 Hình 4.1: Cấu trúc mạng nơron mờ hồi quy(RFNN) 54

Hình 4.2: Cấu trúc kết nối của một luật mờ thứ j 58

Hình 4.3: Cấu trúc nhận dạng mô hình động phi tuyến dùng mạng RFNN 60

Hình 4.4 : Phương pháp nhận dạng mô hình cấu trúc song song 61

Hình 4.5 : Phương pháp nhận dạng mô hình cấu trúc nối tiếp 62

Hình 4.6 : Phương pháp huấn luyện tổng quát nhận dạng mô hình ngược 63

Hình 4.7: Cấu trúc bộ điều khiển trực tiếp dùng mạng RFNN 65

Hình 4.8: Cấu trúc bộ điều khiển gián tiếp dùng mạng RFNN 65

Hình 4.9: Kết quả kiểm tra bằng tín hiệu ngẫu nhiên 76

Hình 4.10: Kết quả kiểm tra bằng tín hiệu sin 76

Hình 4.11: Kết quả kiểm tra bằng tín hiệu sin+vuông 77

Hình 4.12: Kết quả đánh giá dự báo mô hình Mackey-Glass 78

Trang 11

Hình 4.14: Kết quả điều khiển với tín hiệu vào Sin 79

Hình 4.15: Kết quả điều khiển với tín hiệu vào ngẫu nhiên 80

Hình 4.16: Kết quả điều khiển với tín hiệu vào Sin+vuông 80

Hình 5.1: Cấu trúc bộ điều khiển PID 82

Hình 5.2: Mô hình mô phỏng dùng PID kinh điển 83

Hình 5.3: Đáp ứng không nhiễu, khối lượng vật nặng m 3 =1kg 84

Hình 5.4: Đáp ứng không nhiễu, khối lượng vật nặng m 3 =5kg 84

Hình 5.5: Đáp ứng có nhiễu xung , khối lượng vật nặng m 3 =1kg 85

Hình 5.6: Đáp ứng có nhiễu xung , khối lượng vật nặng m 3 =1kg 85

Hình 5.7: Các tập mờ chuẩn hóa của các biến vào/ra 88

Hình 5.8: Sơ đồ mô phỏng hệ tay máy dùng logic mờ trực tiếp 89

Hình 5.9: Kết quả mô phỏng với tín hiệu vào sin, không có nhiễu 89

Hình 5.10: Kết quả mô phỏng với tín hiệu vào vuông, không có nhiễu 90

Hình 5.11: Kết quả mô phỏng với tín hiệu vào vuông, nhiễu trắng(0.00001) 90

Hình 5.12: Kết quả mô phỏng với tín hiệu vào vuông, nhiễu xung(1) 91

Hình 5.13: Mô hình nhận dạng hệ tay máy hai bậc tự do 92

Hình 5.14: Lưu đồ chương trình nhận dạng hệ tay máy hai bậc tự do 94

Hình 5.15: Kết quả nhận dạng(link 1)- tín hiệu vào: sin 94

Hình 5.17: Kết quả nhận dạng(link 1)- tín hiệu vào: random 95

Hình 5.19: Mô hình nhận dạng mô hình ngược của hệ tay máy 97

Hình 5.20: Lưu đồ nhận dạng mô hình ngược của hệ tay máy 98

Hình 5.25: Mô hình điều khiển trực tiếp hệ tay máy dùng mạng RFNN 101

Hình 5.26: Tín hiệu đặt hình hoa văn 1 103

Hình 5.27(a): Đáp ứng của hệ tay máy với tín hiệu đặt: hoa văn 1 103

Hình 5.27(b): Đáp ứng của link 1 với tín hiệu đặt: hoa văn 1 104

Hình 5.27(c): Đáp ứng của link 2 với tín hiệu đặt: hoa văn 1 104

Hình 5.28: Tín hiệu đặt hình hoa văn 2 105

Hình 5.29(a): Đáp ứng của hệ tay máy với tín hiệu đặt: hoa văn 2 105

Hình 5.29(b): Đáp ứng của link 1 với tín hiệu đặt: hoa văn 2 106

Hình 5.30(a): Đáp ứng của hệ tay máy với tín hiệu đặt: xung vuông 107

Hình 5.30(b): Đáp ứng của link 1 với tín hiệu đặt: xung vuông 107

Hình 5.30(c): Đáp ứng của link 2 với tín hiệu đặt: xung vuông 108

Hình 5.31(a): Đáp ứng của hệ tay máy với tín hiệu đặt: xung vuông+nhiễu 108

Hình 5.31(b): Đáp ứng của link 1 với tín hiệu đặt: xung vuông+nhiễu 109

Hình 5.31(c): Đáp ứng của link 2 với tín hiệu đặt: xung vuông+nhiễu 109

Hình 5.32(a): Đáp ứng của hệ tay máy với tín hiệu đặt: sin+vuông 110

Hình 5.32(b): Đáp ứng của link 1 với tín hiệu đặt: sin+vuông 110

Hình 5.32(c): Đáp ứng của link 2 với tín hiệu đặt: sin+vuông 111

Hình 5.33(a): Đáp ứng của hệ tay máy với tín hiệu đặt: sin+vuông_nhiễu 111

Hình 5.33(b): Đáp ứng của link 1 với tín hiệu đặt: sin+vuông_nhiễu 112

Trang 12

Hình 5.33(c): Đáp ứng của link 2 với tín hiệu đặt: sin+vuông_nhiễu 112

Hình 5.34: Mô hình điều khiển thích nghi gián tiếp hệ tay máy 114

Hình 5.35(a): Tín hiệu đặt hình hoa văn 3 116

Hình 5.35(b): Đáp ứng hệ tay máyvới tín hiệu đặt: hoa văn 3 117

Hình 5.35(d): Đáp ứng của link 2 với tín hiệu đặt: hoa văn 3 118

Hình 5.36(a): Tín hiệu đặt hình hoa văn 4 118

Hình 5.36(b): Đáp ứng hệ tay máy với tín hiệu đặt: hoa văn 4 119

Hình 5.36(d): Đáp ứng của link 2 với tín hiệu đặt: hoa văn 4 120

Hình 5.37(a): Đáp ứng hệ tay máy với tín hiệu đặt: xung hình vuông 120

Hình 5.37(b): Đáp ứng của link 1 với tín hiệu đặt: xung hình vuông 121

Hình 5.37(c): Đáp ứng của link 2 với tín hiệu đặt: xung hình vuông 121

Hình 5.38(a): Đáp ứng hệ tay máy với tín hiệu đặt: xung hình vuông_nhiễu 122

Hình 5.38(b): Đáp ứng của link 1 với tín hiệu đặt: xung hình vuông_nhiễu 122

Hình 5.38(c): Đáp ứng của link 2 với tín hiệu đặt: xung hình vuông_nhiễu 123

Hình 5.39: Mô hình vật lý con lắc ngược trên xe 124

Hình 5.40: Mô hình điều khiển cân bằng con lắc ngược 126

Hình 5.41(a): Kết quả đáp ứng vị trí xe và góc lệch (không nhiễu) 127

Hình 5.41(b): Kết quả đáp ứng vị trí xe và góc lệch (có nhiễu) 127

Trang 13

CHƯƠNG 1 GIỚI THIỆU TỔNG QUAN

1 Các vấn đề và công trình có l ên quan

1.1 Tổng quan v điều khiển thích nghi dùng mạng nơ-ron mờ

Đầu thập niên 1950, từ nhu cầu thiết kế các hệ thống lái máy bay tự động, các nhà khoa học đã nghiên cứu và tạo dựng những cơ sở ban đầu cho lĩnh vực lý thuyết điều khiển thích nghi ra đời và phát triển Hệ thống cần điều khiển là máy bay, với các đặc tính động học có liên quan, chịu nhiều tác động bởi sự thay đổi lớn về độ cao và tốc độ đưa đến những khó khăn và vấn đề phức tạp buộc các nhà khoa học phải giải quyết triệt để Điều này đòi hỏi phải có bộ điều khiển sao cho có thể cập nhật liên tục và thay đổi đủ nhanh các thông số để kịp thời thích ứng với các đặc tính động học tức thời của hệ thống Do đó, mô hình chuẩn MRAC cho bộ điều khiển thích nghi đã được tạo ra nhằm giải quyết vấn đề kỹ thuật này

Nhiều sơ đồ điều khiển thích nghi cho các hệ thống đặc thù đã ra đời vào những năm 1970 tiếp theo Đó là kết quả của sự kết hợp linh hoạt của các sơ đồ ước lược thông số và các phương pháp thiết kế bộ điều khiển Nhiều nghiên cứu mang tính ứng dụng đã được triển khai và bổ khuyết cho lý thuyết điều khiển thích nghi Tuy nhiên hầu hết những nghiên cứu với các sơ đồ điều khiển này chỉ ổn định trong điều kiện nhiễu cụ thể và trong phạm vi hạn chế Tiếp đến các sai số mô hình và nhiễu bị chặn từ các ví dụ vào đầu thập niên 1980 tiếp tục chỉ ra sự thiếu ổn định, không mang tính bền vững của các điều khiển thích này Đến nửa cuối thập niên 1980, một

số ứng dụng điều khiển cho các hệ thống tuyến tính với thông số bất định và thay đổi theo thời gian dần được nghiên cứu theo hướng thích nghi bền vững

Từ thập niên 1990 đến nay, hệ thống điều khiển thích nghi được thực hiện theo hướng nghiên cứu chất lượng của hệ điều khiển và phát triển các kết quả đạt được trong thập niên 1980 đối với các hệ thống phi tuyến mang các thông số chưa

Trang 14

biết Từ đó, lý thuyết điều khiển phi tuyến có được các lớp sơ đồ điều khiển thích nghi phù hợp Các nghiên cứu ban đầu điều khiển thích nghi cho hệ phi tuyến hầu hết có đối tượng là dạng hệ SISO (một ngõ vào – một ngõ ra) Tiếp theo những thành công đó cho đến nay, nhiều công trình nghiên cứu điều khiển thích nghi hệ phi tuyến MIMO (nhiều ngõ vào – nhiều ngõ ra) đã được triển khai mang lại nhiều lợi ích thiết thực.

Nhiều nghiên cứu đã áp dụng thành công mạng nơron truyền thẳng trong nhận dạng và điều khiển hệ thống động [1]-[3] Các kết quả này cũng được mở rộng ra đối với mạng nơron hồi quy [4]-[6]

Logic mờ và mạng nơron được sử dụng nhằm mục đích khai thác kiến thức của con nguời về khả năng xử lý Việc kết hợp giữa logic mờ và mạng nơron sẽ mở

ra nhiều ứng dụng rộng rãi trong nhận dạng và điều khiển đối tượng phi tuyến động [7]-[8] Hai công trình quan trọng có thể kể đến là:

 Yang Gao và Meng Joo Er [7] đã đề nghị mô hình nơron mờ để nhận dạng và điều khiển thích nghi cho hệ phi tuyến MIMO

 Lin và Lee [8] cũng đề nghị một mô hình nơron tổng quát cho bộ điều khiển và quyết định logic mờ cho mô hình xe không người lái

Mạng nơron mờ (FNN) có thể thực hiện một cấu trúc mô hình điều khiển tham chiếu, quá trình thiết kế mạng FNN được kết hợp giữa các khâu trễ và giải thuật học lan truyền ngược để giải quyết vấn đề cấu trúc mô hình động [9], [10]

Lee and Teng [11] đề xuất một mô hình mạng nơron mờ hồi quy (RFNN) dựa

trên giải thuật học giám sát, đây là một cấu trúc mạng động phù hợp cho việc diễn

tả một hệ thống động với ưu điểm nổi trội là khả năng giải quyết vấn đề biến thiên của ngõ vào hoặc ngõ ra bằng các mối quan hệ thời gian tại các nút mạng hồi quy;

do mạng RFNN có khả năng lưu trữ thông tin tạm thời nên cấu trúc mạng dùng nhận dạng và điều khiển hệ thống trở nên đơn giản vì cần rất ít nút mạng

Mạng RFNN là một phiên bản bổ sung của mạng FNN được dùng để nhận dạng và điều khiển hệ thống phi tuyến động [12]-[14] Mạng RFNN là một mạngnhiều lớp hồi quy, thực hiện suy diễn mờ và được tạo nên nhờ một bộ luật mờ Các

Trang 15

mối quan hệ thời gian được nhúng trong mạng được thực hiện nhờ cộng thêm vòng hồi tiếp ở lớp thứ hai của mạng FNN Sự bổ sung này cung cấp các phần tử nhớ cho mạng RFNN và mở rộng những khả năng cơ bản của mạng FNN cho những vấn đề

về sự biến thiên của hệ thống Bởi vì mỗi nơron hồi quy có một vòng hồi tiếp nội,

có thể lưu những đáp ứng động của hệ thống nên mô hình mạng đơn giản Tất cả những đặc tính của mạng FNN – suy diễn mờ, xấp xỉ hàm và những đặc tính hội tụ -đều được mở rộng cho mạng RFNN

Với những ưu điểm nổi trội của mạng RFNN về cấu trúc mạng và giải thuật học thích nghi trực tuyến nên trong luận văn này, tác giả sử dụng cấu trúc mạng RFNN để nhận dạng và điều khiển thích nghi đối tượng phi tuyến động mà cụ thể là

hệ tay máy hai bậc tự do

1.2 Tình hình nghiên cứu điều khiển tay máy hai bậc tự do

Hệ tay máy hai bậc tự do là một hệ thống phi tuyến động phù hợp cho việc nghiên cứu các giải thuật, thuật toán điều khiển tự động [18], [19] sử dụng logic

mờ và mạng nơron để điều khiển, tuy nhiên khả năng điều khiển còn hạn chế và chỉ giới hạn ở mức cân bằng cánh tay máy Với sự phát triển của công nghệ tính toán mềm và tốc độ xử lý của PC, nhiều phương pháp điều khiển thông minh đối tượng phi tuyến động ra đời, đặc biệt là sự kết hợp giữa logic mờ và mạng nơron cùng với các giải thuật học trực tuyến và thích nghi [7], [9], [12], [15]

2 Nhiệm vụ của luận văn

Tìm hiểu cấu trúc và giải thuật học của mạng nơron mờ hồi quy (RFNN) [2],

[3], [4], [5]

Khảo sát đối tượng hệ tay máy hai bậc tự do

Nghiên cứu và thực hiện các bộ điều khiển thích nghi hệ tay máy hai bậc tự do với mô hình phi tuyến theo các mô hình điều khiển sau:[1], [12], [14]

 Mô hình điều khiển dùng PID và logic mờ

 Mô hình nhận dạng đối tượng phi tuyến dùng mạng RFNN với giải thuật học online

Trang 16

Mô phỏng các mô hình điều khiển trên MATLAB( viết bằng M-file)

Phân tích, đánh giá so sánh kết quả mô phỏng của các mô hình điều khiển.Khảo sát tín ổn định và bền vững của bộ điều khiển thông qua việc thay đổi các kiểu tín hiệu tham khảo, thêm nhiễu và thay đổi tải của hệ tay máy 2 bậc tự do

3 Nội dung của luận văn

Với nhiệm vụ thực hiện luận văn ở trên, bố cục của luận văn gồm 6 chương:

3.1 Chương 1: Tổng quan

Giới thiệu khái quát lịch sử phát triển và các ưu điểm nổi bậc của mạng RFNN; giới thiệu một số công trình đã được công bố có liên quan đến điều khiển hệtay máy hai bậc tự do và ý nghĩa ứng dụng của mô hình này trong thực tế; mục đích nghiên cứu; nhiệm vụ thực hiện và nội dung sơ lược của luận văn

3.2 Chương 2: Cơ sở lý thuy t

Giới thiệu lý thuyết cơ bản về logic mờ, mạng nơron, mạng nơron mờ và điều khiển thích nghi Những vấn đề này làm cơ sở nền tảng để tiếp cận những vấn

đề được đề cập ở nhũng chương sau

3.3 Chương 3: Đối tượng tay máy hai bậc tự do

Đối tượng hệ tay máy hai bậc tự do là một hệ phi tuyến động rất phù hợp cho việc nghiên cứu khảo sát các bộ điều khiển hệ phi tuyến động nói chung

Trong phần này ta tìm hiểu mô hình toán phi tuyến hệ tay máy hai bậc tự do

mô hình không gian trạng thái, khảo sát đặc tính động học của hệ

3.4 Chương 4: Điều khiển tay máy hai bậc tự do

Tìm hiểu cấu trúc mạng nơ-ron mờ hồi quy, cấu trúc và giải thuật học lan truyền ngược online của mạng neuron mờ hồi quy Cấu trúc nhận dạng và điều khiển Đây là cơ sở cho việc xây dựng các mô hình nhận dạng và điều khiển các đối tượng phi tuyến động, cụ thể là hệ tay máy hai bậc tự do

Đây là phần nội dung chính của đề tài, trong phần này sẽ đề cập đến phương pháp xây dựng các bộ điều khiển thích nghi cho hệ phi tuyến động ,cụ thể:

Trang 17

 Mô hình điều khiển dùng PID và Logic mờ.

 Mô hình nhận dạng đối tượng phi tuyến dùng mạng RFNN với giải thuật học online

3.5 Chương 5: Mô phỏng

Ứng dụng các thuật toán nhận dạng và điều khiển được đề cập ở chương 4 để

mô phỏng hệ tay máy hai bậc tự do Từ kết quả mô phỏng, đánh giá, so sánh với các phương pháp khác, giới hạn phạm vi ứng dụng của thuật toán

3.6 Chương 6: Kết luận và hướng phát triển

Phân tích, đánh giá các kết quả đã thực hiện, khẳng định tính ưu việt của phương pháp được lựa chọn cho mô hình này Rút ra những vấn đề chưa thực hiện được trong luận văn và đề xuất hướng phát triển của đề tài

Trang 18

mờ và mạng nơ-ron cả hai đều là hệ thống động, các bộ xấp xỉ số không dựa trên

mô hình nên cho phép xử lý các thông tin không chắc chắn và có nhiễu Hai phương pháp này có điểm khác biệt đáng kể: ở cách xấp xỉ hàm mẫu, biểu diễn và mã hóacác tri thức cũng như cách suy dễn hay ánh xạ từ dữ liệu vào sang dữ liệu ra

Mạng nơ-ron dựa trên nhiều đơn vị xử lý cơ sở, được liên kết chặt chẽ với nhau tạo ra tính mềm dẻo và khả năng học tốt Các hệ mờ ra quyết định ngõ ra bằng cách xử lý thông tin đầu vào dưới dạng các biến ngôn ngữ, qua đó dùng các hàm liên thuộc tương ứng với các biến vào theo hệ qui tắc mờ dựa vào kinh nghiệm của các chuyên gia với phương pháp suy diễn mờ và giải mờ phù hợp Vì vậy, hệ mờ cho phép xấp xỉ hàm dựa trên các tập mờ, trong khí đó các mẫu học của mạng nơ-ron là các giá trị đơn lẻ

Do đó, hai cách tiếp cận này được sử dụng để bổ sung cho nhau Mạng ron nhân tạo cung cấp các thuật toán tính toán ở mức thấp, cho phép thực hiện truy xuất thông tin từ các hệ thống cần điều khiển Còn các hệ mờ cho phép tận dụng các tri thức và kinh nghiệm của các chuyên gia Từ đó, có thể sử dụng kết hợp hai phương pháp này hoặc để dịch chuyển khả năng tính toán và học ở mức thấp của các mạng nơ-ron sang các hệ mờ, hoặc có thể tích hợp khả năng suy diễn dựa trên

nơ-luật mờ “nếu … thì …” của các hệ mờ ở mức cao sang mạng nơ-ron Có 3 hướng

cơ bản để kết hợp mạng nơ-ron và hệ mờ:

 Các hệ mờ nơ-ron (Neural Fuzzy Systems) sử dụng công cụ nơ-ron nhúng trong mô hình mờ

Trang 19

 Các mạng nơ-ron mờ (Fuzzy Neural Networks) thực hiện mờ hóa mạng nơ-ron truyền thống.

 Các hệ lai giữa mạng nơ-ron và hệ mờ (Fuzzy Neural Hybrid Systems).Nhờ sự tích hợp khả năng tổng quát hóa của hệ logic mờ và khả năng tự học, cập nhật thông số của mạng nơ-ron mà hệ thống sẽ linh hoạt hơn nhiều nhờ thừa kế những ưu điểm của từng phương pháp Như vậy, với cùng một thuật toán, hệ thống nơ-ro mờ có thể thích nghi và hoạt động hiệu quả với nhiều hệ thống khác nhau.Cho đến nay, đã có nhiều công trình nghiên cứu kết hợp mạng nơ-ron và hệ

mờ trong nhận dạng và điều khiển hệ thống phi tuyến, đồng thời đã chứng tỏ được những ưu điểm vượt trội như công bố trong [1], [3], [7], [11]

Năm 1970, tại Trường Mary Queen, London - Anh, Ebrahim Mamdani đã dùng logic mờ để điều khiển một máy hơi nước mà ông không thể điều khiển được bằng kỹ thuật cổ điển Đến năm 1975 Mamdani đã thành công trong việc ứng dụng logic mờ vào điều khiển Tại Đức Hann Zimmermann đã dùng logic mờ cho các hệ

ra quyết định Tại Nhật, logic mờ được ứng dụng vào nhà máy xử lý nước của Fuji Electronic vào 1983, hệ thống xe điện ngầm của Hitachi vào 1987

Lý thuyết mờ ra đời ở Mỹ, ứng dụng đầu tiên ở Anh nhưng phát triển mạnh

mẽ nhất là ở Nhật Trong lĩnh vực Tự động hóa logic mờ ngày càng được ứng dụng rộng rãi Nó thực sự hữu dụng với các đối tượng phức tạp mà ta chưa biết rõ hàm truyền, logic mờ có thể giải quyết các vấn đề mà điều khiển kinh điển không làm được

Trang 20

Theo xu hướng đó, các hệ thống phức tạp (như hệ cánh tay máy nhiều bậc tự

do, con lắc ngược, thiết bị tự cân bằng, …) có đặc tính động có thể được mô tả bằng các phát biểu ngôn ngữ tương tự như các kinh nghiệm của các chuyên gia Và như thế, để tổng hợp các phát biểu ngôn ngữ này cần có phương pháp tích hợp thông tindưới dạng các phát biểu ngôn ngữ

2.1 Khái niệm cơ bản

Một cách tổng quát, một hệ thống mờ là một tập hợp các qui tắc dưới dạng

“Nếu … thì …” (If … Then …) để tái tạo hành vi ra quyết định của con người

được tích hợp vào cấu trúc điều khiển của hệ thống Trong đó, các tập mờ có biến không rõ ràng, chứa đựng các thông tin không rõ ràng Việc thiết kế một hệ thống

mờ mang rất nhiều tính chất chủ quan, nó tùy thuộc vào kinh nghiệm và kiến thức của người thiết kế Ngày nay, tuy kỹ thuật mờ đã phát triển vượt bậc nhưng vẫn chưa có một cách thức chính quy và hiệu quả để thiết kế một hệ thống mờ Việc thiết kế vẫn phải dựa trên một kỹ thuật cổ điển là thử − sai và đòi hỏi phải đầu tư nhiều thời gian để có thể đi tới một kết quả có thể chấp nhận được

Để hiểu rõ khái niệm “MỜ” là gì, ta hãy thực hiện phép so sánh sau:

Trong toán học phổ thông, ta đã học khá nhiều về tập hợp, ví dụ như tập các số thực

R, tập các số nguyên tố P = {2,3,5, }… Những tập hợp như vậy được gọi là tập hợp kinh

điển hay tập rõ, tính “RÕ” ở đây được hiểu là với một tập xác định S chứa n phần tử thì

ứng với phần tử x ta xác định được một giá trị y = S(x).

Giờ ta xét phát biểu thông thường về tốc độ một chiếc xe môtô: chậm, trung

bình, hơi nhanh, rất nhanh Phát biểu “CHẬM” ở đây không được chỉ rõ là bao nhiêu km/h, như vậy từ “CHẬM” có miền giá trị là một khoảng nào đó, ví dụ 5km/h

– 20km/h chẳng hạn Tập hợp L = {chậm, trung bình, hơi nhanh, rất nhanh} như

vậy được gọi là một tập các biến ngôn ngữ Với mỗi thành phần ngôn ngữ x k củaphát biểu trên nếu nó nhận được một khả năng (xk ) thì tập hợp F gồm các cặp (x,

(x k)) được gọi là tập mờ

Trang 21

2.1.1 Định nghĩa tập mờ

Tập mờ F xác định trên tập kinh điển B là một tập mà mỗi phần tử của nó là

một cặp giá trị (x,F (x)), với x X vàF (x) là một ánh xạ:

F (x): B [0 1]

trong đóF gọi là hàm liên thuộc, B gọi là tập nền, x là giá trị vật lý

2.1.2 Các thuật ngữ trong logic mờ

- Độ cao tập mờ F là giá trị h = SupF (x), trong đó supF (x) chỉ giá trị nhỏ

nhất trong tất cả các chặn trên của hàmF (x).

- Miền xác định của tập mờ F, ký hiệu là

S là tập con thỏa mãn:

S = F (x) = { x B | F (x) > 0 }

- Miền tin cậy của tập mờ F, ký hiệu là T

là tập con thỏa mãn:

T = { x B | F (x) = 1 } Hình 2.1: Mô tả hàm liên thuộc.

- Các dạng hàm liên thuộc (membership function) trong logic mờ: có rất nhiều dạng hàm liên thuộc như: Gaussian, PI-shape, S-shape, Sigmoidal, Z-shape…

Hình 2.2: Các dạng hàm liên thuộc thường sử dụng.

1

Trang 22

2.1.3 Biến ngôn ngữ

Biến ngôn ngữ là phần tử chủ đạo trong các hệ thống dùng logic mờ Ở đây các thành phần ngôn ngữ của cùng một ngữ cảnh được kết hợp lại với nhau

Để minh họa về hàm liên thuộc và biến ngôn ngữ, ta xét ví dụ sau:

Xét tốc độ của một chiếc xe môtô, ta có thể phát biểu xe đang chạy: rất chậm

(VS); chậm (S); trung bình (M); nhanh (F); rất nhanh (VF).

Những phát biểu như vậy gọi là biến ngôn ngữ của tập mờ Gọi x là giá trị của biến tốc độ, ví dụ x = 10km/h, x = 60km/h… Hàm liên thuộc tương ứng của các

biến ngôn ngữ trên được ký hiệu lần lượt là:

VS (x), S (x), M (x), F (x), VF (x)

Hình 2.3: Minh họa các hàm liên thuộc của các biến ngôn ngữ.

Như vậy biến tốc độ có hai miền giá trị:

- Miền các giá trị ngôn ngữ:

N = { rất chậm, chậm, trung bình, nhanh, rất nhanh }

Trang 23

2.1.4 Các phép toán trên tập mờ

Cho X,Y là hai tập mờ trên không gian nền B, có các hàm thuộc tương ứng là

X , Y, khi đó:

- Phép hợp hai tập mờ (or) XY

+ Theo luật Max: X Y (b) = Max{ X (b), Y (b) }

+ Theo luật Sum: X Y (b) = Min{ 1, X (b) + Y (b) }

+ Tổng trực tiếp: X Y (b) = X (b) + Y (b) -X (b).Y (b)

- Phép giao hai tập mờ (and) XY

+ Theo luật Min: XY (b) = Min{ X (b), Y (b) }

+ Theo luật Lukasiewicz: XY (b) = Max{0, X (b)+Y (b)-1}

+ Theo luật Prod: XY (b) = X (b).Y (b)

- Phép bù tập mờ (not): X c (b) = 1-X (b)

2.2 Luật hợp thành

2.2.1 Mệnh đề hợp thành

Ví dụ điều khiển mực nước trong bồn chứa, ta quan tâm đến hai yếu tố:

+ Mực nước trong bồn L = {rất thấp, thấp, vừa}

+ Góc mở van ống dẫn G = {đóng, nhỏ, lớn}

Ta có thể suy diễn cách thức điều khiển như thế này:

Nếu mực nước = rất thấp thì góc mở van = lớn

Nếu mực nước = thấp thì góc mở van = nhỏ

Nếu mực nước = vừa thì góc mở van = đóng

Trong ví dụ trên, ta thấy có cấu trúc chung là “Nếu A thì B” Cấu trúc này gọi

là mệnh đề hợp thành, A là mệnh đề điều kiện, C = AB là mệnh đề kết luận.

Trang 24

Định lý Mamdani: “Độ phụ thuộc của kết luận không được lớn hơn độ phụ thuộc

+ Luật Max – Min;

+ Luật Max – Prod;

+ Luật Sum – Min;

+ Luật Sum – Prod

a) Thuật toán xây dựng mệnh đề hợp thành cho hệ SISO

Luật mờ cho hệ SISO có dạng “If A Then B”

Chia hàm thuộcA (x) thành n điểm x i , i = 1,2,…,n

Chia hàm thuộcB (y) thành m điểm y j , j = 1,2,…,m

) 1 , (

) 1 , 2 (

) , 1 (

) 1 , 1 (

ym xn y

xn

ym x y

x

ym x y

x

R R

m r r

21

1

Trang 25

Trong trường hợp đầu vào là giá trị mờ A’ thìB’ (y) là:

B’ (y) = { l 1 ,l 2 ,l 3 ,…,l m } với l k = maxmin{a i ,r ik }

b) Thuật toán xây dựng mệnh đề hợp thành cho hệ MISO

Luật mờ cho hệ MISO có dạng:

“If cd 1 = A 1 and cd 2 = A 2 and … Then rs = B”

Các bước xây dựng luật hợp thành R:

- Rời rạc các hàm thuộcA1 (x 1 ), A2 (x 2 ), …,An (x n ),B (y)

- Xác định độ thỏa mãn H cho từng vector giá trị rõ đầu vào x ={c 1 ,c 2 ,…,c n }, trong

đó c i là một trong các điểm mẫu của Ai (x i ) Từ đó suy ra:

Giải mờ là quá trình xác định giá trị rõ ở đầu ra từ hàm thuộc B’ (y) của tập

mờ B’ Có hai phương pháp giải mờ:

Trang 26

+ Nguyên lý cận phải.

Hình 2.4: Mô tả nguyên tắc giải mờ.

- Nguyên lý trung bình: y’ =

2

1 y

y 

- Nguyên lý cận trái: chọn y’ = y1

- Nguyên lý cận phải: chọn y’ = y2

2.2.5 Phương pháp trọng tâm

Điểm y’ được xác định là hoành độ của điểm trọng tâm miền được bao bởi

trục hoành và đườngB’ (y).



 y dy y

, trong đó S là miền xác định của tập mờ B’

Phương pháp trọng tâm cho luật Sum-Min

Giả sử có m luật suy diễn được triển khai, ký hiệu các giá trị mờ đầu ra của luật điều khiển thứ k là B’k (y) thì với quy tắc Sum-Min hàm thuộc sẽ là B’ (y) =

Trang 27

m k k m

k S

y B

m k

k B

S

m k k B S

m k k B

A

M dy

y

dy y y dy

y

dy y y

1

1 '

) (

(2.1)

trong đó: M i =  

S k

B y dy

y ' ( ) và A i = 

S k

B' (y) dy ; i = 1,2,…,m

Hình 2.5: Mô tả giải mờ bằng phương pháp trọng tâm.

Xét riêng cho trường hợp các hàm thuộc dạng hình thang như hình trên:

2 2 2 1

k k

H

H y

1

1 với H k =B’k (y k )

Đây là công thức giải mờ theo phương pháp độ cao

2.2.6 Mô hình mờ Tagaki-Sugeno

Trang 28

Mô hình mờ mà ta nói đến trong các phần trước là mô hình Mamdani Ưu điểm của mô hình Mamdani là đơn giản, dễ thực hiện nhưng khả năng mô tả hệthống không tốt Trong kỹ thuật điều khiển, người ta thường sử dụng mô hình mờTagaki-Sugeno (TS).

Tagaki-Sugeno đưa ra mô hình mờ sử dụng cả không gian trạng thái mờ lẫn

mô tả linh hoạt hệ thống Theo Tagaki/Sugeno thì một vùng mờ LX kđược mô tả bởiluật:

R sk : If x = LX k Then x  A(x k)xB(x k)u (2.2)

Luật này có nghĩa là: nếu vector trạng thái x nằm trong vùng LX k thì hệ thốngđược mô tả bởi phương trình vi phân cục bộ x  A(x k)xB(x k)u Nếu toàn bộ cácluật của hệ thống được xây dựng thì có thể mô tả toàn bộ trạng thái của hệ trong

toàn cục Trong (2.2) ma trận A(x k ) và B(x k ) là những ma trận hằng của hệ thống ở

trọng tâm của miền LX kđược xác định từ các chương trình nhận dạng Từ đó rút ra được:

 w (A(x )x B(x )u)

với w k (x)  [0, 1] là độ thỏa mãn đã chuẩn hóa của x* đối với vùng mờ LX k

Luật điều khiển tương ứng với (2.2) sẽ là:

x  k( ) l( )( ( k)  ( k) ( l))

Trang 29

2.3 Bộ điều khiển mờ

2.3.1 Cấu trúc một bộ điều khiển mờ

Hình 2.6: Sơ đồ khối bộ điều khiển mờ

Một bộ điều khiển mờ gồm ba khâu cơ bản:

u1 2

Hình 2.7: mô hình mờ với các hàm liên thuộc

2.3.2 Nguyên lý điều khiển mờ

Trang 30

Hình 2.8: Mô hình bộ điều khiển mờ

Các bước thiết kế hệ thống điều khiển mờ:

- Giao diện đầu vào gồm các khâu: mờ hóa và các khâu hiệu chỉnh như tỷ lệ, tích phân, vi phân …;

- Thiếp bị hợp thành: sự triển khai luật hợp thành R;

- Giao diện đầu ra gồm: khâu giải mờ và các khâu giao diện trực tiếp với đốitượng

2.3.3 Thiết kế bộ điều khiển mờ

Các bước thiết kế:

B1: Định nghĩa tất cả các biến ngôn ngữ vào/ra

B2: Xác định các tập mờ cho từng biến vào/ra (mờ hóa)

- Miền giá trị vật lý của các biến ngôn ngữ;

- Số lượng tập mờ;

- Xác định hàm thuộc;

- Rời rạc hóa tập mờ

Trang 31

B3: Xây dựng luật hợp thành.

B4: Chọn thiết bị hợp thành

B5: Giải mờ và tối ưu hóa

Những lưu ý khi thiết kế bộ điều khiển mờ:

- Không bao giờ dùng điều khiển mờ để giải quyết bài toán mà có thể dễ dàngthực hiện bằng bộ điều khiển kinh điển;

- Không nên dùng bộ điều khiển mờ cho các hệ thống cần độ an toàn cao;

- Thiết kế bộ điều khiển mờ phải được thực hiện qua thực nghiệm

Phân loại các bộ điều khiển mờ:

i Điều khiển Mamdani (MCFC)

ii Điều khiển mờ trượt (SMFC)

iii Điều khiển tra bảng (CMFC)

iv Điều khiển Tagaki/Sugeno (TSFC)

Trang 32

3 Mạng nơ-ron nhân tạo

Từ những năm 40 của thế kỷ 20, các nhà nghiên cứu đã phát triển mô hình phần cứng và phần mềm đơn giản phỏng theo các nơ-ron sinh học (bao gồm các cơ chế tương tác của chúng) với mong muốn chế tạo ra những cỗ máy thông minh có khả năng ra quyết định như bộ não người Vào năm 1944, những người đặt nền móng đầu tiên trong lĩnh vực này là Mc Culloh và Pitts đã xuất bản công trình nghiên cứu có tính hệ thống về mạng nơ-ron nhân tạo

Đến những năm 50 và 60 của thế kỷ 20, một nhóm các nhà nghiên cứu đã kết hợp những kiến thức về sinh học và tâm thần học để tạo ra một mạng nơ-ron nhân tạo hoàn chỉnh đầu tiên dưới dạng một mạch điện tử Sau đó các mạng nơ-ron được chuyển thành các chương trình mô phỏng trên máy tính với mức độ linh hoạt cao hơn

Tuy nhiên việc nghiên cứu về mạng nơ-ron thực sự phát triển mạnh mẽ từnhững năm 1980, với sự đóng góp quan trọng bởi những nghiên cứu mở rộng của Rosenblatt, Widrow và Hoff về các mạng nơ-ron nhiều lớp phức tạp Hơn nữa, sựphát triển của lĩnh vực nghiên cứu về mạng nơ-ron nhân tạo còn được sự hỗ trợkhông nhỏ từ sự phát triển vượt bậc và liên tục của ngành khoa học máy tính (phần cứng và phần mềm) đã giúp cho các nhà nghiên cứu có thể tạo ra, kiểm chứng và ứng dụng vào thực tế các hệ thống dựa trên mạng nơ-ron nhân tạo phức tạp và linh hoạt Mạng nơ-ron nhân tạo được ứng dụng trong nhiều lĩnh vực như: nhận dạng, phân loại, xử lý ảnh, các hệ thống điều khiển, dự báo …

Cho đến nay, nhiều vấn đề điều khiển đã được các nhà nghiên cứu giải quyết

và công bố bằng nhiều dạng cấu hình mạng nơ-ron với các thuật toán huấn luyện phù hợp Phương mạng nơ-ron thích nghi dựa trên tiêu chuẩn ổn định Lyapunov giúp giải quyết vấn đề hội tụ và sự không ổn định của vòng kín thường xuất hiện trong điều khiển bám theo của các hệ thống động phi tuyến có sự tham gia của nhiễu

Trang 33

3.1 Cấu trúc cơ bản của mạng nơ-ron sinh học

Hệ thống thần kinh của con người là một mạng nơ-ron cực kỳ phức tạp,trong đó bộ não có khoảng 1011  1012 nơ-ron Mỗi nơ-ron có thể liên kết với 104

nơ-ron khác thông qua các khớp nối (dendrite) và các mạng lưới phụ Mỗi nơ-ron trong bộ não người gồm một thân nơ-ron, một trục nơ-ron (axon) và nhiều khớp nối

Các khớp nối nhận tín hiệu từ các nơ-ron khác, trục nơ-ron có thể xem như là một ống dài với các nhánh ở cuối ống Các nhánh này được nối với các nơ ron khácthông qua các mối nối Tùy thuộc vào vai trò cua nơ-ron mà số lượng mối nối có thểdao động từ vài trăm đến vài ngàn mối nối

Hình 2.9: Cấu trúc của một nơ-ron sinh học

Thân nơ-ron tổng hợp các tín hiệu thu thập được từ các khớp nối cũng như từcác mối nối trên bề mặt của nó Nếu các tín hiệu tổng hợp này vượt quá một mức ngưỡng cho phép thì nơ-ron sẽ truyền một xung điện tới các trục nơ-ron của nó.Trong trường hợp ngược lại, các tín hiệu vào sẽ bị bỏ qua và không có xung điện ởngõ ra nơ-ron Mô hình và cách thức hoạt động nơ-ron sinh học là nền tảng cho nguyên lý hoạt động của các nơ-ron nhân tạo

Hai đặc tính cơ bản của mạng nơ-ron là:

- Quá trình tính toán được tiến hành song song và phân tán trên nhiều nơ-ron gần như đồng thời.

Trang 34

- Tính toán thực chất là quá trình học, chứ không phải theo sơ đồ định sẵn từ trước.

Luật học trong mạng nơ-ron nhân tạo có 2 loại chính: học thông số và học cấu trúc Học thông số có nghĩa là cập nhật các trọng số kết nối trong mạng nơ-ron Trong khi đó, học cấu trúc là tập trung vào việc thay đổi cấu trục của mạng (bao gồm số đơn vị xử lý và loại kết nối) Hai dạng học này có thể thực hiện đồng thời hoặc tách rời

3.2 Mô hình toán của mạng nơ ron nhân tạo.

Mạng nơ ron nhân tạo là mạng được thiết kế dựa trên việc mô phỏng cấu trúc

hệ thần kinh sinh học của con người Cấu trúc của mạng gồm nhiều lớp: lớp vào, nhiều lớp ẩn và lớp ra Các nơ-ron của lớp vào được kết nối với các phần tử cảm biến như tai, mắt Các nơ-ron lớp ẩn là các đơn vị xử lý Các nơ-ron của lớp ra được kết nối với các phần tử chấp hành như tay,chân Tín hiệu truyền từ nơ-ron này tới các nơ-ron khác dưới dạng tín hiệu điện Nếu tín hiệu truyền là tín hiệu dương thì tín hiệu đó được gọi là tín hiệu kích hoạt Nếu tín hiệu truyền là điện áp

âm thì tín hiệu đó là tín hiệu ức chế Nếu tín hiệu truyền là zero thì không có sự kết nối giữa các nơ-ron

Nơ-ron nhân tạo là một thành phần cơ bản của một mạng nơ-ron nhân tạo Một nơ-ron nhân tạo có 3 thuộc tính cơ bản: Trọng số kết nối, ngưỡng và hàm kích hoạt

Hình 2.10: Cấu trúc của một nơ-ron nhân tạo

Trang 35

Các giá trị W w , w , w 1 2 nT là các trọng số kết nối của các nơ-ron với các

nơ-ron khác, nó được dùng để xác định cường độ của các vector ngõ vào

X = [x1,x2…xn] Do đó giá trị ngõ vào của hàm kích hoạt được xác định là XTW

Tùy thuộc vào dạng hàm kích hoạt, nếu trọng số kết nối là dương thì XTW sẽ kích

thích nơ-ron ở ngõ ra và ngược lại

Giá trị ngưỡng bên trong của nơ-ron (ký hiệu θ) là giá trị biên độ ảnh hưởng

đến sự kích hoạt ngõ ra theo công thức:

Trong đó u là hàm tổng, dùng để kết hợp và xử lý các thông tin ở đầu vào, y là

tín hiệu ngõ ra của nơ-ron có được từ hàm kích hoạt f(u).

j

j x w u

1 2

 Hàm cầu (spherical function):

2 1

Thông thường, hàm tổng được sử dụng nhiều nhất là hàm tuyến tính

Hàm kích hoạt f thực thi một biểu thức toán học dựa trên tín hiệu ngõ vào để

tạo tín hiệu ngõ ra cho nơ-ron Có nhiều dạng hàm kích hoạt được sử dụng tùy

thuộc vào bài toán mà mạng nơ-ron được dùng để giải quyết

 Hàm nấc:

Trang 36

j 1

j j net net j

1

1 w

2 )

f

 Hàm Ram:

j 1

n j j

Trang 37

3.3 Phân loại mạng nơ-ron nhân tạo

Các loại mạng nơ-ron nhân tạo có thể được phân loại dựa trên các tính chất của nó

Theo số lớp:

- Mạng nơ-ron một lớp: mạng chỉ gồm 1 lớp nơ-ron

- Mạng nơ-ron nhiều lớp: mạng gồm nhiều lớp nơ-ron

- Mạng nơ-ron truyền thẳng: các tín hiệu trong mạng chỉ truyền theo một chiều

Thuật toán huấn luyện cho mạng nơ-ron một lớp có đặc điểm

+ Giá trị ban đầu của trọng số và ngưỡng là những giá trị ngẫu nhiên

+ Tính toán theo từng mẫu ngõ vào và ngõ ra mong muốn

+ Ngõ ra của mạng được tính theo phương trình:

Y  f X W

+ Luật cập nhật trọng số theo biểu thức:

Trang 38

( 1) ( ) [ ( ) ( )] ( )

ij ij i i j

w t w t  d t y t x t (2.5)Trong đó: -là tốc độ học

- d t i( ) là ngõ ra mong muốn thứ i

Có nhiều thuật toán huấn luyện cho mạng nơ-ron một lớp như thuật toán Perceptron, thuật toán Widrow-Hoff Nhưng thuật toán Widrow-Hoff hay được sửdụng hơn, thuật toán này tính toán sai lệch giữa ngõ ra mong muốn với ngõ ra thực

sự của mạng  d t( ) y t( ) với d(t) là ngõ ra mong muốn của mạng và y(t) là ngõ ra của mạng Sau đó luật cập nhật trọng số của mạng được tính theo:

ij ij i i j

w t w t  d t y t x t (2.6)Tuy vậy trong thực tế có nhiều bài toán mà mạng nơ-ron một lớp không thểgiải quyết được

3.3.2 Mạng nơ-ron nhiều lớp

Để khắc phục hạn chế của mạng nơ-ron một lớp người ta thường hay sửdụng mạng nơ-ron nhiều lớp (hay còn gọi là mạng truyền thẳng) kết hợp với các hàm kích hoạt phi tuyến

Một trong các cấu trúc cơ bản và phổ biến của mạng nơ-ron nhiều lớp là một mạng bao gồm một lớp vào, một lớp ẩn và một lớp ra được biểu diễn trong hình 2.12 Các nơ-ron của lớp vào làm nhiệm vụ chuyển tín hiệu từ ngõ vào đến lớp ẩn của mạng Lớp ẩn chứa các nơ-ron được xem như các đơn vị xử lý và lớp ra chứa các nơ-ron để ra quyết định Lớp ẩn và lớp ra có cấu trúc giống mạng nơ-ron một lớp

Trang 39

Hình 2.12: Cấu trúc của mạng nơ-ron ba lớp

Hình 2.13: Cấu trúc của mạng hồi quy nơ-ron ba lớp

Giải thuật lan truyền ngược được phát minh bởi Rumelhart, McClelland và Williams vào những năm 80 của thế kỷ 20, là giải thuật phổ biến được áp dụng đểhuấn luyện mạng nơ-ron nhiều lớp Với giải thuật này ngõ vào được cung cấp cho mạng sau đó ngõ ra được tính toán và so sánh với ngõ ra mong muốn Trọng số kết nối của mạng được cập nhật sao cho sai số ngõ ra sẽ được giảm trong lần tính toán tiếp theo Kiểu học này còn được gọi là kiểu học có giám sát, vì giải thuật học đòi hỏi phải cung cấp một tập mẫu huấn luyện đầy đủ (gồm các ngõ vào và ngõ ramong muốn) Trọng số kết nối của mạng được chỉnh định theo hướng tỉ lệ với sai

số, việc lan truyền ngược những sai số này từ ngõ ra đến ngõ vào của mạng có thểchỉnh định tất cả các trọng số kết nối của mạng

Trang 40

Giải thuật lan truyền ngược huấn luyện mạng nơ-ron nhiều lớp có thể tóm tắt như sau:

+ Các trọng số kết nối và ngưỡng ban đầu được khởi tạo bởi các giá trị ngẫu nhiên nhỏ

+ Tập mẫu huấn luyện được đưa vào mạng bao gồm các ngõ vào x t( ) và ngõ

ra mong muốn d t( )

+ Tín hiệu lan truyền thuận trong mạng theo các công thức sau:

Tín hiệu vào đơn vị thứ q của lớp ẩn:

1

( 1, )

m

q qj j j



  Tín hiệu ra đơn vị thứ q của lớp ẩn:

Định dạng
Số trang	149
Dung lượng	5,38 MB