ĐIỀU KHIỂN ỔN ĐỊNH VỊ TRÍ HỆ BI – THANH SỬ DỤNG PHƯƠNG PHÁP TRƯỢT – NƠ RON LUẬN VĂN THẠC SĨ

TÓM TẮT LUẬN VĂN ĐIỀU KHIỂN ỔN ĐỊNH VỊ TRÍ HỆ BI - THANH SỬ DỤNG PHƯƠNG PHÁP TRƯỢT – NƠ RON Học viên: Võ Long Sĩ Chuyên ngành: Kỹ thuật điều khiển và tự động hóa Mã số: 60520216 Khóa:

Trang 1

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA

VÕ LONG SĨ

ĐIỀU KHIỂN ỔN ĐỊNH VỊ TRÍ HỆ BI – THANH

SỬ DỤNG PHƯƠNG PHÁP TRƯỢT – NƠ RON

LUẬN VĂN THẠC SĨ

KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA

Đà Nẵng - Năm 2017

Trang 2

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA

VÕ LONG SĨ

ĐIỀU KHIỂN ỔN ĐỊNH VỊ TRÍ HỆ BI – THANH

Chuyên ngành : Kỹ thuật điều khiển và tự động hóa

Mã số : 60 52 02 16

LUẬN VĂN THẠC SĨ

KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA

Người hướng dẫn khoa học: TS NGUYỄN KIM ÁNH

Đà Nẵng - Năm 2017

Trang 3

LỜI CAM ĐOAN

Tôi cam đoan đây là công trình nghiên cứu của riêng tôi.Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác

Tác giả luận văn

Võ Long Sĩ

Trang 4

TÓM TẮT LUẬN VĂN

ĐIỀU KHIỂN ỔN ĐỊNH VỊ TRÍ HỆ BI - THANH

Học viên: Võ Long Sĩ Chuyên ngành: Kỹ thuật điều khiển và tự động hóa

Mã số: 60520216 Khóa: 31 Trường Đại học Bách khoa - ĐHĐN

Tóm tắt – Các hệ thống tự cân bằng đã và đang được nghiên cứu và phát triển rộng rãi Việc

điều khiển hệ thống tự cân bằng có thể giúp giảm chấn cho xe ô tô, ổn định hàng hóa khi vận chuyển trên tàu biển, ứng dụng trong xe hai bánh tự cân bằng Trong lĩnh vực quân sự có thể điều khiển ổn định được góc bắn pháo trên xe tăng, tàu chiến, góc phóng tên lửa, cân bằng trong máy bay không người lái Một phương pháp đơn giản nhưng có thể giải quyết tài toán phi tuyến rất hiệu quả đó là điều khiển trượt , phương pháp này mang lại chất lượng bền vững rất cao Tuy nhiên tín hiệu điều khiển được tạo ra bởi bộ điều khiển trượt có hiện tượng rung (chattering) trong hệ thống Đây là một hiện tượng nguy hiểm và là nguyên nhân làm giảm tuổi thọ nhiều thiết bị Luận văn này, tác giả đề xuất các phương pháp trượt dùng mạng nơ ron

để hạn chế hiện tượng chattering trong điều khiển trượt Sử dụng phương pháp này để điều khiển ổn định vị trí mô hình hệ bi – thanh Đây là một mô hình thí nghiệm phổ biến cho việc điều khiển tự cân bằng tại các phòng nghiên cứu và trường đại học trên thế giới.

Từ khóa – Hệ bi – thanh; Điều khiển trượt; Điều khiển trượt dùng mạng nơ ron; Điều khiển

trượt thích nghi dùng mạng nơ ron

STABILITY CONTROL POSITIONS THE BEAM AND BALL USING

SLIDING - NEURAL METHOD Abstract – Self-balancing systems have been extensively researched and developed

Controlled self-balancing systems can help to reduce shock for car, stabilize cargo when shipped on board, and applied in self- balancing two-wheeled vehicles In the field of military control can stabilize the angle of guns on tanks, warships, missile launchers, balance in unmanned aircraft Therefore, the control of nonlinear systems is unavoidable Sliding mode control is a simple method but effective for solving nonlinear problem This method provides high quality of stability However, the control signal generated by the sliding mode controller

in the system has chattering phenomenon This is a dangerous phenomenon and is the cause of the longevity of devices In this thesis, The author offers sliding mode control method using neural network to reduce the chattering phenomenon in sliding mode control This method is used to control the position of the ball and beam system This system is widely used for researching nonlinear in labs and universities

root-Key words – Ball and beam system; Sliding mode control; Neural sliding mode control;

Adaptive neural sliding mode control

Trang 5

MỤC LỤC

LỜI CAM ĐOAN

TÓM TẮT LUẬN VĂN

MỤC LỤC

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

DANH MỤC CÁC BẢNG

DANH MỤC CÁC HÌNH

MỞ ĐẦU 1

Chương 1 - TỔNG QUAN VỀ HỆ BI - THANH 5

1.1 Giới thiệu hệ bi - thanh 5

1.1.1 Mô hình hệ bi – thanh kiểu trục lệch 5

1.1.2 Mô hình hệ bi – thanh kiểu trục giữa 5

1.2 Các công trình nghiên cứu liên quan 6

1.2.1 Các công trình nghiên cứu trong nước 6

1.2.2 Các công trình nghiên cứu ngoài nước 6

1.3 Kết luận 8

Chương 2 - MÔ HÌNH HÓA VÀ ĐIỀU KHIỂN HỆ THỐNG PHI TUYẾN 9

2.1 Mô hình hóa hệ thống phi tuyến 9

2.1.1 Phương trình Euler-Lagrange 9

2.1.2 Tuyến tính hóa hệ thống phi tuyến xung quanh điểm làm việc 10

2.2 Điều khiển hệ thống phi tuyến 11

2.2.1 Ổn định Lyapunov đối với hệ thống phi tuyến 11

2.2.2 Điều khiển trượt 13

2.2.3 Điều khiển dùng mạng nơ ron 19

2.2.4 Điều khiển trượt dùng mạng nơ ron 23

2.2.5 Điều khiển trượt thích nghi dùng mạng nơ ron cho đối tượng phi tuyến 29

2.3 Kết luận 30

Chương 3 - XÂY DỰNG MÔ HÌNH TOÁN VÀ THIẾT KẾ BỘ ĐIỀU KHIỂN 31 3.1 Xây dựng mô hình toán 31

3.1.1 Xây dựng phương trình trạng thái mô tả hệ bi - thanh 31

3.1.2 Tuyến tính hóa xung quanh điểm làm việc 34

3.2 Thiết kế bộ điều khiển trượt cho hệ bi - thanh 35

3.3 Thiết kế bộ điều khiển trượt dùng mạng nơ ron cho hệ bi - thanh 36

3.4 Thiết kế bộ điều khiển trượt thích nghi dùng mạng nơ ron cho hệ bi - thanh 37

3.5 Kết luận 38

Trang 6

Chương 4 - MÔ PHỎNG VÀ ĐÁNH GIÁ KẾT QUẢ 40

4.1 Mô phỏng đối tượng hệ bi – thanh trước khi có bộ điều khiển 40

4.2 Mô phỏng hệ bi – thanh sau khi có bộ điều khiển trượt 42

4.3 Mô phỏng hệ bi – thanh sau khi có bộ điều khiển trượt dùng mạng nơ ron 46

4.4 Mô phỏng hệ bi – thanh sau khi có bộ điều khiển trượt thích nghi dùng mạng nơ ron 49

4.5 Khảo sát đáp ứng của các bộ điều khiển khi có nhiễu tác động 54

4.5.1 Bộ điều khiển trượt 54

4.5.2 Bộ điều khiển trượt dùng mạng nơ ron 54

4.5.3 Bộ điều khiển trượt thích nghi dùng mạng nơ ron 56

4.6 So sánh kết quả của các phương pháp điều khiển 57

4.7 Kết luận 58

KẾT LUẬN VÀ KIẾN NGHỊ 60 DANH MỤC TÀI LIỆU THAM KHẢO

QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN (bản sao)

Trang 7

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

I Momen quán tính của bi sắt kgm

I Momen quán tính của thanh kgm

SMC Sliding Mode Control: Điều khiển trượt

NSMC Neural Sliding Mode Control: Điều khiển trượt dùng mạng nơ ron ANSMC Adaptive Neural Sliding Mode Control: Điều khiển trượt thích nghi dùng mạng nơ ron

DC Direct current: Dòng điện một chiều

LQR Linear-Quadratic Regulator: Điều khiển tối ưu

RBF Radial basis function: Mạng hàm cơ sở xuyên tâm

Trang 8

DANH MỤC CÁC BẢNG

Số hiệu

Trang 9

1.3 Hệ thống bi - thanh của nhóm tác giả D Colon và I.S Diniz 7 1.4 Hệ thống bi - thanh của nhóm tác giả Mohammad Keshmiri và

Ali Fellah Jahromi

7

2.1 Xác định tín hiệu điều khiển tiến về mặt trượt 14

2.4 Mạng truyền thẳng 1 lớp (single layer feedforward network) 21 2.5 Mạng truyền thẳng nhiều lớp (multi layer feedforward network) 21 2.6 Mạng hồi quy nhiều lớp (multi layer recurrent network) 22 2.7 Nút đơn hồi tiếp (single node with feedback to itself) 22

2.9 Học không có giám sát (unsupervised learning, self organizing) 23

2.12 Mạng noron NN1 dùng làm thành phần điều khiển tương đương 25 2.13 Mạng noron NN2 dùng làm thành phần điều khiển hiệu chỉnh 28 2.14 Mô hình điều khiển trượt thích nghi dùng mạng nơ ron 29

3.3 Mạng nơ ron dùng làm thành phần điều khiển tương đương 36 3.4 Mạng nơ ron dùng làm thành phần điều khiển hiệu chỉnh 37 3.5 Mạng nơ ron làm bộ điều khiển trượt thích nghi dùng mạng nơ

ron

38

4.2 Mô hình toán được xây dựng trên Matlab Simulink 40

4.6 Đáp ứng vị trí bi sắt và góc lệch thanh khi không có bộ điều

khiển

42

Trang 10

4.9 Cấu trúc bên trong khối m(x) mô phỏng theo phương trình (3.18) 43

4.11 Đáp ứng điều khiển trượt khi thay hàm sign(.) bằng hàm sat(.) 44 4.13 Đáp ứng điều khiển trượt bám theo tín hiệu đặt khi thay hàm

sign(.) bằng hàm sat(.)

45

4.14 Sơ đồ mô phỏng Matlab - Simulink theo phương pháp điều khiển

trượt dùng mạng nơ ron

46

4.19 Đáp ứng của điều khiển trượt dùng mạng nơ ron 48 4.20 Đáp ứng của điều khiển trượt dùng mạng nơ ron bám theo tín

4.26 Phiên điều khiển đầu tiên trượt thích nghi dùng mạng nơ ron 51 4.27 Phiên điều khiển thứ hai trượt thích nghi dùng mạng nơ ron 51 4.28 Quá trình huấn luyện và hội tụ bộ điều khiển trượt thích nghi

4.32 Đáp ứng bộ điều khiển trượt dùng mạng nơ ron khi có nhiễu 55 4.33 Đáp ứng bộ điều khiển trượt thích nghi dùng mạng nơ ron khi có

nhiễu

56 4.34 So sánh đáp ứng của các phương pháp điều khiển 57

Trang 12

MỞ ĐẦU

1 Lý do chọn đề tài

Ngày nay, các hệ thống tự cân bằng được sử dụng rất rộng rãi trong đời sống và trong kỹ thuật Nhiều hệ thống tự cân bằng đã và đang được nghiên cứu phát triển như: điều khiển cân bằng trong hệ thống giảm chấn cho xe hơi, ổn định hàng hóa trên tàu biển, xe hai bánh tự cân bằng, ổn định cầu trục vận chuyển hàng hóa Đặt biệt trong lĩnh vực quân sự, việc nghiên cứu và phát triển các hệ thống cân bằng có khả năng ổn

định được góc bắn pháo trên xe tăng, tàu chiến, góc phóng tên lửa, cân bằng trong máy

bay không người lái

Trong bối cảnh này, để thực nghiệm việc điều khiển tự cân bằng, nhiều phòng thí nghiệm của nhiều trường Đại học, viện nghiên cứu sử dụng một số mô hình đơn giản

về mặt kết cấu nhưng có đủ độ phức tạp về mặt động lực học và có tính phi tuyến cao

Có thể liệt kê ra ở đây một số mô hình phổ biến như: mô hình con lắc ngược, mô hình

nêm ngược, mô hình hệ bi – thanh Trong đó mô hình hệ thống “bi – thanh” được sử dụng cho việc thử nghiệm một số bài toán điều khiển Vấn đề chính của những bài toán này đặt ra là cần thiết kế bộ điều khiểncho mô hình để giữ cân bằng vị trí của bi trên thanh hoặc bi di chuyển trên thanh theo một vị trí thay đổi đặt trước Các vấn đề này đặt ra nhiều thách thức trong lĩnh vực điều khiển tự động Bên cạnh đó, việc sử dụng các phương pháp điều khiển thông minh để điều khiển mô hình hệ bi - thanh có thể giúp ta tìm ra được các phương pháp điều khiển hợp lý, từ đó áp dụng các phương pháp này vào mô hình thực tế có tính chất tương tự

Việc điều khiển ổn định hệ bi - thanh đã được thực hiện trong một số nghiên cứu Những nghiên cứu này tập trung trên việc khai thác, ứng dụng một số lý thuyết điều khiển nâng cao vào việc xây dựng bộ điều khiển nhằm nâng cao chất lượng của mục tiêu điều khiển Các tác giả đã xây dựng nhiều phương pháp điều khiển khác nhau, trong đó có sự kết hợp giữa các phương pháp điều khiển thông minh như: điều khiển

mờ [1], điều khiển mờ trượt – PD [2], điều khiển tối ưu (LQR) [3] Tuy nhiên, trong các nghiên cứu này vẫn còn tồn tại những nhược điểm như: thời gian đáp ứng chậm, yêu cầu bi phải có khối lượng nhẹ để hạn chế quán tính khi lăn trên thanh

Một phương pháp điều khiển phi tuyến đơn giản nhưng hiệu quả đó là điều khiển trượt Phương pháp này được đề xuất bởi Emelyanov, một nhà điều khiển học người Nga vào năm 1962 Nhưng mãi đến năm 1977 mới được phát triển rộng rãi nhờ những

ấn phẩm xuất bản bằng tiếng Anh của Utkin Ưu điểm nổi bậc của phương pháp này là tính ổn định và bền vững ngay cả khi hệ thống có sự tác động của nhiễu hoặc khi thông số của đối tượng thay đổi theo thời gian Tuy nhiên, tín hiệu của hàm chuyển mạch trong phương pháp điều khiển trượt tồn tại hiện tượng dao động với tần số cao (chattering) xung quanh mặt trượt Đây là một hiện tượng nguy hiểm, gây ra một chuỗi các sốc nhỏ trên thiết bị và hậu quả làm giảm tuổi thọ của nó Có nhiều nghiên cứu được đề xuất để khắc phục hiện tượng chattering trong phương pháp điều khiển trượt

Trang 13

bằng cách sử dụng mạng nơ ron để thay thế các thành phần điều khiển tương đương [6-9] Việc sử dụng phương pháp này có thể nhận dạng các hàm phi tuyến trong bộ điều khiển trượt mà không cần nhận dạng các thông số của hệ thống Hàm dấu trong phương pháp điều khiển trượt được thay thế bằng hàm bão hòa để hạn chế hiện tượng chattering Tuy nhiên, nhược điểm của phương pháp này là thời gian đáp ứng chậm hơn so với phương pháp điều khiển trượt Vì các chặn trên dùng trong thành phần điều khiển bền vững với các giá trị hằng được chọn trước Do đó, chất lượng điều khiển vẫn phải phụ thuộc vào việc chọn các giá trị chặn Để khắc phục vấn đề này, một số nghiên cứu sử dụng phương pháp điều khiển trượt thích nghi dùng mạng nơ ron điều khiển hệ thống động phi tuyến [4,5,10,11] Các kết quả đã công bố cho thấy, phương pháp này

có thời gian đáp ứng nhanh hơn so với phương pháp điều khiển trượt dùng mạng nơ ron và khắc phục được hiện tượng chattering của điều khiển trượt

Do đó, trong phạm vi của luận văn này, tác giả đề xuất lựa chọn đề tài: “Điều

khiển ổn định vị trí hệ bi - thanh sử dụng phương pháp trượt – nơ ron”

2 Mục đích nghiên cứu

Mục đích của luận văn này là nghiên cứu các phương pháp điều khiển trượt, điều khiển trượt dùng mạng nơ ron, điều khiển trượt thích nghi dùng mạng nơ ron để điều khiển đối tượng hệ bi – thanh, nhằm giải quyết hai vấn đề sau:

- Điều khiển ổn định vị trí hệ bi - thanh

- Cải thiện chất lượng điều khiển hệ bi - thanh thông qua việc hạn chế hiện tượng chattering trong điều khiển trượt

3 Đối tượng và phạm vi nghiên cứu

3.1 Đối tượng nghiên cứu

Hệ thống bi – thanh được mô tả như Hình 1 gồm có: bi sắt (1), thanh cân bằng (2) và động cơ DC (3) Khi động cơ DC quay, thông qua hộp số sẽ làm cho thanh cân bằng quay một góc Dưới tác dụng của trọng lực sẽ làm quả bóng lăn tự do trên thanh và bộ điều khiển có nhiệm vụ kiểm soát góc quay của động cơ DC để giữ quả bóng cân bằng tại vị trí mong muốn Tương tự hệ con lắc ngược, hệ bi - thanh cũng là một trong những đối tượng phi tuyến không ổn định điển hình, thường được sử dụng

để thử nghiệm một số lý thuyết trong lĩnh vực điều khiển tự động

Trang 14

trượt dùng mạng nơ ron và điều khiển trượt thích nghi dùng mạng nơ ron để điều khiển đối tượng hệ bi - thanh

4 Phương pháp nghiên cứu

4 1 Nghiên cứu lý thuyết

- Nghiên cứu các vấn đề liên quan đến xây dựng mô hình toán học cho đối tượng

- Nghiên cứu các lý thuyết điều khiển trượt, điều khiển tối ưu, điều khiển dùng mạng nơ ron

- Nghiên cứu các lý thuyết điều khiển kết hợp phương pháp điều khiển trượt và điều khiển dùng mạng nơ ron

4.2 Phương pháp thực nghiệm

Để kiểm chứng, đánh giá kết quả các phương pháp điều khiển đã thiết kế và việc

mô hình hóa đối tượng hệ bi – thanh, trong luận văn này, phần mềm Matlab – Simulink được sử dụng làm công cụ để mô phỏng

5 Ý nghĩa khoa học và thực tiễn của đề tài

Trong thực tế của lĩnh vực điều khiển tự động thì việc điều khiển các hệ thống phi tuyến bất định là không thể tránh khỏi Một phương pháp điều khiển phi tuyến đơn giản nhưng mang lại chất lượng bền vững cao là phương pháp điều khiển trượt Tuy nhiên, tín hiệu điều khiển trong phương pháp này tạo ra hiện tượng dao động với tần

số cao Đây là một hiện tượng nguy hiểm và là nguyên nhân làm giảm tuổi thọ của thiết bị trong hệ thống Việc nghiên cứu để khắc phục hiện tượng này mang một ý nghĩa vô cùng quan trọng Bên cạnh đó, hệ bi – thanh là mô hình nghiên cứu phổ biến trong phòng thí nghiệm của các trường đại học [12-15] Tuy mô hình này có cấu tạo đơn giản nhưng đủ độ phức tạp về mặt động lực học Việc điều khiển ổn định vị trí hệ

bi – thanh sử dụng các phương pháp điều khiển đã đề xuất có thể giúp ta khảo sát, đánh giá được kết quả của các phương pháp điều khiển này, từ đó có thể mở rộng nghiên cứu cho các hệ thống thực có độ phi tuyến cao hơn như: ổn định hàng hóa khi vận chuyển trên tàu biển [16], góc bắn pháo trên xe tăng, tàu chiến [17], góc phóng cho tên lửa [18,19], cân bằng trong máy bay không người lái [20,21]

6 Cấu trúc luận văn

Luận văn được trình bày thành 4 chương:

Chương 1 giới thiệu về hệ bi – thanh, các dạng mô hình của hệ bi – thanh trong

phòng thí nghiệm và tổng quan về các công trình nghiên cứu liên quan từ các nguồn tài liệu trong cũng như ngoài nước

Chương 2 trình bày khái quát lý thuyết mô hình hóa đối tượng, các phương pháp

điều khiển được áp dụng để điều khiển hệ bi - thanh như: mạng nơ ron, điều khiển trượt, điều khiển trượt dùng mạng nơ ron, điều khiển trượt thích nghi dùng mạng nơ ron cho đối tượng phi tuyến

Chương 3 trình bày chi tiết về các bước xây dựng mô hình toán học cho hệ bi –

thanh Trên cơ sở lý thuyết về các phương pháp điều khiển ở chương 2, chương này

Trang 15

cũng trình bày các bước xây dựng bộ điều khiển trượt, điều khiển trượt dùng mạng nơ

ron, điều khiển trượt thích nghi dùng mạng nơ ron cho đối tượng hệ bi – thanh

Chương 4, chương này trình bày mô phỏng và đánh giá kết quả của các phương

pháp điều khiển sử dụng phần mềm Matlab – Simulink Đầu tiên, chúng ta khảo sát đáp ứng của hệ bi - thanh khi chưa có bộ điều khiển Kế tiếp, các bộ điều khiển đã xây dựng ở chương 3 được sử dụng để điều khiển ổn định vị trí hệ bi – thanh và đánh giá kết quả đạt được

Cuối cùng, luận văn được kết thúc bằng kết luận, các kiến nghị và đề xuất hướng phát triển tiếp theo của đề tài

Trang 16

Chương 1 TỔNG QUAN VỀ HỆ BI - THANH

1.1 Giới thiệu hệ bi - thanh

Cũng như hệ con lắc ngược, mô hình hệ bi – thanh thường dùng để thực nghiệm các bài toán điều khiển tự cân bằng Dựa theo cấu tạo và nguyên lý hoạt động thì hệ bi

- thanh có hai dạng cơ bản: mô hình hệ bi – thanh kiểu trục lệch và mô hình hệ bi – thanh kiểu trục giữa

1.1.1 Mô hình hệ bi – thanh kiểu trục lệch

Cấu tạo của hệ bi thanh kiểu trục lệch được mô tả trong Hình 1.1 Trong đó: L là chiều dài thanh, R là bán kính của bi, r là khoảng cách bi trên thanh so với khớp nối B,

ra là chiều dài cánh tay đòn và α là góc của thanh so với phương nằm ngang

Hình 1.1 Hệ thống bi – thanh kiểu trục lệch

Nguyên lý hoạt động của hệ này là: khi động cơ DC quay, thông qua con quay C làm cho khớp nối B di chuyển theo phương thẳng đứng Điều này làm thay đổi chiều cao của khớp nối B so với khớp nối A và thanh lệch với phương nằm ngang một góc α Nhờ tác dụng của trọng lực làm cho bi di chuyển trên thanh ở các khoảng cách r khác nhau, dựa vào góc quay của con quay C, chúng ta có thể điều khiển được vị trí của bi trên thanh Ưu điểm của hệ bi - thanh kiểu trục lệch là động cơ DC làm quay con quay

C có mô men nhỏ Nhược điểm của kiểu này là mô hình và thuật toán điều khiển phức tạp

1.1.2 Mô hình hệ bi – thanh kiểu trục giữa

Cấu tạo của hệ bi – thanh kiểu trục giữa được mô tả trong Hình 1.2 Trong đó r là khoảng cách của bi trên thanh so với điểm cân bằng ở giữa thanh và α là góc nghiêng của thanh so với phương nằm ngang

Bi

Trang 17

Hình 1.2 Hệ thống bi - thanh kiểu trục giữa

Nguyên lý hoạt động của hệ này như sau: khi động cơ DC quay làm cho thanh nghiêng so với phương nằm ngang một góc α Nhờ tác dụng của trọng lực làm cho bi lăn trên thanh ở các vị trí r khác nhau Dựa vào việc thay đổi góc quay của động cơ

DC có thể thay đổi được khoảng cách bi r theo vị trí mong muốn Ưu điểm của hệ bi – thanh kiểu trục giữa là dễ xây dựng mô hình và thuật toán điều khiển hơn so với hệ bi – thanh kiểu trục lệch Tuy nhiên, nhược điểm của dạng này là phải cần một động cơ

DC có mô men lớn để điều khiển góc quay

1.2 Các công trình nghiên cứu liên quan

1.2.1 Các công trình nghiên cứu trong nước

Ở nước ta, có các nghiên cứu của tác giả Trần Phương Nam năm 2008, Võ Văn Châu năm 2014 tại trường Đại học Giao Thông Vận Tải Thành Phố Hồ Chí Minh [1,2], Doãn Thế Công năm 2014 tại trường Đại học Kỹ Thuật Công Nghiệp - Đại học Thái Nguyên về hệ thống bi - thanh [3] Các tác giả đã xây dựng bộ điều khiển mờ, xây dựng bộ điều khiển mờ trượt - PD, sử dụng bộ điều khiển tối ưu (LQR), mô phỏng đối tượng với các bộ điều khiển đã thiết kế, thiết kế và chế tạo được mô hình thực nghiệm Tuy nhiên bên cạnh đó cũng tồn tại những nhược điểm như: thời gian đáp ứng chậm, yêu cầu bi phải có khối lượng nhẹ để hạn chế quán tính khi lăn trên thanh

1.2.2 Các công trình nghiên cứu ngoài nước

Năm 2007, Lon-Chen Hung và Hung-Yuan Chung đã nghiên cứu phương pháp điều khiển trượt - nơ ron phân ly (DNNSMC), bằng cách kết hợp lý thuyết điều khiển trượt và mạng nơ ron để điều khiển các mô hình: hệ bi - thanh, hệ con lắc đơn, hệ nêm ngược (Seesaw system) [12] Tác giả đã mô phỏng các đối tượng và phương pháp điều khiển DNNSMC trên phần mềm Matlab – Simulink Các kết quả cho thấy, thời gian đáp ứng của hệ thống còn chậm Tuy nhiên phương pháp điều khiển này đã khắc phục được hiện tượng dao động của phương pháp điều khiển trượt cổ điển Đồng thời cho thấy, chúng ta có khả năng kết hợp lý thuyết điều khiển trượt và mạng nơ ron để điều khiển các đối tượng có độ không ổn định và phi tuyến cao

Năm 2009, D Colon và I.S Diniz đã chế tạo mô hình hệ bi - thanh kiểu trục giữa như Hình 1.3 [13] Nhóm tác giả đã sử dụng thuật toán PID để điều khiển ổn định vị trí

bi sắt ở điểm cân bằng, tuy nhiên vẫn còn hạn chế là thời gian đáp ứng chậm, chưa

Động cơ DC

Thanh

Trang 18

điều khiển bi sắt bám theo tín hi

hệ bi – thanh để thực nghi

sinh viên tại các trường đ

Hình 1.3 Hệ thố

Năm 2012, nhóm tác gi

cứu và chế tạo hệ bi – thanh ki

các phương pháp điều khi

khiển PID-LQR cho hệ bi

vị trí cân bằng Tuy nhiên

theo tín hiệu đặt với vị trí bi thay

tác giả Y.H Chang, C.W Chang, C.W Tao,

pháp mờ - trượt để điều khi

-Trên đây là các bài báo chính y

giới về hệ bi – thanh Ngoài ra còn m

hiểu sâu hơn, độc giả có th

Động cơ DC

ám theo tín hiệu đặt Mục đích của nhóm tác gi

c nghiệm các bài toán điều khiển, dùng trong vi

ng đại học ở Brazil

ống bi - thanh của nhóm tác giả D Colon và I.S Diniz

m 2012, nhóm tác giả Mohammad Keshmiri và Ali Fellah Jahromi

thanh kiểu trục lệch như Hình 1.4 Nhóm

u khiển PID, LQR và kết hợp hai phương pháp này thành b

bi - thanh Các kết quả cho thấy rằng bi sắt

uy nhiên, đáp ứng của hệ vẫn còn chậm, chưa đitrí bi thay đổi theo thời gian [14] Cũng trong nY.H Chang, C.W Chang, C.W Tao, H.W Lin và J.S Taur

u khiển ổn định định vị trí hệ bi – thanh ki

t điều khiển mờ và điều khiển trượt, tạo thành phkhông cần xác định rõ các thông số của mô hình

nh bền vững trên thanh cân bằng, thời gian đ

ng chattering trong điều khiển trượt [15]

- thanh của nhóm tác giả Mohammad Keshmiri

Jahromi

ây là các bài báo chính yếu tổng hợp các công trình nghiên c

thanh Ngoài ra còn một số công trình nghiên cứu khác,

có thể tìm đọc trong các tài liệu tham khảo [24

Bi

Thanh

Bi Thanh

Động cơ DC

a nhóm tác giả chủ yếu là chế tạo

n, dùng trong việc giảng dạy cho

D Colon và I.S Diniz

Ali Fellah Jahromi đã nghiên

thanh kiểu trục giữa Bằng thành phương pháp điều

a mô hình Các kết quả

i gian đáp ứng nhanh, hạn

Mohammad Keshmiri và Ali Fellah

p các công trình nghiên cứu trên thế

u khác, để có thể tìm

o [24-28]

Thanh

Trang 20

Chương 2

MÔ HÌNH HÓA VÀ ĐIỀU KHIỂN HỆ THỐNG PHI TUYẾN

Để hình thành các giải thuật điều khiển cho hệ thống phi tuyến, việc lựa chọn phương pháp điều khiển và mô hình hóa đối tượng phi tuyến là rất quan trọng Chương này cung cấp cho ta cơ sở lý thuyết về mô hình hóa và điều khiển hệ thống phi tuyến,

từ đó đề xuất các phương pháp điều khiển để ổn định vị trí hệ bi – thanh

2.1 Mô hình hóa hệ thống phi tuyến

Mô hình hóa là phương pháp xây dựng mô hình toán của hệ thống bằng cách dựa vào các quy luật vật lý chi phối hoạt động của hệ thống Trong lĩnh vực điều khiển tự động, mô hình toán của một hệ thống thường được mô tả dưới dạng một hệ phương trình phi tuyến Để xây dựng hệ phương trình này, chúng ta thường sử dụng cơ học Lagrange, do nó có tính tổng quát khi tính đến những đại lượng vô hướng như động năng và thế năng Điều này giúp chúng ta giải quyết các vấn đề cơ học dễ dàng hơn so với việc phân tích các phương trình của Newton trong cơ học cổ điển Bên cạnh đó, khi điều kiện cho phép, người ta thường tìm cách chuyển thể gần đúng mô hình phi tuyến sang một mô hình tuyến tính xấp xỉ tương đương để dễ dàng hơn khi phân tích

và điều khiển Trong phần này, trình bày phương pháp xây dựng mô hình toán hệ thống phi tuyến bằng phương trình Euler-Lagrange và các bước để tuyến tính hóa một

hệ phi tuyến xung quanh điểm làm việc

Trang 21

2.1.2 Tuyến tính hóa hệ thống phi tuyến xung quanh điểm làm việc

Xét hệ phi tuyến bậc / có 0 ngõ vào, % ngõ ra mô tả bởi phương trình trạng thái

12&" = 32", 4"5" = ℎ72", 4"8.9 (2.6)Trong đó: 2" ∈ ;< là vector trạng thái,

2&" là đạo hàm theo thời gian của 2",

4" ∈ ;= là vector tín hiệu vào,

5" ∈ ;+ là vector tín hiệu ra,

3 ∈ ;<, ℎ ∈ ;+ là hàm mô tả đặc tính động của hệ phi tuyến

Điểm trạng thái 2> được gọi là điểm dừng của hệ phi tuyến nếu như hệ đang ở trạng thái 2> Với tác động điều khiển 4 cố định, không đổi cho trước thì hệ sẽ nằm nguyên tại trạng thái đó Nếu (2>, 4> là điểm dừng của hệ phi tuyến thì:

932",4"|@A@B,CACB = 0, điểm dừng còn được gọi là điểm làm việc tĩnh của hệ phi tuyến

Khai triển Taylor 32, 4 và ℎ2, 4 xung quanh điểm làm việc tĩnh (2>, 4> ta có thể mô tả hệ thống bằng phương tình trạng thái tuyến tính:

D2E&" = F2E" + G4E"

5E" = H2E" + I4E"9 (2.7)Trong đó: 2E" = 2" − 2>

N$3$2OO

VVV

@ B ,C B

Trang 22

G = 9$3$4K

@ B ,C B = 9

LMMMMMMM

N$3$4OO

VVV

@ B ,C B

H = 9$ℎ$2K

@B,C B = 9

LMMMMMMM

N$ℎ$2OO

VVV

@B,C B

I = 9$ℎ$4K

@ B ,C B = 9

LMMMMMMM

N$ℎ$4OO

VVV

@ B ,C B

2.2 Điều khiển hệ thống phi tuyến

Để phân tích và thiết kế bộ điều khiển cho hệ phi tuyến, hiện nay phương pháp Lyapunov là phương pháp được sử dụng rộng rãi nhất Phương pháp Lyapunov cung cấp điều kiện đủ để đánh giá tính ổn định của hệ phi tuyến, có thể áp dụng cho hệ phi tuyến bậc cao bất kỳ Do vậy có thể sử dụng phương pháp này để thiết kế các bộ điều khiển như: điều khiển mờ, điều khiển trượt, điều khiển dùng mạng nơ ron

2.2.1 Ổn định Lyapunov đối với hệ thống phi tuyến

Tiêu chuẩn ổn định thứ hai của Lyapunov (điều kiện đủ)

Xét hệ thống được mô tả bởi phương trình trạng thái: 2& = 32O,2 , 2W, 2X Trong

đó 2 ∈ ;< là vector trạng thái, 2& là đạo hàm theo thời gian của 2

Nếu tồn tại một hàm 2 với mọi biến trạng thái 2O, 2 , … … 2< là một hàm xác định dương, sao cho đạo hàm của nó YZ@

Y[ dựa theo phương trình vi phân của chuyển

Trang 23

động bị nhiễu cũng là hàm xác định dấu, song trái dấu với hàm 2 thì chuyển động không bị nhiễu sẽ ổn định tiệm cận

• 2 &2 < 0: Với mọi biến trạng thái 2', ^ = 1 ÷ / thì hệ thống ổn định tiệm cận

• 2 &2 = 0: Với mọi biến trạng thái 2', ^ = 1 ÷ / thì hệ thống ổn định

• 2 &2 > 0: Với mọi biến trạng thái 2', ^ = 1 ÷ / thì hệ thống không ổn định

với e là một ma trận xác định dương, 2d là ma trận chuyển vị của 2

Chọn hàm năng lượng 2 xác định dương:

trong đó, nếu ma trận S là ma trận vuông xác định dương thì &2 có dạng:

&2 = 2&dh2 + 2dh2& + 2dh&2

= F2dh2 + 2dhF2 + 2dh&2

= 2dFdh2 + 2dhF2 + 2dh&2

= 2d7Fdh + hF + h&82

(2.11)

Do 2 xác định dương, nên để hệ thống ổn định thì &2) phải là xác định âm

Ta chọn &2 = −2de2 (do Q là ma trận xác định dương nên &2 sẽ là xác định âm) Từ phương trình (2.10) ta có:

Điều kiện cần và đủ để trạng thái cân bằng 2 = 0 ổn định tiệm cận: cho trước bất

kỳ một ma trận xác định dương e và ma trận F ổn định, tồn tại một ma trận xác định dương h thỏa mãn phương trình:

Phương trình (2.13) được gọi là phương trình Lyapunov

Khi S không thay đổi theo thời gian h& = 0, ta có phương trình đại số Lyapunov

Với 2 = 2dh2 và &2 = 2de2 thì chỉ tiêu chất lượng b được tính như sau:

b = c 2f de2!" = 92dh2|gf = −2d∞h2∞ + 2dh20

Trang 24

Ta có 2∞ → 0, do đó:

2.2.2 Điều khiển trượt

2.2.2.1 Điều khiển trượt cơ bản

Xét hệ không dừng có tín hiệu vào 4 = 4O, … , 4kd, chứa thành phần bất định

!2, 4, ", mô tả bởi:

Trong đó 2 ∈ ;< là vector trạng thái, f (.) là vector các hàm liên tục và một mặt

cong trơn / × n chiều, thường được gọi là mặt trượt, mô tả bởi vector gồm n hàm trơn:

o2, " = poO2, ", o 2, ", … , ok2, "qd = 0 (2.17)Trong đó o2, " chứa tất cả các quỹ đạo trạng thái mong muốn x(t) của hệ (theo một

chỉ tiêu chất lượng cho trước) Mặt trượt (2.17) trên thường gặp ở dạng tổng quát, vì

nó có dạng không dừng (cấu trúc mặt trượt bị thay đổi theo thời gian)

Nhiều trường hợp, để đơn giản trong điều khiển sau này và khi điều kiện cho phép, người ta chỉ cần sử dụng mặt trượt dừng (có cấu trúc không biến đổi theo thời gian):

o2, " = poO2, o 2, … , ok2qd = 0 (2.18)

Nhiệm vụ của điều khiển trượt là phải xác định tín hiệu điều khiển u để đưa hệ

(2.16) tiến về mặt trượt (2.17) và giữ nó lại trên đó

Ký hiệu tín hiệu điều khiển cần tìm u đó là:

4 = D44>+ khi o2, " = 0

Trong đó: 4>+ là thành phần điều khiển giữ x(t) ở lại trên mặt trượt (equivalence

principle), tức là nếu đã có: o2g, "g = 0 với 2g = 2"g thì 4>+ sẽ tạo ra được:

o&2g, "g = 0 xℎ^ " ≥ 0 (2.20)Hình 2.1 minh họa vai trò của thành phần tín hiệu này đối với quỹ đạo trạng thái

x(t) của hệ, 4t là thành phần tín hiệu làm cho x(t) tiến về mặt trượt Như vậy, ở trường

hợp mặt trượt dừng (2.18), khi sử dụng hàm xác định dương: o = Oodo thì điều

kiện đủ để x(t) tiến về mặt trượt là tín hiệu điều khiển 4t phải tạo ra được:

&o = odo& < 0 xℎ^ o2 ≠ 0 (2.21)Điều kiện (2.21) này được gọi là điều kiện trượt và sử dụng với mặt trượt dừng (2.18) Khi đó các thành phần 4>+, 4t sẽ được xác định theo các bước sau đây:

Bước 1 - Điều khiển giữ trên mặt trượt

Khi hệ (2.14) là hệ rõ và có cấu trúc:

2& = 32, " + H2, "4, trong đó: H2, " = pℎO2, ", … , ℎk2, "q là ma trận / × n, và mặt trượt là mặt cong trơn dừng (2.18), thì từ điều kiện (2.20) ta có:

Trang 25

Bước 2 - Điều khiển tiến về mặt trượt

Từ điều kiện đủ (2.21) trên cho mặt trượt dừng (2.18) về sai lệch giá trị tín hiệu

Hình 2.1 Xác định tín hiệu điều khiển tiến về mặt trượt

Bởi vậy, giống như (2.22), người ta đã đi đến một giá trị sai lệch tín hiệu điều khiển ∆ cho hệ (2.16), ký hiệu chi tiết là:

∆= ∆O, ∆ , … , ∆<d (2.23)

với mặt trượt lý tưởng o2, " = o2 dạng vector hàm dừng, thỏa mãn:

$o

$2 {2, " = n "ậ/ đơ/ ị như sau:

- Bộ điều khiển chuyển mạch:

∆= −2o^/7o28, x = 1,2, … , n, trong đó 2 > 0, ∀2 và

o^/o = −1 xℎ^ o < 01 xℎ^ o > 0

- Bộ điều khiển phản hồi tuyến tính:

∆= −o2 với L = LT> 0 tùy chọn

- Bộ điều khiển vector đơn vị:

Trang 26

∆= −x|~@|~@ với k > 0 tùy chọn

Xử lý thành phần bất định đầu vào

Xét hệ (2.16) có cấu trúc chứa thành phần bất định d(x,u,t) ở đầu vào:

2& = 32, " + H2, "p4 + !2, 4, "q (2.25)

Trong đó: thành phần bất định d(x,u,t) có thể là độ rơ cơ khí của hệ, các thành phần ma

sát không xác định, các yếu tố môi trường ảnh hưởng như nhiệt độ, gió Thỏa mãn tính

bị chặn |!2, 4, "| ≤ 2, ", ∀4

Tương tự như ở hệ rõ, nhiệm vụ của điều khiển trượt ở đây là phải xác định được tín hiệu điều khiển (2.19) để đưa hệ về mặt trượt dừng (2.18) và giữ nó lại trên đó Thành phần 4>+ trong (2.19) được xác định với giả thiết !2, 4, " = 0 Như vậy

ta cũng sẽ có được 4>+ theo công thức (2.22)

Để xác định thành phần còn lại 4t = 4>+ + ∆ theo nguyên lý tương đương, ta làm như sau Trước tiên chọn một hàm o xác định dương Tiếp theo ta xác định ∆

Chẳng hạn như để có được chất lượng là ổn định tiệm cận toàn cục, mặt trượt

được chọn chỉ cần là một trong các mặt cong trơn, dừng s(x) trong không gian m chiều

Trang 27

- Phi tuyến

o2 = 2&O− 32O, 2 = 2O, 2 , 2O ∈ ℝk, (2.28)trong đó 32O là vector hàm n chiều, được chọn sao cho với nó luôn tồn tại hàm vô hướng, dừng 2O xác định dương thỏa mãn:

2O =$2$

O32O, xác định âm, tức là:

o2, " = 2&O− & + F2O−

có A là ma trận hằng, đối xứng xác định dương tùy chọn

Ở đây, ta cũng có thể chọn ma trận hàm F" thay vì ma trận hằng F và cũng không bắt buộc phải đối xứng Tuy nhiên ma trận hàm F" này phải hỏa mãn điều kiện là tất cả các giá trị riêng của:

F" + F"dđều nằm bên phải trục ảo (ma trận Hurwitz)

- Phi tuyến:

o2, " = 2&O− & − 32O− , "

= & − 3, " với = 2O− ,

trong đó 3, " là vector hàm mà với nó tồn tại hàm vô hướng trơn, không dừng

, " thỏa mãn các điều kiện theo định lý LaSalle là:

¡O|| ≤ , " ≤ ¡ ||

$

$" +$$ 3, " ≤ −¡W|| ớ^ ¡O, ¡ , ¡W ∈ ¢f Điều đặc biệt, nếu các mặt trượt (2.27), (2.28) có số chiều đúng bằng bậc mô hình là n thì bài toán điều khiển tiến về mặt trượt sẽ trở thành bài toán điều khiển bám theo mô hình mẫu

b) Điều kiện trượt

Điều kiện trượt là điều kiện đủ để tín hiệu điều khiển đưa quỹ đạo trạng thái x(t)

của hệ về được đến mặt trượt, chẳng hạn khi sử dụng mặt trượt dừng (2.18) thì một trong những điều kiện trượt là công thức (2.21) đã dẫn ra ở trên

Tuy nhiên điều kiện trượt (2.21) sẽ là không đủ khi sử dụng với mặt trượt không dừng s(x,t) = 0, vì ở các hàm không dừng, điều kiện &o, " → 0 chưa đủ để khẳng định o, " → 0, thậm chí là chưa đủ để khẳng định hàm o, " sẽ tiến đến hằng số

Ta có thể thấy điều đó ở ví dụ:

Trang 28

o", " = £" = sin ln"

thì mặc dù có:

&£" =cos ln"" → 0 xℎ^ " → ∞, song lại không có £" → hằng số Ngược lại, từ £" đã tiến tới hằng số ta cũng không thể suy ra được &£" → 0, chẳng hạn £" =Osin"

Lý do cho sự không tương đương ở trên là vì £" có thể là hàm không liên tục đều Bởi vậy, khi sử dụng mặt trượt dạng không dừng (2.17), ta phải xây dựng điều kiện trượt dựa trên định lý LaSalle Một trong những điều kiện trượt thường được sử dụng cho hệ phi tuyến bất định hàm dạng tổng quát chung (2.16), thỏa mãn điều kiện LaSalle, thay cho (2.21), là:

&£ = od§}~}[+}@}~32, 4, !, "¨ ≤ −©|o|, (2.30)trong đó: © > 0, x ∈ ℕ tùy chọn Từ điều kiện trượt (2.30) này, ta sẽ xác định được bộ

điều khiển phản hồi trạng thái u(x,t) cần tìm

Để thuận lợi cho việc sử dụng công thức (2.30) trên vào việc xây dựng bộ điều

khiển u(x,t), nhiều tài liệu đã đề xuất sử dụng:

cho trường hợp mặt trượt đơn và dừng, tức là s(x) là hàm vô hướng, sử dụng các mặt

trượt với cấu trúc:

trong đó ¬o là hàm tùy chọn thỏa mãn:

Để minh họa ý nghĩa của việc sử dụng điều kiện trượt (2.31) cho việc xây dựng

bộ điều khiển, ta xét bài toán điều khiển trượt cho hệ tuyến tính một đầu vào:

2& = F2 + ®4 với mặt trượt tuyến tính o2 = d2 ó d® ≠ 0 Khi đó từ gợi ý (2.33):

o& = −xOo − x o/o và o&2 = d2& = dF2 + ®4

Trang 29

2.2.2.2 Luật điều khiển trượt cổ điển cho hệ phi tuyến một đầu vào

Xét một hệ thống phi tuyến với biểu diễn trạng thái sau [4]:

Vấn đề đặt ra là xác định luật điều khiển u để đưa các quỹ đạo pha của hệ thống

về mặt trượt và duy trì trên mặt trượt một cách bền vững đối với các biến động của 3± và ±

Từ (2.31) chọn hàm: o = Oo Để hệ thống ổn định thì từ điều kiện trượt (2.21) ta có:

Đạo hàm mặt trượt o theo thời gian, từ (2.36) ta có:

o& = <<+ + ² + O& (2.38)

Từ (2.35) ta có: < = ±&<− < Chọn <= 1, (2.38) được viết lại như sau:

o& = 3± + ±4 + ! − <+ <O<O+ + ² + O& (2.39)

Để thỏa mãn bất đẳng thức (2.36) thì từ (2.32) ta chọn: o& = −xo/o Trong đó

x là hằng số dương Hay bộ điều khiển 4 được chọn như sau:

4 = −± 731 ± + <O<O+ ⋯ + ² + O& + xo^/o + ! − <8 (2.40)(2.40) được gọi là luật điều khiển trượt cổ điển Trong các ứng dụng điều khiển thực tế, bộ điều khiển trượt cổ điển thường có hai nhược điểm:

- Tín hiệu điều khiển tạo dao động với tần số cao xung quanh mặt trượt gây ra hiện tượng rung (chattering)

- Không xác định được chính xác các thông số của mô hình

Trang 30

2.2.3 Điều khiển dùng mạng nơ ron

Mạng nơ ron nhân tạo mô phỏng hoạt động của não người để giải quyết các bài toán kỹ thuật Bộ não người có khoảng 10Og nơ ron sinh học Các nơ ron này được kết

nối với nhau thành mạng Việc xử lý thông tin được thực hiện nhờ vào sự lan truyền của tín hiệu từ nơ ron này sang nơ ron khác thông qua các sợi trục thần kinh (axon) Mạng nơ ron nhân tạo được đặc trưng bởi ba yếu tố

− Phần tử xử lý (nơ ron),

− Cấu trúc và ghép nối của các phần tử xử lý,

− Phương pháp huấn luyện mạng

a) Nơ ron sinh học b) Nơ ron nhân tạo Hình 2.2 Nơ ron sinh học và nơ ron nhân tạo

Hình 2.2 mô tả nơ ron sinh học và nơ ron nhân tạo Mỗi nơ ron nhân tạo được đặc trưng bởi quan hệ giữa các tín hiệu vào 2O, 2 , ⋯ , 2k và tín hiệu ra 5

Một mạng nơ ron được mô tả:

/" = 32O, 2 , ⋯ , 2k − ´ (2.41)thì

Trang 32

2.2.3.3 Kiến trúc mạng nơ

Mạng nơ ron nhân t

thường được sắp xếp trong nhi

với một lớp đầu ra được mô t

nơ ron và các thông số đầ

của mạng nơ ron này là có

luật cập nhật trọng số cho các n

tạp thì nó không thể giải quy

ứng dụng để giải các bài toán

lớp hơn cũng có thể giải quy

Hình 2.4 Mạng truy

+ Mạng truyền thẳng nhi

của mạng truyền thẳng m

đầu vào và đầu ra còn có các l

đến tất cả các nơ ron của l

nơ ron của loại mạng này ph

mạng nơ ron này có thể

nhân tạo gồm nhiều nơ ron liên kết nối vớ

p trong nhiều lớp, được gọi là kiến trúc mạng

có nhiều lớp hay một lớp, trong đó các nơ ron

ng truyền thẳng và mạng hồi quy

ng: có hai dạng là mạng truyền thẳng một l

ng một lớp: đây là mô hình đơn giản nhất c

c mô tả như Hình 2.4 Trong lớp này có th

ầu vào sẽ được kết nối trực tiếp đến các nơ ron này là có cấu trúc đơn giản, xử lý tín hiệu nhanh

cho các nơ ron Tuy nhiên, đối với các bài toán phi tuy

i quyết được Mạng nơ ron truyền thẳng m

i các bài toán phân lớp nhị phân, đối với các bài toán phân thành nhi

i quyết bằng cách thêm nhiều nơ ron vào trong l

ng truyền thẳng 1 lớp (single layer feedforward network)

ng nhiều lớp: mô hình mạng truyền thẳng nhimột lớp được mô tả như Hình 2.5 Mô hình này ngoài các l

u ra còn có các lớp ẩn và mỗi nơ ron trong một lớp đư

a lớp tiếp theo Việc xây dựng luật cập nh

ng này phức tạp hơn so với mạng truyền thẳ giúp giải quyết tốt hơn các bài toán phi tuy như: nhận dạng hệ thống phi tuyến, nhận d

lý ngôn ngữ tự nhiên

ng truyền thẳng nhiều lớp (multi layer feedforward network)

ác nơ ron được sắp xếp trong một hay nhi

n trong nội tại các nơ ron hay với các nơ ron

ới nhau Các nơ ron ron có thể được kết nối

t lớp và mạng truyền

t của mạng nơ ron chỉ

p này có thể có một hoặc nhiều

n các nơ ron này Đặc điểm

p (single layer feedforward network)

ng nhiều lớp là cải tiến ình 2.5 Mô hình này ngoài các lớp

p được kết nối đầy đủ nhật trọng số cho các ẳng một lớp Vì loại

n các bài toán phi tuyến nên được ứng

n dạng hình ảnh, nhận

p (multi layer feedforward network)

t hay nhiều lớp và tín hiệu

ơ ron khác trong cùng

Trang 33

mạng Nhờ khả năng phả

để nhận dạng rất hiệu qu

nhiều bài toán kỹ thuật, nh

rõ thông số mô hình Tuy nhiên

mạng này khá phức tạp

Hình 2.6 Mạng h

Để dễ dàng hơn trong vi

đơn giản hóa bằng việc s

2.7 Tuy nhiên, dạng này ch

ản hồi để tự cải thiện chất lượng nên mạng này

u quả các hệ thống có độ phi tuyến cao Ứng d

t, nhất là các bài toán nhận dạng và điều khiTuy nhiên, để xây dựng luật cập nhật trọng s

ng hồi quy nhiều lớp (multi layer recurrent ne

n trong việc xây dựng các luật cập nhật trọng s

c sử dụng mạng hồi quy có cấu trúc nút đơ

ng này chỉ được sử dụng cho các bài toán có đ

Nút đơn hồi tiếp (single node with feedback to itself)

ng nơ ron

n luyện mạng là xác định các bộ trọng số cgiải quyết bài toán cụ thể Nếu quá trình hu, ta nói các nơ ron học có giám sát như Hình 2.8

Hình 2.8 Học có giám sát (supervised learning)

ng này được sử dụng

ng dụng để giải quyết

u khiển hệ thống không

ng số cho các nơ ron của

p (multi layer recurrent network)

ng số Chúng ta có thể đơn hồi tiếp như Hình

có độ phi tuyến không

p (single node with feedback to itself)

của các nơ ron trong

u quá trình huấn luyện có sử dụng

ình 2.8

có giám sát (supervised learning)

Trang 34

Nếu quá trình huấn luy

ron học không có giám sát

Hình 2.9 Học không có giám sát (unsupervised learning, self organizing)

Nếu quá trình huấn luy

! là tín hiệu nhiễu, |!"

Gọi ¿À p±YO ±

số pO ⋯ <q

± Đối với bài toán ổn đ

sai số như sau:

n luyện không sử dụng tín hiệu ra mong mu

c không có giám sát như Hình 2.9

c không có giám sát (unsupervised learning, self organizing)

n luyện không sử dụng tín hiệu ra mong muánh giá chất lượng của mạng, ta nói quá trình hnhư Hình 2.10

10 Học tăng cường (reinforcement learning)

u ra mong muốn, ta nói các nơ

c không có giám sát (unsupervised learning, self organizing)

u ra mong muốn nhưng có sử quá trình học của mạng là quá

ng (reinforcement learning)

ng thái sau [5]:

(2.50)

là tín hiệu điều khiển,

ng thái mong muốn, với vector sai

Y<qd phương trình trạng thái

(2.51)

Trang 35

Định nghĩa mặt trượt:

Với = pO ⋯ <q là vector các hệ số được chọn trước sao cho đa thức đặc trưng của (2.52) thỏa mãn điều kiện Hurwitz (có tất cả các nghiệm với phần thực âm) Kết quả là khi o = 0, tín hiệu sai lệch → 0 khi " → ∞

Viết lại mặt trượt:

o = OO+ + ⋯ + <O<O+ << = 0 (2.53)Luật điều khiển trượt gồm có 2 thành phần:

- Thành phần điều khiển tương đương 4>+ điều khiển sao cho quỹ đạo trạng thái duy trì trên mặt trượt o = 0 khi " ≥ 0

- Thành phần điều khiển hiệu chỉnh 4Á điều khiển sao cho quỹ đạo trạng thái tiến về mặt trượt

Lấy đạo hàm o ở phương trình (2.53) ta có:

o& = O&O+ & + ⋯ + <O&<O+ <&< = 0 (2.54)

Từ (2.51), (2.54), thành phần điều khiển tương đương được xác định bởi phương trình:

o& = OO+ + O + ⋯ + <+ <O<+ 4>+ + !" = 0

ta có thành phần điều khiển tương đương như sau:

Theo điều kiện (2.31) thành phần điều khiển hiệu chỉnh được chọn sao cho quỹ đạo trạng thái tiến về mặt trượt thì:

Khi o > 0, để giảm o thì o& < 0, điều kiện (2.56) thỏa mãn khi 4Á < 0

Khi o < 0, để tăng o thì o& > 0, điều kiện (2.56) thỏa mãn khi 4Á > 0

Căn cứ vào phân tích trên có thể chọn thành phần điều khiển hiệu chỉnh:

2.2.4.1 Mô hình điều khiển trượt dùng mạng nơ ron

Trong mô hình điều khiển trượt dạng này tín hiệu điều khiển trượt được phân chia như sau:

Ở lân cận mặt trượt thành phần điều khiển tương đương được thay thế bằng mạng noron NN1 hai lớp dùng để điều khiển các trạng thái bám trên mặt trượt, ngõ ra là 4Æ>+

4>+ = −OO− + O − ⋯ − <+ <O<− !" (2.55)

Trang 36

Ở vùng xa mặt trượ

mạng noron NN2 với tín hi

hướng các trạng thái tiến v

Mô hình điều khiển tr

Hình 2.11 Mô hình 2.2.4.2 Luật cập nhật thích nghi

ợt thành phần điều khiển hiệu chỉnh 4Á

i tín hiệu vào là sai số và tín hiệu ra là 4

n về mặt trượt

n trượt dùng mạng nơ ron được trình bày nh

Mô hình điều khiển trượt dùng mạng nơ ron

ÈÉkqd là vectơ trọng số của nơ ron

qd là vectơ trọng số của nơ ron thứ Í lớp ẩn,Ë4" là vectơ ngõ ra của nơ ron ở ngõ ra ra

ng noron NN1 dùng làm thành phần điều khiển t

được thay thế bằng 4ÆÁ được sử dụng để

Trang 37

Với ^ 1 ÷ / và Í 1 ÷ /, dựa vào cấu trúc mạng nơ ron ta có các thông số của mạng như sau:

Trang 38

Đạo hàm riêng theo 2 của phương trình (2.65) ta được:

có luật cập nhật trọng số cho các nơ ron ở lớp ẩn:

∆È±'¸ =14 ∙ Ï ∙ 74>+ − 4Æ>+8 ∙ Â4 ∙ p1 − Ë/" q ∙ È¸ ∙ §1 − 7Ç/"¸8 ¨ ∙ Ì' = 14 ∙ Ï ∙o ∙ Â4 ∙ p1 − Ë/" q ∙ È¸ ∙ §1 − 7Ç/"¸8 ¨ ∙ Ì' (2.78)

b) Mạng noron NN2 dùng làm thành phần điều khiển hiệu chỉnh

Xét mạng truyền thẳng có cấu trúc như Hình 2.13 gồm có: 1 nơ ron, =pO … <qd là vectơ ngõ vào, = pO … <qd là vectơ trọng số ngõ

vào, K là vector trọng số ngõ ra, là hàm sigmoid lưỡng cực, 4ÆÁ là ngõ ra của mạng [9]

Trang 39

Hình 2.13 Mạng noron NN2 dùng làm thành phần điều khiển hiệu chỉnh

Định nghĩa hàm năng lượng:

Trong đó Ï là hằng số học, ∆Â là trọng số cập nhật ở ngõ ra, ∆' là trọng số cập nhật

ở ngõ vào, ^ = 1 ÷ / Từ phương trình (2.79) ta có luật cập nhật trọng số ở ngõ ra:

∆Â = −Ï ∙$Â = −Ï ∙$b $o$b$Â = −Ï ∙ o ∙$o $Â$o (2.82)

Từ các phương trình (2.51), (2.54), (2.58) ta có:

o = OO+ + ⋯ + <O<O− ±Y<

+ c O±O+ ⋯ + <±< − OO− + O − ⋯ − <+ <O<+ Â ∙ o!" Lấy đạo hàm phương trình (2.83) theo K:

∆Â = −Ï ∙ o ∙ c o!"[

g

(2.85)Tương tự từ phương trình (2.81) ta có luật cập nhật cho trọng số ở ngõ vào mạng nơ ron NN2:

∆' = −Ï ∙$$b

' = −Ï ∙$b$o ∙$$o

' = −Ï ∙ o ∙$$o

Trang 40

Trong đó: $o

$' $ ∑ $''' ' (2.87)Thay (2.79) vào (2.78) ta được:

2.2.5 Điều khiển trượt thích nghi dùng mạng nơ ron cho đối tượng phi tuyến

Mô hình đối tượng và các định nghĩa về hệ thống như đã mô tả ở Mục 2.2.4 Xét một mạng nơ ron 3t dùng làm bộ điều khiển dạng truyền thẳng q lớp có

phương trình biểu diễn tổng quát [5]

Trong đó Î là vectơ ngõ vào, È là vectơ trọng số của mạng Các trọng số của

mạng được khởi tạo giá trị ban đầu nhỏ Các giá trị này sẽ được cập nhật theo lý thuyết điều khiển trượt, sao cho o → 0, khi " → ∞

Định nghĩa hàm Lyapunov:

trong đó: Õ là hắng số, o là mặt trượt được mô tả như Hình 2.14

Điều kiện để o → 0, khi " → ∞ là:

& = Õo& + oÕo² + o& < 0, (2.91)với o& là đạo hàm của o theo thời gian

Hình 2.14 Mô hình điều khiển trượt thích nghi dùng mạng nơ ron

Từ phương trình (2.38) ta có:

o = c 73± + [ <O<O+ ⋯ + ² + O& + ! − <+ ±48

(2.92)Lấy đạo hàm bậc 2 của mặt trượt o ta có:

o² = !o&!" = $4$o&$· ·& = $4 ±$· ·&$4 (2.93)

Định dạng
Số trang	82
Dung lượng	4,68 MB