Bài viết này đưa ra bộ điều khiển bền vững thích nghi mạng nơron cho robot công nghiệp để cải thiện độ chính xác cao của điều khiển bám. Để giả quyết các kiến thức chưa biết của hệ thống robot, bộ điều khiển ARNNs được sử dụng để xấp xỉ động lực học chưa biết mà không yêu cầu kiến thức trước đó.
Trang 1Thiết kế bộ điều khiển thích nghi trượt bền vững sử dụng
mạng nơron cho robot công nghiệp
Design a robust adaptive sliding mode controller using neural
network for industrial robot manipulator
Vũ Thị Yến 1, 2 , Nguyễn Hữu Quảng 1 , Lê Đức Thân 3
Email: havi2203@gmail.com
1
Trường Đại học Sao Đỏ, Việt Nam
2
Trường Đại học Hồ Nam, Trung Quốc
3
Trường Đại học Tài chính - Quản trị kinh doanh
Ngày nhận bài: 6/9/2018 Ngày nhận bài sửa sau phản biện: 22/12/2018
Ngày chấp nhận đăng: 27/12/2018
Tóm tắt
Bài báo này đưa ra bộ điều khiển bền vững thích nghi mạng nơron cho robot công nghiệp để cải thiện
độ chính xác cao của điều khiển bám Để giả quyết các kiến thức chưa biết của hệ thống robot, bộ điều khiển ARNNs được sử dụng để xấp xỉ động lực học chưa biết mà không yêu cầu kiến thức trước đó Ngoài ra, bộ điều khiển trượt SMC được xây dựng để tối ưu các tham số vectơ, bù sai lệch xấp xỉ Tất
cả các tham số của bộ điều khiển đưa ra được xác định bằng thuyết ổn định Lyapunov Vì thế, khả năng
ổn định, bền vững và hiệu quả bám yêu cầu của ARNNs cho IRMs được đảm bảo Hơn thế nữa, mô phỏng được thực hiện trên robot ba bậc tự do đưa ra so sánh với bộ điều khiển PID và bộ điều khiển
mờ thích nghi (AF) để chứng minh tính bền vững và hiệu quả của bộ điều khiển ARNNs
Từ khóa: Điều khiển trượt; mạng nơron; điều khiển thích nghi bền vững; robot công nghiệp.
Abstract
This paper proposed an adaptive robust neural networks (ARNNs) control for industrial robot manipulators
to improve high accuracy of the tracking control In order to deal with the unknown knowledge of the robot system problems, the ARNNs are used to approximate the unknown dynamics without the requirement of prior knowledge In addition, the robust SMC is constructed to optimize parameter vectors, compensate the approximation error All the parameters of the proposed control system are determined by Lyapunov stability theorem Therefore, the stability, robustness and desired tracking performance of ARNNs for IRMs are guaranteed Moreover, the simulations performed on three-link IRMs are proposed in comparison with proportional integral differential (PID) and adaptive Fuzzy (AF) control to prove the robustness and efficiency of the ARNNs
Keywords: Sliding mode control; neural networks; robust adaptive control; robot industrial manipulator.
Chữ viết tắt:
SMC: Sliding Mode Control (Điều khiển trượt)
ARNNs: Adaptive Robust Neural Networks (Điều khiển thích nghi bền vững mạng nơron)
PID: Proportional Integral Derivative (Điều khiển khuếch đại tích phân vi phân)
AF: Adaptive Fuzzy (Điều khiển mờ thích nghi)
1 GIỚI THIỆU CHUNG
Ngày nay, với sự phát triển của công nghiệp 4.0 và
các dây chuyền sản xuất thông minh, robot công
nghiệp đóng một vai trò to lớn Tuy nhiên, robot
công nghiệp là một đối tượng phi tuyến nhiều biến vào ra Trong quá trình làm việc, robot công nghiệp chịu tác động của nhiều yếu tố như tín hiệu nhiễu, sự thay đổi của trọng lượng tải, ma sát phi tuyến,… Do đó để thiết kế một bộ điều khiển phù hợp là một thách thức lớn cần được giải quyết
Để giải quyết thách thức đó, đã có rất nhiều bộ điều khiển đã được nghiên cứu và đưa ra như bộ
Người phản biện: 1 PGS.TS Trần Vệ Quốc
2 TS Đỗ Văn Đỉnh
Trang 2điều khiển PID, bộ điều khiển thích nghi, bộ điều
khiển trượt, được đưa ra trong các tài liệu
[1-4] Trong những thập kỷ trước, xấp xỉ tín hiệu phi
tuyến sử dụng bộ điều khiển trượt đã được quan
tâm [3-5] Đặc điểm cốt lõi của phương pháp điều
khiển trượt là khả năng đảm bảo tính bền vững
và ổn định cho hệ thống điều khiển, tuy nhiên một
khó khăn chính trong việc thiết kế bộ điều khiển
trượt là tất cả các thông số giới hạn trên và giới
hạn dưới của các thông số không xác định phải
được xác định trước khi thiết kế bộ điều khiển Do
đó, đối với các hệ thống điều khiển có nhiều tham
số không xác định thì việc thiết kế hệ thống điều
khiển trượt trở nên phức tạp Để giải quyết khó
khăn này, các bộ điều khiển thông minh trên cơ
sở của logic mờ được đưa ra [6-8] Trong [7], tác
giả đưa ra bộ điều khiển mờ thích nghi điều khiển
cho hệ thống phi tuyến Ở đây, nhóm tác giả sử
dụng bộ điều khiển mờ để xấp xỉ thành phần chưa
biết của hệ thống điều khiển phi tuyến Bộ điều
khiển này đã đảm bảo được khả năng ổn định và
bền vững cho hệ thống điều khiển trong phạm vi
giới hạn đưa ra Tuy nhiên, trong tất các bộ điều
khiển được thiết kế dựa trên cơ sở của logic mờ,
các luật điều khiển được xây dựng dựa trên kinh
nghiệm của người thiết kế, do đó với những kinh
nghiệm đó nhiều khi không đủ và khó để xây dựng
luật điều khiển phù hợp Để giải quyết vấn đề này,
trong bài báo này đã đưa ra bộ điều khiển bền
vững thích nghi dựa trên cơ sở của bộ điều khiển
nơron (ARNNs) Bằng việc kế thừa các thuận lợi
của bộ điều khiển nơron đó là khả năng học online
các luật trong quá trình bộ điều khiển làm việc, do
đó khi áp dụng bộ điều khiển này vào điều khiển
robot công nghiệp thì hiệu quả bám, tốc độ hội tụ
đã được cải thiện đáng kể
Cấu trúc bài báo gồm 7 phần: phần 1 là giới thiệu
chung, động lực học của robot được đưa ra trong
phần 2, phần 3 là xây dựng cấu trúc bộ điều khiển
NNs, phần 4 là thiết kế bộ điều khiển ARNNs,
chứng minh tính ổn định của hệ thống được đưa
ra trong phần 5, phần 6 là mô phỏng và cuối cùng
là phần kết luận
2 ĐỘNG LỰC HỌC ROBOT
Xét phương trình động lực học của robot người
máy ba bậc tự do được đưa ra trong hình 1:
sử dụng bộ điều khiển trượt đã được quan tâm
[3- 5] Đặc điểm cốt lõi của phương pháp điều
khiển trượt là khả năng đảm bảo tính bền vững
và ổn định cho hệ thống điều khiển tuy nhiên
một khó khăn chính trong việc thiết kế bộ điều
khiển trượt là tất cả các thông số giới hạn trên
và giới hạn dưới của các của các thông số
không xác định phải được xác định trước khi
thiết kế bộ điều khiển Do đó đối với các hệ
thống điều khiển có nhiều tham số không xác
định thì việc thiết kế hệ thống điều khiển trượt
trở nên phức tạp Để giải quyết khó khăn này,
các bộ điều khiển thông minh trên cơ sở của
logic mờ được đưa ra [6- 8] Trong [7], tác giả
đưa ra bộ điều khiển mờ thích nghi điều khiển
cho hệ thống phi tuyến Ở đây, nhóm tác giả sử
dụng bộ điều khiển mờ để xấp xỉ thành phần
chưa biết của hệ thống điều khiển phi tuyến
Bộ điều khiển này đã đảm bảo được khả năng
ổn định và bền vững cho hệ thống điều khiển
trong phạm vi giới hạn đưa ra Tuy nhiên trong
tất các bộ điều khiển được thiết kế dựa trên cơ
sở của logic mờ, các luật điều khiển được xây
dựng dựa trên kinh nghiệm của người thiết kế
do đó với những kinh nghiệm đó nhiều khi
không đủ và khó để xây dựng luật điều khiển
phù hợp Để giả quyết vấn đề này, trong bài
báo này đã đưa ra bộ điều khiển bền vững
thích nghi dựa trên cơ sở của bộ điều khiển nơ
rôn (ARNNs) Bằng việc kế thừa các thuận lợi
của bộ điều khiển nơ rôn đó là khả năng học
online các luật trong quá trình bộ điều khiển
làm việc, do đó khi áp dụng bộ điều khiển này
vào điều khiển robot công nghiệp thì hiệu quả
bám, tốc độ hội tụ đã được cải thiện đáng kể
Cấu trúc bài báo gồm 7 phần: phần 1 là giới
thiệu chung, động lực học của robot được đưa
ra trong phần 2, phần 3 đi xây dựng cấu trúc bộ
điều khiển NNs, phần 4 đi thiết kế bộ điều khiển
ARNNs , chứng minh tính ổn định của hệ thống
được đưa ra trong phần 5, phần 6 là mô phỏng
cuối cùng là phần kết luận
2 ĐỘNG LỰC HỌC ROBOT
Xét phương trình động lực học của robot người
máy 3 bậc tự do được đưa ra trong hình 1:
M C G
Ở đây (𝜃𝜃, 𝜃𝜃̇, 𝜃𝜃̈) ∈ 𝑅𝑅𝑛𝑛×1 là vị trí, vận tốc và gia
tốc của robot 𝑀𝑀(𝜃𝜃) ∈ 𝑅𝑅𝑛𝑛 × 𝑛𝑛 là ma trận khối lượng suy rộng 𝐶𝐶(𝜃𝜃, 𝜃𝜃̇) ∈ 𝑅𝑅𝑛𝑛 𝑥𝑥 𝑛𝑛 là ma trận ly tâm và Coriolis 𝐺𝐺(𝜃𝜃) ∈ 𝑅𝑅𝑛𝑛×1 là một vectơ mô tả thành phần trọng lượng, 𝜏𝜏 ∈ 𝑅𝑅𝑛𝑛×1 là mômen điều khiển
Để thiết kế bộ điều khiển chúng ta đưa ra một
số tính chất cho (1) như sau:
Tính chất 1: Ma trận khối lượng suy rộng
M là một ma trận đối xứng và xác
định dương
Ở đây 𝑚𝑚0> 0 và 𝑚𝑚0∈ 𝑅𝑅
Tính chất 2: 𝑀𝑀̇(𝜃𝜃) − 2𝐶𝐶(𝜃𝜃, 𝜃𝜃̇) là ma trận đối
xứng lệch cho vectơ 𝑥𝑥 bất kỳ:
x M T – 2C , x 0 (2)
Tính chất 3: 𝐶𝐶(𝜃𝜃, 𝜃𝜃̇)𝜃𝜃̇ được giới hạn theo:
Ở đây 𝐶𝐶𝑘𝑘 là hằng số dương
3 BỘ ĐIỀU KHIỂN NƠRON
Bộ điều khiển NNs có cấu trúc như hình 2 gồm
có ba lớp:
- Lớp 1 là lớp đầu vào (input layer): gồm các biến đầu vào 1, 2, , 𝑛𝑛,
- Lớp 2 là lớp ẩn (the hidden layer): đầu ra của lớp ẩn được tính toán theo công thức sau:
h s j( ) exp[ ( s b j) / (2 )], 2 d2j j 1 , , m (4) trong đó: 𝑚𝑚 là số nơron lớp ẩn và
1, , 𝑛𝑛 là vectơ trung tâm của mạn ; là độ lệch chuẩn của hàm xuyên tâm thứ , [ , , ] ; là hàm Gaussian của mạng
Hình 1 Robot ba bậc tự do
X 0
0 0
Z 0
Z 1
0 1
X 1
0 2 X 2
Z 2
X 3
0 3
Z 3
l 1
l 2
l 3
Trang 3- Lớp 3 là lớp đầu ra (output layer), đầu ra
của mạng nơron được tính toán như sau :
1
( ) m W , ,d , 1, ,
ở đây: là trọng số kết nối giữa nơron lớp ẩn
thứ và nơron đầu ra thứ , là số đầu vào
Sau đây, chúng ta sử dụng bộ điều khiển NNs
này giống như một xấp xỉ trong bộ điều khiển
đã được thiết kế Khi đó sẽ tồn tại một hàm
NNs tối ưu với các tham số tối ưu như sau:
f s W*T h s (6)
trong đó: h h h 1, , ,2 h mT; W*là giá trị trọng
số tối ưu; và là vectơ sai lệch xấp xỉ
Giả thiết: Sai lệch xấp xỉ được giới hạn:
*
0
Ở đây: 0 là giá trị thực dương
Đầu ra của bộ điều khiển NNs là giá trị xấp xỉ
và được tính theo công thức sau:
f s W h s t b dˆ ˆT , , , (8)
trong đó: ̂, ̂, ̂, ̂ là giá trị xấp xỉ của
, , ,
WˆT W , W , , Wˆ1T ˆ2T ˆT
m
4 THIẾT KẾ BỘ ĐIỀU KHIỂN ARNNs
Mục đích thiết kế bộ điều khiển để khi robot
dưới sự tác động của lực 𝜏𝜏 thì sai lệch bám
giữa vị trí mong muốn của các khớp 𝜃𝜃 với
vectơ vị trí thực tế của robot 𝜃𝜃 có thể được hội
tụ về 0 khi Cấu trúc của bộ điều khiển
robot được thiết kế như hình 3
( ), ̇( ) tương ứng là sai lệch vị trí và sai lệch vận tốc Luật thích nghi sẽ được xác định như sau:
e t d (9)
s t e e (10)
ở đây: y ( 1, 2, , 𝑛𝑛) là ma trận khuếch đại hằng số dương
Từ công thức (1) có thể viết lại như sau : 𝑀𝑀(𝜃𝜃) (𝜃𝜃̈ − ̈) 𝐶𝐶(𝜃𝜃, 𝜃𝜃̇)·(𝜃𝜃̇ − ̇) 𝐺𝐺(𝜃𝜃) 𝜏𝜏 𝑀𝑀(𝜃𝜃) (𝜃𝜃̈ ̇ − ̇) 𝐶𝐶(𝜃𝜃, 𝜃𝜃̇) (𝜃𝜃̇ − ) 𝐺𝐺(𝜃𝜃) 𝜏𝜏
(11)
ở đây: 𝑀𝑀(𝜃𝜃) (𝜃𝜃̈ ̇) 𝐶𝐶(𝜃𝜃, 𝜃𝜃̇) (𝜃𝜃̇ ) 𝐺𝐺(𝜃𝜃)
Từ sơ đồ cấu trúc hệ thống điều khiển robot hình 3 ta có:
fˆ smcPI (13) trong đó: ̂ là tín hiệu đầu ra của bộ điều khiển ARNNs; 𝜏𝜏 là bộ điều khiển trượt (SMC); và
𝜏𝜏 là bộ điều khiển khuếch đại tích phân
Bộ điều khiển trượt được thiết kế như sau:
sgn
4 4b 4d
s
ở đây k s được chọ n: k s 0
Bộ điều khiển khuếch đại tích phân được tính toán như sau:
0
t
Thay (14) vào (13) ta thu được:
Ms f C ss mcPI 0 (16)
Để hệ thống làm việc ổn định, việc chọn luật học thích nghi của bộ điều khiển ARNNs rất quan trọng và trong bài báo này luật học sẽ được chọn như sau:
W=- W
T
b
d
k s k hs
b k b s
d k d s
𝑠𝑠
𝑓𝑓𝑚𝑚
𝑊𝑊1
Input layer
Hidden layer
Output layer
∑
𝑚𝑚
Hình 2 Cấu trúc của NNs
Trang 45 CHỨNG MINH TÍNH ỔN ĐỊNH CỦA HỆ THỐNG
Xét robot ba bậc tự do có phương trình động
học như phương trình (1) và bộ điều khiển
ARNNs có luật thích nghi như công thức (18)
Phân tích tính ổn định của hệ thống theo thuyết
Lyapunov
Xét hàm Lyapunov có phương trình như sau:
T
T
I
V t s Ms sdt k sdt
tr W W tr b kb tr d d
(18)
Đạo hàm bậc nhất ( ) theo thời gian ta thu
được phương trình như sau:
1 0
W
ˆ
1
2
ˆ
W ˆ
W
t
I
T
V t s Ms s Ms s k sdt tr k
tr k b b tr k d d
(19)
Thay (17) vào (20) ta có:
W
0 1
b
1
1
2
ˆ
t
PI
T
V t s Ms C s s s k sdt
tr k s tr k b b
tr
h
k d d s
(20)
Sử dụng tính chất 2 và thay luật thích nghi (18) vào (21) ta có:
0 0
ˆ
W W
T PI
t
V t s s s k sdt tr
tr b b tr d d s
s
(21)
Bằng việc sử dụng kết quả:
( ̃ ̂ ) ‖ ̃ ‖ − ‖ ̃‖2, ( ̃ ̂)
‖ ̃‖ − ‖ ̃‖2, ( ̃ ̂) ‖ ̃‖ − ‖ ̃‖2
và công thức (15), (16) ta thu được:
W
2 2
2
T
d
b
k k k s
s
s k
b
b d
0 2 2
2
d
b
k
k d
k
T
P
Do đó ̇( ) 0
Từ kết quả cho thấy hệ thống được ổn định
ARNNs
𝑠𝑠(𝑡𝑡) 𝑒𝑒̇ 𝜆𝜆𝑒𝑒
Ŵ̇M −𝑘𝑘𝑊𝑊
𝑏𝑏̂̇
𝑑𝑑̂̇
Update Laws
SMC robust term
𝑘𝑘𝑃𝑃
d/dt
𝑓𝑓̂(𝑥𝑥)
𝜏𝜏𝑠𝑠𝑠𝑠𝑠𝑠 𝜏𝜏 + −
𝑒𝑒
𝜆𝜆
𝑘𝑘𝐼𝐼
𝜏𝜏𝑃𝑃𝐼𝐼
𝜃𝜃̇𝑑𝑑
𝑠𝑠
𝑑𝑑𝑡𝑡𝑡𝑡
0
𝑘𝑘𝑠𝑠
Robot manipulator
Hình 3 Cấu trúc hệ thống điều khiển robot công nghiệp
Trang 56 KẾT QUẢ MÔ PHỎNG
Trong phần này chúng ta mô phỏng hệ thống điều
khiển cho robot công nghiệp ba bậc tự do như
hình 4
Hình 4 Robot ba bậc tự do
Phương trình động học của robot như sau:
trong đó:
ở đây: là khối lượng của khớp 1, khớp 2
và khớp 3 tương ứng là chiều dài của khớp 1, khớp 2 và khớp 3 tương ứng;
là giá trị của gia tốc trọng trường vị trí của khớp 1, khớp 2 và khớp 3 Chọn giá trị của
vị trí mẫu cho khớp 1, khớp 2 và khớp 3
Khối lượng và chiều dài của các khớp lần lượt là:
Chọn các tham số của bộ điều khiển khi mô phỏng:
Hình 5 Vị trí, sai lệch bám của robot
Trang 6Bảng 1 So sánh hiệu quả bám của bộ điều khiển đưa ra với bộ điều khiển AF và PID
Nhận xét: Từ kết quả mô phỏng hình 5 và bảng 1,
chúng ta có thể thấy rằng tính ổn định và bền vững
của cả ba bộ điều khiển bền vững thích nghi nơron
(ARNNs), thích nghi mờ (AF) và bộ điều khiển
khuếch đại vi tích phân (PID) đủ đảm bảo Tuy
nhiên, bộ điều khiển ARNNs hội tụ nhanh hơn thời
gian quá độ ngắn hơn và sai lệch nhỏ hơn so với
hai bộ điều khiển AF và PID Hơn thế nữa ở hình
6 chúng ta dễ dàng nhận thấy mômen điều khiển của bộ điều khiển ARNNs cũng nhỏ hơn mômen điều khiển của bộ điều khiển AF và PID Từ kết quả này chứng minh rằng bộ điều khiển ARNNs
có khả năng điều khiển tốt hơn và cải thiện đáng
kể khả năng bám của cánh tay robot so với bộ điều khiển AF và PID
Hình 6 Mômen điều khiển của robot
7 KẾT LUẬN
Trong bài báo này, bộ điều khiển thích nghi bền
vững điều khiển cho robot ba bậc tự do trên cơ sở
sử dụng bộ điều khiển nơron đã đảm bảo được
khả năng ổn định và bền vững trong môi trường
làm việc khác nhau Bằng việc sử dụng thuyết ổn
định Lyapunov, nhóm tác giả đã chứng minh được
hệ thống luôn luôn ổn định trên toàn vùng làm việc
Hơn thế nữa, hiệu quả của bộ điều khiển cũng
được chứng minh thông qua kết quả mô phỏng và
kết quả so sánh giữa bộ điều khiển đưa ra, bộ điều
khiển PID và bộ điều khiển mờ thích nghi (AF) Kết
quả mô phỏng cho chúng ta thấy rằng tốc độ hội
tụ, khả năng bám và sai lệch bám của bộ điều
khiển đưa ra tốt hơn bộ điều khiển PID và bộ điều
tục nghiên cứu để đưa vào thực nghiệm cũng như được ứng dụng vào thực tế
TÀI LIỆU THAM KHẢO
[1] Jafarov, E.M., Parlakçı, M.N.A., and Istefanopulos Y
(2005) A New Variable Structure PID-Controller
Design for Robot Manipulators IEEE Trans on
control systems technology 13 (1), pp 122-130 [2] Al- Qahtani H.M., Mohammed, Amin A., Sunar,
M (2017) Dynamics and control of a robotic arm
having four links Arabian journal for Science and
Engineering 42(5), pp 1841-1852.
[3] Man, Z., and Palaniswami, M (1993) A variable
structure model reference adaptive control for
Trang 7[4] Sabanovic, A (2011) Variable structure systems
with sliding modes in motion control - A Survey
IEEE Trans Ind Electron 7 (2), pp 212-223.
[5] Li, K., Wen, R (2017) Robust Control of a Walking
Robot System and Controller Design Procedia
Engineering 174, pp 947–955.
[6] Chen, Y., Wang, K., Zhai, L., Gao, J (2017)
Feedforward fuzzy trajectory compensator with
robust adaptive observer at input trajectory level
for uncertainmulti-link robot manipulators Journal
of the Franklin institute 000, pp 1-30.
[7] Ghavidel, H.F., Kalat, A.A (2017) Robust composite
adaptive fuzzy identification control of uncertain MIMO nonlinear systems in the presence of input saturation Arab J Sci Engs DOI 10.1007/
s13369-017-2552-9.
[8] Londhe, P.S., Singh,Y., Santhakumar, M., Patre,
B.M., Waghmare, L.M (2016) Robust nonlinear
PID-like fuzzy logic control of a planar parallel (2PRP-PPR) manipulator ISA Transactions 63,
pp 218-232.