MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ BỘ ĐIỀU KHIỂN Some various approaches to controller design Nguyễn Duy Cương 1 , Đào Bá Phong, Phan Xuân Minh 2 1 Đại học Kỹ thuật Công nghiệp Thái Nguyên 2 Đ
Trang 1MỘT SỐ PHƯƠNG PHÁP THIẾT KẾ BỘ ĐIỀU KHIỂN
Some various approaches to controller design Nguyễn Duy Cương 1 , Đào Bá Phong, Phan Xuân Minh 2
1 Đại học Kỹ thuật Công nghiệp Thái Nguyên 2 Đại học Bách khoa Hà Nội
TÓM TẮT
Bài báo này giới thiệu và đánh giá một số phương pháp thiết kế bộ điều khiển cho hệ
tuyến tính và phi tuyến như PID, LQG, bộ điều khiển thích nghi tham chiếu theo mô
hình mẫu MRAS (Model Reference Adaptive Systems) và bộ điều khiển learning
feed-forward dựa trên mạng nơron Kết quả của các phương pháp thiết kế được mô
phỏng trên phần mềm 20-Sim và kiểm chứng trên mô hình thực nghiệm MeDe5
ABSTRACT
This paper presents and evaluates some various design types of controller for both
linear and nonlinear system such as PID, LQG, MRAS (Model Reference Adaptive
Systems) and Learning Feed-forward Controller based on neural networks The
results of design methods are simulated by 20-Sim software and tested on
experiment model MeDe5
1 GIỚI THIỆU
Với mục đích cần có một mô hình thực
nghiệm để kiểm chứng các kết quả thiết kế
bộ điều khiển cho hệ thống tuyến tính và phi
tuyến, nhóm kỹ thuật điều khiển tại Khoa
Điện, Trường Twente, Hà Lan đã thiết kế và
chế tạo mô hình MeDe5 (The Mechatronic
Demonstration Setup - 2005) vào năm 2005
[1] Kết cấu cơ khí được thiết kế dựa trên
nguyên lý của công nghệ in, ụ trượt có thể
chuyển động tiến và lùi một cách linh hoạt
nhờ sự dẫn động của động cơ điện một chiều
thông qua dây curoa Trong mô hình thực
nghiệm này, người thiết kế đã bố trí toàn bộ
động cơ điện, thanh trượt, ụ trượt, dây
curoa,… trên một cái khung dẻo với mục
đích để tạo ra sự rung lắc khi ụ trượt di
chuyển Hệ thống điều khiển có sự tham gia
của máy tính, phần mềm 20-sim cung cấp
môi trường mô hình hoá và mô phỏng cho
hệ thống [1,8] Mục tiêu của chúng tôi là
thiết kế được những thuật toán điều khiển tốt
để giúp cho quá trình gia tốc, giảm tốc của ụ
trượt được êm hơn, điều này dẫn đến mức độ
rung lắc của khung được giảm Dựa trên hệ
thống thực nghiệm này, các phương pháp
điều khiển: PID, LQG, MRAS (áp dụng cho
bài toán với đối tượng được tuyến tính hoá)
và mạng nơron (áp dụng để giải quyết bài
toán phi tuyến) đã lần lượt được thiết kế và
thử nghiệm Qua đó ưu nhược điểm của từng
phương pháp đã được làm rõ Trong thực tế, tuỳ thuộc vào đối tượng điều khiển (tuyến tính hay phi tuyến) và yêu cầu về chất lượng điều khiển mà hệ thống cần phải đạt, ta sẽ chọn lựa bộ điều khiển cho phù hợp
Hình 1: Mô hình thực nghiệm MeDe5
Các thống số cơ bản của MeDe5
DC Motor Motor constant 5.7
Inertia of motor 1e-5 kg Frame Mass of frame 0.8 kg Frame Flex Spring constant 6 kN/m
frame
6 Ns/m
Load Mass of slider 0.3 kg Belt Flex Spring constant 800 N/m
Damping in belt 1 Ns/m Damper Viscous friction 3 Ns/m
Trang 2Damper MotorSensor
PositionSensorFrame PositionSensorSlider
Slider
FlexibleBelt
DC Motor
FlexibleFrame
P
m
K
P
P
m
Hình 2: Mô hình hoá kết cấu cơ khí của MeDe5
bằng phần mềm 20-Sim
Đối tượng điều khiển (hệ thống thực nghiệm
MeDe5) có mô hình toán học phụ thuộc vào
các điều kiện biên đi kèm:
- Nếu xét đầy đủ các thành phần, đối tượng
có tính phi tuyến mạnh
- Khi bỏ qua những thành phần phi tuyến
của lực ma sát trên phần tử damper, ta
nhận được mô hình toán học của đối
tượng là khâu bậc 6 tuyến tính
- Nếu coi dây curoa nối giữa động cơ và ụ
trượt là cứng và bỏ qua khối lượng rôto
của động cơ thì đối tượng sẽ có dạng một
khâu bậc 4 tuyến tính
- Tiếp tục, nếu ta coi khung là vững chắc
thì đối tượng sẽ có dạng một khâu bậc 2
tuyến tính
2 BỘ ĐIỀU KHIỂN PID
Vi tri u truot
y R
∫
d/dt Kp
Ki
Qua trinh Kd
Hình 3: Bộ điều khiển PID
Hình 4: Kết quả mô phỏng với thứ tự từ trên
xuống: nhiễu, tín hiệu ra, tín hiệu điều khiển
Hình 5: Sai lệch giữa tín hiệu mẫu và tín hiệu
ra khi thông số của đối tượng thay đổi
Bộ điều khiển kinh điển PID (hình 3) đã và đang được sử dụng rộng rãi để điều khiển các đối tượng SISO bởi vì tính đơn giản của
nó cả về cấu trúc lẫn nguyên lý làm việc Bộ điều chỉnh này làm việc rất tốt trong các hệ thống có quán tính lớn như điều khiển nhiệt
độ, điều khiển mức, và trong các hệ điều khiển tuyến tính hay có mức độ phi tuyến thấp Tuy nhiên, từ những phân tích lý thuyết và kết quả mô phỏng với đối tượng bậc 2 tuyến tính đã chỉ ra một số hạn chế của
bộ điều khiển PID như sau:
- Kết quả mô phỏng trên hình 4 cho thấy: khi
hệ thống bị tác động bởi nhiễu, nhiễu sẽ được đưa đến đầu vào thông qua mạch phản hồi và tổng hợp cùng với tín hiệu mẫu do vậy tín hiệu điều khiển cũng sẽ bao gồm nhiễu Đây là một trong những nguyên nhân ảnh hưởng đến tính ổn định của hệ thống và
độ chính xác điều khiển
- Biên độ sai lệch giữa tín hiệu mẫu và tín hiệu ra là lớn và luôn tồn tại trong suốt quá trình điều khiển Sai lệch này có xu hướng tăng khi thông số của đối tượng thay đổi (hình 5)
- Bộ điều khiển PID được thiết kế trên cơ sở
mô hình tuyến tính hoá với những thông số chính xác của đối tượng trong khi thực tế đối tượng là phi tuyến và thông số là không chính xác
Tuy nhiên, nếu hệ thống làm việc trong môi trường ít bị ảnh hưởng của nhiễu, thông số của đối tượng chỉ thay đổi nhỏ trong quá trình làm việc và yêu cầu về độ chính xác cũng như ổn định không cao thì PID vẫn là một giải pháp hiệu quả
Trang 33 BỘ ĐIỀU KHIỂN LQR (Linear
Quadratic Regulator)
u R
Vi tri khung Toc do khung
Vi tri u truot Toc do u truot
y
Hình 6: Nguyên lý bộ điều khiển LQR
LQR là thuật toán điều khiển được xây dựng
dựa trên cơ sở nguyên lý phản hồi trạng thái
Bộ điều khiển nhận tín hiệu vào là trạng thái
của hệ thống và tín hiệu mẫu sau đó tính
toán và chuyển thành tín hiệu điều khiển cho
quá trình
Vi tri
u truot
y u
R
Vi tri u truot*
Toc do u truot*
Vi tri khung*
Toc do khung*
LQR
SVF SVF Qua trinh
Hình 7: Bộ điều khiển LQR kết hợp với SVF
Sử dụng mô hình đối tượng bậc 4 tuyến tính
trong tính toán với bộ điều khiển LQR Các
trạng thái của đối tượng có thể nhận được
thông qua bốn cảm biến tuy nhiên khi đó bộ
điều khiển chịu tác động của nhiễu (hình 6)
Để loại bỏ nhiễu, ta sử dụng các bộ lọc biến
trạng thái SVF (State Variable Filter) (hình
7) Tuy nhiên SVF gây ra sự chậm pha của
trạng thái hồi tiếp Để khắc phục nhược
điểm này, ta sử dụng bộ điều khiển LQG
(Linear Quadratic Gaussian) [6,7]
R
T T uoc luong Vi tri u truot
LQG = LQR + LQE
LQE
QUA TRINH LQR
Hình 8: LQG là sự kết hợp của LQR và LQE
Chức năng của LQE (Linear Quadratic
Estimator) chính là quan sát trạng thái
Trong truờng hợp này, bộ quan sát trạng thái
của Kalman được sử dụng để nhận được
trạng thái ước lượng sạch của đối tượng và
không gây ra sự lệch pha giữa trạng thái
thực và trạng thái ước lượng Kết quả thiết
kế và mô phỏng bộ điều khiển LQR số kết hợp với bộ quan sát trạng thái của Kalman được cho trên hình 9 và 10
Toc do u truot uoc luong
Vi tri u truot uoc luong
Vi tri u truot LQE
LQR
Process
Z -1
Z -1
Z -1
a22 a21
A D
A D
-1
z
∫
K K1
L1
a11 b1
L2
K2
m
K kM
P
m
Hình 9: Bộ điều khiển LQR số kết hợp với bộ
quan sát trạng thái Kalman
Hình 10: Kết quả mô phỏng với thứ tự từ trên xuống: trạng thái thực, trạng thái ước lượng, sai lệch trạng thái, tín hiệu điều khiển
Mặt hạn chế thứ nhất của của bộ điều khiển PID về vấn đề nhiễu đã được khắc phục Kết quả mô phỏng (hình 10) cho thấy: tuy trạng thái thực và sai lệch trạng thái có bao gồm nhiễu nhưng trạng thái ước lượng và tín hiệu điều khiển là sạch (không chứa nhiễu)
4 HỆ THỐNG ĐIỀU KHIỂN THÍCH NGHI THÁM CHIẾU THEO MÔ HÌNH MẪU MRAS
4.1 Bộ điều khiển MRAS trực tiếp
Bản chất của việc áp dụng MRAS (Model Reference Adaptive Systems) là thiết kế bộ điều khiển sao cho hệ thống đạt được những đặc tính mong muốn được đưa ra bởi một
mô hình toán (mô hình mẫu) Khi đặc tính của hệ thống thực khác so với đặc tính lý tưởng của mô hình mẫu, hệ thống được thay đổi bằng cách điều chỉnh các thông số của
bộ điều khiển (hình 11) Trong nghiên cứu của chúng tôi, luật điều khiển thích nghi được xây dựng trên cơ sở lý thuyết ổn định của Liapunov [2]
Trang 4U
Yp
Mo hinh mau
BDK
BDK thich nghi
Qua trinh
Hình 11: Bộ điều khiển MRAS trực tiếp
Khi tính toán bộ điều khiển MRAS trực tiếp,
ta sử dụng mô hình đối tượng bậc 2 tuyến
tính và mô hình mẫu cũng có dạng bậc 2
Kết quả thiết kế và mô phỏng bộ điều khiển
MRAS trực tiếp được cho trên hình 12 và
hình 13 Nhận thấy, bộ điều khiển MRAS
trực tiếp trong trường hợp này chính là bộ
điều khiển PID tự chỉnh
Tin hieu mau
r
x2
x1
Desired velocity
Desired Position Slider Position Error
Position Slider Velocity Slider
PROCESS
P21
Mo hinh mau
Loc bien trang thai
Thich nghi Kd Thich nghi
Ki
P22
Thich nghi
Kp
SpringDamperBelt m MotorInertia
K
Amplifier
K
MotorGain
Damper SpringDamperFrame m MassFrame
F
ForceActuator
P
PositionSensorSlider m MassSlider
trực tiếp và hệ thống thực nghiệm
Hình 13: Kết quả mô phỏng hệ thống ứng với
các hệ số ma sát của damper khác nhau (3 và 6
(N.s/m).Theo thứ tự từ trên xuống: sai lệch vị trí
Từ kết quả mô phỏng nhận thấy ưu điểm của
hệ điều khiển thích nghi trực tiếp là: khi
thông số của đối tượng thay đổi, bộ điều
khiển tự động hiệu chỉnh các thông số và sau
một khoảng thời gian xác định, sai lệch của
hệ thống tiến dần đến 0 Đây là tính chất mà
bộ điều khiển PID thông thường và LQG không thể thực hiện được
4.2 Bộ điều khiển MRAS gián tiếp
Mo hinh kha chinh
BDK thich nghi
Doi tuong BDK
Hình 14: Sử dụng MRAS để nhận dạng và ước lượng trạng thái đối tượng (MRAS gián tiếp)
Phần trên đã đề cập đến MRAS được sử dụng trong thích nghi trực tiếp các thông số của bộ điều khiển như thế nào Trong trường hợp này, đối tượng cần phải tuân theo đáp ứng của mô hình mẫu Tuy nhiên nếu đối tượng và mô hình mẫu thay đổi vị trí cho nhau, khi đó mô hình mẫu được xem là mô hình khả chỉnh và sẽ tuân theo đáp ứng của đối tượng Điều này được thực hiện bằng cách chỉnh định các thông số của mô hình khả chỉnh Trong quá trình thực hiện, hai vấn đề sau đây được giải quyết [2]:
- Nhận dạng đối tượng: điều chỉnh các thông
số của mô hình khả chỉnh với mục đích để nhận được các đáp ứng đầu ra giống nhau giữa đối tượng và mô hình khả chỉnh Kết quả, sau một khoảng thời gian hiệu chỉnh, các thông số của đối tượng và mô hình khả chỉnh là tương đương nhau
- Ước lượng trạng thái: sau khi quá trình
chỉnh định thông số của mô hình khả chỉnh thành công, trạng thái của mô hình này sẽ tương đương với trạng thái của đối tượng Trang thái của mô hình khả chỉnh có thể được xem như trạng thái ước lượng của đối tượng
Những luật thích nghi cho bài toán toán thích nghi trực tiếp và thích nghi gián tiếp là như nhau Khi hệ thống bị tác động bởi nhiễu, cấu trúc như trên hình 14 cho phép nhận được trạng thái ước lượng sạch của đối tượng và khi đó MRAS đóng vai trò như là
bộ quan sát trạng thái thích nghi Với chức năng giống như bộ lọc Kalman, bộ quan sát trạng thái thích nghi tạo ra trạng thái ước
Trang 5lượng sạch của đối tượng Khi hệ thống bị
tác động bởi nhiễu, trạng thái thực cũng như
sai lêch luôn bao gồm nhiễu Tuy nhiên
trạng thái ước lượng (được dùng làm tín hiệu
phản hồi) và tín hiệu điều khiển luôn không
chứa nhiễu (hình 15) Một ưu điểm nổi bật
của bộ quan sát trạng thái thích nghi so với
bộ quan sát Kalman đó là biên độ sai lệch
giữa trạng thái thực và trạng thái ước lượng
giảm dần và tiến đến giá trị 0 sau một
khoảng thời gian xác định (hình 16)
Hình 15: Kết quả mô phỏng hệ thống với thứ tự
từ trên xuống: vị trí thực, vị trí ước lượng, sai
lệch vị trí và tín hiệu điều khiển
Hình 16: So sánh bộ quan sát trạng thái Kalman
và bộ quan sát trạng thái thích nghi
4.3 Bộ điều khiển learning
feed-forward (LFFC) dựa trên MRAS
y u
R
BDK thich nghi
Doi tuong BDK
Mo hinh
mau
Hình 17: Cấu trúc bộ điều khiển learning
feed-forward dựa trên MRAS
Đối tượng được biểu diễn bởi hàm truyền
thì hàm truyền của hệ thống từ
p
H
r
sẽ là
y
p p
m
s b
s b
p
m m
n n
n
c s
a
c s
a s
s
H
+ +
+ + +
+
= 2 2 2 22
2ςω ω
ω
Nếu các thông số a m =a p, b m =b p và
p
c = thì H =H r Khi này, tại đầu ra của
hệ thống nhận được tín hiệu mong muốn (y=r) Ta đi tìm một cơ chế học dựa trên sai lệch giữa tín hiệu ra của mô hình mẫu và của đối tượng để thực hiện việc hiệu chỉnh
tụ đến các thông số của đối tượng Trong nghiên cứu của chúng tôi, luật điều khiển thích nghi được xây dựng trên cơ sở lý thuyết ổn định của Liapunov
m
a b m, c m
Hình 18: Kết quả mô phỏng hệ thống ứng với các hệ số ma sát của damper khác nhau (3 và 6 N.s/m).Theo thứ tự từ trên xuống: sai lệch vị trí
ụ trượt, thích nghi a m , b m và c m
Giống như hệ thống với bộ điều khiển thích nghi trực tiếp, khi thông số của đối tượng thay đổi, bộ điều khiển learning feed-forward dựa trên MRAS cũng có khả năng
tự động hiệu chỉnh các thông số của bộ điều khiển theo xu hướng đưa sai lệch tiến dần về
0 Tuy nhiên, ưu điểm vượt trội của mô hình điều khiển này so với LQG và MRAS trực tiếp đó là tốc độ thích nghi nhanh hơn, độ ổn định cao hơn và ít nhạy cảm với nhiễu [4,5] Phương pháp này chỉ áp dụng được khi mô hình mẫu và đối tượng có dạng bậc 2 Như vậy với những đối tượng có hàm truyền bậc cao hơn, khi tính toán ta phải sử dụng hàm xấp xỉ bậc 2 của chúng Bộ điều khiển LFFC dựa trên MRAS chỉ có thể áp dụng (bù và hiệu chỉnh) cho hệ thống với đối tượng từ bậc 2 trở xuống nên đây chính là hạn chế của phương pháp này
Trang 65 BỘ ĐIỀU KHIỂN LFFC DỰA TRÊN
MẠNG NƠRON
Các phương pháp thiết kế bộ điều khiển như
đã đề cập ở trên đều dựa trên mô hình tuyến
tính hoá của đối tượng Tuy nhiên, nếu ta xét
đầy đủ các thành phần lực ma sát trên phần
tử damper, đối tượng điều khiển của ta sẽ có
tính phi tuyến gây ra bởi thành phần lực ma
sát Coulomb Đối với hệ thống phi tuyến,
việc xác định thông số của đối tượng là rất
khó khăn Và nếu áp dụng các bộ điều khiển
như PID, LQG hay thậm chí là MRAS cho
đối tượng phi tuyến này thì chất lượng hệ
thống nhận được là không tốt Vì vậy,
phương pháp thiết kế bộ điều khiển LFFC
dựa trên mạng nơron đã được đề xuất [4,5]
y u
u2
u1 e
d R
Learning
Doi tuong BDK
Hình 19: Cấu trúc bộ điều khiển LFFC dựa trên
mạng nơron
Mô hình dự kiến của bộ điều khiển này được
thể hiện trên hình 20 Thành phần phi tuyến
của đối tượng (lực ma sát Coulomb) được
tách riêng và bù bởi hai mạng nơron kiểu
B-Spline riêng rẽ cho chuyển động thuận và
ngược của ụ trượt Hiện nay phương pháp
này đang ở trong giai đoạn thiết kế và mô
phỏng Kết quả của LFFC dựa trên mạng
nơron sẽ được trình bày trong báo cáo sau
Qua trinh
Potition Slider Sensor
Vi tri u truot
BSplineNetwork
Loc bien trang thai
Tin hieu mau
Gia toc mau
Toc do mau
Vi tri mau
P
K
P
m
Km
d/dt Kd
w^2
2*z*w
∫
∫
Kp
Hình 20: Bộ điều khiển LFFC dựa trên mạng
nơron cho đối tượng phi tuyến
6 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
Bài báo đã giới thiệu và đánh giá một số phương pháp thiết kế bộ điều khiển cho hệ tuyến tính và phi tuyến như PID, LQG, bộ điều khiển thích nghi tham chiếu theo mô hình mẫu MRAS (Model Reference Adaptive Systems) và bộ điều khiển learning feed-forward dựa trên mạng nơron Qua đó
ưu nhược điểm của từng phương pháp đã được làm rõ Trong thực tế, tuỳ thuộc vào đối tượng điều khiển (tuyến tính hay phi tuyến) và yêu cầu về chất lượng điều khiển
mà hệ thống cần phải đạt, ta sẽ chọn lựa bộ điều khiển cho phù hợp
TÀI LIỆU THAM KHẢO
1 Hans Dirne; Memonstrator of Advanced
Controller, Master thesis; University of Twente, The Netherlands, May 2005
2 Amerongen, J van; Intelligent Control
(part 1)-MRAS, Lecture notes; University of Twente, The Netherlands, March 2004
3 Amerongen, J van & Vries, T.J.A;
Digitale regeltechniek; University of Twente, The Netherlands, May 2005
4 Amerongen, J.van; A MRAS-based
learning feed-forward controller; University
of Twente, The Netherlands, 2006
5 Vries T.J.A, Welthuis W.J.R, Idema L.J;
Application of parsimonious learning feedforward control to mechatronic systems, IEE Proceedings of Control Theory Applications, Vol 148 (No 4), July, pp
318-322, 2001
6 Karl J.Astrom & Bjorn Wittenmark;
Addison-Wesley Publishing Company, 1995
7 Yoan D Landau; Adaptive Control - The
model reference approach; New York, United States, 1979
8 Controllab Products B.V; 20-Sim software