Sơ đồ khối hệ thống điều khiển thích nghi Hệ thống điều khiển trong đó thông số và cấu trúc của bộ điềukhiển thay đổi trong quá trình vận hành nhằm đảm bảo chất lượngđiều khiển khi có s
Trang 1Môn học
HỆ THỐNG ĐIỀU KHIỂN THÔNG MINH
Giảng viên: TS Huỳnh Thái Hoàng
B ä â Đi à Khi å Tư Đ ä
Bộ môn Điều Khiển Tự Động
Khoa Điện – Điện Tử Đại học Bách Khoa TP.HCM Email: hthoang@hcmut edu vn Homepage: http://www4.hcmut.edu.vn/~hthoang
Trang 3Điề khiể hí h hi
Nội dung chương 4
Điều khiển thích nghi
Điều khiển học
Trang 4ĐIỀU KHIỂN THÍCH NGHI
Trang 5Sơ đồ khối hệ thống điều khiển thích nghi
Hệ thống điều khiển trong đó thông số (và cấu trúc) của bộ điềukhiển thay đổi trong quá trình vận hành nhằm đảm bảo chất lượngđiều khiển khi có sự hiện diện của các yếu tố bất định hoặc biến đổikhông biết trước gọi là hệ thống điều khiển thích nghi
Trang 6Phân loại hệ thống điều khiển thích nghi
Đối t
Đối tượng:
Tuyến tính hoặc phi tuyến
SISO hoặc MIMO (vuông, không vuông) ặ ( g, g g)
Hệ có bậc tương đối tổng quát
Có nhiễu hệ thống, nhiễu đo lường
Cơ sở của thuật toán điều khiển thích nghi:
Điều khiển hồi tiếp tuyến tính hóa p y
Điều khiển trượt
Thuật toán thích nghi:
Liên tục hoặc rời rạc
Trang 7Đặt bài toán
Đối tượng: hệ phi tuyến SISO mô tả bởi phương trình vi phân:
⎨
⎧x& = f (x) + g(x)u
⎩
⎨ = )y h (x
Bài toán đặt ra là điều khiển tín hiệu ra y(t) bám theo tín hiệu đặt
Bài toán đặt ra là điều khiển tín hiệu ra y(t) bám theo tín hiệu đặt
y m (t)
Trang 8Đối tượng điều khiển
Nếu đối tượng có bậc tương đối bằng r, đối tượng có thể được mô tả bằng phương trình sau:
u b
x x
L ( ) ( ) ( ) ( ) , , ( ) 1( ), ( )
1
x x
x
x x
f x
1
∂ k− φ
L
)(
)
()
(
1
x
f x
x x
∂
∂
= φφ
k f k
f
L L
)
()
Trang 9Luật điều khiển hồi tiếp tuyến tính hóa
L ật điề khiể hồi tiế t ế tí h hó
Luật điều khiển hồi tiếp tuyến tính hóa:
[ ( ) ( )]
) (
1 )
(
*
t v
a b
x
x
) (
b x
Trang 10Các giả thiết
Trang 11Tính ổn định của luật điều khiển hồi tiếp tuyến tính hóa
(t →
0)
(t →
⇒ y(t) bám theo ym (t) với sai số xác lập bằng 0
Trang 12Ý tưởng điều khiển thích nghi
Điều khiển thích nghi trên cơ sở xấp xỉ luật điều khiển hồi tiếp tuyến tính hóa :
[ ( ) ( )]
1)
(
*
t v a
Lý do:
[ ( ) ( )]
)(
Lý do:
hàm a(x) và b(x) chưa biết
hoặc hàm a(x) và b(x) đã biết nhưng thay đổi trong quá trình vận hành
Hai phương pháp điều khiển thích nghi:
Hai phương pháp điều khiển thích nghi:
Điều khiển thích nghi gián tiếp
Điều khiển thích nghi trực tiếp
Trang 13Điều khiển thích nghi gián tiếp
Nhận dạng trực tuyến a(x) và b(x) dùng mô hình và , sau
đó tính tín hiệu điều khiển theo nguyên lý chắc chắn tương đương
)(
ˆ x
a b (x)
[ ˆ ( ) ( )]
) ( ˆ
1 )
b
x x
Mô hình và có thể là mô hình mờ, mạng thần kinh hoặc mô hình hộp đen phi tuyến tổng quát
)(
ˆ x
a b ˆ x( )
)()
(
ˆ x a T a x
a =θ ξ
)()
(
ˆ x x
b
T b
b( ) =θb ξξb( )Các vector và là vector thông số của mô hình.θa θb
Trang 14Điều khiển thích nghi gián tiếp (tt)
(sup
minarg
*
x
Tξθθ
b b
b b
b b
ξθ
a a
a a
a a
ξθ
θ
θ
Gọi và là sai số giữa mô hình tối ưu và đặc tính động học chính xác của đối tượng Mô hình đúng của đối tượng có thể biểu diễn như sau:
()
(x a*T a x a x
a =θ ξ +δ
)()
()
(x b*T b x b x
b =θ ξ +δ
Trang 15Điều khiển thích nghi gián tiếp (tt)
ố
Sai lệch giữa mô hình nhận dạng được và mô hình đúng của hệ thống:
)()
()(
~)
()
(
ˆ x x T a x a x
a t a
)()
()(
~)
()
(
b b
T
b t b
*
)()
(
~
a a
(
~
b b
b t θ t θ
hệ thống ổn định sử dụng thêm thành phần điều khiển trượt usi
Tín hiệu điều khiển là tổng gồm 2 thành phần:
u ce điều khiển hệ thống bám quỹ đạo chuẩn
u si đảm bảo hệ thống ổn định
si
ce u u
u = +
Trang 16Các giả thiết cần để thiết kế bộ điều khiển thích nghi gián tiếp
Quỹ đạo chuẩn mong muốn khả vi liên tục bị chặn đến bậc y m (t) r
và các đạo hàm , , có thể đo được.y&m (t) y m(r)(t)
Sai số cấu trúc giữa mô hình và đặc tính chính xác của đối tượng bị chặn bởi các cận biết trước:
∞
∈
≤ ( ) L)
(x b x
δb( ) b( ) ∞
Trang 17Trình tự thiết kế bộ điều khiển thích nghi:
Viết biểu thức mô tả động học sai số bám
Chọn hàm Lyapunov V (là hàm toàn phương theo sai số bám và sai số thông số)
Luật thích nghi thông số được chọn sao sai số thông số bị triệt tiêu khỏi đạo hàm theo thời gian của hàm Lyapunov ( không phụ
V&
thuộc vào sai số thông số của mô hình)
Thành phần điều khiển chế độ trượt được chọn sao cho đảm bảo đạo hàm theo thời gian của hàm Lyapunov âm ( V& < 0) khi sai số
đạo hàm theo thời gian của hàm Lyapunov âm ( ) khi sai số cấu trúc nằm trong giới hạn định trước
0
<
V
Trang 18Thiết kế bộ điều khiển thích nghi gián tiếp
Biểu thức mô tả động học sai số bám
T
T ~ 1 ~ ~
~ 1
si ce
a
T a s
e
2
1 2
1 2
~ ) (
~ ) (
2
ce s b b
b
T b s
a a
a
T a ce
b a
s s
ξ
θ & = Q− − 1
b b
s ce b b
⇒
⇒ Hệ thống ổn định
Trang 19Sơ đồ khối hệ thống điều khiển thích nghi gián tiếp
Trang 20Thí dụ: Điều khiển thích nghi gián tiếp hệ bồn kép dùng mô hình mờ
Đặc tính động học của hệ thống mô tả bởi các phương trình sau:
) (
1 )
1 1
h A
t
( ( ( ) ( )) | ( ) ( ) | ( ))
1 )
h& (sgn( ( ) ( )) 2 | ( ) ( ) | 2 ( ))
) (
1 )
2 2
h A
t
i min
A i i = i +
Trang 21Điều khiển thích nghi trực tiếp
Luật điều khiển hồi tiếp tuyến tính hóa lý tưởng:
[ ( ) ( )]
) (
1 )
Dùng mô hình phi tuyến để nhận dạng trực tiếp u*(x):
) ( )
ˆ x
u
) ( )
(x u u x
hộp đen phi tuyến tổng quát
là vector độ đúng của mệnh đề điều kiện của mô hình mờ, vector ngõ ra lớp ẩn của mạng thần kinh, hoặc vector hàm cơ sở
Trang 22Điều khiển thích nghi trực tiếp (tt)
x
x
ξθ
θ
θ
G i δ ( ) là i ố iữ ô hì h ối à l ậ điề khiể hồi iế
Gọi là sai số giữa mô hình tối ưu và luật điều khiển hồi tiếp tuyến tính hóa lý tưởng Luật điều khiển tuyến tính hóa có thể biểu diễn như sau:
()
( *
*
x x
u =θ ξ + δ
Trang 23Điều khiển thích nghi trực tiếp (tt)
S i lệ h iữ l ật điề khiể hậ d đ à l ật điề khiể hồi
Sai lệch giữa luật điều khiển nhận dạng được và luật điều khiển hồi tiếp tuyến tính hóa:
)()
(
~)
()
(
~
u u
trong đó:
)()
()
()
(x u x u u x u x
Sai số mô hình luôn tồn tại trong các ứng dụng thực tế Để đảm bảo
hệ thống ổn định sử dụng thêm thành phần điều khiển trượt u d
hệ thống ổn định sử dụng thêm thành phần điều khiển trượt usd
Tín hiệu điều khiển là tổng gồm 2 thành phần:
û xấp xỉ luật điều khiển hồi tiếp tuyến tính hóa lý tưởng
u sd đảm bảo hệ thống ổn định
sd
u u
u = ˆ +
Trang 24Các giả thiết cần để thiết kế bộ điều khiển thích nghi trực tiếp
bị hặ)
|)(
và các đạo hàm , , có thể đo được.y&m (t) y m(r)(t)
Sai số cấu trúc giữa luật điều khiển nhận dạng và luật điều khiển hồi tiếp tuyến tính hóa bị chặn bởi cận biết trước:
)()
( δ
δu(x) ≤ δu(x)∈L∞
δ
Trang 25Trình tự thiết kế bộ điều khiển thích nghi:
Viết biểu thức mô tả động học sai số bám
Chọn hàm Lyapunov V (là hàm toàn phương theo sai số bám và sai số thông số)
Luật thích nghi thông số được chọn sao sai số thông số bị triệt tiêu khỏi đạo hàm theo thời gian của hàm Lyapunov ( không phụ
V&
thuộc vào sai số thông số của mô hình)
Thành phần điều khiển chế độ trượt được chọn sao cho đảm bảo đạo hàm theo thời gian của hàm Lyapunov âm ( V& < 0) khi sai số
đạo hàm theo thời gian của hàm Lyapunov âm ( ) khi sai số cấu trúc nằm trong giới hạn định trước
0
<
V
Trang 26Thiết kế bộ điều khiển thích nghi trực tiếp
Biểu thức mô tả động học sai số bám
Biểu thức mô tả động học sai số bám
sd u
u
T u s
e& +η = − θ~ ξ + δ −
~
~1
1
u s
e b
2
12
e u
u u
s sd
b
e e
u
e b
Luật thích nghi thông số:g g θ&u u = Q Q u u− 1ξξu u e s s
Thành phần điều khiển chế độ trượt: sgn( )
2 2 s s
b u
Trang 27Sơ đồ khối hệ thống điều khiển thích nghi trực tiếp
Trang 28Thí dụ điều khiển thích nghi trực tiếp cánh tay máy
u(t): moment tác động lên trục quay của cánh tay máy
φ(t): góc quay (vị trí) của cánh tay máy,
J: moment quán tính của cánh tay máy (J = 0.05 kg.m2)
M: khối lượng của cánh tay máy (M = 1 0kg)
M: khối lượng của cánh tay máy (M = 1.0kg)
m: khối lượng vật nặng (m = 0.1 kg)
l: chiều dài cánh tay máy (l = 0.4 m)
l C : khoảng cách từ trọng tâm cánh tay máy đến trục
l C : khoảng cách từ trọng tâm cánh tay máy đến trục quay (l C = 0.15 m)
(sin)
()()
()(J + ml2 φ&& t + Bφ& t + ml + Ml C g φ t = u t
Giả sử trong quá trình vận hành, thông số cánh tay máy (thí dụg q ậ , g y y ( ụnhư trọng lượng tải) thay đổi
Trang 29Phương trình ngõ ra cánh tay máy
Phương trình vi phân mô tả cánh tay máy 1 bậc tự do:
)()
(sin)
()()
()(J + ml2 φ&& t + Bφ& t + ml + Ml C g φ t = u t
Đặt: y(t) = φ(t)
T
t x t x
a
y&& = (x) + (x)
Phương trình ngõ ra cánh tay máy:
)(
)(cos)
()
()
ml J
t x g
Ml ml
(
b x
)(
)
ml J
b
+
=
x
Trang 30Sơ đồ mô phỏng hệ thống điều khiển thích nghi trực tiếp cánh tay máy
Trang 31Thiết kế bộ điều khiển thích nghi trực tiếp
hiệu điều khiển hồi
tiếp tuyến tính hóa lý
tưởng:
)()
()
()
(x = ξ x ξ x ξ x
ξ
u u
2 1
1 ) ( ) ] [(
)
i
i x x
μ
μξ
− +
Trang 32ĐIỀU KHIỂN HỌC
Trang 33Khái niệm điều khiển học
Hệ thống điều khiển học là hệ thống điều khiển có khả năng cảithiện chất lượng điều khiển trong tương lai, dựa vào thông tin kinhnghiệm mà hệ thống thu thập được trong quá khứ, thông qua tươngtác vòng kín với đối tượng và môi trường
Đặc điểm của hệ thống điều khiển học:
Đặc điểm của hệ thống điều khiển học:
Hệ thống điều khiển học có khả năng tự chủ (autonomy), vì nó
có thể cải thiện chất lượng của chính nó
Hệ thống điều khiển học có bộ nhớ vì thông tin quá khứ là yếu tốthen chốt để cải thiện chất lượng tương lai
Để cải thiện chất lượng, hệ thống điều khiển học phải nhận thôngtin phải hồi chất lượng dựa trên một hàm mục tiêu mà hệ thốngtìm cực trị
Trang 34So sánh điều khiển học và điều khiển thích nghi
định lại thông số khi ngay cả khi tình huống cũ lặp lại
Hệ thống điều khiển học có bộ nhớ lưu trữ các cấu trúc và thông
số điều khiển đã học trong quá khứ -> không cần quá trình thích
số điều khiển đã học trong quá khứ > không cần quá trình thíchnghi khi tình huống thay đổi lặp lại tình huống trong quá khứ
Trang 35Sơ đồ khối hệ thống điều khiển học
Trang 36Thực thi hệ thống điều khiển học
ứng với miền tín hiệu vào
Rất nhiều hệ thống điều khiển học được thực hiện theo cách này
Khuyết điểm của phương pháp này là tổ hợp các miền tín hiệu
Khuyết điểm của phương pháp này là tổ hợp các miền tín hiệuvào tăng lên khi không gian trạng thái tăng lên hoặc số miềnphân chia mỗi chiều không gian trạng thái tăng lên
Trang 37Thực thi hệ thống điều khiển học
trúc này có thể cố định hay biến đổi và có nhiều thông số tự do
Thực thi hệ thống điều khiển học bằng cách xấp xỉ hàm có một
số ưu điểm hơn so với các tra bảng:
Thứ nhất, các hàm liên tục nói chung được mô tả một cáchhiệu quả hơn thông qua các thông số tự do, và do đó, cách
xấp xỉ hàm cần ít bộ nhớ hơn để biểu diễn một hàm liên tục
so với cách tra bảng
Thứ hai cấu trúc xấp xỉ hàm có tính chất tổng quát hóa (tức
là nội suy giữa những điểm tín hiệu vào)
Các cấu trúc xấp xỉ hàm được sử dụng phổ biến: mạng thần kinh(MLP, RBF) và mô hình mờ (Mamdani, Takagi - Sugeno)
Trang 38Thí dụ điều khiển học dùng mạng RBF
Đối tượng mô tả bởi mô hình toán học:
Đối tượng mô tả bởi mô hình toán học:
(
)()()
()()
1(
k k
y
k u v k
v k
Cx
B x
A x
.1
95.0)
2(
665
0)
13
.0)
e v
v k
]) 1 , 0 ([
) (k = rand
μ
Trang 39Thí dụ điều khiển học dùng mạng RBF (tt)
Giả thiết hú t hỉ biết bậ ủ hệ thố (bậ 2) à khô biết
Giả thiết chúng ta chỉ biết bậc của hệ thống (bậc 2) mà không biếtảnh hưởng của điểm làm việc đến đặc tính động học của hệ thốngnhư thế nào (tức là không biết cụ thể A(v) và B(v) phụ thuộc vào v
Trang 40Thí dụ điều khiển học dùng mạng RBF (tt)
S đồ khối hệ thố điề khiể h t tiế
Sơ đồ khối hệ thống điều khiển học trực tiếp:
Trang 41Thí dụ điều khiển học dùng mạng RBF (tt)
Mô hình chuẩn:
16250
80
0025
0)
(s =
G m
Luật điều khiển hồi tiếp trạng thái:
)()
()
()
(k K1x1 k K2x2 k K3r k
1625
08
0 ++ s s
m
K1, K2: độ lợi hồi tiếp trạng thái, K3: độ lợi đầu vào
)()
()
()
( 1 1 2 2 3
Trang 421 ,0357.
0[−
Trang 43Thí dụ điều khiển học dùng mạng RBF (tt)
Quá trình học: Tại mỗi thời điểm lấy mẫu hệ thống học thực hiện các tác vụ sau:
Đo lường biến hoạch định điểm làm việc
Đo lường biến hoạch định điểm làm việc
Đọc độ lợi điều khiển từ ngõ ra mạng RBF:
k v K k
v K k
v K k
)()
()
()
(k K1x1 k K2x2 k K3r k
Xuất tín hiệu điều khiển tác động vào đối tượng
Sai lệch giữa đáp ứng của đối tượng với tín hiệu ra mong muốn của mô hình chuẩn được sử dụng để cập nhật trọng số mạng RBF
Trang 44RBF được tính dựa vào sai số giữa tín hiệu ra của mô hình chuẩn
và tín hiệu ra của hệ thống theo công thức:
)()())
((v k e k k
Trong đó: α là hệ số dương nhỏ
)()
()
(k y k y k
e = ref −
k k
k
k) ( ) ( ) ( )(
k r k
x k
x
k) ( ) ( ) ( )( = 1 2
φ
Bước 2: các trọng số lớp ra của mạng RBF được cập nhật bằng
thuật toán suy giảm độ dốc:
Trong đó: z là ngõ ra của tế bào thần kinh thứ i ở lớp ẩn
))((
) ( )
1 (
k v K z w
w ij l+ = ij l −η iδ j (i =1 31; j =1 3)Trong đó: zi là ngõ ra của tế bào thần kinh thứ i ở lớp ẩn
Trang 45Thí dụ điều khiển học dùng mạng RBF (tt)
Mô phỏng kết quả:
Cứ 60 chu kỳ lấy mẫu giá trị μ(k) thay đổi một lần
Ba giá trị đầu tiên của μ(k) được gán bằng 0 1; 0 3; 0 6
Ba giá trị đầu tiên của μ(k) được gán bằng 0.1; 0.3; 0.6
Các giá trị sau đó được gán ngẫu nhiên trong đoạn [0,1]
Trang 46Thí dụ điều khiển học dùng mạng RBF (tt)
Kết quả học luật điều khiển: Độ lợi hồi tiếp trạng thái K1(v)
Trang 47Thí dụ điều khiển học dùng mạng RBF (tt)
Kết quả học luật điều khiển: Độ lợi hồi tiếp trạng thái K2(v)
Trang 48Thí dụ điều khiển học dùng mạng RBF (tt)
Kết quả học luật điều khiển: Độ lợi hồi tiếp trạng thái K3(v)
Trang 49Thí dụ điều khiển học mờ
Đối tượng: tên lửa một tầng có mô hình toán học đơn giản cho bởi
Đối tượng: tên lửa một tầng có mô hình toán học đơn giản cho bởiphương trình:
)
Bài toán đặt ra là điều khiển vận tốc của tên lửa theo tín hiệu đặt
Trang 50Thí dụ điều khiển học mờ (tt)
Sơ đồ khối hệ thống điều khiển học mờ:
Trang 51Thí dụ điều khiển học mờ (tt)
Cơ chế học của hệ thống như sau:
Cơ chế học của hệ thống như sau:
Quan sát dữ liệu vào ra của hệ thống điều khiển mờ
Đánh giá chất lượng của hệ thống điều khiển
Tự chỉnh thông số bộ điều khiển mờ để đạt được chất lượng
mong muốn (chất lượng mong muốn xác định bởi mô hình chuẩn trong sơ đồ điều khiển)
trong sơ đồ điều khiển)
Lưu trữ tri thức (qui luật chỉnh định thông số) vào bộ nhớ
Trang 52Thí dụ điều khiển học mờ (tt)
Bộ điều khiển:Bộ điều khiển được sử dụng là bộ điều khiển PD mờ
Bộ điều khiển:Bộ điều khiển được sử dụng là bộ điều khiển PD mờ gồm các qui tắc Sugeno với mệnh đề kết luận là hằng số
Tín hiệu vào của bộ điều khiển PD mờ là:
sai số
biến thiên sai số:
)()
()
(k r k y k
T k
e k
e k
e( ) = [ ( ) − ( − 1 )] /
Δ
Tín hiệu ra của bộ điều khiển là u(k) Các hệ số chuẩn hóa ở ngõ
và ngõ ra của bộ điều khiển là K E, K D, và K U được chọn như sau:
1
=
K K = 1 K =10000
Trang 53Thí dụ điều khiển học mờ (tt)
Hàm liên thuộc của các tập mờ định nghĩa cho biến vào e(k) và Δe(k):
Trang 54Thí dụ điều khiển học mờ (tt)
Các qui tắc điều khiển có dạng:
Trang 55Thí dụ điều khiển học mờ (tt)
Mô hình chuẩn:
2.0
2
0)
R
s
Y m
Chất lượng của hệ thống được tính bằng sai lệch giữa tín hiệu ra của
mô hình chuẩn và tín hiệu ra của đối tượng:
)()
()
(k y k y k
e m = m −
Trang 56 Ngược lại, nếu chất lượng mong muốn không thỏa mãn (em (k)
lớn) thì cơ chế học sẽ điều chỉnh bộ điều khiển mờ
Trang 57hình chuẩn
Tín hiệu vào mô hình ngược là: em (k) và Δe m (k)
Tín hiệu ra mô hình ngược là: p(k)g p( )
Trang 58Thí dụ điều khiển học mờ (tt)
Hệ qui tắc mô tả mô hình ngược mờ:
Hệ qui tắc mô tả mô hình ngược mờ:
Trang 59Thí dụ điều khiển học mờ (tt)
Khối điều chỉnh cơ sở tri thức:
Khối điều chỉnh cơ sở tri thức:
Điều chỉnh bộ điều khiển mờ để hệ thống đạt được chất lượng điều khiển tốt hơn
Cho thông tin về thay đổi cần thiết ở ngõ vào của đối tượng là
p(k), bộ điều chỉnh cơ sở tri thức sẽ cập nhật cơ sở tri thức của bộ
điều khiển mờ (mệnh đề kết luận của các qui tắc điều khiển) sao
điều khiển mờ (mệnh đề kết luận của các qui tắc điều khiển) sao cho tác động điều khiển trước đó (tức u(k−1)) sẽ được thay đổi một lượng là p(k)
M ốn đạt được điề nà ngõ ra của các q i tắc mờ tác động ở
) ( )
1 (
) 1 (
*
k p k
u k
Muốn đạt được điều này ngõ ra của các qui tắc mờ tác động ở
thời điểm lấy mẫu thứ (k−1) phải được thay đổi một lượng là:
)()
1(
)(k α k + p k
αi(k) = αi(k −1) + p(k) (k) p(k)
α
U K
p k
)( =