Miền nghiên cứu của điều khiển tối ưu không chỉ riêng ởcác hệ thống kỹ thuật mà có thể tìm thấy ở hầu hết các hệ thống khôngphải là kỹ thuật khác như hệ sinh học, hệ kinh tế Bài toán điề
Trang 1Lời nói đầu
Một trong những mục tiêu hàng đầu trong tổng hợp hệ thống điềukhiển là tính hiệu quả cao Hệ thống càng phức tạp, quy mô càng lớn, thìviệc đưa ra các quyết định điều khiển để hệ thống cho hiệu quả càng khókhăn, ngay cả đối với những chuyên gia nhiều kinh nghiệm Bởi vậy cầnphải có những phương pháp tổng quát, chặt chẽ về mặt lý thuyết, làm nềntảng trợ giúp cho công việc trên và đó chính là mục đích của điều khiển tốiưu
Điều khiển tối ưu là một chuyên ngành trong điều khiển tự động cóvai trò xác lập và tạo lập những luật điều khiển cho hệ thống để hệ thốngđạt được chỉ tiêu về tính hiệu quả đã được định trước dưới dạng (phiếm)hàm mục tiêu Q Miền nghiên cứu của điều khiển tối ưu không chỉ riêng ởcác hệ thống kỹ thuật mà có thể tìm thấy ở hầu hết các hệ thống khôngphải là kỹ thuật khác như hệ sinh học, hệ kinh tế
Bài toán điều khiển có ba cấu trúc cơ bản đó là:
* Điều khiển hở
Về bản chất, hình thức điều khiển này cũng giống như bài toán tìmtín hiệu điều khiển thích hợp đặt ở đầu vào của đối tượng, nhưng được bổsung thêm bộ điều khiển để tạo ra được tín hiệu điều khiển đó
Ví dụ để điều khiển tàu thuỷ đi được theo một quỹ đạo y(t) mongmuốn (tín hiêu đầu ra), người ta phải tác động bằng lực (t) vào tay lái đểtạo ra được vị trí u(t) của bánh lái một cách thích hợp Trong ví dụ này hệthống tay lái – bánh lái có vai trò của một bộ điều khiển
Hình thức điều khiển hở này là điều khiển một chiều và chất lượngđiều khiển phụ thuộc vào độ chính xác của mô hình toán học mô tả đốitượng cũng như phải có giả thiết rằng không có tác động nhiễu khôngmong muốn vào hệ thống trong suốt quá trình điều khiển
Bộ điều khiển
Đối tượng điều khiển
Trang 2* Điều khiển phản hồi trạng thái
Ở đối tượng điều khiển, các tín hiệu trạng thái x1(t),x2(t), ,x n(t),được viết chung dạng vector x (t) (x1(t),x2(t), ,x n(t))T, là thành phầnchứa đựng đầy đủ nhất các thông tin chất lượng động học hệ thống, kể cảnhững tác động nhiễu không mong muốn Bởi vậy, để có thể tạo ra đượccho đối tượng một chất lượng mong muốn, ổn định với tác động nhiễu, cầnphải có một tín hiệu áp đặt ở đầu vào là u(t) phản ứng kịp theo những thayđổi trạng thái của đối tượng
Hình 2 biểu diễn nguyên tắc điều khiển phản hồi trạng thái Bộ điều khiển
sử dụng tín hiệu trạng thái x (t) của đối tượng để tạo ra được tín hiệu đầuvào u(t) cho đối tượng Vị trí của bộ điều khiển có thể là ở mạch truyềnthẳng hoặc ở mạch hồi tiếp
Hệ thống điều khiển phản hồi trạng thái có khả năng giữ được ổnđịnh chất lượng mong muốn cho đối tượng, mặc dù trong quá trình điềukhiển luôn có những tác động nhiễu Như vậy hệ thống điều khiển phảnhồi trạng thái tối ưu đã giải quyết triệt để mục tiêu của bài toán điều khiển
đó là chất lượng điều khiển đạt tốt nhất
Tuy vậy hệ thống điều khiển phản hồi trạng thái có nhược điểm, trongnhiều trường hợp trạng thái của đối tượng điều khiển không đo được trựctiếp gây khó khăn cho việc nhận dạng đối tượng điều khiển vì vậy người taphải thay bộ điều khiển phản hồi trạng thái bằng bộ điều khiển phản hồi tínhiệu ra
Bộ điều khiển
Đối tượng điều khiển
y
u e
Bộ điều khiển
Đối tượng điều khiển
Đối tượng điều khiển
y
u e
Bộ điều khiển
Đối tượng điều khiển
Trang 3Bộ điều khiển sử dụng tín hiệu đầu ra y(t) của đối tượng để tạongược ra được tín hiệu đầu vào u(t) cho nó Tuy nhiên, cho tới nay bài toánđiều khiển phản hồi tín hiệu ra vẫn còn là một bài toán mở và chưa có lờigiải tổng quát cuối cùng, vì tín hiệu ra y(t) thường không mang được đầy
đủ thông tin động học của đối tượng
Với những ưu nhược điểm của bài toán phản hồi trạng thái và điều khiểnphản hồi tín hiệu ra, từ những lý thuyết đã nghiên cứu luận văn trình bàythuật toán thiết kế bộ điều khiển tối ưu phản hồi tín hiệu ra dựa trên sự kếthợp của hai bộ điều khiển: Bộ điều khiển phản hồi trạng thái và bộ điềukhiển phản hồi đầu ra áp dụng cho đối tượng điều khiển là đối tượng tuyếntính để chất lượng điều khiển là tối ưu
Sau một thời gian học tập và nghiên cứu đến nay bản luận văn của tôi
đã được hoàn thành Nhân dịp này tôi xin chân thành cảm ơn PGS.TSNguyễn Doãn Phước - Thầy giáo hướng dẫn trực tiếp, người đã đưa rahướng nghiên cứu tận tình giúp đỡ, chỉ bảo và tạo mọi điều kiện thuận lợi
để tôi hoàn thành luận văn này
Tôi xin cảm ơn tất cả các thầy cô giáo đã tham gia giảng dạy, giúp
đỡ tôi trong suốt quá trình học tập, nâng cao trình độ kiến thức
Tôi xin gửi lời cảm ơn đến tất cả bạn bè, đồng nghiệp và người thân
đã giúp đỡ tôi trong suốt quá trình vừa qua
Vì điều kiện về thời và khả năng của bản thân có hạn nên bản luận văn này không tránh khỏi những thiếu sót Tôi rất mong các thầy cô cùng cácbạn đồng nghiệp góp ý sửa đổi, bổ xung thêm để bản luận văn thêm hoànthiện
Trang 4Chương 1 PHÂN TÍCH HỆ THỐNG TRONG MIỀN KHÔNG GIAN TRẠNG THÁI 1.1 Những nhiệm vụ cơ bản của công việc phân tích
Các nhiệm vụ cơ bản của công việc phân tích chất lượng động họccủa một hệ thống bao gồm:
u B x A dt
thái x e và không có một tác động nào từ bên ngoài thì hệ sẽ nằm nguyên tại
đó Theo định nghĩa như vậy thì điểm cân bằng x e của hệ thống phải lànghiệm của:
hệ thống sẽ nằm im tại đó, tức là trạng thái của nó không bị thay đổi
khi không có sự tác động từ bên ngoài (u=0).
Ta có thể thấy ngay được từ (1.2) là hệ tuyến tính cân bằng tại mọi
điểm trạng thái thuộc không gian Ker (A) và nếu ma trận A của mô hình
trạng thái (1.1) không suy biến thì hệ (1.1) chỉ có một điểm cân bằng duynhất là gốc toạ độ 0
2) Hiểu biết về tính ổn định Lyapunow của hệ thống Một hệ thống được gọi là ổn định Lyapunow tại điểm cân bằng x e nếu sau khi có một tácđộng tức thời (chẳng hạn như nhiễu tức thời) đánh bật hệ ra khỏi điểm cân
Trang 5bằng x e thì sau đó hệ có khả năng tự quay về được lân cận điểm cân bằng
x e ban đầu (không cần có tín hiệu điều khiển u) Nếu hệ không những tự quay về được lân cận của x e mà còn tiến tới x e thì nó được gọi là ổn định
tiệm cận Lyapunow tại x e
3) Hiểu biết về tính điều khiển được của hệ thống tại một điểm trạng
thái cho trước.
Nhiệm vụ chính của điều khiển là tìm được tín hiệu điều khiển manglại cho hệ thống một chất lượng mong muốn, tức là phải tìm ra được mộttín hiệu thoả mãn chất lượng đề ra trong số các tín hiệu có khả năng đưa hệ
thống từ điểm trạng thái x 0 ban đầu tới được điểm trạng thái đích x T Nếu
như không tồn tại bất cứ một tín hiệu điều khiển nào đưa được hệ từ x 0 tới
x T thì sự cố gắng tổng hợp hay đi tìm tín hiệu điều khiển như trên sẽ trởnên vô nghĩa (bài toán không có lời giải) Bởi vậy, để công việc điều khiển
có thể có kết quả ta phải biết được rằng có tồn tại hay không ít nhất một tín
hiệu điều khiển đưa được hệ thống từ x 0 về x T trong khoảng thời gian T hữu
hạn Nếu như tồn tại một tín hiệu điều khiển làm được việc đó thì ta nói hệ
thống là điều khiển được tại điểm trạng thái x 0
4) Hiểu biết về tính quan sát được của hệ thống tại một điểm trạng
thái cho trước.
Hay quay lại vấn đề chính xác là xây dựng bộ điều khiển cho hệthống để minh hoạ Nếu sau khi đã biết là công việc xây dựng bộ điều
khiển có thể có kết quả (hệ điều khiển được tại x 0) thì công việc tiếp theo
là phải xác định được x 0 để từ đó bộ điều khiển có thể tạo ra được tín hiệu
điều khiển thích hợp đưa hệ từ x 0 về x T Công việc xác định điểm trạng thái
x 0 có thể được tiến hành bằng cách đo trực tiếp (nhờ các bộ cảm biến,sensor) nhưng có khi phải tính toán, phải quan sát khi không thể đo được
trực tiếp x 0, chẳng hạn như gia tốc không thể đo được trực tiếp mà phảiđược suy ra từ việc đo tốc độ trong một khoảng thời gian cho phép Trong
trường hợp phải quan sát, người ta nói điểm trạng thái x 0 của một hệ làquan sát được nếu ta có thể xác định được nó thông qua việc đo các tín
hiệu vào/ra trong một khoảng thời gian hữu hạn.
1.2 Phân tích tính ổn định
1.2.1 Định lý Gerchgorin.
Trang 6Định lý 1.1 (Gerschgorin): Với mỗi giá trị riêng s k của ma trận phức(các phần tử là những số phức):
n
n n
a a
a
a a
a
a a
2 22
k a R a s
R
1 Vậy thì hệ
(1.1) với a ijR sẽ ổn định nếu a ii +R i <0 với mọi i = 1, 2,…,n.
Định lý 1.3 Hệ (1.1) ổn định BIBO khi và chỉ khi nó ổn định tiệm cận
Lyapunov, tức là khi và chỉ khi các qũy đạo trạng thái tự do có hướng tiến
về gốc toạ độ và kết thúc tại đó
Định lý 1.4 (Lyapunov): Nếu tồn tại hàm V(x), thoả mãn các điều kiện:
a) Khả vi, xác định dương, tức là V(x)>0 với x≠0 và V(x)=0 x = 0
Định lý 1.5 (Hệ quả Lyapunov): Cho một hệ tuyến tính mô tả bởi mô
hình trạng thái (1.1) Hệ sẽ ổn định nếu một trong hai điều sau được thoả mãn:
a) Tồn tại ma trận vuông P R n xn xác định dương sao cho ma trận
Trang 7Cuối cùng, và cũng để việc sử dụng định lý 1.5 được thuận tiện, thìđịnh lý của Sylvester cho sau đây như một công cụ xác định tính xác địnhdương của một ma trận đối xứng cho trước.
Định lý 1.6 (Sylvester): Cần và đủ để ma trận vuông, đối xứng:
,
2 1
2 22
2 1
1 12
n
n n
q q
q
q q
q
q q
11
22 21
12 11
q q
33 32
31
23 22
21
13 12
q
q q
q
q q
q
Tất nhiên rằng định lý Sylvester nêu trên cũng được sử dụng để xác
định tính xác định âm của một ma trận Q bằng cách kiểm tra xem ma trận
-Q có xác định dương hay không Nếu -Q xá định dương thì Q xác định
âm
1.3 Phân tích tính điều khiển được
1.3.1 Khái niệm điều khiển được và điều khiển được hoàn toàn
Định nghĩa 1.1 Một hệ thống tuyến tính, liên tục được gọi là điều
khiển được nếu tồn tại ít nhất một tín hiệu điều khiển đưa được nó từ một
điểm trạng thái ban đầu x 0 (tuỳ ý) để được gốc tọa độ 0 trong khoảng thời
gian hữu hạn.
1.3.2 Các tiêu chuẩn xét tính điều khiển được cho hệ tham số hằng
Xét hệ tuyến tính tham số hằng mô tả bởi:
với AR nxn;BR nxm (1.5)
1 Tiêu chuẩn Hautus
Định lý 1.7 (Hautus): Cần và đủ để hệ tuyến tính (1.5) điều khiển được
là:
Rank(sI - A,B) = n với mọi s C
2 Tiêu chuẩn Kalman
Định lý 1.8 (Kalman): Cần và đủ để hệ tuyến tính (1.5) điều khiển
được là:
Rank (B, AB,… A n-1 B)=n
u B x A dt
x
d
Trang 81.4 Phân tích tính quan sát được
1.4.1 Khái niệm quan sát được và quan sát được hoàn toàn
Định nghĩa 1.2 Một hệ thống có tín hiệu vào u(t) và tín hiệu ra y(t)
được gọi là:
a) Quan sát được tại thời điểm t 0, nếu tồn tại ít nhất một giá trị hữu
hạn T>t 0 để điểm trạng thái x(t) = x 0 xác định được một cách chính xác
thông qua vector các tín hiệu vào ra u(t), y(t) trong khoảng thời gian [t 0 , T].
b) Quan sát được hoàn toàn tại thời điểm t 0 , nếu với mọi T>t 0, điểm
trạng thái x 0 = x(t 0 ) luôn xác định được một cách chính xác từ vector các
tín hiệu vào ra u(t), y(t) trong khoảng thời gian [t 0 , T].
Chú ý: Yêu cầu phải đo trong khoảng thời gian hữu hạn là rất quan
trọng Khoảng thời gian quan sát càng ngắn sẽ càng tốt cho công việc điều
khiển sau này Nếu thời gian quan sát quá lớn, điểm trạng thái x 0 vừa xácđịnh được sẽ mất ý nghĩa ứng dụng cho bài toán điều khiển, ví dụ khi có
được x 0 thì có thể hệ đã chuyển đến một điểm trạng thái mới cách rất xa
điểm trạng thái x 0
1.4.2 Một số kết luận chung về tính quan sát được của hệ tuyến tính
Một cách tổng quát, sau đây ta sẽ xét hệ tuyến tính có thể khôngdừng với:
u t B x t A dt
)
R t
)
R t
)
R t
) ( là những ma trận
có phần tử có thể là hàm số phụ thuộc t.
Định lý 1.9 Hệ không dừng (1.10) sẽ
a) Quan sát được tại t 0 khi và chỉ khi tồn tại ít nhất một giá trị T>t 0
hữu hạn sao cho các vector cột của ma trận C(t)(t-t 0 )độc lập tuyến tính
trong khoảng thời gian t 0 t<T.
b) Quan sát được hoàn toàn tại t 0 khi và chỉ khi với mọi giá trị T>t 0, các
vector cột của ma trận C(t)(t-t 0 ) độc lập tuyến tính trong khoảng thời gian t 0
t<T.
Trang 9Định lý 1.10 Nếu hệ không dừng (1.10) quan sát được tại thời điểm
t 0 nếu tồn tại T 1 >t 0 hữu hạn sao cho các vector cột của C (t t0)không phụ
thuộc tuyến tính trên tòn khoảng [t 0 , T 1 ] Vì C là ma trận hằng nên (t t0)
là thành phần duy nhất phụ thuộc t trong tích C (t t0) Do (t t0) không
suy biến với mọi t (định lý 3.12 – Lý thuyết điều khiển nâng cao, Nguyễn Doãn Phước tr263) nên điều này cũng đúng với mọi khoảng [t 0 , T 1], trong
đó T là số tuỳ ý lớn hơn t 0
Định lý 1.11: Nếu hệ không dừng (1.10) quan sát được tại thời điểm
t 0 thì nó cũng quan sát được mọi thời điểm t0
1.4.3 Tính đối ngẫu và các tiêu chuẩn xét tính quan sát được của hệ tham số hằng
Cho hệ tuyến tính, tham số hằng mô tả bởi:
u B x A dt
u C x A dt
x
d
T T
T T
(1.13)
được gọi là hệ đối ngẫu với hệ (1.12) đã cho.
Có thể thấy ngay được là từ là ma trận truyền đạt của hệ (1.12):
D B A sI C s
G( ) ( )
ta cũng có ma trận truyền đạt G T (s)cho hệ đối ngẫu (1.13) với nó.
Định lý 1.12: Hệ tham số hằng (1.12) quan sát được khi và chỉ khi hệ
(1.13) đối ngẫu với nó điều khiển được
Định lý 1.13: Cho hệ tham số hằng (1.12) Các phát biểu sau là
tương đương:
a) Hệ quan sát được
C A sI
Trang 10Chương 2
THIẾT KẾ BỘ ĐIỀU KHIỂN PHẢN HỒI TRẠNG THÁI TỐI ƯU 2.1 Phương pháp biến phân
2.1.1 Nội dung phương pháp
Biến phân là một phương pháp được xây dựng từ điều kiện cầnphải có của nghiệm tối ưu u(t) của bài toán tối ưu động, liên tục, cókhoảng thời gian T xác định, cho trước và không bị ràng buộc bởi điềukiện U, hoặc nếu có bị ràng buộc thì tập U của các (vector) tín hiệu điềukhiển thích hợp phải là một tập hở
Ý tưởng chính của biến phân có thể được tóm tắt như sau:
- Từ giả thiết u(t) là tín hiệu điều khiển tối ưu, x(t) là quỹ đạo trạngthái tối ưu, người ta xây dựng một tín hiệu điều khiển khác có một sai lệchnhỏ so với nó là:
) ( )
Và xem u ~ t( ) chưa phải là tín hiệu tối ưu
- Tiếp theo, người ta giả thiết quỹ đạo trạng thái ~ t x( )do u ~ t( ) tạo
ra cho hệ thống cũng chỉ có một sai lệch rất nhỏ so với quỹ đạo trạng thái tối
Xét bài toán tìm bộ điều khiển R tĩnh, phản hồi trạng thái để điều
khiển đối tượng (2.4) Mục đích của phương pháp thiết kế bộ điều khiển Rsao cho sau khi bị nhiễu đánh bật ra khỏi điểm cân bằng (hoặc điểm làm
việc ) đến một điểm trạng thái x 0 nào đó, bộ điều khiển R sẽ kéo được hệ từ
x 0về toạ độ 0 (hay điểm làm việc cũ) và trong quá trình trở lại này sự tổn
hao năng lượng, đánh giá bởi phiếm hàm mục tiêu:
Giả sử u(t) là tín hiệu điều khiển được tạo ra bởi R đã thoả mãn điều
kiện tối ưu (2.5), tức là trong số tất cả các tín hiệu u ~ t( ) đưa hệ từ x 0 về gốc
toạ độ 0 thì u(t) sẽ là vector tín hiệu mà:
Trang 11
0 0
)
~
~
~ ( 2
1
~ )
( 2
1
dt u F u x E x u
Q dt u F u x E x u
(2.6)Bây giờ ta xét đáp ứng của đối tượng với một tín hiệu khác có sailệch nhỏ u so với u(t), tức là ứng với u~(t) u(t) u(t) Gọi ~x(t) x(t) x(t)
là quỹ đạo trạng thái tương ứng của đối tượng cũng đi từ x 0 về gốc toạ độ 0 khi được kích thích bởi u ~ t( ) Vậy thì:
x B x A dt
x d
dt
x d
giống như x(t) nên
0 ) ( )
T u x
T x u
u u T x T x T
x x T
T
x E u F
0
Để kết hợp được điều kiện biên (2.7) với (2.9) ta tạo ra tích vô hướng
của vector 0 trong (2.7) bằng cách nhân hai vế của nó với một vector p T bấtkỳ:
0 ) ( x x u
dt
d
Trang 12rồi cộng với (2.9) sẽ được:
dt B
A dt
d p E u E
u T x T
x A p dt
p d F
u B p
T u
T T x
) (
)
dt E
x A p dt
p d F
u B
T u
T T
2
1 ) (A x B u x E x u F u p
u
H u
H u
H u
L x d
trong đó H là hàm Hamilton định nghĩa theo (2.11) Ngoài ra, cùng
với ký hiệu của hàm Hamilton thì:
T
p
H dt
x d
và chúng được gọi là phương trình Euler - Lagrange.
Định lý 2.2: Nếu u(t) là tín hiệu điều khiển tối ưu thì tín hiệu đó phải
thoả mãn: