1.2 Những tính chất động học điển hình Tất nhiên chúng ta khó có thể tìm hiểu sâu được đối tượng tới mức trả lời hết được tất cả những câu hỏi về chất lượng động học của nó, tuy nhiên c
Trang 1NGÔ TRƯỜNG MINH
ĐIỀU KHIỂN CẬN TỐI ƯU CHO
HỆ PHI TUYẾN KHÔNG DỪNG CÓ RÀNG BUỘC
Chuyên ngành: ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA
LUẬN VĂN THẠC SĨ KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA
Trang 2MỤC LỤC
MỤC LỤC
LỜI CAM ĐOAN
CHƯƠNG 1: TỔNG QUAN HỆ KHÔNG DỪNG 1
1.1 Giới thiệu về hệ phi tuyến không dừng 1
1.2 Những tính chất động học điển hình 2
CHƯƠNG 2: CÁC PHƯƠNG PHÁP ĐIỀU KHIỂN CẬN TỐI ƯU CHO HỆ KHÔNG DỪNG 16
2.1 Đặc điểm của bài toán tối ưu 16
2.2 Xây dựng bài toán tối ưu 21
2.3 Phương pháp giải bài toán phi tuyến không dừng 22
2.4 Hàm Hamilton và tính chất biến phân 24
2.5 Thừa số Lagrange và hàm Hamilton 32
2.6 Phương pháp giải bài toán ràng buộc Arthur E Bryson &Yu-Chi Ho 41
2.6.1 Bất đẳng thức ràng buộc về các biến điều khiển 41
2.6.2 Bất phương trình ràng buộc của điều khiển và biến trạng thái 44
2.6.3 Bất đẳng thức ràng buộc về chức năng của các biến trạng thái 45
CHƯƠNG 3 BÀI TOÁN HỆ PHI TUYẾN KHÔNG DỪNG 50
3.1 Lời giới thiệu 50
3.2 Giải quyết vấn đề 51
3.3 Kết quả của bài toán 56
3.4 Ví dụ 62
3.5 Kết luận 63
KẾT QUẢ VÀ BÀN LUẬN 64
TÀI LIỆU THAM KHẢO 65
Trang 3Danh mục hình vẽ
Hình 1.1 Cấu trúc mô hình của hệ phi tuyến Hamerstein 3
Hình 1.2 Tìm nghiệm hệ phương trình (1.3) bằng phương pháp đồ thị 4
Hình 1.3 Điều kiện để kiểm tra tính ổn định 8
Hình 2.1: Sơ đồ hệ thống điều khiển 16
Hình 2.2 Nghiệm tối ưu địa phương/ toàn cục 17
Hình 2.3 Mô hình động cơ điện một chiều kích từ độc lập 19
Hình 2.4 Minh họa công thức biến phân 25
Hình 2.5 Các đường đồng mức và vector gradient 39
Hình 2.6 Cho một bài toán tìm thời gian ngắn nhất (barchistochorone) với một bất đẳng thức có biến trạng thái bị ràng buộc 47
Hình 2.7 Tìm thời gian ngắn nhất (barchistochorone) với tan 1 2 với một vài giá trị / h l , biến trạng thái bị ràng buộc 49
Trang 4LỜI CAM ĐOAN
Tên tôi là: Ngô Trường Minh
Học viên lớp cao học điều khiển và tự động hóa 2013B – trường đại học Bách khoa Hà Nội
Xin cam đoan: đề tài “Điều khiển cận tối ưu cho hệ phi tuyến không dừng
có ràng buộc” do thầy giáo TS Đào Phương Nam hướng dẫn là của riêng tôi
“Tôi cam đoan rằng, ngoại trừ các kết quả tham khảo từ các công trình khác như đã ghi rõ trong luận văn, các công việc trình bày trong luận văn này là do chính tôi thực hiện và chưa có phần nội dung nào của luận văn này được nộp để lấy một bằng cấp ở trường này hoặc trường khác”
Trang 5CHƯƠNG 1: TỔNG QUAN HỆ KHÔNG DỪNG
1.1 Giới thiệu về hệ phi tuyến không dừng
Thường xu hướng đơn giản hóa vấn đề là chỉ nghiên cứu hệ dừng, tuy nhiên
có những bài toán điều khiển không thể tránh được hệ không dừng Ví dụ: điều khiển xe bám đường đi khi đường đi thay đổi (không phải đường thẳng)
Lịch sử nghiên cứu: Phân tích và điều khiển hệ phi tuyến luôn là vấn đề thời
sự, thu hút được sự quan tâm của những người làm trong lĩnh vực kỹ thuật hệ thong Những phương pháp phân tích và tổng hợp hệ thống trên cơ sở lý thuyết các hệ thống điều khiển phi tuyến đã đưa con người đến gần hơn nữa trong các ứng dụng thực tế cũng như khả năng nâng cao được chất lượng cho các hệ thống điều khiển hiện tại Nó chính là chiếc cầu nối giữa lý thuyết và thực tiễn Chính
vì thế, ngay từ khi lý thuyết điều khiển được khai sinh, mảng lý thuyết các hệ thống điều khiển phi tuyến đã khẳng định được vị trí của mình Nhiều phương pháp phân tích và điều khiển hệ phi tuyến đã ra đời và phát triển song song cùng
lý thuyết điều khiển tuyến tính cơ bản Đó là các phương pháp phân tích mặt phẳng pha, phương pháp phân tích và điều khiển hệ Hammerstein, hệ Wiener, phương pháp cân bằng điều hòa, lý thuyết Lyapunov hay phương pháp điều khiển trượt (Tài liệu [1] trang 3)
Đặc biệt trong những năm gần đây, với sự trợ giúp của nhiều ngành khoa học khác nhau, chuyên ngành phân tích và điều khiển hệ phi tuyến đã có những bước nhảy vọt về mặt chất lượng, cả trong lý thuyết lẫn ứng dụng Nền móng cho sự phát triển về mặt lý thuyết trước tiên có thể kể đến là phép đổi trục tọa độ
vi phôi xây dựng trên nền hình học vi phân, đã tạo ra khả năng nghiên cứu, phân tích hệ phi tuyến theo hướng tận dụng các kết quả đã có của điều khiển tuyến tính…Bên cạnh sự phát triển về chất lượng trên, trường phái phân tích và điều khiển hệ phi tuyến kinh điển cũng đã được bổ sung thêm nhiều kỹ thuật hữu ích
Trang 6dự báo theo mô hình (Model Predictiv Control - MPC)… Không những thế, lý thuyết các hệ thống điều khiển phi tuyến đã còn được ứng dụng thành công cho lớp đối tượng phi tuyến có tính chất động học đặc biệt như các hệ thụ động, các
hệ hồi tiếp chặt tham số, hệ tiêu tán…Sự tiến bộ to lớn của chuyên ngành phân tích và điều khiển hệ phi tuyến cần phải nhanh chóng ứng dụng vào thực tiễn
Đó cũng là điều mà tác giả khi trình bày luận văn này với tên đề tài là “ Điều khiển cận tối ưu cho hệ phi tuyến không dừng có ràng buộc”
Đây là một luật điều khiển có phản hồi xây dựng bài toán theo phương pháp gần đúng cho hệ điều khiển tối ưu Được áp dụng cho đối tượng hệ phi tuyến không dừng có thời gian ràng buộc tới hệ điều khiển cho hệ bất phương trình Đây là một luật điều khiển có hiệu quả khi hệ thống có nhiễu loạn dẫn đến sự sai lệch so với giá trị đặt ban đầu khi mô hình không bền vững
1.2 Những tính chất động học điển hình
Tất nhiên chúng ta khó có thể tìm hiểu sâu được đối tượng tới mức trả lời hết được tất cả những câu hỏi về chất lượng động học của nó, tuy nhiên có một số câu hỏi cơ bản về chất lượng điển hình của đối tượng nói riêng và hệ thống nói chung mà bất cứ một bài toán phân tích nào cũng phải trả lời được, đó là các câu hỏi về:
- Điểm trạng thái cân bằng và điểm trạng thái dừng
- Tính ổn định của hệ tại những điểm cân bằng đó
- Khả năng tự dao động của hệ cũng như tần số, biên độ và tính ổn định của các dao động này
- Có hay không hiện tượng hỗn loạn trong hệ
- Có hay không khả năng phân nhánh trong hệ
- Và những tính chất khác như bậc tương đối, tính động học không …
Điểm trạng thái cân bằng và điểm dừng Đương nhiên, sẽ hoàn hảo nếu ta có được các kết luận về tính chất động học của hệ thống cho toàn bộ không gian trạng thái (không gian vector của trạng thái x ) Song rất có thể là điều đó là
Trang 7không thực hiện được Nếu như vậy, người ta đành phải chấp nhận khảo sát tính chất của hệ trong một số vùng trạng thái đặc biệt mang tính chất điển hình và một trong các vùng đó là lân cận của những điểm trạng thái cân bằng và điểm trạng thái dừng (Tài liệu [1] trang 35)
Định nghĩa 1.1: Xét hệ phi tuyến dừng ( , )
( , )
d x
f x u dt
a) Điểm trạng thái cân bằng xe (equilibrium point) là điểm trạng thái mà tại đó
và nếu không bị kích thích (u 0 ) hệ sẽ không thay đổi trạng thái Như vậy
điểm trạng thái cân bằng xe sẽ chính là nghiệm của :
Ví dụ: Xác định điểm trạng thái dừng cho hệ Hammerstein
Hình 1.1 Cấu trúc mô hình của hệ phi tuyến Hamerstein
Xét hệ phi tuyến Hamerstein có cấu trúc như hình vẽ Giả sử khâu tuyến tính với hàm truyền G(s) có G(0) là hữu hạn Do khâu phi tuyến là khâu tĩnh nên các trạng thái x của hệ Hamerstein cũng chính là trạng thái của khâu tuyến tính
Trang 8xác định cho trước, sẽ có d x d 0
dt Khi đó các tín hiệu có bên trong hệ là e(t),
u(t) và y(t) cũng sẽ xác lập tại các giá trị dừng e u yd, ,d d và giữa chúng có quan
u = f(e) và e d G (0) u
Số các điểm dừng cũng là số các giao điểm đó Như vậy, tùy thuộc vào hệ
mà cụ thể là khâu phi tuyến tĩnh và vào khâu tuyến tính động cũng như vào tín hiệu đầu cho trước ( )t d , bài toán có thể vô nghiệm (hệ không có điểm trạng thái dừng ứng với ( )t d), song cũng có thể có một hay nhiều điểm trạng thái dừng
Hình 1.2 Tìm nghiệm hệ phương trình (1.3) bằng phương pháp đồ thị
Tiêu chuẩn xét tính ổn định cho hệ không dừng
Xét tính ổn định của hệ không dừng, cân bằng tại gốc và có mô hình không
bị kích thích, không dừng có mô hình: d x f x( , t)
dt với f(0, ) 0t , t 0 thỏa
Trang 9mãn mọi điều kiện đầu x t ( )0 x 0 Để thực hiện được điều này, người ta đưa thêm vào một số khái niệm sau: (Tài liệu [1] trang 80)
c) Hàm thực, đơn điệu giảm ( ),z z 0 thỏa lim ( ) 0
z z
được gọi là thuộc lớp L d) Hàm thực, liên tục ( , )z t với z t, 0 sẽ được gọi là thuộc lớp KL nếu khi t
cố định thì nó thuộc lớp K và khi z cố định thì nó thuộc lớp L
e) Hàm thực, liên tục ( , )z t với z t, 0 sẽ được gọi là thuộc lớp KL∞ nếu khi t
cố định thì nó thuộc lớp K∞ và khi z cố định thì nó thuộc lớp L
Ngoài ra, định lý Lyapunov có phát biểu:cho hệ tự trị
tiệm cận toàn cục (GAS – global asymptotically stable)
b) Khi W( )x 0, x ( xác định bán dương) thì hệ là ổn định tại gốc tọa độ
Trang 10Ta còn nhận thấy khi hệ đã ổn định tiệm cận hoặc ổn định, thì hoặc sẽ có ( ) 0
x t hoặc nó sẽ ở lại trên một đường đồng mức nào đó bao gốc ( 90 )0 ,
nếu như nó không tiến về gốc tọa, nên cũng sẽ luôn có lim 0
t
dV dt
Suy ra:
Định lý (LaSalle): Xét hệ phi tuyến không bị kích thích và cân bằng tại gốc
mô tả bởi (tài liệu [1] trang 80)
a) Nếu W( , )x t 0với mọi x và với mọi t t0thì hệ sẽ ổn định tại t0
b) Nếu W( , )x t ( )x với x , t t0và Kthì hệ sẽ ổn định tiệm cận tại t0
với miền ổn định và khi đó hàm V( , )x t sẽ được gọi là Hàm Lyapunov
c) Nếu hệ ổn định hoặc ổn định tiệm cận thì sẽ luôn có lim W( , ) 0
Chứng minh: (Tài liệu [1] trang 81)
a) Từ (1.9) ta suy ra hàm V( , )x t không tăng theo t Vậy cũng phải có với mọi
0
t t : V( ( ), t) x t V x t ( ( ), )0 t0 V x t ( , )0 0
Bây giờ ta chọn một số dương tùy ý Vì 1( ), ( ) r 2 r thuộc lớp K nên luôn tồn tại một hằng cố dương ( , ) t0 khác thỏa mãn 1( ) 2( ) Gọi x t( )là một quỹ đạo trạng thái có điểm đầu x t ( )0 x0 thỏa mãn x0 ( , )t0 Vậy thì:
1( ) 2( ) V( , t ) V( (t), t) x0 0 x
Trang 11Nói cách khác, quỹ đạo trạng thái x t( )đi từ x0không thể ra ngoài lân cận
được nữa, vì nếu không, với x ta sẽ thu được điều nghịch lý:
( , ) ( x ) ( )
V x t Vậy hệ ổn định tại 0(đ.p.c.m) b) Với W( , )x t ( ) 0x thì hệ là ổn định Ngoài ra, khi x 0thì với ( ) x 0hay L V x t f ( , ) ( ) 0x vẫn phải có góc 900 nên quỹ đạo trạng thái x t( )vẫn cắt các đường đồng mức của V( , )x t từ ngoài vào trong Do đó ta sẽ có thêm lim ( ) 0
về 0, ta có điều phải chứng minh
Đương nhiên định lý LaSalle hoàn toàn áp dụng được cho hệ không dừng với
mô hình (1.7), còn gọi là hệ bất biến theo thời gian Vậy nên tiêu chuẩn Lyapunov (định lý 1.7) chỉ là một trường hợp riêng của định lý LaSalle và trong nhiều tài liệu, được gọi là trường hợp bất biến của LaSalle
Tiêu chuẩn Lyapunov và định lý LaSalle chỉ là điều kiện đủ Điều này nói rằng nếu ta không tìm được một hàm Lyapunov cho hệ thì vẫn không ổn định (không tìm được không có ngĩa là nó không tồn tại) Chỉ tới khi ta chứng minh được rằng thực sự không tồn tại hàm Lyapunov thì mới có thể khẳng định được
là hệ không ổn định
Mặc dù không khẳng định được hệ (1.7) có ổn định hay không khi ta không tìm ra được một hàm Lyapunov V x t( , ) cụ thể, song hoàn toàn tương tự ta có thể đưa ra một điều kiện đủ để kiểm tra tính không ổn định của hệ (1.7)
Trang 12Hình 1.3 Điều kiện để kiểm tra tính ổn định
Xét một hàm V x t( , )hợp thức có vector gradient luôn chỉ từ trong ra ngoài
trong toàn bộ không gian trạng thái Hình 1.3 nếu đạo hàm
Định lý: hệ (1.7) sẽ không ổn định Lyapunov tại 0nếu tồn tại hàm hợp phức ( , )
V x t và đạo hàm (1.10) của nó xác định dương (Tài liệu [1] trang 82)
Khác với tiêu chuẩn Lyapunov (định lý 1.47) mà ở đó hàm V x( )chỉ cần thỏa mãn hai tích chất (1.5) và (1.6) thì ở định lý LaSalle, hàm V x t( , )phải là hàm hợp thức, túc là thỏa mãn (1.8) Ta có thể dễ dàng thấy điều kiện hợp thức (1.8) chứa đựng luôn cả hai điều kiện (1.5) và (1.6), nhưng điều ngược lại thì không Điều này dẫn tới việc nếu chỉ sử dụng một hàm V x( ) thỏa mãn (1.5) và (1.6) cho hệ không dừng (1.7) thay cho hợp thức (1.9) khi áp dụng đính lý LaSalle sẽ rất có thể dẫn đến những kết quả sai lầm
Trang 13Xác định âm, song hệ chỉ là ổn định chứ không ổn định tiệm cận
Tương tự, nếu ta lại chọn hàm xác định dương (không hợp thức)
Ổn định tiệm cận đều và ổn định theo hàm mũ (Tài liệu [1] trang 83)
Với tiêu chuẩn Lyapunov cho hệ tự trị, dừng hay định lý LaSalle cho hệ không tự trị, không dừng (1.7) ta có thể kiểm tra được tính ổn định tiệm cận tại
0 của một hệ phi tuyến nói chung, tuy nhiên lại vẫn không biết được dạng tiến
về 0của quỹ đạo trạng thái tự do x t( )của nó, do đó cũng không thể kết luận được
về chất lượng ổn định của nó, chẳng hạn vẫn không thể biết được nó ổn định nhanh hay chậm, có ổn định đều hay không hoặc trước khi tiến về 0 có khi nào
Trang 14nó rời xa điểm gốc tọa độ hay không … Để khắc phục nhược điểm này người ta
đã đưa ra một vài tiêu chuẩn để đánh giá chất lượng ổn định của hệ như:
- Hệ (1.7) ổn định càng nhanh nếu nó có giá trị W( )x với x 0càng lớn, vì khi đó góc cắt giữa quỹ đạo trạng thái tự do x t( )và đường đồng mức cao (nếu x t( ) càng cắt vuông góc với đường đồng mức, nó sẽ tiến về 0 càng nhanh)
- Hệ là ổn định đều theo nghĩa nếu có t1 t2thì cũng có x t( )1 x t( )2 khi giá trị W( , )x t là đơn điệu theo t
Song những tiêu chuẩn đánh giá này, do dựa chủ yếu vào dạng hàm hợp thức V( , )x t được chọn, nên chỉ mang tính định tính và không thể được gọi là đã đánh giá đúng chất lượng ổn định của hệ
Mong muốn có những tiêu chuẩn đánh giá chất lượng ổn định hệ phi tuyến một cách thống nhất và chính xác, người ta đã so sánh với tính ổn định của hệ tuyến tính, xác định xem quỹ đạo trạng thái tự do của hệ tuyến tính ổn định có những đặc điểm gì để từ đó đặt ra những khái niệm và chất lượng ổn định cho hệ phi tuyến nói chung
Xét hệ tuyến tính ổn định (tiệm cận) với mô hình không bị kích thích:
d x
Ax
dt , A là ma trận bền ( có tất cả giá trị riêng nằm bên trái trục ảo)
Khi đó nghiệm x t( )e x At 0với x0 x (0)là trạng thái đầu, sẽ có các tính chất sau:
Trang 15- Nếu tất cả các giá trị riêng của A là những số thực thì sẽ có x t( ) (x0 , )t
với KLvà t 0, vì khi t1 t2thì At1 At2
Tương ứng, trong hệ phi tuyến người ta cũng có các định nghĩa về chất lượng quỹ đạo trạng thái tự do của một hệ phi tuyến ổn định như sau:
Định nghĩa 1.3: Xét hệ phi tuyến không dừng, cân bằng tại gốc và có mô
hình không bị kích thích (1.7) Khi đó hệ sẽ được gọi là: (Tài liệu [1] trang 84) a) ổn định đều tại t0(uniformly stabil) nếu tồn tại miền và hàm Kđể có
d) Ổn định tiệm cận đều toàn cục tại t0 nếu nó ổn định tiệm cận đều với miền
ổn định là toàn bộ không gian trạng thái và KL
e) Ổn định theo hàm mũ tại t0nếu nó ổn định tiệm cận đều toàn cục và thỏa mãn
0
( )
0 0 0
(x ,t t ) x e b t t
với , blà hai số dương và x t ( )0 x0
f) Ổn định toàn cục theo hàm mũ nếu nó ổn định theo hàm mũ, có là toàn bộ không gian trạng thái
Trong định nghĩa trên ta có đề cập tới khái niệm ổn định tại t0 Đây là khái niệm ổn định Lyapunov được bổ sung thêm cho hệ không dừng (1.7) và thực chất được xác định ở thời điểm t0theo nghĩa: Hệ không dừng (1.7) sẽ ổn định
Trang 16thuộc (chứ không phụ thuộc t0) sao cho quỹ đạo trạng thái tự do x t( )của nó với điều kiện đầu x t ( )0 x0 , luôn thỏa mãn: x0 ( ) x t( ) , t t0
Rõ ràng hệ đã ổn định đều thì cũng sẽ ổn định Lyapunov, song ngƣợc lại thì không phải lúc nào cũng đúng Ta xét ví dụ sau:
Ví dụ: Xét hệ không dừng có mô hình không bị kích thích: (Tài liệu [1] trang 85)
Định lý: Xét hệ phi tuyến không bị kích thích và cân bằng tại gốc mô tả bởi (1.7) Ký hiệu V x t( , ) là hàm trơn thỏa mãn: (Tài liệu [1] trang 85)
a) Ổn định đều nếu 1( ), ( ) r 2 r Kvà 3( ) 0 r khi r [0, )
b) Ổn định tiệm cận đều nếu 1( ), ( ) r 2 r và 3( ) r đều là những hàm thuộc lớp K
khi r [0, )
Trang 17c) Ổn định tiệm cận đều toàn cục nếu 1( ), ( ) r 2 r và 3( ) r là những hàm thuộc lớp Kvà không phụ thuộc
d) Ổn định theo hàm mũ nếu i( )r k r i akhi r [0, ) và a0 vớii 1, 2, 3
e) Ổn định tiệm cận toàn cục theo hàm mũ nếu không phụ thuộc và c) đúng với mọi 0
Chứng minh: Do hàm V x t( , )với các tính chất đã nêu trên thỏa mãn điều kiện (1.8) và (1.9) của định lý LaSalle với mọi t0 0 nên ta có ngay khẳng định a) Khẳng định b) được suy ra từ kết quả của định lý LaSalle vì 3( )x là xác định dương Khẳng định c) là hiển nhiên Với d) thì hệ ổn định đều và có
0
x t m x e với mọi x0 và m là một số dương thích hợp
Định lý Khalil: Xét hệ (1.7) ký hiệu V x t( , )là hàm trơn thỏa mãn: (Tài liệu [1] trang 86)
Nhưng do b, c>0 nên điều kiện đầu V x t t ( ( ), )0 0 V x t ( ), )0 0 V0ta cũng sẽ có
nghiệm V x t( ), ) của bất phương trình vi phân trên thỏa mãn:
Trang 180 0
1/
0 0
Định lý Lipschitz : Cần và đủ để hệ không dừng (1.7) với vector hàm f x t( , )
thỏa mãn Lipschitz, ổn định (địa phương) theo hàm mũ tồn tại hàm V x( , t) sao cho:
t
V x t
d x d x
( ) p t t
x t q x e với p 0,q 0 và x0 x t ( )0
Thì sẽ tồn tại hàm V x( , t)có ba tính chất nêu trong (1.12) Và để làm được điều này, ta sẽ sử dụng lại ký hiệu f( )x chỉ nghiệm của phương trình vi phân (1.7) tại thời điểm ứng với điều kiện ban đầu xx t( ) tùy ý nhưng cho trước Cùng với ký hiệu đó, ta xây dựng hàm xác định dương
Trang 192 ( , ) ( )
t T f t
V x t x d
Có T>0 là hằng số thời gian tùy chọn Từ giả thiết rằng hệ là ổn định (địa
phương) theo hàm mũ ở đây ta phải có:
1
( ) ( , t)
f
t T n
i f
i i
Trang 20CHƯƠNG 2: CÁC PHƯƠNG PHÁP ĐIỀU KHIỂN CẬN TỐI ƯU CHO
HỆ KHÔNG DỪNG 2.1 Đặc điểm của bài toán tối ưu
a) Khái niệm
Một hệ điều khiển được thiết kế ở chế độ làm việc tốt nhất là hệ luôn ở trạng thái tối ưu theo một tiêu chuẩn chất lượng nào đó (đạt được giá trị cực trị) Trạng thái tối ưu có đạt được hay không tùy thuộc vào yêu cầu chất lượng đặt ra, vào sự hiểu biết về đối tượng và các tác động lên đối tượng, vào điều kiện làm việc của hệ điều khiển…
Hình 2.1: Sơ đồ hệ thống điều khiển
Trong đó: - :tín hiệu đầu vào
- u : Tín hiệu điều khiển
- y : tín hiệu đầu ra
- e z : tín hiệu sai lệch
- n n1, 2 : tín hiệu nhiễu Chỉ tiêu chất lượng Q của một hệ thống có thể được đánh giá theo sai lệch của đại lượng được điều khiển y so với trị số mong muốn , lượng quá điều khiển (trị số cực đại max so với trị số xác lập (∞) tính theo phần trăm), thời gian quá độ… hay theo một chỉ tiêu hốn hợp trong điều kiện làm việc nhất định như hạn chế về công suất, tốc độ, gia tốc… Do đó việc chọn một luật điều khiển
Trang 21và cơ cấu điều khiển để đạt đƣợc chế độ làm việc tối ƣu cón tùy thuộc vào lƣợng thông tin ban đầu mà ta có đƣợc
Ở đây chúng ta có thể thấy đƣợc sự khác biệt của chất lƣợng tối ƣu khi lƣợng
thông tin ban đầu thay đổi (Hình 2.2)
Hình 2.2 Nghiệm tối ưu địa phương/ toàn cục
Khi tín hiệu điều khiển u giới hạn trong miền [u1, u2], ta có đƣợc giá trị tối ƣu cực đại Q*1 của chỉ tiêu chất lƣợng J ứng với tín hiệu điều khiển u*1
Khi tín hiệu điều khiển u không bị ràng buộc bởi điều kiện u1 ≤ u ≤u2, ta có giá trị tối ƣu Q*2 > Q*1 ứng với u2* Nhƣ vậy giá trị tối ƣu thực sự bây giờ là Q*
2 Tổng quát hơn, khi ta xét bài toán trong một miền [um , un] nào đó và tìm đƣợc giá trị tối ƣu Q*
1 thì đó là giá trị tối ƣu cục bộ Nhƣng khi bài toán không
có điều kiện ràng buộc đối với u thì giá trị tối ƣu là Q*
= extremum (Q*i) với Q*i
là các giá trị tối ƣu cục bộ, giá trị Q*chính là giá trị tối ƣu toàn cục
Điều kiện tồn tại cực trị:
- Đạo hàm bậc một của Q theo u phải bằng 0 : 𝜕𝑄
Trang 22b) Điều kiện thành lập bài toán tối ưu
Để thành lập bài toán tối ưu thì yêu cầu đầu tiên là hệ thống phải có đặc tính phi tuyến có cực trị
Bước quan trọng trong việc thành lập một hệ tối ưu là xác định chỉ tiêu chất lượng Q Nhiệm vụ cơ bản ở đây là bảo đảm cực trị của chỉ tiêu chất lượng Q
Ví dụ như khi xây dựng hệ tối ưu tác động nhanh thì yêu cầu đối với hệ là nhanh chóng chuyển từ trạng thái này sang trạng thái khác với thời gian quá độ nhỏ nhất, nghĩa là cực tiểu hóa thời gian quá độ Hay khi tính toán động cơ tên lửa thì chỉ tiêu chất lượng vượt được khoảng cách lớn nhất với lượng nhiên liệu đã cho
Chỉ tiêu chất lượng Q phụ thuộc vào tín hiệu ra x(t), tín hiệu điều khiển u(t)
và thời gian t Bài toán điều khiển tối ưu là xác định tín hiệu điều khiển u(t) làm cho chỉ tiêu chất lượng J đạt cực trị với những điều kiện hạn chế nhất định của u
Ta có phương trình cân bằng moment của động cơ:
𝜔 = 𝑑𝜑
Trang 23Hình 2.3 Mô hình động cơ điện một chiều kích từ độc lập
Trong đó kM = CM = const; Mq là moment quán tính; là tốc độ góc; là góc quay Giả sử bỏ qua phụ tải trên trục động cơ (Mc = 0) thì :
Bài toán tối ưu tác động nhanh ( thời gian tối thiểu) :
Tím luật điều khiển u(t) với điều kiện hạn chế 𝑢 ≤ 1 để động cơ quay từ vị trí ban đầu có góc quay và tốc độ đều bằng 0 đến vị trí cuối cùng có góc quay bằng 0 và tốc độ bằng 0 với một khoảng thời gian ngắn nhất
Vì cần thời gian ngắn nhất nên chỉ tiêu chất lượng Q sẽ là:
𝑄 = 𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 𝑑𝑡 = 𝑇
𝑇 0
Rõ ràng từ phương trình trên ta phải có L[x(t), u(t),t] = 1
Trang 24Như vậy, đối với bài toán tối ưu tác động nhanh thì chỉ tiêu chất lượng Q có dạng: 𝑄 = 1𝑑𝑡 = 𝑇0𝑇
Bài toán năng suất tối ưu:
Năng suất ở đay được xác định bởi góc quay lớn nhất của động cơ trong thời gian T nhất định Khi đó chỉ tiêu chất lượng J có dạng:
𝑄 = 𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 𝑑𝑡0𝑇 = 𝜑𝑇 − 𝜑0 = 𝜑 0𝑇 𝑡 𝑑𝑡
Do đó L[x(t), u(t),t] = 𝜑 𝑡 = 𝑥 (𝑡) và ta có chỉ tiêu chất lượng Q đối với bài toán năng suất tối ưu như sau: 𝑄 = 𝑥 0𝑇 𝑡 𝑑𝑡
Bài toán năng lượng tối thiểu:
Tổn hao năng lượng trong hệ thống: 𝑃 = 𝑈0𝑇 𝑢𝑖𝑢 𝑑𝑡
Dựa vào phương trình cân bằng điện áp: Uu = iuRu + ke
Và phương trình cân bằng moment:𝑘𝑀𝑖𝑢 − 𝑀𝑐 = 𝑀𝑞𝑑𝜔𝑑𝑡
c) Tối ưu hóa tĩnh và động
Chúng ta cần phân biệt hai dạng bài toán tối ưu hóa tĩnh và tối ưu hóa động Tối ưu hóa tĩnh là bài toán không phụ thuộc vào thời gian Còn đối với bài toán tối ưu hóa động thì thời gian cũng là một biến mà chúng ta cần phải xem xét đến
Trang 252.2 Xây dựng bài toán tối ưu
a) Tối ưu hóa không có điều kiện ràng buộc
Một hàm chỉ tiêu chất lượng vô hướng L(u) = 0 được cho trước là một hàm của một vector điều khiển hay một vector quyết định u ∈ 𝑅𝑚 Chúng ta cần chọn giá trị của u sao cho L(u) đạt giá trị nhỏ nhất
Để giải bài toán tối ưu, ta viết chuỗi Taylor mở rộng cho độ biến thiên của
L(u) như sau: 𝑑𝐿 = 𝐿𝑇𝑢𝑑𝑢 + 1
2𝑑𝑢𝑇𝐿𝑢𝑢𝑑𝑢 + 𝑂(3) (2.6) Với O(3) có thể côi là số hạng thứ 3 Grad của L theo u là một vector m cột:
Trang 26Nếu Luu là xác định âm thì điểm cực trị chính là điểm cực đại, còn nếu Luu là không xác định thì điểm cực trị chính là điểm yên ngựa Nếu Luu là bán xác định thì chúng ta sẽ xét đến thành phần bậc cao hơn trong (2.) để xác định được loại của điểm cực trị
b) Tối ưu hóa với các điều kiện ràng buộc
Cho hàm chỉ tiêu chất lượng vô hướng L(x,u), với vector điều khiển u Rn Bài toán đưa ra là chọn u sao cho hàm chỉ tiêu chất lượng L(x,u) đạt giá trị nhỏ nhất và thỏa mãn đồng thời các phương trình điều kiện ràng buộc
Vector trạng thái x được xác định từ một giá trị u cho trước bằng mối quan
hệ (2.12), vì thế f là một hệ gồm n phương trình vô hướng, f Rn
Để tìm điều kiện cần và đủ của giá trị cực tiểu, đồng thời thỏa mãn f(x,u) = 0,
ta cần làm chính xác như trong phần trước Đầu tiên ta khai triển dL dưới dạng
Taylor, sau đó xác định hạng số thứ nhất và thứ hai
2.3 Phương pháp giải bài toán phi tuyến không dừng
a) Phương pháp biến phân (Tài liệu [2] trang 165)
Biến phân (variation) là phương pháp được xây dựng từ điều kiện cần cho nghiệm tối ưu u t ( ) của bài toán tối ưu động, liên tục, phát biểu như sau:
Bài toán 2.1: Cho hệ liên tục mô tả bởi: d x f x u t( , , )
trong đó vector f x u t( , , )trơn theo x u,
Với
1( )( )
n
n
x t x
Trang 271( )( )
m
m
u t u
là vector của n phương trình mô tả hệ thống
Bậc n với các điều kiện ràng buộc:
- Tập U mlà một tập con hở trong không gian điều khiển m
- Khoảng thời gian T xảy ra quá trình tối ưu là cố định cho trước
- Điểm đầu x (0) x0 có thể là cố định cho trước, song cũng có thể là bất kỳ
- Điểm cuối x T( ) x T có thể là cố định cho trước, song cũng có thể là bất kỳ Hãy xác định tín hiệu điều khiển tối ưu u t ( ) U hoặc bộ điều khiển phản hồi trạng thái tối ưu u u x t( , ), đưa hệ đi từ x(0)tới x T trong khoảng thời gian T sao
cho hàm chi phí Q cho bởi
0 ( , ) ( ) ( , , )
T T
T
T T
Đây chính là hệ trong bài toán (2.1) được bổ sung chi tiết thêm các điều kiện
về điểm trạng thái đầu x0 , điểm trạng thái cuối
T
x , khoảng thời gian xảy ra quá
trình tối ưu T và về ràng buộc U của tín hiệu điều khiển u t( ) Trong bài toán trên
ta sẽ không xét đén trường hợp ít có ý nghĩa thực tiễn là hệ có cả điểm đầu x0và điểm cuối x Tbất kỳ
Ý tưởng chính của biến phân để giải bài toán 2.1 có thể được tóm tắt như
sau:
Trang 28- Từ giả thiết u t ( )là tín hiệu điều khiển tối ưu x t ( )là quỹ đạo trạng thái tối
ưu, người ta xây dựng một tín hiệu điều khiển khác có một sai lệch nhỏ so với nó là:
u t u t t trong đó ( )t là rất nhỏ và tùy ý (2.15)
- Tiếp theo, ta giả thiết quỹ đạo trạng thái x t( )do u t( )taọ ra cho hệ thống cũng chỉ có một sai lệch rất nhỏ so với quỹ đạo trạng thái tối ưux t ( ), tức là: x t ( ) x t ( ) ( ) t cũng có ( )t rất nhỏ (2.16) Giả thiết này luôn được thỏa mãn nếu hệ (2.13) là dừng tức là :
( , )
d x
f x u
Và vector hàm f x u( , )liên tục theo xvà u
- Cuối cùng, từ điều kiện phải có của tín hiệu điều khiển tối ưu:
Ta xác định tính chất của điều khiển tối ưu u t ( ), gọi là tính chất biến phân
2.4 Hàm Hamilton và tính chất biến phân
a) Biến đồng trạng thái và điều kiện cần (Tài liệu [2] trang 166)
Xét bài toán tối ưu (2.1) Ký hiệu u t ( )là nghiệm tối ưu của bài toán đó và
( )
x t là quỹ đạo trạng thái tối ưu tương ứng Ký hiệu tiếp u t( )là tín hiệu điều khiển được biến phân từ u t ( )theo công thức (2.15)và x t( )là quỹ đạo trạng thái tương ứng nó thỏa mãn điều kiện biến phân (2.16) Hiển nhiên khi đó ta có bất
đẳng thức (2.18) Hình (2.4) minh họa trục quan hai quỹ đạo trạng thái x t ( )và
Trang 29( )
x t Từ hình minh họa đó ta rút ra được quan hệ giữa và điểm trạng thái đầu x0
và cuối x T như sau :
- Nếu x0 là cố định và cho trước thì phải có (0) 0
- Nếu x0không cố định, chẳng hạn bị ràng buộc x0 S0, thì có thể sẽ có(0) 0
- Nếu x T là cố định và cho trước thì phải có ( )T 0
- Nếu x T không cố định, chẳng hạn bị ràng buộc xT ST, thì có thể sẽ có( )T 0
Hình 2.4 Minh họa công thức biến phân
Với các ký hiệu như trên thì sau cùng một khoảng thời gian T không đổi sẽ
Trang 30T T
Là các ký hiệu Jacobi của hàm nhiều biến g x u( , )
Hoàn toàn tương tự, như mô hình trạng thái (2.17) của hệ ta cũng có :
Trang 31Và khi ỏp dụng cụng thức tớch phõn toàn phõn, sẽ đƣợc với mọi vector p :
0 0
T T
0 l¯ bất kỳ (0)
tùy ý nếu l¯ cố định cho trước
nếu x p
0 l¯ bất kỳ ( )
tùy ý nếu l¯ cố định cho trước
T
T Q
f g
Trang 320 0
T Q
H dt u
Trang 33
Như vậy,đây là bài toán 2.1 có điểm đầu, điểm
cuối cố định,T=2 và c =0 Để giải bài toán ta áp dụng phương pháp biến phân
trong đó s s1, 2 là những giá trị riêng của ma trận A, tức
là nghiệm của : det(sIA) 0 s1 2,s2 2
- Các hệ số k k1, 2 được xác định từ điều kiện biên x(0) 4, x(2) 0như sau
b) Tính chất của hàm Hamilton dọc theo quỹ đạo tối ưu
Quay lại bài toán 2.1 của phương pháp biến phân, trong đó khảng thời gian
cố định cho trước T xảy ra quá trình tối ưu có thể là hữu hạn hoặc vô hạn (Tài
liệu [2] trang 172)
Phương pháp biến phân (định lý 2.1) đã chỉ ra rằng nghiệm u t ( )tối ưu của
Trang 34 thỏa mãn điều kiện biên (2.22) và (2.23)
Định lý 2.2 : xét bài toán 2.1 với phiếm hàm mục tiêu (2.14) có c 0 Khi
đó, dọc theo quỹ đạo tối ƣu u t ( ) , ( ) x t hàm Hamilton (2.25) tối ƣu :
b) Do x T bất kỳ nên có p T( ) 0 Do T nên theo định lý Barbalas, từ tính
hội tụ của tích phân vô hạn
0 ( , )
Tiếp theo, xuất phát từ: