Tạ Duy Phượng, luận vănchuyên ngành Toán giải tích với đề tài: Bài toán điều khiển tối ưu toàn phương mô tả bởi hệ phương trình vi phân đại số tuyến tính được hoàn thành bởi sự nhận thức
Trang 1CHU THỊ HỒNG
BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU TOÀN PHƯƠNG MÔ TẢ BỞI HỆ PHƯƠNG TRÌNH
VI PHÂN ĐẠI SỐ TUYẾN TÍNH
LUÂN VĂN THAC Sĩ TOÁN HOC
Trang 2TRƯỜNG ĐẠI HỌC sư PHẠM HÀ NỘI 2
CHU THỊ HỒNG
BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU TOÀN PHƯƠNG MÔ TẢ BỞI HỆ PHƯƠNG TRÌNH
VI PHÂN ĐẠI SỐ TUYẾN TÍNH
Chuyên ngành: Toán giải tích Mã số: 60
46 01 02
LUẬN VẴN THẠC SĨ TOÁN HỌC
Người hướng dẫn khoa học: PGS TS TẠ DUY PHƯỢNG
HÀ NỘI, 2015
Trang 3Luận văn được thực hiện và hoàn thành dưới sự hướng dẫn khoa học của PGS.
TS Tạ Duy Phượng Tôi xin được gửi lời cảm ơn sâu sắc đến Thầy hướng dẫn khoahọc của mình, người đã giao đề tài và tận tình hướng dẫn trong suốt quá trình tìmhiểu, nghiên cứu để tôi có thể hoàn thành luận văn này
Nhân dịp này, tôi cũng xin chân thành cảm ơn tới toàn thể các Thầy Cô giáo khoaToán đặc biệt là chuyên ngành Toán Giải tích, Phòng Sau đại học, trường Đại học
Sư phạm Hà Nội 2 đã giảng dạy và giúp đỡ tôi trong suốt quá trình học tập và nghiêncứu tại trường
Cuối cùng, tôi xin gửi lời cảm ơn chân thành tới gia đình và bạn bè đã cổ vũ, độngviên, giúp đỡ tôi trong quá trình học tập và thực hiện luận văn này
Hà Nội, tháng 6 năm 2015 Ngưìri thực hiện
Chu Thị Hồng
Trang 4Tôi xin cam đoan, dưới sự hướng dẫn của PGS TS Tạ Duy Phượng, luận văn
chuyên ngành Toán giải tích với đề tài: Bài toán điều khiển tối ưu toàn phương mô
tả bởi hệ phương trình vi phân đại số tuyến tính được hoàn thành bởi sự nhận thức
và tìm hiểu của bản thân tác giả
Trong quá trình nghiên cứu và thực hiện luận văn, tác giả đã kế thừa những kếtquả của các nhà khoa học với sự ữân trọng và biết ơn
Hà Nội, tháng 6 năm 2015 Người thực hiện
Chu Thị Hồng
Trang 5Mục lục
Danh mục kí hiệu và viết tắt
Mỏ đầu
4 5
1 Bài toán điều khiển tối ưu vối hàm mục tiêu toàn phương mô tả bỏỉ
1.1
B ài toán điều khiển tối ưu 8
1.1.1 Các khái niệm cờ bản 8
1.1.2 Bài toán điều khiển tối ưu 16
1.1.3 Nguyên lí cực đại Ponưyagin 22
1.2 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương trình vi phân tuyến tính 25 1.2.1 Bài toán điều khiển tối Ưu với hàm mục tiêu toàn phương
mô tả bởi hệ phương trình vi phân tuyến tính 1.2.2 Phương ưình Riccati
25 26
2.1 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương trình vi phân đại số tuyến tính
2.1.1 Các khái niệm cd bản
u kiện cần và đủ tối Ưu
34 34 44
Trang 62.2 Cấu trúc Hamiltonl 512.3 Nghiệm của bài toán điều khiển tối
ưu với điều khiển liên hệ
Trang 7Danh mục kí hiệu và viết tắt
Các kí hiệu thường dùng
: Không gian Euclide m chiều X*:
Không gian liên hợp của X detA: Định
L(Mn, Mm) : Không gian các ánh xạ tuyến tính liên tục từ №n tới №m
L ( Rn): Không gian các ánh xạ tuyến tính từ ]Rn tới ]Rn L 2 [a, b]: Không gian các hàm khả tích trên [a, b]
C [ a , b ] : Không gian các hàm liên tục trên đoạn [a, 6]
c1 [ a , b ] : Không gian các hàm khả vi, liên tục ữên đoạn [ a , 6]
C^[a, 6] = {a? € c[a, 6] : B x G c^a, 6]}
Các kí hiệu viết tắt
DAE Phương ữình vi phân đại số ODE Phương trình vi phân thường
Trang 8Mỏ đầu
1 Lí do chọn đề tài
Do yêu cầu thực tiễn, bài toán điều khiển tối ưu mô tả bởi hệ phương trình viphân thường đã được nghiên cứu khá ưọn vẹn và đã đạt được các kết quả cơ bản,điển hình là nguyên lí cực đại Pontryagin và phương pháp qui hoạch động Cũng donhững yêu cầu của kĩ thuật, khoa học và công nghệ, bắt đầu từ những năm 1980,phương trình vi phân đại số (Differential-Algebraic Equations) mô tả các hệ thốngphức tạp (trong cơ học người máy, hóa học, điều khiển tàu vũ trụ, ) đã được nghiêncứu mạnh mẽ trên thế giới Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương
mô tả bởi hệ phương trình vi phân đại số tuyến tính đã được một số nhóm nghiêncứu trên thế giới (Nga, Đức, ) cố gắng giải quyết (xem, thí dụ tíu, [01, @)
Với mong muốn tìm hiểu sâu hơn về một hướng nghiên cứu tương đối thời sựhiện nay là bài toán điều khiển tối ưu mô tả bởi hệ phương trình vi phân thường và
phương trình vi phân đại số, tôi chọn đề tài Bài toán điều khiển tối ưu toàn phương
mô tả bởi hệ phương trình vi phân đại số tuyến tính làm luận văn cao học.
2 Mục đích nghiên cứu
1) Tìm hiểu và trình bày bài toán điều khiển tối ưu với hàm mục tiêu toàn phương
mô tả bởi hệ phương trình vi phân thường tuyến tính trong không gian
Trang 9hữu hạn chiều, chủ yếu theo Tài liệu [HO và một số tài liệu khác.
2) Tìm hiểu và trình bày lí thuyết hệ phương trình vi phân đại số tuyến tính, chủyếu theo Tài liệu Ũ3-
3) Tìm hiểu và trình bày bài toán điều khiển tối ưu với hàm mục tiêu toàn phương
mô tả bởi hệ phương trình vi phân đại số tuyến tính theo AU
3 Nhiệm vụ nghiên cứu
1) Nghiên cứu bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi
hệ phương trình vi phân thường trong không gian hữu hạn chiều
2) Nghiên cứu hệ phương trình vi phân đại số
3) Nghiên cứu bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi
hệ phương ữình vi phân đại số tuyến tính
4 Đối tượng và phạm vỉ nghiên cứu
Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phươngtrình vi phân thường và phương trình vi phân đại số tuyến tính
5 Phương pháp nghiên cứu
1) Thu thập các tài liệu liên quan tới Bài toán điều khiển tối ưu với hàm mục tiêutoàn phương mô tả bởi hệ phương trình vi phân
2) Phân tích, tổng hợp và hệ thống các kiến thức liên quan tới Bài toán điều khiểntối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương trình vi phân thường vàphương trình vi phân đại số tuyến tính
Trang 106 Đóng góp mới
Xây dựng Luận văn thành một tài liệu tổng quan tốt cho sinh viên và học viên caohọc về đề tài Bài toán điều khiển tối ưu toàn phương mô tả bởi hệ phương trình viphân thường và phương trình vi phân đại số tuyến tính ữong không gian hữu hạnchiều
Trang 11Chương 1 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bỏi hệ phương trình vỉ phân thường tuyến tính
1.1.1 Các khái niệm cơ bản
Định nghĩa 1.1.1 Cho X, Y là hai không gian vectơ trên trường số thực K A : X —
> Y được gọi là ánh xạ tuyến tính từ X vào Y nếu thỏa mãn điều kiện
A ( a x ) = a A ( x ) , với mọi X e X , a e R,
A(pc + y) = A ị x ) + A ( y ) , với mọi X , y € X
Định nghĩa 1.1.2 Cho X i , X 2,€ Mn, ]Rn là không gian vectơ trên trường số thực Khiđó
Tổ hợp tuyến tính trên E của X i , X 2 , Xỵ là
OiiXi + + OLk x k> với Oíị G K, * = 1,2, , k.
Tập tất cả các tổ hợp tuyến tính của Xị, X 2 , ■■■, Xỵ là một không gian con được
gọi là s p a n của X i , x 2, X ỵ , được xác định bởi
s p a n ị x 1 x 2 , X ỵ } : = { x = a \ X \ + + a ỵ X ỵ : « ị ẽ M , ĩ = l , 2 r , A:}.
Tập các vectơ Xi, x 2 , X ỵ được gọi là độc lập tuyến tính trên R nếu
«1, Oi2, Oíỵ E M
Trang 12Ma trận A cấp n X n được gọi là ma trận xác định dương (positive definite) được
kí hiệu bởi A > 0, nếu x*Ax > 0 với mọi X ^ 0.
Vậy ma trận B là ma trận nửa xác định dương.
Định nghĩa 1.1.5 Một ma trận vuông A cấp n X n được gọi là suy biến (singular)
nếu định thức của nó bằng 0 Ma trận vuông có định thức khác 0 được gọi là ma ữận
k h ô n g s u y b i ế n ( n o n s i n g u l a r )
Trang 13Định nghĩa 1.1.6 Cho E,F € L{\Rm) Cặp ma trận (E, F) được gọi là chính quy nếu 3A sao cho d e t ( X E + F ) Ỷ 0- Nếu det(AE + F ) = 0 với mọi A thì cặp ma trận ( E ,
F ) được gọi là suy biến.
Tập hợp các ma trận dạng (XE + F) được gọi là chùm ma trận.
Định nghĩa 1.1.7 Cho Ả là ma trận vuông cấp n, ma trận A gọi là ma trận khả nghịch nếu tồn tại ma trận B vuông cấp n sao cho AB = BA = E n (E n là ma trận đơn
vị cấp n ).
Nếu A là ma trận khả nghịch thì ma trận B thỏa mãn điều kiện trên là duy nhất, và B gọi là ma trận nghịch đảo (inverse matrix) của ma trận A, kí hiệu là A~ l Vậy ta luôn có AA~ l = A~ 1 A = E n
Ta thấy rằng A khả nghịch khi và chỉ khi A không suy biến (tức là detA 7^ 0)
Nếu A, B khả nghịch thì AB cũng khả nghịch và { A B ) ~ X = B~ 1 A~ 1
Định nghĩa 1.1.8 (ta, p 589-590)
Cho ma trận M G L(M n , № m ) Ta gọi ma ưận M~ G L ( R m , № n ) là ma trận nghịch đảo suy rộng (generalized inverse matrix) của M nếu thỏa mãn điều kiện
do M MM = M nên M là ma trận nghịch đảo suy rộng của M.
Định nghĩa 1.1.9 Hạng của ma trận là giá trị lớn nhất của số hàng hoặc số cột độc
lập tuyến tính Hạng của ma ữận A kí hiệu là rankA.
Ma trận A G Mmxn được gọi là có hạng dòng đầy đủ nếu m < n và r a n k ( A ) =
771
Ma trận A được gọi là có hạng cột đầy đủ nếu n < m và r a n k ( A ) = n
M ~ M M ~ = M ~
Ví dụ 1.2
Trang 14Nếu r a n k ( A ) bằng số cột hoặc số dòng của A thì A được gọi là có hạng đầy đủ.
Ma trận vuông có hạng đầy đủ là một ma trận không suy biến
Định nghĩa 1.1.10 ([GO, p 57) Ta gọi không gian định chuẩn (hay không gian tuyến
tính định chuẩn) là không gian tuyến tính X trên trường p (P = R hoặc p = C) cùng với một ánh xạ từ X vào tập số thực R, kí hiệu là ll-ll và đọc là chuẩn, thỏa mãn các
tiên đề sau đây:
(1) Va; G X : ỊỊa^ll > 0, \\x\\ = 0 ^ X = 6 (6 là kí hiệu phần tử không của X);
(2) Va: e X,Va G p : IIo;rr|Ị = \a\ ||x||;
( 3 ) V x , | / € l : ||z + y\\ < Ị|xỊỊ + ||y|Ị.
Số II a:|| được gọi là chuẩn của véctơ X Ta cũng kí hiệu không gian định chuẩn là
X Các tiên đề trên được gọi là hệ tiên đề chuẩn.
Định nghĩa 1.1.11 Cho X là không gian định chuẩn và {^n}nỄN là dãy các phần tử
trong X Ta nói rằng dãy {^n}nSN hội tụ theo chuẩn đến X £ X,
x n —>■ X
nếu
lim ||x — xn|| = 0
ĩl—>00 Định nghĩa 1.1.12 Cho u là một tập mở trong Mn và / : u —¥ Km Hàm /
được gọi là khả vi tại điểm a = (ữi, Ũ 2 ,an) G ư nếu tồn tại một ánh xạ
1. \ \ f ( a + h ) - f ( a ) - A ( h ) \ \ í™ \\h\\
Trang 15Cho tập X Ф 0 và họ T các tập con của X
Định nghĩa 1.1.13 (0, p 30) T được gọi là một ơ — đại số nếu nó thỏa mãn các điều kiện
(i) X, 0 G T
(ii) Ả £ T =>■ A° € T , ưong đó A c X\A.
(iii) A k <E T, к = 1,2, =>- и A k G T.
k=1
Nếu T là ơ— đại số các tập con của X thì cặp (X, F) được gọi là một không gian
đo được và mỗi tập A G T được gọi là tập đo được (đo được với T hay }7— đođược)
Định nghĩa 1.1.14 Độ đo ịi : T —Ï ]R+ là một hàm tập xác định trên ơ— đại số T trên X và thỏa mãn các tính chất sau:
1) ịi (А) ) > 0 với mọi А € T\
Hàm số / : X —>■ Ш được gọi là đo được trên tập A đối với ơ— đại số T nếu
Va € M : {x € Ẩ : f(x) < a} G T.
Đinh nghĩa 1.1.16 Trong một không gian meưic X bất kì, cho một ơ— đại số T và một độ đo ịẤ trên T Ta nói một điều kiện a [x) được thỏa mãn với hầu
Trang 16hết mọi X ẽ A, hay được thỏa mãn hầu khắp nơi trên A nếu có tập B c A sao cho /i
(B) — 0 và a (X) được thỏa mãn với mọi X e A\B.
Ví dụ f ( x ) = g ( x ) hầu khắp nơi trên A có nghĩa là 3 B c A , /i (5) = 0 và
vậy, nếu f là hàm đo được, không âm thì ta định nghĩa
Nếu f là hàm đo được bất kỳ thì
f + ( t ) := m a x { f ( t ) , 0} > 0, f ~ ( t ) : = m a x { - f ( t ) , 0} > 0
cũng là các hàm đo được, không âm và ta có f(t) = /+ (í) — f~ (t)
Nếu ít nhất một trong các tích phân f f + d/Ầ, / f ~ d ị i , là số hữu hạn thì ta định
Định nghĩa 1.1.18 Cho hai không gian metric Mị = (X, d i ) , M 2 = (Y , d 2 ) , ánh
xạ / : M i — > M 2
Trang 17Ánh xạ / được gọi là liên tục tại điểm x ữ G X, nếu Ve > 0, 3Ổ > 0, sao cho với mọi X e X mà d i ( x , X o ) < ổ thì d ỵ ự ị x ) , f { x o ) ) < £ -
Ánh xạ / gọi là liên tục trên tập А с X nếu ánh xạ / liên tục tại mọi điểm X e A Khi А = X thì ánh xạ / được gọi là liên tục.
Định nghĩa 1.1.19 Một ánh xạ / từ một tập X vào tập các số thực mở rộng Ш = MU
{±00} được gọi là một hàm số thực nếu f ( x ) с Ш tức là f ( x ) không lấy các giá trị
±00 thì hàm số được gọi là hữu hạn Một hàm số hữu hạn và liên tục theo nghĩa ánh
xạ liên tục được gọi là hàm số liên tục.
Định nghĩa 1.1.20 Hàm X : (a, b) —> Rn được gọi là liên tục tuyệt đối, nếu với mỗi
£ > 0 tồn tại số ố > 0 sao cho với mọi hệ hữu hạn khoảng đôi một không cắt nhau
Đinh lý 1.1.2 (Lebesgue) Nếu hàm X : (a, b) —»• №n là liên tục tuyệt đối trên (a,
b), thì nó k hả vi hầ u k hắp nơ i t rên (a, ò), đạo hàm x '( ) của nó khả tí ch trê n
(a, b) và công thức Newton-Leibniz
t
Trang 18đúng vói mọi í, r € (a, b)
N ế u h à m £ : (a , b ) —> Mn ẢTỉả t í c h t r ê n (a , ò) v à T G (a, ò), t h ì h à m s ố X (t )
•
f £ (s)ds /à /ỉ'ên tục tuyệt đối và x' (í) = £ (í) hầu khắp nơi.
T
Ta nói hàm X = (#1, £2, •••, x n ) : (a,b) —»■ Mn là đo được và khả tích nếu mỗi
hàm số Xị : (a, ò) —> M là đo được và khả tích Và theo định nghĩa,
( A x , y ) = { x , B y ), V x e X , Vy G Y
Toán tử liên hợp B được kí hiệu là A *
Trang 19Định nghĩa 1.1.24 Toán tử tuyến tính bị chặn A ánh xạ không gian Hilbert H vào chính nó gọi là tự liên hợp nếu
( A x , y ) = { X , A y ) , Va;, y G H
Toán tử tự liên hợp còn gọi là toán tử đối xứng
1.1.2 Bài toán điều khiển tối ưu
Xét hệ phương trình vi phân thường
Một hàm khả vi X : ( a , b ) —>■ G được gọi là nghiệm của hệ phương trình vi
phân (Ịl.lỊ) ưên khoảng (a, 6) nếu nó thỏa mãn hệ phương trình (Ịl.lỊ) với mọi
dx Íí)
t € (a, 6), tức là —y— = f ( t , x (t)) đúng với moi t € (a, 6) dt
Định lý 1.1.3 (Định lý tồn tại nghiệm của phương ữình vi phân)
Giả sử f : ( a : b ) X G —¥ Mn là hàm Lipshitz theo X đều theo t, tức là:
II/ ( t , X ị ) — / { t , x2)|| < L ỊỊíCi — x 2 \\ , Ví e (a, 6) ,\/xi,x 2 E G mở c Mn
Khi đó phương trình (ỊlTỊ) CÓ duy nhất nghiệm địa phương thỏa mãn điều kiện ban đầu
x ( t 0 ) = x0 , t o G ( a , b )
Trang 20Chú ý 1.1.1 Để ngắn gọn, ta thường gọi hệ phương trình (LJ_) là phương trình
vi phân, ta hiểu rằng đây là phương trình vi phân vectơ hay hệ phương trình vi phân Tương tự, đôi khi ta cũng gọi các hàm vectơ x ị t ) v à f ( t , X ) l à c á c
h à m s ố
Bài toán tìm nghiệm của hệ phương trình (Ịl.lỊ) thỏa mãn điều kiện (Ị1.2Ị) được
gọi là bài toán giá trị ban đầu hay bài toán Cauchy của hệ phương trình vi phân
với các thời điểm t ữ , T > t ữ là cho trước và cố định
Các hàm u : [0, oo) — > Rm là hàm đo được (hoặc liên tục từng khúc) trên [ t o , T ]
và thỏa mãn hạn chế
được gọi làđiều khiển chấp nhận được Ở đây Ư c Rm là một tập nào đó ữong
không gian hữu hạnchiều M m và được gọi là t ậ p h ạ n c h ế trên biếnđiều khiển,
vế phải •)là hàm (vectơ) liên tục theo cả ba biến ( t , X , u ) Khi hàm điều khiển u (•) đã được chọn, hệ (Ị1.3Ị) trở thành phương trình vi phân thường
x ' ( t ) = f ( t , x ( t ) , u ( t ) ) = f ( t , x ( t ) ) , t e [ t 0 ì T ] (1.5)
Vì u (•) là một hàm cho trước, liên tục từng khúc và thậm chí là hàm đo được nên
cho dù hàm / ( - , - , • ) có thể là đủ tốt (liên tục, thậm chí tuyến tính hoặc khả vi theo
cả ba biến), sau khi thay hàm u ( ) vào / (•, •, •) thì vế phải của phương
ưình ( L 5 ) có thế không còn là một hàm liên tục, các khái niệm theo nghĩa cốđiển về tồn tại nghiệm (khả vi liên tục) không còn đúng Ta xét ví dụ sau
Trang 21Ví dụ 1.4 Cho x ' = u vế phải / (t , x , u ) — и liên tục theo (í, X , и) Nếu chọn
Trang 22Nếu X (0) = 0 thìci = c2 = 0 và
* № = { 0,1 > 0.
Nghiệm x ( t ) không khả vi tại X = 0.
Vì vậy ta phải mở rộng khái niệm nghiệm của phương trình vi phân (Ịl.lỊ)
Định nghĩa 1.1.25 Hàm số X = ip (t) liên tục tuyệt đối trên khoảng
( t ữ - ỗ , t ữ + ỏ ) c ( a , b )
(do đó có đạo hàm hầu khắp nơi trên ( t 0 — ổ , t 0 + ố) thỏa mãn phương trình vi phân
(Ị_J_) hầu khắp nơi trên ( t Q — ỏ, t Q + ổ) được gọi là nghiệm suy rộng địa phương trong lân cận t 0 của phương trình vi phân (Ịl.lỊ) trên khoảng (a, b).
Nếu điều kiện của Định lí Caratheodory được thỏa mãn, thì phương trình vi
phân (Ị1.5Ị) có nghiệm (suy rộng) X (í)
Ta nhắc lại Định lí Caratheodory về tồn tại nghiệm suy rộng của phương trình vi phân với vế phải đo được
Định lí Caratheodory Cho hàm / : D —> Mn, ưong đó
Trang 23Khi ấy tồn tại một số c > 0 sao cho phương trình vi phân (Ịl.lỊ) có nghiệm suy rộng
ữên T c — { t : \ t — t 0 \ < c } thoả mãn điều kiện ban đầu X (t ữ) = x 0
Theo định lý Caratheodory với mỗi điều khiển chấp nhận được hệ (1.3) có một và
chỉ một nghiệm x ( t ) , x ( t ) liên tục tuyệt đối từ I tới Kn thỏa mãn điều kiện x ( t0) =
£()•
Với u ( ) đã chọn thì (Ị1.3Ị) nói chung có nghiệm địa phương x(.) Nghiệm a;(.) được gọi là quỹ đạo ứng với điều khiển «(.).
Bài toán ( x 0 , X \ ) - điều khiển được được phát biểu như sau: Cho trước x ữ , X ị G
R n , hệ (Ị1.3Ị) được gọi là (íCo, Xi) - điều khiển được nếu tồn tại T > 0, điều khiển
chấp nhận được u ( ) sao cho quỹ đạo tương ứng x ( t ) đi từ x 0 tới X i , tức là z(0)
= X q , x(T) = X ị
Hệ (Ị1.3Ị) được gọi là hoàn toàn điều khiển được nếu với mỗi vectơ x ( 0 ) = x ữ ẽ
K n, X i e ]Rn, với mỗi T > 0 và một hàm đo được u ( t ) trên [0,T],
u(t) G Mn sao cho quỹ đạo tương ứng của hệ (Ị1.3Ị) thỏa mãn điều kiện x ữ G Mn và
x ( T ) = X \ Nghĩa là, tồn tại một điều khiển chuyển hệ từ vị trí (trạng thái) x 0 £ Rn
sang vị trí (trạng thái) Xị £ Rn sau thời gian T.
Bài toán điều khiển tối ưu ịoptimal controlproblem) được phát biểu như sau:
Trong số tất cả các điều khiển đưa quỹ đạo từ X Q đến X ị hãy tìm điều khiển
u ( t ) sao cho nó cực tiểu hóa một tiêu chuẩn J (u), J (lí) được gọi là hàm mục tiêu.
Định nghĩa 1.1.26 Tập các trạng thái có thể đạt được từ trạng thái ban đầu x 0 sau thời gian T,T > 0, được định nghĩa bởi
Acc ( x ữ , T ) = { x u (T) , u ( t ) e U } ,
trong đó x u ( ) là nghiệm của hệ (Ị1.7Ị ) sinh bởi điều khiển chấp nhận được u ( ) ,
và thỏa mãn điều kiện ban đầu x u (0) = X o , u là tập lồi trong không gian hữu hạn chiều Ta đặt Acc(x0,0) = x 0
Tập Acc (a^o, T) được gọi là tập đạt được của hệ (Ị1.7Ị) tại thời điểm T xuất phát từ
điểm X Q
Trang 24Mệnh đề 1.1.1 Nếu u là lồi thì Acc (a:0, T) là tập lồi với mọi T > 0.
Chứng minh Lấy xf, xỊ e Acc (x 0 , T) Khi ấy tồn tại Uị (t ), i = 1, 2 là điều khiển
chấp nhận được sao cho Xị (t ) là nghiệm của (Ị1.7Ị ) tương ứng với Uị it ) thỏa mãn
điều kiện ban đầu z(0) = x ữ Khi ấy
Ta đặt и (t ) = Awi (í) + (1 — Л) ) М2 (í), do и là lồi, nên u ( t ) € £/ mọi í €
[0,T] Do U ị { ) là đo được nên u(t) là đo được hay u(t) là điều khiển chấp
Trang 25Khi đó
( X x ĩ (T) + (1 - Л) х т
2 (Т) + )) <Е А с с (я0, т ).
Vậy А с с (X Q , т) là tập lồi với mọi T > 0. □
1.1.3 Nguyên lí cực đại Pontryagin
Xét hệ phương trình vi phân có điều khiển
x ' = / ( x , и ), X G Rn ,
X (0) = Ĩ(| ẽ i" cho trước, и e и С Mm
Hàm mục tiêu được cho bởi
Hàm Ф : M n — > ■ R q cho q ràng buộc là các hạn chế tại điểm cuối, tức là
ị Ф г ( x ( T ) ) = 0,
Ф ( x (T)) = 0 & ị {
với mọi điều khiển chấp nhận được и (•), X (•) là quỹ đạo sinh bởi и (•).
Bộ ( x * , u * ) làm cực tiểu phiếm hàm J ( x , ù) được gọi là quá trình tối ưu.
Trang 26Ta xây dựng hàm Hamilton
n
H = L + \ T f = L + Y, Ai/,
i= 1
Các biến số A là các hàm phụ thuộc vào t Nguyên lý cực đại Pontryagin sau
đây cho điều kiện cần tối ưu
Định lý 1.1.4 (Nguyên lý cực đại Pontryagin, Theorem 2.1, du, p 2-6)
G i ả s ử ( x * i u * ) là quá trình tối ưu Khi đó tồn tại A* ( t) G Rn và V * e R9 sao cho £*(.), A*(.) thỏa mãn
vđỉ mọi u e u hầu khắp nơi.
Như vậy, nghiệm tối ưu là nghiệm của phương trình vi phân với điều kiện biên vàthỏa mãn điều kiện tối ưu (Ị1.6Ị)
Nếu u = arg min H (X, u, À) tồn tại, ta có thể sử dụng điều này chọn điều khiển u
và tìm quỹ đạo chấp nhận được làm cực tiểu hàm mục tiêu.
Điều kiện biên cho bởi n điều kiện ban đầu a^(0) = Xq £ R n , q ràng buộc cuối trong ữạng thái ' ệ ( x (T)) = 0, và n — q giá trị cuối cho nhân tử Lagrange (the
Lagrange multipliers)
Trong phương trình cuối, V là biến tự do và do đó có n phương trình trong n + q
biến tự do, loại n — q ràng buộc đặt trên À (T) Như vậy tổng cộng, ta có 2n giá trị
biên
Trang 27Nguyên lý cực đại là một định lý rất tổng quát Nếu и = Km và H là khả vi, thì
điều kiện cần của điều khiển tối ưu trở thành
Trang 28Lấy T cố định, số gia của hàm mục tiêu được viết như sau
Ỗ J = J (X* + ôx, u* + ôu, A* 4- ỐA, V * + ỗ v )— J A*, V * )
1.2 Bài toán điều khiển tối ưu với hàm mục tiêu toàn
phương mô tả bỏỉ hệ phương trình vỉ phân tuyến tính
1.2.1 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bỏỉ
hệ phương trình vi phân tuyến tính
Xét hệ phương trình vi phân thường tuyến tính có điều khiển
X 1 (t) = A ( t ) x (t ) + B ( t ) u ( t ) , t £ I = [0, T ] (1.7)
X e Rn, u e Rm, x ữ cho trước
Trang 29Ở đây A ị t ) và B (t ) là các ma trận hàm lần lượt có cấp n X n , n X ra, biến thời
gian tthay đổi trong đoạn [0, T], Tỉ - vectơ (vectơ 71 chiều)
Hàm mục tiêu có dạng toàn phương {quadratic form)
T J= - [ (x T Px + u T Qu) dt+-x T(T) (T)21/ 2
ở đây Q , w và p là các ma trận đối xứng, xác định dương, trạng thái x(t) xuất phát
từ điểm đầu X (0) = Xq và được sinh bởi vectơ điều khiển 777, chiều u(t) tới điểm cuối x ( T )
Bài toán điều khiển tối ưu với hàm mục tiêu dạng toàn phương tuyến tính
ịlinear-quadraic optimal probỉem)được phát biểu như sau: Cho X Qvà T,tìm
u ( t ) sao cho x ( t ) là nghiệm của (Ị1.7Ị), cực tiểu hàm mục tiêu J (u ) được định
Trang 30Sử dụng Định lý fll.l.4Ị), ta được điều kiện cần
u ( t
) = — Q ~ 1 ( t ) B T ( t ) X ( x )
thay vào phương trình (|1.10|) ta được hệ (|1.10|)-(ỊmT) Để giải bài toán điều khiển
tối ưu ta phải giải b à i toán b i ê n h a i đ i ể m bằng cách sử dụng điều kiện đầu a;
(0) = x 0 và điều kiện cuối A(T) Tuy nhiên, nói chung hệ này là khó giải Sử dụng
Trang 31Phương trình (Ị1.13Ị) được gọi là phương trình vi phân ma trận Riccati
Giả sử S(t) thỏa mãn (Ị1.13Ị), ta có điều khiển tối ưu dạng
u(t) = — Q ~ 1 ( t ) B T ( t ) S ( t ) x ( t )
Thay vào hệ phương trình vi phân ban đầu (Ị1.9Ị) và giải hệ này với điều kiện z(0) =
X ữ ta được nghiệm Chú ý rằng ở đây điều khiển u ( t ) là một dạng điều khiển dạng
không có ràng buộc đặt lên giá trị cuối À hoặc S(t) tương đương Do đó ta tìm ma
trận hằng s thỏa mãn (Ị1.13Ị) Nói cách khác, ta tìm s sao cho
Nghiệm của (Ị1.16Ị) được kí hiệu là x ( t ) , t > 0, x ( t ) £ Mn
Định nghĩa 1.2.1 Ma trận A được gọi là ổn định ịstable) nếu R e Ằ < 0 với mọi A e
A ( A )
Trong thực tế, nhiều khi chúng ta không quan sát được toàn bộ đầu ra x(t)
(nghiệm của phương trình (Ị1.16Ị», mà chỉ quan sát được một số tọa độ của nó thôngqua hàm
y = C x : t > 0 (1.17)
Trang 32Hệ (Ịl.161)- (Ị1.17Ị) hay cặp ma trận (A, c) được gọi là quan sát được (observable)
nếu với x0 ẽ i", x ữ Ỷ 0 tồn tại t > 0 sao cho
y ( t ) = C x ( t ) í 0
Hệ (Ị1.16Ị)- (Ị1.17Ị) hay cặp ma trận ( A , C ) được gọi là nhận biết được
ịde-tectable) nếu tồn tại ma trận K e M ( n , k) sao cho ma ữận A + KC là ổn định.
Một cặp ma ữận (A , B ) được gọi là ổn đ ị n h hóa được khi tồn tại ma trận K €
M ( n , k) sao cho ( A — K B ) là ổn định.
Định lý 1.2.1 Giả sử ( A : B) ổn định hóa được và (p, A) nhận biết được tectabỉe) Khi đó tồn tại duy nhất ma trận nửa xác định dương s là nghiệm của phương trình đại số Rỉccati (Ị1.15Ị), điều khiển u = — Q ~ 1 B T S x sao cho hệ phương trình x' = (A — B Q ~ X B T S ) x là ổn định.
(de-Chú ý 1.2.1 Nếu p = c*c, trong đó ma trận c có cd p X n với p < n Khi ấy (p,
A) là nhận biết được (detectable) khi và chỉ khi (c, A) cũng nhận biết được
(detectabỉe) Hàm mục tiêu được cho bởi
00
J (aj0) = min 1 [y T (t) y (t) + U T (t) Qu (í)] dt tp£ệ J
0
(1.18)
với y = Cx ỏ trưởng hợp này, điều kiện của định lý là (A, B) là ổn định hoá được và (ơ, Ả) nhận biết được (detectable).
Từ giả thiếtcủa định lý, ta dễ thấy rằng nếu ( A , B ) ổn định hoá được, và
(p, A ) nhậnbiết được (detectable), thì hàm điều khiển
u = - Q ~ 1 B T S x (1.19)
dẫn đến hệ đóng
z ' = ( A - B Q ~ 1 B T S ) X (1.20)
X
Trang 33là ổn định Do đó (|1.19|) là một điều khiển chấp nhận được, dẫn đến X ( t ) 0
Ta kiểm tra (Ị1.19Ị) đúng là điều khiển tối ưu
Sử dụng (|1.15|) ta viết p như sau
Q
~ 1
B T
S x { t ) ] T
Q [ u
(í) +
Trang 34u = — Q 1 B T S x ( t )
với hàm mục tiêu cực tiểu được cho bởi
«7 (zo) = X Q S X 0 (1.21)
Định lý 1.2.2 (Theorem 2.2, lỊĨÕl p 2.11 - 2.12) Cho (A, B) Ổn định và (p, ^4) nhận
biết được (detectable) Điều khiển tối ưu làm cực tiểu hàm mục tiêu của phương trình (Ị1.9Ị) được cho bởi
Trang 35V2q 3
s =
Hàm điều khiển được cho bởi
K = Q ~ 1 B T S = Điều kiện liên hệ ngược cực tiểu hoá hàm mục tiêu là u = — K x Ta