26 2 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương trình vi phân đại số tuyến tính 33 2.1 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi
Trang 1CHU THỊ HỒNG
BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU TOÀN PHƯƠNG
MÔ TẢ BỞI HỆ PHƯƠNG TRÌNH
VI PHÂN ĐẠI SỐ TUYẾN TÍNH
LUẬN VĂN THẠC SĨ TOÁN HỌC
HÀ NỘI, 2015
Trang 2CHU THỊ HỒNG
BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU TOÀN PHƯƠNG
MÔ TẢ BỞI HỆ PHƯƠNG TRÌNH
VI PHÂN ĐẠI SỐ TUYẾN TÍNH
Chuyên ngành: Toán giải tích
Mã số: 60 46 01 02
LUẬN VĂN THẠC SĨ TOÁN HỌC
Người hướng dẫn khoa học: PGS TS TẠ DUY PHƯỢNG
HÀ NỘI, 2015
Trang 3Luận văn được thực hiện và hoàn thành dưới sự hướng dẫn khoa học củaPGS TS Tạ Duy Phượng Tôi xin được gửi lời cảm ơn sâu sắc đến Thầy hướngdẫn khoa học của mình, người đã giao đề tài và tận tình hướng dẫn trong suốtquá trình tìm hiểu, nghiên cứu để tôi có thể hoàn thành luận văn này.
Nhân dịp này, tôi cũng xin chân thành cảm ơn tới toàn thể các Thầy Cô giáokhoa Toán đặc biệt là chuyên ngành Toán Giải tích, Phòng Sau đại học, trườngĐại học Sư phạm Hà Nội 2 đã giảng dạy và giúp đỡ tôi trong suốt quá trình họctập và nghiên cứu tại trường
Cuối cùng, tôi xin gửi lời cảm ơn chân thành tới gia đình và bạn bè đã cổ vũ,động viên, giúp đỡ tôi trong quá trình học tập và thực hiện luận văn này
Hà Nội, tháng 6 năm 2015
Người thực hiện
Chu Thị Hồng
Trang 4Tôi xin cam đoan, dưới sự hướng dẫn của PGS TS Tạ Duy Phượng, luận văn
chuyên ngành Toán giải tích với đề tài: Bài toán điều khiển tối ưu toàn phương
mô tả bởi hệ phương trình vi phân đại số tuyến tính được hoàn thành bởi sựnhận thức và tìm hiểu của bản thân tác giả
Trong quá trình nghiên cứu và thực hiện luận văn, tác giả đã kế thừa nhữngkết quả của các nhà khoa học với sự trân trọng và biết ơn
Hà Nội, tháng 6 năm 2015
Người thực hiện
Chu Thị Hồng
Trang 5Mục lục
1 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi
1.1 Bài toán điều khiển tối ưu 8
1.1.1 Các khái niệm cơ bản 8
1.1.2 Bài toán điều khiển tối ưu 16
1.1.3 Nguyên lí cực đại Pontryagin 22
1.2 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương trình vi phân tuyến tính 25
1.2.1 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương trình vi phân tuyến tính 25
1.2.2 Phương trình Riccati 26
2 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương trình vi phân đại số tuyến tính 33 2.1 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương trình vi phân đại số tuyến tính 34
2.1.1 Các khái niệm cơ bản 34
2.1.2 Điều kiện cần và đủ tối ưu 44
Trang 62.2 Cấu trúc Hamilton 51
2.3 Nghiệm của bài toán điều khiển tối ưu với điều khiển liên hệ ngược 55
2.3.1 Điều khiển tối ưu liên hệ ngược 55
2.3.2 Nghiệm của hệ phương trình DAE Riccati 58
2.3.3 Nghiệm của bài toán hệ đóng 63
2.3.4 Phương trình Riccati và hệ Hamilton 64
Trang 7Danh mục kí hiệu và viết tắt
Các kí hiệu thường dùng
Rm: Không gian Euclide mchiều
X∗: Không gian liên hợp củaX
L(Rn,Rm): Không gian các ánh xạ tuyến tính liên tục từ Rn tới Rm
L(Rn): Không gian các ánh xạ tuyến tính từ Rn tới Rn
L2[a, b]: Không gian các hàm khả tích trên[a, b]
C[a, b]: Không gian các hàm liên tục trên đoạn[a, b]
C1[a, b]: Không gian các hàm khả vi, liên tục trên đoạn[a, b]
C1B[a, b]=x ∈ C[a, b] : Bx ∈ C1[a, b]
Các kí hiệu viết tắt
DAE Phương trình vi phân đại số
ODE Phương trình vi phân thường
Trang 8Mở đầu
1 Lí do chọn đề tài
Do yêu cầu thực tiễn, bài toán điều khiển tối ưu mô tả bởi hệ phương trình
vi phân thường đã được nghiên cứu khá trọn vẹn và đã đạt được các kết quả cơbản, điển hình là nguyên lí cực đại Pontryagin và phương pháp qui hoạch động.Cũng do những yêu cầu của kĩ thuật, khoa học và công nghệ, bắt đầu từ nhữngnăm 1980, phương trình vi phân đại số (Differential-Algebraic Equations) mô
tả các hệ thống phức tạp (trong cơ học người máy, hóa học, điều khiển tàu vũtrụ, ) đã được nghiên cứu mạnh mẽ trên thế giới Bài toán điều khiển tối ưuvới hàm mục tiêu toàn phương mô tả bởi hệ phương trình vi phân đại số tuyếntính đã được một số nhóm nghiên cứu trên thế giới (Nga, Đức, ) cố gắng giảiquyết (xem, thí dụ [4], [7], [9])
Với mong muốn tìm hiểu sâu hơn về một hướng nghiên cứu tương đối thời sựhiện nay là bài toán điều khiển tối ưu mô tả bởi hệ phương trình vi phân thường
và phương trình vi phân đại số, tôi chọn đề tài Bài toán điều khiển tối ưu toàn
phương mô tả bởi hệ phương trình vi phân đại số tuyến tính làm luận văn caohọc
2 Mục đích nghiên cứu
1) Tìm hiểu và trình bày bài toán điều khiển tối ưu với hàm mục tiêu toànphương mô tả bởi hệ phương trình vi phân thường tuyến tính trong không gian
Trang 9hữu hạn chiều, chủ yếu theo Tài liệu [8] và một số tài liệu khác.
2) Tìm hiểu và trình bày lí thuyết hệ phương trình vi phân đại số tuyến tính,chủ yếu theo Tài liệu [7]
3) Tìm hiểu và trình bày bài toán điều khiển tối ưu với hàm mục tiêu toànphương mô tả bởi hệ phương trình vi phân đại số tuyến tính theo [9]
3 Nhiệm vụ nghiên cứu
1) Nghiên cứu bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô
tả bởi hệ phương trình vi phân thường trong không gian hữu hạn chiều
2) Nghiên cứu hệ phương trình vi phân đại số
3) Nghiên cứu bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô
tả bởi hệ phương trình vi phân đại số tuyến tính
4 Đối tượng và phạm vi nghiên cứu
Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phươngtrình vi phân thường và phương trình vi phân đại số tuyến tính
5 Phương pháp nghiên cứu
1) Thu thập các tài liệu liên quan tới Bài toán điều khiển tối ưu với hàm mụctiêu toàn phương mô tả bởi hệ phương trình vi phân
2) Phân tích, tổng hợp và hệ thống các kiến thức liên quan tới Bài toán điềukhiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương trình vi phânthường và phương trình vi phân đại số tuyến tính
Trang 106 Đóng góp mới
Xây dựng Luận văn thành một tài liệu tổng quan tốt cho sinh viên và học viêncao học về đề tài Bài toán điều khiển tối ưu toàn phương mô tả bởi hệ phươngtrình vi phân thường và phương trình vi phân đại số tuyến tính trong không gianhữu hạn chiều
Trang 11Chương 1
Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương
trình vi phân thường tuyến tính
1.1 Bài toán điều khiển tối ưu
1.1.1 Các khái niệm cơ bản
Định nghĩa 1.1.1 Cho X, Y là hai không gian vectơ trên trường số thực R
A : X → Y được gọi là ánh xạ tuyến tính từX vàoY nếu thỏa mãn điều kiện
A(αx) = αA(x), với mọix ∈ X, α ∈ R,
A(x + y) = A(x) + A(y), với mọix, y ∈ X
Tập tất cả các tổ hợp tuyến tính của x1, x2, , xk là một không gian con được
gọi là span củax1, x2, , xk, được xác định bởi
span{x1,x2, , xk} := {x =α1x1 + + αkxk : αi ∈ R, i = 1, 2, , k}.Tập các vectơx1, x2, , xk được gọi là độc lập tuyến tính trên R nếu
α1, α2, , αk ∈ R
Trang 12thỏa mãn hệ thức
α1x1 + + αkxk = 0,
chỉ xảy ra khi và chỉ khiα1 = α2 = = αn = 0
Hệ vectơ x1, x2, , xk được gọi là phụ thuộc tuyến tính nếu nó không độc lập
Ma trận A cấp n × n gọi là ma trận nửa xác định dương (semi-positive
definite)được kí hiệu bởiA ≥ 0, nếux∗Ax ≥ 0với mọix ∈ Rn
Ma trận Acấp n × n được gọi là ma trận xác định dương (positive definite)
được kí hiệu bởiA > 0, nếux∗Ax > 0với mọix 6= 0
Vậy ma trậnB là ma trận nửa xác định dương
Định nghĩa 1.1.5 Một ma trận vuông A cấp n × n được gọi là suy biến
(sin-gular) nếu định thức của nó bằng 0 Ma trận vuông có định thức khác 0 được
gọi là ma trận không suy biến (nonsingular).
Trang 13Định nghĩa 1.1.6 ChoE, F ∈ L(Rm) Cặp ma trận(E, F ) được gọi là chính
quy nếu ∃λ sao cho det(λE + F ) 6= 0 Nếudet(λE + F ) ≡ 0 với mọi λ thìcặp ma trận(E, F )được gọi là suy biến.
Tập hợp các ma trận dạng(λE + F ) được gọi là chùm ma trận.
Định nghĩa 1.1.7 ChoAlà ma trận vuông cấpn, ma trậnAgọi là ma trận khả
nghịchnếu tồn tại ma trậnB vuông cấp nsao choAB = BA = En (En là matrận đơn vị cấpn)
NếuAlà ma trận khả nghịch thì ma trậnB thỏa mãn điều kiện trên là duy nhất,
vàB gọi là ma trận nghịch đảo (inverse matrix) của ma trậnA, kí hiệu là A−1.Vậy ta luôn cóAA−1 = A−1A = En
Ta thấy rằngAkhả nghịch khi và chỉ khiAkhông suy biến (tức làdetA 6= 0).Nếu A, B khả nghịch thì AB cũng khả nghịch và (AB)−1 = B−1A−1
doM−M M− = M−nên M− là ma trận nghịch đảo suy rộng củaM
Định nghĩa 1.1.9 Hạng của ma trận là giá trị lớn nhất của số hàng hoặc số cột
độc lập tuyến tính Hạng của ma trậnAkí hiệu là rankA
Ma trận A ∈ Rm×n được gọi là có hạng dòng đầy đủ nếu m < n và
rank(A) = m
Ma trậnAđược gọi là có hạng cột đầy đủ nếun ≤ mvàrank(A) = n
Trang 14Nếurank(A)bằng số cột hoặc số dòng củaAthìAđược gọi là có hạng đầy
đủ
Ma trận vuông có hạng đầy đủ là một ma trận không suy biến
Định nghĩa 1.1.10 ([2], p 57) Ta gọi không gian định chuẩn (hay không gian
tuyến tính định chuẩn) là không gian tuyến tínhX trên trườngP (P = R hoặc
P = C) cùng với một ánh xạ từX vào tập số thực R, kí hiệu là k.k và đọc là
chuẩn, thỏa mãn các tiên đề sau đây:
(1)∀x ∈ X : kxk ≥ 0, kxk = 0 ⇔ x = θ (θlà kí hiệu phần tử không của X);(2)∀x ∈ X, ∀α ∈ P : kαxk = |α| kxk;
(3)∀x, y ∈ X : kx + yk ≤ kxk + kyk
Số kxk được gọi là chuẩn của véctơ x Ta cũng kí hiệu không gian định chuẩn
làX Các tiên đề trên được gọi là hệ tiên đề chuẩn.
Định nghĩa 1.1.11 Cho X là không gian định chuẩn và {xn}n∈N là dãy cácphần tử trongX Ta nói rằng dãy{xn}n∈Nhội tụ theo chuẩnđến x ∈ X,
xn → x
nếu
lim
n→∞kx − xnk = 0
Định nghĩa 1.1.12 Cho U là một tập mở trong Rn và f : U → Rm Hàm f
được gọi là khả vi tại điểm a = (a1, a2, , an) ∈ U nếu tồn tại một ánh xạtuyến tínhA :Rn →Rm sao cho
Trang 15Cho tậpX 6= ∅và họ F các tập con của X.
Định nghĩa 1.1.13 ([3], p 30)F được gọi là một σ− đại sốnếu nó thỏa mãncác điều kiện
(i) X, ∅ ∈ F
(ii) A ∈ F ⇒ Ac ∈ F, trong đóAc := X\A
(iii) Ak ∈ F , k = 1, 2, ⇒ ∞∪
k=1Ak ∈ F.NếuF làσ−đại số các tập con củaX thì cặp(X, F )được gọi là một không
gian đo được và mỗi tập A ∈ F được gọi là tập đo được (đo được với F hay
F −đo được)
Định nghĩa 1.1.14 Độ đoµ : F → R+ là một hàm tập xác định trên σ− đại
sốF trênX và thỏa mãn các tính chất sau:
1)µ (A) ≥ 0với mọiA ∈ F;
Định nghĩa 1.1.16 Trong một không gian metricX bất kì, cho mộtσ− đại số
F và một độ đo µ trên F Ta nói một điều kiện α (x) được thỏa mãn với hầu
Trang 16hết mọi x ∈ A, hay được thỏa mãn hầu khắp nơi trênAnếu có tậpB ⊂ Asaochoµ (B) = 0vàα (x) được thỏa mãn với mọi x ∈ A\B.
Ví dụ f (x) = g(x)hầu khắp nơi trên Acó nghĩa là ∃B ⊂ A, µ (B) = 0 và
∀x ∈ A\B, f (x) = g (x)
Định nghĩa 1.1.17 Một hàm f : X → R được gọi là hàm đơn giản nếu nó đo
được và chỉ nhận hữu hạn giá trị
Định lý 1.1.1 Nếu f là hàm đo được, không âm thì tồn tại dãy các hàm đơn giản, không âmfn sao cho
cũng là các hàm đo được, không âm và ta cóf (t) = f+(t) − f−(t).
Nếu ít nhất một trong các tích phânR
A
f+dµ,R
A
f−dµ, là số hữu hạn thì ta định nghĩa
Trang 17Ánh xạf được gọi là liên tục tại điểmx0 ∈ X, nếu∀ε > 0, ∃δ > 0, sao chovới mọix ∈ X màd1(x, x0) < δ thìd2(f (x), f (x0)) < ε.
Ánh xạ f gọi là liên tục trên tậpA ⊂ X nếu ánh xạ f liên tục tại mọi điểm
x ∈ A KhiA = X thì ánh xạf được gọi là liên tục.
Định nghĩa 1.1.19 Một ánh xạ f từ một tập X vào tập các số thực mở rộng
¯
R = R∪ {±∞}được gọi là một hàm số thực nếuf (X) ⊂ R tức làf (x)khônglấy các giá trị±∞thì hàm số được gọi là hữu hạn Một hàm số hữu hạn và liên tục theo nghĩa ánh xạ liên tục được gọi là hàm số liên tục.
Định nghĩa 1.1.20 Hàmx : (a, b) → Rnđược gọi là liên tục tuyệt đối, nếu với
mỗiε > 0tồn tại số δ > 0 sao cho với mọi hệ hữu hạn khoảng đôi một khôngcắt nhau
ChọnN = 1 ta có, hàm liên tục tuyệt đối là liên tục đều trên(a, b)
Định lý 1.1.2 (Lebesgue) Nếu hàm x : (a, b) → Rn là liên tục tuyệt đối trên
(a, b), thì nó khả vi hầu khắp nơi trên(a, b), đạo hàmx0(.) của nó khả tích trên
(a, b)và công thức Newton-Leibniz
Trang 18đúng với mọit, τ ∈ (a, b).
Nếu hàmξ : (a, b) → Rn khả tích trên (a, b) vàτ ∈ (a, b), thì hàm số x (t) =
t
R
τ
ξ (s)ds là liên tục tuyệt đối và x0(t) = ξ (t)hầu khắp nơi.
Ta nói hàm x = (x1, x2, , xn) : (a, b) → Rn là đo được và khả tích nếumỗi hàm sốxi : (a, b) → R là đo được và khả tích Và theo định nghĩa,
Z b a
x (t) dt =
Z b a
x1(t) dt, ,
Z b a
xbán kínhr > 0được gọi là lân cận củax ∈ X¯ trong không gianM
Định nghĩa 1.1.22 Một tậpC trong một không gian vectơ thực hay phức được
gọi là lồi nếu:
a, b ∈ C ⇒ αa + (1 − α) b ∈ C
Tập hợp các điểm có dạngαa + (1 − α) b ∈ C với0 ≤ α ≤ 1được gọi là đoạnthẳng nốiavớib Có thể định nghĩa một tập là lồi nếu nó chứa mọi đoạn thẳngnối hai điểm bất kì của nó
Một hàm f xác định trên một tập lồi C và có thể lấy giá trị +∞được gọi là
hàm lồinếu:
a, b ∈ C, 0 ≤ α ≤ 1 ⇒ f (αa + (1 − α) b) ≤ αf (a) + (1 − α) f (b)
Định nghĩa 1.1.23 Cho A là toán tử tuyến tính bị chặn ánh xạ không gianHilbert X vào không gian Hilbert Y Toán tử B ánh xạ không gian Y vàokhông gianX gọi là toán tử liên hợp với toán tửAnếu
hAx, yi = hx, Byi , ∀x ∈ X, ∀y ∈ Y
Toán tử liên hợpB được kí hiệu là A∗
Trang 19Định nghĩa 1.1.24 Toán tử tuyến tính bị chặnAánh xạ không gian Hilbert H
vào chính nó gọi là tự liên hợp nếu
hAx, yi = hx, Ayi , ∀x, y ∈ H
Toán tử tự liên hợp còn gọi là toán tử đối xứng
1.1.2 Bài toán điều khiển tối ưu
Xét hệ phương trình vi phân thường
Một hàm khả vi x : (a, b) → G được gọi là nghiệm của hệ phương trình vi
phân (1.1) trên khoảng (a, b) nếu nó thỏa mãn hệ phương trình (1.1) với mọi
t ∈ (a, b), tức là dx (t)
dt = f (t, x (t))đúng với mọit ∈ (a, b).
Định lý 1.1.3 (Định lý tồn tại nghiệm của phương trình vi phân)
Giả sửf : (a, b) × G →Rn là hàm Lipshitz theoxđều theot, tức là:
kf (t, x1) − f (t, x2)k ≤ L kx1 − x2k , ∀t ∈ (a, b) , ∀x1, x2 ∈ G mở⊆ Rn.
Khi đó phương trình (1.1) có duy nhất nghiệm địa phương thỏa mãn điều kiện
ban đầu
x (t0) = x0, t0 ∈ (a, b).
Trang 20Chú ý 1.1.1 Để ngắn gọn, ta thường gọi hệ phương trình (1.1) là phương trình
vi phân, ta hiểu rằng đây là phương trình vi phân vectơ hay hệ phương trình vi phân Tương tự, đôi khi ta cũng gọi các hàm vectơ x(t) và f (t, x) là các hàm số.
Bài toán tìm nghiệm của hệ phương trình (1.1) thỏa mãn điều kiện (1.2) được
gọi là bài toán giá trị ban đầu hay bài toán Cauchy của hệ phương trình vi phân
với các thời điểmt0, T > t0 là cho trước và cố định
Các hàmu : [0, ∞) → Rmlà hàm đo được (hoặc liên tục từng khúc) trên[t0, T ]
Trang 21Ví dụ 1.4 Chox0 = u Vế phải f (t, x, u) = uliên tục theo(t, x, u) Nếu chọn
Trang 22Nghiệmx(t) không khả vi tạix = 0.
Vì vậy ta phải mở rộng khái niệm nghiệm của phương trình vi phân (1.1)
Định nghĩa 1.1.25 Hàm sốx = ϕ (t)liên tục tuyệt đối trên khoảng
(t0 − δ, t0 + δ) ⊂ (a, b)
(do đó có đạo hàm hầu khắp nơi trên(t0 − δ, t0 + δ)thỏa mãn phương trình viphân (1.1) hầu khắp nơi trên (t0 − δ, t0 + δ)được gọi là nghiệm suy rộng địa
phương trong lân cậnt0 của phương trình vi phân (1.1) trên khoảng(a, b)
Nếu điều kiện của Định lí Caratheodory được thỏa mãn, thì phương trình viphân (1.5) có nghiệm (suy rộng)x (t)
Ta nhắc lại Định lí Caratheodory về tồn tại nghiệm suy rộng của phương trình
vi phân với vế phải đo được
Định lí Caratheodory Cho hàmf : D → Rn, trong đó
Trang 23Khi ấy tồn tại một sốc > 0sao cho phương trình vi phân (1.1) có nghiệm suyrộng trênTc = {t : |t − t0| ≤ c} thoả mãn điều kiện ban đầux (t0) = x0.Theo định lý Caratheodory với mỗi điều khiển chấp nhận được hệ (1.3) cómột và chỉ một nghiệm x(t), x(t) liên tục tuyệt đối từ I tới Rn thỏa mãn điềukiệnx(t0) = x0.
Vớiu(.)đã chọn thì (1.3) nói chung có nghiệm địa phươngx(.) Nghiệmx(.)
được gọi là quỹ đạo ứng với điều khiểnu(.)
Bài toán(x0, x1)- điều khiển đượcđược phát biểu như sau: Cho trướcx0, x1 ∈
Rn, hệ (1.3) được gọi là (x0, x1) - điều khiển được nếu tồn tại T > 0, điềukhiển chấp nhận được u(.) sao cho quỹ đạo tương ứngx(t) đi từ x0 tới x1, tức
làx(0) = x0, x(T ) = x1
Hệ (1.3) được gọi là hoàn toàn điều khiển được nếu với mỗi vectơ x(0) =
x0 ∈ Rn, x1 ∈ Rn, với mỗi T > 0 và một hàm đo được u(t) trên [0, T ],
u(t) ∈ Rn sao cho quỹ đạo tương ứng của hệ (1.3) thỏa mãn điều kiệnx0 ∈ Rn
và x(T ) = x1 Nghĩa là, tồn tại một điều khiển chuyển hệ từ vị trí (trạng thái)
x0 ∈ Rn sang vị trí (trạng thái)x1 ∈ Rn sau thời gianT
Bài toán điều khiển tối ưu (optimal control problem) được phát biểu như sau:
Trong số tất cả các điều khiển đưa quỹ đạo từx0 đếnx1 hãy tìm điều khiểnu(t)
sao cho nó cực tiểu hóa một tiêu chuẩnJ (u),J (u)được gọi là hàm mục tiêu.
Định nghĩa 1.1.26 Tập các trạng thái có thể đạt được từ trạng thái ban đầu x0
sau thời gianT, T > 0, được định nghĩa bởi
Acc (x0, T ) = {xu(T ) , u (t) ∈ U } ,
trong đóxu(.)là nghiệm của hệ (1.7) sinh bởi điều khiển chấp nhận đượcu(.),
và thỏa mãn điều kiện ban đầuxu(0) = x0 , U là tập lồi trong không gian hữuhạn chiều Ta đặtAcc(x0, 0) = x0
TậpAcc (x0, T )được gọi là tập đạt được của hệ (1.7) tại thời điểmT xuất phát
từ điểmx0
Trang 24Mệnh đề 1.1.1 NếuU là lồi thìAcc (x0, T )là tập lồi với mọi T > 0.
Chứng minh. Lấy xT1, xT2 ∈ Acc (x0, T ) Khi ấy tồn tại ui(t),i = 1, 2 là điềukhiển chấp nhận được sao cho xi(t) là nghiệm của (1.7) tương ứng với ui(t)
thỏa mãn điều kiện ban đầux(0) = x0 Khi ấy
x0i(t) = A(t)xi(t) + B(t)ui(t) + f (t); i = 1, 2, t ∈ [0, T ]
Choλ ∈ [0, 1], ta chứng minh λxT1 + (1 − λ) xT2 ∈ Acc (x0, T )
Ta đã biết, nghiệm của phương trình vi phân tuyến tính thường có dạng
Chox(t)là nghiệm tương ứng với u(t) Ta có
Trang 25Khi đó
λxT1 (T ) + (1 − λ) xT2 (T )∈ Acc (x0, T )
VậyAcc (x0, T )là tập lồi với mọi T > 0
1.1.3 Nguyên lí cực đại Pontryagin
Xét hệ phương trình vi phân có điều khiển
Hàmψ : Rn →Rq choq ràng buộc là các hạn chế tại điểm cuối, tức là
ψq(x (T )) = 0
Bài toán điều khiển tối ưu được phát biểu như sau: Trong số tất cả các điều
khiển chấp nhận đượcu(.)trên[0, T ], hãy tìm điều khiển u∗(.) sao cho
J (x∗, u∗) ≤ J (x, u) ,
với mọi điều khiển chấp nhận đượcu (·), x (·)là quỹ đạo sinh bởiu (·)
Bộ (x∗, u∗) làm cực tiểu phiếm hàmJ (x, u) được gọi là quá trình tối ưu.
Trang 26Định lý 1.1.4 (Nguyên lý cực đại Pontryagin, Theorem 2.1, [9], p 2-6)
Giả sử (x∗, u∗) là quá trình tối ưu Khi đó tồn tạiλ∗(t) ∈ Rn và ν∗ ∈ Rq sao chox∗(.), λ∗(.)thỏa mãn
với mọiu ∈ U hầu khắp nơi.
Như vậy, nghiệm tối ưu là nghiệm của phương trình vi phân với điều kiệnbiên và thỏa mãn điều kiện tối ưu (1.6)
Nếu u = arg min H (x, u, λ) tồn tại, ta có thể sử dụng điều này chọn điềukhiển uvà tìm quỹ đạo chấp nhận được làm cực tiểu hàm mục tiêu
Điều kiện biên cho bởi n điều kiện ban đầu x(0) = x0 ∈ Rn, q ràng buộccuối trong trạng tháiψ (x (T )) = 0, vàn − qgiá trị cuối cho nhân tử Lagrange(the Lagrange multipliers)
λ (T ) = ∂V
∂x (x (T )) + ν
T∂ψ
∂x.
Trong phương trình cuối,ν là biến tự do và do đó cónphương trình trongn + q
biến tự do, loạin − q ràng buộc đặt trênλ (T ) Như vậy tổng cộng, ta có2ngiátrị biên
Trang 27Nguyên lý cực đại là một định lý rất tổng quát NếuU = Rm và H là khả vi,thì điều kiện cần của điều khiển tối ưu trở thành
Trang 28LấyT cố định, số gia của hàm mục tiêu được viết như sau
1.2 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương
mô tả bởi hệ phương trình vi phân tuyến tính
1.2.1 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả
bởi hệ phương trình vi phân tuyến tính
Xét hệ phương trình vi phân thường tuyến tính có điều khiển
x0(t) = A (t) x (t) + B (t) u (t) , t ∈ I = [0, T ] (1.7)
x ∈ Rn, u ∈ Rm,x0 cho trước
Trang 29Ở đâyA(t)và B(t)là các ma trận hàm lần lượt có cấpn × n, n × m, biến thờigiantthay đổi trong đoạn[0, T ],n– vectơ (vectơnchiều).
Hàm mục tiêu có dạng toàn phương (quadratic form)
J = 12
Bài toán điều khiển tối ưu với hàm mục tiêu dạng toàn phương tuyến tính
(linear-quadraic optimal problem) được phát biểu như sau: Cho x0 và T, tìm
u(t) sao chox(t) là nghiệm của (1.7), cực tiểu hàm mục tiêu J (u) được địnhnghĩa bởi (1.8)
Trang 30Sử dụng Định lý (1.1.4), ta được điều kiện cần
thay vào phương trình (1.10) ta được hệ (1.10)-(1.11) Để giải bài toán điều
khiển tối ưu ta phải giải bài toán biên hai điểm bằng cách sử dụng điều kiện
đầux(0) = x0 và điều kiện cuốiλ(T ) Tuy nhiên, nói chung hệ này là khó giải
Trang 31Phương trình (1.13) được gọi là phương trình vi phân ma trận Riccati.
Giả sửS(t) thỏa mãn (1.13), ta có điều khiển tối ưu dạng
u(t) = −Q−1(t)BT(t)S(t)x(t)
Thay vào hệ phương trình vi phân ban đầu (1.9) và giải hệ này với điều kiện
x(0) = x0 ta được nghiệm Chú ý rằng ở đây điều khiển u(t)là một dạng điềukhiển dạng liên hệ ngược
Một bài toán điều khiển tối ưu quan trọng là khi T = ∞ và W = 0 Hàmmục tiêu có dạng
không có ràng buộc đặt lên giá trị cuốiλ hoặc S(t) tương đương Do đó ta tìm
ma trận hằngS thỏa mãn (1.13) Nói cách khác, ta tìmS sao cho
Nghiệm của (1.16) được kí hiệu làx(t), t ≥ 0,x(t) ∈ Rn
Định nghĩa 1.2.1 Ma trậnAđược gọi là ổn định (stable) nếuReλ < 0với mọi
λ ∈ λ (A)
Trong thực tế, nhiều khi chúng ta không quan sát được toàn bộ đầu ra x(t)
(nghiệm của phương trình (1.16)), mà chỉ quan sát được một số tọa độ của nóthông qua hàm
Trang 32Hệ (1.16)- (1.17) hay cặp ma trận(A, C)được gọi là quan sát được (observable)
nếu vớix0 ∈ Rn, x0 6= 0tồn tạit > 0 sao cho
y(t) = Cx(t) 6= 0
Hệ (1.16)- (1.17) hay cặp ma trận (A, C) được gọi là nhận biết được
(de-tectable) nếu tồn tại ma trận K ∈ M (n, k) sao cho ma trận A + KC là ổnđịnh
Một cặp ma trận (A, B) được gọi là ổn định hóa được khi tồn tại ma trận
K ∈ M (n, k) sao cho(A − KB)là ổn định
Định lý 1.2.1 Giả sử(A, B) ổn định hóa được và (P, A) nhận biết được tectable) Khi đó tồn tại duy nhất ma trận nửa xác định dươngS là nghiệm của phương trình đại số Riccati (1.15), điều khiển u = −Q−1BTSx sao cho hệ phương trìnhx0 = (A − BQ−1BTS)x là ổn định.
(de-Chú ý 1.2.1 NếuP = C∗C, trong đó ma trận C có cỡ p × n với p < n Khi
ấy (P, A) là nhận biết được (detectable) khi và chỉ khi (C, A) cũng nhận biết được (detectable) Hàm mục tiêu được cho bởi
Từ giả thiết của định lý, ta dễ thấy rằng nếu (A, B) ổn định hoá được, và
(P, A)nhận biết được (detectable), thì hàm điều khiển
dẫn đến hệ đóng
x0 = A − BQ−1BTSx (1.20)
Trang 33là ổn định Do đó (1.19) là một điều khiển chấp nhận được, dẫn đếnx (t) →
t→∞0
Ta kiểm tra (1.19) đúng là điều khiển tối ưu
Sử dụng (1.15) ta viếtP như sau
Trang 34Ta cóxT0Sx0 là hằng số không phụ thuộcu, và dou = −Q−1BTSxchấp nhậnđược vàQ > 0, ta được điều khiển
u = −Q−1BTSx (t)
với hàm mục tiêu cực tiểu được cho bởi
J (x0) = xT0Sx0 (1.21)
Định lý 1.2.2 (Theorem 2.2, [10], p 2.11 - 2.12) Cho(A, B)ổn định và(P, A)
nhận biết được (detectable) Điều khiển tối ưu làm cực tiểu hàm mục tiêu của phương trình (1.9) được cho bởi
u = −Q−1BTSx (t) ,
trong đó S là nghiệm duy nhất nửa xác định dương của (1.13) Hàm mục tiêu
tối ưu được cho bởi(1.21)
Trang 352q
Trang 36Chương 2
Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương
trình vi phân đại số tuyến tính
Lí thuyết phương trình vi phân đại số (Differential Algebraic Equations
-DAEs) được định hình và phát triển trong khoảng ba mươi năm trở lại đây Mộtmặt, nó có thể được coi như là sự mở rộng tự nhiên của lí thuyết phương trình
vi phân Mặt khác, lí do để phương trình vi phân đại số được các nhà toán họcquan tâm là vì nó là mô hình của rất nhiều các bài toán thực tế
Nhiều bài toán thực tế (điều khiển người máy, hệ thống điện, ) được mô tảbởi các hệ phương trình vi phân đại số có điều khiển Lí thuyết điều khiển các
hệ động lực mô tả bởi phương trình vi phân đại số được quan tâm và phát triểnmạnh mẽ trong những năm gần đây
Chương 2 của luận văn trình bày bài toán điều khiển tối ưu mô tả bởi hệphương trình vi phân đại số tuyến tính với hàm mục tiêu toàn phương Theomột nghĩa nào đó, nội dung của Chương 2 là sự phát triển của Chương 1 cho hệđiều khiển mô tả bởi hệ phương trình vi phân đại số tuyến tính Đồng thời cũngchỉ ra những khó khăn khi làm việc với các hệ thống phức tạp hơn hệ phươngtrình vi phân thường