1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bài toán điều khiển tối ưu toàn phương mô tả bởi hệ phương trình vi phân đại số tuyến tính

72 542 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 72
Dung lượng 474,81 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

26 2 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương trình vi phân đại số tuyến tính 33 2.1 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi

Trang 1

CHU THỊ HỒNG

BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU TOÀN PHƯƠNG

MÔ TẢ BỞI HỆ PHƯƠNG TRÌNH

VI PHÂN ĐẠI SỐ TUYẾN TÍNH

LUẬN VĂN THẠC SĨ TOÁN HỌC

HÀ NỘI, 2015

Trang 2

CHU THỊ HỒNG

BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU TOÀN PHƯƠNG

MÔ TẢ BỞI HỆ PHƯƠNG TRÌNH

VI PHÂN ĐẠI SỐ TUYẾN TÍNH

Chuyên ngành: Toán giải tích

Mã số: 60 46 01 02

LUẬN VĂN THẠC SĨ TOÁN HỌC

Người hướng dẫn khoa học: PGS TS TẠ DUY PHƯỢNG

HÀ NỘI, 2015

Trang 3

Luận văn được thực hiện và hoàn thành dưới sự hướng dẫn khoa học củaPGS TS Tạ Duy Phượng Tôi xin được gửi lời cảm ơn sâu sắc đến Thầy hướngdẫn khoa học của mình, người đã giao đề tài và tận tình hướng dẫn trong suốtquá trình tìm hiểu, nghiên cứu để tôi có thể hoàn thành luận văn này.

Nhân dịp này, tôi cũng xin chân thành cảm ơn tới toàn thể các Thầy Cô giáokhoa Toán đặc biệt là chuyên ngành Toán Giải tích, Phòng Sau đại học, trườngĐại học Sư phạm Hà Nội 2 đã giảng dạy và giúp đỡ tôi trong suốt quá trình họctập và nghiên cứu tại trường

Cuối cùng, tôi xin gửi lời cảm ơn chân thành tới gia đình và bạn bè đã cổ vũ,động viên, giúp đỡ tôi trong quá trình học tập và thực hiện luận văn này

Hà Nội, tháng 6 năm 2015

Người thực hiện

Chu Thị Hồng

Trang 4

Tôi xin cam đoan, dưới sự hướng dẫn của PGS TS Tạ Duy Phượng, luận văn

chuyên ngành Toán giải tích với đề tài: Bài toán điều khiển tối ưu toàn phương

mô tả bởi hệ phương trình vi phân đại số tuyến tính được hoàn thành bởi sựnhận thức và tìm hiểu của bản thân tác giả

Trong quá trình nghiên cứu và thực hiện luận văn, tác giả đã kế thừa nhữngkết quả của các nhà khoa học với sự trân trọng và biết ơn

Hà Nội, tháng 6 năm 2015

Người thực hiện

Chu Thị Hồng

Trang 5

Mục lục

1 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi

1.1 Bài toán điều khiển tối ưu 8

1.1.1 Các khái niệm cơ bản 8

1.1.2 Bài toán điều khiển tối ưu 16

1.1.3 Nguyên lí cực đại Pontryagin 22

1.2 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương trình vi phân tuyến tính 25

1.2.1 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương trình vi phân tuyến tính 25

1.2.2 Phương trình Riccati 26

2 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương trình vi phân đại số tuyến tính 33 2.1 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương trình vi phân đại số tuyến tính 34

2.1.1 Các khái niệm cơ bản 34

2.1.2 Điều kiện cần và đủ tối ưu 44

Trang 6

2.2 Cấu trúc Hamilton 51

2.3 Nghiệm của bài toán điều khiển tối ưu với điều khiển liên hệ ngược 55

2.3.1 Điều khiển tối ưu liên hệ ngược 55

2.3.2 Nghiệm của hệ phương trình DAE Riccati 58

2.3.3 Nghiệm của bài toán hệ đóng 63

2.3.4 Phương trình Riccati và hệ Hamilton 64

Trang 7

Danh mục kí hiệu và viết tắt

Các kí hiệu thường dùng

Rm: Không gian Euclide mchiều

X∗: Không gian liên hợp củaX

L(Rn,Rm): Không gian các ánh xạ tuyến tính liên tục từ Rn tới Rm

L(Rn): Không gian các ánh xạ tuyến tính từ Rn tới Rn

L2[a, b]: Không gian các hàm khả tích trên[a, b]

C[a, b]: Không gian các hàm liên tục trên đoạn[a, b]

C1[a, b]: Không gian các hàm khả vi, liên tục trên đoạn[a, b]

C1B[a, b]=x ∈ C[a, b] : Bx ∈ C1[a, b]

Các kí hiệu viết tắt

DAE Phương trình vi phân đại số

ODE Phương trình vi phân thường

Trang 8

Mở đầu

1 Lí do chọn đề tài

Do yêu cầu thực tiễn, bài toán điều khiển tối ưu mô tả bởi hệ phương trình

vi phân thường đã được nghiên cứu khá trọn vẹn và đã đạt được các kết quả cơbản, điển hình là nguyên lí cực đại Pontryagin và phương pháp qui hoạch động.Cũng do những yêu cầu của kĩ thuật, khoa học và công nghệ, bắt đầu từ nhữngnăm 1980, phương trình vi phân đại số (Differential-Algebraic Equations) mô

tả các hệ thống phức tạp (trong cơ học người máy, hóa học, điều khiển tàu vũtrụ, ) đã được nghiên cứu mạnh mẽ trên thế giới Bài toán điều khiển tối ưuvới hàm mục tiêu toàn phương mô tả bởi hệ phương trình vi phân đại số tuyếntính đã được một số nhóm nghiên cứu trên thế giới (Nga, Đức, ) cố gắng giảiquyết (xem, thí dụ [4], [7], [9])

Với mong muốn tìm hiểu sâu hơn về một hướng nghiên cứu tương đối thời sựhiện nay là bài toán điều khiển tối ưu mô tả bởi hệ phương trình vi phân thường

và phương trình vi phân đại số, tôi chọn đề tài Bài toán điều khiển tối ưu toàn

phương mô tả bởi hệ phương trình vi phân đại số tuyến tính làm luận văn caohọc

2 Mục đích nghiên cứu

1) Tìm hiểu và trình bày bài toán điều khiển tối ưu với hàm mục tiêu toànphương mô tả bởi hệ phương trình vi phân thường tuyến tính trong không gian

Trang 9

hữu hạn chiều, chủ yếu theo Tài liệu [8] và một số tài liệu khác.

2) Tìm hiểu và trình bày lí thuyết hệ phương trình vi phân đại số tuyến tính,chủ yếu theo Tài liệu [7]

3) Tìm hiểu và trình bày bài toán điều khiển tối ưu với hàm mục tiêu toànphương mô tả bởi hệ phương trình vi phân đại số tuyến tính theo [9]

3 Nhiệm vụ nghiên cứu

1) Nghiên cứu bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô

tả bởi hệ phương trình vi phân thường trong không gian hữu hạn chiều

2) Nghiên cứu hệ phương trình vi phân đại số

3) Nghiên cứu bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô

tả bởi hệ phương trình vi phân đại số tuyến tính

4 Đối tượng và phạm vi nghiên cứu

Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phươngtrình vi phân thường và phương trình vi phân đại số tuyến tính

5 Phương pháp nghiên cứu

1) Thu thập các tài liệu liên quan tới Bài toán điều khiển tối ưu với hàm mụctiêu toàn phương mô tả bởi hệ phương trình vi phân

2) Phân tích, tổng hợp và hệ thống các kiến thức liên quan tới Bài toán điềukhiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương trình vi phânthường và phương trình vi phân đại số tuyến tính

Trang 10

6 Đóng góp mới

Xây dựng Luận văn thành một tài liệu tổng quan tốt cho sinh viên và học viêncao học về đề tài Bài toán điều khiển tối ưu toàn phương mô tả bởi hệ phươngtrình vi phân thường và phương trình vi phân đại số tuyến tính trong không gianhữu hạn chiều

Trang 11

Chương 1

Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương

trình vi phân thường tuyến tính

1.1 Bài toán điều khiển tối ưu

1.1.1 Các khái niệm cơ bản

Định nghĩa 1.1.1 Cho X, Y là hai không gian vectơ trên trường số thực R

A : X → Y được gọi là ánh xạ tuyến tính từX vàoY nếu thỏa mãn điều kiện

A(αx) = αA(x), với mọix ∈ X, α ∈ R,

A(x + y) = A(x) + A(y), với mọix, y ∈ X

Tập tất cả các tổ hợp tuyến tính của x1, x2, , xk là một không gian con được

gọi là span củax1, x2, , xk, được xác định bởi

span{x1,x2, , xk} := {x =α1x1 + + αkxk : αi ∈ R, i = 1, 2, , k}.Tập các vectơx1, x2, , xk được gọi là độc lập tuyến tính trên R nếu

α1, α2, , αk ∈ R

Trang 12

thỏa mãn hệ thức

α1x1 + + αkxk = 0,

chỉ xảy ra khi và chỉ khiα1 = α2 = = αn = 0

Hệ vectơ x1, x2, , xk được gọi là phụ thuộc tuyến tính nếu nó không độc lập

Ma trận A cấp n × n gọi là ma trận nửa xác định dương (semi-positive

definite)được kí hiệu bởiA ≥ 0, nếux∗Ax ≥ 0với mọix ∈ Rn

Ma trận Acấp n × n được gọi là ma trận xác định dương (positive definite)

được kí hiệu bởiA > 0, nếux∗Ax > 0với mọix 6= 0

Vậy ma trậnB là ma trận nửa xác định dương

Định nghĩa 1.1.5 Một ma trận vuông A cấp n × n được gọi là suy biến

(sin-gular) nếu định thức của nó bằng 0 Ma trận vuông có định thức khác 0 được

gọi là ma trận không suy biến (nonsingular).

Trang 13

Định nghĩa 1.1.6 ChoE, F ∈ L(Rm) Cặp ma trận(E, F ) được gọi là chính

quy nếu ∃λ sao cho det(λE + F ) 6= 0 Nếudet(λE + F ) ≡ 0 với mọi λ thìcặp ma trận(E, F )được gọi là suy biến.

Tập hợp các ma trận dạng(λE + F ) được gọi là chùm ma trận.

Định nghĩa 1.1.7 ChoAlà ma trận vuông cấpn, ma trậnAgọi là ma trận khả

nghịchnếu tồn tại ma trậnB vuông cấp nsao choAB = BA = En (En là matrận đơn vị cấpn)

NếuAlà ma trận khả nghịch thì ma trậnB thỏa mãn điều kiện trên là duy nhất,

vàB gọi là ma trận nghịch đảo (inverse matrix) của ma trậnA, kí hiệu là A−1.Vậy ta luôn cóAA−1 = A−1A = En

Ta thấy rằngAkhả nghịch khi và chỉ khiAkhông suy biến (tức làdetA 6= 0).Nếu A, B khả nghịch thì AB cũng khả nghịch và (AB)−1 = B−1A−1

doM−M M− = M−nên M− là ma trận nghịch đảo suy rộng củaM

Định nghĩa 1.1.9 Hạng của ma trận là giá trị lớn nhất của số hàng hoặc số cột

độc lập tuyến tính Hạng của ma trậnAkí hiệu là rankA

Ma trận A ∈ Rm×n được gọi là có hạng dòng đầy đủ nếu m < n và

rank(A) = m

Ma trậnAđược gọi là có hạng cột đầy đủ nếun ≤ mvàrank(A) = n

Trang 14

Nếurank(A)bằng số cột hoặc số dòng củaAthìAđược gọi là có hạng đầy

đủ

Ma trận vuông có hạng đầy đủ là một ma trận không suy biến

Định nghĩa 1.1.10 ([2], p 57) Ta gọi không gian định chuẩn (hay không gian

tuyến tính định chuẩn) là không gian tuyến tínhX trên trườngP (P = R hoặc

P = C) cùng với một ánh xạ từX vào tập số thực R, kí hiệu là k.k và đọc là

chuẩn, thỏa mãn các tiên đề sau đây:

(1)∀x ∈ X : kxk ≥ 0, kxk = 0 ⇔ x = θ (θlà kí hiệu phần tử không của X);(2)∀x ∈ X, ∀α ∈ P : kαxk = |α| kxk;

(3)∀x, y ∈ X : kx + yk ≤ kxk + kyk

Số kxk được gọi là chuẩn của véctơ x Ta cũng kí hiệu không gian định chuẩn

làX Các tiên đề trên được gọi là hệ tiên đề chuẩn.

Định nghĩa 1.1.11 Cho X là không gian định chuẩn và {xn}n∈N là dãy cácphần tử trongX Ta nói rằng dãy{xn}n∈Nhội tụ theo chuẩnđến x ∈ X,

xn → x

nếu

lim

n→∞kx − xnk = 0

Định nghĩa 1.1.12 Cho U là một tập mở trong Rn và f : U → Rm Hàm f

được gọi là khả vi tại điểm a = (a1, a2, , an) ∈ U nếu tồn tại một ánh xạtuyến tínhA :Rn →Rm sao cho

Trang 15

Cho tậpX 6= ∅và họ F các tập con của X.

Định nghĩa 1.1.13 ([3], p 30)F được gọi là một σ− đại sốnếu nó thỏa mãncác điều kiện

(i) X, ∅ ∈ F

(ii) A ∈ F ⇒ Ac ∈ F, trong đóAc := X\A

(iii) Ak ∈ F , k = 1, 2, ⇒ ∞∪

k=1Ak ∈ F.NếuF làσ−đại số các tập con củaX thì cặp(X, F )được gọi là một không

gian đo được và mỗi tập A ∈ F được gọi là tập đo được (đo được với F hay

F −đo được)

Định nghĩa 1.1.14 Độ đoµ : F → R+ là một hàm tập xác định trên σ− đại

sốF trênX và thỏa mãn các tính chất sau:

1)µ (A) ≥ 0với mọiA ∈ F;

Định nghĩa 1.1.16 Trong một không gian metricX bất kì, cho mộtσ− đại số

F và một độ đo µ trên F Ta nói một điều kiện α (x) được thỏa mãn với hầu

Trang 16

hết mọi x ∈ A, hay được thỏa mãn hầu khắp nơi trênAnếu có tậpB ⊂ Asaochoµ (B) = 0vàα (x) được thỏa mãn với mọi x ∈ A\B.

Ví dụ f (x) = g(x)hầu khắp nơi trên Acó nghĩa là ∃B ⊂ A, µ (B) = 0 và

∀x ∈ A\B, f (x) = g (x)

Định nghĩa 1.1.17 Một hàm f : X → R được gọi là hàm đơn giản nếu nó đo

được và chỉ nhận hữu hạn giá trị

Định lý 1.1.1 Nếu f là hàm đo được, không âm thì tồn tại dãy các hàm đơn giản, không âmfn sao cho

cũng là các hàm đo được, không âm và ta cóf (t) = f+(t) − f−(t).

Nếu ít nhất một trong các tích phânR

A

f+dµ,R

A

f−dµ, là số hữu hạn thì ta định nghĩa

Trang 17

Ánh xạf được gọi là liên tục tại điểmx0 ∈ X, nếu∀ε > 0, ∃δ > 0, sao chovới mọix ∈ X màd1(x, x0) < δ thìd2(f (x), f (x0)) < ε.

Ánh xạ f gọi là liên tục trên tậpA ⊂ X nếu ánh xạ f liên tục tại mọi điểm

x ∈ A KhiA = X thì ánh xạf được gọi là liên tục.

Định nghĩa 1.1.19 Một ánh xạ f từ một tập X vào tập các số thực mở rộng

¯

R = R∪ {±∞}được gọi là một hàm số thực nếuf (X) ⊂ R tức làf (x)khônglấy các giá trị±∞thì hàm số được gọi là hữu hạn Một hàm số hữu hạn và liên tục theo nghĩa ánh xạ liên tục được gọi là hàm số liên tục.

Định nghĩa 1.1.20 Hàmx : (a, b) → Rnđược gọi là liên tục tuyệt đối, nếu với

mỗiε > 0tồn tại số δ > 0 sao cho với mọi hệ hữu hạn khoảng đôi một khôngcắt nhau

ChọnN = 1 ta có, hàm liên tục tuyệt đối là liên tục đều trên(a, b)

Định lý 1.1.2 (Lebesgue) Nếu hàm x : (a, b) → Rn là liên tục tuyệt đối trên

(a, b), thì nó khả vi hầu khắp nơi trên(a, b), đạo hàmx0(.) của nó khả tích trên

(a, b)và công thức Newton-Leibniz

Trang 18

đúng với mọit, τ ∈ (a, b).

Nếu hàmξ : (a, b) → Rn khả tích trên (a, b) τ ∈ (a, b), thì hàm số x (t) =

t

R

τ

ξ (s)ds là liên tục tuyệt đối và x0(t) = ξ (t)hầu khắp nơi.

Ta nói hàm x = (x1, x2, , xn) : (a, b) → Rn là đo được và khả tích nếumỗi hàm sốxi : (a, b) → R là đo được và khả tích Và theo định nghĩa,

Z b a

x (t) dt =

Z b a

x1(t) dt, ,

Z b a

xbán kínhr > 0được gọi là lân cận củax ∈ X¯ trong không gianM

Định nghĩa 1.1.22 Một tậpC trong một không gian vectơ thực hay phức được

gọi là lồi nếu:

a, b ∈ C ⇒ αa + (1 − α) b ∈ C

Tập hợp các điểm có dạngαa + (1 − α) b ∈ C với0 ≤ α ≤ 1được gọi là đoạnthẳng nốiavớib Có thể định nghĩa một tập là lồi nếu nó chứa mọi đoạn thẳngnối hai điểm bất kì của nó

Một hàm f xác định trên một tập lồi C và có thể lấy giá trị +∞được gọi là

hàm lồinếu:

a, b ∈ C, 0 ≤ α ≤ 1 ⇒ f (αa + (1 − α) b) ≤ αf (a) + (1 − α) f (b)

Định nghĩa 1.1.23 Cho A là toán tử tuyến tính bị chặn ánh xạ không gianHilbert X vào không gian Hilbert Y Toán tử B ánh xạ không gian Y vàokhông gianX gọi là toán tử liên hợp với toán tửAnếu

hAx, yi = hx, Byi , ∀x ∈ X, ∀y ∈ Y

Toán tử liên hợpB được kí hiệu là A∗

Trang 19

Định nghĩa 1.1.24 Toán tử tuyến tính bị chặnAánh xạ không gian Hilbert H

vào chính nó gọi là tự liên hợp nếu

hAx, yi = hx, Ayi , ∀x, y ∈ H

Toán tử tự liên hợp còn gọi là toán tử đối xứng

1.1.2 Bài toán điều khiển tối ưu

Xét hệ phương trình vi phân thường

Một hàm khả vi x : (a, b) → G được gọi là nghiệm của hệ phương trình vi

phân (1.1) trên khoảng (a, b) nếu nó thỏa mãn hệ phương trình (1.1) với mọi

t ∈ (a, b), tức là dx (t)

dt = f (t, x (t))đúng với mọit ∈ (a, b).

Định lý 1.1.3 (Định lý tồn tại nghiệm của phương trình vi phân)

Giả sửf : (a, b) × G →Rn là hàm Lipshitz theoxđều theot, tức là:

kf (t, x1) − f (t, x2)k ≤ L kx1 − x2k , ∀t ∈ (a, b) , ∀x1, x2 ∈ G mở⊆ Rn.

Khi đó phương trình (1.1) có duy nhất nghiệm địa phương thỏa mãn điều kiện

ban đầu

x (t0) = x0, t0 ∈ (a, b).

Trang 20

Chú ý 1.1.1 Để ngắn gọn, ta thường gọi hệ phương trình (1.1) là phương trình

vi phân, ta hiểu rằng đây là phương trình vi phân vectơ hay hệ phương trình vi phân Tương tự, đôi khi ta cũng gọi các hàm vectơ x(t) f (t, x) là các hàm số.

Bài toán tìm nghiệm của hệ phương trình (1.1) thỏa mãn điều kiện (1.2) được

gọi là bài toán giá trị ban đầu hay bài toán Cauchy của hệ phương trình vi phân

với các thời điểmt0, T > t0 là cho trước và cố định

Các hàmu : [0, ∞) → Rmlà hàm đo được (hoặc liên tục từng khúc) trên[t0, T ]

Trang 21

Ví dụ 1.4 Chox0 = u Vế phải f (t, x, u) = uliên tục theo(t, x, u) Nếu chọn

Trang 22

Nghiệmx(t) không khả vi tạix = 0.

Vì vậy ta phải mở rộng khái niệm nghiệm của phương trình vi phân (1.1)

Định nghĩa 1.1.25 Hàm sốx = ϕ (t)liên tục tuyệt đối trên khoảng

(t0 − δ, t0 + δ) ⊂ (a, b)

(do đó có đạo hàm hầu khắp nơi trên(t0 − δ, t0 + δ)thỏa mãn phương trình viphân (1.1) hầu khắp nơi trên (t0 − δ, t0 + δ)được gọi là nghiệm suy rộng địa

phương trong lân cậnt0 của phương trình vi phân (1.1) trên khoảng(a, b)

Nếu điều kiện của Định lí Caratheodory được thỏa mãn, thì phương trình viphân (1.5) có nghiệm (suy rộng)x (t)

Ta nhắc lại Định lí Caratheodory về tồn tại nghiệm suy rộng của phương trình

vi phân với vế phải đo được

Định lí Caratheodory Cho hàmf : D → Rn, trong đó

Trang 23

Khi ấy tồn tại một sốc > 0sao cho phương trình vi phân (1.1) có nghiệm suyrộng trênTc = {t : |t − t0| ≤ c} thoả mãn điều kiện ban đầux (t0) = x0.Theo định lý Caratheodory với mỗi điều khiển chấp nhận được hệ (1.3) cómột và chỉ một nghiệm x(t), x(t) liên tục tuyệt đối từ I tới Rn thỏa mãn điềukiệnx(t0) = x0.

Vớiu(.)đã chọn thì (1.3) nói chung có nghiệm địa phươngx(.) Nghiệmx(.)

được gọi là quỹ đạo ứng với điều khiểnu(.)

Bài toán(x0, x1)- điều khiển đượcđược phát biểu như sau: Cho trướcx0, x1 ∈

Rn, hệ (1.3) được gọi là (x0, x1) - điều khiển được nếu tồn tại T > 0, điềukhiển chấp nhận được u(.) sao cho quỹ đạo tương ứngx(t) đi từ x0 tới x1, tức

làx(0) = x0, x(T ) = x1

Hệ (1.3) được gọi là hoàn toàn điều khiển được nếu với mỗi vectơ x(0) =

x0 ∈ Rn, x1 ∈ Rn, với mỗi T > 0 và một hàm đo được u(t) trên [0, T ],

u(t) ∈ Rn sao cho quỹ đạo tương ứng của hệ (1.3) thỏa mãn điều kiệnx0 ∈ Rn

và x(T ) = x1 Nghĩa là, tồn tại một điều khiển chuyển hệ từ vị trí (trạng thái)

x0 ∈ Rn sang vị trí (trạng thái)x1 ∈ Rn sau thời gianT

Bài toán điều khiển tối ưu (optimal control problem) được phát biểu như sau:

Trong số tất cả các điều khiển đưa quỹ đạo từx0 đếnx1 hãy tìm điều khiểnu(t)

sao cho nó cực tiểu hóa một tiêu chuẩnJ (u),J (u)được gọi là hàm mục tiêu.

Định nghĩa 1.1.26 Tập các trạng thái có thể đạt được từ trạng thái ban đầu x0

sau thời gianT, T > 0, được định nghĩa bởi

Acc (x0, T ) = {xu(T ) , u (t) ∈ U } ,

trong đóxu(.)là nghiệm của hệ (1.7) sinh bởi điều khiển chấp nhận đượcu(.),

và thỏa mãn điều kiện ban đầuxu(0) = x0 , U là tập lồi trong không gian hữuhạn chiều Ta đặtAcc(x0, 0) = x0

TậpAcc (x0, T )được gọi là tập đạt được của hệ (1.7) tại thời điểmT xuất phát

từ điểmx0

Trang 24

Mệnh đề 1.1.1 NếuU là lồi thìAcc (x0, T )là tập lồi với mọi T > 0.

Chứng minh. Lấy xT1, xT2 ∈ Acc (x0, T ) Khi ấy tồn tại ui(t),i = 1, 2 là điềukhiển chấp nhận được sao cho xi(t) là nghiệm của (1.7) tương ứng với ui(t)

thỏa mãn điều kiện ban đầux(0) = x0 Khi ấy

x0i(t) = A(t)xi(t) + B(t)ui(t) + f (t); i = 1, 2, t ∈ [0, T ]

Choλ ∈ [0, 1], ta chứng minh λxT1 + (1 − λ) xT2 ∈ Acc (x0, T )

Ta đã biết, nghiệm của phương trình vi phân tuyến tính thường có dạng

Chox(t)là nghiệm tương ứng với u(t) Ta có

Trang 25

Khi đó

λxT1 (T ) + (1 − λ) xT2 (T )∈ Acc (x0, T )

VậyAcc (x0, T )là tập lồi với mọi T > 0

1.1.3 Nguyên lí cực đại Pontryagin

Xét hệ phương trình vi phân có điều khiển

Hàmψ : Rn →Rq choq ràng buộc là các hạn chế tại điểm cuối, tức là

ψq(x (T )) = 0

Bài toán điều khiển tối ưu được phát biểu như sau: Trong số tất cả các điều

khiển chấp nhận đượcu(.)trên[0, T ], hãy tìm điều khiển u∗(.) sao cho

J (x∗, u∗) ≤ J (x, u) ,

với mọi điều khiển chấp nhận đượcu (·), x (·)là quỹ đạo sinh bởiu (·)

Bộ (x∗, u∗) làm cực tiểu phiếm hàmJ (x, u) được gọi là quá trình tối ưu.

Trang 26

Định lý 1.1.4 (Nguyên lý cực đại Pontryagin, Theorem 2.1, [9], p 2-6)

Giả sử (x∗, u∗) là quá trình tối ưu Khi đó tồn tạiλ∗(t) ∈ Rn ν∗ ∈ Rq sao chox∗(.), λ∗(.)thỏa mãn

với mọiu ∈ U hầu khắp nơi.

Như vậy, nghiệm tối ưu là nghiệm của phương trình vi phân với điều kiệnbiên và thỏa mãn điều kiện tối ưu (1.6)

Nếu u = arg min H (x, u, λ) tồn tại, ta có thể sử dụng điều này chọn điềukhiển uvà tìm quỹ đạo chấp nhận được làm cực tiểu hàm mục tiêu

Điều kiện biên cho bởi n điều kiện ban đầu x(0) = x0 ∈ Rn, q ràng buộccuối trong trạng tháiψ (x (T )) = 0, vàn − qgiá trị cuối cho nhân tử Lagrange(the Lagrange multipliers)

λ (T ) = ∂V

∂x (x (T )) + ν

T∂ψ

∂x.

Trong phương trình cuối,ν là biến tự do và do đó cónphương trình trongn + q

biến tự do, loạin − q ràng buộc đặt trênλ (T ) Như vậy tổng cộng, ta có2ngiátrị biên

Trang 27

Nguyên lý cực đại là một định lý rất tổng quát NếuU = Rm và H là khả vi,thì điều kiện cần của điều khiển tối ưu trở thành

Trang 28

LấyT cố định, số gia của hàm mục tiêu được viết như sau

1.2 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương

mô tả bởi hệ phương trình vi phân tuyến tính

1.2.1 Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả

bởi hệ phương trình vi phân tuyến tính

Xét hệ phương trình vi phân thường tuyến tính có điều khiển

x0(t) = A (t) x (t) + B (t) u (t) , t ∈ I = [0, T ] (1.7)

x ∈ Rn, u ∈ Rm,x0 cho trước

Trang 29

Ở đâyA(t)và B(t)là các ma trận hàm lần lượt có cấpn × n, n × m, biến thờigiantthay đổi trong đoạn[0, T ],n– vectơ (vectơnchiều).

Hàm mục tiêu có dạng toàn phương (quadratic form)

J = 12

Bài toán điều khiển tối ưu với hàm mục tiêu dạng toàn phương tuyến tính

(linear-quadraic optimal problem) được phát biểu như sau: Cho x0 và T, tìm

u(t) sao chox(t) là nghiệm của (1.7), cực tiểu hàm mục tiêu J (u) được địnhnghĩa bởi (1.8)

Trang 30

Sử dụng Định lý (1.1.4), ta được điều kiện cần

thay vào phương trình (1.10) ta được hệ (1.10)-(1.11) Để giải bài toán điều

khiển tối ưu ta phải giải bài toán biên hai điểm bằng cách sử dụng điều kiện

đầux(0) = x0 và điều kiện cuốiλ(T ) Tuy nhiên, nói chung hệ này là khó giải

Trang 31

Phương trình (1.13) được gọi là phương trình vi phân ma trận Riccati.

Giả sửS(t) thỏa mãn (1.13), ta có điều khiển tối ưu dạng

u(t) = −Q−1(t)BT(t)S(t)x(t)

Thay vào hệ phương trình vi phân ban đầu (1.9) và giải hệ này với điều kiện

x(0) = x0 ta được nghiệm Chú ý rằng ở đây điều khiển u(t)là một dạng điềukhiển dạng liên hệ ngược

Một bài toán điều khiển tối ưu quan trọng là khi T = ∞ và W = 0 Hàmmục tiêu có dạng

không có ràng buộc đặt lên giá trị cuốiλ hoặc S(t) tương đương Do đó ta tìm

ma trận hằngS thỏa mãn (1.13) Nói cách khác, ta tìmS sao cho

Nghiệm của (1.16) được kí hiệu làx(t), t ≥ 0,x(t) ∈ Rn

Định nghĩa 1.2.1 Ma trậnAđược gọi là ổn định (stable) nếuReλ < 0với mọi

λ ∈ λ (A)

Trong thực tế, nhiều khi chúng ta không quan sát được toàn bộ đầu ra x(t)

(nghiệm của phương trình (1.16)), mà chỉ quan sát được một số tọa độ của nóthông qua hàm

Trang 32

Hệ (1.16)- (1.17) hay cặp ma trận(A, C)được gọi là quan sát được (observable)

nếu vớix0 ∈ Rn, x0 6= 0tồn tạit > 0 sao cho

y(t) = Cx(t) 6= 0

Hệ (1.16)- (1.17) hay cặp ma trận (A, C) được gọi là nhận biết được

(de-tectable) nếu tồn tại ma trận K ∈ M (n, k) sao cho ma trận A + KC là ổnđịnh

Một cặp ma trận (A, B) được gọi là ổn định hóa được khi tồn tại ma trận

K ∈ M (n, k) sao cho(A − KB)là ổn định

Định lý 1.2.1 Giả sử(A, B) ổn định hóa được và (P, A) nhận biết được tectable) Khi đó tồn tại duy nhất ma trận nửa xác định dươngS là nghiệm của phương trình đại số Riccati (1.15), điều khiển u = −Q−1BTSx sao cho hệ phương trìnhx0 = (A − BQ−1BTS)x là ổn định.

(de-Chú ý 1.2.1 NếuP = C∗C, trong đó ma trận C có cỡ p × n với p < n Khi

ấy (P, A) là nhận biết được (detectable) khi và chỉ khi (C, A) cũng nhận biết được (detectable) Hàm mục tiêu được cho bởi

Từ giả thiết của định lý, ta dễ thấy rằng nếu (A, B) ổn định hoá được, và

(P, A)nhận biết được (detectable), thì hàm điều khiển

dẫn đến hệ đóng

x0 = A − BQ−1BTSx (1.20)

Trang 33

là ổn định Do đó (1.19) là một điều khiển chấp nhận được, dẫn đếnx (t) →

t→∞0

Ta kiểm tra (1.19) đúng là điều khiển tối ưu

Sử dụng (1.15) ta viếtP như sau

Trang 34

Ta cóxT0Sx0 là hằng số không phụ thuộcu, và dou = −Q−1BTSxchấp nhậnđược vàQ > 0, ta được điều khiển

u = −Q−1BTSx (t)

với hàm mục tiêu cực tiểu được cho bởi

J (x0) = xT0Sx0 (1.21)

Định lý 1.2.2 (Theorem 2.2, [10], p 2.11 - 2.12) Cho(A, B)ổn định và(P, A)

nhận biết được (detectable) Điều khiển tối ưu làm cực tiểu hàm mục tiêu của phương trình (1.9) được cho bởi

u = −Q−1BTSx (t) ,

trong đó S là nghiệm duy nhất nửa xác định dương của (1.13) Hàm mục tiêu

tối ưu được cho bởi(1.21)

Trang 35

2q

Trang 36

Chương 2

Bài toán điều khiển tối ưu với hàm mục tiêu toàn phương mô tả bởi hệ phương

trình vi phân đại số tuyến tính

Lí thuyết phương trình vi phân đại số (Differential Algebraic Equations

-DAEs) được định hình và phát triển trong khoảng ba mươi năm trở lại đây Mộtmặt, nó có thể được coi như là sự mở rộng tự nhiên của lí thuyết phương trình

vi phân Mặt khác, lí do để phương trình vi phân đại số được các nhà toán họcquan tâm là vì nó là mô hình của rất nhiều các bài toán thực tế

Nhiều bài toán thực tế (điều khiển người máy, hệ thống điện, ) được mô tảbởi các hệ phương trình vi phân đại số có điều khiển Lí thuyết điều khiển các

hệ động lực mô tả bởi phương trình vi phân đại số được quan tâm và phát triểnmạnh mẽ trong những năm gần đây

Chương 2 của luận văn trình bày bài toán điều khiển tối ưu mô tả bởi hệphương trình vi phân đại số tuyến tính với hàm mục tiêu toàn phương Theomột nghĩa nào đó, nội dung của Chương 2 là sự phát triển của Chương 1 cho hệđiều khiển mô tả bởi hệ phương trình vi phân đại số tuyến tính Đồng thời cũngchỉ ra những khó khăn khi làm việc với các hệ thống phức tạp hơn hệ phươngtrình vi phân thường

Ngày đăng: 15/08/2016, 15:55

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Phạm Kỳ Anh, Phương pháp số trong điều khiển tối ưu, NXB Đại học Quốc gia Hà Nội, 2001 Sách, tạp chí
Tiêu đề: Phương pháp số trong điều khiển tối ưu
Nhà XB: NXB Đại họcQuốc gia Hà Nội
[2] Nguyễn Phụ Hy, Giải tích hàm, NXB Khoa học và Kĩ thuật, 2006 Sách, tạp chí
Tiêu đề: Giải tích hàm
Nhà XB: NXB Khoa học và Kĩ thuật
[3] Hoàng Tụy, Hàm thực và giải tích hàm, NXB Đại học Quốc gia Hà Nội, 2005.[B] Tài liệu Tiếng Anh Sách, tạp chí
Tiêu đề: Hàm thực và giải tích hàm
Nhà XB: NXB Đại học Quốc gia Hà Nội
[4] Katalin Balla, Galina A. Kurina, Roswitha M¨arz, Index Criteria for Differ- ential Algebraic Equations Arising from Linear-Quadratic Optimal Con- trol Problems, Journal of Dynamical and Control Systems, Vol. 12, July 2006, 289-311 Sách, tạp chí
Tiêu đề: Index Criteria for Differ-ential Algebraic Equations Arising from Linear-Quadratic Optimal Con-trol Problems, Journal of Dynamical and Control Systems
[5] Galina A. Kurina, Roswitha M¨arz, Feedback control for linear systems unresolved with respect to derivative, Automat. Remote Control, Vol. 45, pp. 713–717, 1984 Sách, tạp chí
Tiêu đề: Feedback control for linear systemsunresolved with respect to derivative
[6] Galina A. Kurina, Roswitha M¨arz, (2004), On Linear-Quadratic Optimal Control Problems for Time-Varying Descriptor Systems, SIAM J. Control Optim, 42 , no. 6, 2062–2077 (electronic) Sách, tạp chí
Tiêu đề: On Linear-Quadratic OptimalControl Problems for Time-Varying Descriptor Systems
Tác giả: Galina A. Kurina, Roswitha M¨arz
Năm: 2004
[7] René Lamour, Roswitha M¨arz, Caren Tischendorf, Differential-algebraic equations: a projector based analysis, Differential-Algebraic Equations Forum, Springer, Heidelberg, xxviii+649 pp, 2013 Sách, tạp chí
Tiêu đề: Differential-algebraicequations: a projector based analysis
[8] E. B. Lee, L. Markus, Foundations of Optimal Control Theory, Robert E.Krieger Publishing Company, Florida, 1986 Sách, tạp chí
Tiêu đề: Foundations of Optimal Control Theory
[10] Richard M. Murray, Optimization-Based Control, California Institute of Technology, DRAFT V2.1a, January 4, 2010 Sách, tạp chí
Tiêu đề: Optimization-Based Control
[11] J. Zabczyk, Mathematical Control Theory: An Introduction, Birkh¨auser, Boston, 1995 Sách, tạp chí
Tiêu đề: Mathematical Control Theory: An Introduction
[9] Roswitha M¨arz, Differential Algebraic Equations in Optimal Control Problems, https://www.tu-ilmenau.de/fileadmin/media/.../Maerz.pdf Link

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w