1. Trang chủ
  2. » Cao đẳng - Đại học

Bài toán điều khiển tối ưu thời gian đối với hệ ô - tô - nôm tuyến tính

50 287 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 50
Dung lượng 681,09 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

KHOA TOÁN————oOo———— NGUYỄN THỊ THANH NGÂN BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU THỜI GIAN ĐỐI VỚI HỆ Ô-TÔ-NÔM TUYẾN TÍNH KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC Chuyên ngành: Toán giải tích HÀ NỘI, 04/2017..

Trang 1

KHOA TOÁN

————oOo————

NGUYỄN THỊ THANH NGÂN

BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU THỜI GIAN ĐỐI

VỚI HỆ Ô-TÔ-NÔM TUYẾN TÍNH

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC

Chuyên ngành: Toán giải tích

HÀ NỘI, 04/2017

Trang 2

KHOA TOÁN

————oOo————

KHÓA LUẬN TỐT NGHIỆP

BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU THỜI GIAN ĐỐI

VỚI HỆ Ô-TÔ-NÔM TUYẾN TÍNH

Giảng viên hướng dẫn: TS TRẦN VĂN BẰNG

Sinh viên thực hiện : NGUYỄN THỊ THANH NGÂN

HÀ NỘI, 04/2017

Trang 3

Để hoàn thành khóa luận tốt nghiệp này, em xin bày tỏ lòng biết ơn chânthành tới các thầy giáo và cô giáo trong khoa Toán, trường Đại học Sư phạm

Hà Nội 2, đã tận tình giúp đỡ chỉ bảo trong suốt thời gian em theo học tại khoa

và trong thời gian làm khóa luận

Đặc biệt em xin bày tỏ lòng biết ơn sâu sắc tới thầy giáo TS Trần VănBằng, giảng viên Khoa Toán, trường Đại học Sư phạm Hà Nội 2, người trựctiếp hướng dẫn em, luôn tận tâm chỉ bảo và định hướng cho em trong suốt quátrình làm khóa luận để em có được kết quả như ngày hôm nay

Mặc dù đã có rất nhiều cố gắng, song thời gian và kinh nghiệm bản thân cònnhiều hạn chế nên khóa luận không thể tránh khỏi những thiếu sót rất mongđược sự đóng góp ý kiến của các thầy cô giáo, các bạn sinh viên và bạn đọc

Em xin chân thành cảm ơn!

Hà Nội, tháng 4 năm 2017

Sinh viên

Nguyễn Thị Thanh Ngân

1

Trang 4

Khóa luận này là kết quả nghiên cứu của bản thân em dưới sự hướng dẫntận tình của thầy giáo TS Trần Văn Bằng.

Trong khi nghiên cứu hoàn thành đề tài nghiên cứu này em đã tham khảomột số tài liệu đã ghi trong phần tài liệu tham khảo

Em xin khẳng định kết quả của đề tài "Bài toán điều khiển tối ưu thờigian đối với hệ ô-tô-nôm tuyến tính" là kết quả của việc nghiên cứu, họctập và nỗ lực của bản thân, không có sự trùng lặp với kết quả của các đề tàikhác Nếu sai em xin chịu hoàn toàn trách nhiệm

Hà Nội, tháng 4 năm 2017

Sinh viên

Nguyễn Thị Thanh Ngân

2

Trang 5

Lời cảm ơn 1

1.1 Bài toán điều khiển được 8

1.2 Bài toán điều khiển tối ưu 11

1.3 Hệ thời gian ngược 12

1.4 Tính điều khiển được của hệ ô-tô-nôm 12

1.5 Phụ lục của Chương ??: Chứng minh của Nguyên lý Bang−Bang 15 2 Bài toán điều khiển tối ưu thời gian đối với hệ ô-tô-nôm tuyến tính 17 2.1 Bài toán điều khiển tối ưu thời gian đối với hệ ô-tô-nôm tuyến tính 17

2.2 Sự tồn tại của điều khiển tối ưu thời gian 21

2.3 Ứng dụng 40

Kết luận 47

Tài liệu tham khảo 48

3

Trang 6

1 Lý do chọn đề tài

Toán học bắt nguồn từ nhu cầu giải quyết các bài toán có nguồn gốc thựctiễn Cùng với thời gian, toán học ngày càng phát triển và chia thành hai lĩnhvực, đó là: Toán học lý thuyết và toán học ứng dụng Trong lĩnh vực toán họcứng dụng thường gặp rất nhiều bài toán liên quan đến việc giải quyết bài toánbằng cách tìm một quy luật điều khiển một hệ cho trước

Một bài toán điều khiển bao gồm một hàm chi phí đó là một hàm của trạngthái và các biến điều khiển Một điều khiển tối ưu là một tập hợp các phươngtrình vi phân mô tả đường đi của các biến điều khiển cực tiểu hóa hàm chi phí.Xuất phát từ nhận thức trên và lòng ham mê môn học với sự hướng dẫn tậntình của thầy giáo TS Trần Văn Bằng, em mạnh dạn chọn đề tài "Bài toánđiều khiển tối ưu thời gian đối với hệ ô-tô-nôm tuyến tính" để thựchiện khóa luận tốt nghiệp của mình Nội dung chính của khóa luận là trìnhbày một số kết quả về bài toán điều khiển tối ưu thời gian đối với hệ ô-tô-nômtuyến tính Khóa luận được trình bày trong hai chương là:

Chương 1: Kiến thức chuẩn bị

Trong chương này trình bày một số kiến thức cần thiết cho nội dung củaChương 2, bao gồm bài toán điều khiển được, bài toán điều khiển tối ưu, hệthời gian ngược và tính điều khiển được của hệ ô-tô-nôm

Chương 2: Bài toán điều khiển tối ưu thời gian đối với hệ ô-tô-nôm tuyếntính

4

Trang 7

Trong chương này trình bày một số kiến thức về bài toán điều khiển tối ưuthời gian đối với hệ ô-tô-nôm tuyến tính, sự tồn tại của điều khiển tối ưu thờigian và ứng dụng.

2 Mục đích và nhiệm vụ nghiên cứu

- Tìm hiểu tính điều khiển tối ưu thời gian của hệ ô-tô-nôm tuyến tính

- Nghiên cứu tính điều khiển tối ưu thời gian hệ ô-tô-nôm tuyến tính;

- Ứng dụng xét tính điều khiển tối ưu thời gian một số hệ ô-tô-nôm tuyếntính cụ thể

3 Đối tượng và phạm vi nghiên cứu

Đối tượng nghiên cứu: Bài toán của hệ ô-tô-nôm tuyến tính

Phạm vi nghiên cứu: Tính điều khiển tối ưu thời gian

4 Phương pháp nghiên cứu

Tổng hợp kiến thức thu thập được qua những tài liệu liên quan đến đề tài

và sử dụng các phương pháp nghiên cứu của giải tích

5 Ý nghĩa khoa học và thực tiễn của đề tài

Bài toán điều khiển tối ưu đóng vai trò quan trọng trong sự phát triển củakhoa học và kỹ thuật Lĩnh vực này hữu hiệu khắp nơi trong thực tiễn như việcđiều khiển động cơ xe lửa, mô hình nền kinh tế, mô hình bể chứa nước,

6 Đóng góp của đề tài

Xây dựng luận văn thành một tài liệu tổng quan tốt cho sinh viên về đề tài

"Bài toán điều khiển tối ưu thời gian đối với hệ ô-tô-nôm tuyến tính"

Trang 9

Bảng kí hiệu

B(x; α) Hình cầu mở tâm x bán kính α, {y|y − x| < α}

C , C [u(·)] Hàm chi phí

C (t) Tập điều khiển được ở thời điểm t

CBB(t) Tập điều khiển được ở thời điểm t sử dụng

điều khiển Bang−Bang

IntS Phần trong của tập S

K(t; x0) Tập khả đạt tại thời điểm t

KBB(t; x0) Tập khả đạt tại thời điểm t sử dụng

điều khiển Bang−Bang

UBB Lớp của hàm trong Um theo đó |ui(t)| = 1

x(t; t0; x0; u(·)) Nghiệm của phương trình vi phân

qua x0 tại thời điểm t0 ứng với điều khiển u(·)

Trang 10

KIẾN THỨC CHUẨN BỊ

1.1 Bài toán điều khiển được

Chúng ta sẽ thảo luận về tính điều khiển được của bài toán điều khiển:

˙x = f (t; x; u), u(·) ∈ Um, T (t) đã cho (1.1)tức là, mô tả những trạng thái ban đầu x(0) = x0 sao cho tồn tại ít nhất mộtđiều khiển thành công u(·)

Ta định nghĩa tập hợp điều khiển được C = S

t1>0C (t1), trong đó

C (t1) = {x0 ∈ Rn|∃u(·) ∈ Um sao cho x(t1; x0; u(·)) ∈ T (t1)}

hay đơn giản là tập những trạng thái mà có thể hướng đến mục tiêu ở thờiđiểm t1

Hai vấn đề lớn về tính điều khiển được đó là:

(a) Miêu tả tập C

(b) Miêu tả cách C thay đổi nếu chúng ta thay đổi tập điều khiển Um.Liên quan đến các lớp điều khiển đặc biệt, có ba tập con của Um mà chúng

ta sẽ xét:

(a) UP C[0; t1]={u(·) ∈ Um[0; t1]|u(·) hằng từng khúc [0; t1]} trong đó u(·)

là hằng từng khúc, tức là tồn tại một phân hoạch (phụ thuộc vào u(·))

0 = s0 < s1 < < sl = t1 sao cho u(t) là hằng số trên mỗi khoảng[sk−1; sk) Từ quan điểm thực tế, UP C = S

t 1 >0

UP C[0; t1] bao gồm các điềukhiển dễ sử dụng so với điều khiển thuộc Um nói chung

8

Trang 11

(b) Uε[0; t1]={u(·) ∈ Um[0; t1]|u(·) liên tục tuyệt đối, u(0) = u(t1) = 0,

|u(t)| ≤ 1 và | ˙u(t)| ≤ ε hầu khắp nơi trên [0; t1]}

Trong đó ε > 0 cố định, Uε = S

t 1 >0

Uε[0; t1] là lớp các điều khiển trơn(không thay đổi đột ngột)− chẳng hạn là việc điều khiển một chiếc xe.(c) UBB[0; t1]={u(·) ∈ Um[0; t1]||ui(t)| ≡ 1 trên [0; t1], i = 1, , m} là lớpđiều khiển "bang−bang" Điều khiển từ lớp UBB = S

t 1 >0UBB[0; t1] sửdụng năng lượng tối đa cho phép (nhớ rằng u(t) ∈ Ω) tại mọi thời điểm.Những điều khiển này có thể dễ xây dựng hơn đối với bài toán xe lửa

vì các động cơ chỉ cần hai trạng thái "tắt" và "toàn bộ năng lượng".Chúng ta không yêu cầu một hàm u(·) ∈ UBB phải liên tục từng khúc,

do đó UBB có thể chứa một số hàm khá phi thực tế Lớp các điều khiểnbang−bang hằng từng khúc trên [0; t1] được ký hiệu là UBBP C[0; t1] và

UBBP C = S

t1>0UBBP C[0; t1]

Bây giờ chúng ta sẽ chỉ xét các điều khiển thuộc Um nói chung Để nghiêncứu tính điều khiển được đối với một trạng thái ban đầu x0, ta gọi K(t; x0) làtập khả đạt ở thời điểm t, và RC(x0) là nón khả đạt K(t; x0) là tập hợp cáctrạng thái trong Rn mà có thể đạt được ở thời điểm t, khởi đầu từ trạng thái

x0 ở thời điểm t0 = 0, trong đó sử dụng tất cả các điều khiển chấp nhận được,tức là:

K(t; x0) = {x(t; x0; u(·))|u(·) ∈ Um}và

RC(x0) = {(t; x(t; x0; u(·)))|t ≥ 0, u(·) ∈ Um} = [

t≥0

t × K(t; x0)

Để đơn giản, chúng ta đã lấy t0 = 0 (nếu chúng ta cho phép t0 là tùy ý thì

ta sẽ phải xác định K(t; t0; x0), RC(t0; x0) theo cách tương tự) (Hình 1.1) làphác họa hai tậpK(t; x0), RC(x0) trong trường hợp n = 2 Hai phản hồi pháchọa trong đó cho ta hình dung về biên của RC(x0)

Trang 12

Hình 1.1:

Hình 1.2:

RC(x0) trông giống như hình nón và K(t; x0) là lát cắt của nón tại thời điểm

t Các tập hợp K(t; x0) trong thực tế là các tập trong không gian (x1, x2), vìvậy chúng ta nên chiếu chúng trở lại không gian (x1, x2), như được phác họatrong (Hình 1.2)

Khi đó chúng ta sẽ nhìn thấy trực tiếp sự biến đổi của tập khả đạt theo thờigian (luôn bắt đầu từ x0 tại t0 = 0)

Trang 13

1.2 Bài toán điều khiển tối ưu

* Bài toán điều khiển cơ bản thường liên quan tới một hàm chi phí hoặcmột tiêu chí thực hiện Chúng ta sẽ chỉ giải quyết với hàm chi phí có dạng

trong đó f0 là hàm giá trị thực đã cho Bài toán điều khiển tối ưu là điều khiển

x0 đến mục tiêu, bằng cách dùng điều khiển u(·) từ lớp nào đó làm cho C[u(·)]nhỏ nhất Tập các điều khiển thành công là:

∆ = {u(·) ∈ Um|∃t1 ≥ 0 sao cho x(t1; x0, u(·)) ∈T (t1)}

Khi đó điều khiển u∗(·) ∈ Um là tối ưu nếu nó thành công, tức là u∗(·) ∈ ∆ và

C(u∗(·)) ≤ C(u(·)) với mọi u(·) ∈ ∆

Trong lý thuyết điều khiển tối ưu, có hai vấn đề cơ bản đó là:

(a) Chứng minh sự tồn tại của điều khiển tối ưu

(b) Tìm (xây dựng) một điều khiển tối ưu, hay là đưa ra một công thức đểđiều khiển đến mục tiêu một cách tối ưu

Trong trường hợp bài toán điều khiển tuyến tính, Nguyên lý cực đại sẽ chothấy rằng, dưới một số ràng buộc hợp lý, điều khiển tối ưu là bang−bang vàhằng từng khúc

*Tiếp theo chúng ta sẽ thảo luận vắn tắt về bài toán điều khiển tối ưu xelửa Phiếm hàm chi phí là

Trang 14

ta biết rằng có thể C[u(·)] còn đạt cực tiểu tại một vài điều khiển thành côngkhác thuộc U1− chẳng hạn, và điều khiển một lần chuyển có thể rất tốn nhiênliệu Vấn đề về sự tồn tại và xây dựng các điều khiển tối ưu có thể khá khókhăn; ngay lúc này chúng ta chỉ phân tích bằng trực giác hai trường hợp đặcbiệt của bài toán điều khiển xe lửa.

1.3 Hệ thời gian ngược

C là một tập điều khiển được, tức là tập tất cả các điểm ban đầu x0 bị điềukhiển đến mục tiêu Tập C điều khiển được cho cả hai bài toán ô-tô-nôm tổngquát:

˙x = f (x, u), x(t) ∈ Rn, u(·) ∈ Um (NLA)

và bài toán ô-tô-nôm tuyến tính

˙x = Ax + Bu, A, B là các ma trận hằng số (LA)

với mục tiêu T (t) ≡ 0

Khi đó:

x(t) là nghiệm của (NLA) với x(0) = x0 và x(t1) = x1, nên z(t) = x(t1− t)

là nghiệm của hệ thời gian ngược:

˙z = −f (z, ˜u), z(0) = x1, z(t1) = x0, u(t) = u(t˜ 1 − t) (1.2)Phương trình (1.2) là một phương trình phi tuyến ô-tô-nôm

1.4 Tính điều khiển được của hệ ô-tô-nôm

* Ta sẽ nghiên cứu vấn đề điều khiển được đối với hệ tuyến tính ô-tô-nôm:

˙x = Ax + Bu, A, B là các ma trận hằng số

Theo công thức biến thiên hằng số (xem phụ lục), cho trước một điều khiểnu(·) ∈ Um nghiệm của (LA) với trạng thái ban đầu x0 tại thời điểm t = 0,

Trang 15

được cho bởi công thức phản hồi

x[t] ≡ x(t; x0; u(·)) = X(t)X−1(0)x0 +

Z t 0

* Sau đây ta có các định lý về hệ ô-tô-nôm tuyến tính (LA):

Định lí 1.1 Cho hệ (LA) mô tả như trên, khi đó C là liên thông đường Hơnnữa C là mở khi và chỉ khi 0 ∈ Int C

Định lí 1.2 Cho hệ (LA), tập có thể điều khiển được C ∈ Rn là đối xứng vàlồi

Định lí 1.3 Cho hệ ô-tô-nôm tuyến tính ( (LA)) Khi đó:

rank M = n ⇔ 0 ∈ Int C (⇔Cmở, theo Định lí 1.1)

Chứng minh Chứng minh định lý tương đương với việc chứng minh:

do X(t) = eAt là ma trận cơ bản của hệ (LA)

Chứng minh phần đảo: Giả sử rank M < n Khi đó có một vectơ đơn vị

y ∈ Rn, ||y|| = 1, trực giao với mọi vectơ cột của M, tức là 1 × m vectơ dòng

yTAkB = 0 với k = 0, 1, , (n − 1)

Trang 16

Nếu P(λ) ≡ det (λI − A) là đa thức đặc trưng của A, thì theo Định líCayley-Hamilton nói rằng "thay thế" ma trận A cho λ thì kết quả trong đathức thuộc ma trận không, tức là P(A) = 0 Do đó An có thể được viết nhưmột tổ hợp tuyến tính của các lũy thừa bậc thấp hơn của nó

k

nên yTe−AsB = 0 Do (1.6) và C (t1) nằm trong siêu phẳng trực giao với

y, ∀t1 > 0 nên với mọi x0 ∈ C (t1), yTx0 = 0 Vì C là hợp của các tập C (t1)nên nó nằm trong siêu phẳng đó Nên suy ra 0 /∈ Int C

Chứng minh phần thuận: Giả sử 0 /∈ Int C Khi đó ∀t1 > 0, 0 /∈ Int C (t1)(vì C (t1) ⊂ C) Mặt khác, với mọi t1 và C (t1) lồi sao cho: 0 ∈ C (t1) (bằngcách lấyu(·) ≡ 0) nên với mỗi t1, tồn tại một siêu phẳng chứa 0 sao cho C (t1)nằm về một phía của siêu phẳng này, tức là có một vectơ khác không b(t1) saocho ∀x0 ∈ C (t1), bTx0 ≤ 0 Khi đó

Định lí 1.4 Với rank M = n Xét hệ ô-tô-nôm tuyến tính (LA)

˙x = Ax + Bu

Nếu Re(λ) < 0 với mọi giá trị riêng λ của A thì C = Rn

Trang 17

Định lí 1.5 Xét hệ ô-tô-nôm tuyến tính (LA) và M = [B, AB, , An−1B].Khi đó:

C = Rn ⇔ rank M = n và Re(λ) ≤ 0 với mọi giá trị riêng λ của A

Ví dụ 1.1 (Tính điều khiển được của động cơ xe lửa )

Với động cơ xe lửa, ta có:

xe lửa, bất kì trạng thái ban đầu nào cũng có thể được điều khiển đến 0 ∈ R2

* Một điều đáng nói là Định lí 1.5 trở nên đơn giản hơn đáng kể trong trườnghợp không có hạn chế đối với điều khiển (u(t) ∈Rm)

Định lí 1.6 (Nguyên lí Bang - Bang) Cho hệ (LA), ta có CBB(t1) = C (t1)với ∀t1 > 0 ; tập này là tập compact, lồi và phụ thuộc liên tục vào t1

1.5 Phụ lục của Chương 1: Chứng minh của Nguyên

lý Bang−Bang.

Mệnh đề 1.1 (Tính compact yếu của Um[0; t1] trong dãy L2[0; t1])

Nếu {un(·)}⊂ Um[0; t1], (n = 1, 2, ) thì tồn tại dãy con {unk(·)} và một

u∗(·) ∈ Um[0; t1] sao cho mọi ma trận Y(t) cấp n × m trong L2[0; t1], ta có:

y(s)u(s)ds, y(s) = e−AsB (1.8)trong đó ma trận B cấp n × 1

Trang 18

Mệnh đề 1.2 Ánh xạ T được định nghĩa ở (1.8) từ tập ánh xạ lồi vào tậplồi, và tập compact yếu trong L2[0; 1] lên tập compact trong Rm (Nói riêng, từmệnh đề (1.1) , Q là lồi và compact).

Trang 19

BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU THỜI GIAN ĐỐI VỚI HỆ

˙x(t) = Ax(t) + Bu(t), x(t) ∈ Rn, u(t) ∈ Ω ⊂ Rm, (LA)

với A, B là các ma trận hằng cấp n × n và n × m, u(·) ∈ Um, mục tiêu

Trong suốt chương này chúng ta giả thiết rằng:

Không cột nào của B gồm toàn số 0

17

Trang 20

Giả thiết này không làm mất tính tổng quát Vì chẳng hạn nếu cột thứnhất của B gồm toàn số 0, thì thành phần thứ nhất u1(·) của u(·) sẽ không cóảnh hưởng gì trong (LA) Vì vậy, chúng ta có thể thay thế m−vectơ u(·) bằng(m − 1)−vectơ [u2(·), , um(·)]T Nên khi bỏ cột thứ nhất của B trong (LA)thì bài toán không thay đổi.

Nhiều kết quả của chương này vẫn đúng với hệ tuyến tính tổng quát

˙x(t) = A(t)x(t) + B(t)u(t) + c(t),những mở rộng đó sẽ được tóm tắt trong mục cuối cùng Chương này tập trungnghiên cứu bài toán (LA) bởi vì hình học của bài toán này rõ ràng hơn trongtrường hợp bài toán điều khiển tối ưu tổng quát

Đầu tiên chúng ta chỉ ra những phản hồi chính sẽ được chứng minh trongchương này

Để làm được điều này, nhớ rằng Ω là hình lập phương đơn vị trong Rm :

RC là tập con của Rn+1 (xem hình 1.1 và 1.2 Chương 1)

K(t; x0) và RC có thể được nhúng trong siêu phẳng với số chiều nhỏ nhấtcủa Rn và Rn+1 Khi đó Int K, ∂K, v.v., đều được lấy tương đối so với siêuphẳng tương ứng Với hệ ô-tô-nôm (LA), trạng thái ban đầu x0 ∈ Rn, giả sửtồn tại một điều khiển thành công thuộc Um điều khiển x0 đến 0 (không nhấtthiết phải là tối ưu−thời gian) Do đó các mệnh đề sau là đúng:

(a) Có ít nhất một điều khiển tối ưu − thời gian bang−bang trong Um

(không nhất thiết hằng từng khúc)

(b) Phản hồi ứng với điều khiển tối ưu−thời gian nằm trên biên của K(t; x0)với∀t,nghĩa là, nếux[t] = x(t; x0; u(·)) là tối ưu−thời gian thìx[t] ∈ ∂K(t; x0)(tương đương (t; x[t]) ∈ ∂RC) với 0 ≤ t ≤ t1

Trang 21

(c) Điều khiển tối ưu−thời gian u(t) thỏa mãn Nguyên lý cực đại: Có vectơhằng h 6= 0 sao cho

hTe−AtBu(t) = sup

v∈Ω

hTe−AtBv, 0 ≤ t ≤ t1.Tương đương, khi (hTe−AtB)i 6= 0 :

Chú ý 2.1 Chúng ta sẽ chứng tỏ rằng số lần chuyển giá trị điều khiển (trongtừng trường hợp cụ thể) phụ thuộc vào các giá trị riêng của A

Để bắt đầu, chúng ta cần làm một vài quan sát sơ bộ Nhắc lại Nguyên lýBang−Bang (Định lý 1.6 từ Chương 1) phát biểu rằng với bất kỳ hệ ô-tô-nômtuyến tính, CBB(t) = C (t) ∀t > 0, trong đó C (t) (CBB(t)) là tập các trạngthái ban đầu mà tồn tại điều khiển thành công thuộc Um (UBB) điều khiểntrạng thái đó đến mục tiêu 0 Chú ý rằng chúng ta chọn T (t) ≡ 0 cho tiện(vì bất kỳ điểm cố định nào trong Rn đều có thể là mục tiêu) Chúng ta khẳngđịnh rằng Nguyên lý Bang−Bang là tương đương với mệnh đề sau về tập khảđạt:

Với (LA), K(t; x0) = KBB(t; x0) ∀t ≥ 0, ∀x0

Tức là, các trạng thái có thể đạt từ một điểm x0 cho trước tại một thờiđiểm cho trước là như nhau bất kể chúng ta sử dụng điều khiển tổng quátthuộc Um[0; t], hay điều khiển Bang−Bang

Điều này suy ra từ ý tưởng thời gian ngược được bàn luận ở Chương 1 Nhắclại rằng x(t) nghiệm đúng (LA) với x(0) = x0 nếu và chỉ nếu z(t) = x(t1 − t)nghiệm đúng hệ thời gian ngược:

˙z = −Az − Bu; z(t1) = x0 (2.1)

Trang 22

Do vậy hai hệ có cùng các quỹ đạo, chỉ khác nhau về hướng Hệ thời gian ngượccũng là hệ tuyến tính và ô-tô-nôm, nên Nguyên lý Bang−Bang khẳng định rằng

CBB(t1) = C (t1) với (2.1),tức là các trạng thái điều khiển thành công đến x0bởi (2.1) là như nhau đối với điều khiển bang−bang và điều khiển tổng quát.Nhưngx1 có thể điều khiển tới x0 bởi (2.1) nếu và chỉ nếu x0 có thể điều khiểnthành công x1 bởi (LA) (Hình 2.1) Do vậy x1 thuộc tập điều khiển thành côngđối với (2.1) nếu và chỉ nếu nó thuộc tập khả đạt đối với (LA) Do đó Nguyên

lý Bang−Bang suy ra rằng KBB(t1; x0) = K(t1; x0) đối với (LA)

eA(t−s)Bu(s)ds = eAtx0 + Q[u]

Do đó y ∈ K(t; x0) nếu và chỉ nếu y = eAtx0 + Q[u] với một u(·) ∈ Um[0; t].Với t cố định, tính lồi của K(t; x0) (và tính đối xứng của K(t; 0)) nhận được

từ tính chất tuyến tính của Q và tính đối xứng, lồi của Um[0; t]

Trang 23

* Mệnh đề (1.1) của phụ lục Chương 1 phát biểu rằng Um[0; t] là compactyếu theo dãy trong L2[0; t], và Mệnh đề (1.2) của phụ lục Chương 1 chứng tỏrằng đối với mỗi t, tập

* Cuối cùng chúng ta sẽ chứng minh ánh xạ t → D(t) là liên tục Với t cốđịnh và ε > 0, chúng ta phải chứng minh rằng có δ(ε) > 0 sao cho |t∗− t1| < δthì D(t1);D(t∗) có tính chất mỗi tập bị chứa trong ε−lân cận của tập còn lại.Thật vậy, giả sử δ < 1, đặt T = t1 + 1; M = max

[0,T ] |e−AsB| Ta sẽ chứng tỏrằngD(t∗) chứa trong một ε−lân cận của D(t1) với |t∗− t1| < ε

M. Giả sử y∗ ∈D(t∗) nghĩa là y∗ =

t∗

R

0

e−AsBu∗(s)ds với một u∗(·) ∈ Um[0, t∗] Mở rộng u∗(s)lên [0, T ] bằng cách đặt u∗ = 0 trên (t∗, T ], sau đó đặt y0 =

2.2 Sự tồn tại của điều khiển tối ưu thời gian

Định lí 2.1 Nếu tồn tại một điều khiển thành công điều khiển x0 đến 0 qua(LA) thì tồn tại một điều khiển tối ưu−thời gian

Chứng minh Giả thiết có một điều khiển thành công nghĩa là 0 ∈ K(t∗; x0)với một t∗ Đặt

t1 = inf {t ≥ 0 | 0 ∈ K(t, x0)}

Tập này khác rỗng và bị chặn dưới, nên tồn tại cận dưới đúng Ta sẽ chứng tỏrằng 0 ∈ K(t1; x0), hay có một điều khiển trong Um điều khiển x0 đến 0 trongthời gian cực tiểu t1

Trang 24

Thật vậy: Giả sử 0 /∈ K(t1; x0) Vì K(t1; x0) là tập đóng nên có một hìnhcầu B(0; ρ) với 0 ∈ Rn sao cho B(0; ρ) ∩ K(t1; x0) = φ Vì K(t; x0) liên tụctheo t, nên tính chất giao khác rỗng này vẫn đóng khi t gần t1, nếu chúng ta

có B(0; ρ), nghĩa là có δ > 0 sao cho với t1 ≤ t ≤ t1 + δ :

B(0;ρ

2) ∩ K(t; x0) = φ.

Chứng tỏ 0 ∈ Rn không khả đạt với t1 ≤ t ≤ t1+ δ, mâu thuẫn với định nghĩacủa t1

Suy ra giả sử là sai Vì vậy 0 ∈ K(t1; x0)

Hệ quả 2.1 Nếu tồn tại một điều khiển thành công thuộc Um điều khiển

x0 đến 0, thì tồn tại một điều khiển tối ưu−thời gian bang−bang

Chứng minh Theo Nguyên lý Bang−Bang, KBB(t, x0) = K(t, x0) với mọi t ≥0

Định nghĩa 2.1 Điều khiển u(·) xác định trên [0, t∗] là cực trị nếu phản hồitương ứng nằm trên biên của RC, nghĩa là:

x(t; x0; u(·)) ∈ ∂K(t, x0), 0 ≤ t ≤ t∗ (2.2)Một điều khiển cực trị có thể là thành công hoặc không, và nếu là thành côngthì nó vẫn có thể là tối ưu hoặc không (Hình 2.2)

Hình 2.2: Đường cong (e) là cực trị; (n) là không cực trị.

Trang 25

Định lí 2.2 Nếu w(·) là điều khiển tối ưu−thời gian đối với (LA), thì w(·)

là cực trị

Chứng minh Chứng minh gồm hai phần

Thứ nhất, chúng ta sẽ chứng minh rằng nếu w(·) là tối ưu, thì tại thời điểmtới mục tiêu t1 phản hồi sẽ nằm trên ∂K(t1; x0), tức là nếu w(·) là điều khiểntối ưu điều khiển x0 đến 0 trong thời gian t1, nghĩa là:

x[t1] ≡ x(t1; x0; w(·)) = 0,thì x[t1] = 0 ∈ ∂K(t1; x0)

Thật vậy: Giả sử x[t1] = 0 không nằm trên ∂K(t1; x0) Khi đó có một hìnhcầu B(0; ρ) ⊂ K(t1; x0) Bởi vì K(t1; x0) là hàm liên tục của t Nên ta có thểthay đổi t mà vẫn giữ được bao hàm thức trên nếu chúng ta thu nhỏ hình cầu,nghĩa là, có δ > 0 sao cho B(0;ρ

2) ⊂ K(t; x0) với t1− δ ≤ t ≤ t1 Khi đó 0 sẽđạt được ở thời điểm t1 − δ, mâu thuẫn với tính tối ưu của t1 Suy ra giả sử làsai Do đó: 0 = x[t1] ∈ ∂K(t1; x0)

Thứ hai, chúng ta chứng minh rằng nếu phản hồi nằm trên ∂K(t∗; x0) ởthời điểm t∗ bất kỳ, thì (2.2) đúng với 0 ≤ t ≤ t∗ (nói cách khác, phản hồikhông bao giờ chuyển động được từ bên trong của RC ra biên, ∂RC) Giả sử

x∗ ≡ x[t∗] ∈ Int K(t∗; x0) với một 0 < t∗ < t1, trong đó x[t] là phản hồi đốivới w(·) Ta phải chứng minh rằng x[t] ∈ Int K(t; x0) ∀t > t∗

Thật vậy: Vì x∗ ∈ Int K(t∗; x0) nên có một hình cầu B ≡ B(x˜ ∗; δ) ⊂K(t∗; x0) Do đó mỗi trạng thái x˜0 ∈ ˜B đều khả đạt từ x0 tại thời điểm t∗,bằng cách sử dụng một điều khiển chấp nhận được u(·).˜ Chúng ta xét bài toánmới

˙y = Ay + Bw, y(t∗) = ˜x0; t∗ < t,với điều khiển w(·) cố định Chú ý rằng với x˜0 = x∗, ta có y[t] ≡ x[t] Nghiệmcủa bài toán có thể được viết:

Ngày đăng: 16/06/2017, 11:03

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w