Phương pháp giải tựa giả tuần tự Quasi-Sequential Approach QS-SQA cùng với phương pháp rời rạc hóa collocation trực giao được coi là một phương pháp tiên tiến mà có thể được áp dụng cho
Trang 1ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP
-
LUẬN VĂN THẠC SĨ KỸ THUẬT
NGHIÊN CỨU ĐIỀU KHIỂN TỐI ƯU CHO HỆ ĐIỀU KHIỂN CÓ PHƯƠNG TRÌNH TRẠNG THÁI DẠNG SUY BIẾN
Trang 2i
LỜI CẢM ƠN
Để hoàn thành chương trình cao học và thực hiện viết luận văn này, tôi đã nhận được sự hướng dẫn, giúp đỡ và góp ý nhiệt tình của quý Thầy, Cô giáo trường Đại học Kỹ thuật Công nghiệp Thái Nguyên, trường Đại học Bách Khoa Hà Nội, cùng một số Trường, Viện khác
Trước hết, tôi xin chân thành cảm ơn đến quý Thầy, Cô giáo trường Đại học Kỹ thuật Công nghiệp Thái Nguyên, trường Đại học Bách Khoa Hà Nội, cùng một số Trường, Viện khác, đặc biệt là những thầy cô đã trực tiếp tận tình hướng dẫn tôi suốt thời gian học tập tại trường
Tôi xin gửi lời biết ơn sâu sắc đến Phó giáo sư – Tiến sĩ Nguyễn Hữu Công đã dành rất nhiều thời gian và tâm huyết hướng dẫn nghiên cứu và giúp tôi hoàn thành luận văn tốt nghiệp
Đồng thời, tôi cũng xin cảm ơn quý đồng nghiệp, bạn cùng lớp Cao học khóa K12 - TĐH đã tạo điều kiện giúp đỡ tôi trong suốt quá trình học tập cũng như đóng góp những ý kiến quý báu giúp tôi hoàn thành bản luận văn này
Cuối cùng, tôi xin gửi lời cảm ơn chân thành đến những thành viên trong đại gia đình, chồng và con trai tôi, những người luôn sát cánh động viên tôi về cả tinh thần
và vật chất, giúp tôi hoàn thành khóa học cũng như bản luận văn này
Mặc dù tôi đã có nhiều cố gắng hoàn thiện bản luận văn này bằng tất cả sự nhiệt tình và năng lực của mình, tuy nhiên không thể tránh khỏi những thiếu sót, rất mong nhận được những đóng góp quý báu của quý Thầy, Cô giáo và các bạn
Thái Nguyên, tháng 09 năm 2011
Tác giả
Ngô Phương Thanh
Trang 3ii
LỜI CAM ĐOAN
Tôi xin cam đoan đây là đề tài do tôi thực hiện Các kết quả trong luận văn là trung thực và chưa từng được công bố trong bất kỳ công trình nào của các tác giả khác Tất cả các tài liệu tham khảo đều có nguồn gốc, xuất xứ rõ ràng
Nếu sai tôi hoàn toàn chịu trách nhiệm
Thái Nguyên, ngày 20 tháng 09 năm 2011
Tác giả
Ngô Phương Thanh
Trang 4iii
TÓM TẮT LUẬN VĂN Tóm tắt: Nghiên cứu phương pháp số trong điều khiển tối ưu cho hệ thống động
nói chung và điều khiển tối ưu suy biến nói riêng luôn là vấn đề thời sự trong kỹ thuật điều khiển tự động bởi các hệ thống cần được điều khiển ngày càng phức tạp hơn Phương pháp giải tựa (giả) tuần tự (Quasi-Sequential Approach QS-SQA) cùng với phương pháp rời rạc hóa collocation trực giao được coi là một phương pháp tiên tiến mà có thể được áp dụng cho những bài toán điều khiển tối ưu suy biến phức tạp có kích thước tương đối lớn Ưu điểm chính của phương pháp này là việc làm giảm đáng kể kích thước của bài toán tối ưu bằng cách đưa vào một lớp bài toán mô phỏng (Simulation) để tiến hành giải hệ phương trình vi phân thường (ODEs) hoặc hệ phương trình vi phân đại số cấp 1 (DAEs) mô tả hệ thống động cần được điều khiển Mục tiêu của luận văn này là nghiên cứu những vấn đề lý thuyết
về tối ưu động nói chung, về điều khiển tối ưu suy biến nói riêng; sau đó phát triển gói phần mềm sử dụng phương pháp QS-SQA kết hợp với phần mềm giải bài toán tối ưu phi tuyến thông thường IPOPT cho bài toán điều khiển tối ưu suy biến Gói phần mềm này sẽ tự động tiến hành việc rời rạc hóa mô hình bài toán dạng phương trình DAEs hoặc ODEs mô tả hệ thống do người sử dụng cung cấp, sau đó tiến hành giải bài toán tối ưu tĩnh vừa được hình thành bằng phương pháp tối ưu điểm trong
IP (Interior Point) Phương pháp rời rạc hóa biến điều khiển bằng các đoạn hằng số (piece-wise constant) đã được sử dụng trong luận văn này cũng phù hợp với phương pháp điều khiển số hiện hành 06 ví dụ từ đơn giản đến phức tạp trong điều khiển tối ưu suy biến đã được dùng để minh họa thuật toán và so sánh với các phương pháp điều khiển khác
Từ khóa: tối ưu động, điều khiển tối ưu suy biến, hệ phương trình vi phân đại
số, collocation trực giao, phương pháp tựa tuần tự, tối ưu phi tuyến, phương pháp tối ưu điểm trong
Trang 5iv
MỤC LỤC
Trang
Lời cảm ơn ……… i
Lời cam đoan ……… ii
Tóm tắt luận văn ……… iii
Mục lục ……… iv
Danh mục hình vẽ ……… vii
Danh mục các chữ viết tắt ……… viii
Lời nói đầu ……… ix
Chương 1 BÀI TOÁN TỐI ƯU TỔNG QUÁT ……… 1
1.1 Giới thiệu và phân loại bài toán tối ưu ……… 1
1.1.1 Giới thiệu chung ……… 1
1.1.2 Phân loại bài toán tối ưu ……… 2
1.2 Bài toán tối ưu tĩnh ……… 5
1.2.1 Khái niệm ……… 5
1.2.2 Bài toán tối ưu phi tuyến liên tục ……… 7
1.2.3 Phương pháp SQP với tập giới hạn tích cực (AS-SQP) ………… 8
1.2.4 Phương pháp SQP điểm trong (IP-SQP) ……… 9
1.2.5 Những so sánh giữa hai phương pháp AS-SQP và IP-SQP …… 11
1.3 Bài toán tối ưu động ……… 12
1.3.1 Khái niệm ……… 13
1.3.2 Các phương pháp gián tiếp ……… 13
1.3.2.1 Phương pháp biến phân ……… 13
1.3.2.2 Phương pháp quy hoạch động Bellman ……… 17
1.3.2.3 Nguyên lý cực đại Pontryagin ……… 21
1.3.3 Các phương pháp trực tiếp ……… 28
1.3.3.1 Các cơ sở toán học ……… 28
Trang 6v
Phương pháp collocation trực giao ……… 28
Phương pháp Newton-Raphson ……… ………… 30
1.3.3.2 Phương pháp đồng thời (Simultaneous Approach) ……… 31
1.3.3.3 Phương pháp tuần tự (Sequential Approach) ……… 33
1.3.3.4 Phương pháp tựa tuần tự (Quasi-Sequential Approach QS-SQA) … 35 Chương 2 PHƯƠNG PHÁP SỐ GIẢI BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU CHO HỆ CÓ PHƯƠNG TRÌNH TRẠNG THÁI SUY BIẾN 39 2.1 Bài toán điều khiển tối ưu ……….… 39
2.1.1 Khái niệm ……….… 39
2.1.2 Phân loại ……… 40
2.1.3 Giải bài toán điều khiển tối ưu liên tục ……… 41
2.2 Bài toán điều khiển tối ưu suy biến ……… 42
2.2.1 Khái niệm ……… 42
2.2.2 Các đặc điểm ……… 42
2.3 Lựa chọn phương pháp giải và phần mềm ……… 43
2.3.1 Lựa chọn phương án IP-SQP ……… 43
2.3.2 Phần mềm IPOPT ……… 45
2.3.2.1 Method get_nlp_info ……… 46
2.3.2.2 Method get_bounds_info ……… 47
2.3.2.3 Method get_starting_point ……… 48
2.3.2.4 Method eval_f ……… 49
2.3.2.5 Method eval_grad_f ……… 49
2.3.2.6 Method eval_g ……….…… 50
2.3.2.7 Method eval_jac_g ……… 51
2.3.2.8 Method eval_h ……….… 52
2.3.2.9 Method finalize_solution ……… 54
2.3.2.10 Hàm main()……… 55
Chương 3 CÁC VÍ DỤ MINH HỌA & KẾT QUẢ MÔ PHỎNG 56
Trang 7vi
3.1 Ví dụ minh họa ……… …… 56
3.1.1 Ví dụ 1 ……… 56
3.1.2 Ví dụ 2 ……… 58
3.1.3 Ví dụ 3 ……… 60
3.1.4 Ví dụ 4 ……… 60
3.1.5 Ví dụ 5 ……… 63
3.1.6 Ví dụ 6 ……… 65
3.2 Nhận xét ……….… 67
Chương 4 KẾT LUẬN & KIẾN NGHỊ ……… 68
4.1 Kết luận ……… 68
4.2 Một số kiến nghị về hướng nghiên cứu tiếp theo ……… 68
TÀI LIỆU THAM KHẢO ……… 70
Trang 8vii
DANH MỤC HÌNH VẼ
Trang
Hình 1.1: Sơ đồ tổng quan bài toán tối ưu ……… 3
Hình 1.2: Sơ đồ hình cây của bài toán tối ưu tĩnh tổng quát ……… 5
Hình 1.3: Đồ thị của bài toán 1.1 ……… 6
Hình 1.4: Hàm chuyển đổi mẫu và bộ điều khiển tối ưu ……… 24
Hình 1.5: Phương pháp rời rạc hóa Radau collocation (NC=3) ……… 29
Hình 1.6: Sơ đồ tổng quan phương pháp giải đồng thời……… 33
Hình 1.7: Sơ đồ tổng quan phương pháp giải lần lượt……….… 34
Hình 1.8: Sơ đồ tổng quan phương pháp giải tựa lần lượt……… 35
Hình 3.1: Đồ thị tín hiệu biến trạng thái và điều khiển (ví dụ 1)………….… 58
Hình 3.2a: Đồ thị tín hiệu biến trạng thái và điều khiển (ví dụ 2)……….…… 59
Hình 3.2b: Tín hiệu điều khiển với Jmin=0.2683938 trong [18] (ví dụ 2)….… 59
Hình 3.3a: Đồ thị tín hiệu biến trạng thái và điều khiển (ví dụ 3)……… 61
Hình 3.3b: Tín hiệu biến điều khiển với Jmin=0.7539845 trong [18] (ví dụ 3)… 61 Hình 3.4a: Đồ thị tín hiệu biến trạng thái và điều khiển (ví dụ 4)……… 62
Hình 3.4b: Tín hiệu biến điều khiển với Jmin=1.2521134 trong [18] (ví dụ 4) 62
Hình 3.5a: Đồ thị tín hiệu biến trạng thái (ví dụ 5)……… 63
Hình 3.5b: Đồ thị tín hiệu biến điều khiển (ví dụ 5)……….… 64
Hình 3.5c: Tín hiệu biến điều khiển với Jmin=0.11928 trong [18] (ví dụ 5)… 64
Hình 3.6a: Đồ thị tín hiệu biến trạng thái (ví dụ 6)……….… 66
Hình 3.6b: Đồ thị tín hiệu biến điều khiển (ví dụ 6)……… 66 Hình 3.6c: Tín hiệu biến điều khiển với Jmin=2.335x10-9 trong [18] (ví dụ 6)… 67
Trang 9viii
DANH MỤC CÁC CHỮ VIẾT TẮT
I Tiếng Việt
BTQHPT bài toán quy hoạch phi tuyến
BTQHL bài toán quy hoạch lồi
BTQHTP bài toán quy hoạch toàn phương
BTQHTT bài toán quy hoạch tuyến tính
II Tiếng Anh
AEs Algebraic Equations - hệ phương trình đại số
AS Active Set – tập tích cực
CSTR Continuous Stirred Tank Reactor - bể phản ứng trộn liên tục
DAEs Differential Algebraic Equations - hệ phương trình vi phân-đại số IDM Iterative Dynamic Programming – quy hoạch động lặp
IP Interior Point – điểm trong
KKT Karush–Kuhn–Tucker
NLP NonLinear Programming – quy hoạch (tối ưu) phi tuyến
NMPC Nonlinear Model Predictive Control – điều khiển dự báo mô hình
phi tuyến ODEs Ordinary Differential Equations hệ phương trình vi phân thường
QP Quadratic Programming – tối ưu toàn phương
QS-SQA Quasi-Sequential Approach - Phương pháp tựa tuần tự
SQP Sequential Quadratic Programming – tối ưu toàn phương liên tiếp SMA Simultaneous Approach - Phương pháp giải đồng thời
SQA Sequential Approach - Phương pháp giải tuần tự
Trang 10ix
Trang 11x
LỜI NÓI ĐẦU
Cuộc cách mạng khoa học kỹ thuật và công nghệ ở các nước trong khu vực và trên thế giới đang trong thời kỳ phát triển như vũ bão đã đưa Việt Nam đứng trước rất nhiều cơ hội và thách thức mới trên con đường công nghiệp hóa – hiện đại hóa đất nước
Quá trình công nghiệp hóa – hiện đại hóa đất nước đòi hỏi đội ngũ các nhà khoa học, cán bộ kỹ thuật phải không ngừng nghiên cứu, học tập nâng cao trình độ để kịp thời tiếp cận, từng bước làm chủ các kiến thức khoa học kỹ thuật hiện đại và công nghệ tiên tiến
Chương trình đào tạo thạc sĩ tại Trường Đại học Kỹ thuật Công nghiệp Thái Nguyên nhằm đào tạo những cán bộ khoa học có trình độ cao để tiếp thu và làm chủ công nghệ hiện đại để phục vụ cho công tác nghiên cứu, giảng dạy và sản xuất Là một giáo viên đang tham gia giảng dạy tại một trường kỹ thuật, tôi đã rất cố gắng nỗ lực tham gia khoá đào tạo thạc sĩ khoá 12 của trường Để đánh giá kiến thức đã lĩnh hội được trong toàn khoá học, thể hiện bằng kết quả học tập cụ thể cuối khóa, tôi đã
nhận đề tài luận văn tốt nghiệp: “Nghiên cứu điều khiển tối ưu cho hệ điều khiển
có phương trình trạng thái dạng suy biến bằng phương pháp số” dưới sự hướng
dẫn khoa học trực tiếp của PGS TS Nguyễn Hữu Công
Nghiên cứu phương pháp số trong điều khiển tối ưu cho hệ thống động nói chung và điều khiển tối ưu suy biến nói riêng luôn là vấn đề thời sự trong kỹ thuật điều khiển tự động bởi các hệ thống cần được điều khiển ngày càng phức tạp hơn
Để thực hiện đề tài nêu trên, cấu trúc luận văn được chia thành 04 chương:
Chương 1: Bài toán tối ưu tổng quát
Chương 2: Phương pháp số giải bài toán điều khiển tối ưu cho hệ có
phương trình trạng thái suy biến
Chương 3: Các ví dụ minh họa & Kết quả mô phỏng
Chương 4: Kết luận & Kiến nghị
Đề tài đã được hoàn thành đúng thời gian quy định với hàm lượng kiến thức đảm bảo cho một luận văn tốt nghiệp thạc sĩ kỹ thuật
Thái nguyên, ngày 20 tháng 09 năm 2011
Trang 12xi
Học viên: Ngô Phương Thanh
Trang 13Giới thiệu và phân loại bài toán tối ưu 1
Chương 1 BÀI TOÁN TỐI ƯU TỔNG QUÁT
Loài người thực hiện những tính toán tối ưu Các nhà đầu tư luôn tìm cách tạo ra lợi nhuận cao nhất với mức độ rủi ro thấp nhất Các nhà sản xuất luôn hướng tới mục tiêu đạt hiệu quả cao nhất trong quá trình thiết kế cũng như sản xuất các sản phẩm của họ
Tự nhiên cũng luôn thực hiện bài toán tối ưu theo cách của nó Các quá trình vật
lý luôn có xu hướng tiến tới trạng thái có mức năng lượng nhỏ nhất Các phân tử trong các phản ứng hóa học biệt lập sẽ tương tác với các phân tử khác cho đến khi tổng năng lượng nghỉ của các điện tử của chúng là nhỏ nhất Các tia sáng thì luôn đi theo hướng sao cho thời gian lan truyền là ngắn nhất
Tối ưu hóa (Optimization) là một công cụ rất quan trọng trong thực tiễn đời sống, kinh tế cũng như trong lĩnh vực khoa học, công nghệ Tối ưu tĩnh (static optimization) và tối ưu động (dynamic optimization) là hai lĩnh vực gắn bó mật thiết với nhau Xét về mặt toán học, tối ưu tĩnh liên quan đến bài toán tối ưu trong không gian thực hữu hạn chiều Rn, cảm sinh từ không gian chuẩn Euclide Các bài toán tối
ưu động là các bài toán tối ưu trong các không gian hàm vô số chiều Do đó bài toán tối ưu động trên thực tế có thể được xem như là trường hợp suy rộng của bài toán tối ưu tĩnh
1.1 Giới thiệu và phân loại bài toán tối ưu
1.1.1 Giới thiệu chung
Tối ưu hóa là một trong những lĩnh vực kinh điển của toán học có ảnh hưởng đến hầu hết các lĩnh vực khoa học – công nghệ và kinh tế – xã hội Trong thực tế, việc tìm giải pháp tối ưu cho một vấn đề nào đó chiếm một vai trò hết sức quan trọng Phương án tối ưu là phương án hợp lý nhất, tốt nhất, tiết kiệm chi phí, tài nguyên, nguồn lực mà lại cho hiệu quả cao
Để có thể hình thành bài toán tối ưu, trước hết chúng ta cần xác định hàm mục tiêu, chính là sự đánh giá chất lượng hoạt động của hệ thống cần nghiên cứu Hàm mục tiêu này có thể là lợi nhuận, thời gian, năng lượng, hoặc bất kì một đại lượng nào hoặc tổng hợp của một số đại lượng mà được đại diện bằng một giá trị vô hướng duy nhất Hàm mục tiêu phụ thuộc vào các đặc tính nhất định của hệ thống,
mà được gọi là các biến hoặc các ẩn số Mục tiêu của chúng ta là tìm ra giá trị của các biến làm tối ưu hàm mục tiêu Thông thường thì các biến bị giới hạn, hay bị
Trang 14Giới thiệu và phân loại bài toán tối ưu 2 ràng buộc theo các điều kiện nào đó Ví dụ như số các điện tử trong một phân tử và lãi suất thì không thể là số âm
Quá trình xác định hàm mục tiêu, các biến, và các ràng buộc cho một bài toán tối ưu đã cho là được biết đến như là quá trình mô hình hóa Xây dựng một mô hình thích hợp là bước đầu tiên, đôi khi là bước quan trọng nhất, trong quá trình tối ưu hóa Nếu mô hình này là quá đơn giản, nó sẽ không cung cấp đủ thông tin về bài toán thực tế Nếu mô hình được xây dựng một cách quá phức tạp, chúng ta có thể gặp khó khăn khi giải bài toán
Sau khi đã xây dựng xong mô hình, chúng ta phải tìm một thuật toán tối ưu để tìm lời giải cho nó, thường là với sự trợ giúp của máy tính Trong thực tế, không có một thuật toán tối ưu hóa tổng quát mà chỉ tồn tại một tập hợp các thuật toán, mỗi trong số đó là phù hợp với một loại bài toán tối ưu cụ thể Trách nhiệm của người
sử dụng là phải lựa chọn các thuật toán nào đó phù hợp cho một ứng dụng cụ thể Lựa chọn này có tính chất rất quan trọng, vì nó có thể quyết định xem vấn đề được giải quyết một cách nhanh hay chậm và, cuối cùng là liệu chúng ta có thể tìm được nghiệm hay không
Sau khi đã lựa chọn một thuật toán tối ưu hóa áp dụng cho bài toán, chúng ta phải có khả năng đánh giá xem liệu nó có thành công trong việc tìm kiếm một lời giải cho bài toán tối ưu hay không Trong nhiều trường hợp, người ta sử dụng một biểu thức toán học được gọi là điều kiện tối ưu để kiểm tra xem các giá trị hiện tại của các biến có thực sự là lời giải của bài toán được đặt ra hay không Nếu các điều kiện tối ưu không được thỏa mãn, chúng có thể cung cấp những thông tin hữu ích
về cách để cải thiện lời giải hiện hành Mô hình này có thể được cải thiện bằng cách
áp dụng các kỹ thuật như phân tích độ nhạy, mà cho thấy độ nhạy của các lời giải để thay đổi mô hình và dữ liệu Nếu có bất kỳ thay đổi được áp dụng cho mô hình, bài toán tối ưu hóa được giải quyết một lần nữa, và quá trình cứ lặp đi lặp lại như thế
1.1.2 Phân loại bài toán tối ƣu
Các bài toán tối ưu, cũng còn được gọi là các bài toán quy hoạch toán học, được chia ra thành các lớp sau:
Bài toán tối ưu động (Dynamic Optimization): trong đó thời gian cũng là một biến mà chúng ta cần phải xem xét đến,
Bài toán tối ưu tĩnh (Static Optimization): chỉ tiêu chất lượng của bài toán không phụ thuộc vào thời gian,
Trang 15Giới thiệu và phân loại bài toán tối ưu 3
Phương pháp
gián tiếp
Phương pháp đồng thời
Phương pháp trực tiếp
Phương pháp lần lượt
TỐI ƯU HÓA
Tối ưu tĩnh Tối ưu động
Tối ưu tiền định
Tối ưu ngẫu nhiên
Phương pháp tựa lần lượt
Rời rạc hóa đầy đủ (biến điều khiển) Rời rạc hóa
Trang 16Giới thiệu và phân loại bài toán tối ưu 4
Bài toán quy hoạch tuyến tính (BTQHTT),
Bài toán tối ưu phi tuyến hay còn gọi là bài toán quy hoạch phi tuyến (BTQHPT), bao gồm cả bài toán quy hoạch lồi (BTQHL) và bài toán quy hoạch toàn phương (BTQHTP),
Bài toán tối ưu rời rạc, bài toán tối ưu nguyên và hỗn hợp nguyên,
Bài toán quy hoạch động,
Bài toán quy hoạch đa mục tiêu,
Bài toán quy hoạch ngẫu nhiên/mờ, v.v
Ngoài ra, người ta cũng phân loại bài toán tối ưu tĩnh cụ thể hơn như trên hình 1.2:
Optimization: tối ưu hóa,
Continuous: (tối ưu) liên tục,
Disrete: (tối ưu) rời rạc,
Interger Programming: tối ưu nguyên,
Stochastic Programming: tối ưu ngẫu nhiên,
Constrained: (tối ưu) có ràng buộc (hay giới hạn),
Network Programming: tối ưu mạng,
Bound Constrained: ràng buộc biên trị,
Nonlinearly Constrained: (tối ưu) với ràng buộc phi tuyến,
Linear Programming: tối ưu tuyến tính,
Unconstrained: (tối ưu) không có ràng buộc (hay giới hạn),
Nonlinear Equations: tối ưu phi tuyến,
Nonlinear Least Squares: tối ưu bình phương cực tiểu phi tuyến,
Global Optimization: tối ưu toàn cục,
Nondifferentiable Optimization: Tối ưu (với hàm) không khả vi
Các phương pháp toán học giải các lớp bài toán tối ưu tổng quát như nêu trên đây được gọi là các phương pháp tối ưu toán học (hay các phương pháp quy hoạch toán học) Trong số các bài toán trên thì các BTQHTT đã được giải quyết khá tốt nhờ phương pháp đơn hình (Simplex) nổi tiếng BTQHPT liên tục là dạng phổ biến, bao trùm và hiện đang được quan tâm nhất Do đó trong đề tài này, tác giả chỉ tập trung vào dạng bài toán này
Trang 17Bài toán tối ưu tĩnh 5
1.2 Bài toán tối ƣu tĩnh
Hình 1.2: Sơ đồ hình cây của bài toán tối ưu tĩnh tổng quát
(Nguồn: http://www.ece.northwestern.edu/OTC/ )
1.2.1 Khái niệm
Về mặt toán học, tối ưu hóa là việc đi tìm cực tiểu hoặc cực đại một hàm mà có thể có các biến bị giới hạn Chúng ta sử dụng các ký hiệu sau đây:
- x là véctơ chứa các biến, còn gọi là các ẩn số hay các tham số;
- f là hàm mục tiêu, là một hàm vô hướng của biến x mà chúng ta muốn tìm
cực tiểu hay cực đại
- g i là các hàm giới hạn, là các hàm vô hướng của biến x xác định các phương trình hay bất phương trình mà các biến x phải thỏa mãn
Sử dụng các ký hiệu này, bài toán tối ưu tĩnh tổng quát có thể được viết như sau:
min ( )sao cho
( ) 0,( ) 0,
n
x R
i j
Trang 18Bài toán tối ưu tĩnh 6
3 0
1 00
x x
Hàm mục tiêu và ba bất phương trình giới hạn lần lượt là:
Hình 1.3: Đồ thị của bài toán 1.1
x * =[2,1] là nghiệm của bài toán
Trong phần tiếp theo của luận văn, bài toán tối ưu (1.1) được giả thiết là bài toán tối ưu phi tuyến liên tục và khả vi đến cấp 2
điểm tối ưu
các đường đồng mức của hàm mục tiêu
miền xác định
Trang 19Bài toán tối ưu tĩnh 7
1.2.2 Bài toán tối ƣu phi tuyến liên tục
Bài toán tối ưu phi tuyến liên tục được mô tả ở dạng tổng quát như sau:
Gradient của (1.5) với biến x được cho bởi:
Hiện nay trong việc giải bài toán tối ưu liên tục phi tuyến có khá nhiều phương pháp với những ưu nhược điểm và phạm vi ứng dụng đặc thù với mỗi loại bài toán riêng biệt [12] Tuy nhiên có hai nhóm phương pháp khá mạnh đang được áp dụng rộng rãi là: Sequential Quadratic Programming methods (SQP) - quy hoạch toàn phương liên tiếp và Interior Point (IP) methods - phương pháp điểm trong [12]
Trang 20Bài toán tối ưu tĩnh 8 Phương pháp tối ưu toàn phương liên tiếp (Sequential Quadratic Programming - SQP) đã được chứng minh là rất hiệu quả để giải BTQHPT liên tục Hai phương án phân biệt được ứng dụng trong phương pháp SQP để giải quyết các ràng buộc dạng bất phương trình theo phương pháp Tựa-Newton (Newton-like) là: phương pháp tập ràng buộc tích cực AS-SQP (active-set SQP) và phương pháp hàm chặn IP-SQP (barrier SQP), hay còn gọi là phương pháp điểm trong (Interior-Point IP)
1.2.3 Phương pháp SQP với tập giới hạn tích cực (AS-SQP)
Hệ KKT (1.8) bao gồm điều kiện bù (1.8d) và điều kiện không âm (1.8e), mà chính là phần khó khăn nhất trong việc giải hệ phương trình KKT Khi giải hệ KKT, phương trình ràng buộc (1.8d) và bất phương trình (1.8e) phụ thuộc lẫn nhau và làm cho hệ KKT có ma trận điều kiện yếu tại vị trí gần nghiệm
Phương pháp AS-SQP thay thế (1.8d) bằng các giá trị
s i A I iA , trong đó là tập hợp các chỉ số của các ràng buộc dạng bất phương trình, là tập hợp các chỉ số của ràng buộc dạng phương trình và A( )x E i I : ( )h x i 0là tập tích cực (active-set)
Trong phương pháp AS-SQP, người ta tiến hành giải bài toán phụ dạng tối ưu
toàn phương QP (Quadratic Programming) trong mỗi lần lặp x k
sau:
1
2sao cho
và tìm tập tích cực (x) trong bài toán QP nhằm thỏa mãn các điều kiện (1.8d-1.8e)
Hệ KKT cho bài toán QP này là:
Hệ phương trình (1.10) tương đương với việc tuyến tính hóa hệ phương trình
(1.8) tại mỗi lần lặp thứ k với x k Việc giải hệ (1.10) và xác định tập tích cực với (1.10) dễ dàng hơn so với hệ (1.8)
Trang 21Bài toán tối ưu tĩnh 9 Với phương pháp AS-SQP, tại mỗi lần lặp, các ràng buộc dạng bất phương trình không nằm trong tập tích cực (x) được bỏ qua, và chỉ giải bài toán QP với các
ràng buộc dạng phương trình mà đã được giản lược nhằm giảm thời gian tính toán Tuy nhiên việc xác định tập tích cực dẫn đến tăng số lượng các vòng lặp khi tồn tại một số lượng lớn các ràng buộc dạng bất phương trình
1.2.4 Phương pháp SQP điểm trong (IP-SQP)
Phương án này ứng dụng các phương pháp điểm trong cơ sở-đối ngẫu dual IP) trong đó có sử dụng một số điểm mạnh của các thuật toán tiên tiến [3,5,6,
(primal-12, 13, 14] để chuyển bài toán (1.4) thành bài toán mới chỉ chứa các ràng buộc dạng phương trình Các ràng buộc dạng bất phương trình được nhúng vào trong hàm chặn (barrier function), do đó phương pháp này còn có tên gọi là phương pháp hàm chặn Thuật ngữ “cơ sở-đối ngẫu“ xuất phát từ việc phương pháp này tính toán hướng tìm
(search direction d k ) cho các biến quyết định x và biến phụ s (gọi chung là biến cơ
sở-primal) cũng như các biến nhân tử Lagrange (gọi là biến đối ngẫu-dual)
Phương pháp hàm chặn thêm vào các biến phụ s đóng vai trò như là những biến
quyết định và đưa vào hàm mục tiêu một đại lượng chặn dạng logarit nhằm chuyển bài toán (1.4) thành bài toán sau:
Trang 22Bài toán tối ưu tĩnh 10
Và Hessian là:
( , , , ) xx ( , , , ) xx ( ) T ( ) T ( )
W x s L x s f x g x h x (1.15) Điều kiện cần tối ưu, còn gọi là điều kiện Karush-Kuhn-Tucker (KKT) được viết như sau:
của hệ (1.18) chính là hướng tìm để di chuyển từ
giá trị hiện tại k k k k T
( k, k, k) x ( )( k) x ( )T
W x h x S V h x xác định dương trong hạch (null space) của x g x( )[6], việc tìm nghiệm k
x
của hệ (1.18) tương đương với việc gải bài toán QP sau:
Trang 23Bài toán tối ưu tĩnh 11
trong đó d s là hướng tìm cho các biến phụ
Trong bài toán QP (1.20) không tồn tại ràng buộc dạng bất phương trình, do đó
nó được giải mà không phải quan tâm đến việc tìm tập tích cực như trong phương pháp tập tích cực đã trình bày ở trên Khi đó, hệ KKT của (1.20) được cho bởi:
1.2.5 Những so sánh giữa hai phương pháp AS-SQP và IP-SQP
Nhóm phương pháp AS-SQP nhìn chung được áp dụng rất hiệu quả với các bài toán từ cỡ nhỏ đến trung bình, trong khi các phương pháp IP-SQP lại tỏ ra đáp ứng tốt với các bài toán tối ưu toàn phương lồi cỡ lớn
Đối với bài toán tối ưu toàn phương lồi, nhóm phương pháp AS-SQP thực hiện một số lượng lớn các bước tính toán mà trong đó hướng tìm nghiệm được tính toán một cách khá dễ dàng, trong khi nhóm phương pháp IP-SQP lại sử dụng một số lượng ít hơn những bước tính toán khó khăn hơn [12] Điều này xuất phát từ sự khác nhau của hai hệ thống hệ số của ma trận điều kiện KKT (1.10) và (1.21) và sự khác nhau giữa các bước tính nhân tử hóa nhằm cập nhật các hệ số của ma trận hệ
số của hệ KKT Trong các phương pháp AS-SQP, ma trận KKT sẽ khác nhau sau mỗi bước lặp, trong khi đó với các phương pháp IP-SQP các phần tử khác 0 của ma trận KKT cần được nhân tử hóa trong mỗi lần lặp là cố định (chỉ có giá trị của chúng thay đổi), do đó người ta có thể tận dụng tính chất thưa của các ma trận W,
g và h trong (1.21) Đặc điểm này sẽ rất hữu ích trong trường hợp giải bài toán phi tuyến cỡ lớn
Do đó nếu bài toán có một lượng không nhiều các ràng buộc dạng bất phương trình thì việc tìm tập ràng buộc tích cực sẽ khá dễ dàng và sau đó việc giải bài toán tối ưu toàn phương (1.9) sẽ không khó khăn, do đó phương pháp AS-SQP được coi
là thích hợp trong trường hợp này Trong trường hợp ngược lại, với bài toán có
Trang 24Bài toán tối ưu động 12 nhiều ràng buộc dạng bất phương trình, các phương pháp IP-SQP thường giải nhanh hơn do chúng tránh được việc phải tìm tập rằng buộc tích cực AS Đây là những đặc điểm cần chú ý khi chọn phương pháp giải phù hợp cho các bài toán tối ưu được hình thành trong phần tiếp theo của luận văn này.
1.3 Bài toán tối ƣu động
Các bài toán tối ưu động (Dynamic Optimization) nói chung liên quan đến một
hệ thống các phương trình vi phân-đại số (DAEs) mô tả các hệ thống động học rất phổ biến trong các lĩnh vực cơ khí, cơ-điện tử, điện và điện tử cũng như công nghệ hóa học
Các mô hình đại diện cho các quá trình hóa học thường bao gồm một hệ thống những phương trình vi phân thường (ODEs) mô tả những cân bằng khối lượng và năng lượng động của hệ thống, mà trong đó các phản ứng hóa học xảy ra, cùng với các phương trình đại số (AEs) thể hiện các quan hệ cân bằng nhiệt động lực học, những giá trị ở chế độ làm việc xác lập, v.v Các hệ thống mạch điện bao gồm những phần tử cơ bản như điện trở, tụ điện và điện cảm được mô tả bằng những hệ phương trình vi phân mà được tổng hợp lại bằng các định luật Kirchhoff dưới dạng các phương trình đại số Trong các hệ thống cơ khí, những hệ phương trình vi phân thường được dùng để mô tả các quá trình động học của những hệ thống con và các phương trình đại số được dùng để tổng hợp các ràng buộc tại các khớp nối
Nhiệm vụ của bài toán tối ưu động là thực hiện việc tìm kiếm một luật điều khiển cho một hệ thống cho trước nhằm đạt được một tiêu chí tối ưu nhất định Bài toán như vậy bao gồm một hàm chi phí chứa các biến trạng thái (còn gọi là biến phụ thuộc) và các biến điều khiển (còn gọi là biến độc lập) cùng với một tập hợp các phương trình vi phân-đại số mô tả hệ thống động học cần được tối ưu Việc giải bài toán tối ưu động nói trên chính là việc đi tìm quỹ đạo của các biến điều khiển nhằm giảm thiểu giá trị hàm chi phí như: tìm đường đi ngắn nhất, tìm thời gian xảy ra quá trình ngắn nhất, cực tiểu hóa chi phí, cực tiểu hóa thời gian tác động, giảm giá thành sản phẩm, v.v
Trang 25Bài toán tối ưu động 13
thuộc) vi phân, biến trạng thái đại số và biến điều khiển (độc lập) Hệ phương trình (1.22.b-1.22c) là một hệ phương trình DAEs mô tả hệ thống cần xét, (1.22.d) là những ràng buộc tại điểm cuối của biến trạng thái, và (1.22.e) là những ràng buộc trên quỹ đạo của biến điều khiển và biến trạng thái
Theo hình 1.1, bài toán tối ưu động (1.22) trước hết được phân thành hai nhánh: bài toán ngẫu nhiên và bài toán tiền định Trong bài toán ngẫu nhiên tồn tại một số đại lượng là các biến ngẫu nhiên và cách giải chúng tương đối phức tạp nên không được xét đến trong luận văn này Bài toán tiền định có thể giải theo một số phương pháp được chia thành hai nhánh: phương pháp gián tiếp và phương pháp trực tiếp Phương pháp gián tiếp tập trung tìm nghiệm theo hướng giải tích dựa vào điều kiện cần của nghiệm tối ưu để giải bài toán hai điểm đầu-cuối [9,11] Phương pháp này chỉ phù hợp với các bài toán tương đối đơn giản và không có các điều kiện biên Với các bài toán phức tạp và tồn tại điều kiện biên cũng như các ràng buộc thì phương pháp này tỏ ra không hiệu quả
Trái lại, phương pháp trực tiếp tiến hành tìm nghiệm tối ưu một cách trực tiếp theo phương pháp số Trong phương pháp này, người ta tiến hành rời rạc hóa bài toán tối ưu động vô số chiều (1.22) thành bài toán toán tối ưu phi tuyến hữu hạn chiều Do tính tương đối đơn giản và nhờ khả năng tính toán và lập trình ngày càng được nâng cao, phương pháp trực tiếp ngày càng thu hút được sự quan tâm nghiên cứu
1.3.2 Các phương pháp gián tiếp
Nhiệm vụ của điều khiển tối ưu là giải bài toán tìm cực trị của phiếm hàm
z t y t u t t( ), ( ), ( ),
bằng cách chọn tín hiệu điều khiển u(t) với những điều kiện
hạn chế của đại lượng điều khiển và biến trạng thái Một trong những công cụ toán học để xác định cực trị là phương pháp biến phân cổ điển Euler-Lagrange
Trang 26Bài toán tối ưu động 14 Đường cực trị là những hàm trơn còn phiếm hàm cùng các điều kiện hạn chế là những hàm phi tuyến Do đó phương pháp này không thể áp dụng cho những trường hợp mà tín hiệu điều khiển có thể là các hàm gián đoạn
Trường hợp không có điều kiện ràng buộc:
Cho u(t) là hàm thuộc lớp hàm có đạo hàm bậc nhất liên tục Trong mặt phẳng (u,t) cho hai điểm (t 0 ,u 0 ) và (t 1 ,u 1) Cần tìm quỹ đạo nối hai điểm này sao cho tích phân theo quỹ đạo uu t( ) cho bởi:
Không giảm tính tổng quát, ở đây ta có thể lấy t 0 = 0 và t 1 = T
Biến đổi của J do δu tạo nên là:
Xem δu là hàm biến đổi độc lập, biểu thức (1.26) có thể biến đổi để chỉ chứa δu
bằng cách lấy tích phân những thành phần chứa u:
0 0
( , , ) ( , , ) ( , , )
T T
Trang 27Bài toán tối ưu động 15
Nếu gia số δJ của chỉ tiêu chất lượng J tồn tại và nếu J có cực trị đối với u*
Trường hợp có điều kiện ràng buộc:
Nếu ngoài chỉ tiêu chất lượng (1.23) còn có các điều kiện ràng buộc dạng :
mà i( )t với i = 1, 2, …, n là hàm Lagrange Vì giới hạn thỏa mãn với mọi t nên
hàm Lagrange phụ thuộc thời gian
Tương tự như trên ta có phương trình Euler-Lagrange tổng quát:
Trang 28Bài toán tối ưu động 16
Trong trường hợp này, 1là các hệ số không phụ thuộc thời gian
Khi có điều kiện ràng buộc dạng (1.32) hoặc (1.36) phải giải (n+1) phương trình
để xác định y*(t) và *
1( )t
với i=1, 2, …, n
Phương trình Euler-Lagrange với tín hiệu điều khiển bị hạn chế
Trong phần trên ta chỉ đề cập tới bài toán mà trong đó tín hiệu điều khiển không
có giới hạn nào ràng buộc Trong thực tế, thường gặp tín hiệu điều khiển có ràng buộc dạngu 1
Điều kiện cần để có cực trị: khi u(t) là đường cực trị thì u+δu và u-δu là những
hàm cho phép Bây giờ ta so sánh trị số phiếm hàm ở đường cực trị với trị số của nó
ở hàm u+δu và u-δu Nếu miền biến đổi của u(t) là kín và u(t) ở ngoài biên thì một trong các hàm u+δu hoặc u-δu sẽ ra ngoài miền cho phép
Một trong các biện pháp khắc phục khó khăn trên là đường cực trị ở biên và:
Trang 29Bài toán tối ưu động 17
Một chiến lược tối ưu có tính chất không phụ thuộc vào những quyết định trước
đó (ví dụ như những luật điều khiển) song các quyết định còn lại phải cấu thành nên chiến lược tối ưu có liên quan với kết quả của những quyết định trước đó Nguyên lý tối ưu của Belman: “Bất kỳ một đoạn cuối cùng nào của quỹ đạo tối
ưu cũng là một quỹ đạo tối ưu ”
Nguyên lý này giới hạn xem xét trên một số các chỉ tiêu tối ưu Nó chỉ ra rằng phương án tối ưu phải được xác định từ trạng thái cuối đi ngược về trước đó
Điều kiện áp dụng: nguyên lý tối ưu là một phương pháp số, chỉ áp dụng được khi hệ thống có phân cấp điều khiển và ta biết trước sơ đồ mắt lưới được xây dựng bằng thực nghiệm
Hệ rời rạc
Phương pháp quy hoạch động cũng có thể dễ dàng áp dụng cho hệ phi tuyến Ngoài ra, nếu có càng nhiều điều kiện ràng buộc đối với tín hiệu điều khiển và biến trạng thái thì ta có được lời giải càng đơn giản
Đặt: x k1 f k( ,x u k k) (1.44)
với số mũ k trên f thể hiện sự thay đổi theo thời gian Giả định kết hợp với hàm chỉ
tiêu chất lượng:
Trang 30Bài toán tối ưu động 18
với [i, N] là thời gian lấy mẫu Chúng ta cần chỉ ra sự phụ thuộc của J đối với trạng
thái và thời gian đầu
Giả sử ta đã có được tổn hao tối ưu *
điểm k +1 đến N cho mọi x k1
Tại thời điểm k, nếu ta áp dụng một luật điều khiển u k bất kỳ và sử dụng một chuỗi luật điều khiển tối ưu kể từ vị trí k +1, lúc đó tổn hao sẽ là :
với x k là trạng thái ở thời điểm k , và x k+1 được cho bởi (1.44) Theo nguyên
lý Bellman thì tổn hao tối ưu từ thời điểm k sẽ là:
một vector điều khiển
Trong thực tế, ta có thể định rõ các điều kiện ràng buộc được thêm vào chẳng hạn như yêu cầu luật điều khiển u kthuộc về một bộ các luật điều khiển được chấp
nhận
Phương pháp điều khiển số
Chúng ta có thể rời rạc hóa, giải bài toán tối ưu cho hệ rời rạc và sau đó dùng khâu lưu giữ bậc 0 để tạo ra tín hiệu điều khiển số
Trang 31Bài toán tối ưu động 19
Phương trình này đúng với (1.44)
Để rời rạc hoá hàm chỉ tiêu, ta có thể viết:
( 1) 1 0
k N
1 0
Trang 32Bài toán tối ưu động 20
N S S
Tuy nhiên trong trường hợp này ta có thể làm tốt hơn xấp xỉ Euler (1.61) bằng
cách sử dụng chính xác phương trình trạng thái (1.50) bao gồm bộ lấy mẫu và khâu lưu giữ bậc 1:
u như trong phần rời rạc Điều khiển số áp dụng trong thực tế
được thể hiện như sau:
lượng có thể chấp nhận được của x k và u k tăng thì khối lượng tính toán để tìm *
Trang 33Bài toán tối ưu động 21
và x(t0) đã được cho trước
Điều kiện để bài toán tối ưu là:
H u
Dấu * thể hiện chỉ số chất lượng tối ưu Mà bất kỳ sự biến thiên nào trong bộ
điều khiển tối ưu xảy ra tại thời điểm t (trong khi trạng thái và biến trạng thái nếu được duy trì) sẽ tăng đến giá trị của hàm Hamilton Điều kiện này được viết như
sau:
( , , , ) ( , , , )
H x u t H x u t thỏa tất cả giá trị u (1.75) Yêu cầu tối ưu biểu thức (1.75) được gọi nguyên lý cực đại Pontryagin: “Hàm Hamilton phải đạt cực đại ở tất cả các giá trị u cho giá trị tối ưu của trạng thái và biến trạng thái”
Đặc biệt chú ý không thể nói rằng biểu thức H x u( , , ) H x u( , , , ) t chắc
chắn phải đúng
Điều khiển Bang-Bang
Chúng ta hãy thảo luận bài toán tối thiểu thời gian tuyến tính với đầu vào ràng buộc Cho hệ thống:
x x Buvới chỉ tiêu chất lượng:
Trang 34Bài toán tối ưu động 22
(t)Bu(t) càng nhỏ càng tốt (có nghĩa là giá trị
càng xa về phía bên trái trên trục tọa độ thực; T Bu là giá trị nhỏ nhất) Nếu
không có sự ràng buộc nào trên u(t), thì điều này sẽ cho ra những giá trị vô hạn
(dương hoặc âm) của những biến điều khiển
Với kết quả này, bài toán tối ưu đặt ra phải có những điều kiện ràng buộc đối với tín hiệu điều khiển
Theo nguyên lý cực đại Pontryagin (1.75), hàm điều khiển tối ưu u *
(t)bu(t) có giá trị âm nhất Mặt
khác, nếu λT (t)b là giá trị âm, chúng ta nên chọn u(t) ở giá trị cực đại là giá trị 1 để
Trang 35Bài toán tối ưu động 23 giá trị λT
(t)bu(t) càng âm càng tốt Nếu giá trị λ T (t)bu(t) bằng 0 tại thời điểm t, khi
đó u(t) có thể nhận bất cứ giá trị nào tại thời điểm này
Quan hệ giữa điều khiển tối ưu và biến trạng thái có thể biểu diễn bằng hàm
chuyển đổi tại vị trí giữa các giá trị cực trị, cho nên được gọi là điều khiển bang
Bang-Nếu bộ điều khiển là một vector có m phần tử, theo nguyên lý cực đại ta chọn các thành phần u i (t) bằng 1, nếu các thành phần b i Tλ(t) là giá trị âm; và bằng -1 nếu
b i T λ(t) là giá trị dương, với b i là cột thứ i của B Phương pháp điều khiển này tạo
Trang 36Bài toán tối ưu động 24 không định nghĩa được bởi biểu thức (1.81) Đó gọi là điều kiện kỳ dị Nếu điều đó không xảy ra, thì bộ điều khiển thời gian tối ưu được gọi là bình thường
Nếu hệ thống là bất biến theo thời gian, ta sẽ có được quả đơn giản và bộ điều khiển thời gian tối ưu là duy nhất
Hình 1.4: Hàm chuyển đổi mẫu và bộ điều khiển tối ưu
Hệ thống bất biến theo thời gian trong biểu thức (1.76) có thể đạt được nếu chỉ
có một ma trận
1
n n
Giả sử hệ thống bình thường và ta muốn dẫn x(t0) tiến đến trạng thái cuối cố
định x(T) với hàm điều khiển thỏa [u(t)]≤ 1 Khi đó:
1 nếu trạng thái cuối x(T) bằng 0, khi đó sẽ tồn tại bộ điều khiển thời gian tối
thiểu nếu hệ thống không có cực với phần thực dương (ví dụ không có cực trên mặt phẳng phía bên phải),
2 cho bất kỳ giá trị x(T) cố định, nếu tồn tại đáp án cho bài toán tối ưu thời
gian thì nó là duy nhất,
3 cuối cùng, nếu hệ thống có n cực thực và nếu tồn tại bộ điều khiển tối ưu thời
gian thì mỗi thành phần u i (t) của bộ điều khiển tối ưu thời gian thay đổi n-1
lần
Điều khiển Bang-Off-Bang
Trang 37Bài toán tối ưu động 25
Ở phần này chúng ta sẽ thảo luận bài toán điều khiển nhiên liệu tối thiểu tuyến tính với đầu vào bị ràng buộc
Giả định rằng bài toán thỏa : u t( ) 1 (1.93)
Ta muốn tìm luật điều khiển để tối thiểu J(t0) , thỏa (1.93) và đưa x(t0) về trạng
thái cuối thỏa (1.72) với hàm Ψ đã cho Thời gian cuối T có thể tự do hoặc ràng buộc Chúng ta sẽ thảo luận kỹ hơn ở ví dụ Lưu ý rằng thời gian T ít nhất phải bằng thời gian tối thiểu để đưa x(t 0 ) về trạng thái cuối x(T) thỏa (1.72)
Hàm Hamilton:
H C u AxBu (1.94) Theo nguyên lý cực đại (1.75), bài toán điều khiển tối ưu phải thỏa:
Trang 38Bài toán tối ưu động 26
với mọi u(t)
1
0
T i
Nếu b i T λ /c i bằng 1, khi đó một vài giá trị không xác định dương của u i (t) sẽ làm
q i trong (1.99) bằng zero; nếu b i T λ /c i bằng -1 , khi đó một vài giá trị không xác định
âm của u i (t) sẽ làm q i bằng 0 Do đó bài toán nhiên liệu tối thiểu có luật điều khiển
giống như một bài toán phi tuyến
Biến trạng thái hồi tiếp là :
w w
Trang 39Bài toán tối ưu động 27
Ta có thể viết lại bài toán nhiên liệu tối thiểu như sau:
( )
T i i
Nếu b i T λ(t)/c i bằng 1 hoặc –1, giữa 2 trạng thái có một khoảng thời gian khác
zero Trong trường hợp này, nguyên lý cực đại sẽ không xác định được các thành
phần u i (t) Đây gọi là những khoảng kỳ dị Nếu b i T λ(t)/c i bằng 1 hoặc –1 chỉ tại một
số khoảng thời gian xác định, đây là bài toán nhiên liệu tối thiểu thông thường
Bài toán điều khiển nhiên liệu tối thiểu là thông thường nếu A 0 và nếu hệ
thống là bình thường Có nghĩa là nếu u i được định nghĩa bởi (1.88) thì nó là kỳ dị với i = 1 , … , m
Nếu bài toán nhiên liệu tối thiểu là bình thường và bộ điều khiển nhiên liệu tối thiểu tồn tại, khi đó nó là duy nhất
Nhận xét
Phương pháp biến phân cổ điển Euler-Lagrange thuận lợi khi giải bài toán tối
ưu mà phiếm hàm có dạng phi tuyến, còn tín hiệu điều khiển là những hàm trơn mà
ta có thể dự đoán trước dựa trên bản chất vật lý của chúng
Phương pháp này gặp nhiều khó khăn khi áp dụng cho các trường hợp mà tín hiệu điều khiển có thể là hàm gián đoạn Trên thực tế ta thường gặp bài toán tối ưu
mà tín hiệu điều khiển lại là hàm liên tục từng đoạn, cho nên phương pháp biến phân cổ điển bị hạn chế khả năng sử dụng trong thực tế rất nhiều
Đối với hệ thống gián đoạn tốt nhất ta nên áp dụng phương pháp quy hoạch
động của Bellman Đặc biệt với các bài toán tối ưu phức tạp dùng máy tính số tác
động nhanh giải quyết bằng phương pháp này rất có hiệu quả Tuy nhiên, do hàm
mô tả tín hiệu điều khiển tìm được theo bảng số liệu rời rạc nên biểu thức giải tích của tín hiệu điều khiển chỉ là gần đúng Phương pháp quy hoạch động còn gặp hạn
chế khi áp dụng đối với hệ thống liên tục vì rất khó giải phương trình Bellman Nguyên lý cực đại Pontryagin áp dụng tốt cho các bài toán tối ưu có điều kiện
ràng buộc bất kể điều kiện ràng buộc cho theo hàm liên tục hoặc hàm gián đoạn
Nhưng đối với bài toán tối ưu phi tuyến thì nguyên lý cực đại Pontryagin lại gặp
khó khăn, đặc biệt trong việc xác định các hàm phụ λi (t) để cho hàm H đạt cực đại
1.3.3 Các phương pháp trực tiếp
Trang 40Bài toán tối ưu động 28
Như đã giới thiệu ở phần 1.3.1, bài toán tối ưu động có thể được giải theo cách chuyển về bài toán tối ưu liên tục Một trong những cơ sở toán học để thực hiện việc chuyển hóa này là phương pháp rời rạc hóa collocation trực giao được sử dụng
để rời rạc hóa hệ phương trình DAEs (1.22b-1.22c) thành hệ phương trình đại số phi tuyến cỡ lớn Tiếp sau đó, phương pháp Newton-Raphson sẽ được sử dụng để giải hệ phương trình mới được tạo ra này nhằm mục đích tìm nghiệm của các biến tại các điểm lưới collocation của mỗi đoạn thời gian rời rạc
Phương pháp collocation trực giao
Trong phương pháp này, tín hiệu điều khiển u(t) được xấp xỉ từng đoạn có giá trị hằng số trong các khoảng thời gian, còn tín hiệu trạng thái x(t) được rời rạc hóa
bằng phương pháp đa thức Lagrange mà giá trị các biến trong phương trình buộc phải thỏa mãn tại các điểm collocation
Giả sử NC là số điểm collocation trong một đoạn thời gian riêng biệt, ta xét
trường hợp mà các điểm Gauss nằm trong khoảng [0,1], đa thức trực giao
Lagrange bậc NC được thành lập như sau:
0
NC
j i
và đa thức (1.102) được áp dụng trong mỗi phần tử thời gian này Phương thức này cũng được biết đến như là phương pháp phần tử hữu hạn collocation
Nhằm duy trì tính liên tục giá trị của các biến giữa hai khoảng thời gian liên tiếp, điểm collocation cuối của phần tử thời gian trước đó sẽ được dùng làm điểm khởi tạo cho phần tử tiếp theo Phương pháp Radau collocation này có tác dụng nâng cao tính hội tụ của bài toán do phương trình mô tả hệ thống được thỏa mãn tại những điểm collocation Hình 1.5 minh họa việc sử dụng phương pháp Radau collocation
để rời rạc hóa hệ DAEs trong (1.22b-1.22c) thành một hệ các phương trình đại số