Điều này dẫn đến một loạt các sự phát triển mới đầy hấp dẫn, bên cạnh các thách thức mới trong lĩnh vực điều khiển dự báo hệ phi tuyến, trong đó phải tính tới cả việc đưa ra được lời chứ
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
LUẬN ÁN TIẾN SĨ KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA
NGƯỜI HƯỚNG DẪN KHOA HỌC:
GS.TS NGUYỄN DOÃN PHƯỚC
Hà Nội − 2015
Trang 3Lời cam đoan
Tôi xin cam đoan đây là công trình nghiên cứu của cá nhân tôi dưới sự hướng dẫn của tập thể giáo viên hướng dẫn và các nhà khoa học Tài liệu tham khảo trong luận án được trích dẫn đầy đủ Các kết quả nghiên cứu của luận án là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác
Đỗ Thị Tú Anh
Trang 4Lời cảm ơn
Trong quá trình làm luận án, tôi đã nhận được rất nhiều góp ý về chuyên môn cũng như
sự ủng hộ về các công tác tổ chức của tập thể cán bộ hướng dẫn, của các nhà khoa học, của các bạn đồng nghiệp Tôi xin được gửi tới họ lời cảm ơn sâu sắc
Tôi xin bày tỏ lòng cảm ơn đến tập thể cán bộ hướng dẫn đã tâm huyết hướng dẫn tôi trong suốt thời gian qua
Tôi cũng xin chân thành cảm ơn các nhà khoa học, các đồng nghiệp, tập thể Bộ môn Điều khiển Tự động đã có những ý kiến đóng góp quý báu, các Phòng ban của Trường Đại học Bách Khoa Hà Nội đã tạo điều kiện thuận lợi cho tôi trong suốt quá trình thực hiện đề tài luận án
Nghiên cứu sinh
Đỗ Thị Tú Anh
Trang 5MỤC LỤC
Các ký hiệu được sử dụng vii
Danh mục các ký hiệu và chữ viết tắt viii
Danh mục các hình vẽ, đồ thị ix
Danh mục các bảng x
MỞ ĐẦU 1
Tính cấp thiết của đề tài luận án 1
Mục tiêu và nhiệm vụ của luận án 1
Phạm vi và đối tượng nghiên cứu của luận án 2
Cấu trúc và những đóng góp của luận án 2
CHƯƠNG 1: GIỚI THIỆU CHUNG 4 1.1 Động cơ thúc đẩy đề tài 4
1.1.1 Hệ điều khiển dự báo 4
1.1.2 Các hướng nghiên cứu của luận án 6
1.2 Những kết quả lý thuyết cơ bản 14
1.2.1 Tính ổn định Lyapunov 14
1.2.2 Tính ổn định ISS 15
1.2.3 Quy hoạch động của Bellman 16
CHƯƠNG 2: TỔNG QUAN VỀ ĐIỀU KHIỂN DỰ BÁO PHẢN HỒI ĐẦU RA DỰA TRÊN QUAN SÁT TRẠNG THÁI 18 2.1 Điều khiển dự báo phản hồi đầu ra dựa trên quan sát trạng thái cho hệ tuyến tính 18
2.1.1 Điều khiển dự báo bền vững hệ tuyến tính sử dụng bộ quan sát tựa Luenberger 18
2.1.2 Điều khiển dự báo bền vững hệ tuyến tính sử dụng bộ quan sát Moving Horizon 22
2.2 Điều khiển dự báo phản hồi đầu ra dựa trên quan sát trạng thái cho hệ phi tuyến 25
2.2.1 Điều khiển dự báo hệ phi tuyến sử dụng bộ quan sát High Gain 25
2.2.2 Điều khiển dự báo hệ phi tuyến sử dụng bộ quan sát mở rộng 29
2.3 Đánh giá chung 34
2.3.1 Đánh giá các phương pháp điều khiển hiện có 34
Trang 62.3.2 Định hướng của luận án 35
CHƯƠNG 3: ĐIỀU KHIỂN DỰ BÁO PHẢN HỒI ĐẦU RA VỚI BỘ QUAN SÁT TRẠNG THÁI TỐI ƯU CHO HỆ PHI TUYẾN 36 3.1 Phản hồi trạng thái 36
3.1.1 Phản hồi trạng thái với hàm mục tiêu có cấu trúc biến đổi 36
3.1.2 Phân tích tính ổn định 41
3.2 Quan sát trạng thái 45
3.2.1 Các vấn đề chung của quan sát trạng thái 45
3.2.2 Xây dựng bộ quan sát trạng thái tối ưu 47
3.2.3 Cài đặt thuật toán quan sát tối ưu 51
3.3 Tính ổn định của hệ điều khiển dự báo phản hồi đầu ra theo nguyên lý tách với hàm mục tiêu có cấu trúc biến đổi 55
3.4 Tóm tắt chương 60
CHƯƠNG 4: ĐIỀU KHIỂN DỰ BÁO PHẢN HỒI ĐẦU RA VỚI BỘ QUAN SÁT TRẠNG THÁI TỐI ƯU CHO HỆ SONG TUYẾN 61 4.1 Phản hồi trạng thái 61
4.1.1 Thiết kế bộ điều khiển dự báo phản hồi trạng thái cho hệ song tuyến với hàm mục tiêu có tham số biến đổi 61
4.1.2 Tính ổn định của hệ điều khiển dự báo phản hồi trạng thái 68
4.2 Quan sát trạng thái 73
4.2.1 Kiểm tra tính quan sát đều của hệ song tuyến 73
4.2.2 Thiết kế bộ quan sát trạng thái tối ưu cho hệ song tuyến 74
4.3 Tính ổn định của hệ song tuyến phản hồi đầu ra theo nguyên lý tách 82
4.4 Tóm tắt chương và các mở rộng 87
4.4.1 Tóm tắt chương 87
4.4.2 Các mở rộng 87
KẾT LUẬN VÀ KIẾN NGHỊ 91 Những vấn đề đã được giải quyết 91
Những vấn đề còn tồn tại và kiến nghị 91
Trang 7K Lớp các hàm thực r , r 0 đơn điệu tăng với 0 0
L Lớp các hàm thực k , k 0 đơn điệu giảm với
limk k 0
Trang 8Danh mục các ký hiệu và chữ viết tắt
Co Convex hull
CLF Control Lyapunov Function
DMC Dynamic Matrix Control
FTO Finite Time Observer
GPC Generalized Predictive Control
ISS Input-to-State Stability
LF Lyapunov Function
LMI Linear Matrix Inequality
LQR Linear Quadratic Regulator
LRPC Long Range Predictive Control
LRQP Long Range Quadratic Programming MAC Model Algorithmic Control
MPC Model Predictive Control
QP Quadratic Programming
SQP Sequential Quadratic Programming
Trang 9Danh mục các hình vẽ, đồ thị
Hình 1.2 Tín hiệu ra y khi R k const và biến đổi 13 Hình 1.3 Tín hiệu điều khiển u khi R k const và biến đổi 13 Hình 1.4 Tín hiệu ra y ứng với cửa sổ dự báo khác nhau 14 Hình 1.5 Tín hiệu điều khiển u khi R và cửa sổ dự báo thay đổi k 14
Hình 3.3 Đáp ứng thời gian của bộ quan sát trạng thái tối ưu ứng với M 2 khi
Hình 3.4
Đáp ứng thời gian của bộ quan sát trạng thái tối ưu ứng với các giá trị
Hình 3.5 Đáp ứng thời gian của bộ quan sát trạng thái tối ưu ứng với M 2 sử
dụng thuật toán Levenberg-Marquardt và Gauss-Newton 55 Hình 3.6 Cấu trúc hệ điều khiển dự báo phản hồi đầu ra theo nguyên lý tách 56 Hình 3.7 Nguyên tắc làm việc của bộ điều khiển dự báo phản hồi đầu ra theo
Hình 4.1 Đáp ứng thời gian của các biến trạng thái x và 1 x cho ví dụ 4.1 2 72
Hình 4.3 Giá trị nhỏ nhất của hàm mục tiêu J biểu diễn theo k k 73 Hình 4.4 Trạng thái quan sát được so với trạng thái thực của hệ khi không có
Hình 4.5 Trạng thái quan sát được so với trạng thái thực của hệ khi có nhiễu
Hình 4.6 Sai lệch trạng thái của x khi nhiễu có kỳ vọng bằng không so 1
Trang 10Danh mục các bảng
Bảng 3.1 Số các vòng lặp của thuật toán Levenberg-Marquardt và Gauss-
Bảng 4.1 Chỉ số sai lệch quan sát khi tăng cửa sổ quan sát 82
Trang 11MỞ ĐẦU
Tính cấp thiết của đề tài luận án
Ba thập kỉ qua đã chứng kiến sự phát triển nhanh chóng của lĩnh vực điều khiển dự báo trên cả khía cạnh nghiên cứu lý thuyết và ứng dụng thực tế Hơn 30 năm qua, điều khiển dự báo cho các hệ tuyến tính đã được áp dụng rộng rãi, đặc biệt là trong lĩnh vực điều khiển quá trình Tuy nhiên, các ứng dụng hiện nay thường yêu cầu các quá trình vận hành trong một dải làm việc lớn và gần với các điều kiện biên, đồng thời phải thỏa mãn các ràng buộc cũng như phải đạt được chất lượng gần tối ưu Kết quả là các phương pháp điều khiển tuyến tính không phải lúc nào cũng đem lại chất lượng như mong muốn và do đó dẫn đến việc phải áp dụng các phương pháp điều khiển phi tuyến Đây là một trong những lí do mà điều khiển dự báo phi tuyến được quan tâm đặc biệt trong những năm gần đây với rất nhiều bước tiến ở cả lĩnh vực
lý thuyết và ứng dụng Ngoài ra, năng lực ngày càng tăng của các máy tính hiện có cũng như
sự phát triển không ngừng của các phương pháp giải số dành riêng cho điều khiển dự báo phi tuyến đã mang đến khả năng ứng dụng của nó cả cho các hệ động học biến đổi nhanh Điều này dẫn đến một loạt các sự phát triển mới đầy hấp dẫn, bên cạnh các thách thức mới trong lĩnh vực điều khiển dự báo hệ phi tuyến, trong đó phải tính tới cả việc đưa ra được lời chứng minh tính thỏa mãn nguyên lý tách của hệ kín phản hồi đầu ra khi ghép chung bộ điều khiển
dự báo phản hồi trạng thái phi tuyến với bộ quan sát trạng thái, cũng như phải xây dựng được thuật toán để giải bài toán tối ưu khi có ràng buộc về tín hiệu điều khiển, … Các thách thức này cũng chính là động cơ thúc đẩy đề tài nghiên cứu của luận án
Mục tiêu và nhiệm vụ của luận án
Mục tiêu của luận án là giải quyết bài toán "Điều khiển dự báo phản hồi đầu ra theo nguyên lý tách cho hệ phi tuyến" Để thực hiện được mục tiêu này, luận án đặt ra hai nhiệm vụ
chính, bao gồm:
Sử dụng hàm mục tiêu có cấu trúc biến đổi trong việc xây dựng bộ điều khiển dự báo phản hồi trạng thái nhằm mở rộng tính linh hoạt của bộ điều khiển và hơn nữa là có thể chuyển được bài toán điều khiển có điều kiện ràng buộc cho tín hiệu điều khiển cũng như trạng thái về thành bài toán không ràng buộc
Xây dựng bộ quan sát trạng thái và từ đó là bộ điều khiển dự báo phản hồi đầu ra cho
hệ phi tuyến trên cơ sở sử dụng bộ quan sát trạng thái, cũng như khảo sát tính ổn định của hệ kín thu được
Trang 12Phạm vi và đối tượng nghiên cứu của luận án
Phạm vi của luận án là nghiên cứu và đưa ra các kết quả cho điều khiển dự báo hệ phi tuyến nói chung và hệ song tuyến (lớp hệ phi tuyến đặc biệt và phổ biến trong công nghiệp) nói riêng Các bài toán rất phổ biến hiện nay trong điều khiển dự báo, chẳng hạn như bài toán ước lượng trạng thái hay bài toán ổn định hóa và bám ổn định quỹ đạo đặt cũng sẽ được giải quyết Tính ổn định của hệ điều khiển dự báo phản hồi trạng thái và phản hồi đầu ra được luận
án chứng minh dựa trên lý thuyết ổn định Lyapunov và ổn định ISS (Input-to-State Stability)
Đặc biệt, với hệ song tuyến, khi được coi là vô số các hệ tuyến tính tham số hằng, thì lời giải của bài toán tối ưu trong điều khiển dự báo có xét đến điều kiện ràng buộc của tín hiệu điều
khiển lại có thể được phát triển từ các kết quả quen thuộc của bài toán LQR (Linear Quadratic Regulator) hay phương pháp quy hoạch động của Bellman nhờ việc sử dụng hàm
mục tiêu có tham số biến đổi
Cấu trúc và những đóng góp của luận án
Luận án được bố cục với 4 chương chính Sau phần giới thiệu chung về điều khiển dự báo và những khái niệm lý thuyết cơ bản trong chương 1, chương 2 sẽ trình bày tổng quan về các kết quả đã có của điều khiển dự báo phản hồi đầu ra dựa trên quan sát trạng thái, để từ đó làm rõ hơn được những kết quả chính của luận án ở các chương sau Các kết quả lý thuyết phát triển thêm của luận án được trình bày ở hai chương 3 và 4 Cụ thể, chương 3 khảo sát tính ổn định của hệ điều khiển dự báo phản hồi trạng thái với hàm mục tiêu của bộ điều khiển
có cấu trúc biến đổi và đề xuất sử dụng bộ quan sát tối ưu, từ đó phân tích tính ổn định theo nguyên lý tách của hệ điều khiển dự báo phản hồi đầu ra với bộ quan sát trạng thái tối ưu cho
hệ phi tuyến tổng quát Các kết quả ở chương 3 sẽ được áp dụng cho riêng các hệ song tuyến
và được trình bày ở chương 4 Ngoài ra, trong chương 4 luận án cũng đưa ra một thuật toán điều khiển dự báo phản hồi trạng thái cho hệ song tuyến mà có thể kết hợp với bộ quan sát trạng thái tối ưu để tạo thành hệ phản hồi đầu ra ổn định theo nguyên lý tách Để làm rõ hơn cho các đóng góp của luận án, một số ví dụ mô phỏng cũng sẽ được trình bày ở các chương 1,
3 và 4 Cuối cùng là các kết luận về kết quả đạt được của luận án và hướng phát triển tiếp theo
Luận án đã có các đóng góp cụ thể như sau:
Phát biểu được một tiêu chuẩn ổn định cho hệ điều khiển dự báo phản hồi trạng thái hệ phi tuyến mà ở đó hàm mục tiêu có cấu trúc biến đổi trong cửa sổ dự báo cũng như theo sự dịch chuyển của cửa sổ dự báo trên trục thời gian
Xây dựng được bộ điều khiển dự báo phản hồi trạng thái cho hệ song tuyến và chứng minh được tính ổn định tiệm cận của hệ kín thu được
Xây dựng được thuật toán quan sát trạng thái tối ưu cho hệ phi tuyến và điều kiện đủ để
bộ quan sát đó trở thành bộ quan sát có khoảng thời gian quan sát hữu hạn FTO (Finite Time Observer)
Trang 13 Phát biểu được điều kiện cần và đủ để hệ song tuyến là quan sát đều và xây dựng thuật toán quan sát trạng thái tối ưu cho hệ song tuyến
Đưa ra điều kiện đủ để bộ điều khiển dự báo phản hồi đầu ra, xây dựng trên nền nguyên
lý tách, làm hệ phi tuyến nói chung và hệ song tuyến nói riêng là ổn định tiệm cận (với
bộ quan sát FTO) và ổn định ISS (khi luôn tồn tại sai lệch quan sát)
Trang 14CHƯƠNG 1: GIỚI THIỆU CHUNG
1.1 Động cơ thúc đẩy đề tài
1.1.1 Hệ điều khiển dự báo
Điều khiển dự báo dựa theo mô hình (Model Predictive Control - MPC), hay gọi tắt là
điều khiển dự báo, đề cập đến một họ các phương pháp điều khiển sử dụng một mô hình toán học để dự báo tín hiệu ra của đối tượng (quá trình) trong tương lai Tại mỗi thời điểm trích mẫu, thuật toán điều khiển dự báo sẽ tối ưu đáp ứng của hệ bằng cách tính toán ra dãy tín hiệu điều khiển tương lai Chỉ có thành phần đầu tiên của dãy tín hiệu điều khiển tối ưu này được đưa tới đối tượng và toàn bộ chu trình tính toán sẽ được lặp lại tại các thời điểm trích mẫu tiếp theo [16,36,50] Nhờ khả năng xử lý trực tiếp các điều kiện ràng buộc của trạng thái và tín hiệu vào/ra trong bài toán tối ưu nên điều khiển dự báo đã được áp dụng thành công trong rất nhiều lĩnh vực trên thực tế [45,47]
Hình 1.1: Nguyên lý làm việc của bộ điều khiển dự báo
Hình 1.1 mô tả cấu trúc bên trong (hình 1.1a) và nguyên lý hoạt động (hình 1.1b) của hệ điều khiển dự báo Như vậy bộ điều khiển dự báo gồm có ba khâu chính:
Khâu mô hình dự báo Khâu này có nhiệm vụ xác định được dãy các giá trị đầu ra
tương lai thuộc cửa sổ dự báo hiện tại, tức là cửa sổ dự báo k k, N tính từ thời điểm hiện tại k Kết quả đầu ra của khâu dự báo này là giá trị đầu ra tương lai , 0,1, , 1
k i i N
y dưới dạng các hàm phụ thuộc tín hiệu đầu vào tương lai trong cùng cửa sổ dự báo u , i0,1, ,N 1:
Khoảng dự báo tiếp theo
Khoảng dự báo hiện tại
Bộ điều khiển dự báo
Mô hình
dự báo
Đối tượng điều khiển
Tối ưu hóa Hàm mục tiêu
Trang 15trong đó e k i w k i y k i và Q R là các ma trận đối xứng xác định dương tùy chọn ,
Khâu tối ưu hóa là khâu thực thi bài toán tối ưu (1.2) nhờ một phương pháp tối ưu hóa
cụ thể Trong số các giá trị tín hiệu điều khiển tối ưu tìm được trong cửa sổ dự báo hiện tại:
Nếu bài toán điều khiển dự báo nêu trên có thêm điều kiện ràng buộc cho tín hiệu điều khiển u , tức là bài toán tối ưu (1.2) có ràng buộc k U , thì người ta gọi đó là điều khiển dự báo
bị ràng buộc, ngược lại nó sẽ được gọi là bài toán điều khiển không ràng buộc
Bên cạnh đó, người ta còn phân biệt thêm giữa điều khiển dự báo tuyến tính và điều khiển dự báo phi tuyến Với điều khiển dự báo tuyến tính thì mô hình toán học được sử dụng
để dự báo động học của đối tượng là tuyến tính cũng như các điều kiện ràng buộc về trạng thái và tín hiệu vào/ra là các tập lồi, thường cho dưới dạng các bất đẳng thức tuyến tính; đồng thời hàm mục tiêu cần được tối thiểu hóa là hàm toàn phương Nếu một trong các giả thiết trên không được thỏa mãn thì ta gọi đó là bài toán điều khiển dự báo phi tuyến [21]
Với ưu điểm nổi trội là điều khiển được những hệ thống (quá trình) có các ràng buộc về tín hiệu điều khiển (và còn có thể cả về trạng thái) nên ngay sau khi xuất hiện bộ điều khiển
dự báo đầu tiên do các kỹ sư công ty dầu khí Shell giới thiệu năm 1977, điều khiển dự báo đã
Trang 16được nghiên cứu, phát triển rất nhanh Điểm qua ta có thể thấy chỉ trong một thời gian rất ngắn, đã có khá nhiều phiên bản khác nhau của điều khiển dự báo được ra đời [45], chẳng hạn
như thuật toán điều khiển theo mô hình (Model Algorithmic Control - MAC), phương pháp
ma trận động học điều khiển (Dynamic Matrix Control - DMC), phương pháp điều khiển dự báo tổng quát (Generalized Predictive Control - GPC), điều khiển dự báo thích nghi khoảng rộng (Long Range Predictive Control - LRPC) của De Keyser năm 1988, bộ điều khiển dự
báo bền vững của Garcia năm 1989, điều khiển dự báo khoảng trượt với cực tiểu hóa hàm
mục tiêu toàn phương (receding horizon predictive control) của Scattolini và Clarke năm
1991, điều khiển dự báo khoảng rộng toàn phương (Long Range Quadratic Programming - LRQP) của Sandoz năm 2000, điều khiển dự báo có ràng buộc (constrained predictive control) của Grim năm 2003, hay điều khiển dự báo nhiều chiều có ràng buộc cho tín hiệu đầu
vào của Warren và Marlin năm 2006, Một tổng quan tương đối đầy đủ về các phương pháp điều khiển dự báo tuyến tính này đã được nghiên cứu sinh trình bày trong tài liệu [4]
Tuy nhiên, có thể thấy các phương pháp điều khiển dự báo nêu trên đều tập trung chủ yếu cho bài toán điều khiển dự báo tuyến tính, trong khi các đối tượng trong thực tế đều ít nhiều mang tính phi tuyến và hàm mục tiêu thường không ở dạng toàn phương cũng như các ràng buộc thường gặp là phi tuyến Bởi vậy, điều khiển dự báo hệ phi tuyến đã được đặc biệt quan tâm và nghiên cứu nhiều trong những năm gần đây Đó cũng chính là một trong những
động cơ thúc đẩy nghiên cứu đề tài "Điều khiển dự báo phản hồi đầu ra theo nguyên lý tách cho hệ phi tuyến" của luận án
1.1.2 Các hướng nghiên cứu của luận án
Để thực hiện đề tài "Điều khiển dự báo phản hồi đầu ra theo nguyên lý tách cho hệ phi tuyến", luận án đã đặt ra hai hướng nghiên cứu chính, gồm:
Xây dựng bộ điều khiển dự báo phản hồi đầu ra cho hệ phi tuyến trên cơ sở sử dụng bộ quan sát trạng thái và khảo sát tính ổn định của hệ thu được
Sử dụng hàm mục tiêu có cấu trúc biến đổi trong việc xây dựng bộ điều khiển dự báo phản hồi trạng thái nhằm mở rộng tính linh hoạt của bộ điều khiển và hơn nữa là có thể chuyển được bài toán điều khiển có điều kiện ràng buộc cho tín hiệu điều khiển cũng như trạng thái về thành bài toán không ràng buộc
A) Về phản hồi đầu ra
Thứ nhất là về hướng điều khiển phản hồi đầu ra Mặc dù phát triển nhanh, song phần lớn các đóng góp mang tính lý thuyết của điều khiển dự báo hệ phi tuyến đều dựa trên giả thiết phải có đầy đủ thông tin về trạng thái bên trong của hệ Giả thiết này thường không được thỏa mãn trong thực tế, do không thể đo được tất cả các biến trạng thái của đối tượng [21, 38] Một giải pháp cho vấn đề này là sử dụng một bộ quan sát trạng thái để ước lượng các biến trạng thái của đối tượng từ các tín hiệu vào/ra đo được rồi sau đó áp dụng các phương pháp điều khiển dự báo phản hồi trạng thái đã có, hay nói cách khác là chuyển bài toán phản hồi
Trang 17trạng thái thành bài toán phản hồi đầu ra [9] Tất nhiên, vẫn có những công trình nghiên cứu
về điều khiển dự báo sử dụng phản hồi đầu ra trực tiếp mà không cần đến thông tin về trạng thái bên trong của hệ, chẳng hạn [25, 43], song các phương pháp hiện có vẫn bộc lộ những hạn chế về phương pháp luận và phạm vi ứng dụng
Với những lý do trên, luận án sẽ tập trung giải quyết bài toán quan sát trạng thái và bài toán điều khiển dự báo phản hồi đầu ra dựa trên quan sát trạng thái cho hệ phi tuyến
Hơn thế nữa, các phương pháp điều khiển phản hồi đầu ra dựa trên quan sát trạng thái cho các hệ phi tuyến nói chung và các hệ điều khiển dự báo nói riêng đều phải chỉ ra tính ổn định của hệ kín dựa trên nguyên lý tách Thậm chí, các phương pháp điều khiển dự báo hệ tuyến tính cũng không đương nhiên thỏa mãn nguyên lý tách do sự có mặt của các điều kiện ràng buộc [21]
Theo các tài liệu [21, 48] thì tính thỏa mãn nguyên lý tách có thể được chứng minh dựa trên ba xu hướng thiết kế sau:
1 Tách (separation): Với xu hướng này, bộ điều khiển dự báo phản hồi trạng thái tĩnh vả bộ
quan sát trạng thái được thiết kế độc lập với nhau và việc ghép chung bộ điều khiển và bộ quan sát này sẽ đảm bảo cho hệ kín ổn định
2 Bộ điều khiển tách (controller separation): Bộ điều khiển dự báo phản hồi trạng thái tĩnh
được thiết kế trước Sau đó chọn một bộ quan sát thích hợp để khi ghép chung nó với bộ điều khiển đã có thì hệ kín sẽ ổn định
3 Bộ quan sát tách (observer separation): Bộ quan sát trạng thái được thiết kế trước Sau đó
chọn một bộ điều khiển dự báo phản hồi trạng thái tĩnh thích hợp sao cho khi ghép chung
nó với bộ quan sát đã có thì hệ kín sẽ ổn định
Việc lựa chọn một trong ba xu hướng thiết kế nêu trên nhằm tạo ra tính ổn định cho hệ thống điều khiển dự báo phản hồi đầu ra theo nguyên lý tách cũng chính là một trong những
động cơ thúc đẩy đề tài
B) Về hàm mục tiêu có cấu trúc biến đổi
Thứ hai là về khả năng chuyển bài toán điều khiển dự báo có ràng buộc thành bài toán điều khiển dự báo không ràng buộc nhờ sử dụng hàm mục tiêu có cấu trúc biến đổi
Xét lại hàm mục tiêu (1.3), nay được viết lại thành:
Trang 18pháp quy hoạch phi tuyến, thì nghiệm U* có thể chỉ mới là điểm cực trị của J( )U , chứ chưa phải nghiệm đúng của (1.2)
Để tìm nghiệm toàn cục của (1.2), ta cần tới phương pháp điều khiển tối ưu, chẳng hạn như phương pháp biến phân, hoặc quy hoạch động của Bellman [3], song các công thức tường minh xác định U* theo phương pháp điều khiển tối ưu này lại mới chỉ dừng lại cho trường hợp không ràng buộc, do đó không thể áp dụng được khi bài toán điều khiển dự báo có thêm các điều kiện ràng buộc cho tín hiệu điều khiển u hoặc trạng thái k x k
Tuy nhiên, nếu nhìn lại cấu trúc hàm mục tiêu (1.4) ta sẽ thấy:
Khi R càng lớn, sự tham gia của thành phần UTRU trong hàm mục tiêu J( )U càng cao, kéo theo khi có được J( )U min, giá trị của U sẽ càng giảm Điều đó đồng nghĩa với việc càng tăng R , điều kiện ràng buộc:
Tất nhiên ta càng không thể vừa tăng R vừa tăng Q , vì như vậy tương quan về sự tham gia của hai thành phần UTRU và ETQ trong E J( )U sẽ không thay đổi
Bởi vậy một ý tưởng dung hòa xuất hiện ở đây là ngay ban đầu (khi k nhỏ) ta chọn R
đủ lớn để có U đủ nhỏ sao cho với nó có được điều kiện ràng buộc (1.5) Khi điều kiện ràng buộc (1.5) đã được thỏa mãn, ta sẽ giảm R để thông qua đó làm tăng thêm sự tham gia của thành phần sai lệch bám ETQ trong E J( )U nhằm làm giảm sai lệch bám sau này Tương tự ta cũng có thể chọn Q đủ nhỏ ban đầu, sau đó tăng dần Q theo k
Với hai trường hợp thay đổi hai ma trận R hay Q theo thời gian k như trên, hàm mục tiêu gốc ban đầu (1.4) trở thành:
Trang 19Với hàm mục tiêu (1.7) có cấu trúc hàm g k i (e k i ,u k i ) dưới dấu tổng thay đổi theo k một cách thích hợp, thì thay vì tìm nghiệm bài toán tối ưu có ràng buộc (1.2), nghiệm bài toán tối
ưu không ràng buộc:
* arg min ( )J
được tìm nhờ các phương pháp điều khiển tối ưu (chẳng hạn nhờ các công thức nghiệm tường minh của biến phân hay quy hoạch động) cũng sẽ vẫn thỏa mãn điều kiện ràng buộc (1.5) của bài toán điều khiển dự báo
Cuối cùng ta cũng cần lý giải cho việc sử dụng hàm mục tiêu có cấu trúc biến đổi (1.7) thay cho hàm mục tiêu cố định (1.3) có làm mất đi tính tối ưu của bài toán hay không Câu trả lời ở đây là mục đích của điều khiển dự báo luôn là đảm bảo chất lượng điều khiển đặt ra (chẳng hạn điều khiển bám với ràng buộc cho trước), chứ không phải là điều khiển tối ưu, tức
là ở điều khiển dự báo ta có thể sử dụng nhiều hàm mục tiêu khác nhau, miễn rằng chúng đảm bảo được chỉ tiêu chất lượng ban đầu Do đó việc sử dụng hàm mục tiêu có cấu trúc biến đổi (1.7), tuy rằng không còn là bài toán tối ưu thuần túy, song lại đáp ứng được yêu cầu chất lượng của điều khiển dự báo Bởi vậy việc sử dụng hàm mục tiêu có cấu trúc biến đổi không ảnh hưởng tới nhiệm vụ của điều khiển dự báo
Như vậy, với việc sử dụng hàm mục tiêu có cấu trúc biến đổi (1.7), luận án đặt ra nhiệm
vụ là cần phải xác định những giả thiết cần thiết cho hàm g k i (e k i ,u k i ) dưới dấu tổng, sao cho những kết quả đã có của điều khiển dự báo với hàm mục tiêu cố định vẫn đúng khi sử
dụng hàm mục tiêu có cấu trúc biến đổi (1.7) Nói cách khác, luận án đặt ra nhiệm vụ là phải xác định điều kiện đủ cho tính ổn định của hệ điều khiển dự báo phản hồi trạng thái có hàm mục tiêu có cấu trúc biến đổi
Để minh họa ý nghĩa việc thay thế hàm mục tiêu cố định (1.4) bằng hàm mục tiêu có tham số biến đổi (1.6) hoặc có cấu trúc biến đổi (1.7), nhằm chuyển bài toán điều khiển dự báo có ràng buộc thành bài toán không bị ràng buộc, từ đó sử dụng được các phương pháp tối
ưu động thay vì quy hoạch phi tuyến, ta xét ví dụ ứng dụng sau Đây cũng là một ứng dụng thực tế của phương pháp đề xuất trong luận án đã được nghiên cứu sinh trình bày trong tài liệu [1]
Ví dụ 1.1: Xét hệ truyền động qua một cặp bánh răng, mô tả bởi mô hình liên tục [1]:
góc ăn khớp của hai bánh răng, và cũng là đại lượng đánh giá khe hở giữa các bánh L
răng Khi hai bánh răng tiêu chuẩn và không có độ dịch tâm, thì góc ăn khớp
0
20
L
Với hệ có khe hở thì 18L25,
Trang 20 c là đại lượng đánh giá độ cứng của bánh răng Giá trị c càng nhỏ, độ mềm dẻo của
M là moment cản, bao gồm cả moment tải, c M là moment đặt ở đầu vào, d
M ms1,M ms2 là moment ma sát trong các ổ trục bánh răng,
r L1, r L2 là bán kính lăn tương ứng của hai bánh răng (bán kính ngoài),
11, 22 là vận tốc góc tương ứng của hai bánh răng,
i là tỷ số truyền từ bánh răng 1 sang bánh răng 2, tức là 12 2 i21 1 , i21i121
Dưới một số giả thiết bổ sung thêm [1], mô hình trên sẽ chuyển được về thành:
a a a
Trang 21Những kết quả mô phỏng ở các hình 1.2 và hình 1.3 một lần nữa cho thấy khi R giảm k
dần (đường nét liền), tín hiệu ra bám được theo tín hiệu đặt mà vẫn đảm bảo thỏa mãn điều kiện ràng buộc của tín hiệu điều khiển u k 30 Trong khi đó nếu giữ nguyên R k const(đường nét gạch) thì R phải được chọn đủ nhỏ nhằm tạo ra tín hiệu điều khiển đủ lớn mới có k
thể đưa hệ thống bám được tín hiệu đặt Điều này dẫn đến việc ở những thời điểm đầu tiên, điều kiện ràng buộc của u bị vi phạm k
Trang 220 1 2 3 4 5 6 7 8 0
0.2 0.4 0.6 0.8 1 1.2
Hình 1.2: Tín hiệu ra y khi R k const và biến đổi
-40 -20 0 20 40 60 80 100
Hình 1.3: Tín hiệu điều khiển u khi R k const và biến đổi
Trang 230 1 2 3 4 5 6 7 8 0
0.2 0.4 0.6 0.8 1 1.2
Hình 1.4: Tín hiệu ra y ứng với của sổ dự báo khác nhau
-10 0 10 20 30
Hình 1.5: Tín hiệu điều khiển u khi R k và cửa sổ dự báo thay đổi
Ngoài ra, ưu điểm của việc sử dụng hàm mục tiêu có tham số biến đổi so với hàm mục tiêu có tham số cố định còn được thể hiện qua kết quả mô phỏng ở các hình 1.4 và hình 1.5
Để không vi phạm điều kiện ràng buộc của u thì việc giữ nguyên k R k const lại không thể đem lại chất lượng bám tốt, kể cả khi tăng cửa sổ dự báo Cụ thể, ở hình 1.4 sai lệch bám của
hệ thống ứng với R k 10 ,2 N 50 (đường chấm gạch) tuy nhỏ hơn sai lệch bám ứng với
2
10 ,
k
R N 5 (đường nét gạch) nhưng vẫn không thể tốt bằng trường hợp R k 102 2k
và N 5 (đường nét liền) Mặt khác, hạn chế của việc tăng N là làm tăng khối lượng tính toán của bộ điều khiển trong một chu kỳ trích mẫu
Trang 24Nói cách khác, kết quả mô phỏng trên đã xác nhận một lần nữa khẳng định là thông qua việc thay đổi tham số Q k, R của hàm mục tiêu một cách thích hợp ta hoàn toàn vẫn có thể k
giữ nguyên được chất lượng điều khiển đặt ra ban đầu, song lại có thể chuyển bài toán thiết kế
bộ điều khiển dự báo có ràng buộc thành bài toán không bị ràng buộc
1.2 Những kết quả lý thuyết cơ bản
Như được đề cập ở mục 1.1, luận án đặt ra nhiệm vụ là phải xác định điều kiện đủ cho tính ổn định của hệ điều khiển dự báo phản hồi trạng thái và phản hồi đầu ra Do đó, trong
mục này, các kết quả lý thuyết về tính ổn định Lyapunov và ổn định ISS (Input-to-State Stability) cho hệ thống phi tuyến không liên tục sẽ được nhắc lại
1.2.1 Tính ổn định Lyapunov
Nói đến phân tích chất lượng động học hệ phi tuyến không thể không nhắc tới lý thuyết Lyapunov mà nền tảng của nó là khái niệm ổn định, ổn định tiệm cận Lyapunov cũng như tiêu chuẩn kiểm tra tính ổn định của hệ
Định nghĩa 1.1: Xét hệ phi tuyến tự trị (không bị kích thích), không dừng, cân bằng tại gốc tọa độ và có mô hình không bị kích thích:
1 ( , )
Khi đó hệ sẽ được gọi là:
a) Ổn định tại k , nếu với mọi 0 0 bao giờ cũng tồn tại ,k0 sao cho quỹ đạo trạng thái tự do x k f k,x0 của nó, tức là nghiệm của (1.9), với điều kiện đầu
Trang 25Định lý sau đây phát biểu tiêu chuẩn ổn định Lyapunov
Định lý 1.1 [27]: Xét hệ phi tuyến không bị kích thích và cân bằng tại gốc mô tả bởi (1.9) Ký hiệu V x,k là hàm trơn thỏa mãn:
a) Nếu W x k,k 0, x kO và k k0 thì hệ sẽ ổn định tại k 0
b) Nếu W x k,k3x k , x k O, k k0 và K thì hệ sẽ ổn định tiệm cận 3tại k với miền ổn định 0 O và khi đó V x k,k sẽ được gọi là hàm Lyapunov (Lyapunov function - LF)
c) Nếu hệ ổn định hoặc ổn định tiệm cận thì cũng sẽ có lim k, 0
trong đó d là tín hiệu bất định, tác động không mong muốn vào hệ Khái niệm này được k
hiểu như sau:
Định nghĩa 1.3: Xét hệ phi tuyến không dừng (1.10) cân bằng tại gốc, tức là:
Với định nghĩa như trên thì khi hệ bất định (1.10) là ổn định ISS, mọi quỹ đạo trạng thái
tự do của hệ, không phụ thuộc vào thành phần bất định d k tác động vào hệ, luôn tiến
về được một lân cận của gốc tọa độ O có kích thước (bán kính) là d k Như vậy, ta có thể thấy ngay được rằng trong trường hợp d không phải là tín hiệu bất định, mà lại là tín k
hiệu vào u của hệ, tức là: k
1 ( , , )
Trang 26thì khi (1.10) ổn định ISS, hệ (1.11) sẽ ổn định theo nghĩa đầu vào bị chặn, trạng thái của hệ cũng sẽ bị chặn, và:
1.2.3 Quy hoạch động của Bellman
Nguyên lý tối ưu của Bellman, phát biểu rằng: “Mọi đoạn cuối của quỹ đạo trạng thái tối ưu cũng là tối ưu”, được cụ thể hóa bằng định lý sau đây
Định lý 1.3 [27]: Xét bài toán quy hoạch động dạng chuẩn:
Đặc biệt là trong trường hợp này, “inf” trong (1.12) chính là “min”
Hệ quả sau đây của định lý 1.3 khẳng định rằng đoạn cuối của dãy giá trị tín hiệu điều khiển tối ưu cũng là tối ưu với trạng thái đầu và cửa sổ dự báo thích hợp
Trang 27Hệ quả 1.1 [27]: Nếu u0, ,u N1 là dãy giá trị tín hiệu điều khiển tối ưu ứng với trạng thái đầu x và cửa sổ dự báo 0 N 2, thì ứng với mỗi K 1, N 1, dãy
ta có định lý về tính ổn định của hệ kín như sau
Định lý 1.4 [27]: Xét bài toán điều khiển tối ưu (1.13) cho hệ thống được mô tả bởi:
Trang 28CHƯƠNG 2: TỔNG QUAN VỀ ĐIỀU KHIỂN DỰ BÁO
PHẢN HỒI ĐẦU RA DỰA TRÊN QUAN SÁT TRẠNG THÁI
Để làm rõ được đóng góp mới của luận án, chương này sẽ tổng kết các kết quả đã có của điều khiển dự báo phản hồi đầu ra dựa trên quan sát trạng thái bao gồm ở cả hệ tuyến tính
và hệ phi tuyến Với mỗi một phương pháp, tính ổn định của hệ ghép giữa bộ điều khiển dự báo phản hồi trạng thái với bộ quan sát trạng thái sẽ được trình bày trong mối liên hệ với ba
xu hướng thiết kế theo nguyên lý tách như đã được nêu lên ở mục 1.1 Ưu điểm và hạn chế của các phương pháp hiện có cũng như các đóng góp của luận án sẽ được bàn đến ở cuối chương
2.1 Điều khiển dự báo phản hồi đầu ra dựa trên quan sát trạng
thái cho hệ tuyến tính
Có thể nói, tất cả các đối tượng (quá trình) trên thực tế đều là các hệ phi tuyến Tuy nhiên nếu mô hình toán học của những đối tượng (quá trình) phi tuyến này có thể được tuyến tính hóa xung quanh các điểm làm việc hoặc tuyến tính hóa dọc theo quỹ đạo trạng thái của hệ thì các phương pháp điều khiển dự báo tuyến tính vẫn có thể được áp dụng, đặc biệt là các phương pháp điều khiển mang tính bền vững Do đó, mục này của luận án sẽ tập trung vào trình bày một số kết quả tiêu biểu của điều khiển dự báo bền vững cho hệ tuyến tính trong đó
mô hình toán học của đối tượng hoặc là mô hình tuyến tính bất định có các tham số nằm trong
một siêu diện (polytope) [53], hoặc là mô hình tuyến tính có nhiễu trạng thái và nhiễu đầu ra
tuyến (off-line) một bộ điều khiển dự báo bền vững phản hồi trạng thái và một bộ quan sát trạng thái tựa Luenberger sử dụng các bất đẳng thức ma trận tuyến tính (Linear Matrix Inequalities - LMIs) Do bộ điều khiển được thiết kế ngoại tuyến, tức là một dãy các ma trận
trạng thái của bộ điều khiển được tính toán sẵn trước khi chúng được lựa chọn để thực thi cho đối tượng, nên ta có thể phân tích tính ổn định bền vững của các luật điều khiển này khi kết
Trang 29hợp chúng với bộ quan sát (cũng được thiết kế ngoại tuyến) Vì vậy, phương pháp này được gọi là điều khiển dự báo phản hồi đầu ra theo nguyên lý tách (xu hướng 1)
Xét các hệ tuyến tính không dừng được mô tả bởi:
A và B k có chứa các tham số thay đổi theo thời gian
Giả sử thời điểm hiện tại là thời điểm k Sau đây, x k i và u k i lần lượt ký hiệu các vector trạng thái và vector tín hiệu vào của hệ bất định (2.1), được dự báo cho thời điểm ki
trong tương lai Hàm mục tiêu cần cực tiểu hóa có dạng toàn phương với miền dự báo vô hạn, là:
Trang 30A B0, 0 Biểu thức (2.4) của bộ quan sát trạng thái tựa Luenberger chứa một thành phần hiệu chỉnh để đảm bảo tính ổn định của bộ quan sát Ma trận quan sát L p được thiết kế sao cho sai lệch quan sát sẽ đơn điệu giảm và được xác định từ một hệ số suy giảm tốc độ
0 cho trước 1
Với hệ thống phản hồi đầu ra theo nguyên lý tách (xu hướng 1), bộ điều khiển dự báo phản hồi trạng thái và bộ quan sát trạng thái được thiết kế độc lập với nhau
1 Bước 1 Chọn các tham số thiết kế Q và R của bộ điều khiển, thành lập bảng tra
G F i, i,i 1, ,N c bằng cách thực hiện các bước sau với giá trị trạng thái khởi tạo x 1
a) Tính nghiệm i,G X Y i, i, i và Z ứng với i x của bài toán tối ưu lồi i
b) Nếu i N c, chọn một giá trị trạng thái x i 1 thỏa mãn x i1G i1x i11 Gán i i 1
và quay lại bước a)
2 Bước 2 Chọn các tham số thiết kế của bộ quan sát Tính ma trận quan sát L p G Y1
trong đó G và Y thỏa mãn:
2
0 0
G QA Y C G
Trang 31Định lý 2.1 [53]: Xét hệ tuyến tính bất định (2.1) với các điều kiện ràng buộc (2.2)
Phần ngoại tuyến: lặp lại các bước 1 và 2 cho đến khi bộ điều khiển và bộ quan sát trạng thái được thiết kế thỏa mãn tiêu chuẩn ổn định bền vững ở bước 3
Phần trực tuyến: cho trước giá trị trạng thái ước lượng k
x tại thời điểm k được tính toán
Về tính chất ổn định định bền vững của phương pháp vừa được đề cập ta có thể hiểu như sau Nếu ký hiệu sai lệch quan sát là:
Trang 32đường tròn đơn vị, hệ kín phản hồi đầu ra sẽ ổn định tiệm cận Tuy nhiên khái niệm có giá trị riêng nằm đủ gần gốc của A0L C p là không rõ ràng, nhất là khi phải chọn trước các điểm cực đó, nên phương pháp trình bày trong [53] đã không đi theo hướng thiết kế L p gán điểm cực của Luenberger, mà thay vào đó là thiết kế theo LMIs như đã trình bày ở trên Với phương pháp thiết kế LMIs này, sai lệch quan sát e sẽ tiến về gốc tọa độ với tốc độ đủ k
nhanh để đảm bảo sẽ có được tính ổn định hệ kín mà không cần để ý tới sai lệch x u k, ktrong mô hình (2.6)
Một phương pháp thiết kế bộ điều khiển dự báo phản hồi đầu ra tương tự với phương pháp nói trên được đề cập trong [20] Các phương pháp điều khiển dự báo tuyến tính bền vững này có thể áp dụng cho một số đối tượng (quá trình) phi tuyến bằng cách xấp xỉ chúng
về hệ tuyến tính đa mô hình (2.1) Tuy nhiên, chất lượng của hệ kín có thể giảm do sai lệch tuyến tính hóa gây ra
2.1.2 Điều khiển dự báo bền vững hệ tuyến tính sử dụng bộ quan sát Moving
Horizon
Khác với xu hướng thiết kế độc lập bộ điều khiển phản hồi trạng thái và bộ quan sát trạng thái như ở [53] thì các kết quả được công bố trong [38, 51] lại đại diện cho nhóm phương pháp thiết kế bộ quan sát trạng thái trước rồi đưa sai lệch quan sát vào bài toán thiết
kế bộ điều khiển dự báo Nói cách khác, đây là xu hướng thiết kế bộ điều khiển dự báo phản hồi đầu ra theo nguyên lý quan sát tách (xu hướng 3) Một trong các bộ quan sát thích hợp cho
xu hướng thiết kế này là bộ quan sát Moving Horizon [51] mà với nó, sai lệch quan sát sẽ hội
tụ và bị giới hạn trong một tập bất biến Khi cửa sổ quan sát trượt dọc theo trục thời gian thì tập bất biến sẽ nhỏ dần và nếu bộ điều khiển dự báo phản hồi đầu ra làm cho giá trị ước lượng
từ bộ quan sát tiến về lân cận gốc tọa độ thì sẽ kéo theo trạng thái thực của hệ cũng sẽ tiến về lân cận gốc tọa độ, tức là hệ kín sẽ ổn định Sau đây ta cũng sẽ trình bày tóm tắt các kết quả trong [38, 51]
Xét hệ tuyến tính chịu ảnh hưởng của nhiễu trạng thái bị chặn và nhiễu đo đầu ra, được
mô tả bởi mô hình trạng thái:
Trang 33Bộ quan sát Moving Horizon được sử dụng để ước lượng trạng thái của hệ tại thời điểm
k , ký hiệu là k
x , dựa trên hữu hạn các số liệu đo của tín hiệu vào và ra trong khoảng thời
gian [kM k, ) trong đó M 0 được gọi là cửa sổ quan sát Tại thời điểm k 1 tiếp theo, các
số liệu đo mới được cập nhật đồng thời các số liệu đo cũ nhất bị loại ra khỏi cửa sổ quan sát,
và bộ quan sát sẽ lại tính ra k 1
x dựa trên các số liệu đo này Cứ như vậy ta có thể quan sát được trạng thái của hệ cùng với việc trượt cửa sổ quan sát dọc theo trục thời gian Cụ thể, để
có được giá trị trạng thái ước lượng k
x tại thời điểm hiện tại k thì từ dãy các giá trị đã đo được y k M ,,y k1,u k M ,,u k1, ta phải giải bài toán tối thiểu hóa hàm mục tiêu:
để tìm nghiệm tối ưu k M
x và từ đó thu được dãy các giá trị trạng thái ước lượng
ưu của vòng trước
trong đó A là ma trận Shur và L là sai lệch sinh ra bởi nhiễu k w và k v k
Luật điều khiển dự báo gồm thành phần truyền thẳng và thành phần phản hồi trạng thái
Trang 34trong đó P P T 0, Q Q T 0, R R T 0 là các ma trận trọng số được chọn trước và
tức là trạng thái quan sát được k
x luôn nằm trong một đường ống bị chặn (tube) có tâm là
quỹ đạo trạng thái hệ danh định x và tiến về miền hấp dẫn k , cũng như sai lệch quan sát x kluôn nằm trong tập S và tiến về chỉ phụ thuộc vào w và k v Ký hiệu k là tổng Minkowski theo nghĩa nếu S Rn và Rn thì S xxS,
Nhận xét trên cũng đã được phát biểu trong định lý sau của tài liệu [38] Định lý này đã khẳng định tính ổn định bền vững của hệ điều khiển dự báo phản hồi đầu ra dựa trên bộ quan sát trạng thái Moving Horizon cho lớp hệ (2.7)
Định lý 2.2 [38]: Ký hiệu X là tập các giá trị của x mà với chúng dãy tín hiệu điều khiển 0
danh định U tồn tại Giả sử tập X bị chặn Khi đó, (i) tập là ổn định hàm mũ bền
Trang 35vững của hệ ghép k1A k B k k,
x x u x xk1A L k x với miền hấp dẫn X k
trong đó X X
và, (ii) bất kỳ trạng thái đầu 0 0 0
được đưa về theo dạng hàm mũ đồng thời thỏa mãn các điều kiện ràng buộc
về trạng thái và tín hiệu điều khiển
Rõ ràng với phương pháp thiết kế này, sai lệch quan sát được coi như là một thành phần bất định bị chặn mà nó được tính đến trong bộ điều khiển bền vững [10] Vì vậy, phương pháp này thuộc nhóm các phương pháp điều khiển dự báo phản hồi đầu ra theo nguyên lý quan sát tách (xu hướng 3) Ngoài ra, một số kết quả khác đi theo xu hướng 3 này cũng đã được công bố trong [12, 18, 33]
Để áp dụng các phương pháp thiết kế bộ điều khiển dự báo tuyến tính bền vững này sang cho các đối tượng (quá trình) phi tuyến thì ta có thể tuyến tính hóa hệ phi tuyến tại điểm làm việc và coi sai lệch mô hình là nhiễu tác động lên hệ Tất nhiên, việc xấp xỉ tuyến tính hóa sẽ ảnh hưởng đến chất lượng điều khiển của hệ kín
2.2 Điều khiển dự báo phản hồi đầu ra dựa trên quan sát trạng
thái cho hệ phi tuyến
Như trên đã đề cập, các hệ thống thực tế đều là các hệ phi tuyến và điều khiển dự báo tuyến tính bền vững về mặt lý thuyết có thể áp dụng cho một số đối tượng (quá trình) phi tuyến, nếu như các đối tượng (quá trình) phi tuyến này có thể xấp xỉ tuyến tính được Tuy nhiên, các phương pháp điều khiển dự báo trực tiếp cho hệ phi tuyến hứa hẹn khả năng đem lại chất lượng hệ kín tốt hơn so với điều khiển dự báo bền vững cho hệ tuyến tính Liên quan đến bài toán phản hồi đầu ra sử dụng bộ quan sát trạng thái, một số kết quả tiêu biểu của điều khiển dự báo cho hệ phi tuyến có thể được liệt kê như [23, 39, 49] Trong tất cả các phương pháp này, bộ điều khiển dự báo phản hồi trạng thái và bộ quan sát trạng thái được thiết kế độc lập với nhau nhưng vẫn đảm bảo được tính ổn định của hệ kín khi có sai lệch quan sát, nhờ tận dụng tính bền vững vốn có của bộ điều khiển dự báo Do đó, các phương pháp này thuộc nhóm phương pháp điều khiển phản hồi đầu ra dựa trên nguyên lý tách (xu hướng 1) và được trình bày tóm tắt dưới đây
2.2.1 Điều khiển dự báo hệ phi tuyến sử dụng bộ quan sát High Gain
Tài liệu [23] xét các đối tượng (quá trình) phi tuyến được mô tả bởi mô hình trạng thái liên tục:
Trang 36Ký hiệu các thời điểm lấy mẫu là t , với i t i t i1T a, T là chu kỳ trích mẫu thì bài a
toán điều khiển tối ưu phải giải tại mỗi thời điểm t là: i
i p p
Tư tưởng cơ bản của phương pháp thiết kế bộ điều khiển dự báo phản hồi đầu ra cho
hệ (2.12) nêu trong [23] là thiết kế bộ điều khiển phản hồi trạng thái không liên tục có tính bền vững với nhiễu, sau đó thiết kế bộ quan sát trạng thái với sai lệch quan sát đủ nhỏ để có
thể coi nó là nhiễu tác động lên hệ kín Khi đó chất lượng ổn định thực (practical stability)
của hệ kín vẫn được đảm bảo nếu ta ghép chung bộ điều khiển phản hồi trạng thái với bộ quan sát trạng thái, cho dù chúng được thiết kế độc lập với nhau Khái niệm ổn định thực được hiểu
là ổn định theo nghĩa Lyapunov trong đó quỹ đạo trạng thái luôn tiến về một miền hấp dẫn đủ nhỏ chứa gốc tọa độ Tuy tài liệu [23] không chỉ rõ một bộ điều khiển phản hồi trạng thái ổn định hóa nào cụ thể nhưng các tác giả đã đưa ra các điều kiện chung cho bộ điều khiển này như sau
Giả thiết 2.1 [23]: Tồn tại một miền R X Rn với 0R để có:
1) Hàm F R U: R là liên tục, thỏa mãn F0 0, 0 và bị chặn dưới bởi một hàm
F
K sao cho: F x u Fx u, , x u, R U
2) Luật điều khiển tối ưu u( ; ) x là liên tục từng đoạn và Lipschitz địa phương theo x
trong R , đều theo Tức là, với một tập compact R cho trước
u( , x1)u( , x2) L u x1x2 , 0,T p, x x1, 2 ,
trong đó L là hệ số Lipschitz của u u( , ) x (là hàm số của x ) trong
3) Hàm giá trị, được định nghĩa là giá trị tối ưu của hàm mục tiêu với mỗi xR,
( , ),
V x J u x x là Lipschitz với mọi tập con compact của R và V 0 0,
0
V x với mọi xR 0
Trang 374) Dọc theo quỹ đạo trạng thái bắt đầu từ thời điểm lấy mẫu t tại i x t i R, hàm giá trị thỏa mãn
Những bộ điều khiển dự báo phản hồi trạng thái không liên tục thỏa mãn giả thiết 2.1
kể trên vốn mang trong nó tính bền vững với nhiễu, tính chất này được dựa trên các kết quả của điều khiển phản hồi không liên tục thông qua khối trích mẫu và giữ mẫu tín hiệu [31] Do
đó khi chuyển thành bộ điều khiển dự báo phản hồi đầu ra sử dụng bộ quan sát trạng thái để ước lượng trạng thái thực của hệ thì nếu coi sai lệch quan sát là nhiễu nhỏ tác động lên hệ kín,
ta vẫn có được tính ổn định thực của cả hệ Cũng từ đây, các tác giả đã đưa ra điều kiện cho
bộ quan sát là sau một khoảng thời gian kể từ thời điểm đầu, sai lệch quan sát tại các thời điểm trích mẫu được điều chỉnh đủ nhỏ, tức là:
Giả thiết 2.2 [21]: Với bất kỳ sai lệch quan sát lớn nhất mong muốn emax , tồn tại các 0
tham số của bộ quan sát sao cho:
t i t i emax, t i k conv a T
trong đó k conv 0 được chọn trước tùy ý
Một trong những bộ quan sát thỏa mãn giả thiết 2.2 là bộ quan sát High Gain với giả thiết hệ (2.12) là quan sát đều hoàn toàn [23] Giả sử tồn tại phép đổi trục tọa độ H x, u trong đó:
Trang 38với giả thiết
bị chặn là một xấp xỉ của và có thể được suy ra từ ;
, 1i , 1i , , 1i r i
T i
s s s i p
là Hurwitz Sau khi có được t i
là trạng thái ước lượng của đối tượng trong tọa độ được
tính ở thời điểm t thì trạng thái ước lượng của đối tượng (2.12) trong hệ tọa độ ban đầu ở i
thời điểm t sẽ được cho bởi i
Trang 39lân cận trong một khoảng thời gian hữu hạn và không ra khỏi lân cận đó [21, 22, 23] Các khẳng định trên được phát biểu thành định lý sau đây
Định lý 2.3 [23]: Cho các tập compact tùy ý Q Rn và S R Khi đó, với số thực bất kỳ
0
, tồn tại một hằng số T a sao cho với 0T a T a, tồn tại một số thực sao 0
cho với 0 , và tất cả x0,0 S Q , các quỹ đạox t , t sẽ bị chặn và sau một khoảng thời gian hữu hạn sẽ hội tụ đến tập x, , và x t R , t 0
Ngoài bộ quan sát High Gain nói trên thì bộ quan sát Moving Horizon trong [39] cũng thỏa mãn giả thiết 2.2 và do đó nó có thể được kết hợp với bộ điều khiển dự báo phản hồi trạng thái để có được tính ổn định thực của hệ kín
Hạn chế của phương pháp sử dụng bộ quan sát High Gain là chưa có cơ sở để chỉ ra một phép đổi trục để chuyển được hệ phi tuyến dạng bất kỳ (2.12) về dạng chuẩn (2.14)
2.2.2 Điều khiển dự báo hệ phi tuyến sử dụng bộ quan sát mở rộng
Trong tất cả các phương pháp kể trên, khái niệm ổn định của hệ thống điều khiển dự báo phản hồi trạng thái cũng như phản hồi đầu ra đều được hiểu theo nghĩa ổn định Lyapunov, tức là theo thời gian quỹ đạo trạng thái tự do của hệ kín (ứng với tín hiệu đặt bằng
0) sẽ tiến về (lân cận) gốc tọa độ Để chỉ ra được khả năng bám tín hiệu đặt khác 0 của quỹ
đạo trạng thái của hệ kín, gọi tắt là tính bám ổn định, thì người ta thường dựa vào khái niệm
ổn định ISS [8,2] Với khái niệm ổn định ISS này (tín hiệu vào bị chặn sẽ kéo theo trạng thái cũng bị chặn với độ lớn tỷ lệ theo giá trị bị chặn ở đầu vào) thì hiển nhiên mọi hệ ISS cũng sẽ
ổn định Lyapunov, song điều ngược lại thì không [2]
Nhiều tác giả, chẳng hạn như [22, 23, 37] đã khảo sát tính ổn định bền vững của hệ kín phản hồi đầu ra bao gồm đối tượng phi tuyến không liên tục dạng chuẩn:
Trang 40bằng giả thiết sự tồn tại của phép đổi biến H chuyển (2.16) về thành (2.15)
Tuy nhiên, trong các tài liệu tham khảo nêu trên đều bỏ qua việc khảo sát sự tồn tại của phép đổi biến H này cũng như thuật toán xác định H nếu nó tồn tại Điều này là cần thiết vì chỉ có như vậy các kết quả nghiên cứu về tính ổn định ISS cho hệ chuẩn (2.15) mới có thể đi được vào ứng dụng cho hệ phi tuyến tổng quát (2.16)
Dựa trên kết quả nêu trong [35] về khả năng tồn tại của một phép đổi biến không nhân quả:
Xét các đối tượng (quá trình) phi tuyến danh định được mô tả bởi mô hình trạng thái không liên tục (2.18), trong đó x kX Rn, u kU Rm và y kRp lần lượt là vector trạng thái, vector tín hiệu vào và vector tín hiệu ra của hệ X và U là các tập ràng buộc của trạng thái và tín hiệu vào, được giả thiết là các tập compact và chứa gốc tọa độ bên trong
Do trạng thái ước lượng được từ bộ quan sát sẽ được đưa tới bộ điều khiển dự báo mà trạng thái ước lượng này chứa trong nó sai lệch quan sát nên các tác giả trong [49] đề xuất sử dụng bộ điều khiển dự báo ổn định ISS với sai lệch quan sát Tín hiệu điều khiển được đưa đến đối tượng sẽ là phần tử đầu tiên của vector tín hiệu điều khiển dự báo
x x e với e là sai lệch quan sát k
Mặt khác, với giả thiết hệ (2.18) là quan sát đều thì tương tự với ý tưởng thiết kế bộ quan sát High Gain ở mục 2.2.1, cụ thể là sử dụng phép đổi biến để đưa hệ phi tuyến ban
đầu (2.12) về dạng chuẩn (2.14) thì ở đây, cũng thông qua một phép đổi biến phi nhân quả