DANH MỤC CÁC THUẬT NGỮ VÀ CHỮ VIẾT TẮT LQR: Linear Quadratic Regulator, Bộ điều chỉnh cho hệ tuyến tính với chỉ tiêu dạng toàn phương LQG: Linear Quadratic Gaussian, Bộ điều khiển cho hệ
Trang 1MỤC LỤC
DANH MỤC CÁC THUẬT NGỮ VÀ CHỮ VIẾT TẮT 3
DANH MỤC CÁC BẢNG 4
DANH MỤC CÁC HÌNH VẼ 5
MỞ ĐẦU 7
Chương 1 TỔNG QUAN 10
1.1 Các khái niệm trong điều khiển tích cực 10
1.2 Máy kích động và các phương thức điều khiển 12
1.2.1 Các loại máy kích động 12
1.2.2 Các phương thức sinh lực điều khiển 13
1.3 Ví dụ về các hệ điều khiển tích cực cỡ lớn trong thực tế 15
1.4 Tổng quan về các thuật toán điều khiển 20
1.5 Các nghiên cứu trong nước 24
1.6 Vấn đề đặt ra và được nghiên cứu trong luận án 24
Chương 2 BÀI TOÁN ĐIỀU KHIỂN KHÔNG HẠN CHẾ ĐO 27
2.1 Giới thiệu 27
2.2 Thuật toán điều khiển kinh điển LQR 27
2.2.1 Đặt bài toán 27
2.2.2 Lời giải tối ưu thực sự 29
2.2.3 Thuật toán điều khiển kinh điển LQR 32
2.3 Các hạn chế của thuật toán kinh điển LQR 33
2.3.1 Tính không hoàn toàn tối ưu 33
2.3.2 Khả năng khuyếch đại thời gian trễ 37
2.4 Đề xuất cải thiện thuật toán LQR bằng thuật toán hồi tiếp - dẫn tiếp 41
2.5 Đề xuất thuật toán nhận dạng kích động ngoài 47
2.6 Đề xuất cách xác định vị trí đặt lực tối ưu 50
Chương 3 BÀI TOÁN ĐIỀU KHIỂN KHÔNG HẠN CHẾ ĐẶT LỰC 56
3.1 Giới thiệu 56
3.2 Luật điều khiển dạng Kalman Bucy 56
Trang 23.2.1 Đặt bài toán 56
3.2.2 Luật điều khiển dạng Kalman Bucy 57
3.3 Hạn chế của luật điều khiển dạng Kalman Bucy 69
3.4 Đề xuất thuật toán nhận dạng kích động ngoài 71
3.5 Đề xuất cách xác định vị trí đặt đầu đo tối ưu 81
3.6 Đề xuất cải thiện điều khiển bằng thành phần dẫn tiếp 84
Chương 4 BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU PHẢN HỒI ĐẦU RA 91
4.1 Giới thiệu 91
4.2 Phương pháp tách 91
4.3 Thuật toán điều khiển tối ưu kinh điển LQG 93
4.4 Các phiên bản điều khiển nâng cao 105
4.4.1 Phiên bản điều khiển nâng cao 1 105
4.4.2 Phiên bản điều khiển nâng cao 2 106
4.4.3 Ví dụ 107
4.5 Ảnh hưởng của thời gian trễ 111
KẾT LUẬN 117
DANH MỤC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN LUẬN ÁN 119
TÀI LIỆU THAM KHẢO 120
PHỤ LỤC 131
Trang 3DANH MỤC CÁC THUẬT NGỮ VÀ CHỮ VIẾT TẮT
LQR: Linear Quadratic Regulator, Bộ điều chỉnh cho hệ tuyến tính
với chỉ tiêu dạng toàn phương LQG: Linear Quadratic Gaussian, Bộ điều khiển cho hệ tuyến tính
với chỉ tiêu dạng toàn phương và nhiễu ngẫu nhiên Gauss Feedforward: Dẫn tiếp, Điều khiển đầu vào
Feedback: Hồi tiếp, Phản hồi, Điều khiển đầu ra
FB-FF: Feedback-Feedforward, Điều khiển hồi tiếp - dẫn tiếp
AMD: Active mass damper, Thiết bị điều khiển tích cực khối lượng TMD: Tuned mass damper, Thiết bị giảm chấn khối lượng được điều
chỉnh (thụ động) RMS: Root mean square, Giá trị căn trung bình bình phương
Robustness: Tính bền vững, khả năng điều khiển mặc dù có sai số và sự bất
định của mô hình Observer: Bộ quan sát, phương trình dùng để phục hồi lại trạng thái của
hệ từ số liệu đo một phần trạng thái của hệ
Spillover: Hiện tượng điều khiển làm khuyếch đại các dạng riêng bậc cao,
gây mất ổn định Benchmark: Bài toán so sánh các thuật toán điều khiển trên cùng một kết
cấu đã được tiêu chuẩn hoá Sensor: Cảm biến, đầu đo
Actuator: Máy kích động, thiết bị sinh lực điều khiển
Trang 4DANH MỤC CÁC BẢNG
Bảng 2.1: Đáp ứng của ô tô với các bước sóng khác nhau của mặt đường 36
Bảng 2.2: Chỉ tiêu J u với các vị trí đặt lực khác nhau 54
Bảng 2.3: Chỉ tiêu tích phân J với các vị trí đặt lực khác nhau 55
Bảng 2.4: Đáp ứng với các vị trí đặt lực khác nhau 55
Bảng 3.1: Các giá trị riêng của hệ dầm đứng chịu tải trọng sóng 67
Bảng 3.2: Các giá trị riêng của điều khiển hệ dầm ngang 79
Bảng 3.3: Hiệu quả nhận dạng lực, trường hợp đo chuyển động tương đối 83
Bảng 3.4: Hiệu quả nhận dạng lực, trường hợp đo chuyển động tuyệt đối 84
Bảng 3.5 Đáp ứng RMS (cm) của chuyển dịch giữa dầm 90
Bảng 4.1: Đáp ứng với các trường hợp khác nhau của ma trận trọng số 101
Bảng 4.2: Kết quả mô phỏng số, cảm biến tại vị trí d m =l/2, nhiễu đo nhỏ 110
Bảng 4.3: Kết quả mô phỏng số, cảm biến tại vị trí d m =l/2, nhiễu đo lớn 110
Bảng 4.4: Kết quả mô phỏng số, cảm biến tại vị trí d m =l/4, nhiễu đo nhỏ 110
Bảng 4.5: Kết quả mô phỏng số, cảm biến tại vị trí d m =l/4, nhiễu đo lớn 111
Bảng 4.6: Đáp ứng khi chưa điều khiển 115
Bảng 4.7: Đáp ứng của hệ khi điều khiển bằng thuật toán LQG 115
Bảng 4.8: Đáp ứng của hệ khi điều khiển bằng thuật toán điều khiển nâng cao phiên bản 2 116
Trang 5DANH MỤC CÁC HÌNH VẼ
Hình 1.1: Sơ đồ khối của một hệ điều khiển tích cực 11
Hình 1.2: Phương thức tác động lực từ bên ngoài 13
Hình 1.3: Phương thức điều khiển qua chuyển động tương đối 14
Hình 1.4: Phương thức điều khiển nhờ lực quán tính 15
Hình 1.5: Kyobashi Seiwa Building và thiết bị AMD 16
Hình 1.6: Thiết bị AMD chính và AMD phụ 16
Hình 1.7: Yokohama Landmark Tower và AMD dạng con lắc 17
Hình 1.8: Sơ đồ cấu tạo của AMD 17
Hình 1.9: Applause Tower và sân bay dóng vai trò AMD 18
Hình 1.10: Ảnh chụp bộ đệm và máy kich động 18
Hình 1.11: Nanjing TV Tower, AMD dạng đai và máy kích động 19
Hình 1.12: Sơ đồ của AMD lắp tại Nanjing TV Tower 19
Hình 1.13: Shinjuku Park Tower và AMD dạng con lăn 20
Hình 2.1: Sơ đồ điều khiển LQR 33
Hình 2.2: Mô hình ô tô được điều khiển tích cực 34
Hình 2.3: So sánh lực điều khiển với các bước sóng khác nhau 37
Hình 2.4: Hệ trục toạ độ của máy bay 39
Hình 2.5: Đáp ứng của vận tốc v x và của góc nâng 41
Hình 2.6: Sơ đồ khối của điều khiển FB-FF 44
Hình 2.7: Kết cấu khung không gian 44
Hình 2.8: So sánh các đáp ứng của kết cấu khung 46
Hình 2.9: Sơ đồ thuật toán điều khiển FB-FF kết hợp với nhận dạng 49
Hình 2.10: Hệ thanh giằng tích cực giữa 2 tầng 52
Hình 3.1: Sơ đồ điều khiển dạng Kalman Bucy 57
Hình 3.2: Dầm thẳng đứng chịu tải trọng sóng 61
Hình 3.3: Chuyển dịch đỉnh (2 lần mô phỏng), =10-3 68
Hình 3.4: Chuyển dịch đỉnh (2 lần mô phỏng), =10-4 68
Trang 6Hình 3.5: Chuyển dịch đỉnh (2 lần mô phỏng), =10-5 68
Hình 3.6: Chuyển dịch đỉnh (2 lần mô phỏng), =10-3, thời gian trễ 0.08s 70
Hình 3.7: Chuyển dịch đỉnh (2 lần mô phỏng), =10-4, thời gian trễ 0.08s 70
Hình 3.8: Chuyển dịch đỉnh (2 lần mô phỏng), =10-5, thời gian trễ 0.08s 70
Hình 3.9: Sơ đồ nhận dạng lực từ biến đo 74
Hình 3.10: Kết cấu dầm ngang chịu tải dập dềnh của sóng 75
Hình 3.11: Phần thực và ảo của kích động thực và xấp xỉ, vị trí đo tại l/4 80
Hình 3.12: Phần thực và ảo của kích động thực và xấp xỉ, vị trí đo tại l/2 80
Hình 3.13: Phần thực và ảo của kích động thực và xấp xỉ, vị trí đo tại 3l/4 80
Hình 3.14: Sơ đồ điều khiển có bổ sung thành phần dẫn tiếp 87
Hình 3.15: Chuyển dịch giữa dầm , Iv=10-10 m2/s, v=510-4s 88
Hình 3.16: Chuyển dịch giữa dầm , Iv=10-12 m2/s, v=510-4s 89
Hình 3.17: Chuyển dịch giữa dầm , Iv=10-10 m2/s, v=2510-4s 89
Hình 3.18: Chuyển dịch giữa dầm , Iv=10-12 m2/s, v=2510-4s 89
Hình 4.1: Sơ đồ điều khiển LQG 94
Hình 4.2: Hệ dầm đứng chịu tải gió được điều khiển bởi AMD 95
Hình 4.3: Ăng ten parabol quan sát bầu trời 102
Hình 4.4: Góc phương vị của ăng ten 104
Hình 4.5: Hiệu điện thế điều khiển của mô tơ 104
Hình 4.6: Sơ đồ phiên bản điều khiển nâng cao 1 106
Hình 4.7: Sơ đồ phiên bản điều khiển nâng cao 2 107
Hình 4.8: Kết cấu dầm ngang được điều khiển 107
Hình 4.9: Kết cấu 8 tầng được điều khiển bằng AMD 112
Trang 7MỞ ĐẦU
Khi nhắc đến khái niệm “điều khiển”, có lẽ nhiều người sẽ công nhận rằng con người là một trong những hệ điều khiển hoàn hảo nhất Con người có các tri giác nhanh nhạy, các cơ bắp khéo léo và một bộ não xử lý cực nhanh để tạo nên 3 thành phần cốt lõi của một hệ điều khiển Các hệ điều khiển nhân tạo hiện nay về nguyên tắc đều gồm 3 thành phần này: các bộ cảm biến hay đầu đo dùng để xác định trạng thái của hệ điều khiển, các máy kích động sinh lực điều khiển và các bộ máy tính điều khiển để xử lý tín hiệu Trong lĩnh vực cơ học, những ứng dụng tiêu biểu có thể kể đến là điều khiển rôbốt, giảm dao động cho các phương tiện vận tải, máy móc và công trình xây dựng, các hệ thống lái tự động trong hàng không và hàng hải, điều khiển các trạm vũ trụ hoặc các trạm ăngten quan sát, Sự phát triển của lĩnh vực điều khiển dựa trên sự phát triển lý thuyết và công nghệ của 3 thành phần cốt lõi là bộ cảm biến, máy kích động và bộ điều khiển Khi thiết kế, bộ điều khiển có thể xem như một đối tượng toán học và được mô tả trong khuôn khổ của lý thuyết điều khiển nói chung Các lý thuyết điều khiển cổ điển trước đây dựa trên phép biến đổi Laplace được áp dụng cho các hệ tương đối đơn giản Các tính toán lúc đó có thể thực hiện bằng tay và các phương pháp thiết kế dựa trên các đồ thị khá trực quan Sự phát triển có tính cách mạng của máy tính điện tử đã hình thành nên lý thuyết điều khiển hiện đại từ những năm 60 của thế kỷ trước Ngày nay, các lý thuyết điều khiển đã được sử dụng cho các hệ rất phức tạp Đối với các kết cấu lớn,
mô hình động lực thường bao gồm khá nhiều trạng thái Nói chung, số lượng các trạng thái thường vượt quá số lượng của bộ cảm biến và máy kích động được lắp đặt Sự hạn chế số lượng của máy kích động và bộ cảm biến không phải chỉ do những yêu cầu về chi phí mà nó còn ảnh hưởng đến độ tin cậy của điều khiển vì số lượng càng tăng thì nguy cơ hỏng hóc càng cao Do số lượng bộ cảm biến và máy
kích động ít hơn số lượng trạng thái mô tả kết cấu nên dẫn tới vấn đề hạn chế đo (không xác định được toàn bộ trạng thái) và hạn chế đặt lực điều khiển (không đặt
được lực điều khiển vào toàn bộ trạng thái) Nhiều thuật toán điều khiển đã đề ra để
Trang 8giải quyết những vấn đề này Tuy nhiên, trong các kết cấu lớn và phức tạp, kích động ngoài thường mang tính ngẫu nhiên và không thể xác định được bằng phép đo Các thuật toán kinh điển thường coi kích động là các quá trình ngẫu nhiên ồn trắng
để luật điều khiển được hình thành khi đó không phụ thuộc vào kích động ngoài Trong nhiều trường hợp, thuật toán điều khiển không phụ thuộc kích động ngoài chưa thực sự mang lại hiệu quả tối ưu Với lý do trên, đề tài luận án “Phát triển thuật toán điều khiển tích cực phản hồi cho các kết cấu trong điều kiện đo hạn chế đáp ứng” đã được hình thành
Mục tiêu của luận án:
Phát triển các thuật toán điều khiển kinh điển cho các kết cấu có sự hạn chế đo, bằng cách sử dụng tối đa thông tin đo được để xác định kích động ngoài
Đối tượng nghiên cứu:
Các kết cấu có nhiều bậc tự do chịu tải trọng ngẫu nhiên và bị hạn chế đo
Nội dung nghiên cứu:
- Phát triển thuật toán điều khiển hồi tiếp dẫn tiếp kết hợp với nhận dạng lực vào hai bài toán: bài toán điều khiển không hạn chế đo và bài toán điều khiển không hạn chế đặt lực
- Phát triển các phương thức xác định vị trí đặt lực và đặt đầu đo tối ưu
- Khảo sát ảnh hưởng của các tham số như thời gian trễ, các ma trận trọng số, tần số kích động ngoài và nhiễu đo đến hiệu quả của thuật toán điều khiển trong hai bài toán được khảo sát
- Kết hợp hai bài toán được khảo sát để trở thành bài toán điều khiển phản hồi đầu ra tổng quát Từ đó phát triển thuật toán điều khiển hồi tiếp dẫn tiếp kết hợp với nhận dạng lực vào bài toán điều khiển tổng quát
- Lập chương trình tính và mô phỏng số đối với các kết cấu mô tả các hệ được điều khiển trong thực tế, có tính đến tính ngẫu nhiên của kích động và thời gian trễ của điều khiển
Phương pháp và công cụ nghiên cứu:
Trang 9- Phương trình trạng thái, động lực chính cho sự phát triển của lý thuyết điều khiển hiện đại, được sử dụng để mô tả kết cấu Phương pháp Monte Carlo được sử dụng để mô tả tải trọng ngẫu nhiên
- Mô phỏng số được thực hiện nhờ phần mềm MATLAB và công cụ SIMULINK
- Các ví dụ hầu hết được lấy trong các tài liệu đã được công bố Vì thế các thông số của kết cấu và thiết bị điều khiển nói chung mô tả phù hợp với ứng dụng thực tế
Bố cục của luận án
Luận án được chia làm 4 chương
- Trong chương 1, tổng quan về lý thuyết điều khiển tích cực sẽ được trình bày Các khái niệm, các vấn đề mới đặt ra cần nghiên cứu, các ứng dụng thực tế và các thành tựu đã đạt được của lý thuyết điều khiển hiện đại sẽ lần lượt được giới thiệu Đồng thời, vấn đề chính mà luận án tập trung nghiên cứu giải quyết sẽ được chỉ ra
- Trong chương 2, bài toán điều khiển không hạn chế đo sẽ được trình bày Đóng góp chính của luận án trong chương này là đề xuất thuật toán điều khiển hồi tiếp - dẫn tiếp kết hợp với nhận dạng lực để cải thiện bài toán điều khiển không hạn chế đo
- Trong chương 3, bài toán điều khiển không hạn chế đặt lực sẽ được trình bày Đóng góp chính của luận án trong chương này là đề xuất thuật toán điều khiển hồi tiếp - dẫn tiếp kết hợp với nhận dạng lực để cải thiện bài toán điều khiển không hạn chế đặt lực
- Trong chương 4, bài toán điều khiển phản hồi đầu ra tổng quát sẽ được trình bày Phương pháp tách là cơ sở để tách bài toán điều khiển tổng quát thành 2 bài toán được thảo luận trong chương 2 và chương 3 Dựa trên các kết quả của chương 2 và 3, đóng góp của luận án trong chương này là đưa ra 2 phiên bản điều khiển nâng cao đối với bài toán điều khiển đầu ra tổng quát
Trang 10Chương 1 TỔNG QUAN
1.1 Các khái niệm trong điều khiển tích cực
Điều khiển tích cực nói một cách chung nhất là lĩnh vực nghiên cứu cách thiết kế một hệ thống có khả năng tác động vào một quá trình và buộc quá trình đó tuân theo một yêu cầu nhất định Cách ứng xử của một quá trình được xác định bởi một hệ động lực mà trạng thái của nó theo thời gian sẽ phụ thuộc vào tương tác với môi trường và phụ thuộc vào các tương tác bên trong Mối quan hệ giữa hệ động lực và môi trường ngoài có thể được hiểu bằng khái niệm đầu vào và đầu ra Các đầu ra là các biến đo thể hiện đáp ứng của hệ thống còn các đầu vào thể hiện kích động ngoài tác động vào hệ thống Đầu vào được phân làm hai loại: nhiễu và điều khiển Nhiễu
là các tác động bên ngoài liên quan đến các kích động của tự nhiên và không thể điều khiển được Bộ điều khiển là các hệ thống được thiết kế để thay đổi đầu vào sao cho đầu ra của hệ thống đạt được một số thể hiện mong muốn
Điều khiển tích cực trong cơ học là một trường hợp riêng của điều khiển tích cực, trong đó các hệ động lực được mô tả bởi các phương trình chuyển động Đầu ra là các đại lượng cơ học như dịch chuyển, vận tốc,gia tốc Đầu ra được đo bằng các
bộ cảm biến Đầu vào nhiễu được sinh ra bởi các tác động của môi trường như gió, động đất, sóng, va chạm, phương tiện vận tải hay bất kỳ các nguồn gây dao động nào khác Đầu vào điều khiển là các đại lượng cơ học như lực, mômen, gia tốc, được tạo ra bởi các máy kích động thích hợp Sơ đồ của một hệ được điều khiển tích cực được cho trên Hình 1.1 Một hệ thống điều khiển tích cực bao gồm 3 phần chính: các cảm biến để đo đáp ứng hoặc kích động ngoài hoặc cả hai, bộ điều khiển
là các máy tính được tích hợp các thuật toán điều khiển thích hợp và các máy kích động sinh lực tác động vào hệ cần được điều khiển
Trang 11Hình 1.1: Sơ đồ khối của một hệ điều khiển tích cực
Bộ điều khiển được coi như một bộ xử lý thông tin để khép kín vòng lặp điều khiển Vai trò của bộ điều khiển là cung cấp tín hiệu điều khiển như một hàm của các tín hiệu đo Vì vậy, khi thiết kế, bộ điều khiển được coi như một đối tượng toán học và được mô tả trong khuôn khổ của lý thuyết điều khiển nói chung Nếu đầu vào của
hệ được điều khiển (tức là kích động ngoài) được giám sát và điều khiển thì người
ta gọi hệ là được điều khiển mở (open-loop control) hay điều khiển dẫn tiếp (feedforward control) Nếu đầu ra của hệ được điều khiển (tức là các đáp ứng) được giám sát và điều khiển thì người ta gọi hệ là được điều khiển đóng (closed-loop control) hay điều khiển hồi tiếp hoặc phản hồi (feedback control) Trường hợp cả đầu vào và đầu ra của hệ được giám sát và điều khiển thì sẽ dẫn tới khái niệm điều khiển đóng mở (closed-open loop control) hay điều khiển hồi tiếp-dẫn tiếp (feedback-feedforward control) Về mặt vật lý, hiệu quả của điều khiển hồi tiếp là làm thay đổi các tham số của kết cấu (độ cứng và độ cản) để kết cấu có thể phản ứng tốt hơn với kích động ngoài Trong khi đó, hiệu quả của điều khiển dẫn tiếp là làm giảm bớt hoặc triệt tiêu hoàn toàn kích động ngoài
Một vòng lặp của điều khiển tích cực trải qua 3 bước bao gồm đo đạc, xử lý tín hiệu
và sinh lực điều khiển Hiệu quả của điều khiển phụ thuộc vào khả năng thực hiện chính xác 3 bước này Các yếu tố quyết định bao gồm công nghệ cảm biến [Lynch
Trang 12vcs 2006], khả năng xử lý của máy tính, thuật toán điều khiển thích hợp, khả năng,
độ chính xác và tốc độ của máy kích động cũng như hiệu quả của cơ cấu tác động lực, công nghệ vật liệu mới và cơ khí chính xác
1.2 Máy kích động và các phương thức điều khiển
1.2.1 Các loại máy kích động
Tất cả các thiết bị khi được điều khiển có khả năng sinh lực đều được coi là máy kích động Máy kích động có nhiều loại với nguyên lý hoạt động và khả năng sinh lực khác nhau, phụ thuộc vào ứng dụng cụ thể Có những loại cỡ rất nhỏ ứng dụng trong các lĩnh vực của cơ điện tử, lại có những loại cỡ rất lớn ứng dụng trong điều khiển kết cấu công trình Trong số các dạng máy kích động cỡ lớn có thể kể đến các loại sau
- Máy kích động dạng thuỷ lực sinh ra lực bằng cách tạo ra áp suất trên bề mặt của đầu pittông trong xi lanh nhờ vào dòng chất lỏng được bơm vào hoặc ra xy lanh Loại này có khả năng lớn nhất khoảng vài trăm meganewton
- Máy kích động dạng môtơ điện sinh lực nhờ vào chuyển động quay của các
mô tơ điện Nếu cần thiết, máy kích động loại này có thêm hệ thống truyền động biến chuyển động quay thành chuyển động tịnh tiến Loại này có khả năng lớn nhất khoảng vài trăm kilonewton
- Máy kích động dạng điện từ là loại máy kích động không sử dụng sự tương tác giữa các thiết bị cơ khí mà sử dụng lực từ giữa 2 dòng điện Loại này có khả năng lớn nhất khoảng vài kilonewton
- Ba loại máy kích động kể trên được phát triển trong nhiều lĩnh vực điều khiển chuyển động và đã được nghiên cứu khá nhiều về mặt công nghệ để có thể trở thành sản phẩm thương mại Hiện nay, người ta cũng đang phát triển các loại máy kích động mới dựa trên các bộ giảm chấn có van đóng mở [Feng vcs 1990, Kurata vcs 1994, Sack vcs 1993] hoặc dựa trên các vật liệu thông minh Các vật liệu thông minh có thể kể đến bao gồm chất lỏng từ biến (magnetorheological fluids) có khả năng thay đổi tính chất khi thay đổi từ trường [Carlson vcs 1996, Spencer vcs
Trang 131998a], vật liệu áp điện (piezzoelectric material) có khả năng biến dạng khi chịu dòng điện [Ikeda 1997, Crawley 1987], vật liệu nhớ hình dạng (shape memory alloy) có khả năng thay đổi hình dạng khi đốt nóng hoặc làm lạnh [Wayman vcs
1972, Fremond vcs 1996] Các loại máy kích động này có chung ưu điểm là rất dễ điều khiển nhưng có một số nhược điểm như lực kích động luôn ngược chiều với vận tốc chuyển động, khả năng sinh lực lớn còn hạn chế và giá thành của các vật liệu thông minh còn khá cao
1.2.2 Các phương thức sinh lực điều khiển
Về nguyên lý cơ học, khi hệ cần được điều khiển dao động thì một cơ cấu bất kỳ có khả năng sinh công cơ học đều có thể tạo ra lực điều khiển Cơ cấu nào có khả năng sinh công càng cao thì hiệu quả điều khiển càng tốt Có 3 phương thức chính để tạo
ra lực điều khiển:
- Phương thức tác động lực thứ nhất tạo ra lực điều khiển là ngoại lực từ bên ngoài tác động vào hệ cần được điều khiển Chẳng hạn, trên Hình 1.2a là sơ đồ một cách tác động lực vào cầu để giảm dao động thẳng đứng gây ra bởi phương tiện Máy kích động có một đầu tì vào mố cầu, một đầu gắn vào dầm cầu Trong quá trình dao động, điểm đặt của lực điều khiển tại dầm cầu dao động còn điểm đặt tại
mố cầu đứng yên Vì vậy cơ cấu này sinh công và có thể dùng để điều khiển dao động Tương tự như vậy, trên Hình 1.2b máy bay phản lực cũng được điều khiển bởi ngoại lực là lực tác động của khối khí phụt về phía sau
Hình 1.2: Phương thức tác động lực từ bên ngoài
- Phương thức tác động lực thứ hai tạo ra lực điều khiển giữa 2 bộ phận chuyển động tương đối với nhau bên trong hệ cần được điều khiển Chẳng hạn với
u
u
Trang 14kết cấu khung trên Hình 1.3a , khi kết cấu dao động, 2 điểm đặt của lực điều khiển đều dao động nhưng không giống nhau Vì vậy, tổng công do lực điều khiển sinh ra tại 2 điểm đặt là khác 0 và cơ cấu có thể dùng để điều khiển dao động Tuy nhiên, hiệu quả của điều khiển phụ thuộc vào chuyển động tương đối giữa 2 điểm đặt Khi kết cấu khung quá cứng thì 2 điểm đặt chuyển động gần như nhau Do lực điều khiển tại 2 điểm đặt là ngược chiều nên dù lực điều khiển có rất lớn thì tổng công sinh ra vẫn nhỏ và hiệu quả điều khiển thấp Một cơ cấu điều khiển dạng này cũng
có thể thấy ở bánh lái của máy bay hay bánh lái của tàu thuỷ Trên Hình 1.3b, khi bánh lái quay sẽ tạo ra chuyển động tương đối giữa bánh lái và máy bay, mômen điều khiển dùng để quay bánh lái sẽ sinh công và như thế cơ cấu bánh lái có thể dùng để điều khiển
Hình 1.3: Phương thức điều khiển qua chuyển động tương đối
- Phương thức tác động lực thứ ba là tạo ra lực điều khiển giữa hệ cần được điều khiển và một khối lượng phụ gắn thêm Chẳng hạn, trên Hình 1.4a là cơ cấu tạo ra lực điều khiển để giảm dao động ngang của kết cấu Khi kết cấu và khối lượng phụ có dao động tương đối với nhau thì lực điều khiển sẽ sinh công Chú ý rằng với cơ cấu trên Hình 1.4a thì lực điều khiển sẽ tỷ lệ thuận với khối lượng và gia tốc hệ phụ Do đó để công sinh ra đủ lớn thì khối lượng của hệ phụ cũng phải đủ lớn Trên Hình 1.4b cũng là một cách thức tương tự nhưng hệ phụ lúc này không
Trang 15chuyển động tịnh tiến mà chuyển động quay Mômen điều khiển sẽ sinh công qua chuyển động tương đối giữa hệ phụ và hệ cần được điều khiển
Hình 1.4: Phương thức điều khiển nhờ lực quán tính
Như vậy bài toán tìm cơ cấu điều khiển thích hợp rõ ràng là một vấn đề cần có sự nghiên cứu Một cơ cấu điều khiển tốt nếu nó có khả năng sinh công cao, tức là sinh được lực lớn nhưng phải trên một chuyển động đủ dài
1.3.Ví dụ về các hệ điều khiển tích cực cỡ lớn trong thực tế
Trong lĩnh vực xây dựng dân dụng thì điều khiển tích cực là một bài toán rất phức tạp vì nó đòi hỏi cơ cấu sinh lực tương đối lớn Khá nhiều ứng dụng có thể được tham khảo trong các tài liệu [Soong 1989, Housner vcs 1997, Spencer vcs 1997, Kitamura vcs 2004, Kareem vcs 1999] Dưới đây là một vài ví dụ trong số đó
Kyobashi Seiwa Building (Nhật Bản, 1989)
Toà nhà được điều khiển cao 11 tầng, mặt cắt 4m12m, cao 33m và nặng 400 tấn (Hình 1.5) Hệ thống điều khiển tích cực AMD (Active mass damper) được sử dụng với mục đích giảm đáp ứng của kết cấu khi chịu tải trọng động đất (gia tốc 10cm/s2)
và tải trọng gió (tốc độ 20m/s) xuống còn khoảng bằng 1/3 giá trị khi chưa được điều khiển [Kajima 1991] Hệ thống điều khiển tích cực bao gồm 2 khối lượng được treo vào hệ khung trên nóc toà nhà Giữa khối lượng phụ và kết cấu có lắp đặt các
Trang 16máy kích động thuỷ lực Các đại lượng được đo gồm gia tốc của tầng 6, tầng 11 và gia tốc nền (Hình 1.5)
Hình 1.5: Kyobashi Seiwa Building và thiết bị AMD
Hình 1.6: Thiết bị AMD chính và AMD phụ Tổng cộng có 2 khối lượng phụ được lắp đặt (Hình 1.6), 1 khối nặng 4 tấn để điều khiển dao động ngang (chu kỳ 1.13s), 1 khối nặng 1 tấn để hấp thụ dao động xoắn (chu kỳ 0.97s)
Yokohama Landmark Tower (Nhật Bản, 1993)
Hệ thống điều khiển tích cực cho toà nhà Yokohama Landmark Tower cũng có dạng khối lượng được treo bằng hệ thống cáp treo [Yamazaki vcs 1992] Ảnh chụp
Trang 17toà nhà và hệ thống điều khiển tích cực được cho trên Hình 1.7 Để tăng khả năng sinh công của lực điều khiển, cơ cấu con lắc 3 tầng được sử dụng Sơ đồ cấu tạo của
cơ cấu điều khiển tích cực được cho trên Hình 1.8
Hình 1.7: Yokohama Landmark Tower và AMD dạng con lắc
Hình 1.8: Sơ đồ cấu tạo của AMD Con lắc 3 tầng có chiều dài 3m sẽ có chuyển động tương đương với con lắc có chiều dài 9m, từ đó tăng được hiệu quả điều khiển Máy kích động cơ điện được đặt ở các góc của hộp khung Do các máy kích động cơ điện chuyển động quay nên cơ cấu
Dây
cáp
treo
Khối lượng phụ Khung thép
Máy kích động dạng cơ điện
Vị trí lắp đặt
Trang 18phải có thêm hệ thống vít me bi (ball -screw) để biến chuyển động quay thành chuyển động tịnh tiến
Applause Tower (Nhật Bản, 2001)
Khối lượng phụ được sử dụng chính là sân bay dành cho máy bay lên thẳng ở trên nóc toà nhà (Hình 1.9) Điều này giúp giảm chi phí do phải tăng khối lượng vào kết cấu
Hình 1.9: Applause Tower và sân bay dóng vai trò AMD
Hình 1.10: Ảnh chụp bộ đệm và máy kich động Sân bay nặng 480 tấn được đặt trên hệ thống đệm cao su nhiều tầng (Hình 1.10a) Lực điều khiển giữa khối lượng phụ (sân bay) và kết cấu được tạo ra nhờ 5 máy kích động dạng thuỷ lực (Hình 1.10b)
Nanjing TV Tower (Trung Quốc, 1998)
Tháp truyền hình cao 340m lúc đầu được thiết kế lắp đặt hệ thống điều khiển thụ động thông thường Tuy nhiên sự hạn chế về không gian đã khiến cho giải pháp này
Trang 19không thực hiện được Thay vào đó, do có kích cỡ nhỏ hơn nên hệ thống điều khiển tích cực dạng AMD đã được sử dụng [Reinhorn vcs 1998, Cao vcs 1998] Khối lượng phụ dạng đai nặng 59 tấn, đường kính trong 3.9m, đường kính ngoài 4.75m
và trượt trên hệ thống đệm ma sát Lực điều khiển giữa khối lượng phụ và kết cấu chính được tạo ra nhờ 3 máy kích động thuỷ lực có hành trình tới 1.5m Trên Hình 1.11 là ảnh chụp tháp TV, khối lượng phụ và máy kích động Trên Hình 1.12 là sơ
đồ lắp đặt khối lượng phụ theo 2 mặt cắt
Hình 1.11: Nanjing TV Tower, AMD dạng đai và máy kích động
Hình 1.12: Sơ đồ của AMD lắp tại Nanjing TV Tower
Khối lượng phụ là vành bên ngoài có bán kính lớn hơn Vành bên trong là vách của
Trang 20đệm làm bằng vật liệu cao su Teflon Máy kích động đặc trên vòng tròn cách nhau các góc 120, một đầu gắn vào khối lượng phụ, một đầu gắn vào vách của tháp
Shinjuku Park Tower (Nhật Bản, 1994)
Khối lượng phụ được đỡ trên hệ thống con lăn là loại được sử dụng tại Shinjuku Park Tower [Takenaka vcs 1994] (Hình 1.13)
Hình 1.13: Shinjuku Park Tower và AMD dạng con lăn
Khối lượng phụ nặng 110 tấn, chuyển động trên ray chữ V, không cần đến hệ treo nên kích cỡ tương đối nhỏ gọn Lực điều khiển được tác động vào con lăn thông động cơ điện với cơ cấu truyền động bánh răng Kết quả đo đạc thực tế trong 5 năm liên tục trước và sau khi lắp hệ thống điều khiển tích cực cho thấy gia tốc cực đại giảm từ 6.8cm/s2 xuống còn 3.44cm/s2
1.4 Tổng quan về các thuật toán điều khiển
Như đã đề cập, bài toán điều khiển tích cực xuất hiện trong rất nhiều lĩnh vực mà cơ học chỉ là một lĩnh vực riêng Do vậy lý thuyết điều khiển đã có một thời gian phát triển với nhiều thành tựu đáng kể Trước những năm 60 của thế kỷ trước, lý thuyết điều khiển được gọi là cổ điển Trong lý thuyết điều khiển cổ điển, công cụ phân tích hệ động lực là phép biến đổi Laplace đối với các phương trình vi phân tuyến
Trang 21tính và các công cụ để thiết kế dựa trên cách vẽ các đồ thị và biểu đồ như đồ thị Nyquist [Nyquist 1932], đồ thị Bode [Bode 1945], và phương pháp Quỹ tích nghiệm (Root Locus) [Evans 1948] Đây là những phương pháp đơn giản về mặt khái niệm, không phải tính toán phức tạp và cho kết quả điều khiển một cách trực quan Những phương pháp này đã từng là những phương pháp rất thông dụng trong việc thiết kế các hệ điều khiển Cùng với sự phát triển của máy tính thì lý thuyết điều khiển cổ điển tỏ ra có nhiều hạn chế Nói chung lý thuyết này chỉ áp dụng đối với các hệ có một đầu vào và một đầu ra (single input single output) và không đưa
ra được luật điều khiển tối ưu theo nghĩa nào đó Sự phát triển của máy tính đã hình thành nên lý thuyết điều khiển hiện đại sau những năm 60 của thế kỷ trước Lý thuyết điều khiển hiện đại được thiết kế cho những hệ phức tạp, có số lượng tùy ý đầu vào (điều khiển) và đầu ra (đo) Trong lý thuyết điều khiển hiện đại, công cụ để phân tích hệ động lực là phép tính ma trận, phương trình trạng thái cũng như lý thuyết các quá trình ngẫu nhiên Công cụ để thiết kế khá phong phú, từ các phương pháp tối ưu cho đến các phương pháp trí tuệ nhân tạo như hàm mờ, mạng thần kinh Khi thiết kế cho các hệ cơ học phức tạp, ngoài mục tiêu giảm đáp ứng của hệ, các thuật toán điều khiển hiện đại còn cần phải quan tâm đến những vấn đề sau:
- Mô hình hoá một hệ trên thực tế luôn luôn chứa những yếu tố "lý tưởng hoá" và sự sai lệch giữa mô hình thực và mô hình toán học luôn luôn tồn tại Với những hệ phức tạp thì sai số trong mô hình hoá nếu không được xem xét cẩn thận sẽ
có thể bị khuyếch đại trong quá trình điều khiển Những nghiên cứu trong lĩnh vực này dẫn tới khái niệm "bền vững" (robustness) trong các thuật toán điều khiển [Safonov 1980] Một thiết kế điều khiển "bền vững" là một thiết kế vẫn đảm bảo được hiệu quả của điều khiển cho dù có sự bất định và sai số giữa hệ cơ học trong thực tế với mô hình toán học dùng để thiết kế
- Trong các hệ mềm (là các hệ có cản yếu và nhiều bậc tự do), điều khiển chỉ
có thể được thiết kế cho một vài bậc tự do quan trọng nhất (thông thường là các dạng riêng đầu tiên) Khi đó nếu không được xem xét cẩn thận thì điều khiển có thể biến các bậc tự do "không quan trọng" ban đầu trở thành "quan trọng" Hiện tượng
Trang 22này được gọi là spillover và có thể giảm hiệu quả điều khiển, thậm chí gây mất ổn định [Balas 1978,1980, Soong vcs 1982]
- Đối với những hệ lớn, sự phức tạp của các tính toán điều khiển cũng như sự phức tạp của động lực máy kích động sẽ dẫn tới thời gian trễ của điều khiển Sai số của lực điều khiển do thời gian trễ có thể bị khuyếch đại nếu không được xem xét [Basharkhah vcs 1984, Pu 1989]
- Đối với các hệ cơ học chịu tải môi trường như tải gió, tải động đất, tải sóng thì tính chất ngẫu nhiên của kích động cần phải được quan tâm
- Trong các kết cấu hiện đại, việc sử dụng các thiết bị tiêu tán năng lượng, hay các máy kích động dựa trên các vật liệu thông minh sẽ dẫn tới tính phi tuyến trong các phương trình chuyển động Khi đó, những thuật toán điều khiển hệ phi tuyến sẽ cần được xây dựng hoặc những ảnh hưởng của sự tuyến tính hoá đến thuật toán điều khiển hệ tuyến tính cần được xem xét
- Sự hạn chế của số lượng máy kích động và số lượng các cảm biến cũng là vấn đề được quan tâm Sự hạn chế này không chỉ do các vấn đề kinh tế mà còn do tính tin cậy cần thiết phải có trong thiết kế Một số lượng lớn các máy kích động hay bộ cảm biến cũng làm tăng nguy cơ hỏng hóc, làm giảm hiệu quả điều khiển Như vậy, các vấn đề nảy sinh là tìm vị trí tối ưu của máy kích động và bộ cảm biến cũng như phương thức xử lý trong trường hợp một vài bộ cảm biến bị hỏng
- Các máy tính số là phương tiện chủ yếu để thực hiện các tính toán điều khiển Các tín hiệu do máy tính đưa ra là tín hiệu số mang tính rời rạc, trong khi đó đáp ứng của hệ được điều khiển cũng như máy kích động về mặt vật lý là liên tục
Do đó, sự mở rộng của các thuật toán điều khiển liên tục sang các thuật toán điều khiển rời rạc cũng là vấn đề được quan tâm nghiên cứu
- Các máy kích động trên thực tế có động lực khá phức tạp và sự tương tác giữa máy kích động và hệ được điều khiển trong nhiều trường hợp là không thể bỏ qua
Trang 23Những vấn đề được đặt ra là cơ sở cho sự phát triển của lý thuyết điều khiển hiện đại Các kết quả chính của lý thuyết điều khiển hiện đại có thể được tóm tắt trong một số vấn đề sau:
- Các phương pháp tối ưu như quy hoạch động [Bellman 1957], nguyên lý cực đại [Pontryagin vcs 1967]
- Bộ quan sát [Luenberger 1966] và bộ lọc tối ưu Kalman Bucy [Kalman vcs 1961]
- Điều khiển ấn định cực, điều khiển tối ưu LQR,LQG trên miền thời gian và điều khiển tối ưu chuẩn H2 trên miền tần số [Abdel-Rohman vcs 1978, Kailath
1980, Kwakernaak vcs 1972, Suhardjo vcs 1992]
- Điều khiển dạng riêng [Meirovitch vcs 1980], mô hình hoá và nhận dạng kết cấu [Nishitani 1996], điều khiển có tính đến tương tác kết cấu - máy kích động [Dyke vcs 1995], bài toán vị trí cho máy kích động và các bộ cảm biến [Lee vcs 1990]
- Điều khiển bền vững, mô tả sự bất định dựa trên chuẩn H và lý thuyết synthesis [Chiang 1988, Grimble 1988]
Lý thuyết điều khiển dựa trên mạng thần kinh nhân tạo và hàm mờ [Widrow vcs 1960,1990, Zadeh 1965, Casciati 1997, Venini 1994]
- Điều khiển cho các máy kích động thích ứng [Dyke vcs 1996, Spencer vcs
2000, Karnopp 1990, Astrom vcs 1989]
- Các nghiên cứu về hiện tượng spillover [Seto 1998, Balas 1982]
- Điều khiển phi tuyến, điều khiển trượt mode [Nonami vcs 1994, Yang vcs 1995,1996, Adhikari vcs 1996, Spencer vcs 1996]
- Điều khiển rời rạc, điều khiển phỏng đoán, điều khiển trạng thái giới nội [Del Grosso vcs 1995, Lee vcs 1996, Rodellar vcs 1987,1989]
- Các nghiên cứu so sánh điều khiển trên các kết cấu chuẩn (bài toán benchmark) [Spencer vcs 1998b, Yang 1998]
Trang 241.5 Các nghiên cứu trong nước
Các tài liệu về lý thuyết điều khiển tự động nói chung có thể được tham khảo tại [Nguyễn Doãn Phước vcs 2000, Phạm Công Ngô 2001] Tuy nhiên, những lý thuyết được trình bày chủ yếu áp dụng cho các hệ điện hay các dây chuyền sản xuất tự động Các ứng dụng về mặt cơ học trong lĩnh vực điều khiển có thể tham khảo trong các tài liệu [Dinh Cong Huan vcs 2004, Nguyen Tran Hiep vcs 2004, Do Sanh vcs 2004, Dang Xuan Hoai vcs 2006, Anh vcs 2004a] Trong các tài liệu này, các bài toán điều khiển đặt ra đối với các hệ cơ học như rôbốt, tàu thuỷ, phương tiện vận chuyển trên cáp treo Một số nghiên cứu khác về lý thuyết điều khiển áp dụng cho các kết cấu công trình cũng được trình bày trong [Anh vcs 2004b,2005, Ninh Quang Hai vcs 2004] Trong một phần của luận án [Nguyễn Chỉ Sáng 2004], bài toán điều khiển tích cực đối với hệ giảm chấn khối lượng cũng đã được thảo luận Nói chung, trong hầu hết các tài liệu trên, vấn đề về hạn chế đo trạng thái của hệ chưa được đặt ra Do đó, mục tiêu của luận án là tập trung nghiên cứu sâu hơn về vấn đề này
1.6 Vấn đề đặt ra và được nghiên cứu trong luận án
Bài toán điều khiển áp dụng vào các hệ kết cấu lớn luôn dẫn tới một vấn đề đặc biệt Các kết cấu lớn đòi hỏi các mô hình nhiều trạng thái để mô tả phản ứng động lực
Vì vậy, vấn đề hạn chế đo và hạn chế đặt lực luôn được đặt ra cho các thuật toán điều khiển Bài toán điều khiển tối ưu đặt ra là dựa trên một số lượng hạn chế các biến đo, thiết kế lực điều khiển để tác động vào kết cấu tại một số lượng hạn chế các
vị trí sao cho một chỉ tiêu tối ưu nào đó được cực tiểu Trong các thuật toán điều khiển tối ưu, thuật toán điều khiển LQG là một thuật toán rất thông dụng vì nó cho lời giải hiện hoàn toàn, có thể áp dụng cho mọi trường hợp của vị trí bộ cảm biến và máy kích động Đây là thuật toán sử dụng chỉ tiêu tối ưu dạng tích phân toàn phương trên miền thời gian Thuật toán là một sự phối hợp giữa bộ điều khiển tối
ưu phản hồi trạng thái LQR với bộ quan sát tối ưu Kalman Bucy Ngoài những ưu điểm nổi bật, thuật toán LQG còn có những hạn chế sau:
Trang 25- Bộ điều khiển tối ưu phản hồi trạng thái LQR và bộ quan sát tối ưu Kalman Bucy mang tính phản hồi (hồi tiếp), nghĩa là hoàn toàn không phụ thuộc vào kích động ngoài Luật điều khiển phản hồi chỉ tối ưu khi kích động ngoài là quá trình ngẫu nhiên ồn trắng Trong nhiều trường hợp giả thiết ồn trắng không phù hợp
- Để tăng hiệu quả của luật điều khiển phản hồi thì cần tăng độ lớn các thành phần của ma trận phản hồi Tuy nhiên, việc tăng quá lớn các thành phần của ma trận phản hồi sẽ dẫn tới các vấn đề về khuyếch đại sai số tính toán và sai số do thời gian trễ
Vấn đề khắc phục những hạn chế trên đã được nghiên cứu trong một số tài liệu Để tăng hiệu quả của thuật toán điều khiển hồi tiếp, có thể bổ sung thêm thành phần dẫn tiếp theo một số phương pháp sau:
- Phương pháp điều khiển cổ điển dựa trên phép biến đổi Laplace, theo đó bộ điều khiển được thiết kế để đặt các "không điểm" của hệ thống vào tần số trùng với tần số kích động, qua đó triệt tiêu kích động ngoài [Ogata 1970, Sievers vcs 1992] Như đã trình bày, phương pháp cổ điển nói chung chỉ áp dụng với hệ 1 đầu vào, 1 đầu ra và không đạt được sự tối ưu theo bất kỳ nghĩa nào Phương pháp đòi hỏi đo được kích động ngoài và có tính địa phương, tức là chỉ có hiệu quả với tần số nhất định nào đó
- Sự phát triển trong khả năng tính toán của máy tính đã dẫn tới sự phát triển của các thuật toán lọc thích ứng, thay đổi các thông số của bộ điều khiển thích ứng với sự biến đổi của kích động Trong số này có thể kể tới các kỹ thuật như Filtered-
x LMS [Burgess 1981, Elliott vcs 1987, Vipperman vcs 1993], Higher Harmonic Control [Kewley vcs 1995, Shaw 1980] Các thuật toán này cũng đòi hỏi xác định được kích động ngoài
- Trong trường hợp điều khiển bằng lý thuyết điều khiển hiện đại dựa trên công cụ chủ yếu là phương trình trạng thái, thành phần dẫn tiếp được đưa vào phương trình trạng thái bằng cách mô tả dưới dạng kích động ồn màu Khi đó vectơ trạng thái mở rộng sẽ chứa kích động và luật điều khiển có chứa thành phần dẫn tiếp
Trang 26[Suhardjo vcs 1990, 2001, Mei vcs 2004] Mặc dù có nhiều ưu điểm, phương pháp này phụ thuộc nhiều vào mô hình kích động ồn màu dùng để mô tả kích động
Luận án sử dụng cách tiếp cận của lý thuyết điều khiển hiện đại với việc sử dụng phương trình trạng thái làm công cụ chủ yếu để thiết kế Thành phần dẫn tiếp (feedforward) được bổ sung vào luật điều khiển Tuy nhiên ở đây kích động ngoài được giả sử là không xác định được bằng phép đo Để tránh phải mô tả kích động bằng các quá trình ngẫu nhiên ồn màu như đã đề cập ở trên, luận án sử dụng thuật toán nhận dạng kích động ngoài [Anh 2000] Với thuật toán này, trong quá trình điều khiển, kích động ngoài có thể được xác định trực tuyến nhờ vào các số liệu đo đáp ứng Thuật toán nhận dạng lực ban đầu mới được đặt ra cho trường hợp lý tưởng là đo được hoàn toàn tất cả các trạng thái và đặt được lực điều khiển vào tất
cả các trạng thái Mục tiêu của luận án là phát triển thuật toán nhận dạng lực để có thể áp dụng được vào trường hợp vừa bị hạn chế đo vừa bị hạn chế đặt lực
Trang 27Chương 2 BÀI TOÁN ĐIỀU KHIỂN KHÔNG HẠN CHẾ ĐO
2.1 Giới thiệu
Trong chương này ta sẽ trình bày và phát triển lý thuyết điều khiển tối ưu cho các
hệ tuyến tính chịu tải ngẫu nhiên với chỉ tiêu tối ưu là tích phân dạng toàn phương trên miền thời gian cực tiểu Tất cả các bài toán của chương này được đặt ra với giả
thiết không hạn chế đo, nghĩa là trạng thái đầy đủ x(t) của hệ được điều khiển có
thể được xác định chính xác và hoàn toàn tại mọi thời điểm Giả thiết này phi thực
tế trong nhiều ứng dụng Tuy nhiên lý thuyết được trình bày và phát triển trong chương này sẽ là một cơ sở quan trọng cho trường hợp tổng quát mà ta sẽ trình bày
và phát triển trong chương 4
Thuật toán kinh điển LQR được trình bày trong mục 2.2 Những hạn chế của thuật toán kinh điển được chỉ ra trong mục 2.3 Những đóng góp mới của luận án trong chương này được thể hiện trong các mục 2.4, 2.5 và 2.6 Các đóng góp này bao gồm việc đề xuất thuật toán điều khiển hồi tiếp - dẫn tiếp để khắc phục các hạn chế của thuật toán kinh điển, đề xuất thuật toán nhận dạng lực cho thành phần dẫn tiếp và đề xuất chỉ tiêu xác định vị trí đặt lực tối ưu
2.2 Thuật toán điều khiển kinh điển LQR
2.2.1 Đặt bài toán
Như đã trình bày trong chương 1, hệ phương trình trạng thái là một công cụ cốt lõi cho sự phát triển của lý thuyết điều khiển hiện đại Sử dụng hệ phương trình trạng thái rất thích hợp cho mô phỏng số và tính toán trên máy tính, đồng thời cũng dễ dàng mở rộng và tổng quát hóa cho các bài toán bậc cao, bài toán có tham số thay đổi theo thời gian hoặc các hệ ngẫu nhiên Phần lớn các hệ được điều khiển có thể được mô tả bởi hệ phương trình vi phân cấp 1 dạng:
Trang 28 , , ( ), , 0 0
Trong đó t là thời gian, x(t) là vectơ thay đổi theo thời gian mô tả trạng thái của hệ,
u(t) là vectơ đầu vào được điều khiển có chủ ý để cố gắng thay đổi đáp ứng của hệ, f(t) là vectơ đầu vào không được điều khiển và do môi trường ngoài hệ gây ra, g là
một hàm vectơ Ở đây cần nhấn mạnh rằng, đối với các hệ cơ học thông thường, nhiều người có thể sẽ quen thuộc hơn với phương trình vi phân chuyển động cấp 2 dạng:
d , , , ( ), , 0 0, 0 0
Md t g d t d t u t f t t d v d d (2.2)
Trong đó M là ma trận khối lượng, g d là một hàm vectơ, d(t) là vectơ chuyển dịch
Mặc dù vậy, phương trình (2.2) có thể dễ dàng chuyển về phương trình trạng thái sau:
có thể được tham khảo tại [Kwak 1993] Trong trường hợp hệ tuyến tính có các tham số không phụ thuộc thời gian, hệ phương trình vi phân cấp 2 (2.2) có dạng:
Md t Dd t Kd t L u t L f t d v d (2.4) d
trong đó D là ma trận cản, K là ma trận độ cứng L u và L f tương ứng là các ma trận định vị lực điều khiển và kích động ngoài Dùng biểu thức (2.3) ta thu được phương trình trạng thái có dạng:
Trang 29khiển cũng như kích động ngoài Biểu thức của các ma trận và vectơ được định nghĩa có dạng:
d x v
0
12
Trong đó, các ký hiệu phụ thuộc vào thời gian của x và u được bỏ qua để tránh phức
tạp, ký tự được nâng cao T là chỉ chuyển vị của vectơ hoặc ma trận Q là ma trận đối xứng thực nửa xác định dương cỡ nn, R là ma trận đối xứng thực xác định dương
cỡ n u n u Q và R được gọi là các ma trận trọng lượng Chúng được chọn tuỳ theo mức độ quan trọng giữa x(t) và u(t) Nếu các phần tử của Q có giá trị lớn trong tương quan với các phần tử của R thì độ quan trọng cuả x(t) lớn hơn u(t) và ngược lại Nếu R là ma trận không thì có nghĩa là hoàn toàn không giới hạn lực điều khiển Nếu Q là ma trận không thì có nghĩa là hoàn toàn không điều khiển Bằng cách thay
đổi độ lớn tương đối giữa các phần tử của ma trận trọng lượng, người ta có thể tổng hợp được một luật điều khiển đạt được một sự thoả hiệp thích hợp giữa hiệu quả của điều khiển và độ lớn của lực điều khiển
2.2.2 Lời giải tối ưu thực sự
Trên lý thuyết, bài toán cực tiểu chỉ tiêu (2.7) tồn tại lời giải tối ưu thực sự Tuy nhiên, ta sẽ chỉ ra các lý do khiến cho lời giải này chỉ tồn tại trên lý thuyết Theo lý thuyết biến phân, bài toán cực tiểu (2.7) với ràng buộc (2.5) được đưa về bài toán cực tiểu chỉ tiêu mở rộng hay hàm Lagrange có dạng:
Trang 30Chú ý rằng điều kiện đầu của trạng thái đã được xác định nên x(0)=0, điều kiện tối
ưu L=0 sẽ dẫn tới hệ phương trình sau:
Trang 31Hệ phương trình (2.15), (2.16) kết hợp với phương trình trạng thái cho ta 3 phương
trình để giải đối với 3 biến u,x và Hệ này vẫn còn phức tạp và có thể được biến đổi tiếp như sau Tách thành 2 phần trong đó một phần phụ thuộc tuyến tính vào vectơ trạng thái:
t Px t p t
Trong đó P là một ma trận hằng số còn p(t) là một vectơ phụ thuộc vào thời gian
Theo các khái niệm đã trình bày trong chương 1, số hạng đầu là số hạng hồi tiếp (feedback) vì nó chỉ phụ thuộc vào trạng thái của hệ được điều khiển Số hạng thứ hai sẽ được chứng tỏ là số hạng dẫn tiếp (feedforward) nghĩa là chỉ phụ thuộc vào kích động ngoài Thay (2.17) vào (2.15) và (2.16), sau đó thay (2.16) vào (2.5), dẫn tới:
Nếu giả sử rằng hệ ổn định và kích động ngoài chỉ tác động trong một khoảng thời
gian hữu hạn thì x()=0 Phương trình (2.20) với điều kiện cuối có thể được tách
phương trình đại số ma trận Riccati Đây là phương trình đã được nghiên cứu kỹ và
có một số cách giải khác nhau [Kwakernaak vcs 1972] Cách giải bằng chéo hoá sẽ
được trình bày trong Phụ lục C Từ phương trình (2.23) ta cũng thấy rằng vectơ p(t)
Trang 32được giải chỉ phụ thuộc vào kích động ngoài mà không phụ thuộc trạng thái của hệ,
do đó p(t) là thành phần dẫn tiếp Tóm lại, luật điều khiển tối ưu cuối cùng được xác
định bởi công thức sau:
trong đó P được giải từ phương trình ma trận Riccati (2.22), còn vectơ p(t) được xác
định từ phương trình vi phân (2.23) Phương trình (2.23) được viết lại gọn hơn nhờ
ký hiệu ma trận phản hồi G trong công thức (2.27):
p t G B A p t PHf t p (2.28)
Rõ ràng, về mặt lý thuyết thì lời giải tối ưu là tồn tại Tuy nhiên vectơ p(t) lại được
giải từ hệ phương trình vi phân ngược chiều thời gian (2.28), nghĩa là không cho điều kiện đầu mà là điều kiện cuối Việc giải hệ phương trình như vậy đòi hỏi phải biết trước kích động ngoài trên toàn bộ miền thời gian Với các hệ chịu kích động ngẫu nhiên thì rõ ràng đòi hỏi này là không khả thi và lời giải tối ưu thực sự chỉ mang tính lý thuyết
2.2.3 Thuật toán điều khiển kinh điển LQR
Thuật toán LQR (Linear Quadratic Regulator) là thuật toán điều khiển tối ưu với mục đích đưa trạng thái của một hệ từ một điều kiện đầu bất kỳ về trạng thái 0 Đây
là thuật toán điều khiển tối ưu khi kích động ngoài bằng 0 Khi kích động ngoài
bằng 0, dễ dàng thấy nghiệm của hệ phương trình (2.28) là p(t)=0 và luật điều khiển
LQR được xác định từ (2.24) chỉ còn thành phần hồi tiếp:
Trang 33trong đó G được xác định từ (2.27) Sơ đồ khối của luật điều khiển LQR có dạng
đơn giản như trên Hình 2.1
Hình 2.1: Sơ đồ điều khiển LQR
Ta thấy luật điều khiển (2.29) là luật điều khiển phản hồi trạng thái, đòi hỏi toàn bộ vectơ trạng thái được giả sử là xác định được Như đã nhấn mạnh trong phần giới thiệu, đòi hỏi này là không thực tế nhưng lý thuyết được trình bày trong chương này
sẽ là cơ sở cho chương 4 với bài toán phản hồi đầu ra
2.3 Các hạn chế của thuật toán kinh điển LQR
2.3.1 Tính không hoàn toàn tối ưu
Khi kích động ngoài f(t) khác 0 thì thành phần dẫn tiếp p(t) tính từ (2.28) cũng sẽ
khác 0 và lời giải LQR không còn là lời giải tối ưu nữa Từ (2.24) và (2.29) ta thấy sai số giữa lực điều khiển của thuật toán LQR và thuật toán điều khiển tối ưu thực
sự là:
LQR FF
E u t R B p t R B p t (2.30) Trong đó ký hiệu || || chỉ một chuẩn thích hợp Như vậy, hiệu quả của thuật toán
điều khiển LQR sẽ phụ thuộc vào chuẩn của thành phần dẫn tiếp p(t) tính từ luật
điều khiển tối ưu thực sự
Ví dụ 2.1: Điều khiển dao động thẳng đứng của ô tô
Để minh hoạ tính không hoàn toàn tối ưu của thuật toán LQR, ta xét bài toán điều khiển dao động ngẫu nhiên của ô tô khi di chuyển trên mặt đường ghồ ghề Mô hình
cơ bản của một ô tô chuyển động được cho trên Hình 2.2
Hệ được điều khiển
-G
u
x
f
Trang 34Hình 2.2: Mô hình ô tô được điều khiển tích cực
Trong đó ô tô được mô tả bởi khối lượng thân m 1 và khối lượng trục m2 Hệ thống
nhíp tương đương với lò xo có độ cứng k1 lắp song song với bộ cản có độ cản c1
Lốp tương đương với lò xo có độ cứng k2 Lực điều khiển tích cực u được sinh ra giữa thân xe và trục xe Gọi x1 và x2 là chuyển dịch của thân xe và trục xe so với
nền đường còn xg(t) là chuyển dịch của lốp (theo sự nhấp nhô của mặt đường) Chọn 2 tọa độ suy rộng của hệ là x1 và x2 Động năng T, thế năng V, hàm hao tán F
Trang 3501
x Q
trong đó r là một vô hướng và được thay đổi một cách thích hợp để đạt được sự
thoả hiệp chấp nhận được giữa hiệu quả điều khiển và độ lớn của lực điều khiển
Khi r càng tăng nghĩa là đóng góp của lực điều khiển vào chỉ tiêu J càng lớn và hiệu quả điều khiển càng giảm Khi r= nghĩa là hoàn toàn không điều khiển Trong ví
dụ này, giá trị của trọng số r được cố định bằng 510-5 Ta xét các giá trị số sau của
ô tô [Muller vcs 1997]: m1=1200kg, m2=80kg, c1=4800Ns/m, k1=3104N/m,
k2=32104N/m Như đã nhấn mạnh trong phần lý thuyết, thuật toán LQR chỉ là tối
Trang 36ưu khi kích động ngoài bằng 0 Ta xét trường hợp kích động ngoài khác 0 bằng cách xét đường cong mặt đường có dạng sóng điều hoà:
trong đó Y là biên độ sóng, L là chiều dài nửa bước sóng Chuyển dịch của lốp theo
đường cong mặt đường có dạng:
Lời giải LQR được so sánh với lời giải tối ưu thực sự với một số giá trị khác nhau
của L Để tìm lời giải tối ưu thực sự, ta giải hệ phương trình vi phân (2.28) với điều
kiện cuối tại vô cùng Vì thời gian tính là hữu hạn nên ta giả sử rằng ngoài khoảng thời gian tính thì không có kích động ngoài (tức là mặt đường bằng phẳng) Lúc đó điều kiện cuối tại vô cùng được thay bằng điều kiện cuối của khoảng thời gian tính Thời gian tính là 5s, biên độ sóng là 50cm, vận tốc xe là 50km/h
Bảng 2.1: Đáp ứng của ô tô với các bước sóng khác nhau của mặt đường
Biến dạng nhíp (m)
Gia tốc thân
xe (m/s2)
Lực điều khiển (kN)
Chỉ tiêu tối ưu (Js)
L=13.89m Không điều khiển 0.18 2.04 0.00 0.77
Trang 37Kết quả so sánh được thực hiện với một số giá trị khác nhau của L Trên Bảng 2.1 là
giá trị của chỉ tiêu (2.36) và các giá trị RMS (Root mean square) của biến dạng nhíp, gia tốc thân xe, lực điều khiển trong các trường hợp khác nhau Trên Hình 2.3
là so sánh giữa lực điều khiển của thuật toán LQR (nét liền) với lực điều khiển tối
ưu thực sự (nét đứt)
c) L=4.63
Hình 2.3: So sánh lực điều khiển với các bước sóng khác nhau
Ta nhận xét thấy rằng trong trường hợp L=4.63m thì thuật toán LQR có thể làm chỉ
tiêu đánh giá lớn hơn cả trường hợp không điều khiển Đó là do thuật toán LQR không thực sự tối ưu khi có kích động ngoài
2.3.2 Khả năng khuyếch đại thời gian trễ
Thuật toán LQR là một thuật toán phản hồi trạng thái Trong trường hợp lý tưởng, điều khiển mang tính tức thời, thời gian trễ bằng 0 thì thuật toán LQR đảm bảo chắc
Trang 38chắn sẽ tăng được độ ổn định của hệ được điều khiển Tuy nhiên, trên thực tế, thời gian trễ luôn tồn tại mặc dù có thể có giá trị nhỏ Việc tăng độ lớn các thành phần của ma trận phản hồi có thể khiến cho thời gian trễ này bị khuyếch đại và ảnh hưởng đến độ ổn định của hệ được điều khiển Giả sử ta xét một hệ được điều khiển bằng thuật toán phản hồi LQR, gọi thời gian trễ của lực điều khiển là u, phương trình chuyển động của hệ khi xuất hiện thời gian trễ là:
x t Ax t Bu t Hf t Ax t BGx t Hf t (2.39) Gọi là giá trị riêng của hệ phương trình vi phân tuyến tính có trễ (2.39), là nghiệm của phương trình đặc trưng siêu việt
n
A BGe I (2.40)
trong đó det là ký hiệu định thức, I n là ma trận đơn vị cũng cỡ với ma trận hệ thống
A Phương trình siêu việt (2.40) có vô hạn nghiệm Để nghiên cứu sự ổn định,
thông thường người ta có thể khai triển hàm e mũ theo một chuỗi nào đó và chỉ giữ
lại một số số hạng để giải Trong trường hợp khai triển Taylor của hàm e mũ, ta có:
năng giải quyết của luận án Ở đây, ta chỉ nhấn mạnh tới khả năng khuyếch đại thời
gian trễ
Ví dụ 2.2: Điều khiển chuyển động của máy bay
Để minh hoạ cho sự ảnh hưởng của thời gian trễ đến thuật toán LQR, ta xét bài toán điều khiển chuyển động thẳng đứng của máy bay Bài toán này xuất hiện trong các
Trang 39hệ thống điều khiển bay tự động [Nelson 1998] Trên Hình 2.4, chuyển động thẳng
đứng của máy bay được đặc trưng bởi các đại lượng sau: vận tốc v x dọc theo trục
của máy bay, vận tốc v z vuông góc với máy bay, góc nâng , vận tốc góc nâng
d/dt Chuyển động này được điều khiển bởi các đại lượng gồm lực đẩy động cơ T
và góc lệch của bánh lái độ cao (elevator)
Hình 2.4: Hệ trục toạ độ của máy bay
Chú ý rằng trong các ký hiệu của ngành hàng không thì người ta thường sử dụng u
và w để ký hiệu cho các vận tốc trong mặt phẳng thẳng đứng Tuy nhiên, để tránh sự nhầm lẫn với lực điều khiển u của lý thuyết điều khiển mà ta đang trình bày, ta sử dụng v x và v z để thay thế Khi chuyển động ổn định, máy bay có vận tốc đều Trạng
thái ổn định có dạng v x =v 0 =hằng số, v z =0, =0 và d/dt=0 Khi chịu ảnh hưởng của
các yếu tố bên ngoài như gió giật hay sự không đồng đều của không khí thì trạng thái của máy bay sẽ bị lệch một chút ra khỏi trạng thái chuyển động ổn định Mục tiêu của điều khiển bay tự động là đưa máy bay trở về trạng thái chuyển động ổn định Phương trình trạng thái của máy bay được tuyến tính hoá quanh vị trí chuyển động ổn định được thành lập dựa trên các đặc tính quán tính và khí động lực của máy bay Do khuôn khổ có hạn, ở đây ta chỉ xét phương trình chuyển động cuối cùng Với một mô hình máy bay cụ thể, phương trình trạng thái tuyến tính hoá có giá trị số như sau [Blakelock 1991]:
Trang 40v t
v t
x t
t t
Đơn vị của v x và v z là m/s, của là rad, của T là N và của là rad Các ma trận trọng
số của thuật toán điều khiển LQR được chọn phụ thuộc vào yêu cầu thực tế như sau
[Kwakernaak vcs 1972] Giả sử ta chỉ cần điều khiển 2 trạng thái là vận tốc dọc v x
và góc nâng Khi đó ma trận trọng lượng Q của trạng thái có dạng:
Ta thấy chỉ có tỷ số giữa các trọng số là cố định còn giá trị của trọng số có thể chọn
có bậc độ lớn tuỳ ý Để thuận tiện, chọn q v =0.02 và q=50 Tương tự như vậy, ta
Ta chọn r T =0.0004r, r=2500r, trong đó r là một số có thể thay đổi để đạt được sự
thoả hiệp chấp nhận được giữa hiệu quả điều khiển và độ lớn của lực điều khiển Xét thời gian trễ bằng 0.0336 s (bằng 1% chu kỳ riêng bé nhất của máy bay) Giá trị