BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐH SƯ PHẠM KỸ THUẬT TPHCM BÁO CÁO TỔNG KẾT ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CỦA SINH VIÊN KHẢO SÁT ƯU NHƯỢC ĐIỂM CỦA CÁC GIẢI THUẬT TUYẾN TÍNH/ PHI TUYẾN/THÔNG
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT
S KC 0 0 7 6 8 4
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐH SƯ PHẠM KỸ THUẬT TPHCM
BÁO CÁO TỔNG KẾT
ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CỦA SINH VIÊN
KHẢO SÁT ƯU NHƯỢC ĐIỂM CỦA CÁC GIẢI THUẬT TUYẾN TÍNH/ PHI TUYẾN/THÔNG MINH TRONG VIỆC ỔN
ĐỊNH CÂN BẰNG CHO HỆ ACROBOT
SV2022-130
Thuộc nhóm ngành khoa học: Điều khiển tự động
Trang 3iii
MỤC LỤC
MỤC LỤC iii
DANH MỤC HÌNH ẢNH iv
DANH MỤC BẢNG BIỂU vii
DANH MỤC CHỮ VIẾT TẮT viii
THÔNG TIN KẾT QUẢ NGHIÊN CỨU CỦA ĐỀ TÀI 1
CHƯƠNG 1 DẪN NHẬP 4
1.1 Đặt vấn đề 5
1.1 Lý do chọn đề tài 5
1.2 Đối tượng nghiên cứu 6
1.2 Phương pháp nghiên cứu 6
1.3 Giới hạn đề tài 6
1.4 Dàn ý nghiên cứu 6
1.4.1 Cấu trúc hệ Acrobot 6
1.4.2 Giải thuật LQR, Fuzzy, Sliding Mode 7
1.4.3 Phần mềm 7
1.3 Ý nghĩa thực tiễn 7
CHƯƠNG 2 TỔNG QUAN VỀ CẤU TRÚC HỆ THỐNG 8
2.1 Giới thiệu về hệ Acrobot 9
2.2 Phương Trình toán học của hệ Acrobot 12
CHƯƠNG 3 GIẢI PHÁP ĐIỀU KHIỂN HỆ ACROBOT 16
3.1 Giải thuật tuyến tính 17
3.2 Giải thuật thông minh 17
3.3 Giải thuật phi tuyến 18
3.4 Xây dựng bộ điều khiển LQR 22
3.5 Xây dựng bộ điều khiển FUZZY cho hệ dựa trên công cụ Anfis từ bộ điều khiển LQR 25
3.6 Xây dựng bộ điều khiển trượt 31
CHƯƠNG 4 KẾT QUẢ MÔ PHỎNG 34
Trang 44.1 Kiểm tra tính điều khiển được của hệ thống 35
4.2 Bộ điều khiển LQR 35
4.3 Bộ điều khiển Fuzzy 41
4.4 Bộ điều khiển trượt 45
CHƯƠNG 5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 50
5.1 Kết luận 51
5.2 Hướng phát triển 51
Trang 5iv
DANH MỤC HÌNH ẢNH
Hình 2.1: Hệ reaction wheel inverted pedulum 9
Hình 2.2: Hệ bóng thanh trục giữa 9
Hình 2.3: Hệ con lắc ngược trên xe 10
Hình 2.4: Hệ cần trục 10
Hình 2.5: Vị trí TOP của Acrobot 11
Hình 2.6: Acrobot thực tế 12
Hình 2.7: Mô hình toán học của hệ Acrobot 2-Link 12
Hình 3.1 Cấu trúc bộ điều khiển LQR 17
Hình 3.2: Cấu trúc bộ điều khiển mờ 18
Hình 3.3: Sơ đồ bộ điều khiển trượt 19
Hình 3.4: Giải thuật trượt 21
Hình 3.5: Quỹ đạo thực tế của hệ trượt 21
Hình 3.6: Khối mô phỏng hệ Acrobot 24
Hình 3.7: Mô hình mô phỏng bộ điều khiển LQR với hệ Acrobot 24
Hình 3.8: Khối thu thập dữ liệu 25
Hình 3.9: Tín hiệu ngõ vào(Random Number) tác động vào bộ điều khiển LQR 25
Hình 3.10: Dữ liệu xuất ra workspace của tín hiệu ngõ vào tác động vào bộ điều khiển LQR 26
Hình 3.11: Dữ liệu xuất ra workspace của tín hiệu ngõ ra của bộ điều khiển LQR 26
Hình 3.12: Dữ liệu workspace data 27
Hình 3.13: Dữ liệu data trên anfis 27
Hình 3.14: Lựa chọn hàm liên thuộc 28
Hình 3.15: Sai số với 3 chu kỳ 28
Hình 3.16: Sai số với 7 chu kỳ 29
Hình 3.17: Toolbox Fuzzy 29
Hình 3.18: 81 luật mờ 30
Hình 3.19: Ngõ vào thứ 1 30
Trang 6Hình 3.20: Ngõ vào thứ 2 30
Hình 3.21: Ngõ vào thứ 3 31
Hình 3.22: Ngõ vào thứ 4 31
Hình 3.23: Khối mô phỏng bộ điều khiển trượt với hệ Acrobot 33
Hình 3.24: Bên trong bộ điều khiển trượt 33
Hình 4.1: Kết quả nhập vào Matlab 35
Hình 4.2: Kết quả góc lệnh link 1 với Q là ma trận đơn vị 36
Hình 4.3: Kết quả góc lệnh link 2 với Q là ma trận đơn vị 36
Hình 4.4: Kết quả vận tốc góc link 1 với Q là ma trận đơn vị 37
Hình 4.5: Kết quả vận tốc góc link 2 với Q là ma trận đơn vị 37
Hình 4.6: Kết quả góc lệch của link 2 với Q là ma trận đơn vị so với Q(3,3)=300 38
Hình 4.7: Kết quả góc lệch của link 1 với Q là ma trận đơn vị so với Q(1,1)=400 39
Hình 4.8: Kết quả vận tốc góc link 1 với Q là ma trận đơn vị so với Q(2,2)=400 39
Hình 4.9: Kết quả tín hiệu điều khiển với Q và R là ma trận đơn vị 40
Hình 4.10 Kết quả tín hiệu điều khiển với R=100 41
Hình 4.11: Tín hiệu ngõ vào (Random Number) của bộ điều khiển LQR với thời gian thu thập 1 giây 42
Hình 4.12: Tín hiệu ngõ ra của bộ điều khiển LQR với thời gian 1 giây 42
Hình 4.13: Bộ điều khiển mờ học trong 3 chu kì và số hàm liên thuộc cho từng ngõ vào lần lượt là 3 3 3 3 42
Hình 4.14: So sánh góc lệch link 1 giữa bộ điều khiển LQR và Fuzzy 43
Hình 4.15: So sánh góc lệch link 2 giữa bộ điều khiển LQR và Fuzzy 43
Hình 4.16: Tín hiệu ngõ vào (Random Number) của bộ điều khiển LQR với thời gian thu thập là 50 giây 43
Hình 4.17: Tín hiệu ngõ ra của bộ điều khiển LQR với thời gian 50 giây 44 Hình 4.18: Bộ điều khiển mờ học trong 3 chu kì và số hàm liên thuộc cho từng
Trang 7vi
Hình 4.19: So sánh góc lệch link 1 giữa 2 bộ điều khiển LQR và Fuzzy đã cải
thiện 44
Hình 4.20: So sánh góc lệch link 2 giữa bộ điều khiển LQR và Fuzzy đã cải thiện 45
Hình 4.21: Góc lệch link 2 với a1=alpha=1 dùng hàm sign 45
Hình 4.22: Tín hiệu điều khiển của bộ điều khiển trượt dùng hàm sign 46
Hình 4.23: Góc lệch link 2 với a1=alpha=1 dùng hàm saturation 46
Hình 4.24: Tín hiệu điều khiển của bộ điều khiển trượt dùng hàm saturation 47
Hình 4.25: Góc lệch link 2 khi alpha=10 và a1=1 47
Hình 4.26: Góc lệch link 2 khi alpha=50 và a1=1 48
Hình 4.27: Góc lệch link 2 khi alpha=500 và a1=1 48
Trang 8DANH MỤC BẢNG BIỂU
Bảng 2-1: Các thông số của hệ thống 13Bảng 3-1: Thông số hệ thống 23
Trang 9viii
DANH MỤC CHỮ VIẾT TẮT
Education – Đại học Sư phạm kĩ thuật TPHCM
Trang 10BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐH SƯ PHẠM KỸ THUẬT TPHCM
THÔNG TIN KẾT QUẢ NGHIÊN CỨU CỦA ĐỀ TÀI
1 Thông tin chung:
- Tên đề tài: KHẢO SÁT ƯU NHƯỢC ĐIỂM CỦA CÁC GIẢI THUẬT TUYẾN
TÍNH/ PHI TUYẾN/THÔNG MINH TRONG VIỆC ỔN ĐỊNH CÂN BẰNG CHO
HỆ ACROBOT
Trang 11một bài báo khoa học (của tạp chí chuyên ngành trong nước, có phản biện) cho thành tích chung của nhà trường
3 Tính mới và sáng tạo:
Trong nước:
Acrobot là một mô hình khá mới ở Việt Nam Một số đề tài thực hiện thành công ổn định hệ thống này trên mô phỏng bằng các giải thuật như LQR [1] Giải pháp điều khiển thực nghiệm bằng giải thuật LQR cũng được thực nghiệm thành công trên mô hình thực [2], [3] Ngoài ra, các giải thuật khác chưa được thực hiện trên mô hình này Tuy nhiên, các công trình trên chỉ để chứng tỏ các giải thuật LQR ổn định được hệ thống ổn định ở vị trí TOP Trong [4], giải thuật PD-fuzzy được chứng tỏ là tốt hơn PID Đây là một nghiên cứu chứng tỏ rằng giải thuật lai tốt hơn tuyến tính đơn thuần Đây là 2 giải thuật mà có sự liên quan đến nhau (đều xuất phát từ PID) Tuy nhiên, nghiên cứu so sánh về các giải thuật với nhau vẫn còn chưa được đào sâu, đặc biệt là giữa một loạt các giải thuật có đặc trưng hoàn toàn khác biệt nhau như tuyến tính - phi tuyến thông minh
Ngoài nước:
Đối tượng acrobot là một đối tượng quen thuộc trong các nghiên cứu ở nước ngoài Đối tượng này có cấu trúc khá giống với pendubot nhưng với động cơ được dời lên link 2 so với link 1 Tuy ít công trình nghiên cứu so với pendubot, các nhà nghiên cứu nước ngoài cũng đã thành công trong việc điều khiển PID [7], LQR [8], backstepping [9], trượt [10], fuzzy [11] cho acrobot Tuy nhiên, các công trình trên cũng chỉ chứng minh từng giải thuật riêng biệt ổn định chứ chưa có sự so sánh giữa các giải thuật với nhau Các hệ phương trình toán học cũng như thông số mô hình của acrobot trong các công trình trên cũng chưa đồng nhất Vì thế, việc so sánh chất lượng điều khiển là chưa thực hiện được Do đó, một nghiên cứu so sánh giữa các giải thuật hoàn toàn khác biệt nhau vẫn là một nghiên cứu mới
4 Kết quả nghiên cứu:
- Chương trình điều khiển mô phỏng giải thuật tuyến tính trên Matlab/Simulink
- Chương trình điều khiển mô phỏng giải thuật phi tuyến trên Matlab/Simulink
- Chương trình điều khiển mô phỏng giải thuật thông minh trên Matlab/Simulink
- Quyển báo cáo tổng kết
- Bài báo khoa học
Trang 125 Đóng góp về mặt giáo dục và đào tạo, kinh tế - xã hội, an ninh, quốc phòng và khả năng áp dụng của đề tài:
6 Công bố khoa học của SV từ kết quả nghiên cứu của đề tài (ghi rõ tên tạp chí
nếu có) hoặc nhận xét, đánh giá của cơ sở đã áp dụng các kết quả nghiên cứu (nếu có):
Tp.HCM, Ngày 01 tháng 06 năm 2022
SV chịu trách nhiệm chính thực hiện đề tài
(kí, họ và tên)
Nhận xét của người hướng dẫn về những đóng góp khoa học của SV thực hiện đề
tài (phần này do người hướng dẫn ghi):
Tp.HCM, Ngày 01 tháng 06 năm 2022
Người hướng dẫn
(kí, họ và tên)
Trang 13CHƯƠNG 1 DẪN NHẬP
Trang 141.1 Đặt vấn đề
Trong thời kỳ công nghiệp hóa hiện đại hóa đất nước, với sự tiến bộ và phát
triển vượt bậc về khoa học kỹ thuật, đặc biệt là trong lĩnh vực điều khiển tư động hóa Các hệ thống điều khiển được áp dụng các quy luật điều khiển kinh điển đến hiện đại, điều khiển thông minh, điều khiển bằng trí tuệ nhân tạo cũng lần lượt được ra đời Hệ cánh tay máy, hệ con lắc ngược xoay, hệ xe con lắc ngược…đều được giải quyết bởi các bài toán ổn định hệ thống với độ chính xác tương đối cao, tính ổn định bền vững
và thời gian đáp ứng nhanh Các phương pháp này ngày càng được nghiên cứu, phát triển, ứng dụng rộng rãi, góp phần tăng chất lượng và độ ổn định của hệ thống Đây là bước tiến mạnh mẽ để phát triển ngành khoa học điều khiển thông minh, điều khiển hiện đại, đây là lĩnh vực nghiên cứu mới và đầy tiềm năng
Acrobot là một mô hình khá mới ở Việt Nam Acrobot là một ví dụ điển hình cho các hệ thống có tham số đầu vào điều khiển nhỏ hơn bậc của mô hình Hệ thống acrobot là một hệ thông phi tuyến tính và rất khó điều khiển được, có thể sử dụng làm đối tượng để nghiên cứu và thử nghiệm cho nhiều thuật toán điều khiển
1.1 Lý do chọn đề tài
Một số đề tài thực hiện thành công ổn định hệ thống này trên mô phỏng bằng các giải thuật như LQR [1] Giải pháp điều khiển thực nghiệm bằng giải thuật LQR cũng được thực nghiệm thành công trên mô hình thực [2], [3] Ngoài ra, các giải thuật khác chưa được thực hiện trên mô hình này Tuy nhiên, các công trình trên chỉ để chứng tỏ các giải thuật LQR ổn định được hệ thống ổn định ở vị trí TOP Trong [4], giải thuật PD-fuzzy được chứng tỏ là tốt hơn PID Đây là một nghiên cứu chứng tỏ rằng giải thuật lai tốt hơn tuyến tính đơn thuần Đây là 2 giải thuật mà có sự liên quan đến nhau (đều xuất phát từ PID) Tuy nhiên, nghiên cứu so sánh về các giải thuật với nhau vẫn còn chưa được đào sâu, đặc biệt là giữa một loạt các giải thuật có đặc trưng hoàn toàn khác biệt nhau như tuyến tính- phi tuyến thông minh
Đối tượng acrobot là một đối tượng quen thuộc trong các nghiên cứu ở nước ngoài Đối tượng này có cấu trúc khá giống với pendubot nhưng với động cơ được dời lên link 2 so với link 1 Tuy ít công trình nghiên cứu so với pendubot, các nhà nghiên
Trang 15các giải thuật với nhau Các hệ phương trình toán học cũng như thông số mô hình của acrobot trong các công trình trên cũng chưa đồng nhất Vì thế, việc so sánh chất lượng điều khiển là chưa thực hiện được Do đó, một nghiên cứu so sánh giữa các giải thuật hoàn toàn khác biệt nhau vẫn là một nghiên cứu mới
1.2 Đối tượng nghiên cứu
Nghiên cứu và tìm hiểu về Acrobot và các giải thuật điều khiển đối tượng này, thông qua đề tài nhóm xây dựng từng dạng giải thuật điều khiển (tuyến tính/ phi tuyến/ thông minh) để cân bằng ổn định cho acrobot Thiết kế các bộ điều khiển trên dựa vào
cơ sở mô hình toán học đã được kiểm chứng xác thực của Acrobot, các giải thuật được thiết kế trên cùng một chuẩn mô hình và bộ thông số mô hình nên các kết quả điều khiển có thể được so sánh và đối chiếu với nhau Sử dụng phần mềm Matlab – Simulink làm công cụ xây dung mô hình và mô phỏng hệ thống Từ đó, nhóm rút ra được các ưu khuyết điểm của các giải thuật với nhau
1.2 Phương pháp nghiên cứu
Nghiên cứu lý thuyết kết hợp kiểm chứng thông qua mô phỏng
Nghiên cứu lý thuyết:
Nghiên cứu xây dựng mô hình toán học hệ Acrobot
Nghiên cứu và tiến hành thiết kế bộ điều khiển LQR, bộ điều khiển mờ (Fuzzy)
và bộ điều khiển trượt (Sliding mode) để điều khiển cân bằng hệ Acrobot
Phương pháp mô phỏng:
Sử dụng phần mềm Matlab/Simulink làm công cụ xây dựng mô hình và mô phỏng hệ thống Acrobot
1.3 Giới hạn đề tài
Chỉ điều khiển hệ thống ở vị trí TOP, không điều khiển hệ thống ở vị trí khác
Nhóm tiến hành điều khiển cân bằng, chưa đề cập đến điều khiển bám quỹ đạo
Chỉ mô phỏng được thực hiện, thực nghiệm chưa được tiến hành
Tín hiệu ngõ vào hệ thống là moment do động cơ tạo ra, chưa phải điện áp cấp cho động cơ
1.4 Dàn ý nghiên cứu
1.4.1 Cấu trúc hệ Acrobot
Mô tả toán học về cấu trúc hệ Acrobot
Đề xuất các giải pháp điều khiển
Trang 161.4.2 Giải thuật LQR, Fuzzy, Sliding Mode
Giới thiệu về giải thuật tối ưu LQR
Giới thiệu về giải thuật logic mờ (Fuzzy)
Giới thiệu về giải thuật trượt (Sliding mode)
Ngoài ra, với mô hình Acrobot và giải thuật điều khiển được xây dựng trong đề tài có thể phát triển theo hướng hoàn chỉnh để đưa vào nghiên cứu khoa học, thử nghiệm các giải thuật điều khiển, ứng dụng sản xuất đơn giản hay theo hướng phát triển lên để xây dựng một hệ thống vận hành phức tạp, thông minh và hiệu quả cao hơn Mục tiêu đề tài là một tài liệu tham khảo tốt cho sinh viên/ học viên cao học/ nghiên cứu sinh trong việc điều khiển đối tượng SIMO có dạng thức cơ cấu chấp hành được đặt ở khâu thụ động Bên cạnh đó, mục tiêu của đề tài cũng là đóng góp một bài báo khoa học (của tạp chí chuyên ngành trong nước, có phản biện) cho thành tích chung của nhà trường
Trang 17CHƯƠNG 2 TỔNG QUAN VỀ CẤU
TRÚC HỆ THỐNG
Trang 182.1 Giới thiệu về hệ Acrobot
Ngày nay, khi khoa học - công nghệ ngày càng phát triển rộng rãi và gần đây là cuộc cách mạng 4.0 đã tác động mạnh mẽ đến đời sống sản xuất, sinh hoạt của con người Nhằm hướng đến một cuộc sống mà con người ít phải trực tiếp bỏ sức lao động làm, nhưng vẫn thu được năng suất, chất lượng sản phẩm, độ chính xác cao, giúp cho con người có một cuộc sống thuận tiện và thoải mái hơn Sự góp mặt của tự động hóa quá trình công nghệ đã góp phần không nhỏ đến mục tiêu này Nó đã và đang phát triển và ứng dụng mạnh mẽ trong công nghiệp, cụ thể như công nghiệp hóa lọc dầu, công nghiệp hóa chất, công nghiệp xử lý nước, sản xuất giấy, sản xuất xi măng…cũng như trong các lĩnh vực khác của đời sống Đặc biệt hơn, tự động hóa quá trình giúp con người tránh khỏi những công việc nặng nhọc, trong môi trường độc hại, khai thác những nơi con người không thể đặt chân đến
Việc sử dụng các bộ điều khiển như LQR, mô hình mờ, trượt và kết hợp fuzzy được áp dụng để điều khiển tối ưu tất cả các loại rô bốt Đây được coi là một bước tiến mạnh mẽ của công nghệ nhằm giúp cho rô bốt đạt được các yêu cầu đặt ra Đối với hệ thống acrobot, các thuật toán điều khiển sự cân bằng luôn được chú trọng trong việc lựa chọn bộ điều khiển cho phù hợp để điều khiển một cách tối ưu nhất Robot hiện đại được điều khiển bằng các thuật toán cổ điển, thuật toán di truyền và thuật toán thông minh trong đó tín hiệu nhiễu không được tính đến
PD-Hệ SIMO là một lớp các đối tượng quan trọng trong lĩnh vực điều khiển cân bằng, được đại diện bởi các đối tượng chỉ có 1 tín hiệu điều khiển nhưng phải tác động đến nhiều biến trạng thái của hệ (một số đối tượng được thể hiện từ Hình 2.1 đến Hình 2.4)
Hình 2.1: Hệ reaction wheel
inverted pendulum
Hình 2.2: Hệ bóng thanh trục giữa
Trang 19Hình 2.3: Hệ con lắc ngược trên xe Hình 2.4: Hệ cần trục
Các hệ thống trên đều có đặc điểm chung là đơn giản về cơ khí nhưng mô tả tốt các hệ phi tuyến có thể gặp, rất phù hợp để đào tạo và nghiên cứu trong phòng thí nghiệm có chi phí thấp
Việc giải quyết vấn đề của một đối tượng có ảnh hưởng tương ứng đến các đối tượng khác Do đó, việc nghiên cứu giải thuật thành công trên một đối tượng cân bằng trong phòng thí nghiệm như con lắc ngược có thể hỗ trợ cho việc thiết kế bộ cân bằng cho tên lửa khi phóng… Trong các hệ thống trên, acrobot là một hệ SIMO điển hình thường được sử dụng trong nghiên cứu lý thuyết điều khiển Cấu trúc thông thường về
cơ khí được thể hiện ở Hình 2.1 Việc có cấu trúc cơ khi đơn giản, dễ chế tạo, giá thành rẻ nhưng có tính phi tuyến cao giúp hệ thống này là một đối tượng lý tưởng để sinh viên/ học viên cao học/ nghiên cứu sinh nghiên cứu về giải thuật
Acrobot là một hệ thống phi tuyến điển hình với hai điểm cân bằng Một điểm là điểm cân bằng ổn định hướng xuống theo phương thẳng đứng; điểm còn lại là điểm cân bằng không ổn định hướng lên theo phương thẳng đứng Mục tiêu điều khiển là làm cho Acrobot đu lên một cách nhanh chóng và trơn tru từ điểm cân bằng ổn định đến điểm cân bằng không ổn định và giữ nó cân bằng ở đó Do đặc điểm của ít người điều khiển hơn, robot hoạt động kém có kích thước nhỏ hơn, trọng lượng nhẹ hơn, chi phí thấp hơn và tiêu thụ năng lượng
Trong hệ thống acrobot thì có khác so với hệ thống pendubot, ở đầu link 1 thì sẽ không gắn động cơ hay cơ cấu chấp hành mà nó sẽ gắn động cơ cố định vào đầu còn lại của link 1 Sự di chuyển của link 2 làm ảnh hưởng gián tiếp đến vị trí của link 1 Như vậy, cơ cấu chấp hành ở acrobot thì điều khiển link 2 và không điều khiển link 1 Tóm lại việc điều khiển acrobot ngược lại so với pendubot, việc điều khiển acrobot sẽ khó khăn hơn
Trang 20Đối với bài toán điều khiển acrobot, thì trong bài nhóm tác giả chỉ thực hiện điều khiển vị trí TOP trong trường hợp điều khiển ổn định tại chỗ Đối với điều khiển ở vị trí TOP, động cơ sẽ phải tác động theo một giải thuật phù hợp để giữ ổn định link 1 và link 2 ở vị trí thẳng đứng hướng lên Thông thường, điều khiển vị trí TOP được quan tâm nhiều hơn so với điều khiển ở các vị trí khác Đồng thời, việc điều khiển quỹ đạo của acrobot được thực hiện bằng cách điều khiển sao cho link 2 bám theo 1 quỹ đạo cho trước trong khi link 1 vẫn đứng yên
Hình 2.5: Vị trí TOP của Acrobot
Nhóm tập trung tìm hiểu về điều khiển xoay lên cho Acrobot hai bậc để nghiên cứu các vấn đề trong điều khiển phi tuyến và robot Động lực học của Acrobot đủ phức tạp để mang lại sự khó khăn cho các bài toán điều khiển phi tuyến, nhưng cũng đủ đơn giản để phân tích toán học một cách hoàn chỉnh Chính vì vậy, điều khiển xoay lên đã trở thành một bài toán để xác minh tính hiệu quả của phương pháp điều khiển phi tuyến cũng như trong tính toán thiết kế
Có hai loại acrobot: một là acrobot điều khiển trực tiếp có liên kết thứ hai được điều khiển trực tiếp và liên kết kia là điều khiển acrobot có liên kết thứ hai là điều khiển từ xa bởi một bộ truyền động được gắn ở một đế cố định Vấn đề kiểm soát xoay lên là di chuyển Acrobot từ vị trí đi xuống ổn định của nó đến vị trí đảo ngược không
ổn định của nó và cân bằng nó về phương thẳng đứng Do phạm vi chuyển động lớn, vấn đề xoay lên là rất phi tuyến tính và đầy thách thức
Trang 21Hình 2.6: Acrobot thực tế
2.2 Phương Trình toán học của hệ Acrobot
Để thiết kế bộ điều khiển LQR cho bất kì nhà máy nào, mô hình hệ thống phải được phân tích và mô tả theo phương trình toán học Thông qua phương trình toán học
và các thông số của hệ thống, người thiết kế có thể tính toán giá trị của ma trận K dựa trên phương trình Riccati Sau khi tìm thấy giá trị của ma trận K, người thiết kế có thể điều khiển tín hiệu cho bộ điều khiển LQR Chẳng hạn như hệ thống Acrobot cũng được mô tả theo phương trình toán học
Acrobot cũng tương tự như Pendubot, điểm khác biệt giữa Pendubot và Acrobot
là ở vị trí động cơ điều khiển các khớp
Sơ đồ cấu trúc Acrobot được thể hiện như Hình 2.7
Hình 2.7: Mô hình toán học của hệ Acrobot 2-Link
Trang 22Các biến: q1, q2 và 2 Trong đó, q1 và q2 là các tín hiệu đầu ra và 2 là tín hiệu đầu vào Các biến này có giá trị không xác định Dựa trên bộ điều khiển được thiết kế, tác giả hoặc người thiết kế có thể biết được mối tương quan giữa tín hiệu đầu ra và tín hiệu đầu vào
Bảng 2.1: Các thông số của hệ thống
Ở Hình 2.7, trục hoành của hệ toạ độ Descartes được chọn sao cho mức tham chiếu
Trang 23Vậy hệ thống được mô tả từ phương trình ( 2.4 ) đến ( 2.5 ), từ ( 2.8 ) đến ( 2.11 )
Phương trình trạng thái được tạo ra dưới dạng:
Trang 24( 2.16)
Trang 2516
CHƯƠNG 3 GIẢI PHÁP ĐIỀU KHIỂN
HỆ ACROBOT
Trang 263.1 Giải thuật tuyến tính
Giải thuật LQR (Linear Quadratic Regulator) được biết đến là một thuật toán điều khiển được xây dựng trên nguyên lí hồi tiếp trạng thái (hay còn gọi là phương pháp tuyến tính hóa) Bộ điều khiển này thường được áp dụng trên các hệ thống phi tuyến với nhiều ngõ vào ra Bộ điều khiển LQR nhận tín hiệu đầu vào là trạng thái của
hệ thống cùng với tín hiệu mẫu để có thể tính toán và dùng nó làm tín hiệu để điều khiển hệ thống
Một hệ điều khiển được thiết kế ở chế độ làm việc tốt nhất là hệ luôn ở trạng thái tối ưu theo một tiêu chuẩn chất lượng nào đó (đạt giá trị cực trị) Trạng thái tối ưu có đạt được hay không tùy thuộc vào yêu cầu chất lượng đặt ra, sự hiểu biết về đối tượng
và các tác động lên đối tượng, điều kiện làm việc của hệ
Hình 3.1 Cấu trúc bộ điều khiển LQR
3.2 Giải thuật thông minh
Lý thuyết fuzzy logic được Zadeh, L.A nêu ra lần đầu tiên vào năm 1965 Lý thuyết này giải quyết các bài toán rất gần với cách tư duy của con người Tới nay, lý thuyết logic mờ đã phát triển rất mạnh mẽ và được ứng dụng trong nhiều lĩnh vực của cuộc sống Trong lĩnh vực tự dộng hóa logic mờ ngày càng được ứng dụng rộng rãi
Nó thực sự hữu dụng với các đối tượng phức tạp mà ta không biết rõ hàm truyền, logic
mờ có thể giải quyết các vấn đề mà điều khiển kinh điển không thể làm được
Phương pháp điều khiển mờ được xây dựng theo nguyên lý tư duy của con người Nói cách khác, điều khiển mờ là điều khiển theo lời nói Hoạt động của một bộ
Trang 2718
khiển mờ bao gồm 3 khối cơ bản: Khối mờ hoá, thiết bị hợp thành và khối giải mờ Ngoài ra còn có khối giao diện vào và giao diện ra
Hình 3.2: Cấu trúc bộ điều khiển mờ
Khối mờ hoá có chức năng chuyển mỗi giá tri rõ của biến ngôn ngữ đầu vào thành vector μ có số phần tử bằng số tập mờ đầu vào
Thiết bị hợp thành mà bản chất của nó sự triển khai luật hợp thành R được xây dựng trên cơ sở luật điều khiển
-Khối giải mờ có nhiệm vụ chuyển tập mờ đầu ra thành giá trị rõ y0 (ứng với
mỗi giá tri rõ x0 đề điều khiển đối tượng)
Giao diện đầu vào thực hiện việc tông hợp và chuyển đổi tin hiệu vào (từ tương
tự sang số), ngoài ra còn có thể có thêm các khâu phụ trợ đê thực hiện bài toán động như tích phân, vi phân
Giao diện đầu ra thực hiện chuyển đổi tín hiệu ra (từ số sang tương tự) để điều khiển đối tượng
3.3 Giải thuật phi tuyến
Điều khiển trượt (SMC) là một phương pháp điều khiển phi tuyến làm thay đổi động lực học của hệ thống phi tuyến làm thay đổi động lực học của hệ thống phi tuyến bằng cách sử dụng tín hiệu điều khiển không liên tục (nói đúng hơn là tín hiệu điều khiển có giá trị đặt) Buộc hệ thống ‘trượt’ dọc theo hành vi của hệ thống Phương trình phản hồi trạng thái không phải là một hàm liên tục theo thời gian
Thay vào đó, nó có thể chuyển từ hàm liên tục này sang hàm liên tục khác dựa trên vị trí hiện tại trong không gian trạng thái Ở đây nhóm chọn thêm bộ điều khiển trượt bởi vì ưu điểm của nó là đơn giản và có tính bền vững cao đồng thời có khả năng chống nhiễu tốt và đảm bảo hệ thống kín của ta ổn định tiệm cận Từ [6] ta có:
Trang 28Bộ điều khiển trượt
Hình 3.3: Sơ đồ bộ điều khiển trượt
Xét hệ thống phi tuyến được biểu diễn bởi phương trình vi phân:
X x x x là vector biến trạng thái
u – tín hiệu điều khiển
y – tín hiệu ra
n – bậc hệ thống Các hàm f f X( ),g g X( ) là các hàm phi tuyến không biết trước nhưng biết trước các chặn trên và dưới của chúng
min max,0 min max
Trang 29Trong không gian trạng thái n chiều, phương trình S 0 xác định một mặt cong được
gọi là mặt trượt (sliding surface) Luật điều khiển u được xác định sao cho S 0trong khoảng thời gian hữu hạn Các quỹ đạo pha của hệ thống được đưa về mặt trượt, bên trên mặt trượt, quỹ đạo pha bám theo điểmXd một cách tiệm cận
Để xác định luật điều khiển, đạo hàm ( 3.4 )theo thời gian, ta có:
Trang 30Với k là hằng số dương Giá trị của k được chọn sao cho trong trường hợp xấu nhất
0
SS khi S vẫn luôn thỏa mãn 0
Luật điều khiển u (3.10) đưa quỹ đạo pha của hệ thống về mặt trượt và duy trì một cách bền vững trên mặt trượt này
x 1
x 2
Sliding phase
Hình 3.4: Giải thuật trượt
Điều khiển trượt lý tưởng đòi hỏi luật điều khiển phải thay đổi tức thời ngay tại thời điểm quỹ đạo pha của hệ thống vừa chạm vào mặt trượt để đảm bảo khiS 0 thì
0
S Trong thực tế, điều này không thể thực hiện được do thời gian trễ hay quán tính của khâu chấp hành Kết quả là quỹ đạo pha tiếp tục vượt qua khỏi mặt trượt sau khi chạm vào nó và gây nên hiện tượng quỹ đạo pha dao động quanh mặt trượt (hiện tượng chattering) như Hình 3.5
x 1
x 2
S=0
X d (t)
Hình 3.5: Quỹ đạo thực tế của hệ trượt
Hiện tượng chattering là không mong muốn vì nó gây ra sai số điều khiển, làm phát nóng mạch điện tử, mài mòn các bộ phận cơ khí, kích động các mode tần số cao không được mô hình hóa, làm giảm chất lượng điều khiển hoặc mất ổn định
Người ta luôn tìm nhiều biện pháp khác nhau để làm giảm thiểu hoặc loại trừ hiện tượng này Một số cách để khắc phục hiện tượng chattering là sử dụng hàm saturation,
hàm sigmoid hoặc hàm sat-PI thay thế cho hàm sign; dùng logic mờ (fuzzy logic) để
Trang 3122
3.4 Xây dựng bộ điều khiển LQR
Ta có hệ phương trình toán của hệ acrobot như sau:
Trong đó: Ma trận Q và R là ma trận dương cần chọn lựa (ma trận trọng số) A và B là
ma trận tuyến tính hóa tại điểm làm việc
Điểm làm việc:
( 3.15 )