Khảo sát ưu nhược điềm của các giải thuật tuyến tính phi tuyến thông minh trong việc ổn định cân bằng cho hệ acrobot

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐH SƯ PHẠM KỸ THUẬT TPHCM BÁO CÁO TỔNG KẾT ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CỦA SINH VIÊN KHẢO SÁT ƯU NHƯỢC ĐIỂM CỦA CÁC GIẢI THUẬT TUYẾN TÍNH/ PHI TUYẾN/THÔNG

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT

S KC 0 0 7 6 8 4

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐH SƯ PHẠM KỸ THUẬT TPHCM

BÁO CÁO TỔNG KẾT

ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CỦA SINH VIÊN

KHẢO SÁT ƯU NHƯỢC ĐIỂM CỦA CÁC GIẢI THUẬT TUYẾN TÍNH/ PHI TUYẾN/THÔNG MINH TRONG VIỆC ỔN

ĐỊNH CÂN BẰNG CHO HỆ ACROBOT

SV2022-130

Thuộc nhóm ngành khoa học: Điều khiển tự động

Trang 3

iii

MỤC LỤC

MỤC LỤC iii

DANH MỤC HÌNH ẢNH iv

DANH MỤC BẢNG BIỂU vii

DANH MỤC CHỮ VIẾT TẮT viii

THÔNG TIN KẾT QUẢ NGHIÊN CỨU CỦA ĐỀ TÀI 1

CHƯƠNG 1 DẪN NHẬP 4

1.1 Đặt vấn đề 5

1.1 Lý do chọn đề tài 5

1.2 Đối tượng nghiên cứu 6

1.2 Phương pháp nghiên cứu 6

1.3 Giới hạn đề tài 6

1.4 Dàn ý nghiên cứu 6

1.4.1 Cấu trúc hệ Acrobot 6

1.4.2 Giải thuật LQR, Fuzzy, Sliding Mode 7

1.4.3 Phần mềm 7

1.3 Ý nghĩa thực tiễn 7

CHƯƠNG 2 TỔNG QUAN VỀ CẤU TRÚC HỆ THỐNG 8

2.1 Giới thiệu về hệ Acrobot 9

2.2 Phương Trình toán học của hệ Acrobot 12

CHƯƠNG 3 GIẢI PHÁP ĐIỀU KHIỂN HỆ ACROBOT 16

3.1 Giải thuật tuyến tính 17

3.2 Giải thuật thông minh 17

3.3 Giải thuật phi tuyến 18

3.4 Xây dựng bộ điều khiển LQR 22

3.5 Xây dựng bộ điều khiển FUZZY cho hệ dựa trên công cụ Anfis từ bộ điều khiển LQR 25

3.6 Xây dựng bộ điều khiển trượt 31

CHƯƠNG 4 KẾT QUẢ MÔ PHỎNG 34

Trang 4

4.1 Kiểm tra tính điều khiển được của hệ thống 35

4.2 Bộ điều khiển LQR 35

4.3 Bộ điều khiển Fuzzy 41

4.4 Bộ điều khiển trượt 45

CHƯƠNG 5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 50

5.1 Kết luận 51

5.2 Hướng phát triển 51

Trang 5

iv

DANH MỤC HÌNH ẢNH

Hình 2.1: Hệ reaction wheel inverted pedulum 9

Hình 2.2: Hệ bóng thanh trục giữa 9

Hình 2.3: Hệ con lắc ngược trên xe 10

Hình 2.4: Hệ cần trục 10

Hình 2.5: Vị trí TOP của Acrobot 11

Hình 2.6: Acrobot thực tế 12

Hình 2.7: Mô hình toán học của hệ Acrobot 2-Link 12

Hình 3.1 Cấu trúc bộ điều khiển LQR 17

Hình 3.2: Cấu trúc bộ điều khiển mờ 18

Hình 3.3: Sơ đồ bộ điều khiển trượt 19

Hình 3.4: Giải thuật trượt 21

Hình 3.5: Quỹ đạo thực tế của hệ trượt 21

Hình 3.6: Khối mô phỏng hệ Acrobot 24

Hình 3.7: Mô hình mô phỏng bộ điều khiển LQR với hệ Acrobot 24

Hình 3.8: Khối thu thập dữ liệu 25

Hình 3.9: Tín hiệu ngõ vào(Random Number) tác động vào bộ điều khiển LQR 25

Hình 3.10: Dữ liệu xuất ra workspace của tín hiệu ngõ vào tác động vào bộ điều khiển LQR 26

Hình 3.11: Dữ liệu xuất ra workspace của tín hiệu ngõ ra của bộ điều khiển LQR 26

Hình 3.12: Dữ liệu workspace data 27

Hình 3.13: Dữ liệu data trên anfis 27

Hình 3.14: Lựa chọn hàm liên thuộc 28

Hình 3.15: Sai số với 3 chu kỳ 28

Hình 3.16: Sai số với 7 chu kỳ 29

Hình 3.17: Toolbox Fuzzy 29

Hình 3.18: 81 luật mờ 30

Hình 3.19: Ngõ vào thứ 1 30

Trang 6

Hình 3.23: Khối mô phỏng bộ điều khiển trượt với hệ Acrobot 33

Hình 3.24: Bên trong bộ điều khiển trượt 33

Hình 4.1: Kết quả nhập vào Matlab 35

Hình 4.2: Kết quả góc lệnh link 1 với Q là ma trận đơn vị 36

Hình 4.3: Kết quả góc lệnh link 2 với Q là ma trận đơn vị 36

Hình 4.4: Kết quả vận tốc góc link 1 với Q là ma trận đơn vị 37

Hình 4.5: Kết quả vận tốc góc link 2 với Q là ma trận đơn vị 37

Hình 4.6: Kết quả góc lệch của link 2 với Q là ma trận đơn vị so với Q(3,3)=300 38

Hình 4.7: Kết quả góc lệch của link 1 với Q là ma trận đơn vị so với Q(1,1)=400 39

Hình 4.8: Kết quả vận tốc góc link 1 với Q là ma trận đơn vị so với Q(2,2)=400 39

Hình 4.9: Kết quả tín hiệu điều khiển với Q và R là ma trận đơn vị 40

Hình 4.10 Kết quả tín hiệu điều khiển với R=100 41

Hình 4.11: Tín hiệu ngõ vào (Random Number) của bộ điều khiển LQR với thời gian thu thập 1 giây 42

Hình 4.12: Tín hiệu ngõ ra của bộ điều khiển LQR với thời gian 1 giây 42

Hình 4.13: Bộ điều khiển mờ học trong 3 chu kì và số hàm liên thuộc cho từng ngõ vào lần lượt là 3 3 3 3 42

Hình 4.14: So sánh góc lệch link 1 giữa bộ điều khiển LQR và Fuzzy 43

Hình 4.15: So sánh góc lệch link 2 giữa bộ điều khiển LQR và Fuzzy 43

Hình 4.16: Tín hiệu ngõ vào (Random Number) của bộ điều khiển LQR với thời gian thu thập là 50 giây 43

Hình 4.17: Tín hiệu ngõ ra của bộ điều khiển LQR với thời gian 50 giây 44 Hình 4.18: Bộ điều khiển mờ học trong 3 chu kì và số hàm liên thuộc cho từng

Trang 7

vi

Hình 4.19: So sánh góc lệch link 1 giữa 2 bộ điều khiển LQR và Fuzzy đã cải

thiện 44

Hình 4.20: So sánh góc lệch link 2 giữa bộ điều khiển LQR và Fuzzy đã cải thiện 45

Hình 4.21: Góc lệch link 2 với a1=alpha=1 dùng hàm sign 45

Hình 4.22: Tín hiệu điều khiển của bộ điều khiển trượt dùng hàm sign 46

Hình 4.23: Góc lệch link 2 với a1=alpha=1 dùng hàm saturation 46

Hình 4.24: Tín hiệu điều khiển của bộ điều khiển trượt dùng hàm saturation 47

Hình 4.25: Góc lệch link 2 khi alpha=10 và a1=1 47

Trang 8

DANH MỤC BẢNG BIỂU

Bảng 2-1: Các thông số của hệ thống 13Bảng 3-1: Thông số hệ thống 23

Trang 9

viii

DANH MỤC CHỮ VIẾT TẮT

Education – Đại học Sư phạm kĩ thuật TPHCM

Trang 10

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐH SƯ PHẠM KỸ THUẬT TPHCM

THÔNG TIN KẾT QUẢ NGHIÊN CỨU CỦA ĐỀ TÀI

1 Thông tin chung:

- Tên đề tài: KHẢO SÁT ƯU NHƯỢC ĐIỂM CỦA CÁC GIẢI THUẬT TUYẾN

TÍNH/ PHI TUYẾN/THÔNG MINH TRONG VIỆC ỔN ĐỊNH CÂN BẰNG CHO

HỆ ACROBOT

Trang 11

một bài báo khoa học (của tạp chí chuyên ngành trong nước, có phản biện) cho thành tích chung của nhà trường

3 Tính mới và sáng tạo:

Trong nước:

Acrobot là một mô hình khá mới ở Việt Nam Một số đề tài thực hiện thành công ổn định hệ thống này trên mô phỏng bằng các giải thuật như LQR [1] Giải pháp điều khiển thực nghiệm bằng giải thuật LQR cũng được thực nghiệm thành công trên mô hình thực [2], [3] Ngoài ra, các giải thuật khác chưa được thực hiện trên mô hình này Tuy nhiên, các công trình trên chỉ để chứng tỏ các giải thuật LQR ổn định được hệ thống ổn định ở vị trí TOP Trong [4], giải thuật PD-fuzzy được chứng tỏ là tốt hơn PID Đây là một nghiên cứu chứng tỏ rằng giải thuật lai tốt hơn tuyến tính đơn thuần Đây là 2 giải thuật mà có sự liên quan đến nhau (đều xuất phát từ PID) Tuy nhiên, nghiên cứu so sánh về các giải thuật với nhau vẫn còn chưa được đào sâu, đặc biệt là giữa một loạt các giải thuật có đặc trưng hoàn toàn khác biệt nhau như tuyến tính - phi tuyến thông minh

Ngoài nước:

Đối tượng acrobot là một đối tượng quen thuộc trong các nghiên cứu ở nước ngoài Đối tượng này có cấu trúc khá giống với pendubot nhưng với động cơ được dời lên link 2 so với link 1 Tuy ít công trình nghiên cứu so với pendubot, các nhà nghiên cứu nước ngoài cũng đã thành công trong việc điều khiển PID [7], LQR [8], backstepping [9], trượt [10], fuzzy [11] cho acrobot Tuy nhiên, các công trình trên cũng chỉ chứng minh từng giải thuật riêng biệt ổn định chứ chưa có sự so sánh giữa các giải thuật với nhau Các hệ phương trình toán học cũng như thông số mô hình của acrobot trong các công trình trên cũng chưa đồng nhất Vì thế, việc so sánh chất lượng điều khiển là chưa thực hiện được Do đó, một nghiên cứu so sánh giữa các giải thuật hoàn toàn khác biệt nhau vẫn là một nghiên cứu mới

4 Kết quả nghiên cứu:

- Chương trình điều khiển mô phỏng giải thuật tuyến tính trên Matlab/Simulink

- Chương trình điều khiển mô phỏng giải thuật phi tuyến trên Matlab/Simulink

- Chương trình điều khiển mô phỏng giải thuật thông minh trên Matlab/Simulink

- Quyển báo cáo tổng kết

- Bài báo khoa học

Trang 12

5 Đóng góp về mặt giáo dục và đào tạo, kinh tế - xã hội, an ninh, quốc phòng và khả năng áp dụng của đề tài:

6 Công bố khoa học của SV từ kết quả nghiên cứu của đề tài (ghi rõ tên tạp chí

nếu có) hoặc nhận xét, đánh giá của cơ sở đã áp dụng các kết quả nghiên cứu (nếu có):

Tp.HCM, Ngày 01 tháng 06 năm 2022

SV chịu trách nhiệm chính thực hiện đề tài

(kí, họ và tên)

Nhận xét của người hướng dẫn về những đóng góp khoa học của SV thực hiện đề

tài (phần này do người hướng dẫn ghi):

Tp.HCM, Ngày 01 tháng 06 năm 2022

Người hướng dẫn

(kí, họ và tên)

Trang 13

CHƯƠNG 1 DẪN NHẬP

Trang 14

1.1 Đặt vấn đề

Trong thời kỳ công nghiệp hóa hiện đại hóa đất nước, với sự tiến bộ và phát

triển vượt bậc về khoa học kỹ thuật, đặc biệt là trong lĩnh vực điều khiển tư động hóa Các hệ thống điều khiển được áp dụng các quy luật điều khiển kinh điển đến hiện đại, điều khiển thông minh, điều khiển bằng trí tuệ nhân tạo cũng lần lượt được ra đời Hệ cánh tay máy, hệ con lắc ngược xoay, hệ xe con lắc ngược…đều được giải quyết bởi các bài toán ổn định hệ thống với độ chính xác tương đối cao, tính ổn định bền vững

và thời gian đáp ứng nhanh Các phương pháp này ngày càng được nghiên cứu, phát triển, ứng dụng rộng rãi, góp phần tăng chất lượng và độ ổn định của hệ thống Đây là bước tiến mạnh mẽ để phát triển ngành khoa học điều khiển thông minh, điều khiển hiện đại, đây là lĩnh vực nghiên cứu mới và đầy tiềm năng

Acrobot là một mô hình khá mới ở Việt Nam Acrobot là một ví dụ điển hình cho các hệ thống có tham số đầu vào điều khiển nhỏ hơn bậc của mô hình Hệ thống acrobot là một hệ thông phi tuyến tính và rất khó điều khiển được, có thể sử dụng làm đối tượng để nghiên cứu và thử nghiệm cho nhiều thuật toán điều khiển

1.1 Lý do chọn đề tài

Một số đề tài thực hiện thành công ổn định hệ thống này trên mô phỏng bằng các giải thuật như LQR [1] Giải pháp điều khiển thực nghiệm bằng giải thuật LQR cũng được thực nghiệm thành công trên mô hình thực [2], [3] Ngoài ra, các giải thuật khác chưa được thực hiện trên mô hình này Tuy nhiên, các công trình trên chỉ để chứng tỏ các giải thuật LQR ổn định được hệ thống ổn định ở vị trí TOP Trong [4], giải thuật PD-fuzzy được chứng tỏ là tốt hơn PID Đây là một nghiên cứu chứng tỏ rằng giải thuật lai tốt hơn tuyến tính đơn thuần Đây là 2 giải thuật mà có sự liên quan đến nhau (đều xuất phát từ PID) Tuy nhiên, nghiên cứu so sánh về các giải thuật với nhau vẫn còn chưa được đào sâu, đặc biệt là giữa một loạt các giải thuật có đặc trưng hoàn toàn khác biệt nhau như tuyến tính- phi tuyến thông minh

Đối tượng acrobot là một đối tượng quen thuộc trong các nghiên cứu ở nước ngoài Đối tượng này có cấu trúc khá giống với pendubot nhưng với động cơ được dời lên link 2 so với link 1 Tuy ít công trình nghiên cứu so với pendubot, các nhà nghiên

Trang 15

các giải thuật với nhau Các hệ phương trình toán học cũng như thông số mô hình của acrobot trong các công trình trên cũng chưa đồng nhất Vì thế, việc so sánh chất lượng điều khiển là chưa thực hiện được Do đó, một nghiên cứu so sánh giữa các giải thuật hoàn toàn khác biệt nhau vẫn là một nghiên cứu mới

1.2 Đối tượng nghiên cứu

Nghiên cứu và tìm hiểu về Acrobot và các giải thuật điều khiển đối tượng này, thông qua đề tài nhóm xây dựng từng dạng giải thuật điều khiển (tuyến tính/ phi tuyến/ thông minh) để cân bằng ổn định cho acrobot Thiết kế các bộ điều khiển trên dựa vào

cơ sở mô hình toán học đã được kiểm chứng xác thực của Acrobot, các giải thuật được thiết kế trên cùng một chuẩn mô hình và bộ thông số mô hình nên các kết quả điều khiển có thể được so sánh và đối chiếu với nhau Sử dụng phần mềm Matlab – Simulink làm công cụ xây dung mô hình và mô phỏng hệ thống Từ đó, nhóm rút ra được các ưu khuyết điểm của các giải thuật với nhau

1.2 Phương pháp nghiên cứu

Nghiên cứu lý thuyết kết hợp kiểm chứng thông qua mô phỏng

 Nghiên cứu lý thuyết:

 Nghiên cứu xây dựng mô hình toán học hệ Acrobot

 Nghiên cứu và tiến hành thiết kế bộ điều khiển LQR, bộ điều khiển mờ (Fuzzy)

và bộ điều khiển trượt (Sliding mode) để điều khiển cân bằng hệ Acrobot

 Phương pháp mô phỏng:

 Sử dụng phần mềm Matlab/Simulink làm công cụ xây dựng mô hình và mô phỏng hệ thống Acrobot

1.3 Giới hạn đề tài

 Chỉ điều khiển hệ thống ở vị trí TOP, không điều khiển hệ thống ở vị trí khác

 Nhóm tiến hành điều khiển cân bằng, chưa đề cập đến điều khiển bám quỹ đạo

 Chỉ mô phỏng được thực hiện, thực nghiệm chưa được tiến hành

 Tín hiệu ngõ vào hệ thống là moment do động cơ tạo ra, chưa phải điện áp cấp cho động cơ

1.4 Dàn ý nghiên cứu

1.4.1 Cấu trúc hệ Acrobot

 Mô tả toán học về cấu trúc hệ Acrobot

 Đề xuất các giải pháp điều khiển

Trang 16

1.4.2 Giải thuật LQR, Fuzzy, Sliding Mode

 Giới thiệu về giải thuật tối ưu LQR

 Giới thiệu về giải thuật logic mờ (Fuzzy)

 Giới thiệu về giải thuật trượt (Sliding mode)

Ngoài ra, với mô hình Acrobot và giải thuật điều khiển được xây dựng trong đề tài có thể phát triển theo hướng hoàn chỉnh để đưa vào nghiên cứu khoa học, thử nghiệm các giải thuật điều khiển, ứng dụng sản xuất đơn giản hay theo hướng phát triển lên để xây dựng một hệ thống vận hành phức tạp, thông minh và hiệu quả cao hơn Mục tiêu đề tài là một tài liệu tham khảo tốt cho sinh viên/ học viên cao học/ nghiên cứu sinh trong việc điều khiển đối tượng SIMO có dạng thức cơ cấu chấp hành được đặt ở khâu thụ động Bên cạnh đó, mục tiêu của đề tài cũng là đóng góp một bài báo khoa học (của tạp chí chuyên ngành trong nước, có phản biện) cho thành tích chung của nhà trường

Trang 17

CHƯƠNG 2 TỔNG QUAN VỀ CẤU

TRÚC HỆ THỐNG

Trang 18

2.1 Giới thiệu về hệ Acrobot

Ngày nay, khi khoa học - công nghệ ngày càng phát triển rộng rãi và gần đây là cuộc cách mạng 4.0 đã tác động mạnh mẽ đến đời sống sản xuất, sinh hoạt của con người Nhằm hướng đến một cuộc sống mà con người ít phải trực tiếp bỏ sức lao động làm, nhưng vẫn thu được năng suất, chất lượng sản phẩm, độ chính xác cao, giúp cho con người có một cuộc sống thuận tiện và thoải mái hơn Sự góp mặt của tự động hóa quá trình công nghệ đã góp phần không nhỏ đến mục tiêu này Nó đã và đang phát triển và ứng dụng mạnh mẽ trong công nghiệp, cụ thể như công nghiệp hóa lọc dầu, công nghiệp hóa chất, công nghiệp xử lý nước, sản xuất giấy, sản xuất xi măng…cũng như trong các lĩnh vực khác của đời sống Đặc biệt hơn, tự động hóa quá trình giúp con người tránh khỏi những công việc nặng nhọc, trong môi trường độc hại, khai thác những nơi con người không thể đặt chân đến

Việc sử dụng các bộ điều khiển như LQR, mô hình mờ, trượt và kết hợp fuzzy được áp dụng để điều khiển tối ưu tất cả các loại rô bốt Đây được coi là một bước tiến mạnh mẽ của công nghệ nhằm giúp cho rô bốt đạt được các yêu cầu đặt ra Đối với hệ thống acrobot, các thuật toán điều khiển sự cân bằng luôn được chú trọng trong việc lựa chọn bộ điều khiển cho phù hợp để điều khiển một cách tối ưu nhất Robot hiện đại được điều khiển bằng các thuật toán cổ điển, thuật toán di truyền và thuật toán thông minh trong đó tín hiệu nhiễu không được tính đến

PD-Hệ SIMO là một lớp các đối tượng quan trọng trong lĩnh vực điều khiển cân bằng, được đại diện bởi các đối tượng chỉ có 1 tín hiệu điều khiển nhưng phải tác động đến nhiều biến trạng thái của hệ (một số đối tượng được thể hiện từ Hình 2.1 đến Hình 2.4)

Hình 2.1: Hệ reaction wheel

inverted pendulum

Hình 2.2: Hệ bóng thanh trục giữa

Trang 19

Hình 2.3: Hệ con lắc ngược trên xe Hình 2.4: Hệ cần trục

Các hệ thống trên đều có đặc điểm chung là đơn giản về cơ khí nhưng mô tả tốt các hệ phi tuyến có thể gặp, rất phù hợp để đào tạo và nghiên cứu trong phòng thí nghiệm có chi phí thấp

Việc giải quyết vấn đề của một đối tượng có ảnh hưởng tương ứng đến các đối tượng khác Do đó, việc nghiên cứu giải thuật thành công trên một đối tượng cân bằng trong phòng thí nghiệm như con lắc ngược có thể hỗ trợ cho việc thiết kế bộ cân bằng cho tên lửa khi phóng… Trong các hệ thống trên, acrobot là một hệ SIMO điển hình thường được sử dụng trong nghiên cứu lý thuyết điều khiển Cấu trúc thông thường về

cơ khí được thể hiện ở Hình 2.1 Việc có cấu trúc cơ khi đơn giản, dễ chế tạo, giá thành rẻ nhưng có tính phi tuyến cao giúp hệ thống này là một đối tượng lý tưởng để sinh viên/ học viên cao học/ nghiên cứu sinh nghiên cứu về giải thuật

Acrobot là một hệ thống phi tuyến điển hình với hai điểm cân bằng Một điểm là điểm cân bằng ổn định hướng xuống theo phương thẳng đứng; điểm còn lại là điểm cân bằng không ổn định hướng lên theo phương thẳng đứng Mục tiêu điều khiển là làm cho Acrobot đu lên một cách nhanh chóng và trơn tru từ điểm cân bằng ổn định đến điểm cân bằng không ổn định và giữ nó cân bằng ở đó Do đặc điểm của ít người điều khiển hơn, robot hoạt động kém có kích thước nhỏ hơn, trọng lượng nhẹ hơn, chi phí thấp hơn và tiêu thụ năng lượng

Trong hệ thống acrobot thì có khác so với hệ thống pendubot, ở đầu link 1 thì sẽ không gắn động cơ hay cơ cấu chấp hành mà nó sẽ gắn động cơ cố định vào đầu còn lại của link 1 Sự di chuyển của link 2 làm ảnh hưởng gián tiếp đến vị trí của link 1 Như vậy, cơ cấu chấp hành ở acrobot thì điều khiển link 2 và không điều khiển link 1 Tóm lại việc điều khiển acrobot ngược lại so với pendubot, việc điều khiển acrobot sẽ khó khăn hơn

Trang 20

Đối với bài toán điều khiển acrobot, thì trong bài nhóm tác giả chỉ thực hiện điều khiển vị trí TOP trong trường hợp điều khiển ổn định tại chỗ Đối với điều khiển ở vị trí TOP, động cơ sẽ phải tác động theo một giải thuật phù hợp để giữ ổn định link 1 và link 2 ở vị trí thẳng đứng hướng lên Thông thường, điều khiển vị trí TOP được quan tâm nhiều hơn so với điều khiển ở các vị trí khác Đồng thời, việc điều khiển quỹ đạo của acrobot được thực hiện bằng cách điều khiển sao cho link 2 bám theo 1 quỹ đạo cho trước trong khi link 1 vẫn đứng yên

Hình 2.5: Vị trí TOP của Acrobot

Nhóm tập trung tìm hiểu về điều khiển xoay lên cho Acrobot hai bậc để nghiên cứu các vấn đề trong điều khiển phi tuyến và robot Động lực học của Acrobot đủ phức tạp để mang lại sự khó khăn cho các bài toán điều khiển phi tuyến, nhưng cũng đủ đơn giản để phân tích toán học một cách hoàn chỉnh Chính vì vậy, điều khiển xoay lên đã trở thành một bài toán để xác minh tính hiệu quả của phương pháp điều khiển phi tuyến cũng như trong tính toán thiết kế

Có hai loại acrobot: một là acrobot điều khiển trực tiếp có liên kết thứ hai được điều khiển trực tiếp và liên kết kia là điều khiển acrobot có liên kết thứ hai là điều khiển từ xa bởi một bộ truyền động được gắn ở một đế cố định Vấn đề kiểm soát xoay lên là di chuyển Acrobot từ vị trí đi xuống ổn định của nó đến vị trí đảo ngược không

ổn định của nó và cân bằng nó về phương thẳng đứng Do phạm vi chuyển động lớn, vấn đề xoay lên là rất phi tuyến tính và đầy thách thức

Trang 21

Hình 2.6: Acrobot thực tế

2.2 Phương Trình toán học của hệ Acrobot

Để thiết kế bộ điều khiển LQR cho bất kì nhà máy nào, mô hình hệ thống phải được phân tích và mô tả theo phương trình toán học Thông qua phương trình toán học

và các thông số của hệ thống, người thiết kế có thể tính toán giá trị của ma trận K dựa trên phương trình Riccati Sau khi tìm thấy giá trị của ma trận K, người thiết kế có thể điều khiển tín hiệu cho bộ điều khiển LQR Chẳng hạn như hệ thống Acrobot cũng được mô tả theo phương trình toán học

Acrobot cũng tương tự như Pendubot, điểm khác biệt giữa Pendubot và Acrobot

là ở vị trí động cơ điều khiển các khớp

Sơ đồ cấu trúc Acrobot được thể hiện như Hình 2.7

Hình 2.7: Mô hình toán học của hệ Acrobot 2-Link

Trang 22

Các biến: q1, q2 và 2 Trong đó, q1 và q2 là các tín hiệu đầu ra và 2 là tín hiệu đầu vào Các biến này có giá trị không xác định Dựa trên bộ điều khiển được thiết kế, tác giả hoặc người thiết kế có thể biết được mối tương quan giữa tín hiệu đầu ra và tín hiệu đầu vào

Bảng 2.1: Các thông số của hệ thống

Ở Hình 2.7, trục hoành của hệ toạ độ Descartes được chọn sao cho mức tham chiếu

Trang 23

Vậy hệ thống được mô tả từ phương trình ( 2.4 ) đến ( 2.5 ), từ ( 2.8 ) đến ( 2.11 )

Phương trình trạng thái được tạo ra dưới dạng:

Trang 24

( 2.16)

Trang 25

16

CHƯƠNG 3 GIẢI PHÁP ĐIỀU KHIỂN

HỆ ACROBOT

Trang 26

3.1 Giải thuật tuyến tính

Giải thuật LQR (Linear Quadratic Regulator) được biết đến là một thuật toán điều khiển được xây dựng trên nguyên lí hồi tiếp trạng thái (hay còn gọi là phương pháp tuyến tính hóa) Bộ điều khiển này thường được áp dụng trên các hệ thống phi tuyến với nhiều ngõ vào ra Bộ điều khiển LQR nhận tín hiệu đầu vào là trạng thái của

hệ thống cùng với tín hiệu mẫu để có thể tính toán và dùng nó làm tín hiệu để điều khiển hệ thống

Một hệ điều khiển được thiết kế ở chế độ làm việc tốt nhất là hệ luôn ở trạng thái tối ưu theo một tiêu chuẩn chất lượng nào đó (đạt giá trị cực trị) Trạng thái tối ưu có đạt được hay không tùy thuộc vào yêu cầu chất lượng đặt ra, sự hiểu biết về đối tượng

và các tác động lên đối tượng, điều kiện làm việc của hệ

Hình 3.1 Cấu trúc bộ điều khiển LQR

3.2 Giải thuật thông minh

Lý thuyết fuzzy logic được Zadeh, L.A nêu ra lần đầu tiên vào năm 1965 Lý thuyết này giải quyết các bài toán rất gần với cách tư duy của con người Tới nay, lý thuyết logic mờ đã phát triển rất mạnh mẽ và được ứng dụng trong nhiều lĩnh vực của cuộc sống Trong lĩnh vực tự dộng hóa logic mờ ngày càng được ứng dụng rộng rãi

Nó thực sự hữu dụng với các đối tượng phức tạp mà ta không biết rõ hàm truyền, logic

mờ có thể giải quyết các vấn đề mà điều khiển kinh điển không thể làm được

Phương pháp điều khiển mờ được xây dựng theo nguyên lý tư duy của con người Nói cách khác, điều khiển mờ là điều khiển theo lời nói Hoạt động của một bộ

Trang 27

18

khiển mờ bao gồm 3 khối cơ bản: Khối mờ hoá, thiết bị hợp thành và khối giải mờ Ngoài ra còn có khối giao diện vào và giao diện ra

Hình 3.2: Cấu trúc bộ điều khiển mờ

 Khối mờ hoá có chức năng chuyển mỗi giá tri rõ của biến ngôn ngữ đầu vào thành vector μ có số phần tử bằng số tập mờ đầu vào

 Thiết bị hợp thành mà bản chất của nó sự triển khai luật hợp thành R được xây dựng trên cơ sở luật điều khiển

 -Khối giải mờ có nhiệm vụ chuyển tập mờ đầu ra thành giá trị rõ y0 (ứng với

mỗi giá tri rõ x0 đề điều khiển đối tượng)

 Giao diện đầu vào thực hiện việc tông hợp và chuyển đổi tin hiệu vào (từ tương

tự sang số), ngoài ra còn có thể có thêm các khâu phụ trợ đê thực hiện bài toán động như tích phân, vi phân

 Giao diện đầu ra thực hiện chuyển đổi tín hiệu ra (từ số sang tương tự) để điều khiển đối tượng

3.3 Giải thuật phi tuyến

Điều khiển trượt (SMC) là một phương pháp điều khiển phi tuyến làm thay đổi động lực học của hệ thống phi tuyến làm thay đổi động lực học của hệ thống phi tuyến bằng cách sử dụng tín hiệu điều khiển không liên tục (nói đúng hơn là tín hiệu điều khiển có giá trị đặt) Buộc hệ thống ‘trượt’ dọc theo hành vi của hệ thống Phương trình phản hồi trạng thái không phải là một hàm liên tục theo thời gian

Thay vào đó, nó có thể chuyển từ hàm liên tục này sang hàm liên tục khác dựa trên vị trí hiện tại trong không gian trạng thái Ở đây nhóm chọn thêm bộ điều khiển trượt bởi vì ưu điểm của nó là đơn giản và có tính bền vững cao đồng thời có khả năng chống nhiễu tốt và đảm bảo hệ thống kín của ta ổn định tiệm cận Từ [6] ta có:

Trang 28

Bộ điều khiển trượt

Hình 3.3: Sơ đồ bộ điều khiển trượt

Xét hệ thống phi tuyến được biểu diễn bởi phương trình vi phân:

X  x x x   là vector biến trạng thái

u – tín hiệu điều khiển

y – tín hiệu ra

n – bậc hệ thống Các hàm f  f X( ),g g X( ) là các hàm phi tuyến không biết trước nhưng biết trước các chặn trên và dưới của chúng

min max,0 min max

Trang 29

Trong không gian trạng thái n chiều, phương trình S 0 xác định một mặt cong được

gọi là mặt trượt (sliding surface) Luật điều khiển u được xác định sao cho S 0trong khoảng thời gian hữu hạn Các quỹ đạo pha của hệ thống được đưa về mặt trượt, bên trên mặt trượt, quỹ đạo pha bám theo điểmXd một cách tiệm cận

Để xác định luật điều khiển, đạo hàm ( 3.4 )theo thời gian, ta có:

Trang 30

Với k là hằng số dương Giá trị của k được chọn sao cho trong trường hợp xấu nhất

0

SS  khi S  vẫn luôn thỏa mãn 0

Luật điều khiển u (3.10) đưa quỹ đạo pha của hệ thống về mặt trượt và duy trì một cách bền vững trên mặt trượt này

x 1

x 2

Sliding phase

Hình 3.4: Giải thuật trượt

Điều khiển trượt lý tưởng đòi hỏi luật điều khiển phải thay đổi tức thời ngay tại thời điểm quỹ đạo pha của hệ thống vừa chạm vào mặt trượt để đảm bảo khiS 0 thì

0

S  Trong thực tế, điều này không thể thực hiện được do thời gian trễ hay quán tính của khâu chấp hành Kết quả là quỹ đạo pha tiếp tục vượt qua khỏi mặt trượt sau khi chạm vào nó và gây nên hiện tượng quỹ đạo pha dao động quanh mặt trượt (hiện tượng chattering) như Hình 3.5

x 1

x 2

S=0

X d (t)

Hình 3.5: Quỹ đạo thực tế của hệ trượt

Hiện tượng chattering là không mong muốn vì nó gây ra sai số điều khiển, làm phát nóng mạch điện tử, mài mòn các bộ phận cơ khí, kích động các mode tần số cao không được mô hình hóa, làm giảm chất lượng điều khiển hoặc mất ổn định

Người ta luôn tìm nhiều biện pháp khác nhau để làm giảm thiểu hoặc loại trừ hiện tượng này Một số cách để khắc phục hiện tượng chattering là sử dụng hàm saturation,

hàm sigmoid hoặc hàm sat-PI thay thế cho hàm sign; dùng logic mờ (fuzzy logic) để

Trang 31

22

3.4 Xây dựng bộ điều khiển LQR

Ta có hệ phương trình toán của hệ acrobot như sau:

Trong đó: Ma trận Q và R là ma trận dương cần chọn lựa (ma trận trọng số) A và B là

ma trận tuyến tính hóa tại điểm làm việc

Điểm làm việc:

( 3.15 )

Định dạng
Số trang	62
Dung lượng	5,28 MB