Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vnLỜI CẢM ƠN Sau thời gian nghiên cứu, làm việc khẩn trương và được sự hướng dẫn tận tình giúp đỡ của thầy gi
Trang 1Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP
-
NGUYỄN THỊ GIANG
NGHIÊN CỨU ỨNG DỤNG LEARNING FEED FORWARD TRÊN CƠ SỞ ĐIỀU KHIỂN THÍCH NGHI THEO MÔ HÌNH MẪU (MRAS) ĐIỀU KHIỂN
Trang 2Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
LỜI CAM ĐOAN
Tên tôi là: Nguyễn Thị Giang
Sinh ngày 18 tháng 10 năm 1987
Học viên lớp cao học khoá 13 - Tự động hoá - Trường đại học kỹ thuật Công nghiệp Thái Nguyên
Hiện đang công tác tại Trường Cao đẳng nghề Cơ điện và xây dựng Bắc Ninh
Xin cam đoan luận văn “Nghiên cứu ứng dụng Learning Feed Forward
(LFFC) trên cơ sở điều khiển thích nghi theo mô hình mẫu (MRAS) điều khiển vị trí cánh tay Robot ” do thầy giáo T.S Nguyễn Duy Cương hướng dẫn là công trình
nghiên cứu của riêng tôi Tất cả các tài liệu tham khảo đều có nguồn gốc, xuất xứ rõ ràng
Tác giả xin cam đoan tất cả những nội dung trong luận văn đúng như nội dung trong đề cương và yêu cầu của thầy giáo hướng dẫn Nếu có vấn đề gì trong nội dung của luận văn tác giả xin hoàn toàn chịu trách nhiệm với lời cam đoan của mình
Thái Nguyên, ngày tháng năm 2012
Học viên
Nguyễn Thị Giang
Trang 3Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
LỜI CẢM ƠN
Sau thời gian nghiên cứu, làm việc khẩn trương và được sự hướng dẫn tận tình
giúp đỡ của thầy giáo T.S Nguyễn Duy Cương, luận văn với đề tài “Nghiên cứu
ứng dụng Learning Feed Forward (LFFC) trên cơ sở điều khiển thích nghi theo
mô hình mẫu (MRAS) điều khiển vị trí cánh tay Robot” đã được hoàn thành
Tác giả xin bày tỏ lòng biết ơn sâu sắc tới:
Thầy giáo hướng dẫn T.S Nguyễn Duy Cương đã tận tình chỉ dẫn, giúp đỡ tác
giả hoàn thành luận văn
Thầy giáo Nguyễn Văn Chí – Bộ môn Đo lường và điều khiển tự động- Khoa
Điện tử, cùng các thầy cô giáo Trường Đại học kỹ thuật công nghiệp Thái Nguyên
và một số đồng nghiệp, đã quan tâm động viên, giúp đỡ tác giả trong suốt quá trình học tập để hoàn thành luận văn này
Mặc dù đã cố gắng hết sức, song do điều kiện thời gian và kinh nghiệm thực tế của bản thân còn ít, cho nên đề tài không thể tránh khỏi thiếu sót Vì vậy, tác giả mong nhận được sự đóng góp ý kiến của các thầy giáo, cô giáo và các bạn bè đồng nghiệp
Tôi xin chân thành cảm ơn!
Thái Nguyên, ngày….tháng….năm 2012
Tác giả
Nguyễn Thị Giang
Trang 4Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
MỤC LỤC
LỜI CAM ĐOAN 1
LỜI CẢM ƠN 3
MỤC LỤC 4
DANH MỤC CÁC CHỮ VIẾT TẮT 6
DANH MỤC CÁC HÌNH VẼ 7
LỜI NÓI ĐẦU 9
CHƯƠNG 1 : TỔNG QUAN VỀ ĐIỀU KHIỂN ROBOT CÔNG NGHIỆP 11
Giới thiệu: 11
1.1.TỔNG QUAN VỀ ROBOT CÔNG NGHIỆP 11
1.1.1.Khái niệm về Robot công nghiệp 11
1.1.2 Phân loại Robot công nghiệp 13
1.1.3 Sơ đồ tổ chức kỹ thuật của Robot 16
1.2 PHƯƠNG TRÌNH ĐỘNG HỌC CỦA ROBOT 18
Kết luận chương 1: 20
CHƯƠNG 2 : TỔNG QUAN VỀ LEARNING FEED FORWARD CONTROL (LFFC) VÀ MODEL REFERENCE ADAPTIVE YSTEM(MRAS) 21
Giới thiệu: 21
2.1 TỔNG QUAN VỀ LFFC 21
2.1.1 Giới thiệu 21
2.1.2 Điều khiển học (Learning Control - LC) 22
2.1.3 Bộ điều khiển học sử dụng sai lệch phản hồi (Feedback Error Learning - FEL) 26
2.1.4 Learning Feed forward Control (LFFC) 33
2.2 ĐIỀU KHIỂN THÍCH NGHI THEO MÔ HÌNH MẪU 34
2.2.1 Khái quát chung 34
2.2.2 Cơ chế thích nghi 39
2.2.3 Mô hình độ nhạy: 47
2.2.4 Phương pháp ổn định của Liapunov 49
2.3 BỘ ĐIỀU KHIỂN LFFC TRÊN CƠ SỞ MRAS 61
Trang 5Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
2.3.1 Khái niệm chung 61
2.3.3 Luật điều khiển thích nghi 65
Kết luận chương 2: 70
CHƯƠNG 3 : THIẾT KẾ VÀ MÔ PHỎNG BỘ ĐIỀU KHIỂN LFFC TRÊN CƠ SỞ MRAS ĐỂ ĐIỀU KHIỂN VỊ TRÍ CÁNH TAY ROBOT 71
3.1 THIẾT KẾ BỘ ĐIỀU KHIỂN 71
3.1.1 Chọn khâu khởi tạo tín hiệu đặt 72
3.1.2 Chọn bộ điều khiển PD 72
3.1.3 Tính toán bộ điều khiển LFFC 73
3.2 Mô phỏng hệ thống 75
3.2.1 Cấu trúc mô phỏng 75
3.2.2.Kết quả mô phỏng 81
Kết luận Chương 3 87
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI 88
TÀI LIỆU THAM KHẢO 89
Trang 6Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
DANH MỤC CÁC CHỮ VIẾT TẮT
Trang 7Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Trang 8Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
có bổ xung khâu tỷ lệ
mô hình mẫu
Viscous
Trang 9Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
LỜI NÓI ĐẦU
Ngày nay, điều khiển robot công nghiệp đã và đang được ứng dụng rộng rãi
trong nhiều lĩnh vực sản xuất và đời sống Để điều khiển robot đã có rất nhiều phương pháp khác nhau như dùng bộ điều khiển truyền thống PID,
LQR(Linear Quadratic Regulator), LQG (Linear Quadratic Gaussian), STR (Self
Tuning Regulator) Các bộ điều khiển trên được thiết kế trên cơ sở mô hình tuyến tính hoá với những thông số biết trước Tuy nhiên Robốt là hệ cấu trúc có tính phi tuyến mạnh, các tham số không rõ và thay đổi hoặc chứa các thành phần phi tuyến Ngoài ra trong quá trình làm việc hệ còn chịu tác động của các nhiễu bên ngoài có tham số thay đổi [8] Do vậy đối với các robot làm việc với yêu cầu đồng thời có độ
ổn định và độ chính xác cao thì các bộ điều khiển trên thể hiện các hạn chế
Hệ thống điều khiển thích nghi là hệ thống mà cấu trúc và tham số của bộ điều khiển có thể thay đổi theo sự biến thiên thông số của hệ sao cho chất lượng đảm bảo các chỉ tiêu đã định [1], [6] Đặc biệt hệ điều khiển Learning Feed Forward (LFFC)[2] trên cơ sở thích nghi theo mô hình mẫu (Model Reference Adaptive System: MRAS) [3], đã được nghiên cứu và thiết kế ứng dụng trong thực tế [7],[4]
Bộ điều khiển này có ưu điểm là có khả năng kháng nhiễu hệ thống (System Noise)
có hiệu quả, nhờ đó độ chính xác và độ ổn định của hệ có thể đồng thời đạt được Việc ứng dụng Learning Feed Forward trên cơ sở MRAS để điều khiển vị trí cánh tay rôbốt sẽ nâng cao chất lượng của hệ thống Vì vậy tác giả lựa chọn đề tài
”Nghiên cứu ứng dụng Learning Feed - Forward (LFFC) trên cơ sở điều khiển
thích nghi theo mô hình mẫu (MRAS) điều khiển vị trí cánh tay Robot”
Luận văn tập trung nghiên cứu xây dựng bộ điều khiển vị trí cánh tay robot dựa trên các lý thuyết cơ bản về bộ điều khiển LFFC trên cơ sở MRAS
Phương pháp nghiên cứu của đề tài như sau:
- Nghiên cứu lý thuyết và xây dựng mô hình toán của robot, thiết kế bộ điều khiển
- Kiểm chứng kết quả thiết kế thông qua mô phỏng bằng phần mềm Matlab
Simulink
Trang 10Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Luận văn bao gồm các phần chính như sau:
Chương 1: Tổng quan về điều khiển Rôbốt công nghiệp
Chương 2: Tổng quan về LFFC và MRAS
Chương 3: Thiết kế bộ điều khiển và mô phỏng hệ thống điều khiển vị trí robot 2
khâu ứng dụng LFFC trên cơ sở MRAS
Kết luận và hướng phát triển của đề tài
Thái Nguyên, ngày tháng năm 2012
Học viên
Nguyễn Thị Giang
Trang 11Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
CHƯƠNG 1 TỔNG QUAN VỀ ĐIỀU KHIỂN ROBOT CÔNG NGHIỆP
1.1.TỔNG QUAN VỀ ROBOT CÔNG NGHIỆP
1.1.1.Khái niệm về Robot công nghiệp
Robot là một hệ thống phức tạp, ta có thể hiểu nó thông qua cách nhìn nhận
từ nhiều phương diện sau:
1) Phương diện vật lý:
Là một hệ thống lớn bao gồm nhiều hệ thống con (sub_system) Để vận hành được
nó phải có đầy đủ các yếu tố: Năng lượng; Cơ khí (các thanh nối, khớp, thân, ); Điều khiển;
2) Phương diện truyền tin:
Trang 12Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Là một hệ thống truyền tin và xử lý tin khép kín bao gồm: Phần chuyển động; phần nhận dạng và điều khiển
a) Cơ cấu chuyển động: Có tác dụng thực hiện các chuyển động theo yêu cầu của công nghệ Phần chuyển động được thực hiện bằng các kỹ thuật truyền động sau: Truyền động thuỷ lực; Truyền động khí nén và truyền động điện Trong
đó truyền động điện có thể dùng động cơ điện một chiều hay động cơ điện xoay chiều đi kèm bộ điều khiển
b) Cơ cấu nhận dạng: Là hệ thống các cảm biến bao gồm cảm biến lực, cảm biến vị trí, cảm biến tốc độ, Các thông tin đo được từ các cảm biến được chuyển tới bộ phận điều khiển
Hình 1.1 Sơ đồ hệ thống điều khiển vị trí
Quỹ đạo đặt
BỘ ĐIỀU KHIỂN
HỆ THỐNG ĐO (CÁC SENSOR)
ROBOT
Tín hiệu điều
Trang 13Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
1.1.2 Phân loại Robot công nghiệp
Có nhiều cách phân loại Robot, dựa trên các cơ sở kỹ thuật khác nhau có các cách phân loại khác nhau Sau đây là một số cách phân loại:
1 Phân loại theo số bậc tự do trong môi trường công tác
Lấy hai hình thức chuyển động nguyên thuỷ làm chuẩn
Chuyển động tịnh tiến theo các hướng x,y,z trong không gian Đềcác (Ký hiệu là P: Prasmatic)
Chuyển động quay xung quanh các trục x, y, z (Ký hiệu là R: Rotation)
Thông thường các chuyển động trên được ký hiệu như sau
Chuyển động tịnh tiến Chuyển động quay
Dạng Đề các Dạng trụ
Dạng cầu Dạng khớp
Hình.1.2 Các dạng Robot 3 bậc tự do
Trang 14Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Như vậy chỉ với 3 bậc tự do, Robot sẽ chuyển động trong môi trường công tác với hình khối phụ thuộc vào tổ hợp P và R như hình minh hoạ ở Hình 1.2
PPP trường công tác là hình hộp chữ nhật hoặc lập phương
RPP trường công tác là khối trụ
RRP trường công tác là khối cầu
RRR trường công tác là khối cầu
Lĩnh vực hoạt động của Robot ngày càng mở rộng, với yêu cầu các khả năng thao tác ngày càng khéo léo và tinh vi Vì vậy số bậc tự do có thể không hạn chế Do vậy
để giải quyết bài toán điều khiển trong Robot thì bên cạnh hệ toạ độ chuẩn U ta còn đặt đặt nhiều hệ toạ độ khác như:
2 Phân loại theo phương pháp điều khiển
Có 2 kiểu điều khiển là điều khiển hở và điều khiển kín
- Điều khiển hở, dùng truyền động bước (dùng động cơ điện hoặc động cơ thủy lực, khí nén ) mà quãng đường hoặc góc dịch chuyển tỉ lệ với số xung điều khiển Kiểu này đơn giản nhưng độ chính xác thấp
- Điều khiển kín (điều khiển servo) sử dụng tín hiệu phản hồi vị trí để tăng
độ chính xác điều khiển Có 2 kiểu điều khiển kín là điểm - điểm và điều khiển đường
Điều khiển điểm - điểm (Point to Point): phần công tác dịnh chuyển từ điểm này đến điểm kia theo đường thẳng với tốc độ không cao Nó chỉ làm việc tại các điểm dừng Kiểu điều khiển này dùng trên các robot hàn điểm, vận chuyển, tán đinh, bắn đinh…
Trang 15Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Điều khiển theo đường (Contour): đảm bảo cho phần công tác dịch chuyển theo quỹ đạo bất kì với tốc độ có thể điều khiển được Kiều điều khiển này dùng trên các robot hàn hồ quang, phun sơn,
3 Phân loại theo hệ thống năng lượng
Dựa vào cơ cấu sinh nguồn năng lượng động lực ta chia ra thành 2 loại
Thường dùng các động cơ truyền động là động cơ một chiều hoặc động cơ bước Với hệ này có đặc điểm là hoạt động chính xác, tin cậy, ít phần tử phi tuyến
dễ điều khiển, ngoài ra còn có một số đặc tính khác như kết cấu gọn nhẹ, hệ truyền năng lượng đơn giản nhưng có nhược điểm là cho hệ số quá tải thấp
Đối với hệ thuỷ lực có thể đạt công suất cao, đáp ứng được những điều kiện làm việc nặng nề, tuy nhiên hệ này thường có kết cấu cồng kềnh do cấu tạo có thêm
bể dầu, van lọc, hệ thống dẫn ngược ngoài ra với hệ này sử dụng thuỷ lực có độ phi tuyến cao do vậy điều khiển khó
Với hệ khí nén có cấu tạo gọn nhẹ hơn do không cần dẫn ngược, nhưng phải gắn liền với một trung tâm tạo khí nén Hệ này làm việc với công suất trung bình và nhỏ, kém chính xác
Như vậy hệ năng lượng điện điều khiển chính xác dễ điều khiển, kết cấu gọn nhẹ nhưng công suất hạn chế, không cho phép quá tải lớn do vậy hệ này chỉ phù hợp với hệ công suất trung bình và nhỏ và yêu câù thao tác chính xác cao Đối với
hệ năng lượng thuỷ lực và khí động thì có kết cấu cồng kềnh điều khiển khó nhưng
bù lại có hệ số quá tải lớn do vậy với hệ này thì phù hợp với tải có công suất lớn và yêu cầu chính xác truyền động không cao
Trang 16Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
1.1.3 Sơ đồ tổ chức kỹ thuật của Robot
Tổ chức kỹ thuật của Robot được chia thành 4 khối chức năng chính được minh hoạ như Hình 1.3
Khối A:
Gồm hai thành phần:
Teach pendant: Có nhiệm vụ thực hiện các quá trình dạy học cho Robot
Record buttum: Lưu trữ và chuyển giao các dữ liệu cảm nhận vật lý trong quá trình học gọi là “Bộ cảm nhận vật lý” thông qua khối này tín hiệu đặc trưng cho độ dài và toạ độ góc của vị trí đầu và vị trí cuối của quỹ đạo chuyển động được cảm nhận
Ví dụ : 0,h0;f,h f
Khối B:
Là khối xử lý của Robot gồm các cụm vi xử lý để giải quyết các vấn đề sau :
Hình 1.3 Sơ đồ tổ chức kỹ thuật của Robot
Inverts Kinematic
Cartesianpont storage
Trajectory Phaner
Motor Dymanic
Robot Dynamic
Physical Postion Computer
Block A
Block B
Block D Block C
Trang 17Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Nhóm Forword Kinematic: Thiết lập và giải các bài toán động học trên cơ sở
Nhóm Cartesian Point Storage: Lưu trữ và chuyển giao các kết quả của quá trình giải “Bài toán động học thuận”
Nhóm Trajectory Planer: Lập trình quỹ đạo đi qua các điểm đã hoặc chưa “Dạy”
Thông qua sự chia ra từng khối theo tổ chức kỹ thuật cho thấy có ba bộ thông số chủ yếu sau :
Bộ thông số cảm nhận vị trí;
Bộ thông số hình học;
Bộ thông số điều khiển
Nó được biến đổi và chuyển liên tục từ nhóm chức năng này sang nhóm chức năng khác (Được thể hiện bằng ký hiệu trên hệ thống) Do đó nhiệm vụ chủ yếu của quá trình thiết kế động học Robot là thiết lập giải bài toán động học thuận và bài toán động học ngược Kết quả tìm được sẽ đóng vai trò quan trọng trong việc đưa ra tín hiệu điều khiển chính xác theo mong muốn
s
Trang 18Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
1.2 PHƯƠNG TRÌNH ĐỘNG HỌC CỦA ROBOT
Với robot công nghiệp có nhiều loại khác nhau và sử dụng nhiều luật điều khiển khác nhau Trong khuôn khổ luận văn này tác giả khảo sát robot 2 bậc tự do dùng Feedback kết hợp LFFC (Learning Feedforward Control) trên cơ sở điều khiển thích nghi theo mô hình mẫu(MRAS)
Phương trình động học của robot hai bậc tự do được miêu tả bởi công thức sau: [2]
Với:
Trong hình sau mô tả mô hình robot 2 bậc tự do:
Hình 1.4 Mô hình robot 2 bậc tự do
Phương trình động học của robot 2 bậc tự do được chỉ ra bởi biểu thức (1.2) sau:
Trang 19Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
1 2 2
2 1 1 1 2 1 2 2 2
2 2
1
2 1 2 1 2 1 2
1 2
2
1
2 2 2 2 1 2 2 2
2
1
2
1 2
2 2 2 1
1 2
2 2 1 2
2
2 2 2 1 2 2 1 2 1 2 1 2 2 1 2
sin
sin sin
2
cos 2
cos 2
cos 2
u
u l
gm
m m gl
l gm s
s
d
d m
l
l
m l l m
l
l
l m r
J m
l l l
m l l m l l l
l l
0
,0
0
1 1
1
1 1
I
u M
S M G
M
D M
C M
I
(1.3)
I
C1
Trang 20Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Như vậy có thể kết luận rằng: Góc quay của cánh tay robot có thể được điều khiển bởi LFFC Tín hiệu điều khiển Feed – forward mong muốn là:
u d Cd,ddDd G d Ssgn d Md d (1.6)
Từ (1.6)cho thấy tín hiệu đầu vào khối điều khiển sau khi đã đơn giản hóa bao gồm
Trang 21Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
CHƯƠNG 2 TỔNG QUAN VỀ LEARNING FEED FORWARD CONTROL(LFFC) VÀ
MODEL REFERENCE ADAPTIVE SYSTEM(MRAS)
để tạo ra các sản phẩm có chất lượng tốt hơn Điều này được nhìn nhận trong thị trường đối với sản phẩm mà chúng ta sẽ xem xết trong luận văn này, ví dụ như các
hệ thống truyền động cơ điện tử Theo quan điểm cơ điện tử, chất lượng của các hệ thống cơ điện tử có thể được cải tiến bằng việc thay đổi thiết kế cơ khí và bộ điều khiển Ví dụ như khi nghiên cứu các cánh tay robot, nơi mà chuyển động chính xác phụ thuộc vào độ cứng và quán tính của hệ thống Nếu cánh tay không đạt được các yêu cầu nhất định, độ cứng của nó có thể tăng lên hoặc quán tính của nó có thể được giảm bớt bằng cách thay đổi kết cấu cơ khí hoặc bằng việc ứng dụng các vật liệu mới
Việc thay đổi điều khiển có thể được thực hiện hoặc bằng cách thay đổi thông số của bộ điều khiển đang tồn tại hoặc bằng cách thiết kế bộ điều khiển mới Khi một bộ điều khiển được cải tiến, chỉ đơn thuần là yêu cầu thay đổi phần mềm
và trong một số trường hợp là thêm các sensor cách đánh giá này tương đối dễ dàng thực hiệ được, khi đem so sánh với các cấu trúc tương ứng Trong luận văn này, tác giả sẽ tập trung vào việc nâng cao chất lượng của hệ thống bằng bộ điều khiển
Việc thiết kế một bộ điều khiển nói chung thường dựa trên một mô hình của một đối tượng Mô hình đối tượng càng chính xác bao nhiêu thì việc thiết kế bộ
Trang 22Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
điều khiển càng hiệu quả bấy nhiêu Khi mô hình hóa đối tượng, các vấn đề sau có thể gặp phải:
- Hệ thống quá phức tạp để có thể hiểu được hoặc trình bày một cách đơn giản
- Mô hình quá khó hoặc quá đắt để đánh giá Một số đặc tính của một số tính chất (phi tuyến) khó có thể đạt được, ví dụ như ma sát…
- Đối tượng có thể chịu ảnh hưởng lớn của nhiễu tác động từ môi trường, điều này khó dự đoán trước được
- Các thông số của đối tượng có thể biến đổi theo thời gian
Bộ điều khiển thích nghi có thế là một giải pháp khi cấu trúc của mô hình động học của đối tượng và nhiễu mô hình tác động lên nó được biết trước trong khi các giá trị của các thông số thì không thể xác định được Khi mô hình không xác định hoặc có nhiều thông số không xác định thì lúc đó điều khiển học sẽ được xét đến
2.1.2 Điều khiển học (Learning Control - LC)
Các bộ LC thường được hình dung gần giống như là một hệ thống điều khiển của con người và do đó nó có các thuộc thính giống với con người Trong luận văn này không nghiên cứu bộ LC theo quan điểm sinh học nhưng đồng ý với một số định nghĩa sau:
Định nghĩa 2.1: Một bộ LC là một hệ thống điều khiển bao gồm trong đó 1 hàm xấp xỉ các ánh xạ đầu vào – đầu ra tương ứng trong suốt quá trình điều khiển
mà một hoạt động mong muốn của hệ thống điều khiển đạt được
Định nghĩa 2.2 (hàm xấp xỉ): Một hàm xấp xỉ là một ánh xạ vào/ra được xác
Lưu ý 2.1 (điều khiển tự học và điều khiển thích nghi): Theo hướng này, điều khiển thích nghi có thể được xem xét giống như là một dạng của LC trong đó một hàm xấp xỉ được sử dụng có thể chỉ xấp xỉ một lớp giới hạn của mục tiêu Nói chung, một bộ LC sẽ bao gồm một hàm xấp xỉ cho một đối tượng có nhiều hàm mục tiêu hơn
Trang 23Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Một biến mở rộng của các hàm xấp xỉ có thể được sử dụng như mạng nơ ron, mạng mờ - nơ ron (cũng được biết đến với tên các bộ điều khiển logic mờ thích nghi) v v Nói chung một cách sơ bộ, các bộ hàm xấp xỉ có thể được sử dụng theo
2 cách:
Trước hết, hàm xấp xỉ có thể được sử dụng để tạo (một phần) tín hiệu điều khiển Việc học được thay thế bới việc thích nghi véc tơ thông số của hàm xấp xỉ theo cách mà một số các hàm giá trị chứa đựng sai lệch điều khiển là cực tiểu Bộ điều khiển này được gọi là LC trực tiếp
Thứ hai, hàm xấp xỉ có thể được sử dụng để học một mô hình đối tượng tương ứng được kiểm soát ví dụ như là để làm giảm giá trị của sai số dự báo Dựa trên cơ sở của mô hình đã được học một bộ điều khiển được xây dựng, bộ điều khiển này được gọi là LC gián tiếp
Từ khi bộ LC đầu tiên được phát triển vào năm 1963 cho tới nay, lĩnh vực
LC đã và đang phát triển rất rộng rãi Rất nhiều các cấu trúc của bộ điều khiển khác nhau đã được đề xuất và các thuộc tính của chúng (như tính ổn định và tốc độ hội tụ
đã được phân tích cả trong thực tế và lý thuyết) Tuy nhiên, mặc dù tất cả chúng đều được nghiên cứu nhưng chỉ có một số bộ LC được ứng dụng trong sản phẩm mang tính thương mại Có thể vì những lý do sau đây:
Việc chứng minh sự ổn định được đánh giá cao Phần lớn các nghiên cứu lý thuyết của bộ LC được tập trung vào tính ổn định Tuy nhiên, một bộ LC ổn định cũng không cần thiết mang lại một đáp ứng ngắn hạn học tốt….Hoạt động của bộ
LC đối với một con robot đã được quan sát bằng mô phỏng Sau khi thực hiện với chuyển động 6 bậc tự do, sai số hiệu chỉnh giảm xuống hệ số 2.8 Khi tiếp tục tự
tại bước lặp thứ 62.000 và cuối cùng giảm
số hiệu chỉnh nhỏ đã đạt được nhưng bộ LC không có giá trị thực nghiệm vì nó có dải sai số hiệu chỉnh rất rộng ở giữa
Không nên quá quan tâm tới sai số hiệu chỉnh điểm 0 Một số LC cố gắng đạt được sai số hiệu chỉnh điểm 0 Tuy nhiên, điều này yêu cầu có những tín hiệu điều khiển lớn ở những tần số trên băng thông hệ thống, các tần số này có thể gây
Trang 24Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
nguy hiểm cho các cơ cấu chấp hành và nói chung là không đạt được như mong muốn Loại sai số của hàm xấp xỉ Trong đại đa số các bộ LC, hàm xấp xỉ được thực hiện với vai trò như một mạng nơ ron (Multi Layer Perceptron – MLP) Như chúng tôi sẽ bàn tới ở dưới đây, loại mạng nơ ron này không tương thích một cách đặc biệt cho việc điều khiển
Trên cơ sở những suy xét này, chúng ta có thể đưa ra một số các thuộc tính sau mà một bộ LC nên để trở thành một mặt hàng ưa chuộng về mặt thương mại:
Dễ dàng sử dụng trong một hệ thống điều khiển có sẵn Điều này có nghĩa
là khi một đáp ứng ngắn hạn học tốt thì hiệu suất cực tiểu được bảo đảm Ví dụ như
là trong một bộ điều khiển hiện nay Thậm chí trong suốt quá trình huấn luyện đối tượng vẫn có thể được duy trì trong quá trình vận hành mà không gây ra những tổn thất của quá trình sản xuất
Có khả năng sử dụng những kiến thức dự đoán của đối tượng Nói chung các nhà thiết kế và/hoặc người vận hành có một số kiến thức về đối tượng, ví dụ như trong cấu trúc của mô hình toán học( đơn giản) dưới dạng các hàm, một giản đồ Bode của đối tượng hoặc một mô tả dưới dạng biến ngôn ngữ của hành vi đối tượng Bộ LC nên cho phép loại kiến thức này được kết hợp vào trong thiết kế bộ điều khiển, để chọn các thông số của bộ điều khiển hợp lý và để tốc độ lệ học
Hàm xấp xỉ nên phù hợp cho việc điều khiển Điều này có nghĩa rằng: Cần sử dụng dung lượng nhớ nhỏ Trong thực tế, bộ điều khiển được thực hiện bằng phần mềm được gắn vào máy tính Dung lượng bộ nhớ là có hạn, do đó
số lượng các thông số của hàm xấp xỉ mà yêu cầu phải xấp xỉ tín hiệu điều khiển không thể quá rộng
Việc tính toán đầu ra của hàm xấp xỉ và sự tương thích của quan hệ vào/ra phải được thực hiện một cách nhanh chóng Trong môi trường thời gian thực, trong một khoảng thời gian lấy mẫu, các thông số của hàm xấp xỉ phải tương ứng
và đầu ra tính được Rất nhiều hệ thống chuyển động cơ điện tử yêu cầu thời gian mẫu nhỏ và cho phép thời gian tính toán là rất ít Các hàm xấp xỉ mà bao gồm một lượng lớn các tính toán phức tạp do đó chúng không phù hợp cho việc điều khiển
Trang 25Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Cơ chế học cần hội tụ nhanh Để giữ được lượng thời gian trong đó quá trình vận hành của hệ thống được điều khiển tối ưu từng phần, tiến tới mức cực tiểu, cơ chế học cần hội tụ nhanh
Cơ chế học không nên bị cực tiểu cục bộ, khi bị lưu giữ trong mức cực tiểu cục bộ, thì cơ chế học cho rằng các giá trị đạt được của các thông số của hàm
)
( loc
Hình 2.1 Cực tiểu cục bộ trong kỹ thuật học
Trong hình dưới đây một ví dụ theo một chiều của hiện tượng như vậy được
cấu học mà sử chỉ sử dụng gradient của sai số xấp xỉ thì không thể thoát khỏi mức
cực tiểu cục bộ
Khi cơ chế học dễ dàng lưu lại ở mức tối thiểu cục bộ, rất khó để huấn luyện LC để thu được hiệu quả cao Quan hệ vào/ ra phải tương thích một cách cục
bộ Trong một số hàm xấp xỉ, quan hệ vào/ ra này là tương thích toàn cục Điều này
có nghĩa là nếu giá trị của một trong các thông số của hàm xấp xỉ được tương thích, thì quan hệ vào /ra trên toàn bộ phạm vi đầu vào bị thay đổi Xét một bộ LC được huấn luyện để thực hiện một số chuyển động Khi bộ LC được huấn luyện để thực hiện một chuyển động mới, điều này liên quan tới việc tương ứng các thông số của hàm xấp xỉ Bởi vì mối quan hệ vào ra được tương thích toàn cục nên các tín hiệu điều khiển học trước đó bị thay đổi có thể gây ra nhưng tổn thất trong quá trình làm
Trang 26Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
việc Do đó điều mong đợi ở đây là mối quan hệ vào ra của hàm xấp xỉ được tương thích một cách cục bộ Trong trường hợp này, việc học một chuyển động mới sẽ không làm thay đổi các tín hiệu đã được học trước đó
Hàm xấp xỉ có khả năng tự khái quát hoá tốt Khả năng tự khái quát hoá
là khả năng tạo ra một đầu ra nhạy cho một đầu vào không được thể hiện trong quá trình huấn luyện nhưng nó tương tự như các huấn luyện mẫu Khi hàm xấp xỉ
có khả năng khái quát hoá tốt, bộ LC cũng sẽ thu được một hiệu quả bám cao cho các chuyển động tương tự các chuyển động được huấn luyện Vì vậy nó đủ để huấn luyện LC với một lượng nhỏ các đặc tính chuyển động huấn luyện Khi bộ xấp xỉ không có khả năng tự khái quát hoá tốt, bộ LC phải được huấn luyện cho mỗi chuyển động quan trọng, nó tạo ra một quá trình huấn luyện mở rộng
Sự mềm mại của giá trị xấp xỉ cần điều khiển được Như nói ở phần trước
đây, bộ LC không chỉ thu được sai số bằng không đối với một vài tần số, khi tín hiệu điều khiển có tần số cao sẽ không thỏa mãn theo mong muốn Người sử dụng phải có khả năng quyết định tần số lớn nhất của đầu ra của hàm xấp xỉ
Đáp ứng ngắn hạn là học tốt Đáp ứng ngắn hạn của bộ LC nên là loại đáp
ứng mà có sai số bám dần hội tụ về giá trị mong muốn Việc tăng sai số bám trong pha trung gian của quá trình học có thể làm hỏng đối tượng, hơn thế nữa, đây là trường hợp quá trình làm việc tối thiểu có thể không còn được bảo đảm khi bộ điều khiển được sử dụng như một thiết bị ghép thêm cho một bộ điều khiển đã có sẵn
Sự ổn định lâu dài cần phải được bảo đảm Việc tự học có thể được thực
hiện một cách liên tục hoặc được thực hiện trước khi vận hành Việc học liên tục được yêu cầu khi các thông số của đối tượng thay đổi trong suốt quá trình vận hành Ví dụ, do hao mòn hay chịu ảnh hưởng của môi trường Trong trường hợp này, một bộ điều khiển phải có khả năng đảm bảo việc học ổn định bất chấp các điều kiện vận hành thay đổi như thế nào
2.1.3 Bộ điều khiển học sử dụng sai lệch phản hồi (Feedback Error Learning - FEL)
2.1.3.1 Cấu trúc điều khiển
Trang 27Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Một bộ LC thú vị cho các cánh tay robot mà phải bám theo các quỹ đạo ngẫu nhiên Nói chung bộ điều khiển này được biết đến với cái tên là bộ điều khiển học sai lệch phản hồi: Bộ điều khiển (Feedback Error Learning- FEL)
Hệ thống LC bao gồm 2 phần:
Bộ điều khiển Feef-forward được biểu thị bằng F, nghĩa là 1 hàm/ánh xạ
r
F
bù thêm cho các hệ thống động học và theo cách này sẽ thu được độ bám chính xác cao Khi bộ điều khiển feed-forward bằng với đối tượng nghịch đảo
1
Hình 2.2 Bộ điều khiển phản hồi sai lệch (FEL)
Hình 2.2: Bộ điều khiển phản hồi sai lệch
nhiễu ngẫu nhiên và nhiễu có bản chất chu kỳ Những nhiễu chu kỳ tái diễn giống nhau khi một chuyển động cụ thể được lặp lại Điều này có nghĩa rằng chúng có thể được xem xét như một hàm trạng thái của đối tượng x và có thể lường trước
Hình 2.3 Đối tượng và nhiễu phát sinh
Hàm xấp xỉ
P
d(x)
+ +
u
x
y
Trang 28Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
2.1.3.2 Một ví dụ về ma sát phụ thuộc vị trí:
Giống như đối tượng động học, các nhiễu tái sinh có thể được bù bởi một
bộ điều khiển feed-forward
Để bù chính xác cho hệ thống động học và nhiễu tái sinh, yêu cầu cần phải
có một mô hình chi tiết Sự không chính xác về mô hình có thể làm cho bộ điều khiển feed-forward vận hành kém Khi một mô hình chính xác khó có thể xác định được, thì một phương pháp thay thế có thể được thực hiện
Thay vì đi thiết kế một bộ điều khiển feed-forward dựa trên những đặc điểm
cơ bản của mô hình thực hiện bộ điều khiển feed-forward giống như là một hàm xấp
hàm xấp xỉ được tự thích ứng để học các đối tượng nghịch đảo và để bù các nhiễu phát sinh Khó khăn chính ở đây là lựa chọn tín hiệu học mà chỉ ra được mối quan hệ vào/ra của hàm xấp xỉ phải được tương thích như thế nào Tín hiệu học có thể thu được theo rất nhiều cách Theo lý thuyết đã chứng minh chỉ ra rằng khi đầu
ra của bộ điều khiển phản hồi được sử dụng làm tín hiệu học thì quan hệ vào/ra của hàm xấp xỉ hội tụ tới đối tượng nghịch đảo và giá trị bù của nhiễu tái sinh Loại hàm xấp xỉ mà chúng ta sử dụng ở đây là mạng nơ ron MLP
3 , 3 , 3 , 2 , 2 , 2 , 1 , 1 , 1
r d d d d d d d d d T (2.1) Trong trường hợp cánh tay 3 bậc tự do DOF (Degrees Of Freedom), đầu vào
3 2
(2.2)
Bộ điều khiển phản phản hồi Như đã được nói tới, bộ điều khiển phản hồi trạng thái, đem lại các tín hiệu học cho bộ điều khiển feed-forward Hơn thế, nó xác định quá trình bám cực tiểu tại thời điểm bắt đầu học Cuối cùng, bộ điều khiển phản hồi bù các nhiễu ngẫu nhiên Bộ điều khiển FEL đã được thực hiện trong nhiều ứng dụng của nhiều tác giả; ví dụ như là:
Hệ thống phanh tự động ô tô
Điều khiển hệ thống camera
Trang 29Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Điều khiển cánh tay robot
Dễ dàng sử dụng trên hệ thống điều khiển có sẵn Sự mở rộng duy nhất đối với hệ thống điều khiển có sẵn là hàm xấp xỉ Khi hệ thống điều khiển được thực hiện bằng phần mềm điều này yêu cầu ít có sự thay đổi và có thể dễ dàng được thực hiện
Sự hợp nhất các kiến thức quan trọng trong thiết kế Khi cấu trúc của đối tượng động học được xác định, thì mạng MLP trong bộ điều khiển feed-forward có thể tách ra thành một vài mạng MLP nhỏ hơn Mỗi một mạng con này sẽ bù cho một phần riêng biệt của đối tượng động học Những thí nghiệm đã chỉ ra rằng mạng này đã nâng tốc độ học lên đáng kể
Trang 30Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Sự ổn định được xác lập Điều này đã được chứng minh bằng lý thuyết rằng
bộ điều khiển FEL sử dụng cho điều khiển cánh tay robot cho kết quả là hội tụ Với các hệ thống khác, sự ổn định chưa được xét đến trên phương diện lý thuyết
Đáp ứng ngắn hạn tốt Trong quá trình học, sai lệch bám sẽ dần hội tụ đến giá trị cực tiểu của nó Giống như sự ổn định, đáp ứng ngắn hạn cũng chưa được xét tới trên phương diện lý thuyết
Hàm xấp xỉ phù hợp cho việc điều khiển Rất nhiều các giá trị thực của bộ một LC phụ thuộc vào loại hàm xấp xỉ được sử dụng Mặc dù thực tế là bộ điều khiển FEL cũng đạt được chất lượng bám cao nhưng cách học không phải là tối
ưu cho mạng MLP
Yêu cầu bộ nhớ nhỏ Một trong số những thuộc tính tốt của MLP là nó
có thể xấp xỉ các hàm mục tiêu đa chiều với một số ít các thông số Do đó tổng dung lượng bộ nhớ của máy tính yêu cầu cho việc thực hiện là rất nhỏ Tốn kém cho việc tính toán giá trị Việc tính toán đầu ra của mạng MLP và trọng số của bộ thích nghi bao gồm một số lượng lớn các tính toán phức tạp Do đó, với một
số ứng dụng điều khiển thời gian thực thì loại mạng mạng nơ ron này có thể không phù hợp
Cơ chế học hội tụ chậm và trải qua vùng giá trị cực tiểu cục bộ Cơ chế học
dễ dàng đạt được tại vùng giá trị cực tiểu cục bộ Hàm trọng lượng của mạng kết thúc ở vùng cực tiểu nào phụ thuộc vào hàm trọng lượng ban đầu của mạng Do đó
nó cần phải thực hiện nhiều thử nghiệm huấn luyện mạng với các cài đặt hàm trọng lượng ban đầu khác nhau, để thu được độ bám chính xác có thể chấp nhận được
Có khả năng tổng quát hoá tốt Một thuận lợi thực tế là mối quan hệ vào ra chỉ có thể thích ứng toàn bộ đó là khi MLP có khả năng tổng quát tốt khi quá trình huấn luyện được thực hiện một cách tổng thể Khi một hệ thống chuyển động phải vận hành ở tốc độ thấp, bộ điều khiển FEL có khuynh hướng đưa ra hiệu suất kém Điều này là do thực tế mạng MLP gặp khó khăn trong việc học các dữ liệu có tương quan với nhau ở mức cao Khi các dữ liệu có tương quan với nhau ở mức cao, mạng có khuynh hướng chuẩn hoá tín hiệu theo dữ liệu cuối cùng, kết quả là đưa ra khả năng khái quát hoá kém
Trang 31Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Sự trơn tru của các giá trị xấp xỉ là không hoàn toàn điều khiển được Số lượng các thông số của một bộ MLP quyết định tính chính xác cực đại của giá trị xấp xỉ Nó không đảm bảo được độ trơn tru nhất định Nhờ việc học, mạng MLP có thể xấp xỉ rất gần các hàm mục tiêu trong phạm vi đầu vào và rất chính xác ở phần còn lại
Nhìn vào các thuộc tính ở trên, ta có thể kết luận rằng trong trường hợp mà cách học tốt, bộ điều khiển FEL có khả năng đáp ứng rất tốt Các nghiên cứu khác nhau nhằm mục đích khắc phục các vấn đề tồn tại của bộ điều khiển FEL Theo đó
ta sẽ giới thiệu tóm lược 3 phương pháp: 2 phương pháp đầu thay đổi cấu trúc của
bộ điều khiển học Trong khi ở phương pháp còn lại sử dụng hàm xấp xỉ
Trước tiên, phương pháp thứ nhất có thể cải thiện cách học bằng cách chọn các đầu vào khác nhau cho hàm xấp xỉ Sai số tín hiệu được thêm vào như một đầu vào của bộ xấp xỉ, điều này sẽ làm thay đổi bộ điều khiển LC từ chỗ hoàn toàn là 1
bộ điều khiển feed-forward nguyên bản chuyển sang bộ điều khiển feed-forward dưới đây Các thí nghiệm đã chỉ ra rằng bộ LC này khắc phục được một số lỗi của
bộ điều khiển FEL gốc
Hình 2.4 Học theo sai số phản hồi
Phương thức thứ 2 là sử dụng nhiều bộ điều khiển feed-forward, mỗi một
bộ được huấn luyện để thực hiện một nhiệm vụ cụ thể Mỗi một mạng nơ ron giám sát học xem là bộ feed-forward nào được sử dụng cho nhiệm vụ nào Bộ LC này đã được kiểm tra trên tay máy mà phải thực hiện các chuyển động với các đối tượng có
y
Trang 32Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
trọng lượng khác nhau Sau khi học, mỗi bộ điều khiển feed-forward đã học sẽ phải đảm nhiệm cho một đối tượng xác định Mạng giám sát đã học từ bộ điều khiển feed-forward nào được áp dụng cho đối tượng đó
Khi mạng MLP là nguyên nhân chính gây nên các khó khăn của điều khiển FEL, một phương pháp rõ ràng ở đây là phải tìm ra những hàm xấp xỉ khác nhau Mạng MLP được thay thế bởi mạng (Cerebellar Model Articulation Controller CMAC) Mạng CMAC phụ thuộc vào các lớp mạng nơ ron mà làm việc với hàm cơ
sở Trong trường hợp mạng CMAC, hàm cơ sở bao gồm các hàm đa thức thông minh mà có giá trị khác không trên phần không gian đầu vào Ở mỗi điểm trong không gian đầu vào p các hàm cơ sở chồng chéo lên nhau Thông số của p được biết đến như là một thông số khái quát hoá và có thể được lựa chọn bởi nhà thiết kế Đầu
ra của CMAC là tổng các trọng số của hàm ước lượng cơ sở Việc học được tiến hành bằng cách mô phỏng theo các trọng số của mạng, chứ không phải là theo bản thân các hàm cơ sở Tất cả điều này nhằm mục đích cải thiện những vấn đề sau:
- Độ hội tụ nhanh hơn Khi việc học diễn ra một cách cục bộ, chỉ có 1 số nhỏ các hàm trọng được thích nghi tạo ra độ hội tụ nhanh
- Có thể học các dữ liệu tương quan Các vùng của hàm cơ sở đã được trộn lẫn, điều này có ích cho quá trình học các dữ liệu tương quan
- Không có cực tiểu cục bộ Cơ cấu học không trải qua vùng cực tiểu cục
và độ bám chính xác hơn
Trang 33Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
2.1.4 Learning Feed forward Control (LFFC)
Trong luận văn này một hệ thống LC được xét có cấu trúc tương tự như cấu trúc của bộ điều khiển FEL (hình 2.2) Tuy nhiên, phần feed-forward của bộ điều
theo mô hình mẫu
Trang 34Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
2.2 ĐIỀU KHIỂN THÍCH NGHI THEO MÔ HÌNH MẪU
Hệ thống điều khiển thích nghi là hệ thống mà cấu trúc và tham số của bộ điều khiển có thể thay đổi theo sự biến thiên thông số của hệ sao cho đảm bảo các chỉ tiêu đã định Hệ thống điều khiển thích nghi theo mô hình mẫu có nhiều dạng khác nhau Chúng ta bắt đầu bằng một cách tiếp cận trực giác, chỉ ra rằng các ý tưởng hồi tiếp cơ sở giúp chúng ta tìm ra các thuật toán hiệu chỉnh tham số Chúng
ta chú ý rằng sẽ có hai câu hỏi nảy sinh ra Thứ nhất đó là làm thế nào để tìm các tín hiệu thích hợp mà hiệu chỉnh các tham số thích hợp ở những thời điểm thích hợp Thứ hai là làm thế nào để đảm bảo sự ổn định cho một hệ thống thích nghi mà vốn đã phi tuyến do sự xuất hiện của các bộ nhân trong hệ thống Chúng ra sẽ có cái nhìn sâu hơn đối với câu hỏi đầu tiên bằng cách xét phương pháp mô hình nhạy cảm Sự ổ định có thể được bảo đảm bằng cách ứng dụng lý thuyết ổn định Liapunov’s cho việc thiết kế các hệ thống thích nghi
2.2.1 Khái quát chung
Có những cấu trúc khác nhau mà có thể mang đến cho một hệ thống điều khiển khả năng phản ứng với những thay đổi trong các tham số của nó hoặc với sự thay đổi các đặc tính của nhiễu Một hệ thống hồi tiếp thông thường cũng có mục tiêu là làm giảm độ nhạy cảm của các dạng thay đổi này Tuy nhiên, khi những sự thay đổi là lớn, thậm chí một hệ thống hồi tiếp hệ số khuếch đại hằng số thiết kế chuẩn sẽ không hoạt động một cách như mong muốn Khi đó một cấu trúc bộ điều
khiển phức tạp hơn được yêu cầu và các thuộc tính thích nghi đã biết phải được đưa
ra Một hệ thống thích nghi có thể được định nghĩa như sau:
“ Một hệ thống thích nghi là một hệ thống mà trong đó thêm vào cấu trúc (hồi tiếp) cơ bản, các phép đo tường minh được thực hiện để bù tự động cho những thay đổi về các điều kiện hoạt động, cho những thay đổi về động học quá trình hoặc cho những thay đổi về nhiễu, để duy trì một hoạt động tối ưu của hệ thống”
Nhiều định nghĩa khác đã được đưa ra trong tài liệu; hầu hết chúng chỉ miêu
tả một lớp điển hình của các hệ thống thích nghi
Định nghĩa được đưa ra ở đây … một cấu trúc hồi tiếp thông thường đầu tiên phản ứng đối với sự thay đổi của nhiễu và tham số Ở một cấp độ thứ hai một cơ
Trang 35Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
chế thích nghi hiệu chỉnh các hệ số khuếch đại của bộ điều khiển sơ cấp, thay đổi cấu trúc của nó, và tạo ra các tín hiệu bổ sung … Trong một hệ thống thích nghi như vậy những thiết lập mà được hiệu chỉnh bởi người sử dụng ở cấp độ thứ hai
Dựa trên định nghĩa thì sự thay đổi tự động từ một chế độ hoạt động này sang một chế độ khác được xem như là một đặc trưng thích nghi Việc sử dụng kiến thức về ảnh hưởng của một biến bên ngoài đối với hoạt động của một hệ thống cũng
là một đặc trưng thích nghi Dạng thích nghi này có thể được nhận thấy theo hai cách khác nhau: hoặc thông qua việc đo lường những nhiễu riêng và tạo ra các tín hiệu để bù chúng (điều khiển feedforward), hoặc thông qua việc hiệu chỉnh các hệ
số khuếch đại của bộ điều khiển hồi tiếp theo một chương trình dựa trên kiến thức
về ảnh hưởng của các biến lên tham số hệ thống (gain scheduling) Khả năng khác
là sử dụng một ngân hàng các bộ điều khiển và lựa chọn bộ điều khiển tốt nhất theo
một cách tương tự với gain scheduling Đây được gọi là sự chuyển chế độ Sự mới
mẻ ở ý tưởng này là một phương pháp tiếp cận đa mô hình Đầu ra của tất cả các mô hình trong ngân hàng của các mô hình được so sánh với đầu ra của đối tượng được điều khiển Một bộ điều khiển có thể được thiết kế và thực hiện dựa trên mô hình
mà đầu ra của nó tương đồng nhất với đầu ra của đối tượng Trong thực tế không thể áp dụng điều khiển feedfoward hoặc gain scheduling đối với nhiều biến khác nhau
Một vài dạng của hệ thống thích nghi, hiểu một cách chính xác, đã được phát triển để cho phép hệ thống được tối ưu hóa mà không cần quan tâm đến nguyên nhân của những sự thay đổi động học đối tượng Thông thường khái niệm điều khiển thích nghi được giới hạn theo những dạng hệ thống thích nghi này Không có
sự phân biệt rõ ràng giữa điều khiển thích nghi và learning control Khái niệm learning control thường được sử dụng cho những hệ thống phức tạp hơn ở đó chứa đựng nhiều bộ nhớ và cho những bài toán mà không thể giải quyết được bằng phương pháp của các bộ điều khiển tiêu chuẩn, dựa trên hàm truyền, bởi vì chúng yêu cầu hình thức khác của sự biểu diễn kiến thức, ví dụ, cấu trúc mạng nơron Bài viết này đề cập đến một dạng đặc biệt của điều khiển thích nghi, đó là Điều khiển Thích nghi Mô hình Mẫu
Trang 36Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Các hệ thống điều khiển thích nghi có thể được phân loại theo nhiều cách khác nhau Một trong những cách phân loại đó là dựa trên sự khác nhau giữa:
- Những hệ thống với sự điều chỉnh trực tiếp của các tham số của bộ điều
khiển, không cần nhận dạng rõ ràng các tham số của đối tượng (điều khiển thích
nghi trực tiếp)
- Những hệ thống với sự điều chỉnh gián tiếp của các tham số bộ điều khiển,
không cần nhận dạng rõ ràng các tham số của đối tượng (điều khiển thích nghi gián
tiếp)
Các hệ thống điều khiển thích nghi mô hình mẫu, hầu hết đều sử dụng MRAC hoặc MRAS, chủ yếu được áp dụng cho điều khiển thích nghi trực tiếp Tuy nhiên, dưới đây sẽ chứng minh ứng dụng của MRAS để nhận dạng hệ thống
Triết lý cơ bản đối với ứng dụng của MRAS là hiệu suất mong muốn của hệ thống được đưa ra bởi một mô hình toán học, mô hình mẫu Khi hoạt động của mạch khác với hoạt động “lý tưởng”, mà được xác định bởi mô hình mẫu, đối tượng
sẽ được thay đổi, hoặc bằng hiệu chỉnh các tham số của bộ điều khiển (hình 2.5) hoặc bằng tạo ra một tính hiệu đầu vào bổ sung cho đối tượng (hình 2.6) Những thay đổi này được chuyển thành một bài toán tối ưu, đó là tối giản hóa tiêu chuẩn:
ở đó
e = y m - y p
Thay vì việc chỉ tối tối thiểu hóa sai số giữa tín hiệu đầu ra của đối tượng và
mô hình mẫu, tất cả các biến trạng thái cùa đối tượng và mô hình mẫu có thể được
e = xm - xp (2.5) Trong trường hợp đó bài toán tối ưu hóa có thể được biến đổi thành tối giản hóa tiêu chuẩn:
T 2 0
(2.4)
(2.6)
Trang 37Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
ở đó P là một ma trận xác định dương
Hình 2.5 Hệ thích nghi tham số
Hình 2.6 Hệ thích nghi tín hiệu
Những sự xem xét dưới đây có thể đóng một vai trò trong việc lựa chọn giữa
sự thích nghi của các tham số và thích nghi tín hiệu Một đặc tính quan trọng của các hệ thống với thích nghi tham số là những hệ thống này có bộ nhớ Ngay khi các tham số của đối tượng được hiệu chỉnh tới giá trị chính xác, và không có một sự thay đổi mới nào, vòng thích nghi trên thực tế là không cần thiết nữa: đối tượng và
mô hình mẫu thể hiện như nhau Nhìn chung bộ nhớ không xuất hiện trong những
hệ thống với thích nghi tín hiệu Vì vậy, vòng thích nghi vẫn cần thiết trong tất cả
Trang 38Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
các trường hợp, để tạo ra một tín hiệu đầu vào chính xác Do đó, các hệ thống thích nghi tín hiệu phải phản ứng nhanh hơn để thay đổi động học đối tượng so với các hệ thống thích nghi tham số bởi vì không có kiến thức từ quá khứ được sử dụng Trong những hệ thống mà ở đó các tham số thay đổi liên tục trên một phạm vi rộng thì đây
là một ưu điểm Tuy nhiên, trong một môi trường ngẫu nhiên, tức là trong những hệ thống với nhiều nhiễu, việc này có thể là một nhược điểm Hệ số khuếch đại lớn trong vòng thích nghi cũng có thể dẫn tới nhiều nhiễu trong tín hiệu đầu vào
Khi các tham số của đối tượng thay đổi chậm hoặc không thường xuyên, các
hệ thống với thích nghi tham số sẽ mang đến một hiệu suất tốt hơn nhờ vào bộ nhớ của chúng Đồng thời cũng có những thuật toán thích nghi kết hợp ưu điểm của cả hai phương pháp này Ở nội dung tiếp theo chúng ta sẽ chủ yếu tập trung vào các hệ thống thích nghi tham số, mặc dù sự kế hợp của thích nghi tham số và tín hiệu cũng được đề cập đến
Một cách khác để quan sát hệ thống được trình bày dưới đây “Vòng điều khiển hồi tiếp tiêu chuẩn” được xem như là hệ thống điều khiển sơ cấp tác động mà phải loại bỏ nhiễu “thông thường” Những thay đổi lớn hơn của các tham số hoặc nhiễu lớn hơn được giải quyết bởi hệ thống điều khiển (thích nghi) cấp hai tác động chậm hơn (Hình 2.7)
Hình 2.7 Điều khiển sơ cấp và cấp hai
Trang 39Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
2.2.2 Cơ chế thích nghi
Trong các tài liệu một vài phương pháp đã được đưa ra để thiết kế các hệ thống thích nghi Nhưng ta có thể có được cái nhìn sâu hơn vào một phương pháp bằng cách tự tư duy làm thế nào để tìm ra được các thuật toán Việc này giúp ta thực
sự hiểu được phải làm gì tiếp theo Do đó, lúc này chúng ta sẽ tạm thời hoãn lại những vấn đề về toán học và phân tích những ý tưởng cơ bản của MRAS với một ví
dụ đơn giản Khi cố gắng thiết kế một bộ điều khiển thích nghi cho hệ thống đơn giản này, chúng ta sẽ bắt gặp những vấn đề mà phải cần đến một nền tảng lý thuyết vững chắc hơn Những những đặc điểm chung của những phương pháp thiết kế khác nhau cũng như là sự khác biệt của chúng sẽ trở lên rõ ràng Trong Hình 2.8 là
sơ đồ khối được đưa ra cho một hệ thống mà sẽ được dùng như là một ví dụ xuyên suốt tài liệu này
Hình 2.8 Mô hình mẫu và đối tượng
Trang 40Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Trong ví dụ này, đối tượng (tuyến tính) được mô tả bằng hàm truyền:
Kω
này được thể hiện một cách trực tiếp từ hàm truyền của bộ điều khiển cộng đối tượng trong Hình 2.8:
K (t) = K (0) + β edt (2.11)