Hệ thống điều khiển thích nghi là hệ thống mà cấu trúc và tham số của bộđiều khiển có thể thay đổi theo sự biến thiên thông số của hệ sao cho chất l ượng đảmbảo các chỉ tiêu đã định.. Vì
Trang 1LỜI NÓI ĐẦU
Ngày nay, điều khiển robot công nghiệp đã và đang được ứng dụng rộng rãitrong nhiều lĩnh vực sản xuất và đời sống Để điều khiển rôbốt đã có rất nhiều phươngpháp khác nhau như dùng bộ điều khiển truyền thống PID, LQR (Linear QuadraticRegulator), LQG (Linear Quadratic Gaussian), STR (Self Tuning Regulator) Các
bộ điều khiển trên được thiết kế trên cơ sở mô hình tuyến tính hoá với những thông sốbiết trước Tuy nhiên Robốt là hệ cấu trúc có tính phi tuyến mạnh, các tham số không
rõ và thay đổi hoặc chứa các thành phần phi tuyến Ngoài ra trong quá trình làm việc
hệ còn chịu tác động của các nhiễu bên ngoài có tham số thay đổi Do vậy đối với cácrobot làm việc với yêu cầu đồng thời có độ ổn định và độ chính xác cao thì các bộ điềukhiển trên thể hiện các hạn chế
Hệ thống điều khiển thích nghi là hệ thống mà cấu trúc và tham số của bộđiều khiển có thể thay đổi theo sự biến thiên thông số của hệ sao cho chất l ượng đảmbảo các chỉ tiêu đã định Đặc biệt hệ điều khiển Learning Feed Forward (LFFC) trên
cơ sở mạng nơ ron, đã được nghiên cứu và thiết kế ứng dụng trong thực tế Bộ điềukhiển này có ưu điểm là có khả năng kháng nhiễu hệ thống (Systems Noise) có hiệuquả, nhờ đó độ chính xác và độ ổn định của hệ có thể đồng thời đạt được
Việc ứng dụng Learning Feed Forward trên cơ sở mạng nơron để điều khiển vị trí cánh
tay rôbốt sẽ nâng cao chất lượng của hệ thống Vì vậy tôi lựa chọn đề tài: “Ứng dụng Learning FeedForward trên cơ sở mạng nơ ron điều khiển vị trí cánh tay robot ”
Luận văn này tác giả phân tích mô hình động học của đối tượng thông qua mô hình toán học đó đưa ra phương án điều khiển Kết quả điều khiển được mô phỏng kiểm chứng trên phần mềm matlab
Luận văn này tác giả trình bày trong 3 chương:
Chương 1: Tổng quan về điều khiển bobot công nghiệp
Chương 2:Learning FeedForward control trên cơ sở mạng nơ ron
Chương 3 Thiết kế ứng dụng
Trang 2
CHƯƠNG 1: TỔNG QUAN VỀ ĐIỀU KHIỂN ROBOT CÔNG NGHIỆP 1.1.Tổng quan về Robot
- Về mặt cơ khí robot là một hệ thống cơ khí bao gồm các thanh nối cứng vàcác khớp Ngoài ra còn các bộ phận khác như thân máy, bệ máy
- Về nội dung kỹ thuật cơ khí, điều khiển và điện tử, robot có thể được địnhnghĩa như sau:
Robot là một cơ cấu cơ khí có một vài bậc tự do, có thể di chuyển như conngười và được điều khiển bằng máy tính;
Robot công nghiệp là một cơ cấu máy có thể lập trình được và làm việc mộtcách tự động không cần sự trợ giúp của con người;
Robot là cơ cấu máy có chức năng như con người và có sự hợp tác giữa cácRobot với nhau
Sơ đồ Hình 1.1 là sơ đồ điển hình của hệ thống điều khiển vị trí, trên sơ đồ thểhiện các vị trí và tốc độ của khớp thường được đo bởi các sensor như chiết áp, máyphát tốc, các thiết bị mã hoá Các tín hiệu ra được đưa đến khối điều khiển tạo ra tínhiệu điều khiển, điều khiển các khớp các cơ cấu dẫn động làm cho tay máy chuyểnđộng theo quỹ đạo mong muốn
Tổ chức kỹ thuật của Robot được chia thành 4 khối chức năng chính được minhhoạ như sau:
Sơ đồ hệ thống điều khiển vị trí
Quỹ đạo đặt
BỘ ĐIỀU KHIỂN
HỆ THỐNG ĐO (CÁC SENSOR)
ROBOT
Tín hiệu điều
Trang 31.2 Phương trình động học của robot
Với robot công nghiệp có nhiều loại khác nhau và sử dụng nhiều luật điều khiểnkhác nhau Trong khuôn khổ luận văn này tác giả khảo sát robot 2 bậc tự do dùngFeedback kết hợp LFFC (Learning Feedforward Control) trên cơ sở mạng nơ ron đểđiều khiển
C D S G u
M , sgn
Với:
- : véc tơ góc của khớp nối
- M : ma trận mô men quán tính
- C , : mô hình lực coriolis và quán tính ly tâm
InvertsKinematic
Cartesianpontstorage
TrajectoryPhaner
RobotDynamic
PhysicalPostionComputer
Block A
Block B
Block DBlock C
Sơ đồ tổ chức kỹ thuật của Robot
Trang 4-S : hệ số ma trận đường chéo ma sát Coulomb
-G : trọng lực
-u: mô men xoắn của khớp
Trong hình sau mô tả mô hình robot 2 bậc tự do:
1 2 2
2 1 1 1 2 1 2 2 2
2 2
1
2
1 2
1 2
1 2
1 2 2 1
2 2 2 2 1 2 2 2 2 1
2
1 2
2 2 2 1
1 2
2 2 1
2 2
2 2 2 1
2 2 1
2 1
2 1 2 2 1
2 2 2 2
1
1
cos
coscos
sgn
sgn0
0
0
00
sin
sinsin
2
cos2
cos2
cos2
u
u l
gm
m m gl
l gm s
s
d
d m
l
m l m
l
l m r
J m
l l l
m l l m l l l
l l m r
Trang 5là vị trí góc, vận tốc góc, gia tốc góc Lấy cơ sở từ phương trình này, để xây dựng hệthống điều khiển cho robot 2 bậc tự do
Trang 6
CHƯƠNG 2: LEARNING FEED – FORWARD CONTROL TRÊN CƠ SỞ
MẠNG NƠ RON 2.1 Giới thiệu.
Việc thiết kế một bộ điều khiển nói chung thường dựa trên một mô hình củamột đối tượng Mô hình đối tượng càng chính xác bao nhiêu thì việc thiết kế bộ điềukhiển càng hiệu quả bấy nhiêu Khi mô hình hóa đối tượng, các vấn đề sau có thể gặpphải:
- Hệ thống quá phức tạp để có thể hiểu được hoặc trình bày một cách đơn giản
- Mô hình quá khó hoặc quá đắt để đánh giá Một số đặc tính của một số tínhchất (phi tuyến) khó có thể đạt được, ví dụ như ma sát…
- Đối tượng có thể chịu ảnh hưởng lớn của nhiễu tác động từ môi trường, điềunày khó dự đoán trước được
- Các thông số của đối tượng có thể biến đổi theo thời gian
2.2 Điều khiển học (Learning Control - LC)
Một số định nghĩa về LC sau:
Định nghĩa 2.1: Một bộ LC là một hệ thống điều khiển bao gồm trong đó 1hàm xấp xỉ các ánh xạ đầu vào – đầu ra tương ứng trong suốt quá trình điều khiển màmột hoạt động mong muốn của hệ thống điều khiển đạt được
Định nghĩa 2.2 (hàm xấp xỉ): Một hàm xấp xỉ là một ánh xạ vào/ra được xácđịnh bởi một hàm được lựa chọn F., , với các véc tơ thông số được lựa chọn đểhàm F . được xấp xỉ tốt nhất
Ưu điểm của các bộ điều khiển LC:
Hàm xấp xỉ có khả năng tự khái quát hoá tốt
Sự mềm mại của giá trị xấp xỉ cần điều khiển được
Đáp ứng ngắn hạn là học tốt.
Sự ổn định lâu dài cần phải được bảo đảm
Trang 7
2.3 Bộ điều khiển học sử dụng sai lệch phản hồi (Feedback Error Learning - FEL)
2.3.1 Cấu trúc điều khiển
thì đầu ra của đối tượng y sẽ bằng tín hiệu đặt r
Bộ điều khiển phản hồi sai lệch (FEL)
Cơ chế học hội tụ chậm và trải qua vùng giá trị cực tiểu cục bộ
Có khả năng tổng quát hoá tốt
Hàm xấp xỉ
Trang 8Học theo sai số phản hồi
Phương thức thứ 2 là sử dụng nhiều bộ điều khiển feed-forward, mỗi một bộđược huấn luyện để thực hiện một nhiệm vụ cụ thể Mỗi một mạng nơ ron giám sáthọc xem là bộ feed-forward nào được sử dụng cho nhiệm vụ nào Mạng giám sát đãhọc từ bộ điều khiển feed-forward nào được áp dụng cho đối tượng đó
Tất cả điều này nhằm mục đích cải thiện những vấn đề sau:
- Độ hội tụ nhanh hơn Khi việc học diễn ra một cách cục bộ, chỉ có 1 số nhỏcác hàm trọng được thích nghi tạo ra độ hội tụ nhanh
- Có thể học các dữ liệu tương quan Các vùng của hàm cơ sở đã được trộnlẫn, điều này có ích cho quá trình học các dữ liệu tương quan
- Không có cực tiểu cục bộ Cơ cấu học không trải qua vùng cực tiểu cục bộ
2.4 Learning Feedforward Control (LFFC)
b)
0 1 2 3 4 5
1 µ
Trang 9Lớp 1 Lớp 2 Lớp 3
f .
ω01
y
2.4.2 Mạng nơ ron nhân tạo nhiều lớp
1) Nơ ron
Hình sau chỉ ra cấu trúc của một nơ ron nhân tạo
Nơ ron nhân tạo
2 1
x x x N T R N
x 2) Mạng nơ ron nhân tạo nhiều lớp (Multi layer Perceptron network - MLP)
Trong hình sau chỉ ra cấu trúc một MLP
Cấu trúc MLP 3 lớp
Mỗi nơ ron ở lớp thứ n điều được kết nối với các nơ ron ở lớp thứ n 1
2.5 Learning Feed – Forward trên cơ sở mạng nơ ron
2.5.1 Lựa chọn các thông số BSNs
Đối với các hệ thống chuyển động, các đầu vào của BSN bao gồm các vị tríđặt, r, và các đạo hàm của nó
Trang 10
2.5.1.1 Sự phân bố B-Spline trên đầu vào của mạng BSN
Đầu ra của BSN là tổng trọng số ước lượng của các B- spline Do đó, sốlượng của các B-Spline và các vị trí của chúng quyết định tính chính xác của giá trịxấp xỉ Các tín hiệu đích có dạng trơn có thể được xấp xỉ một cách chính xác với một
số lượng thấp các B-Spline “rộng” Các tín hiệu có độ dao động lớn yêu cầu một sốlượng lớn các B-Spline “hẹp”
Ánh xạ BSN 2.5.1.2 Sự lựa chọn các cơ cấu học
Luật online learning như sau: i i(r)e(r)
Và luật offline learning như sau:
j i
N
i i j j i
r
r e r
1
1
)(
)()(
Trang 11o E r i : Sai số xấp xỉ được tạo ra bởi mạng, trong LFFC e(r i) là
đầu ra của bộ điều khiển phản hồi u c
o N s: Số lượng các mẫu đầu vào
2.5.1.3 Sự lựa chọn tốc độ học
Tốc độ học càng lớn thì độ hội tụ của kỹ thuật học càng nhanh Tuy nhiên mộttốc độ học mà lớn thì sẽ làm cho giá trị xấp xỉ thêm nhạy cảm với nhiễu và có thể lànguyên nhân gây mất ổn định
Bằng việc sử dụng BSN, ta đã có các ưu điểm sau:
Không có cực tiểu cục bộ Đầu ra của BSN là một hàm trọng số tuyến tính Học cục bộ Khi B-Spline có một nền tảng chắc chắn, ánh xạ vào/ra của BSN
Trong đó: yd là đầu ra mong muốn
Luật học offline:
Trang 12
1 Tại thời điểm tín hiệu vào x j và tín hiệu học y d,j y jđưa vào BSN(j=1,2, ); Khi B –Spline thứ i cho tín hiệu vào x j x j 0, tính toán trọng số thíchnghi i
2 Tại thời điểm x j 0, iđã thích nghi, i i i
Xét một ví dụ như hình 2.11 sau:
Cơ chế học offline
2.6.2 Luyện mạng nơ ron
Luyện mạng MLP được thực hiện bằng cách thích nghi trọng số giữa các nốtmạng theo cơ chế lan truyền ngược Trọng số thích nghi trong hàm trị, J là nhỏ nhất.Một cách lựa chọn J phổ biến là tổng bình phương các sai lệch của các dữ liệu đãqua
1 1 2
1
, ,
1
1 0 1
1 1
1 0 1
1 1
1 0 1
1 1 2
1
, ,
1
1 0 1
1 1 2
1
, ,
1
2 0 1
1 0 1
1 1 2
1
, , 2
c d N
n
n nd dk
j
K k
j k
d j k
cd d N
n
n nd d
N n
n nd
d N
n
n nd dk
j
K k
j k
d j k
cd
d N
n
n nd dk
j
K k
j k
d j k
cd
k M
m
m N
n
n nm mk
j
K k
j k
d j k cd
x x
f y
y
x
x
x f
y y
x f
y y
x f
y y
Trang 132.7 LFFC cho chuyển động lặp
2.7.1 Chuyển động lặp
2.7.1.1 Điều khiển học cho chuyển động lặp (Iterative Learning Control - ILC)
Trong luận văn của tác giả, sự ổn định chỉ ra như sau:
- Chỉ ra Learning control bền vững hoặc không bền vững
- Dự báo đáp ứng tức thời
- Chỉ ra một sự ổn định bền vững
- Chỉ ra cách thức lựa chọn các tham số
Cấu trúc tổng quát Iterative Learning Control (ILC)
a Sơ đồ ILC cơ bản (sơ đồ mạch hở)
Trong đó:
- Phần tử phi tuyến P được xác định bởi:
Cx y
Bu x f x
b Sơ đồ điều khiển mạch kín:
Trong tần số cho phép, tín hiệu học được cho bởi:
k k F
F k
F k
F
1 1
:
Trang 14
c Sơ đồ ILC đo lường chính xác:
Sơ đồ ILC có đo lường chính xác 2.7.1.2 Chuyển động lặp (Repetitive Control - RC)
Trong luận văn này tác giả thảo luận RC nhằm chỉ ra cách xác định các tham sốlearning trong các chuyển động lặp
Sơ đồ điều khiển lặp
Trong hình trên, R là một bộ lọc learning Trong chế độ ổn định của RC, hệthống có thể chỉ ra theo một cách khác:
Sơ đồ tương đương điều khiển lặp
Trang 15
Hệ thống trên là ổn định nếu:
- Hệ thống không chuyển động lặp là ổn định, có nghĩa là CP
1
CP RCP
e S
1 1
1
Tiếp theo tính toán tham số lọc học Rđã được thiết kế trước và hoạt động tốt
ở các dải tần số và chỉ ra như sau:
2.7.2 LFFC cho chuyển động lặp (LFFC for Repetitive Motions)
Khi chuyển động lặp lại, tín hiệu Feed – forward cho ILC và RC coi như
là duy nhất là uF r trở thành hàm thời gian trong khoảng t ,0 T p với T p làchu kỳ của chuyển động
Trang 16Sự phân bố B – spline này được biểu diễn như hình sau:
Chỉ số thời gian cho loại chuyển động lặp
2.8 Phân tích sự ổn định của LFFC chỉ số thời gian.
Lựa chọn độ rộng của B – spline
Trong một mô hình chính xác của hệ thống P và bộ điều khiển C là sẵn có, giátrị của a n và n có thể được tính toán cho tất cả các tần số
Thuật toán 2.8.1: Tính toán giá trị ổn định nhỏ nhất của d dựa trên mô hình chi tiết của hệ thống điều khiển:
1 Chọn một khuôn dạng phân bố B-Spline bao gồm 3 B-Spline: N 3
2 Xác định a n và n: điều này thực hiện được nhờ các bước sau:
- Bước 2.1: Chọn n 1;
- Bước 2.2: Tính n
- Bước 2.3: Nếu a n 0 chuyển sang bước 3, nếu không tăng n lên một đơn vị
và quay lại bước 2.2
3 kiểm tra xem a n và n đã tìm được trong bước trước cỏa thỏa mãn không.Nếu thỏa mãn chuyển sang bước 4, nếu không chuyển sang bước 6
4 Tăng số lượng của B – spline lên một đơn vị: N N 1
5 Chuyển sang bước 2
6 Giá trị d được tính:
Trang 17
Các mô hình hình động học tần thấp có thể sử dụng thuật toán sau:
Thuật toán 2.8.2 (Tính toán giá trị ổn định nhỏ nhất của d với các giả thiết trên mô hình động học của hệ thống điều khiển)
1 Sử dụng mô hình tần số thấp của hệ thống để tính toán
,
5 ,
2 Chọn một khuôn dạng phân bố B-Spline bao gồm 3 B-Spline: N=3
3 Tính toán 1 theo công thức : 2 (rad.s 1 )
7 Chuyển tới bước 3;
8 Giá trị nhỏ nhất d được cho bởi:
1
min 0147
0
Trang 18
4 Giá trị nhỏ nhất của độ rộng mạng B – spline,dmin được cho bởi:
1 min 2 rad.s
d
2.8.2 Phân tích ổn định của LFFC
Sự ổn định của LFFC chỉ số thời gian có thể đảm bảo khi:
1 Chiều rộng của B – spline trong chu kỳ chuyển động,d lớn hơn rất nhiều
bề rộng tối thiều dmin s
2
Trong nghiên cứu này, tác giả sử dụng cách thứ 2 Ở đây sử dụng LFFC chỉ sốthời gian như một bộ lọc học
LFFC với mạng quy chuẩn
Tín hiệu Feed – forward thích nghi của LFFC được thực hiện theo 2 bước sau:
Bước 1: Trọng số của BSN chỉ số thời gian theo u C, BSN được huấn luyệnoff-line sử dụng tốc độ học bằng 1 Điều này cho đầu ra u R
Trang 19
Huấn luyện BSN chỉ số thời gian Bước 2: Sau đó trọng số của BSN chỉ số thời gian được thích nghi, LFFC
được huấn luyện sử dụng u R như một tín hiệu học
Thích nghi trọng số của LFFC
Trang 20
Kết luận chương 2:
Như vậy trong chương 2 đã trình phân tích được các bộ điều khiển học(learning control); Cơ sở mạng nơ ron; Các phương pháp luyện mạng nơ ron; phươngpháp quy chuẩn LFFC
Ngoài ra trong chương còn trình bày tổng quát cách tính toán các tham số cơbản của hệ thống điều khiển LFFC trên cơ sở mạng nơ ron
Từ những kiến thức cơ sở đã trình bày trong Chương 2 kết hợp với phương trình độnghọc trong Chương 1 có thể đi xây dựng mô hình điều khiển robot 2 bậc tự do dùng bộ
điều khiển Feedback kết hợp LFFC trên cơ sở mạng nơ ron
Trang 21
CHƯƠNG 3 THIẾT KẾ ỨNG DỤNG 3.1 Giới thiệu chung
Trong các chương trước, một số khía cạnh của LFFC trên cơ sở mạng nơ ron
đã được đề cập, trong chương này, sẽ áp dụng những kiến thức đó để thiết kế ứng dụngLFFC trên cơ sở mạng nơ ron để điều khiển cánh tay robot 2 bậc tự do Để hoàn thànhnhiệm vụ này cần sơ lược các kết quả sau:
- Bộ điều khiển phản hồi (Feedback Control): Bộ điều khiển phản hồi để bùcác nhiễu ngẫu nhiên và tạo ra tín hiệu học cho bộ Feed – Forward Bộ điều khiểnphản hồi cũng giúp xác định độ rộng của B – Spline
- Lựa chọn đầu vào của Feed – Forward: Tín hiệu vào của feed – forward đượclựa chọn là vị trí, vận tốc, gia tốc tham chiếu , ,
- Cấu trúc của phần feed – forward: Kết quả nghiên cứu trong chương 2 chothấy việc lựa chọn feed – forward thường là nhiều đầu vào
- Phân bố B – Spline: Việc lựa chọn độ rộng của B – spline trong LFFC chỉ sốthời gian có thể xác định từ đáp ứng tần số trong vòng phản hồi kín
- Tốc độ học: Giá trị lớn nhất của tốc độ học mà hội thu được xác định từ đápứng tần số của vòng lặp kín
3.2 Xây dựng mô hình điều khiển robot 2 bậc tự do
3.2.1 LFFC tiết kiệm
Mô hình LFFC tiết kiệm được cho bởi sơ đồ sau:
Trang 22
a) cấu trúc LFFC đơn; b) Cấu trúc LFFC tiết kiệm
Trong cấu trúc LFFC tiết kiệm, mỗi BSN chỉ bao gồm một trong các tổ hợp
3.2.2 Mô hình LFFC tiết kiệm cho cánh tay robot 2 bậc tự do.
Robot 2 bậc tự do có 6 tín hiệu đầu vào Feed – forward đó là , , cho mỗikhớp
Trong robot 2 bậc tự do, Ccó thể bỏ qua khi tốc độ chuyển động thấp
2 1 1
0
0
r J r
J M
Tín hiệu feed – forward đầu ra mong muốn có dạng sau:
2 2
, 2
2 , 2 2 , 2 2 2
2 1 1 , 1
1 , 1 , 2
2 1
, 1
1 , 1 , 1
coscos
sgn2
d d d
d d
d d
d d
d d
d
d
l gm s
d r
J
m m gl
l gm s
d r