ĐẠI HỌC THÁI NGUYÊN ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP VŨ QUANG VINH ỨNG DỤNG LEARNING FEEDFORWARD TRÊN CƠ SỞ MẠNG NƠRON ĐIỀU KHIỂN VỊ TRÍ CÁNH TAY ROBOT Tai ngay!!! Ban co the xoa dong chu nay!!! LỜI NÓI ð[.]
Trang 1VŨ QUANG VINH
ỨNG DỤNG LEARNING FEEDFORWARD TRÊN CƠ SỞ MẠNG NƠRON ĐIỀU KHIỂN VỊ TRÍ CÁNH TAY ROBOT
Trang 2Quadratic Regulator), LQG (Linear Quadratic Gaussian), STR (Self Tuning
Regulator) Các bộ ñiều khiển trên ñược thiết kế trên cơ sở mô hình tuyến tính hoá với những thông số biết trước Tuy nhiên Robốt là hệ cấu trúc có tính phi tuyến mạnh, các tham số không rõ và thay ñổi hoặc chứa các thành phần phi tuyến Ngoài
ra trong quá trình làm việc hệ còn chịu tác ñộng của các nhiễu bên ngoài có tham số thay ñổi Do vậy ñối với các robot làm việc với yêu cầu ñồng thời có ñộ ổn ñịnh và
ñộ chính xác cao thì các bộ ñiều khiển trên thể hiện các hạn chế
Hệ thống ñiều khiển thích nghi là hệ thống mà cấu trúc và tham số của bộ ñiều khiển có thể thay ñổi theo sự biến thiên thông số của hệ sao cho chất lượng ñảm bảo các chỉ tiêu ñã ñịnh ðặc biệt hệ ñiều khiển Learning Feed Forward (LFFC) trên cơ sở mạng nơ ron, ñã ñược nghiên cứu và thiết kế ứng dụng trong thực tế Bộ ñiều khiển này có ưu ñiểm là có khả năng kháng nhiễu hệ thống (Systems Noise) có hiệu quả, nhờ ñó ñộ chính xác và ñộ ổn ñịnh của hệ có thể ñồng thời ñạt ñược
Việc ứng dụng Learning Feed Forward trên cơ sở mạng nơron ñể ñiều khiển vị trí cánh tay rôbốt sẽ nâng cao chất lượng của hệ thống Vì vậy tôi lựa chọn ñề tài:
“Ứng dụng Learning FeedForward trên cơ sở mạng nơ ron ñiều khiển vị trí cánh tay robot ”
Luận văn này tác giả phân tích mô hình ñộng học của ñối tượng thông qua
mô hình toán học ñó ñưa ra phương án ñiều khiển Kết quả ñiều khiển ñược mô phỏng kiểm chứng trên phần mềm matlab
Luận văn này tác giả trình bày trong 3 chương:
Chương 1: Tổng quan về ñiều khiển bobot công nghiệp
Trong chương này trình bày về khái niệm phân loại, cấu trúc kỹ thuật của robot công nghiệp và ñã ñưa ra phương trình ñộng học của robot 2 bậc tự do dùng
Trang 3Feedback kết hợp LFFC (Learning Feedforward Control) trên cơ sở mạng nơ ron ñể ñiều khiển
Chương 2:Learning FeedForward control trên cơ sở mạng nơ ron
Trong chương này tác giả trình bày về cơ sở lý thuyết của các bộ ñiều khiển học; bộ ñiều khiển LFFC, cơ sở mạng nơ ron, LFFC trên cơ sở mạng nơ ron Phân tích ứng dụng LFFC trên cơ sở mạng nơ ron cho các chuyển ñộng lặp Phương pháp quy chuẩn LFFC và phân tích quá trình ổn ñịnh của hệ thống
Chương 3 Thiết kế ứng dụng
Trong chương này tác giả sử dụng cơ sở lý thuyết từ chương 1 và chương 2 thiết kế bộ ñiều khiển bobot 2 bậc tự do sử dụng bộ ñiều khiển Feedback kết hợp với LFFC trên cơ sở mạng nơ ron Kết quả của quá trình phân tích ñược kiểm chứng bằng mô phỏng trên phần mềm Matlab simulink
Trang 4CHƯƠNG 1: TỔNG QUAN VỀ ðIỀU KHIỂN ROBOT CÔNG NGHIỆP
Giới thiệu:
Robot công nghiệp bao gồm nhiều loại với hệ thống ñiều khiển khác nhau, chúng ñược sử dụng rộng rãi trong nhiều lĩnh vực Trong chương này, tác giả trình bày về các loại robot công nghiệp, xây dựng mô hình toán cho robot 2 bậc tự do sử dụng hệ thống ñiều khiển Feedback kết hợp với LFFC trên cơ sở mạng nơ ron
Robot là một hệ thống phức tạp, ta có thể hiểu nó thông qua cách nhìn nhận
từ nhiều phương diện sau:
Trang 51) Phương diện vật lý:
Là một hệ thống lớn bao gồm nhiều hệ thống con (sub_system) ðể vận hành ñược
nó phải có ñầy ñủ các yếu tố: Năng lượng; Cơ khí (các thanh nối, khớp, thân, ); ðiều khiển;
2) Phương diện truyền tin:
Là một hệ thống truyền tin và xử lý tin khép kín bao gồm: Phần chuyển ñộng; phần nhận dạng và ñiều khiển
a) Cơ cấu chuyển ñộng: Có tác dụng thực hiện các chuyển ñộng theo yêu cầu của công nghệ Phần chuyển ñộng ñược thực hiện bằng các kỹ thuật truyền ñộng sau: Truyền ñộng thuỷ lực; Truyền ñộng khí nén và truyền ñộng ñiện Trong
ñó truyền ñộng ñiện có thể dùng ñộng cơ ñiện một chiều hay ñộng cơ ñiện xoay chiều ñi kèm bộ ñiều khiển
b) Cơ cấu nhận dạng: Là hệ thống các cảm biến bao gồm cảm biến lực, cảm biến vị trí, cảm biến tốc ñộ, Các thông tin ño ñược từ các cảm biến ñược chuyển tới bộ phận ñiều khiển
ra tín hiệu ñiều khiển, ñiều khiển các khớp các cơ cấu dẫn ñộng làm cho tay máy chuyển ñộng theo quỹ ñạo mong muốn
Trang 61.1.2 Phân loại Robot công nghiệp
Có nhiều cách phân loại Robot, dựa trên các cơ sở kỹ thuật khác nhau có các cách phân loại khác nhau Sau ñây là một số cách phân loại:
1 Phân loại theo số bậc tự do trong môi trường công tác
Lấy hai hình thức chuyển ñộng nguyên thuỷ làm chuẩn
Chuyển ñộng tịnh tiến theo các hướng x,y,z trong không gian ðềcác (Ký hiệu là P: Prasmatic)
Chuyển ñộng quay xung quanh các trục x, y, z (Ký hiệu là R: Rotation)
Thông thường các chuyển ñộng trên ñược ký hiệu như sau
Chuyển ñộng tịnh tiến Chuyển ñộng quay
Hình 1.1 Sơ ñồ hệ thống ñiều khiển vị trí
BỘ ðIỀU KHIỂN
HỆ THỐNG ðO (CÁC SENSOR)
ROBOT
Tín hiệu ñiều
Trang 7Như vậy chỉ với 3 bậc tự do, Robot sẽ chuyển ñộng trong môi trường công tác với hình khối phụ thuộc vào tổ hợp P và R như hình minh hoạ ở Hình 1.2
PPP trường công tác là hình hộp chữ nhật hoặc lập phương
RPP trường công tác là khối trụ
RRP trường công tác là khối cầu
RRR trường công tác là khối cầu
Lĩnh vực hoạt ñộng của Robot ngày càng mở rộng, với yêu cầu các khả năng thao tác ngày càng khéo léo và tinh vi Vì vậy số bậc tự do có thể không hạn chế Do vậy
ñể giải quyết bài toán ñiều khiển trong Robot thì bên cạnh hệ toạ ñộ chuẩn U ta còn ñặt ñặt nhiều hệ toạ ñộ khác như:
Trang 8Số bậc tự do tăng lên kéo theo vấn ñề kỹ thuật và kinh tế phải giải quyết Vì vậy việc chọn số bậc tự do nhất thiết phải ñảm bảo về tính kỹ thuật và tối ưu theo tiêu chuẩn yêu cầu
2 Phân loại theo phương pháp ñiều khiển
Có 2 kiểu ñiều khiển là ñiều khiển hở và ñiều khiển kín
- ðiều khiển hở, dùng truyền ñộng bước (dùng ñộng cơ ñiện hoặc ñộng cơ thủy lực, khí nén ) mà quãng ñường hoặc góc dịch chuyển tỉ lệ với số xung ñiều khiển Kiểu này ñơn giản nhưng ñộ chính xác thấp
- ðiều khiển kín (ñiều khiển servo) sử dụng tín hiệu phản hồi vị trí ñể tăng
ñộ chính xác ñiều khiển Có 2 kiểu ñiều khiển kín là ñiểm - ñiểm và ñiều khiển ñường
ðiều khiển ñiểm - ñiểm (Point to Point): phần công tác dịnh chuyển từ ñiểm này ñến ñiểm kia theo ñường thẳng với tốc ñộ không cao Nó chỉ làm việc tại các ñiểm dừng Kiểu ñiều khiển này dùng trên các robot hàn ñiểm, vận chuyển, tán ñinh, bắn ñinh…
ðiều khiển theo ñường (Contour): ñảm bảo cho phần công tác dịch chuyển theo quỹ ñạo bất kì với tốc ñộ có thể ñiều khiển ñược Kiều ñiều khiển này dùng trên các robot hàn hồ quang, phun sơn,
3 Phân loại theo hệ thống năng lượng
Dựa vào cơ cấu sinh nguồn năng lượng ñộng lực ta chia ra thành 2 loại
• Hệ năng lượng ñiện :
Thường dùng các ñộng cơ truyền ñộng là ñộng cơ một chiều hoặc ñộng cơ bước Với hệ này có ñặc ñiểm là hoạt ñộng chính xác, tin cậy, ít phần tử phi tuyến
Trang 9dễ ñiều khiển, ngoài ra còn có một số ñặc tính khác như kết cấu gọn nhẹ, hệ truyền năng lượng ñơn giản nhưng có nhược ñiểm là cho hệ số quá tải thấp
• Hệ năng lượng thuỷ lực – khí ñộng:
ðối với hệ thuỷ lực có thể ñạt công suất cao, ñáp ứng ñược những ñiều kiện làm việc nặng nề, tuy nhiên hệ này thường có kết cấu cồng kềnh do cấu tạo có thêm
bể dầu, van lọc, hệ thống dẫn ngược ngoài ra với hệ này sử dụng thuỷ lực có ñộ phi tuyến cao do vậy ñiều khiển khó
• Hệ khí nén
Với hệ khí nén có cấu tạo gọn nhẹ hơn do không cần dẫn ngược, nhưng phải gắn liền với một trung tâm tạo khí nén Hệ này làm việc với công suất trung bình và nhỏ, kém chính xác
Như vậy hệ năng lượng ñiện ñiều khiển chính xác dễ ñiều khiển, kết cấu gọn nhẹ nhưng công suất hạn chế, không cho phép quá tải lớn do vậy hệ này chỉ phù hợp với hệ công suất trung bình và nhỏ và yêu câù thao tác chính xác cao ðối với
hệ năng lượng thuỷ lực và khí ñộng thì có kết cấu cồng kềnh ñiều khiển khó nhưng
bù lại có hệ số quá tải lớn do vậy với hệ này thì phù hợp với tải có công suất lớn và yêu cầu chính xác truyền ñộng không cao
1.1.3 Sơ ñồ tổ chức kỹ thuật của Robot.
Tổ chức kỹ thuật của Robot ñược chia thành 4 khối chức năng chính ñược minh hoạ như Hình 1.3 [1]
Trang 10Khối A:
Gồm hai thành phần:
Teach pendant: Có nhiệm vụ thực hiện các quá trình dạy học cho Robot
Record buttum: Lưu trữ và chuyển giao các dữ liệu cảm nhận vật lý trong quá trình học gọi là “Bộ cảm nhận vật lý” thông qua khối này tín hiệu ñặc trưng cho ñộ dài và toạ ñộ góc của vị trí ñầu và vị trí cuối của quỹ ñạo chuyển ñộng ñược cảm nhận
Ví dụ: Các quỹ ñạo ban ñầu, cuối: [ (θ0,h0);(θf,h f) ]
Khối B:
Là khối xử lý của Robot gồm các cụm vi xử lý ñể giải quyết các vấn ñề sau :
Nhóm Forword Kinematic: Thiết lập và giải các bài toán ñộng học trên cơ sở thông số vào là các vị trí ñặt theo các trục: (θs,h s) Tức là giải quyết “Bài toán ñộng học thuận”
Inverts Kinematic
Cartesianpont storage
Trajectory Phaner
Robot Dynamic
Physical Postion Computer
Block A
Block B
Block D Block C
Hình 1.3 Sơ ñồ tổ chức kỹ thuật của Robot
Trang 11Nhóm Cartesian Point Storage: Lưu trữ và chuyển giao các kết quả của quá trình giải “Bài toán ñộng học thuận”
Nhóm Trajectory Planer: Lập trình quỹ ñạo ñi qua các ñiểm ñã hoặc chưa “Dạy”
ñể hình thành bộ quỹ ñạo chuyển ñộng cần có [X d( ) ( )t ;Y d t ] của cơ cấu chấp hành cuối
Nhóm Invers Kinematic: Giải bài toán ñộng học ngược tìm ra các thông số ñiều khiển [θd( ) ( )t h d t ]
Thông qua sự chia ra từng khối theo tổ chức kỹ thuật cho thấy có ba bộ thông số chủ yếu sau :
Bộ thông số cảm nhận vị trí;
Bộ thông số hình học;
Bộ thông số ñiều khiển
Nó ñược biến ñổi và chuyển liên tục từ nhóm chức năng này sang nhóm chức năng khác (ðược thể hiện bằng ký hiệu trên hệ thống) Do ñó nhiệm vụ chủ yếu của quá trình thiết kế ñộng học Robot là thiết lập giải bài toán ñộng học thuận và bài toán
Trang 12ñộng học ngược Kết quả tìm ñược sẽ ñóng vai trò quan trọng trong việc ñưa ra tín hiệu ñiều khiển chính xác theo mong muốn
1.2 Phương trình ñộng học của robot
Với robot công nghiệp có nhiều loại khác nhau và sử dụng nhiều luật ñiều khiển khác nhau Trong khuôn khổ luận văn này tác giả khảo sát robot 2 bậc tự do dùng Feedback kết hợp LFFC (Learning Feedforward Control) trên cơ sở mạng nơ ron ñể ñiều khiển
Phương trình ñộng học của robot hai bậc tự do ñược miêu tả bởi công thức sau: [7]
M θ θ&+ θ,θ&θ&+ θ&+ sgnθ& + θ = (1.1)
Với:
- θ: véc tơ góc của khớp nối
- M( )θ : ma trận mô men quán tính
- C( )θ,θ&: mô hình lực coriolis và quán tính ly tâm
Trang 13+ +
+ +
+ +
+
2
1 2
1 2 2
2 1 1 1 2 1 2 2 2
2 2
1
2
1 2 1 2
1 2
1 2 2 1
2 2 2 2 1 2 2 2 2 1
2
1 2
2 2 2 1
1 2
2 2 1
2 2
2 2 2 1
2 2 1
2 1
2 1 2 2 1
2 2 2 2
1
1
cos
cos cos
sgn
sgn 0
0
0
0 0
sin
sin sin
2
cos 2
cos 2
cos 2
u
u l
gm
m m gl
l gm s
s
d
d m
l l
m l m
l
l m r
J m
l l
m l l m l l l
l m r
J
θθ
θθ
θθ
θ
θ
θθ
θθ
θ
θθθ
θ
θ
θθ
θθ
Trang 14Viết lại biểu thức (1.1) theo ma trận ta có:
θθ
θθ
θ
θ
θθ
θθθθ
0
, 0
0
1 1
1
1 1
I
u M S
M G M
D M C
Như vậy B( )θ khả nghịch, ñiều kiện ñã ñược thỏa mãn
Như vậy có thể kết luận rằng: Góc quay của cánh tay robot có thể ñược ñiều khiển bởi LFFC Tín hiệu ñiều khiển Feed – forward mong muốn là:
u d =C(θd,θ&d)θ&d +Dθ&d +G( )θ&d +Ssgn( )θ&d +M( )θ&d θ&d (1.6)
Từ (1.6) cho thấy tín hiệu ñầu vào ñiều khiển BSN sau khi ñã ñơn giản hóa bao gồm các thành phần (θ,θ& ,,θ&) Với robot 2 bậc tự do, số lượng ñầu vào là 6
Trang 15Kết luận Chương I:
Như vậy với robot 2 bậc tự do sử dụng hệ thống ñiều khiển Feedback kết hợp với LFFC trên cơ sở mạng nơ ron, tác giả ñã chỉ ra phương trình ñộng học như phương trình (1.6) Với tín hiệu vào ñiều khiển Feed – forward bao gồm (θ,θ& ,,θ&)tương ứng là vị trí góc, vận tốc góc, gia tốc góc Lấy cơ sở từ phương trình này, ñể xây dựng hệ thống ñiều khiển cho robot 2 bậc tự do
Trang 16CHƯƠNG 2: LEARNING FEED Ờ FORWARD CONTROL TRÊN CƠ SỞ MẠNG NƠ RON
2.1 Giới thiệu
Một trong các công cụ cạnh tranh mà các hãng sản cuất tùy ý sử dụng ựó là chất lượng của sản phẩm đặc biệt là trong thị trường có liên quan ựến các sản phẩm công nghệ cao đó là một trong những nhân tố quan trọng mang tắnh sống còn
ựể tạo ra các sản phẩm có chất lượng tốt hơn điều này ựược nhìn nhận trong thị trường ựối với sản phẩm mà chúng ta sẽ xem xết trong luận văn này, vắ dụ như các
hệ thống truyền ựộng cơ ựiện tử Theo quan ựiểm cơ ựiện tử, chất lượng của các hệ thống cơ ựiện tử có thể ựược cải tiến bằng việc thay ựổi thiết kế cơ khắ và bộ ựiều khiển Vắ dụ như khi nghiên cứu các cánh tay robot, nơi mà chuyển ựộng chắnh xác phụ thuộc vào ựộ cứng và quán tắnh của hệ thống Nếu cánh tay không ựạt ựược các yêu cầu nhất ựịnh, ựộ cứng của nó có thể tăng lên hoặc quán tắnh của nó có thể ựược giảm bớt bằng cách thay ựổi kết cấu cơ khắ hoặc bằng việc ứng dụng các vật liệu mới
Việc thay ựổi ựiều khiển có thể ựược thực hiện hoặc bằng cách thay ựổi thông số của bộ ựiều khiển ựang tồn tại hoặc bằng cách thiết kế bộ ựiều khiển mới Khi một bộ ựiều khiển ựược cải tiến, chỉ ựơn thuần là yêu cầu thay ựổi phần mềm
và trong một số trường hợp là thêm các sensor cách ựánh giá này tương ựối dễ dàng thực hiệ ựược, khi ựem so sánh với các cấu trúc tương ứng Trong luận văn này, tác giả sẽ tập trung vào việc nâng cao chất lượng của hệ thống bằng bộ ựiều khiển
Việc thiết kế một bộ ựiều khiển nói chung thường dựa trên một mô hình của một ựối tượng Mô hình ựối tượng càng chắnh xác bao nhiêu thì việc thiết kế bộ ựiều khiển càng hiệu quả bấy nhiêu Khi mô hình hóa ựối tượng, các vấn ựề sau có thể gặp phải:
- Hệ thống quá phức tạp ựể có thể hiểu ựược hoặc trình bày một cách ựơn giản
- Mô hình quá khó hoặc quá ựắt ựể ựánh giá Một số ựặc tắnh của một số tắnh chất (phi tuyến) khó có thể ựạt ựược, vắ dụ như ma sátẦ
Trang 17- ðối tượng cĩ thể chịu ảnh hưởng lớn của nhiễu tác động từ mơi trường, điều này khĩ dự đốn trước được
- Các thơng số của đối tượng cĩ thể biến đổi theo thời gian
Bộ điều khiển thích nghi cĩ thế là một giải pháp khi cấu trúc của mơ hình động học của đối tượng và nhiễu mơ hình tác động lên nĩ được biết trước trong khi các giá trị của các thơng số thì khơng thể xác định được Khi mơ hình khơng xác định hoặc cĩ nhiều thơng số khơng xác định thì lúc đĩ điều khiển học sẽ được xét đến
2.2 ðiều khiển học (Learning Control - LC)
Các bộ LC thường được hình dung gần giống như là một hệ thống điều khiển của con người và do đĩ nĩ cĩ các thuộc thính giống với con người Trong luận văn này khơng nghiên cứu bộ LC theo quan điểm sinh học nhưng đồng ý với một số định nghĩa sau:
ðịnh nghĩa 2.1: Một bộ LC là một hệ thống điều khiển bao gồm trong đĩ 1 hàm xấp xỉ các ánh xạ đầu vào – đầu ra tương ứng trong suốt quá trình điều khiển
mà một hoạt động mong muốn của hệ thống điều khiển đạt được
ðịnh nghĩa 2.2 (hàm xấp xỉ): Một hàm xấp xỉ là một ánh xạ vào/ra được xác định bởi một hàm được lựa chọn F( ).,ω , với các véc tơ thơng số ω được lựa chọn
để hàm F( ). được xấp xỉ tốt nhất
Lưu ý 2.1 (điều khiển tự học và điều khiển thích nghi): Theo hướng này, điều khiển thích nghi cĩ thể được xem xét giống như là một dạng của LC trong đĩ một hàm xấp xỉ được sử dụng cĩ thể chỉ xấp xỉ một lớp giới hạn của mục tiêu Nĩi chung, một bộ LC sẽ bao gồm một hàm xấp xỉ cho một đối tượng cĩ nhiều hàm mục tiêu hơn
Một biến mở rộng của các hàm xấp xỉ cĩ thể được sử dụng như mạng nơ ron, mạng mờ - nơ ron (cũng được biết đến với tên các bộ điều khiển logic mờ thích
Trang 18nghi) v v Nói chung một cách sơ bộ, các bộ hàm xấp xỉ có thể ñược sử dụng theo
2 cách:
Trước hết, hàm xấp xỉ có thể ñược sử dụng ñể tạo (một phần) tín hiệu ñiều khiển Việc học ñược thay thế bới việc thích nghi véc tơ thông số của hàm xấp xỉ theo cách mà một số các hàm giá trị chứa ñựng sai lệch ñiều khiển là cực tiểu Bộ ñiều khiển này ñược gọi là LC trực tiếp
Thứ hai, hàm xấp xỉ có thể ñược sử dụng ñể học một mô hình ñối tượng tương ứng ñược kiểm soát ví dụ như là ñể làm giảm giá trị của sai số dự báo Dựa trên cơ sở của mô hình ñã ñược học một bộ ñiều khiển ñược xây dựng, bộ ñiều khiển này ñược gọi là LC gián tiếp
Từ khi bộ LC ñầu tiên ñược phát triển vào năm 1963 cho tới nay, lĩnh vực
LC ñã và ñang phát triển rất rộng rãi Rất nhiều các cấu trúc của bộ ñiều khiển khác nhau ñã ñược ñề xuất và các thuộc tính của chúng (như tính ổn ñịnh và tốc ñộ hội tụ
ñã ñược phân tích cả trong thực tế và lý thuyết) Tuy nhiên, mặc dù tất cả chúng ñều ñược nghiên cứu nhưng chỉ có một số bộ LC ñược ứng dụng trong sản phẩm mang tính thương mại Có thể vì những lý do sau ñây:
Việc chứng minh sự ổn ñịnh ñược ñánh giá cao Phần lớn các nghiên cứu lý thuyết của bộ LC ñược tập trung vào tính ổn ñịnh Tuy nhiên, một bộ LC ổn ñịnh cũng không cần thiết mang lại một ñáp ứng ngắn hạn học tốt….Hoạt ñộng của bộ
LC ñối với một con robot ñã ñược quan sát bằng mô phỏng Sau khi thực hiện với chuyển ñộng 6 bậc tự do, sai số hiệu chỉnh giảm xuống hệ số 2.8 Khi tiếp tục tự học, sai số hiệu chỉnh lên ñến hệ số 1051 tại bước lặp thứ 62.000 và cuối cùng giảm xuống hệ số 10-18 tại bước lặp thứ 250.000 Như vậy, mặc dù thực tế cuối cùng sai
số hiệu chỉnh nhỏ ñã ñạt ñược nhưng bộ LC không có giá trị thực nghiệm vì nó có dải sai số hiệu chỉnh rất rộng ở giữa
Không nên quá quan tâm tới sai số hiệu chỉnh ñiểm 0 Một số LC cố gắng ñạt ñược sai số hiệu chỉnh ñiểm 0 Tuy nhiên, ñiều này yêu cầu có những tín hiệu ñiều khiển lớn ở những tần số trên băng thông hệ thống, các tần số này có thể gây
Trang 19nguy hiểm cho các cơ cấu chấp hành và nĩi chung là khơng đạt được như mong muốn Loại sai số của hàm xấp xỉ Trong đại đa số các bộ LC, hàm xấp xỉ được thực hiện với vai trị như một mạng nơ ron (Multi Layer Perceptron – MLP) Như chúng tơi sẽ bàn tới ở dưới đây, loại mạng nơ ron này khơng tương thích một cách đặc biệt cho việc điều khiển
Trên cơ sở những suy xét này, chúng ta cĩ thể đưa ra một số các thuộc tính sau mà một bộ LC nên để trở thành một mặt hàng ưa chuộng về mặt thương mại:
Dễ dàng sử dụng trong một hệ thống điều khiển cĩ sẵn ðiều này cĩ nghĩa
là khi một đáp ứng ngắn hạn học tốt thì hiệu suất cực tiểu được bảo đảm Ví dụ như
là trong một bộ điều khiển hiện nay Thậm chí trong suốt quá trình huấn luyện đối tượng vẫn cĩ thể được duy trì trong quá trình vận hành mà khơng gây ra những tổn thất của quá trình sản xuất
Cĩ khả năng sử dụng những kiến thức dự đốn của đối tượng Nĩi chung các nhà thiết kế và/hoặc người vận hành cĩ một số kiến thức về đối tượng, ví dụ như trong cấu trúc của mơ hình tốn học( đơn giản) dưới dạng các hàm, một giản đồ Bode của đối tượng hoặc một mơ tả dưới dạng biến ngơn ngữ của hành vi đối tượng Bộ LC nên cho phép loại kiến thức này được kết hợp vào trong thiết kế bộ điều khiển, để chọn các thơng số của bộ điều khiển hợp lý và để tốc độ lệ học
Hàm xấp xỉ nên phù hợp cho việc điều khiển ðiều này cĩ nghĩa rằng: Cần sử dụng dung lượng nhớ nhỏ Trong thực tế, bộ điều khiển được thực hiện bằng phần mềm được gắn vào máy tính Dung lượng bộ nhớ là cĩ hạn, do đĩ
số lượng các thơng số của hàm xấp xỉ mà yêu cầu phải xấp xỉ tín hiệu điều khiển khơng thể quá rộng
Việc tính tốn đầu ra của hàm xấp xỉ và sự tương thích của quan hệ vào/ra phải được thực hiện một cách nhanh chĩng Trong mơi trường thời gian thực, trong một khoảng thời gian lấy mẫu, các thơng số của hàm xấp xỉ phải tương ứng
và đầu ra tính được Rất nhiều hệ thống chuyển động cơ điện tử yêu cầu thời gian
Trang 20mẫu nhỏ và cho phép thời gian tính toán là rất ít Các hàm xấp xỉ mà bao gồm một lượng lớn các tính toán phức tạp do ñó chúng không phù hợp cho việc ñiều khiển
Cơ chế học cần hội tụ nhanh ðể giữ ñược lượng thời gian trong ñó quá trình vận hành của hệ thống ñược ñiều khiển tối ưu từng phần, tiến tới mức cực tiểu, cơ chế học cần hội tụ nhanh
Cơ chế học không nên bị cực tiểu cục bộ, khi bị lưu giữ trong mức cực tiểu cục bộ, thì cơ chế học cho rằng các giá trị ñạt ñược của các thông số của hàm xấp xỉ, ñược biểu thị bởi ωloc, sinh ra sai số xấp xỉ cực tiểu, ñược biểu thị bởi
) ( loc
E ω Mặc dù ωglob ≠ωloctồn tại, làm cho E(ωglob) ≠E(ωloc) Trong hình dưới ñây một ví dụ theo một chiều của hiện tượng như vậy ñược giới thiệu Ở mức cực tiểu cục bộ ñộ ω=ωloc, gradient của sai số xấp xỉ bằng 0 Cơ cấu học mà sử chỉ sử dụng gradient của sai số xấp xỉ thì không thể thoát khỏi mức cực tiểu cục bộ
Hình 2.1 Cực tiểu cục bộ trong kỹ thuật học
Khi cơ chế học dễ dàng lưu lại ở mức tối thiểu cục bộ, rất khó ñể huấn luyện LC ñể thu ñược hiệu quả cao Quan hệ vào/ ra phải tương thích một cách cục
bộ Trong một số hàm xấp xỉ, quan hệ vào/ ra này là tương thích toàn cục ðiều này
có nghĩa là nếu giá trị của một trong các thông số của hàm xấp xỉ ñược tương thích, thì quan hệ vào /ra trên toàn bộ phạm vi ñầu vào bị thay ñổi Xét một bộ LC ñược huấn luyện ñể thực hiện một số chuyển ñộng Khi bộ LC ñược huấn luyện ñể thực hiện một chuyển ñộng mới, ñiều này liên quan tới việc tương ứng các thông số của hàm xấp xỉ Bởi vì mối quan hệ vào ra ñược tương thích toàn cục nên các tín hiệu
Trang 21ựiều khiển học trước ựó bị thay ựổi có thể gây ra nhưng tổn thất trong quá trình làm việc Do ựó ựiều mong ựợi ở ựây là mối quan hệ vào ra của hàm xấp xỉ ựược tương thắch một cách cục bộ Trong trường hợp này, việc học một chuyển ựộng mới sẽ không làm thay ựổi các tắn hiệu ựã ựược học trước ựó
Hàm xấp xỉ có khả năng tự khái quát hoá tốt Khả năng tự khái quát hoá
là khả năng tạo ra một ựầu ra nhạy cho một ựầu vào không ựược thể hiện trong quá trình huấn luyện nhưng nó tương tự như các huấn luyện mẫu Khi hàm xấp xỉ
có khả năng khái quát hoá tốt, bộ LC cũng sẽ thu ựược một hiệu quả bám cao cho các chuyển ựộng tương tự các chuyển ựộng ựược huấn luyện Vì vậy nó ựủ ựể huấn luyện LC với một lượng nhỏ các ựặc tắnh chuyển ựộng huấn luyện Khi bộ xấp xỉ không có khả năng tự khái quát hoá tốt, bộ LC phải ựược huấn luyện cho mỗi chuyển ựộng quan trọng, nó tạo ra một quá trình huấn luyện mở rộng
Sự mềm mại của giá trị xấp xỉ cần ựiều khiển ựược Như nói ở phần trước ựây, bộ LC không chỉ thu ựược sai số bằng không ựối với một vài tần số, khi tắn hiệu ựiều khiển có tần số cao sẽ không thỏa mãn theo mong muốn Người sử dụng phải có khả năng quyết ựịnh tần số lớn nhất của ựầu ra của hàm xấp xỉ
đáp ứng ngắn hạn là học tốt. đáp ứng ngắn hạn của bộ LC nên là loại ựáp ứng mà có sai số bám dần hội tụ về giá trị mong muốn Việc tăng sai số bám trong pha trung gian của quá trình học có thể làm hỏng ựối tượng, hơn thế nữa, ựây là trường hợp quá trình làm việc tối thiểu có thể không còn ựược bảo ựảm khi bộ ựiều khiển ựược sử dụng như một thiết bị ghép thêm cho một bộ ựiều khiển ựã có sẵn
Sự ổn ựịnh lâu dài cần phải ựược bảo ựảm Việc tự học có thể ựược thực hiện một cách liên tục hoặc ựược thực hiện trước khi vận hành Việc học liên tục ựược yêu cầu khi các thông số của ựối tượng thay ựổi trong suốt quá trình vận hành Vắ dụ, do hao mòn hay chịu ảnh hưởng của môi trường Trong trường hợp này, một bộ ựiều khiển phải có khả năng ựảm bảo việc học ổn ựịnh bất chấp các ựiều kiện vận hành thay ựổi như thế nào
Trang 222.3 Bộ ñiều khiển học sử dụng sai lệch phản hồi (Feedback Error Learning - FEL)
2.3.1 Cấu trúc ñiều khiển
Một bộ LC thú vị cho các cánh tay robot mà phải bám theo các quỹ ñạo ngẫu nhiên Nói chung bộ ñiều khiển này ñược biết ñến với cái tên là bộ ñiều khiển học sai lệch phản hồi: Bộ ñiều khiển (Feedback Error Learning FEL)
Hệ thống LC bao gồm 2 phần:
Bộ ñiều khiển Feef-forward ñược biểu thị bằng F, nghĩa là 1 hàm/ánh xạ
( )r F
u F = Một bộ ñiều khiển Feed - forward thông thường có thể ñược sử dụng ñể
bù thêm cho các hệ thống ñộng học và theo cách này sẽ thu ñược ñộ bám chính xác cao Khi bộ ñiều khiển feed-forward bằng với ñối tượng nghịch ñảo
1
−
= P
F , thì ñầu ra của ñối tượng y sẽ bằng tín hiệu ñặt r
Hình 2.2 Bộ ñiều khiển phản hồi sai lệch (FEL)
ðối tượng P, luôn chịu sự tác ñộng của nhiễu Các loại nhiễu ở bao gồm cả nhiễu ngẫu nhiên và nhiễu có bản chất chu kỳ Những nhiễu chu kỳ tái diễn giống nhau khi một chuyển ñộng cụ thể ñược lặp lại ðiều này có nghĩa rằng chúng có thể ñược xem xét như một hàm trạng thái của ñối tượng x và có thể lường trước
Hàm xấp xỉ
P
d(x)
+ +
u
x
y
Trang 23Hình 2.3 ðối tượng và nhiễu phát sinh
2.3.2 Một ví dụ về ma sát phụ thuộc vị trí:
Giống như ñối tượng ñộng học, các nhiễu tái sinh có thể ñược bù bởi một
bộ ñiều khiển feed-forward
ðể bù chính xác cho hệ thống ñộng học và nhiễu tái sinh, yêu cầu cần phải
có một mô hình chi tiết Sự không chính xác về mô hình có thể làm cho bộ ñiều khiển feed-forward vận hành kém Khi một mô hình chính xác khó có thể xác ñịnh ñược, thì một phương pháp thay thế có thể ñược thực hiện
Thay vì ñi thiết kế một bộ ñiều khiển feed-forward dựa trên những ñặc ñiểm
cơ bản của mô hình thực hiện bộ ñiều khiển feed-forward giống như là một hàm xấp
xỉ, ví dụ như là U F =F(r,ω) Trong suốt quá trình ñiều khiển, quan hệ vào/ra của hàm xấp xỉ ñược tự thích ứng ñể học các ñối tượng nghịch ñảo và ñể bù các nhiễu phát sinh Khó khăn chính ở ñây là lựa chọn tín hiệu học mà chỉ ra ñược mối quan hệ vào/ra của hàm xấp xỉ phải ñược tương thích như thế nào Tín hiệu học có thể thu ñược theo rất nhiều cách Theo lý thuyết ñã chứng minh chỉ ra rằng khi ñầu
ra của bộ ñiều khiển phản hồi ñược sử dụng làm tín hiệu học thì quan hệ vào/ra của hàm xấp xỉ hội tụ tới ñối tượng nghịch ñảo và giá trị bù của nhiễu tái sinh Loại hàm xấp xỉ mà chúng ta sử dụng ở ñây là mạng nơ ron MLP
3 , 3 , 3 , 2 , 2 , 2 , 1 , 1 , 1
r= θd θ&d θ&d θd θ&d θ&d θd θ&d θ&d T∈ (2.1)
Trong trường hợp cánh tay 3 bậc tự do DOF (Degrees Of Freedom), ñầu vào của MLP bao gồm góc khớp ñặt θd và ñạo hàm bậc 1 bậc 2 của chúng:
Trong khi ñầu ra uF ñược xét dưới dạng moment của ñộng cơ
uF = [ ] 3
3 2
1 T R
∈
ττ
Trang 24Bộ ñiều khiển phản phản hồi Như ñã ñược nói tới, bộ ñiều khiển phản hồi trạng thái, ñem lại các tín hiệu học cho bộ ñiều khiển feed-forward Hơn thế, nó xác ñịnh quá trình bám cực tiểu tại thời ñiểm bắt ñầu học Cuối cùng, bộ ñiều khiển phản hồi bù các nhiễu ngẫu nhiên Bộ ñiều khiển FEL ñã ñược thực hiện trong nhiều ứng dụng của nhiều tác giả; ví dụ như là:
Hệ thống phanh tự ñộng ô tô ðiều khiển hệ thống camera ðiều khiển cánh tay robot
Dễ dàng sử dụng trên hệ thống ñiều khiển có sẵn Sự mở rộng duy nhất ñối với hệ thống ñiều khiển có sẵn là hàm xấp xỉ Khi hệ thống ñiều khiển ñược thực
Trang 25hiện bằng phần mềm ựiều này yêu cầu ắt có sự thay ựổi và có thể dễ dàng ựược thực hiện
Sự hợp nhất các kiến thức quan trọng trong thiết kế Khi cấu trúc của ựối tượng ựộng học ựược xác ựịnh, thì mạng MLP trong bộ ựiều khiển feed-forward có thể tách ra thành một vài mạng MLP nhỏ hơn Mỗi một mạng con này sẽ bù cho một phần riêng biệt của ựối tượng ựộng học Những thắ nghiệm ựã chỉ ra rằng mạng này ựã nâng tốc ựộ học lên ựáng kể
Sự ổn ựịnh ựược xác lập điều này ựã ựược chứng minh bằng lý thuyết rằng
bộ ựiều khiển FEL sử dụng cho ựiều khiển cánh tay robot cho kết quả là hội tụ Với các hệ thống khác, sự ổn ựịnh chưa ựược xét ựến trên phương diện lý thuyết
đáp ứng ngắn hạn tốt Trong quá trình học, sai lệch bám sẽ dần hội tụ ựến giá trị cực tiểu của nó Giống như sự ổn ựịnh, ựáp ứng ngắn hạn cũng chưa ựược xét tới trên phương diện lý thuyết
Hàm xấp xỉ phù hợp cho việc ựiều khiển Rất nhiều các giá trị thực của bộ một LC phụ thuộc vào loại hàm xấp xỉ ựược sử dụng Mặc dù thực tế là bộ ựiều khiển FEL cũng ựạt ựược chất lượng bám cao nhưng cách học không phải là tối
ưu cho mạng MLP
Yêu cầu bộ nhớ nhỏ Một trong số những thuộc tắnh tốt của MLP là nó
có thể xấp xỉ các hàm mục tiêu ựa chiều với một số ắt các thông số Do ựó tổng dung lượng bộ nhớ của máy tắnh yêu cầu cho việc thực hiện là rất nhỏ Tốn kém cho việc tắnh toán giá trị Việc tắnh toán ựầu ra của mạng MLP và trọng số của bộ thắch nghi bao gồm một số lượng lớn các tắnh toán phức tạp Do ựó, với một
số ứng dụng ựiều khiển thời gian thực thì loại mạng mạng nơ ron này có thể không phù hợp
Cơ chế học hội tụ chậm và trải qua vùng giá trị cực tiểu cục bộ Cơ chế học
dễ dàng ựạt ựược tại vùng giá trị cực tiểu cục bộ Hàm trọng lượng của mạng kết thúc ở vùng cực tiểu nào phụ thuộc vào hàm trọng lượng ban ựầu của mạng Do ựó
Trang 26nó cần phải thực hiện nhiều thử nghiệm huấn luyện mạng với các cài ñặt hàm trọng lượng ban ñầu khác nhau, ñể thu ñược ñộ bám chính xác có thể chấp nhận ñược
Có khả năng tổng quát hoá tốt Một thuận lợi thực tế là mối quan hệ vào ra chỉ có thể thích ứng toàn bộ ñó là khi MLP có khả năng tổng quát tốt khi quá trình huấn luyện ñược thực hiện một cách tổng thể Khi một hệ thống chuyển ñộng phải vận hành ở tốc ñộ thấp, bộ ñiều khiển FEL có khuynh hướng ñưa ra hiệu suất kém ðiều này là do thực tế mạng MLP gặp khó khăn trong việc học các dữ liệu có tương quan với nhau ở mức cao Khi các dữ liệu có tương quan với nhau ở mức cao, mạng có khuynh hướng chuẩn hoá tín hiệu theo dữ liệu cuối cùng, kết quả là ñưa ra khả năng khái quát hoá kém
Sự trơn tru của các giá trị xấp xỉ là không hoàn toàn ñiều khiển ñược Số lượng các thông số của một bộ MLP quyết ñịnh tính chính xác cực ñại của giá trị xấp xỉ Nó không ñảm bảo ñược ñộ trơn tru nhất ñịnh Nhờ việc học, mạng MLP có thể xấp xỉ rất gần các hàm mục tiêu trong phạm vi ñầu vào và rất chính xác ở phần còn lại
Nhìn vào các thuộc tính ở trên, ta có thể kết luận rằng trong trường hợp mà cách học tốt, bộ ñiều khiển FEL có khả năng ñáp ứng rất tốt Các nghiên cứu khác nhau nhằm mục ñích khắc phục các vấn ñề tồn tại của bộ ñiều khiển FEL Theo ñó
ta sẽ giới thiệu tóm lược 3 phương pháp: 2 phương pháp ñầu thay ñổi cấu trúc của
bộ ñiều khiển học Trong khi ở phương pháp còn lại sử dụng hàm xấp xỉ
Trước tiên, phương pháp thứ nhất có thể cải thiện cách học bằng cách chọn các ñầu vào khác nhau cho hàm xấp xỉ Sai số tín hiệu ñược thêm vào như một ñầu vào của bộ xấp xỉ, ñiều này sẽ làm thay ñổi bộ ñiều khiển LC từ chỗ hoàn toàn là 1
bộ ñiều khiển feed-forward nguyên bản chuyển sang bộ ñiều khiển feed-forward dưới ñây Các thí nghiệm ñã chỉ ra rằng bộ LC này khắc phục ñược một số lỗi của
bộ ñiều khiển FEL gốc
Trang 27Hình 2.4 Học theo sai số phản hồi
Phương thức thứ 2 là sử dụng nhiều bộ ñiều khiển feed-forward, mỗi một
bộ ñược huấn luyện ñể thực hiện một nhiệm vụ cụ thể Mỗi một mạng nơ ron giám sát học xem là bộ feed-forward nào ñược sử dụng cho nhiệm vụ nào Bộ LC này ñã ñược kiểm tra trên tay máy mà phải thực hiện các chuyển ñộng với các ñối tượng có trọng lượng khác nhau Sau khi học, mỗi bộ ñiều khiển feed-forward ñã học sẽ phải ñảm nhiệm cho một ñối tượng xác ñịnh Mạng giám sát ñã học từ bộ ñiều khiển feed-forward nào ñược áp dụng cho ñối tượng ñó
Khi mạng MLP là nguyên nhân chính gây nên các khó khăn của ñiều khiển FEL, một phương pháp rõ ràng ở ñây là phải tìm ra những hàm xấp xỉ khác nhau Mạng MLP ñược thay thế bởi mạng (Cerebellar Model Articulation Controller CMAC) Mạng CMAC phụ thuộc vào các lớp mạng nơ ron mà làm việc với hàm cơ
sở Trong trường hợp mạng CMAC, hàm cơ sở bao gồm các hàm ña thức thông minh mà có giá trị khác không trên phần không gian ñầu vào Ở mỗi ñiểm trong không gian ñầu vào p các hàm cơ sở chồng chéo lên nhau Thông số của p ñược biết ñến như là một thông số khái quát hoá và có thể ñược lựa chọn bởi nhà thiết kế ðầu
ra của CMAC là tổng các trọng số của hàm ước lượng cơ sở Việc học ñược tiến hành bằng cách mô phỏng theo các trọng số của mạng, chứ không phải là theo bản thân các hàm cơ sở Tất cả ñiều này nhằm mục ñích cải thiện những vấn ñề sau:
- ðộ hội tụ nhanh hơn Khi việc học diễn ra một cách cục bộ, chỉ có 1 số nhỏ các hàm trọng ñược thích nghi tạo ra ñộ hội tụ nhanh
y
Trang 28- Có thể học các dữ liệu tương quan Các vùng của hàm cơ sở ñã ñược trộn lẫn, ñiều này có ích cho quá trình học các dữ liệu tương quan
- Không có cực tiểu cục bộ Cơ cấu học không trải qua vùng cực tiểu cục
và ñộ bám chính xác hơn
2.4 Learning Feedforward Control (LFFC)
Trong luận văn này một hệ thống LC ñược xét có cấu trúc tương tự như cấu trúc của bộ ñiều khiển FEL (Hình 2.2) Tuy nhiên, phần feed-forward của bộ ñiều khiển LC ñược thực hiện giống như mạng B-Spline (BSN) thay vì mạng MLP Loại ñiều khiển FEL ñược gọi là LFFC Phương pháp BSN cũng tương tự như phương pháp CMAC Giống như mạng CMAC, mạng BSN sử dụng các hàm cơ bản còn gọi
là B-Spline ñể xấp xỉ hoá
2.4.1 Mạng B - Spline
Một mạng B – spline sử dụng các hàm cơ bản ñược biết như các B – Spline
cho các xấp xỉ Một B – Spline n chiều bao gồm từng ñoạn ña thức bậc n− 1 Chiều cao của B – Spline ký hiệu là µ và có giá trị nằm trong ñoạn [ ]0,1 Hình sau cho thấy một số dạng cơ bản của B – Spline
Trang 29Hình 2.5 B – Spline cơ bản
a): B – Spline bậc 1 b): B – Spline bậc 2 c): B – Spline bậc 3
Hình dạng của các loại B – Spline cho như trên Trong bất kỳ thời ñiểm nào, tổng các thành viên của B – Spline bằng 1 Vị trí của B – Spline ñược gọi là véc tơ Knot và xác ñịnh bởi:
i n
i n i i
n i n
i
1 1
1 1 1
− +
λµ
λλ
Trong nghiên cứu này tác giả chỉ ñề cập tới B – Spline 2 chiều.Vị trí B –
Spline thứ i ký hiệu làµi( )x Một B – Spline có vị trí lớn hơn 0 ñược nén bởi một không gian ñầu vào Phần không gian ñầu vào ñó gọi là “khung” của B –Spline B – spline ña chiều ñược xây dựng từ các tensor một chiều (như trong Hình 2.5)
Trang 30Hình 2.6:a) B – Spline 2 chiều; b) Dạng lưới của B - Spline
2.4.2 Mạng nơ ron nhân tạo nhiều lớp
1) Nơ ron
Phần tử cơ bản của mạng nơ ron nhiều lớp là một tế bào thần kinh nhân tạo Một tế bào thần kinh nhân tạo gọi là một nơ ron là ñơn vị thực hiện một hoạt ñộng toán học ñơn giản theo ñầu vào của nó Hình 2.7 chỉ ra cấu trúc của một nơ ron nhân tạo
Trang 31Hình 2.7 Nơ ron nhân tạo
ðầu vào xcủa nơ ron bao gồm cac biến x1, K ,x Nñược gọi là các ñầu vào cơ bản và lệch nhau 1 ñơn vị
2 1
x f
Có nhiều hàm f( ). ñã ñược sử dụng, những hàm hay dùng là hàm Sigmoid như sau:
e u
+
= 1
Trang 32n Nơ ron trong lớp thứ 1 chỉ là vượt qua nốt ñầu vào của mạng sẽ tới tất cả các
nơ ron trong lớp thứ 2
n
Lớp 1 Lớp 2 Lớp 3
Trang 33Nơ ron trong lớp thứ 2 gọi là lớp ẩn, hàm thực hiện trong lớp này f( ). là hàm Sigmoid cơ bản, ñường hyperbolic ñược cho bởi phương trình:
0 1
1 1 2
m N
n
nm nm
ω là trọng số liên kết giữa nơ ron thứ n trong lớp ñầu tiên và
nơ ron thứ m trong lớp thứ 2 cuối cùng nơ ron trong lớp thứ 3 thực hiện một thuật
toán g( ). thường là loại tuyến tính như sau:
2 0 1
2 2
k M
m
mk mk
ω là trọng số liên kết giữa nơ ron j trong lớp thứ 2 với nơ ron k
trong lớp thứ 3 Tổng hợp (2.10), (2.11), (2.12) kết quả cho ñầu ra của MLP có dạng (g( ). là tuyến tính):
2 0
1 0 1
1 1 1
2
k m N
n
nm nm M
m mk
2.5 Learning Feed – Forward trên cơ sở mạng nơ ron
2.5.1 Lựa chọn các thông số BSNs
ðối với các hệ thống chuyển ñộng, các ñầu vào của BSN bao gồm các vị trí ñặt, r, và các ñạo hàm của nó
2.5.1.1 Sự phân bố B-Spline trên ñầu vào của mạng BSN
ðầu ra của BSN là tổng trọng số ước lượng của các B- spline Do ñó, số lượng của các B-Spline và các vị trí của chúng quyết ñịnh tính chính xác của giá trị
Trang 34xấp xỉ Các tín hiệu ñích có dạng trơn có thể ñược xấp xỉ một cách chính xác với một số lượng thấp các B-Spline “rộng” Các tín hiệu có ñộ dao ñộng lớn yêu cầu một số lượng lớn các B-Spline “hẹp”
Hình 2.10 Ánh xạ BSN
Một khả năng riêng biệt của việc phân bố các B-Spline có thể ñược tạo ra trên cơ sở kiến thức của ñối tượng nghịch ñảo và của các nhiễu, hoặc nhờ một tiến trình lặp ñi lặp lại sử dụng các dữ liệu thực nghiệm
2.5.1.2 Sự lựa chọn các cơ cấu học
Tự học ví dụ như là sự thích nghi của các trọng số mạng có thể ñược tiến hành sau mỗi một mẫu - ñược biết tới gọi là học online learning hoặc sau mỗi chuyển ñộng ñã ñược thực hiện xong - ñược gọi là off-line learning
Luật online learning như sau: ∆ωi =γµi(r)e(r) (2.14)
Và luật offline learning như sau:
N i j i
N i
j j i i
r
r e r
1
1
) (
) ( ) (
Trang 35Bằng việc sử dụng BSN, ta ñã có các ưu ñiểm sau:
Không có cực tiểu cục bộ. ðầu ra của BSN là một hàm trọng số tuyến tính ðiều này có nghĩa là các kỹ thuật học ñược ñưa ra trong các công thức trên không trải qua vùng cực tiểu cục bộ ðiều này nhấn mạnh rằng các trọng số ñầu của BSN không ảnh hưởng ñến ñộ chính xác của việc tự hiệu chỉnh cuối cùng
Học cục bộ. Khi B-Spline có một nền tảng chắc chắn, ánh xạ vào/ra của BSN có thể thích nghi một cách cục bộ Việc huấn luyện một chuyển ñộng mới không nhất thiết phải ảnh hưởng tới khả năng hiệu chỉnh các chuyển ñộng ñã học trước ñó Hơn thế nữa, do nền tảng chắc chắn của B-Spline chỉ có một số lượng nhỏ các trọng số góp phần cho ñầu ra, trong quá trình huấn luyện, chỉ có các trọng số cần cần ñược ñáp ứng ðiều này trái ngược với MLP nơi mà tất cả các trọng số của mạng bị thay ñổi trong suốt quá trình học Do ñó, BSN hội tụ nhanh hơn nhiều so với MLP
Sự chính xác trong ñiều chỉnh. ðộ trơn của quan hệ vào/ra là xác ñịnh ñược bằng cách chọn phân bố B-spline Việc chọn B-spline mà có nền tảng vững chắc hơn, làm cho BSN có ñược giá trị xấp xỉ dữ liệu ở miền cao tần chính xác hơn
Trang 36Khi do sự giới hạn của cơ cấu chấp hành, ví dụ, với một giá trị xấp xỉ trơn hơn của
dữ liệu ñược yêu cầu ở một phần xác ñịnh của không gian ñầu vào, B-spline nên ñược sử dụng ñể có một nền tảng rộng hơn hoặc thức bậc cao hơn Trong trường hợp của MLP, người dùng không thể xác ñịnh ñược ñộ trơn của các phần khác nhau trong không gian ñầu vào, thay vào ñó MLP xác ñịnh rõ vị trí nguồn của nó
Cho tới nay mạng CMAC cũng ñã nắm bắt ñược những thuận lợi ñã ñược liệt kê ở trên của mạng BSN Chúng ta chọn BSN bởi vì nó ñơn giản Trong mạng CMAC các hàm phân bố cơ bản là các hàm mà ở mỗi giá trị ñầu vào hàm cơ sở chính xác P có một ñịnh lượng lớn hơn 0 Một số hàm phân bố thoả mãn ñiều này
và mỗi hàm như vậy dẫn ñến một giá trị xấp xỉ khác nhau Người sử dụng phải chọn hàm phân bố nào là có khả năng xấp xỉ tốt nhất Hơn thế, việc chọn lọc một giá trị xấp xỉ bằng cách thêm một số ràng buộc (thêm một hàm cơ sở), kết quả sẽ có ñược hàm phân bố cơ sở khác ðiều này có thể là không ñược như mong muốn cho lắm
Sự phân bố của các hàm cơ bản trong BSN là không phức tạp lắm
Hạn chế chính của các BSN (và của các NN với các hàm cơ bản) ñó là số lượng các trọng số mạng tăng theo hàm mũ với kích thước của không gian ñầu vào
Số lượng các trọng số trong một BSN - N chiều ñược cho bởi:
- Số lượng trọng số lớn Nếu các ñối tượng ñộng học có thành phần phi tuyến ở mức ñộ cao, một hàm phi tuyến ở mức ñộ cao có thể bị ánh xạ bởi mạng B-Spline Một mạng mà có khả năng ánh xạ những phi tuyến này một cách chính xác
sẽ chiếm một phần lớn dung lượng lớn của bộ nhớ máy tính Trong thực tế, các
Trang 37nguồn bộ nhớ là có giới hạn, do ñó mạng phức hợp và ánh xạ chính xác của nó phải ñược cân bằng với nhau
- Các bộ huấn luyện rộng Khi thực thi một sự chuyển ñộng ñịnh trước, chỉ
có các trọng số mạng ñược lập bởi các ñầu vào của mạng là ñược cập nhật ðể thích ứng một số lượng lớn các trọng số mạng, yêu cầu cần phải có một số lượng lớn các huấn luyện chuyển ñộng ðiều này sẽ dẫn tới nhiều lần huấn luyện nếu mạng ñược huấn luyện online trực tuyến ví dụ trong suốt quá trình ñiều khiển
- Khả năng khái quát kém Việc bù của bộ phi tuyến có thể yêu cầu các Spline hẹp ñể thoả mãn các yêu cầu về ñộ chính xác Tuy nhiên, với các B-Spline hẹp, các tín hiệu ñầu ra của mạng rất khác nhau có thể xảy ra với các ñường cong quỹ ñạo mà “gần với nhau” Vì lý do ñó, mà các bộ huấn luyện rộng ñược ñề cập ở trên ñáp ứng ñược tất cả những gì cần thiết mà phải ñưa ra trước khi ñề cập tới hiệu quả lợi ích thu ñược
B Có thể thấy rằng sai lệch về kích thước có thể gây hại nghiêm trọng tới giá trị giao dịch của LFFC Do ñó, nên cố gắng ñể vượt qua sự sai lệch về kích thước
2.6 Luyện mạng
2.6.1 Luyện mạng BSN
Luyện mạng bằng thích nghi không dựa trên hàm cơ sở ðiều này có thể thực hiện sau mỗi khoảng thời gian lấy mẫu – luyện mạng online; hoặc sau khi chuyển ñộng hoàn thành – luyện mạng offline Trong luyện mạng online, hàm trị J
có thể cực tiểu hóa bằng xấp xỉ bình phương của sai lệch
2
1
y y
Trang 38Thế (2.17) vào (2.18) ta có:
( ) (y y) ( )x
x y
y
i d
i j N
j j d
i
k
µγ
ω
ωµγ
j j d
n i j j d i
x
x y y
µ
µγ
Luật học offline:
Trang 391 Tại thời ñiểm tín hiệu vào x j và tín hiệu học y d,j −y jñưa vào BSN (j=1,2, ); Khi B –Spline thứ i cho tín hiệu vào x j µ( )x j > 0, tính toán trọng số thích nghi ωi theo (2.22)
2 Tại thời ñiểm µ( )x j = 0, ωiñã thích nghi, ωi =ωi+ ∆ωi
Xét một ví dụ như hình 2.11 sau:
Hình 2.11 Cơ chế học offline
Trong hình 2.11, x1 5 là các thành viên của B – Spline 1 và 2 không tiến tới 0; tại thời ñiểm x6, B – Spline tiến tới 0 có nghĩa là nó không còn có lợi hơn nữa cho ñầu ra Vì vậy lựa chọn ñể update trọng số của B –Spline 1
2.6.2 Luyện mạng nơ ron
Luyện mạng MLP ñược thực hiện bằng cách thích nghi trọng số giữa các nốt mạng theo cơ chế lan truyền ngược Trọng số thích nghi trong hàm trị, J là nhỏ nhất Một cách lựa chọn J phổ biến là tổng bình phương các sai lệch của các dữ liệu ñã qua
j k
d j
y
Trang 40Trong ñó, d
j k
y, là ñầu ra mong muốn của nơ ron cho ñầu vào x j và y k,j là ñầu ra thực tế của MLP ðối với sự thích nghi trọng số nhỏ có thể giả ñịnh rằng:
j k
d j k
j
K k
j k
d j k
y y
y y J
1
, ,
1
2 , ,
2 1
γ
ωγ
ωγω
γω
ωω
J J
J J
1 1
1 , ,
2
2 0 1
1 0 1
1 1 2
1
, , 2
ab a N
n n na
j
K k
j k
d j b
ab
k M
m
m N
n
nm nm mk
j
K k
j k
d j k ab
x f
y y
x f
y y
ω
ωω
γ
ω
ωω
ωω
γω