Trong sự phát triển không ngừng của khoa học và công nghệ làm xuất hiện các đối tượng điều khiển có độ phức tạp ngày càng gia tăng, lý thuyết điều khiển thông minh là phương pháp điều khiển phỏng theo các đặc điểm cơ bản trí thông minh của con người, bao gồm khả năng học, khả năng xử lý thông tin không chắc chắn và khả năng tìm lời giải tối ưu, có vai trò hết sức quan trọng để giải quyết nhiều vấn đề như nâng cao chất lượng điều khiển, độ ổn định của hệ thống, tiết kiệm năng lượng hay như sử dụng máy móc thay thế con người trong các ứng dụng điều khiển phức tạp hoặc nguy hại. Hàng loạt các công trình nghiên cứu về điều khiển bền vững, điều khiển thích nghi, điều khiển tối ưu hay điều khiển mờ và mạng nơron được công bố trong những năm gần đây cho thấy sự quan tâm lớn của các nhà khoa học trên khắp thế giới và những vấn đề, các hướng nghiên cứu phát triển trong lĩnh vực này.
Trang 1CHƯƠNG 1: TỔNG QUAN
1.1 Khái quát vấn đề và các công trình liên quan
Trong sự phát triển không ngừng của khoa học và công nghệ làm xuất hiện các đối tượng điều khiển có độ phức tạp ngày càng gia tăng, lý thuyết điều khiển thông minh là phương pháp điều khiển phỏng theo các đặc điểm cơ bản trí thông minh của con người, bao gồm khả năng học, khả năng xử lý thông tin không chắc chắn và khả năng tìm lời giải tối ưu, có vai trò hết sức quan trọng để giải quyết nhiều vấn đề như nâng cao chất lượng điều khiển, độ
ổn định của hệ thống, tiết kiệm năng lượng hay như sử dụng máy móc thay thế con người trong các ứng dụng điều khiển phức tạp hoặc nguy hại Hàng loạt các công trình nghiên cứu về điều khiển bền vững, điều khiển thích nghi, điều khiển tối ưu hay điều khiển mờ và mạng nơron được công bố trong những năm gần đây cho thấy sự quan tâm lớn của các nhà khoa học trên khắp thế giới và những vấn đề, các hướng nghiên cứu phát triển trong lĩnh vực này
Alavandar và Nigam [11] phát triển Nơron-Mờ được dựa trên cách tiếp cận đối với giải pháp động học ngược của cánh tay robot công nghiệp, bằng cánh sử dụng khả năng của ANFIS ( hệ thống suy diễn nơron mờ thích nghi)
để học từ dữ liệu huấn luyện nhằm tạo ra mạng ANFIS, thực hiện một biểu diễn hệ thống suy luận mờ điển hình bằng cách sử dụng cấu trúc giống mạng thần kinh BP Guez và Ahmad [13] phát triển giải pháp cho vấn đề động học ngược bằng cách sử dụng mạng nơron trong robot, mạng nơron có thể được huấn luyện để cho ra một giải pháp khá chính xác sẽ đưa đến tải trọng tối thiểu trong xử lý tải của mỗi chu kỳ điều khiển và do đó cho phép điều khiển thời gian thực robot bằng thuật toán lan truyền ngược
Karlik và Aydinb [14] phát triển cách tiếp cận cải tiến giải pháp của động học ngược đối với cánh tay robot 6 bậc Một phương pháp tiếp cận cấu
Trang 2trúc mạng nơron nhân tạo (ANN) được đề xuất ở đây để điều khiển các chuyển động của cánh tay robot Mô hình mạng nơron sử dụng các đơn vị ngưỡng với hàm chuyển sigmoid và luật học theo kiểu suy giảm độ dốc.
Ngoài ra sử dụng các phương pháp khác nhau như phương pháp số và các phương pháp thông minh để giải quyết động học thuận và động học ngược của cánh tay robot công nghiệp được nghiên cứu trong [16] Trong thập niên trước đây một số mô hình mạng nơron thích nghi và học kết hợp đã được áp dụng cho học offline và online của động lực học cánh tay robot [11] Ahn và Anh [4] đã thành công trong việc tối ưu hóa một mô hình nơron thích nghi NARX của động học ngược dựa trên cánh tay robot PAM bằng cách sử dụng thuật toán di truyền Các tác giả trong [7] đã nhận dạng động học ngược của cánh tay robot công nghiệp dựa trên mạng nơron thích nghi Như chúng ta
đã biết, các hệ thống thực là các mô hình phi tuyến hết sức phức tạp nên các phương pháp thiết kế kinh điển dựa trên điều khiển tuyến tính trong nhiều trường hợp không đảm bảo được yêu cầu do đặc tính phi tuyến của động học đối tượng điều khiển, đặc tuyến đầu đo hoặc cơ cấu chấp hành cũng như tính chất không đầy đủ, chính xác của các mô hình thay thế (chưa biết đặc tính động học, nhiễu, điều kiện ban đầu)
Sự phát triển không ngừng của khoa học công nghệ làm xuất hiện các đối tượng điều khiển có độ phức tạp ngày càng tăng Yêu cầu thực tiễn đặt ra là phải điều khiển các hệ thống động ngày càng phức tạp, trong điều kiện các yếu tố bất định ngày càng gia tăng với yêu cầu chất lựợng điều khiển ngày càng cao Các yêu cầu trên không thể được đáp ứng một cách trọn vẹn, đồng thời nếu chỉ dùng các lí thuyết điều khiển thông thường sẵn có Đây chính là động lực cho sự ra đời của hàng loạt các lí thuyết điều khiển thông minh hứa hẹn một hướng giải quyết triệt để các bài toán điều khiển phi tuyến phức tạp Nhiều sơ đồ điều khiển dùng mạng nơ ron MLP với thuật toán Lan Truyền
Trang 3Ngược (Back Propagation - BP) được ứng dụng để giải các bài toán điều khiển các hệ phi tuyến phức tạp và bất ổn định Tính thích nghi cho phép mô hình mạng nơ-ron sau khi được huấn luyện vẫn thực hiện tốt chức năng của
nó dù nhiễu động môi trường và thông số đối tượng điều khiển thay đổi theo thời gian Đó là nhờ mô hình mạng nơ ron có khả năng tự cập nhật các trọng
số của mình
Mạng nơ-rơn nhân tạo là một mô hình toán học đơn giản của bộ não con người Các nghiên cứu về mạng nơ-rơn nhân tạo được bắt đầu từ thập niên 1940 Năm 1944, McCulloh và Pitts là những người đầu tiên đã xuất bản một công trình nghiên cứu có tính hệ thống về mạng nơ-rơn nhận tạo Tuy nhiên nghiên cứu về mạng nơ ron chỉ phát triển mạnh từ sau những năm 1980 Mối quan tâm về mạng nơ-rơn nhân tạo bắt nguồn từ khả năng của mạng trong việc mô phỏng, bắt chước khả năng học và phản ứng của bộ no con người Kết quả là mạng nơ-rơn nhân tạo đã được ứng dụng trong rất nhiều các lĩnh vực khác nhau như nhận dạng, phân loại, xử lý ảnh, dự báo Các hệ thống điều khiển đã chứng tỏ được tính hiệu quả của chúng trong lĩnh vực này Đến nay đã có rất nhiều cấu hình mạng và các thuật tóan huấn luyện tương ứng được công bố để giải quyết các bài tóan khác nhau
Đã có nhiều công trình nghiên cứu mạng nơ-rơn trong nhận dạng, điều khiển hệ phi tuyến và đã chứng tỏ được những ưu điểm vượt trội
Vì lẽ đó trên cơ sở tham khảo bài báo [7] sử dụng mạng nơron thích nghi (Adaptive neural) để huấn luyện và lập trình của tay máy Tác giả đã mạnh dạn sử dụng mô hình mạng nơron thích nghi (Adaptive neural network model) thông qua mô hình nơ ron thích nghi NARX để huấn luyện, lập trình,
mô phỏng cho hệ tay máy Các giả định được điều khiển từ GUI ghi lại tất cả
các chuyển động của cánh tay máy Các dữ liệu ghi lại được sử dụng như tập
dữ liệu dùng để huấn luyện
Trang 4Luận văn này đầu tiên phác thảo cơ sở lý thuyết và ứng dụng mô hình nơron NARX dùng để nhận dạng cho hệ tay máy đa bậc
Xuất phát từ những lý do nêu trên, học viên quyết định chọn đề tài: “mô hình hóa, nhận dạng hệ tay máy phi tuyến dùng mô hình mạng nơron thích nghi” với mục đích sử dụng những ưu điểm của mạng nơ-ron thích nghi, từ
đó đề xuất một thuật toán khả thi để nhận dạng hệ tay máy đa bậc phi tuyến
Cụ thể là: ứng dụng một số giải thuật để giải bài toán nhận dạng động học hệ tay máy Khẳng định ưu thế vượt trội của phương pháp được ứng dụng trong nhận dạng đối với mô hình này qua đánh giá kết quả mô phỏng sử dụng thuật
toán mô hình nơron thích nghi NARX
1.2 Giới thiệu luận văn
1.2.1 Phát biểu bài toán
Một trong các vấn đề cơ bản trong lý thuyết điều khiển là nghiên cứu
để sử dụng phản hồi nhằm làm thay đổi động học của đối tượng sao cho đạt được đặc tính theo mong muốn Trong luận văn, các nghiên cứu tập trung vào phương pháp ứng dụng mô hình nơ ron thích nghi NARX để nhận dạng cho
hệ tay máy 3 bậc với mục tiêu là sử dụng mô hình nơron thích nghi NARX để huấn luyện mô hình động học thuận, ngược của tay máy ba bậc
1.1.2 Nhiệm vụ của luận văn
1 Thành lập mô hình động học thuận và ngược kinh điển của tay máy theo quy tắc D_H ( Denavit_Hartenberg)
2 Nghiên cứu giải thuật giải bài toán động học thuận, ngược cho hệ tay máy
ba bậc với mô hình phi tuyến theo các phương pháp sau:
- Phương pháp huấn luyện mạng nơron thích nghi NARX
Trang 5- Phương pháp dùng giải thuật học của mạng nơ ron truyền thẳng 3 lớp
3 Dùng ngôn ngữ lập trình của phần mềm Matlab 7.0 để mô phỏng và nhận dạng mô hình động nơron thích nghi NARX cho hệ tay máy ba bậc
1.2.3 Bố cục của luận văn
Với nhiệm vụ thực hiện luận văn ở trên, bố cục của luận văn gồm 5 chương:
Chương 1: Tổng quan
Giới thiệu khái quát một số công trình đã được công bố có liên quan đến điều khiển thông minh sử dụng mạng nơ-ron thích nghi, ý nghĩa ứng dụng của mô hình này trong thực tế, mục đích nghiên cứu, nhiệm vụ thực hiện và nội dung
sơ lược của luận văn
Chương 2: Cơ sở lý thuyết
Lý thuyết điều khiển mạng nơ-ron, thích nghi, giải pháp điều khiển sử dụng
mô hình nơron thích nghi NARX cho hệ phi tuyến và thuật toán lan truyền ngược huấn luyện mạng nơ-ron truyền thẳng 3 lớp
Chương 3: Xây dựng mô hình động học thuận và ngược kinh điển theo quy
Trang 6- Giải thuật nhận dạng sử dụng mô hình nơron thuận thích nghi NARX dùng thuật toán Lan Truyền Ngược (Back Propagation - BP) để cập nhật trọng số kết nối của mạng
- Giải thuật nhận dạng sử dụng mô hình nơron ngược thích nghi NARX dùng thuật toán Lan Truyền Ngược (Back Propagation - BP) để cập nhật trọng số kết nối của mạng
Chương 5: Kết quả mô phỏng bằng Matlab Simulink
Chương 6: Kết luận và hướng phát triển của đề tài
Phân tích, đánh giá các kết quả đã thực hiện, khẳng định tính ưu việt của phương pháp được lựa chọn cho mô hình này Rút ra những vấn đề chưa thực hiện được trong luận văn và đề xuất hướng phát triển của đề tài
Trang 7CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
2.1 Mạng nơ-rôn nhân tạo
Mạng nơ-rôn nhân tạo là mô hình toán học đơn giản của bộ não con người Các nghiên cứu về mạng nơ ron nhân tạo đã bắt đầu từ thập niên 1940 McCulloch
và Pitts là những người đầu tiên đã xuất bản một công trình nghiên cứu có tính hệ thống về mạng nơ-rôn nhận tạo Tuy nhiên nghiên cứu về mạng nơ-rôn chỉ phát triển mạnh từ sau những năm 1980 Mối quan tâm về mạng nơ-rôn nhân tạo bắt nguồn từ khả năng của mạng trong việc mô phỏng, bắt chước khả năng học và phản ứng của bộ não con người Kết quả là mạng nơ ron nhân tạo đã được ứng dụng trong rất nhiều các lĩnh vực khác nhau như nhận dạng, phân loại, xử lý ảnh, các hệ thống điều khiển, dự báo… và cũng đã chứng tỏ được tính hiệu quả của chúng trong lĩnh vực này Đến nay đã có rất nhiều cấu hình mạng và các thuật toán huấn luyện tương ứng được công bố để giải quyết các bài toán khác nhau
2.1.1 Khái quát về mạng nơ-rôn nhân tạo
Nơ-rôn nhân tạo là một thành phần cơ bản và quan trọng nhất của một mạng nơ-rôn nhân tạo Năm 1943 McCulloch và Pitts đã đề xuất mô hình nơ ron nhân tạo đầu tiên được mô tả như hình 2.1
w i1
Hình 2.1 Cấu trúc một nơ ron nhân tạo
2
i w
in w
i
Ngõ
ra Đơn vị xử
lý
Ngõ Nút vào
Trang 8Trong đó là ngõ vào từ môi trường ngoài hay ngõ ra của đơn vị xử lý khác, y là ngõ ra của nơ-rôn Các giá trị là các trọng số kết nối với các nơ-rôn khác để xác định cường độ của vector ngõ vào Do đó giá trị ngõ vào hàm kích hoạt là XTW Tuỳ thuộc vào hàm kích hoạt, nếu trọng số là dương XTW sẽ kích thích nơ-rôn ở ngõ ra và ngược lại Đơn vị xử lý tính tổng trọng số của các ngõ vào và tạo lại tín hiệu ra yi = 1 hoặc yi = 0 nếu giá trị tổng của nó ở trên hoặc dưới mức ngưỡng
n
x x x
X = 1, 2, , ]
in i
) (
) 1
y + = − θ (2.1)
Trong đó, hàm tác động a(f) là một hàm bậc thang đơn vị
2.1.2 Các thành phần cơ bản của mạng nơ-rôn nhân tạo
Có 3 thành phần cơ bản của các mạng nơ-rôn nhân tạo: đó là đơn vị
xử lý, mô hình kết nối và luật học
2.1.2.1 Đơn vị xử lý
Một mạng nơ-rôn có nhiều lớp: lớp vào, lớp ẩn và lớp ra Lớp vào phục
vụ như nơi chứa tín hiệu vào, các lớp ẩn chứa các nơ-rôn được xem như các đơn vị xử lý, lớp ra chứa các nơ-rôn để ra quyết định
Kết hợp với mỗi đơn vị xử lý có hàm tổng hợp và hàm kích hoạt, hàm tổng hợp có chức năng tổng hợp tất cả tín hiệu vào và hàm kích hoạt có chức năng tạo tín hiệu ra
a Hàm tổng hợp
Hàm tổng hợp có thể là dạng tuyến tính hoặc phi tuyến
+ Hàm tổng hợp dạng tuyến tính
Trang 9i j m
j ij i
=1
(2.2) + Hàm tổng hợp dạng phi tuyến
i j m
j ij i
=
2 1
(2.3)
b Hàm kích hoạt
Có nhiều kiểu hàm kích hoạt khác nhau nhưng trong luận văn chỉ trình
bày một số hàm kích hoạt phổ biến Các kiểu hàm kích hoạt khác cũng có thể
sử dụng tuỳ thuộc vào bài toán mà mạng nơ-rôn đang giải quyết
0 1
) (
f
f f
a
neáu neáu
0 1
) (
f
f f
a
neáu neáu
1
|
| 0
1 1
) (
f
f f
f f
a
neáu neáu neáu
(2.6) + Hàm Sigmoid: (H.2.2.d) f
e f
+
= 1
1 )
( (2.7)
Trong đó, λ là hệ số hình dạng của hàm Sigmoid, bằng cách thay đổi
hệ số này có thể thay đổi dạng của các hàm Sigmoid minh chứng như hình vẽ
+ Hàm hyperpolic (Tang-hyperbol): (H.2.2.e) f f f f
e e
e e f
λ λ
(2.8) Trong đó, λ là hệ số hình dạng của hàm hyperpolic đặc trưng như hình (e)
Trang 10Khi sử dụng các phương trình (2.7) và (2.8) có một điều cần lưu ý là đạo hàm của 2 phương trình này có thể biểu diễn bằng các hàm của chính nó Đây là một ưu điểm rất quan trọng để phát triển các thuật toán học cho mạng nơ-rôn có sử dụng một trong 2 phương trình trên
1 a(f)
f
-1
1 -1
0
1 a(f)
f -1
0 f
1 a(f)
f
Trang 112.1.2.2 Luật học
Một thành phần quan trọng của mạng nơ ron đó là luật học, có hai loại
đó là học thông số và học cấu trúc Học thông số là cập nhật các trọng số kết nối trong mạng và học cấu trúc là tập trung vào việc thay đổi cấu trúc, bao gồm số đơn vị xử lý và loại kết nối Hai thuật toán học này có thể thực hiện
đồng thời hoặc tách rời Hiện nay bài toán học on-line đồng thời cả thông số
và cấu trúc của mạng đã, đang được nghiên cứu và đưa vào ứng dụng trong nhiều lĩnh vực khác nhau
2.1.2.3 Mô hình kết nối
Mô hình kết nối của mạng nơ ron hay còn gọi là cấu trúc mạng Có hai
mô hình kết nối trong các mạng nơ ron đó là mô hình kết nối truyền thẳng (mạng truyền thẳng) và mô hình kết nối lan truyền ngược (mạng hồi quy)
Tùy thuộc vào số lớp của mạng mà ta có mạng truyền thẳng một lớp hay nhiều lớp, cấu trúc của mạng phải phù hợp với từng bài toán cụ thể
Ví dụ 2.1: Để giải bài toán XOR nếu dùng mạng truyền thẳng một lớp
không giải quyết được mà phải dùng mạng truyền thẳng 3 lớp Cấu trúc mạng như hình 2.3 Với ngõ vào 00, tổng có trọng số của nơ-rôn A1 và nơ-rôn A2 là
0 dẫn đến ngõ ra là 0, lúc này tổng có trọng số của nơ-rôn B là 0 < 0.5 vì thế ngõ ra của mạng y = 0 Với ngõ vào 01, tổng có trọng số nơ-rôn A1 là 1 > 0.5 dẫn đến ngõ ra là 1, tổng có trọng số nơ ron A2 là 1 < 1.5 dẫn đến ngõ ra là 0 Tổng có trọng số nơ-rôn B là 1 > 0.5 vì thế ngõ ra của mạng y = 1 Tương tự như vậy cho trường hợp 10 Đối với ngõ vào 11, tổng có trọng số của nơ-rôn
A1 và A2 đều là 2 >1.5 dẫn đến ngõ ra 2 nơ ron này đều là 1 Tổng có trọng số của nơ-rôn B là 0 < 0.5 dẫn đến ngõ ra y = 0 Như vậy bài toán XOR đã được giải quyết đúng đắn
Trang 12Hình 2.3 Giải bài toán XOR dùng mạng truyền thẳng 3 lớp
Sự khác nhau cơ bản giữa mạng hồi quy và mạng truyền thẳng là thông tin có thể lan truyền theo 2 hướng trong mạng hồi quy Có 2 loại mạng hồi quy là hồi quy bán phần và hồi quy toàn phần
Thuật toán huấn luyện cho mạng nơ-ron một lớp có đặc điểm:
+ Giá trị ban đầu của trọng số và ngưỡng là những giá trị ngẫu nhiên
+ Tính toán theo từng mẫu ngõ vào và ngõ ra mong muốn
+ Ngõ ra của mạng được tính theo phương trình: y= f X W( T )
Trang 13+ Luật cập nhật trọng số được thực hiện theo biểu thức
w t ij( + = 1) w t ij( ) + η [ ( )d t i −y t x t) i( )] ( (2.9)
Trong đó η là tốc độ học; d t i( ) là ngõ ra mong muốn thứ i
Có nhiều thuật toán huấn luyện cho mạng nơ ron một lớp như thuật toán Perceptron, thuật toán Widrow-Hoff Nhưng thuật toán Widrow-Hoff hay được sử dụng hơn, thuật toán này tính toán sai lệch giữa ngõ ra mong muốn
với ngõ ra thực sự của mạng Δ = d(t) − y(t) với d(t) là ngõ ra mong muốn của
mạng và y(t) là ngõ ra của mạng Sau đó luật cập nhật trọng số của mạng được tính theo (2.9)
2.1.3.2 Perceptron nhiều lớp (mạng MLP)
1
z
Đã có nhiều công trình trình bày nhiều thuật học cho mạng MLP và chỉ
rõ sức mạnh của những lớp mô hình này Cần nhắc tới là thuật toán lan truyền ngược (the Back-Propagation Learning Algorithm) và khả năng xấp xỉ hàm liên tục bằng mạng MLP
9
v
Hình 2.5 Mạng nơron nhiều lớp ( mạng MLP)
Trang 14Thuật toán lan truyền ngược cụ thể như sau: Tập dữ liệu đã cho có N mẫu (xn, dn), n = 1,2, … , N Với mỗi n, xn là tín hiệu đầu vào, dn là đầu ra mong muốn Quá trình huấn luyện thực chất là làm cực tiểu hàm G với
G = , với Gn =
1
N n n
Mạng truyền thẳng nhiều lớp được sử dụng để biểu diễn chính xác và biểu diễn xấp xỉ các hàm phi tuyến Một công cụ cơ bản là sử dụng định lý kolmogorov như sau:
Gọi In là khối n chiều của đoạn [0,1], In =[0 Bất kỳ hàm liên tục f(x1, x2…., xn) nào của n biến x1, x2…., xn trên In đều có thể biểu diễn dưới dạng
2.1.3.3 Mạng nơron với hàm cơ sở xuyên tâm (Mạng RBF)
Hàm cơ sở xuyên tâm đã có từ lâu trong lý thuyết xấp xỉ và được sử dụng để xấp xỉ hàm chưa biết dựa trên cơ sở các cặp điểm vào- ra biểu diễn hàm chưa biết đó
Trong nhận dạng mô hình hệ thống RBF có thể biểu diễn theo cấu trúc mạng perceptron Mọi hệ phi tuyến có thể xấp xỉ bằng RBF Đây là đặc điểm làm cho RBF đặc biệt phù hợp với bài toán nhận dạng mô hình
Trang 15Đối với mỗi hàm, việc xấp xỉ được lưu giữ trong các trọng số và tâm của RBF Tuy nhiên các trọng số này không phải là duy nhất RBF có biểu diễn toán học như sau:
C – véc tơ chứa trọng số RBF
R – véc tơ chứa các tâm RBF
ϕ - hàm cơ sở hoặc hàm kích hoạt của mạng
F(x) - hàm nhận được từ đầu ra của mạng
C0 hệ số chệch (có thể là 0)
|| || - chuẩn euclidean
Mỗi tâm R j có cùng số chiều với véc tơ đầu vào Các tâm cũng là các điểm bên trong không gian giữ liệu đầu vào và được chọn sao cho chúng là thể hiện của dữ liệu đầu vào Khi RBF tính toán quá trình xấp xỉ đối với một
số điểm dữ liệu đầu vào thì khoảng cách giữa các điểm đầu vào và mỗi tâm được tính theo khoảng cách euclidean Những khoảng cách này được chuyển qua ϕ sau đó được trọng số hóa bằng Ci và được tổng hợp lại để sinh ra toàn
bộ RBF Một trong những lựa chọn thông thường nhất là hàm Gauss:
( ) exp( ( )2)
2
x a x
ϕ
σ
−
= − (2.13) Trong đó σ là tham số tỷ lệ
Mạng RBF được Moody và Darken đề xuất năm 1989 dựa trên sự tương đồng giữa triển khai hàm cơ sở xuyên tâm và mạng nơ ron một lớp ẩn
Nhờ khả năng xấp xỉ các hàm phi tuyến bất kỳ với độ chính xác tùy ý, mạng nơron và sau này là hệ mờ nơron sẽ là công cụ quan trọng, đặc biệt là mạng
Trang 16RBF, cho mô hình hóa hệ thống và cho điều khiển thích nghi các hệ thống phi tuyến
+ Chọn một vài giá trị khởi đầu nhỏ cho tốc độ học η (0)
η ( )t = η (t− 1) nếu ngoài các điều kiện trên
Tuy nhiên rất khó chọn các giá trị a,b Nếu chọn các giá trị này nhỏ thì khả năng thích nghi chậm, nếu chọn giá trị lớn thì gây nguy hiểm cho quá trình học
2.1.4 Mạng nơ ron trong các hệ thống điều khiển
Mạng nơ ron được sử dụng trong các hệ thống điều khiển có ưu điểm là chúng có khả năng học xấp xỉ bất kỳ một hàm phi tuyến nào, cho dù hàm đó
có bậc cao, với độ chính xác có thể đạt như ý muốn Có bốn cấu hình chuẩn của mạng nơ ron được đưa ra để ứng dụng cho các hệ thống điều khiển: sao chép từ một bộ điều khiển sẵn có, nhận dạng hệ thống, nhận dạng hệ thống đảo và điều khiển các đối tượng phi tuyến sử dụng mạng nơ ron
Trang 172.1.4.1 Cấu hình sao chép từ một bộ điều khiển sẵn có
Nếu một bộ điều khiển có khả năng điều khiển đối tượng thì thông tin được yêu cầu để huấn luyện một mạng nơ ron có thể được thu thập từ bộ điều khiển này Đầu ra mong muốn của mạng là đầu ra của bộ điều khiển sẵn có,
và đầu vào của mạng là đầu ra của đối tượng Mục tiêu của ứng dụng này là
để sao chép lại thông tin từ một bộ điều khiển sẵn có
Hệ thống
Bộ điều khiển
y(k) y(d)
Hình 2.6 Cấu hình sao chép từ một bộ điều khiển sẵn có
2.1.4.2 Cấu hình nhận dạng hệ thống
Dữ liệu huấn luyện mạng có thể được thu thập bằng cách giám sát cặp vào ra của đối tượng mạng nhận cùng đầu vào với đối tượng, còn đầu ra của đối tượng là đầu ra mong muốn của mạng
Trang 18Hệ thống Y(d)
Y(k)
Hình 2.8 Cấu hình hệ thống nhận dạng đảo
Trang 192.1.4.4 Điều khiển các đối tượng phi tuyến sử dụng mạng nơ ron
Các phương pháp điều khiển đối tượng phi tuyến sử dụng các mạng nơ ron thường được sử dụng là phương pháp điều khiển thích nghi trực tiếp (direct adaptive control), phương pháp điều khiển thích nghi gián tiếp ( indirect adaptive control), phương pháp điều khiển tối ưu, Fuzzy… trong nội dung chương bốn của luận văn ta sẽ nghiên cứu kỹ về phương pháp nhận dạng sử dụng mô hình nơ ron thích nghi NARX
2.1.5 Mô hình nơ ron thích nghi NARX
Mạng nơ ron có thể phân thành 2 loại đó là mạng động (NNARX) và mạng tĩnh (ANN) Mạng tĩnh không có phần tử phản hồi và không bao gồm sự chậm trễ, các đầu ra là tính toán trực tiếp từ các đầu vào thông qua kết nối truyền thẳng Mạng động, các đầu ra không những phụ thuộc vào đầu vào hiện tại của mạng mà còn phụ thuộc vào hướng hay đầu vào trước đó, đầu ra hay trạng thái của mạng Mạng động hầu hết mạnh hơn nhiều so với mạng tĩnh (mặc dù hơi khó khăn hơn trong việc huấn luyện) Bởi vì mạng động có bộ nhớ, chúng có thể được đào tạo để học liên tiếp hoặc thay đổi thời gian mô hình
Mô hình này có một thành phần tham số cộng với một phần phi tuyến, nơi mà một phần phi tuyến là xấp xỉ bởi một lớp ẩn truyền thẳng ANN Các mạng (NNARX) là mạng năng động hiện nay, với các kết nối thông tin phản hồi kín vài lớp của mạng Mô hình NNARX dựa trên mô hình tuyến tính ARX,
nó thường được sử dụng trong mô hình chuỗi thời gian
Phương trình xác định cho mô hình NNARX như sau:
( ) ( ( 1), ( 2), ( y), ( 1), ( 2), ( u))
y t = f y t− y t− y t n− u t− u t− u t n− (2.15)
Trường hợp, giá trị kế tiếp phụ thuộc vào tín hiệu đầu ra y (t) là quay trở lại giá trị trước đó của tín hiệu đầu ra và giá trị trước đó của một tín hiệu đầu vào độc lập (ngoại sinh) Đầu ra là phản hồi trở lại đầu vào của mạng
Trang 20truyền thẳng, như phần mẫu cấu trúc NNARX được biểu diễn ở hình 2.9 a Bởi vì đầu ra thực là có được trong việc huấn luyện mạng, chúng ta có thể tạo ra một dãy cấu trúc song song ở hình 2.9 b, trong đó đầu ra thực được sử dụng thay cho phản hồi đầu ra ước lượng Điều này có hai ưu điểm Đầu tiên là đầu vào cho mạng truyền thẳng là chính xác hơn Thứ hai là kết quả cấu trúc mạng đã hoàn truyền thẳng, cấu trúc và lan truyền ngược tĩnh có thể được sử dụng cho huấn luyện
Mạng động là huấn luyện giống như thuật toán suy giảm độ dốc được
sử dụng trong "lan truyền ngược." Mặc dù chúng có thể được đào tạo bằng cách sử dụng các thuật toán dựa trên suy giảm độ dốc cũng được sử dụng cho các mạng tĩnh, hiệu quả của các thuật toán trên mạng động có thể khá khác nhau, và độ dốc phải được tính toán một cách phức tạp hơn
a) Cấu trúc song song b) Dãy cấu trúc song song
Hình 2.9 Mạng truyền thẳng
u(t) u(t)
Mạng truyền thẳng
T
D L
Hình 2.10 Sơ đồ cấu trúc nơ ron thích nghi NARX
Trang 21Một sơ đồ kết quả của mạng được hiển thị bằng hình 2.10, nơi mà một mạng truyền thẳng hai lớp được sử dụng để ước lượng
Đây là loại trọng số của mạng có hai tác động khác nhau trên đầu ra mạng Đầu tiên là tác động trực tiếp, vì một sự thay đổi trong trọng số gây ra một thay đổi ngay lập tức trong đầu ra ở các bước thời gian hiện tại (đây là hiệu quả đầu tiên có thể được tính bằng cách sử dụng tiêu chuẩn lan truyền ngược) Thứ hai là tác động gián tiếp, bởi vì một số đầu vào tới các lớp, chẳng hạn như a(t, 1), cũng là hàm của các trọng số Để giải thích cho tác động gián tiếp, chúng ta phải sử dụng mạng lan truyền ngược động để tính toán độ dốc
Mạng lan truyền ngược động có nhiều thời gian hơn để huấn luyện, ngoài ra, sai số ngoài cho mạng động có thể phức tạp hơn so với mạng tĩnh Huấn luyện có nhiều khả năng bị mắc kẹt tại cực tiểu địa phương Điều này cho thấy chúng ta có thể cần phải huấn luyện mạng nhiều lần để đạt được một kết quả tối ưu
2.2 Kết luận
Qua nội dung lý thuyết đã trình bày, ta có thể nhận thấy rõ nét những ưu nhược điểm của mạng nơ ron là:
+ Ưu điểm:
• Tính phi tuyến (nonlinearity)
• Mô hình tổng quát cho ánh xạ từ tập vào đến tập ra (input-output mapping): Nonparametric models
• Tính thích ứng (adaptivity): training, online-training, nonstationary environments
• Chấp nhận lỗi (Fault Tolerance)
• Thích ứng với nhiễu dữ liệu (noise)
• Khả năng song song: Parallelism, VLSI implementation
Trang 22Bên cạnh đó, giải pháp nhận dạng sử dụng mô hình nơ-ron thích nghi NARX
là chiến lược nhận dạng được sử dụng cho các đối tượng phi tuyến Mô hình nhận dạng sử dụng mô hình nơ ron thích nghi NARX ghi lại các chuyển động tại các thời điểm rời rạc trong một phạm vi dự kiến nhất định Dựa vào đáp ứng dự kiến này để tính toán chuỗi tín hiệu vào ra tương lai trong phạm vi nhận dạng sao cho sai lệch giữa đáp ứng dự báo bởi mô hình và tín hiệu tham chiếu cho trước là tối thiểu
Kết hợp những ưu điểm nổi trội của mạng nơ-ron và phương pháp sử dụng
mô hình nơ-ron thích nghi NARX, trong chương tiếp theo, học viên trình bày một số vấn đề về xây dựng mô hình động học thuận, ngược kinh điển theo quy tắc D_H Những nội dung này là công cụ lý thuyết để giải bài nhận dạng cho hệ phi tuyến và áp dụng cụ thể vào hệ tay máy 3 bậc được đề cập trong chương 4
Trang 23CHƯƠNG 3: XÂY DỰNG MÔ HÌNH ĐỘNG
HỌC THUẬN VÀ NGƯỢC KINH ĐIỂN CỦA
TAY MÁY BA BẬC THEO QUY TẮC D_H
3.2 Xây dựng mô hình động học thuận và ngược kinh điển theo quy tắc D_H
3.2.1 Cơ sở động học về Robot
3.2.1.1 Vị trí và hướng của vật rắn trong không gian
Xét vật rắn B trong hệ quy chiếu cố định Ox0y0z0 (hình 3.1) Lấy A là một điểm nào đó thuộc vật rắn B Gắn chặt vào vật rắn B hệ quy chiếu động Axyz
Hệ tọa độ Ox0y0z0 được dùng làm hệ tọa độ gốc, hệ tọa độ Axyz gọi là hệ tọa
độ vật Ký hiệu eJG1(0), eJJG2(0), eJG3(0) là các vectơ đơn vị trên hệ trục Ox0y0z0, eJG1, eJJG2,
là các vectơ đơn vị trên hệ trục Axyz
3
eJG
Trang 24Vị trí của vật rắn B đối với hệ quy chiếu cố định Ox0y0z0 được xác định bởi vị trí của hệ quy chiếu Axyz đối với hệ quy chiếu Ox0y0z0, tức là được xác định bởi vị trí của điểm A và hướng của hệ tọa độ Axyz so với hệ tọa độ
Ox0y0z0
Hình 3.1 Vị trí và hướng của vật rắn trong không gian
Vị trí của điểm A được xác định thông qua vectơ:
2 1 2 2 2 3 21 22 23 (0) (0) (0)
Trang 25Từ định nghĩa trên trong hệ quy chiếu Ox0y0z0 ta có các hệ thức liên hệ:
Từ định nghĩa trên trong hệ quy chiếu Ox0y0z0 ta có các hệ thức liên hệ:
Ma trận quay cơ bản của phép quay quanh các trục x0, y0, z0:
Trang 26- Biểu diễn hướng giữa 2 hệ tọa độ, trong đó các cột của ma trận là cosin chỉ phương giữa các trục của hệ mới so với hệ gốc
- Biểu diễn sự chuyển đổi tọa độ của một vectơ giữa 2 hệ tọa độ có gốc trùng nhau
- Là toán tử biểu diễn phép quay của một vectơ trong cùng một hệ tọa
Trang 27R = 0
1
R 1 2
- Quay vật (đang trùng phương với hệ Ox0y0z0) theo 0
1
R để nó trùng phương với hệ Ox1y1z1
- Tiếp tục quay vật (hiện đã trùng phương với hệ Ox1y1z1) theo 1
2
R để
nó trùng phương với hệ Ox2y2z2
b) Phép quay quanh trục bất kỳ
Trường hợp thường xuyên gặp phải trong nghiên cứu động học tay máy
là mô tả phép quay một vật quanh trục bất kỳ
Hình 3.3 Phép quay quanh một trục bất kỳ
Trang 28Giả sử r = [rx ry rz] là vectơ đơn vị trong hệ Oxyz của trục quay Ma
trận quay R(r,φ) mô tả phép quay quanh trục r một góc φ được xác định bằng
cách tổ hợp các ma trận quay theo các trục tọa độ gốc Góc φ được quy ước là
dương nếu chiều quay ngược kim đồng hồ
Một trong những cách tổ hợp có thể như sau:
- Làm trùng vectơ r với trục z bằng cách quay r một góc -α quanh trục
z sau đó là -β quanh trục y
- Quay góc φ quanh trục z
- Quay trả góc β quanh y rồi α quanh z
Mô tả bằng ma trận quay các phép quay trên như sau:
Trang 293.2.1.3 Mô tả tối thiểu của hướng
Ma trận quay dùng để mô tả hướng của vật có 9 thành phần, nhưng các thành phần này không hoàn toàn độc lập với nhau Do ma trận quay là ma trận trực giao nên có 6 điều kiện ràng buộc Như vậy, để mô tả phép quay (định hướng) chỉ cần dùng 3 tham số độc lập Việc dùng 3 tham số độc lập để mô tả hướng được gọi là mô tả tối thiểu Có thể dùng các bộ ba tham số khác nhau, nhưng thường dùng nhất là góc Euler và góc RPY
1) Góc Euler
Góc Euler được hình thành bằng cách tổ hợp các thành phần của ma trận quay hệ tọa độ hiện thời Tùy theo kiểu tổ hợp ma trận quay, có 12 bộ góc Euler khác nhau Sau đây là một kiểu, gọi là kiểu ZYX
Giả sử (ϕ θ ψ) là một tổ hợp của góc Euler Phép quay tương ứng với nó được hình thành theo thứ tự sau (Hình 3.4):
Hình 3.4 Góc quay Euler
Trang 30- Quay hệ tọa độ một góc ϕ quanh z, tương ứng ma trận quay R(z, ϕ)
- Quay tiếp hệ tọa độ hiện thời góc θ quanh y’, tương ứng R(y’, θ)
- Quay tiếp hệ tọa độ hiện thời góc ψ quanh z’’, tương ứng R(z’’, ψ) Hướng của hệ tọa độ cuối cùng là kết quả của sự tổ hợp các phép quay trong hệ tọa độ hiện thời Ở phép quay Euler nếu thực hiện thứ tự ngược lại (ψ → θ → ϕ) cũng cho kết quả như nhau
z Roll là chuyển động lác của thân tàu Pitch là sự bồng bềnh Yaw là sự lệch hướng
Trang 31Z Roll
Phép quay tương ứng với góc RPY được thực hiện theo trình tự sau:
- Quay hệ tọa độ gốc một góc ϕ quanh trục z Phép quay này được mô
Trang 32π πθ
r= σx σy σz (3.15) Trong kỹ thuật người ta thường chọn σ = 1 Khi đó tọa độ thuần nhất bốn chiều của điểm P được mở rộng từ các tọa độ vật 1 Ba chiều của điểm P bằng cách thêm vào đại lượng thứ tự như sau:
Trang 332) Ma trận biến đổi tọa độ thuần nhất
Xét vật rắn B chuyển động trong hệ quy chiếu cố định Ox0y0z0 (Hình 3.7) Lấy một điểm A nào đó của vật rắn B và gắn chặt vào vật rắn hệ quy chiếu Axyz Lấy P là một điểm bất kỳ thuộc vật rắn B
21 22 23 (0) (0)
Trong đó R là ma trận cosin chỉ hướng của vật rắn B; sx, sy, sz là tọa độ của vectơ sJJJGAP trong hệ quy chiếu Axyz Nếu sử dụng các tọa độ thuần nhất có thể viết dưới dạng:
(0) (0)
11 12 13 (0) (0)
21 22 23 (0) (0)
e→ X
Y Z
(0) 1
e→
A
r→
A
Trang 34Định ma trận chuyển tọa độ thuần nhất của điểm P từ hệ Axyz sang hệ
Các ma trận quay cơ bản trong mục ma trận cosin chỉ hướng mở rộng
ra trong hệ tọa độ thuần nhất bốn chiều dạng như sau:
0 0 1
0 0 0 1
a b Trans a b c
Trang 35Nhờ 4 ma trận cơ bản này có thể biểu diễn chuyển động bất kỳ của một vật trong không gian
3.2.2 Biểu diễn Denavit _Hartenbergh
Các phương trình động học sử dụng ma trận đại số để xây dựng các hàm quan hệ giữa các biến khớp và phần lớn vị trí tọa độ của cơ cấu chấp hành cuối (vị trí và hướng) dựa trên không gian cấu hình của một tay máy cụ thể Một cách tiếp cận có hệ thống và tổng quát để mô tả các phương trình động học của một chuỗi liên kết tay máy đã được đề xuất bởi Denavit _Hartenbergh (D_H) [3.25] Điều này giống như phép quay và tịnh tiến của
hệ tọa độ quy chiếu cố định tới một liên kết đối với hệ tọa độ quy chiếu chuẩn bằng một ma trận biến đổi đồng nhất Nó là một ma trận 4x4 trong đó, ma trận quay 3x3, là ma trận trực giao biểu diễn hướng của cơ cấu chấp hành cuối đối với hệ tọa độ cơ bản, được sử dụng để mô tả các hoạt động phép quay Vector 3x1 biểu diễn mối quan hệ tọa độ vị trí của gốc hệ tọa độ gắn trên cơ cấu chấp hành cuối đối với hệ tọa độ cơ bản Ma trận biến đổi hệ tọa độ đồng nhất i1
i
A− giữa hệ tọa độ quy chiếu kế tiếp có thể được biểu diễn
dễ dàng bằng cách:
Trang 361
αi là góc giữa zi-1 và zi đối với xi
di là khoảng cách giữa gốc tọa độ Oi-1 và giao điểm của trục zi-1 với trục xi dọc theo zi-1 (hoặc khoảng cách giữa các xi-1 và xi nếu nó song song)
θi là góc giữa xi-1 và xi đối với zi-1
ai là khoảng cách giữa gốc tọa độ Oi và các giao điểm của trục zi-1 với trục xidọc theo xi (hoặc khoảng cách giữa zi-1 và zi nếu nó song song)
Hình 3.8 Cấu trúc thông số động học đối với i khâu đầy đủ
Nếu một vị trí vector pi được xác định trong hệ tọa độ quy chiếu thứ i, sau đó nó có thể được biểu diễn trong hệ tọa độ thứ ( 1)i− như vector pi-1 bằng cách:
1 i1 i (3.27)
p− =A p−
Trang 37Vì vậy, sự phối hợp ma trận biến đổi ánh xạ một vector vị trí biểu diễn trong tọa độ đồng nhất từ một hệ tọa độ này đến một hệ tọa độ khác Kết quả
là, thông qua một chuyển đổi liên tiếp, nó đạt được bằng cách nhân một loạt các tọa độ ma trận biến đổi, hệ tọa độ quy chiếu gắn với cơ cấu chấp hành cuối có thể được biến đổi và biểu diễn trong hệ tọa độ cơ bản Nói chung, ma trận biến đổi đồng nhất từ hệ tọa độ quy chiếu thứ n đến hệ tọa độ quy chiếu
cơ bản có thể được xác định bằng cách nhân i1
Do đó, nếu một vector pn là đã biết trong hệ tọa độ quy chiếu thứ n, nó
có thể được xác định đối với hệ tọa độ cơ bản bằng:
Trang 383.2.2.1 Bài toán thuận Denavit _ Hartenberg matrix
Bài toán thuận nhằm mô tả vị trí và hướng của phần công tác dưới dạng hàm số của các biến khớp Một trong những phương pháp giải bài toán thuận
là dùng trực tiếp hình học giải tích Tuy nhiên phương pháp tính toán trực tiếp này chỉ áp dụng được cho các cơ cấu đơn giản Để có thể giải các bài toán tổng quát cần một thuật giải chung Một trong những thuật giải như vậy xuất phát từ quy tắc Denavit_Hartenberg, được Denavit và Hartenberg xây dựng vào năm 1955 Đó là quy tắc thiết lập hệ thống tọa độ trên các cặp khâu – khớp trên tay máy Dựa trên hệ thống tọa độ này có thể mô tả các cặp khâu – khớp bằng hệ thống các tham số, biến khớp
Xét mô hình robot gồm có n khâu Các khâu được đánh số tăng dần từ khâu cơ sở (khâu 0) đến khâu thứ i Khớp thứ i nối giữa khâu i-1 và khâu i, là khớp quay hoặc khớp tịnh tiến Mỗi khớp chỉ có một bậc tự do
Theo Denavit _Hartenberg tại mỗi khớp ta gắn một hệ trục tọa độ, quy ước về cách đặt tọa độ này như sau:
- Trục zi được chọn dọc theo hướng của trục khớp thứ i+1 Chiều của zi
được chọn tùy ý
- Trục xi được xác định là đường vuông góc chung giữa trục khớp i và khớp i+1, hướng từ điểm trục của khớp i tới khớp i+1 Nếu hai trục song song thì xi có thể chọn bất kỳ là đường vuông góc chung hai trục khớp Trong trường hợp hai trục này cắt nhau, xi được xác định theo chiều của zixzi+1 (hoặc quy tắc bàn tay phải)
- Gốc tọa độ Oi-1 được chọn tại giao điểm của trục xi-1 và trục zi-1
- Trục yi được xác định theo xi và zi theo quy tắc bàn tay phải
Bốn thông số Denavit _Hartenberg liên hệ giữa phép biến đổi của hai
hệ trục tọa độ liên tiếp được xác định như sau:
- θi: góc xoay đưa trục xi-1 về xi quanh zi-1 theo quy tắc bàn tay phải
Trang 39- di: dịch chuyển dọc trục zi-1 đưa gốc tọa độ về nằm trên trục zi
- αi: góc xoay đưa trục zi-1 về zi quanh xi-1 theo quy tắc bàn tay phải
- ai: dịch chuyển dọc trục xi-1 đưa gốc tọa độ về nằm trên trục xi
Ma trận của phép biến đổi, ký hiệu là i1
i
A− là tích của bốn ma trận biến đổi cơ bản và có dạng:
1
- Nếu là khớp tịnh tiến thì di sẽ là biến khớp
- Nếu là khớp quay thì θi sẽ là biến khớp
Có thể biểu diễn ma trận thuần nhất dưới dạng
1 1 1
- i1
i
R− là ma trận cosin (3x3) chỉ hướng của hệ tọa độ n đối với hệ tọa độ i-1
- i1 là vectơ (3x1) chỉ vị trí gốc hệ tọa độ n đối với hệ tọa độ i-1
i
P−
Phương trình xác định vị trí bàn kẹp của robot được tính theo (3.28) và (3.29):
Trang 403.2.2.2 Bài toán động học ngược Denavit _Hartenberg matrix
Nội dung của bài toán động học ngược là xác định giá trị của biến khớp nếu biết hướng và vị trí của bàn kẹp Bài toán động học ngược được đặc biệt quan tâm vì lời giải của nó là cơ sở chủ yếu để xây dựng chương trình điều khiển chuyển động của Robot bám theo quỹ đạo cho trước Có nhiều công trình nghiên cứu tìm lời giải cho bài toán này Đối với trường hợp n > 6 thì hầu như chỉ có lời giải theo phương pháp số đối với một số loại robot cụ thể nào đó, nhưng chưa có một phương pháp chung nào có hiệu quả Bản thân việc giải bài toán động học ngược bằng phương pháp số nhiều khi đòi hỏi thời gian tính toán kéo dài, thậm chí không đi đến lời giải Sở dĩ như vậy là vì thường gặp các hệ phương trình siêu việt không phải lúc nào cũng có độ hội
tụ lời giải Điều đó ảnh hưởng lớn đến việc đảm bảo thời gian thực trong điều khiển robot
Đối với trường hợp n = 6, là trường hợp thường gặp trong thực tế công nghiệp nên có nhiều công trình nghiên cứu hơn Tuy nhiên, ở đây các lời giải tìm được hầu như chỉ cho trường hợp riêng, có đặc điểm hình động học riêng biệt được tận dụng để thiết lập các quan hệ cần thiết khi thiết lập lời giải
Xuất phát từ phương trình xác định vị trí bàn kẹp của Robot (3.46)
0
0 0 0