NHẬN DẠNG HỆ TAY MÁY DÙNG MẠNG NEURON

Trong sự phát triển không ngừng của khoa học và công nghệ làm xuất hiện các đối tượng điều khiển có độ phức tạp ngày càng gia tăng, lý thuyết điều khiển thông minh là phương pháp điều khiển phỏng theo các đặc điểm cơ bản trí thông minh của con người, bao gồm khả năng học, khả năng xử lý thông tin không chắc chắn và khả năng tìm lời giải tối ưu, có vai trò hết sức quan trọng để giải quyết nhiều vấn đề như nâng cao chất lượng điều khiển, độ ổn định của hệ thống, tiết kiệm năng lượng hay như sử dụng máy móc thay thế con người trong các ứng dụng điều khiển phức tạp hoặc nguy hại. Hàng loạt các công trình nghiên cứu về điều khiển bền vững, điều khiển thích nghi, điều khiển tối ưu hay điều khiển mờ và mạng nơron được công bố trong những năm gần đây cho thấy sự quan tâm lớn của các nhà khoa học trên khắp thế giới và những vấn đề, các hướng nghiên cứu phát triển trong lĩnh vực này.

Trang 1

CHƯƠNG 1: TỔNG QUAN

1.1 Khái quát vấn đề và các công trình liên quan

Trong sự phát triển không ngừng của khoa học và công nghệ làm xuất hiện các đối tượng điều khiển có độ phức tạp ngày càng gia tăng, lý thuyết điều khiển thông minh là phương pháp điều khiển phỏng theo các đặc điểm cơ bản trí thông minh của con người, bao gồm khả năng học, khả năng xử lý thông tin không chắc chắn và khả năng tìm lời giải tối ưu, có vai trò hết sức quan trọng để giải quyết nhiều vấn đề như nâng cao chất lượng điều khiển, độ

ổn định của hệ thống, tiết kiệm năng lượng hay như sử dụng máy móc thay thế con người trong các ứng dụng điều khiển phức tạp hoặc nguy hại Hàng loạt các công trình nghiên cứu về điều khiển bền vững, điều khiển thích nghi, điều khiển tối ưu hay điều khiển mờ và mạng nơron được công bố trong những năm gần đây cho thấy sự quan tâm lớn của các nhà khoa học trên khắp thế giới và những vấn đề, các hướng nghiên cứu phát triển trong lĩnh vực này

Alavandar và Nigam [11] phát triển Nơron-Mờ được dựa trên cách tiếp cận đối với giải pháp động học ngược của cánh tay robot công nghiệp, bằng cánh sử dụng khả năng của ANFIS ( hệ thống suy diễn nơron mờ thích nghi)

để học từ dữ liệu huấn luyện nhằm tạo ra mạng ANFIS, thực hiện một biểu diễn hệ thống suy luận mờ điển hình bằng cách sử dụng cấu trúc giống mạng thần kinh BP Guez và Ahmad [13] phát triển giải pháp cho vấn đề động học ngược bằng cách sử dụng mạng nơron trong robot, mạng nơron có thể được huấn luyện để cho ra một giải pháp khá chính xác sẽ đưa đến tải trọng tối thiểu trong xử lý tải của mỗi chu kỳ điều khiển và do đó cho phép điều khiển thời gian thực robot bằng thuật toán lan truyền ngược

Karlik và Aydinb [14] phát triển cách tiếp cận cải tiến giải pháp của động học ngược đối với cánh tay robot 6 bậc Một phương pháp tiếp cận cấu

Trang 2

trúc mạng nơron nhân tạo (ANN) được đề xuất ở đây để điều khiển các chuyển động của cánh tay robot Mô hình mạng nơron sử dụng các đơn vị ngưỡng với hàm chuyển sigmoid và luật học theo kiểu suy giảm độ dốc.

Ngoài ra sử dụng các phương pháp khác nhau như phương pháp số và các phương pháp thông minh để giải quyết động học thuận và động học ngược của cánh tay robot công nghiệp được nghiên cứu trong [16] Trong thập niên trước đây một số mô hình mạng nơron thích nghi và học kết hợp đã được áp dụng cho học offline và online của động lực học cánh tay robot [11] Ahn và Anh [4] đã thành công trong việc tối ưu hóa một mô hình nơron thích nghi NARX của động học ngược dựa trên cánh tay robot PAM bằng cách sử dụng thuật toán di truyền Các tác giả trong [7] đã nhận dạng động học ngược của cánh tay robot công nghiệp dựa trên mạng nơron thích nghi Như chúng ta

đã biết, các hệ thống thực là các mô hình phi tuyến hết sức phức tạp nên các phương pháp thiết kế kinh điển dựa trên điều khiển tuyến tính trong nhiều trường hợp không đảm bảo được yêu cầu do đặc tính phi tuyến của động học đối tượng điều khiển, đặc tuyến đầu đo hoặc cơ cấu chấp hành cũng như tính chất không đầy đủ, chính xác của các mô hình thay thế (chưa biết đặc tính động học, nhiễu, điều kiện ban đầu)

Sự phát triển không ngừng của khoa học công nghệ làm xuất hiện các đối tượng điều khiển có độ phức tạp ngày càng tăng Yêu cầu thực tiễn đặt ra là phải điều khiển các hệ thống động ngày càng phức tạp, trong điều kiện các yếu tố bất định ngày càng gia tăng với yêu cầu chất lựợng điều khiển ngày càng cao Các yêu cầu trên không thể được đáp ứng một cách trọn vẹn, đồng thời nếu chỉ dùng các lí thuyết điều khiển thông thường sẵn có Đây chính là động lực cho sự ra đời của hàng loạt các lí thuyết điều khiển thông minh hứa hẹn một hướng giải quyết triệt để các bài toán điều khiển phi tuyến phức tạp Nhiều sơ đồ điều khiển dùng mạng nơ ron MLP với thuật toán Lan Truyền

Trang 3

Ngược (Back Propagation - BP) được ứng dụng để giải các bài toán điều khiển các hệ phi tuyến phức tạp và bất ổn định Tính thích nghi cho phép mô hình mạng nơ-ron sau khi được huấn luyện vẫn thực hiện tốt chức năng của

nó dù nhiễu động môi trường và thông số đối tượng điều khiển thay đổi theo thời gian Đó là nhờ mô hình mạng nơ ron có khả năng tự cập nhật các trọng

số của mình

Mạng nơ-rơn nhân tạo là một mô hình toán học đơn giản của bộ não con người Các nghiên cứu về mạng nơ-rơn nhân tạo được bắt đầu từ thập niên 1940 Năm 1944, McCulloh và Pitts là những người đầu tiên đã xuất bản một công trình nghiên cứu có tính hệ thống về mạng nơ-rơn nhận tạo Tuy nhiên nghiên cứu về mạng nơ ron chỉ phát triển mạnh từ sau những năm 1980 Mối quan tâm về mạng nơ-rơn nhân tạo bắt nguồn từ khả năng của mạng trong việc mô phỏng, bắt chước khả năng học và phản ứng của bộ no con người Kết quả là mạng nơ-rơn nhân tạo đã được ứng dụng trong rất nhiều các lĩnh vực khác nhau như nhận dạng, phân loại, xử lý ảnh, dự báo Các hệ thống điều khiển đã chứng tỏ được tính hiệu quả của chúng trong lĩnh vực này Đến nay đã có rất nhiều cấu hình mạng và các thuật tóan huấn luyện tương ứng được công bố để giải quyết các bài tóan khác nhau

Đã có nhiều công trình nghiên cứu mạng nơ-rơn trong nhận dạng, điều khiển hệ phi tuyến và đã chứng tỏ được những ưu điểm vượt trội

Vì lẽ đó trên cơ sở tham khảo bài báo [7] sử dụng mạng nơron thích nghi (Adaptive neural) để huấn luyện và lập trình của tay máy Tác giả đã mạnh dạn sử dụng mô hình mạng nơron thích nghi (Adaptive neural network model) thông qua mô hình nơ ron thích nghi NARX để huấn luyện, lập trình,

mô phỏng cho hệ tay máy Các giả định được điều khiển từ GUI ghi lại tất cả

các chuyển động của cánh tay máy Các dữ liệu ghi lại được sử dụng như tập

dữ liệu dùng để huấn luyện

Trang 4

Luận văn này đầu tiên phác thảo cơ sở lý thuyết và ứng dụng mô hình nơron NARX dùng để nhận dạng cho hệ tay máy đa bậc

Xuất phát từ những lý do nêu trên, học viên quyết định chọn đề tài: “mô hình hóa, nhận dạng hệ tay máy phi tuyến dùng mô hình mạng nơron thích nghi” với mục đích sử dụng những ưu điểm của mạng nơ-ron thích nghi, từ

đó đề xuất một thuật toán khả thi để nhận dạng hệ tay máy đa bậc phi tuyến

Cụ thể là: ứng dụng một số giải thuật để giải bài toán nhận dạng động học hệ tay máy Khẳng định ưu thế vượt trội của phương pháp được ứng dụng trong nhận dạng đối với mô hình này qua đánh giá kết quả mô phỏng sử dụng thuật

toán mô hình nơron thích nghi NARX

1.2 Giới thiệu luận văn

1.2.1 Phát biểu bài toán

Một trong các vấn đề cơ bản trong lý thuyết điều khiển là nghiên cứu

để sử dụng phản hồi nhằm làm thay đổi động học của đối tượng sao cho đạt được đặc tính theo mong muốn Trong luận văn, các nghiên cứu tập trung vào phương pháp ứng dụng mô hình nơ ron thích nghi NARX để nhận dạng cho

hệ tay máy 3 bậc với mục tiêu là sử dụng mô hình nơron thích nghi NARX để huấn luyện mô hình động học thuận, ngược của tay máy ba bậc

1.1.2 Nhiệm vụ của luận văn

1 Thành lập mô hình động học thuận và ngược kinh điển của tay máy theo quy tắc D_H ( Denavit_Hartenberg)

2 Nghiên cứu giải thuật giải bài toán động học thuận, ngược cho hệ tay máy

ba bậc với mô hình phi tuyến theo các phương pháp sau:

- Phương pháp huấn luyện mạng nơron thích nghi NARX

Trang 5

- Phương pháp dùng giải thuật học của mạng nơ ron truyền thẳng 3 lớp

3 Dùng ngôn ngữ lập trình của phần mềm Matlab 7.0 để mô phỏng và nhận dạng mô hình động nơron thích nghi NARX cho hệ tay máy ba bậc

1.2.3 Bố cục của luận văn

Với nhiệm vụ thực hiện luận văn ở trên, bố cục của luận văn gồm 5 chương:

Chương 1: Tổng quan

Giới thiệu khái quát một số công trình đã được công bố có liên quan đến điều khiển thông minh sử dụng mạng nơ-ron thích nghi, ý nghĩa ứng dụng của mô hình này trong thực tế, mục đích nghiên cứu, nhiệm vụ thực hiện và nội dung

sơ lược của luận văn

Chương 2: Cơ sở lý thuyết

Lý thuyết điều khiển mạng nơ-ron, thích nghi, giải pháp điều khiển sử dụng

mô hình nơron thích nghi NARX cho hệ phi tuyến và thuật toán lan truyền ngược huấn luyện mạng nơ-ron truyền thẳng 3 lớp

Chương 3: Xây dựng mô hình động học thuận và ngược kinh điển theo quy

Trang 6

- Giải thuật nhận dạng sử dụng mô hình nơron thuận thích nghi NARX dùng thuật toán Lan Truyền Ngược (Back Propagation - BP) để cập nhật trọng số kết nối của mạng

- Giải thuật nhận dạng sử dụng mô hình nơron ngược thích nghi NARX dùng thuật toán Lan Truyền Ngược (Back Propagation - BP) để cập nhật trọng số kết nối của mạng

Chương 5: Kết quả mô phỏng bằng Matlab Simulink

Chương 6: Kết luận và hướng phát triển của đề tài

Phân tích, đánh giá các kết quả đã thực hiện, khẳng định tính ưu việt của phương pháp được lựa chọn cho mô hình này Rút ra những vấn đề chưa thực hiện được trong luận văn và đề xuất hướng phát triển của đề tài

Trang 7

CHƯƠNG 2: CƠ SỞ LÝ THUYẾT

2.1 Mạng nơ-rôn nhân tạo

Mạng nơ-rôn nhân tạo là mô hình toán học đơn giản của bộ não con người Các nghiên cứu về mạng nơ ron nhân tạo đã bắt đầu từ thập niên 1940 McCulloch

và Pitts là những người đầu tiên đã xuất bản một công trình nghiên cứu có tính hệ thống về mạng nơ-rôn nhận tạo Tuy nhiên nghiên cứu về mạng nơ-rôn chỉ phát triển mạnh từ sau những năm 1980 Mối quan tâm về mạng nơ-rôn nhân tạo bắt nguồn từ khả năng của mạng trong việc mô phỏng, bắt chước khả năng học và phản ứng của bộ não con người Kết quả là mạng nơ ron nhân tạo đã được ứng dụng trong rất nhiều các lĩnh vực khác nhau như nhận dạng, phân loại, xử lý ảnh, các hệ thống điều khiển, dự báo… và cũng đã chứng tỏ được tính hiệu quả của chúng trong lĩnh vực này Đến nay đã có rất nhiều cấu hình mạng và các thuật toán huấn luyện tương ứng được công bố để giải quyết các bài toán khác nhau

2.1.1 Khái quát về mạng nơ-rôn nhân tạo

Nơ-rôn nhân tạo là một thành phần cơ bản và quan trọng nhất của một mạng nơ-rôn nhân tạo Năm 1943 McCulloch và Pitts đã đề xuất mô hình nơ ron nhân tạo đầu tiên được mô tả như hình 2.1

w i1

Hình 2.1 Cấu trúc một nơ ron nhân tạo

2

i w

in w

i

Ngõ

ra Đơn vị xử

lý

Ngõ Nút vào

Trang 8

Trong đó là ngõ vào từ môi trường ngoài hay ngõ ra của đơn vị xử lý khác, y là ngõ ra của nơ-rôn Các giá trị là các trọng số kết nối với các nơ-rôn khác để xác định cường độ của vector ngõ vào Do đó giá trị ngõ vào hàm kích hoạt là XTW Tuỳ thuộc vào hàm kích hoạt, nếu trọng số là dương XTW sẽ kích thích nơ-rôn ở ngõ ra và ngược lại Đơn vị xử lý tính tổng trọng số của các ngõ vào và tạo lại tín hiệu ra yi = 1 hoặc yi = 0 nếu giá trị tổng của nó ở trên hoặc dưới mức ngưỡng

n

x x x

X = 1, 2, , ]

in i

) (

) 1

y + = − θ (2.1)

Trong đó, hàm tác động a(f) là một hàm bậc thang đơn vị

2.1.2 Các thành phần cơ bản của mạng nơ-rôn nhân tạo

Có 3 thành phần cơ bản của các mạng nơ-rôn nhân tạo: đó là đơn vị

xử lý, mô hình kết nối và luật học

2.1.2.1 Đơn vị xử lý

Một mạng nơ-rôn có nhiều lớp: lớp vào, lớp ẩn và lớp ra Lớp vào phục

vụ như nơi chứa tín hiệu vào, các lớp ẩn chứa các nơ-rôn được xem như các đơn vị xử lý, lớp ra chứa các nơ-rôn để ra quyết định

Kết hợp với mỗi đơn vị xử lý có hàm tổng hợp và hàm kích hoạt, hàm tổng hợp có chức năng tổng hợp tất cả tín hiệu vào và hàm kích hoạt có chức năng tạo tín hiệu ra

a Hàm tổng hợp

Hàm tổng hợp có thể là dạng tuyến tính hoặc phi tuyến

+ Hàm tổng hợp dạng tuyến tính

Trang 9

i j m

j ij i

=1

(2.2) + Hàm tổng hợp dạng phi tuyến

i j m

j ij i

=

2 1

(2.3)

b Hàm kích hoạt

Có nhiều kiểu hàm kích hoạt khác nhau nhưng trong luận văn chỉ trình

bày một số hàm kích hoạt phổ biến Các kiểu hàm kích hoạt khác cũng có thể

sử dụng tuỳ thuộc vào bài toán mà mạng nơ-rôn đang giải quyết

0 1

) (

f

f f

a

neáu neáu

0 1

) (

f

f f

a

neáu neáu

1

|

| 0

1 1

) (

f

f f

a

neáu neáu neáu

(2.6) + Hàm Sigmoid: (H.2.2.d) f

e f

+

= 1

1 )

( (2.7)

Trong đó, λ là hệ số hình dạng của hàm Sigmoid, bằng cách thay đổi

hệ số này có thể thay đổi dạng của các hàm Sigmoid minh chứng như hình vẽ

+ Hàm hyperpolic (Tang-hyperbol): (H.2.2.e) f f f f

e e

e e f

λ λ

(2.8) Trong đó, λ là hệ số hình dạng của hàm hyperpolic đặc trưng như hình (e)

Trang 10

Khi sử dụng các phương trình (2.7) và (2.8) có một điều cần lưu ý là đạo hàm của 2 phương trình này có thể biểu diễn bằng các hàm của chính nó Đây là một ưu điểm rất quan trọng để phát triển các thuật toán học cho mạng nơ-rôn có sử dụng một trong 2 phương trình trên

1 a(f)

f

-1

1 -1

0

1 a(f)

f -1

0 f

1 a(f)

f

Trang 11

2.1.2.2 Luật học

Một thành phần quan trọng của mạng nơ ron đó là luật học, có hai loại

đó là học thông số và học cấu trúc Học thông số là cập nhật các trọng số kết nối trong mạng và học cấu trúc là tập trung vào việc thay đổi cấu trúc, bao gồm số đơn vị xử lý và loại kết nối Hai thuật toán học này có thể thực hiện

đồng thời hoặc tách rời Hiện nay bài toán học on-line đồng thời cả thông số

và cấu trúc của mạng đã, đang được nghiên cứu và đưa vào ứng dụng trong nhiều lĩnh vực khác nhau

2.1.2.3 Mô hình kết nối

Mô hình kết nối của mạng nơ ron hay còn gọi là cấu trúc mạng Có hai

mô hình kết nối trong các mạng nơ ron đó là mô hình kết nối truyền thẳng (mạng truyền thẳng) và mô hình kết nối lan truyền ngược (mạng hồi quy)

Tùy thuộc vào số lớp của mạng mà ta có mạng truyền thẳng một lớp hay nhiều lớp, cấu trúc của mạng phải phù hợp với từng bài toán cụ thể

Ví dụ 2.1: Để giải bài toán XOR nếu dùng mạng truyền thẳng một lớp

không giải quyết được mà phải dùng mạng truyền thẳng 3 lớp Cấu trúc mạng như hình 2.3 Với ngõ vào 00, tổng có trọng số của nơ-rôn A1 và nơ-rôn A2 là

0 dẫn đến ngõ ra là 0, lúc này tổng có trọng số của nơ-rôn B là 0 < 0.5 vì thế ngõ ra của mạng y = 0 Với ngõ vào 01, tổng có trọng số nơ-rôn A1 là 1 > 0.5 dẫn đến ngõ ra là 1, tổng có trọng số nơ ron A2 là 1 < 1.5 dẫn đến ngõ ra là 0 Tổng có trọng số nơ-rôn B là 1 > 0.5 vì thế ngõ ra của mạng y = 1 Tương tự như vậy cho trường hợp 10 Đối với ngõ vào 11, tổng có trọng số của nơ-rôn

A1 và A2 đều là 2 >1.5 dẫn đến ngõ ra 2 nơ ron này đều là 1 Tổng có trọng số của nơ-rôn B là 0 < 0.5 dẫn đến ngõ ra y = 0 Như vậy bài toán XOR đã được giải quyết đúng đắn

Trang 12

Hình 2.3 Giải bài toán XOR dùng mạng truyền thẳng 3 lớp

Sự khác nhau cơ bản giữa mạng hồi quy và mạng truyền thẳng là thông tin có thể lan truyền theo 2 hướng trong mạng hồi quy Có 2 loại mạng hồi quy là hồi quy bán phần và hồi quy toàn phần

Thuật toán huấn luyện cho mạng nơ-ron một lớp có đặc điểm:

+ Giá trị ban đầu của trọng số và ngưỡng là những giá trị ngẫu nhiên

+ Tính toán theo từng mẫu ngõ vào và ngõ ra mong muốn

+ Ngõ ra của mạng được tính theo phương trình: y= f X W( T )

Trang 13

+ Luật cập nhật trọng số được thực hiện theo biểu thức

w t ij( + = 1) w t ij( ) + η [ ( )d t i −y t x t) i( )] ( (2.9)

Trong đó η là tốc độ học; d t i( ) là ngõ ra mong muốn thứ i

Có nhiều thuật toán huấn luyện cho mạng nơ ron một lớp như thuật toán Perceptron, thuật toán Widrow-Hoff Nhưng thuật toán Widrow-Hoff hay được sử dụng hơn, thuật toán này tính toán sai lệch giữa ngõ ra mong muốn

với ngõ ra thực sự của mạng Δ = d(t) − y(t) với d(t) là ngõ ra mong muốn của

mạng và y(t) là ngõ ra của mạng Sau đó luật cập nhật trọng số của mạng được tính theo (2.9)

2.1.3.2 Perceptron nhiều lớp (mạng MLP)

1

z

Đã có nhiều công trình trình bày nhiều thuật học cho mạng MLP và chỉ

rõ sức mạnh của những lớp mô hình này Cần nhắc tới là thuật toán lan truyền ngược (the Back-Propagation Learning Algorithm) và khả năng xấp xỉ hàm liên tục bằng mạng MLP

9

v

Hình 2.5 Mạng nơron nhiều lớp ( mạng MLP)

Trang 14

Thuật toán lan truyền ngược cụ thể như sau: Tập dữ liệu đã cho có N mẫu (xn, dn), n = 1,2, … , N Với mỗi n, xn là tín hiệu đầu vào, dn là đầu ra mong muốn Quá trình huấn luyện thực chất là làm cực tiểu hàm G với

G = , với Gn =

1

N n n

Mạng truyền thẳng nhiều lớp được sử dụng để biểu diễn chính xác và biểu diễn xấp xỉ các hàm phi tuyến Một công cụ cơ bản là sử dụng định lý kolmogorov như sau:

Gọi In là khối n chiều của đoạn [0,1], In =[0 Bất kỳ hàm liên tục f(x1, x2…., xn) nào của n biến x1, x2…., xn trên In đều có thể biểu diễn dưới dạng

2.1.3.3 Mạng nơron với hàm cơ sở xuyên tâm (Mạng RBF)

Hàm cơ sở xuyên tâm đã có từ lâu trong lý thuyết xấp xỉ và được sử dụng để xấp xỉ hàm chưa biết dựa trên cơ sở các cặp điểm vào- ra biểu diễn hàm chưa biết đó

Trong nhận dạng mô hình hệ thống RBF có thể biểu diễn theo cấu trúc mạng perceptron Mọi hệ phi tuyến có thể xấp xỉ bằng RBF Đây là đặc điểm làm cho RBF đặc biệt phù hợp với bài toán nhận dạng mô hình

Trang 15

Đối với mỗi hàm, việc xấp xỉ được lưu giữ trong các trọng số và tâm của RBF Tuy nhiên các trọng số này không phải là duy nhất RBF có biểu diễn toán học như sau:

C – véc tơ chứa trọng số RBF

R – véc tơ chứa các tâm RBF

ϕ - hàm cơ sở hoặc hàm kích hoạt của mạng

F(x) - hàm nhận được từ đầu ra của mạng

C0 hệ số chệch (có thể là 0)

|| || - chuẩn euclidean

Mỗi tâm R j có cùng số chiều với véc tơ đầu vào Các tâm cũng là các điểm bên trong không gian giữ liệu đầu vào và được chọn sao cho chúng là thể hiện của dữ liệu đầu vào Khi RBF tính toán quá trình xấp xỉ đối với một

số điểm dữ liệu đầu vào thì khoảng cách giữa các điểm đầu vào và mỗi tâm được tính theo khoảng cách euclidean Những khoảng cách này được chuyển qua ϕ sau đó được trọng số hóa bằng Ci và được tổng hợp lại để sinh ra toàn

bộ RBF Một trong những lựa chọn thông thường nhất là hàm Gauss:

( ) exp( ( )2)

2

x a x

ϕ

σ

−

= − (2.13) Trong đó σ là tham số tỷ lệ

Mạng RBF được Moody và Darken đề xuất năm 1989 dựa trên sự tương đồng giữa triển khai hàm cơ sở xuyên tâm và mạng nơ ron một lớp ẩn

Nhờ khả năng xấp xỉ các hàm phi tuyến bất kỳ với độ chính xác tùy ý, mạng nơron và sau này là hệ mờ nơron sẽ là công cụ quan trọng, đặc biệt là mạng

Trang 16

RBF, cho mô hình hóa hệ thống và cho điều khiển thích nghi các hệ thống phi tuyến

+ Chọn một vài giá trị khởi đầu nhỏ cho tốc độ học η (0)

η ( )t = η (t− 1) nếu ngoài các điều kiện trên

Tuy nhiên rất khó chọn các giá trị a,b Nếu chọn các giá trị này nhỏ thì khả năng thích nghi chậm, nếu chọn giá trị lớn thì gây nguy hiểm cho quá trình học

2.1.4 Mạng nơ ron trong các hệ thống điều khiển

Mạng nơ ron được sử dụng trong các hệ thống điều khiển có ưu điểm là chúng có khả năng học xấp xỉ bất kỳ một hàm phi tuyến nào, cho dù hàm đó

có bậc cao, với độ chính xác có thể đạt như ý muốn Có bốn cấu hình chuẩn của mạng nơ ron được đưa ra để ứng dụng cho các hệ thống điều khiển: sao chép từ một bộ điều khiển sẵn có, nhận dạng hệ thống, nhận dạng hệ thống đảo và điều khiển các đối tượng phi tuyến sử dụng mạng nơ ron

Trang 17

2.1.4.1 Cấu hình sao chép từ một bộ điều khiển sẵn có

Nếu một bộ điều khiển có khả năng điều khiển đối tượng thì thông tin được yêu cầu để huấn luyện một mạng nơ ron có thể được thu thập từ bộ điều khiển này Đầu ra mong muốn của mạng là đầu ra của bộ điều khiển sẵn có,

và đầu vào của mạng là đầu ra của đối tượng Mục tiêu của ứng dụng này là

để sao chép lại thông tin từ một bộ điều khiển sẵn có

Hệ thống

Bộ điều khiển

y(k) y(d)

Hình 2.6 Cấu hình sao chép từ một bộ điều khiển sẵn có

2.1.4.2 Cấu hình nhận dạng hệ thống

Dữ liệu huấn luyện mạng có thể được thu thập bằng cách giám sát cặp vào ra của đối tượng mạng nhận cùng đầu vào với đối tượng, còn đầu ra của đối tượng là đầu ra mong muốn của mạng

Trang 18

Hệ thống Y(d)

Y(k)

Hình 2.8 Cấu hình hệ thống nhận dạng đảo

Trang 19

2.1.4.4 Điều khiển các đối tượng phi tuyến sử dụng mạng nơ ron

Các phương pháp điều khiển đối tượng phi tuyến sử dụng các mạng nơ ron thường được sử dụng là phương pháp điều khiển thích nghi trực tiếp (direct adaptive control), phương pháp điều khiển thích nghi gián tiếp ( indirect adaptive control), phương pháp điều khiển tối ưu, Fuzzy… trong nội dung chương bốn của luận văn ta sẽ nghiên cứu kỹ về phương pháp nhận dạng sử dụng mô hình nơ ron thích nghi NARX

2.1.5 Mô hình nơ ron thích nghi NARX

Mạng nơ ron có thể phân thành 2 loại đó là mạng động (NNARX) và mạng tĩnh (ANN) Mạng tĩnh không có phần tử phản hồi và không bao gồm sự chậm trễ, các đầu ra là tính toán trực tiếp từ các đầu vào thông qua kết nối truyền thẳng Mạng động, các đầu ra không những phụ thuộc vào đầu vào hiện tại của mạng mà còn phụ thuộc vào hướng hay đầu vào trước đó, đầu ra hay trạng thái của mạng Mạng động hầu hết mạnh hơn nhiều so với mạng tĩnh (mặc dù hơi khó khăn hơn trong việc huấn luyện) Bởi vì mạng động có bộ nhớ, chúng có thể được đào tạo để học liên tiếp hoặc thay đổi thời gian mô hình

Mô hình này có một thành phần tham số cộng với một phần phi tuyến, nơi mà một phần phi tuyến là xấp xỉ bởi một lớp ẩn truyền thẳng ANN Các mạng (NNARX) là mạng năng động hiện nay, với các kết nối thông tin phản hồi kín vài lớp của mạng Mô hình NNARX dựa trên mô hình tuyến tính ARX,

nó thường được sử dụng trong mô hình chuỗi thời gian

Phương trình xác định cho mô hình NNARX như sau:

( ) ( ( 1), ( 2), ( y), ( 1), ( 2), ( u))

y t = f y t− y t− y t n− u t− u t− u t n− (2.15)

Trường hợp, giá trị kế tiếp phụ thuộc vào tín hiệu đầu ra y (t) là quay trở lại giá trị trước đó của tín hiệu đầu ra và giá trị trước đó của một tín hiệu đầu vào độc lập (ngoại sinh) Đầu ra là phản hồi trở lại đầu vào của mạng

Trang 20

truyền thẳng, như phần mẫu cấu trúc NNARX được biểu diễn ở hình 2.9 a Bởi vì đầu ra thực là có được trong việc huấn luyện mạng, chúng ta có thể tạo ra một dãy cấu trúc song song ở hình 2.9 b, trong đó đầu ra thực được sử dụng thay cho phản hồi đầu ra ước lượng Điều này có hai ưu điểm Đầu tiên là đầu vào cho mạng truyền thẳng là chính xác hơn Thứ hai là kết quả cấu trúc mạng đã hoàn truyền thẳng, cấu trúc và lan truyền ngược tĩnh có thể được sử dụng cho huấn luyện

Mạng động là huấn luyện giống như thuật toán suy giảm độ dốc được

sử dụng trong "lan truyền ngược." Mặc dù chúng có thể được đào tạo bằng cách sử dụng các thuật toán dựa trên suy giảm độ dốc cũng được sử dụng cho các mạng tĩnh, hiệu quả của các thuật toán trên mạng động có thể khá khác nhau, và độ dốc phải được tính toán một cách phức tạp hơn

a) Cấu trúc song song b) Dãy cấu trúc song song

Hình 2.9 Mạng truyền thẳng

u(t) u(t)

Mạng truyền thẳng

T

D L

Hình 2.10 Sơ đồ cấu trúc nơ ron thích nghi NARX

Trang 21

Một sơ đồ kết quả của mạng được hiển thị bằng hình 2.10, nơi mà một mạng truyền thẳng hai lớp được sử dụng để ước lượng

Đây là loại trọng số của mạng có hai tác động khác nhau trên đầu ra mạng Đầu tiên là tác động trực tiếp, vì một sự thay đổi trong trọng số gây ra một thay đổi ngay lập tức trong đầu ra ở các bước thời gian hiện tại (đây là hiệu quả đầu tiên có thể được tính bằng cách sử dụng tiêu chuẩn lan truyền ngược) Thứ hai là tác động gián tiếp, bởi vì một số đầu vào tới các lớp, chẳng hạn như a(t, 1), cũng là hàm của các trọng số Để giải thích cho tác động gián tiếp, chúng ta phải sử dụng mạng lan truyền ngược động để tính toán độ dốc

Mạng lan truyền ngược động có nhiều thời gian hơn để huấn luyện, ngoài ra, sai số ngoài cho mạng động có thể phức tạp hơn so với mạng tĩnh Huấn luyện có nhiều khả năng bị mắc kẹt tại cực tiểu địa phương Điều này cho thấy chúng ta có thể cần phải huấn luyện mạng nhiều lần để đạt được một kết quả tối ưu

2.2 Kết luận

Qua nội dung lý thuyết đã trình bày, ta có thể nhận thấy rõ nét những ưu nhược điểm của mạng nơ ron là:

+ Ưu điểm:

• Tính phi tuyến (nonlinearity)

• Mô hình tổng quát cho ánh xạ từ tập vào đến tập ra (input-output mapping): Nonparametric models

• Tính thích ứng (adaptivity): training, online-training, nonstationary environments

• Chấp nhận lỗi (Fault Tolerance)

• Thích ứng với nhiễu dữ liệu (noise)

• Khả năng song song: Parallelism, VLSI implementation

Trang 22

Bên cạnh đó, giải pháp nhận dạng sử dụng mô hình nơ-ron thích nghi NARX

là chiến lược nhận dạng được sử dụng cho các đối tượng phi tuyến Mô hình nhận dạng sử dụng mô hình nơ ron thích nghi NARX ghi lại các chuyển động tại các thời điểm rời rạc trong một phạm vi dự kiến nhất định Dựa vào đáp ứng dự kiến này để tính toán chuỗi tín hiệu vào ra tương lai trong phạm vi nhận dạng sao cho sai lệch giữa đáp ứng dự báo bởi mô hình và tín hiệu tham chiếu cho trước là tối thiểu

Kết hợp những ưu điểm nổi trội của mạng nơ-ron và phương pháp sử dụng

mô hình nơ-ron thích nghi NARX, trong chương tiếp theo, học viên trình bày một số vấn đề về xây dựng mô hình động học thuận, ngược kinh điển theo quy tắc D_H Những nội dung này là công cụ lý thuyết để giải bài nhận dạng cho hệ phi tuyến và áp dụng cụ thể vào hệ tay máy 3 bậc được đề cập trong chương 4

Trang 23

CHƯƠNG 3: XÂY DỰNG MÔ HÌNH ĐỘNG

HỌC THUẬN VÀ NGƯỢC KINH ĐIỂN CỦA

TAY MÁY BA BẬC THEO QUY TẮC D_H

3.2 Xây dựng mô hình động học thuận và ngược kinh điển theo quy tắc D_H

3.2.1 Cơ sở động học về Robot

3.2.1.1 Vị trí và hướng của vật rắn trong không gian

Xét vật rắn B trong hệ quy chiếu cố định Ox0y0z0 (hình 3.1) Lấy A là một điểm nào đó thuộc vật rắn B Gắn chặt vào vật rắn B hệ quy chiếu động Axyz

Hệ tọa độ Ox0y0z0 được dùng làm hệ tọa độ gốc, hệ tọa độ Axyz gọi là hệ tọa

độ vật Ký hiệu eJG1(0), eJJG2(0), eJG3(0) là các vectơ đơn vị trên hệ trục Ox0y0z0, eJG1, eJJG2,

là các vectơ đơn vị trên hệ trục Axyz

3

eJG

Trang 24

Vị trí của vật rắn B đối với hệ quy chiếu cố định Ox0y0z0 được xác định bởi vị trí của hệ quy chiếu Axyz đối với hệ quy chiếu Ox0y0z0, tức là được xác định bởi vị trí của điểm A và hướng của hệ tọa độ Axyz so với hệ tọa độ

Ox0y0z0

Hình 3.1 Vị trí và hướng của vật rắn trong không gian

Vị trí của điểm A được xác định thông qua vectơ:

2 1 2 2 2 3 21 22 23 (0) (0) (0)

Trang 25

Từ định nghĩa trên trong hệ quy chiếu Ox0y0z0 ta có các hệ thức liên hệ:

Ma trận quay cơ bản của phép quay quanh các trục x0, y0, z0:

Trang 26

- Biểu diễn hướng giữa 2 hệ tọa độ, trong đó các cột của ma trận là cosin chỉ phương giữa các trục của hệ mới so với hệ gốc

- Biểu diễn sự chuyển đổi tọa độ của một vectơ giữa 2 hệ tọa độ có gốc trùng nhau

- Là toán tử biểu diễn phép quay của một vectơ trong cùng một hệ tọa

Trang 27

R = 0

1

R 1 2

- Quay vật (đang trùng phương với hệ Ox0y0z0) theo 0

1

R để nó trùng phương với hệ Ox1y1z1

- Tiếp tục quay vật (hiện đã trùng phương với hệ Ox1y1z1) theo 1

2

R để

nó trùng phương với hệ Ox2y2z2

b) Phép quay quanh trục bất kỳ

Trường hợp thường xuyên gặp phải trong nghiên cứu động học tay máy

là mô tả phép quay một vật quanh trục bất kỳ

Hình 3.3 Phép quay quanh một trục bất kỳ

Trang 28

Giả sử r = [rx ry rz] là vectơ đơn vị trong hệ Oxyz của trục quay Ma

trận quay R(r,φ) mô tả phép quay quanh trục r một góc φ được xác định bằng

cách tổ hợp các ma trận quay theo các trục tọa độ gốc Góc φ được quy ước là

dương nếu chiều quay ngược kim đồng hồ

Một trong những cách tổ hợp có thể như sau:

- Làm trùng vectơ r với trục z bằng cách quay r một góc -α quanh trục

z sau đó là -β quanh trục y

- Quay góc φ quanh trục z

- Quay trả góc β quanh y rồi α quanh z

Mô tả bằng ma trận quay các phép quay trên như sau:

Trang 29

3.2.1.3 Mô tả tối thiểu của hướng

Ma trận quay dùng để mô tả hướng của vật có 9 thành phần, nhưng các thành phần này không hoàn toàn độc lập với nhau Do ma trận quay là ma trận trực giao nên có 6 điều kiện ràng buộc Như vậy, để mô tả phép quay (định hướng) chỉ cần dùng 3 tham số độc lập Việc dùng 3 tham số độc lập để mô tả hướng được gọi là mô tả tối thiểu Có thể dùng các bộ ba tham số khác nhau, nhưng thường dùng nhất là góc Euler và góc RPY

1) Góc Euler

Góc Euler được hình thành bằng cách tổ hợp các thành phần của ma trận quay hệ tọa độ hiện thời Tùy theo kiểu tổ hợp ma trận quay, có 12 bộ góc Euler khác nhau Sau đây là một kiểu, gọi là kiểu ZYX

Giả sử (ϕ θ ψ) là một tổ hợp của góc Euler Phép quay tương ứng với nó được hình thành theo thứ tự sau (Hình 3.4):

Hình 3.4 Góc quay Euler

Trang 30

- Quay hệ tọa độ một góc ϕ quanh z, tương ứng ma trận quay R(z, ϕ)

- Quay tiếp hệ tọa độ hiện thời góc θ quanh y’, tương ứng R(y’, θ)

- Quay tiếp hệ tọa độ hiện thời góc ψ quanh z’’, tương ứng R(z’’, ψ) Hướng của hệ tọa độ cuối cùng là kết quả của sự tổ hợp các phép quay trong hệ tọa độ hiện thời Ở phép quay Euler nếu thực hiện thứ tự ngược lại (ψ → θ → ϕ) cũng cho kết quả như nhau

z Roll là chuyển động lác của thân tàu Pitch là sự bồng bềnh Yaw là sự lệch hướng

Trang 31

Z Roll

Phép quay tương ứng với góc RPY được thực hiện theo trình tự sau:

- Quay hệ tọa độ gốc một góc ϕ quanh trục z Phép quay này được mô

Trang 32

π πθ

r= σx σy σz (3.15) Trong kỹ thuật người ta thường chọn σ = 1 Khi đó tọa độ thuần nhất bốn chiều của điểm P được mở rộng từ các tọa độ vật 1 Ba chiều của điểm P bằng cách thêm vào đại lượng thứ tự như sau:

Trang 33

2) Ma trận biến đổi tọa độ thuần nhất

Xét vật rắn B chuyển động trong hệ quy chiếu cố định Ox0y0z0 (Hình 3.7) Lấy một điểm A nào đó của vật rắn B và gắn chặt vào vật rắn hệ quy chiếu Axyz Lấy P là một điểm bất kỳ thuộc vật rắn B

21 22 23 (0) (0)

Trong đó R là ma trận cosin chỉ hướng của vật rắn B; sx, sy, sz là tọa độ của vectơ sJJJGAP trong hệ quy chiếu Axyz Nếu sử dụng các tọa độ thuần nhất có thể viết dưới dạng:

(0) (0)

11 12 13 (0) (0)

21 22 23 (0) (0)

e→ X

Y Z

(0) 1

e→

A

r→

A

Trang 34

Định ma trận chuyển tọa độ thuần nhất của điểm P từ hệ Axyz sang hệ

Các ma trận quay cơ bản trong mục ma trận cosin chỉ hướng mở rộng

ra trong hệ tọa độ thuần nhất bốn chiều dạng như sau:

0 0 1

0 0 0 1

a b Trans a b c

Trang 35

Nhờ 4 ma trận cơ bản này có thể biểu diễn chuyển động bất kỳ của một vật trong không gian

3.2.2 Biểu diễn Denavit _Hartenbergh

Các phương trình động học sử dụng ma trận đại số để xây dựng các hàm quan hệ giữa các biến khớp và phần lớn vị trí tọa độ của cơ cấu chấp hành cuối (vị trí và hướng) dựa trên không gian cấu hình của một tay máy cụ thể Một cách tiếp cận có hệ thống và tổng quát để mô tả các phương trình động học của một chuỗi liên kết tay máy đã được đề xuất bởi Denavit _Hartenbergh (D_H) [3.25] Điều này giống như phép quay và tịnh tiến của

hệ tọa độ quy chiếu cố định tới một liên kết đối với hệ tọa độ quy chiếu chuẩn bằng một ma trận biến đổi đồng nhất Nó là một ma trận 4x4 trong đó, ma trận quay 3x3, là ma trận trực giao biểu diễn hướng của cơ cấu chấp hành cuối đối với hệ tọa độ cơ bản, được sử dụng để mô tả các hoạt động phép quay Vector 3x1 biểu diễn mối quan hệ tọa độ vị trí của gốc hệ tọa độ gắn trên cơ cấu chấp hành cuối đối với hệ tọa độ cơ bản Ma trận biến đổi hệ tọa độ đồng nhất i1

i

A− giữa hệ tọa độ quy chiếu kế tiếp có thể được biểu diễn

dễ dàng bằng cách:

Trang 36

1

αi là góc giữa zi-1 và zi đối với xi

di là khoảng cách giữa gốc tọa độ Oi-1 và giao điểm của trục zi-1 với trục xi dọc theo zi-1 (hoặc khoảng cách giữa các xi-1 và xi nếu nó song song)

θi là góc giữa xi-1 và xi đối với zi-1

ai là khoảng cách giữa gốc tọa độ Oi và các giao điểm của trục zi-1 với trục xidọc theo xi (hoặc khoảng cách giữa zi-1 và zi nếu nó song song)

Hình 3.8 Cấu trúc thông số động học đối với i khâu đầy đủ

Nếu một vị trí vector pi được xác định trong hệ tọa độ quy chiếu thứ i, sau đó nó có thể được biểu diễn trong hệ tọa độ thứ ( 1)i− như vector pi-1 bằng cách:

1 i1 i (3.27)

p− =A p−

Trang 37

Vì vậy, sự phối hợp ma trận biến đổi ánh xạ một vector vị trí biểu diễn trong tọa độ đồng nhất từ một hệ tọa độ này đến một hệ tọa độ khác Kết quả

là, thông qua một chuyển đổi liên tiếp, nó đạt được bằng cách nhân một loạt các tọa độ ma trận biến đổi, hệ tọa độ quy chiếu gắn với cơ cấu chấp hành cuối có thể được biến đổi và biểu diễn trong hệ tọa độ cơ bản Nói chung, ma trận biến đổi đồng nhất từ hệ tọa độ quy chiếu thứ n đến hệ tọa độ quy chiếu

cơ bản có thể được xác định bằng cách nhân i1

Do đó, nếu một vector pn là đã biết trong hệ tọa độ quy chiếu thứ n, nó

có thể được xác định đối với hệ tọa độ cơ bản bằng:

Trang 38

3.2.2.1 Bài toán thuận Denavit _ Hartenberg matrix

Bài toán thuận nhằm mô tả vị trí và hướng của phần công tác dưới dạng hàm số của các biến khớp Một trong những phương pháp giải bài toán thuận

là dùng trực tiếp hình học giải tích Tuy nhiên phương pháp tính toán trực tiếp này chỉ áp dụng được cho các cơ cấu đơn giản Để có thể giải các bài toán tổng quát cần một thuật giải chung Một trong những thuật giải như vậy xuất phát từ quy tắc Denavit_Hartenberg, được Denavit và Hartenberg xây dựng vào năm 1955 Đó là quy tắc thiết lập hệ thống tọa độ trên các cặp khâu – khớp trên tay máy Dựa trên hệ thống tọa độ này có thể mô tả các cặp khâu – khớp bằng hệ thống các tham số, biến khớp

Xét mô hình robot gồm có n khâu Các khâu được đánh số tăng dần từ khâu cơ sở (khâu 0) đến khâu thứ i Khớp thứ i nối giữa khâu i-1 và khâu i, là khớp quay hoặc khớp tịnh tiến Mỗi khớp chỉ có một bậc tự do

Theo Denavit _Hartenberg tại mỗi khớp ta gắn một hệ trục tọa độ, quy ước về cách đặt tọa độ này như sau:

- Trục zi được chọn dọc theo hướng của trục khớp thứ i+1 Chiều của zi

được chọn tùy ý

- Trục xi được xác định là đường vuông góc chung giữa trục khớp i và khớp i+1, hướng từ điểm trục của khớp i tới khớp i+1 Nếu hai trục song song thì xi có thể chọn bất kỳ là đường vuông góc chung hai trục khớp Trong trường hợp hai trục này cắt nhau, xi được xác định theo chiều của zixzi+1 (hoặc quy tắc bàn tay phải)

- Gốc tọa độ Oi-1 được chọn tại giao điểm của trục xi-1 và trục zi-1

- Trục yi được xác định theo xi và zi theo quy tắc bàn tay phải

Bốn thông số Denavit _Hartenberg liên hệ giữa phép biến đổi của hai

hệ trục tọa độ liên tiếp được xác định như sau:

- θi: góc xoay đưa trục xi-1 về xi quanh zi-1 theo quy tắc bàn tay phải

Trang 39

- di: dịch chuyển dọc trục zi-1 đưa gốc tọa độ về nằm trên trục zi

- αi: góc xoay đưa trục zi-1 về zi quanh xi-1 theo quy tắc bàn tay phải

- ai: dịch chuyển dọc trục xi-1 đưa gốc tọa độ về nằm trên trục xi

Ma trận của phép biến đổi, ký hiệu là i1

i

A− là tích của bốn ma trận biến đổi cơ bản và có dạng:

1

- Nếu là khớp tịnh tiến thì di sẽ là biến khớp

- Nếu là khớp quay thì θi sẽ là biến khớp

Có thể biểu diễn ma trận thuần nhất dưới dạng

1 1 1

- i1

i

R− là ma trận cosin (3x3) chỉ hướng của hệ tọa độ n đối với hệ tọa độ i-1

- i1 là vectơ (3x1) chỉ vị trí gốc hệ tọa độ n đối với hệ tọa độ i-1

i

P−

Phương trình xác định vị trí bàn kẹp của robot được tính theo (3.28) và (3.29):

Trang 40

3.2.2.2 Bài toán động học ngược Denavit _Hartenberg matrix

Nội dung của bài toán động học ngược là xác định giá trị của biến khớp nếu biết hướng và vị trí của bàn kẹp Bài toán động học ngược được đặc biệt quan tâm vì lời giải của nó là cơ sở chủ yếu để xây dựng chương trình điều khiển chuyển động của Robot bám theo quỹ đạo cho trước Có nhiều công trình nghiên cứu tìm lời giải cho bài toán này Đối với trường hợp n > 6 thì hầu như chỉ có lời giải theo phương pháp số đối với một số loại robot cụ thể nào đó, nhưng chưa có một phương pháp chung nào có hiệu quả Bản thân việc giải bài toán động học ngược bằng phương pháp số nhiều khi đòi hỏi thời gian tính toán kéo dài, thậm chí không đi đến lời giải Sở dĩ như vậy là vì thường gặp các hệ phương trình siêu việt không phải lúc nào cũng có độ hội

tụ lời giải Điều đó ảnh hưởng lớn đến việc đảm bảo thời gian thực trong điều khiển robot

Đối với trường hợp n = 6, là trường hợp thường gặp trong thực tế công nghiệp nên có nhiều công trình nghiên cứu hơn Tuy nhiên, ở đây các lời giải tìm được hầu như chỉ cho trường hợp riêng, có đặc điểm hình động học riêng biệt được tận dụng để thiết lập các quan hệ cần thiết khi thiết lập lời giải

Xuất phát từ phương trình xác định vị trí bàn kẹp của Robot (3.46)

0

0 0 0

Định dạng
Số trang	121
Dung lượng	1,47 MB