Nghiên cứu, thiết kế thay thế bộ điều khiển mô hình cánh tay Robot tại phòng thí nghiệm của trường Đại học Kỹ thuật Công nghiệp Thái Nguyên

Các phương pháp này ít nhiều cũng đã giải quyết được những khó khăn khi điều khiển robot như hệ có cấu trúc phi tuyến, tham số bất định, thay đổi, ảnh hưởng bởi nhiễu…Với luận văn này tá

Trang 1

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP

TRẦN QUẾ SƠN

NGHIÊN CỨU, THIẾT KẾ THAY THẾ BỘ ĐIỀU KHIỂN

MÔ HÌNH CÁNH TAY ROBOT TẠI PHÕNG THÍ NGHIỆM CỦA TRƯỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP THÁI

NGUYÊN

LUẬN VĂN THẠC SĨ KỸ THUẬT

CHUYÊN NGÀNH KỸ THUẬT ĐIỆN TỬ

Thái Nguyên - 2015

Trang 2

LỜI CAM ĐOAN

Tên tôi là: Trần Quế Sơn

Sinh ngày07 tháng05 năm 1986

Học viên lớp cao học khoá 14–Kỹ thuật điện tử - Trường đại học kỹ thuật Công nghiệp Thái Nguyên

Hiện đang công tác tại Trường đại học kỹ thuật Công nghiệp Thái Nguyên Xin cam đoan luận văn “Nghiên cứu, thiết kế thay thế bộ điều khiển mô hình cánh tay robot tại phòng thí nghiệm của trường ĐH KTCN” do thầy giáo

PGS.TS Nguyễn Thanh Hà hướng dẫn là công trình nghiên cứu của riêng tôi Tất cả

các tài liệu tham khảo đều có nguồn gốc, xuất xứ rõ ràng

Tác giả xin cam đoan tất cả những nội dung trong luận văn đúng như nội dung trong đề cương và yêu cầu của thầy giáo hướng dẫn Nếu có vấn đề gì trong nội dung của luận văn tác giả xin hoàn toàn chịu trách nhiệm với lời cam đoan của mình

Thái Nguyên, ngày tháng năm 2015

Học viên

Trần Quế Sơn

Trang 3

LỜI CẢM ƠN

Sau thời gian nghiên cứu, làm việc khẩn trương và được sự hướng dẫn tận

tình giúp đỡ của thầy giáo PGS.TS Nguyễn Thanh Hà, luận văn với đề tài “Nghiên cứu, thiết kế thay thế bộ điều khiển mô hình cánh tay robot tại phòng thí nghiệm của trường ĐH KTCN” đã được hoàn thành

Tác giả xin bày tỏ lòng biết ơn sâu sắc tới:

Thầy giáo hướng dẫn PGS.TS Nguyễn Thanh Hà đã tận tình chỉ dẫn, giúp

đỡ tác giả hoàn thành luận văn

Thầy giáoPGS.TS.Nguyễn Duy Cương – Bộ môn Kỹ thuật điện tử - Khoa

Điện tử, cùng các giáo viên Trường Đại học kỹ thuật công nghiệp Thái Nguyên và một số đồng nghiệp, đã quan tâm động viên, giúp đỡ tác giả trong suốt quá trình học tập để hoàn thành luận văn này

Mặc dù đã cố gắng hết sức, song do hạn chế về điều kiện thời gian và kinh nghiệm thực tế của bản thân còn ít nên đề tài không thể tránh khỏi thiếu sót Vì vậy, tác giả mong nhận được sự đóng góp ý kiến của các thầy giáo, cô giáo và các bạn bè đồng nghiệp

Tôi xin chân thành cảm ơn!

Trang 4

MỤC LỤC

LỜI CAM ĐOAN i

LỜI CẢM ƠN iii

DANH MỤC CÁC KÝ HIỆU VIẾT TẮT vi

DANH MỤC HÌNH VẼ vii

LỜI NÓI ĐẦU ix

CHƯƠNG 1 10

TỔNG QUAN VỀ PID, LEARNING FEED FORWARD CONTROL (LFFC) VÀ MODEL REFERENCE ADAPTIVE SYSTEMS (MRAS), BỘ ĐIỀU KHIỂN PID CHO MÔ HÌNH CÁNH TAY ROBOT RD5NT 10

1.1 Tổng quan về PID 10

1.2 Tổng quan về Learning Feed-forward Control (LFFC) 12

1.2.1 Điều khiển học (Learning Control - LC) 12

1.2.2 Bộ điều khiển học sử dụng sai lệch phản hồi (Feedback Error Learning - FEL) 16

1.2.3 Learning Feed forward Control (LFFC) 21

1.3 Lý thuyết điều khiển thích nghi theo mô hình mẫu (MRAS) 21

1.3.1 Lịch sử phát triển của hệ điều khiển thích nghi 21

1.3.2 Khái quát về hệ điều khiển thích nghi 23

1.3.3 Cơ chế thích nghi – thiết kế bộ điều khiển thích nghi dựa vào luật MIT 28

1.3.4 Phương pháp độ nhạy 30

1.3.5 Phương pháp ổn định của Liapunov 32

1.4 Bộ điều khiển LFFC trên cơ sở MRAS 35

1.4.1 Khái niệm chung 36

1.4.2 MRAS dựa trên điều khiển feed - forward 37

1.4.3 Luật điều khiển thích nghi 39

CHƯƠNG 2 46

CÁC KHÁI NIỆM CƠ BẢN, CƠ SỞ MÔ HÌNH TOÁN, PHƯƠNG TRÌNH ĐỘNG LỰC HỌC CỦA CÁNH TAY ROBOT HAI BẬC TỰ DO, THIẾT KẾ VÀ MÔ PHỎNG HỆ THỐNG 46

2.1 Cấu tạo của Robot công nghiệp 46

2.2 Tay máy 47

2.3 Bậc tự do của tay máy 48

2.4 Phương trình động học của robot hai bậc tự do 50

2.5 Thiết kế hệ thống điều khiển 53

2.5.1 Chọn mô hình mẫu 53

2.5.2 Xác định đầu vào của phần feed – forward 54

2.5.3 Xác định cấu trúc của phần feed – forward 55

2.5.4 Giải phương trình Lyapunov 56

2.5.5 Chọn hệ số thích nghi 57

2.5.6 Huấn luyện LFFC 57

2.6 Mô phỏng hệ thống 58

CHƯƠNG 3 60

Trang 5

KẾT QUẢ THỰC NGHIỆM VÀ KẾT LUẬN 60

3.1 Sơ đồ khối hệ thống: 60

3.2 Sơ đồ kết nối phần cứng 61

3.2.1 Giới thiệu tổng quan các khối trong hệ thống thực nghiệm 62

3.3 Kết quả thực nghiệm 67

Kết quả thực nghiệm được tiến hành trên robot RD5NT tại Phòng thí nghiệm Điện – Điện tử của Khoa điện tử - Trường ĐH Kỹ thuật công nghiệp Thái Nguyên 67

3.4 Kết luận và hướng phát triển của đề tài 70

TÀI LIỆU THAM KHẢO 71

Trang 6

DANH MỤC CÁC KÝ HIỆU VIẾT TẮT

LFFC: Learning FeedForward Control

MRAS: Model Reference Adaptive System

a m : Tham số của bộ điều khiển thích nghi

b m : Tham số của bộ điều khiển thích nghi

c m : Tham số của bộ điều khiển thích nghi

d m : Tham số của bộ điều khiển thích nghi

: Vecto góc của khớp nối

M(): ma trận mô men quán tính

C():mô hình lực coriolis và quán tính ly tâm

A p1 : Mô hình phụ thuộc vào mô hình của khớp 1

A p2 : Mô hình phụ thuộc vào mô hình của khớp 2

α a : Tham số của bộ điều khiển thích nghi

α b : Tham số của bộ điều khiển thích nghi

α c : Tham số của bộ điều khiển thích nghi

α d : Tham số của bộ điều khiển thích nghi

J 1,2 : Mô men quán tính của 2 khớp 1, 2

Trang 7

DANH MỤC HÌNH VẼ

Hình 1.1: Sơ đồ khối của bộ điều khiển PID với bộ lọc bậc nhất

Hình 1.2: Cực tiểu cục bộ trong kỹ thuật học

Hình 1.3: Cấu trúc bộ điều khiển phản hồi sai lệch

Hình 1.4: Học theo sai số phản hồi

Hình 1.5a: Hệ thích nghi tham số

Hình 1.5b: Hệ thích nghi tín hiệu

Hình 1.6 Điều khiển ở cấp 1 và cấp 2

Hình 1.7: Mô hình đối tượng và mô hình mẫu

Hình 1.8: Hệ thống điều khiển thích nghi dựa trên mô hình độ nhậy

Hình 1.9a: MRAS cho sự thích nghi của các tham số bộ điều khiển

Hình 1.9b: MRAS với mô hình có thể hiệu chỉnh cho nhận dạng tham số

Hình 1.9c: Cấu trúc MRAS với khâu khởi tạo tín hiệu đặt

Hình 1.10: Nhận dạng mô hình ngược của đối tượng

Hình 1.11: Bộ điều khiển LFFC

Hình 2.1 Các thành phần chính của một robot công nghiệp

Hình 2.2 : Mô hình robot 2 bậc tự do

Hình 2.3: Cấu trúc bộ điều khiển phần feed forward

Hình 2.4: Sơ đồ mô phỏng hệ thống điều khiển

Hình 2.5a: Đáp ứng của khớp 1

Hình 2.5b: Đáp ứng của khớp 2

Hình 3.1: Sơ đồ khối hệ thống điều khiển 1 khớp của mô hình

Hình 3.2: Sơ đồ kết nối tổng thể hệ thống thực nghiệm

Hình 3.3: Mô hình robot RD5NT

Hình 3.4: Bộ điều khiển Dspace 1103

Hình 3.5: Giao diện của phần mềm giám sát điều khiển Control Desk

Hình 3.6: Sơ đồ nguyên lý của mạch cầu H sử dụng IC L298

Hình 3.7: Mạch in mạch cầu H điều khiển động cơ

Hình 3.8: Bản vẽ nguyên lý mạch nguồn

Hình 3.9: Sơ đồ mạch in mạch nguồn

Hình 3.10: Hệ thống thực nghiệm được lắp đặt tại Phòng thí nghiệm Điện – Điện tử Hình 3.11a: Đáp ứng thực nghiệm của khớp 1

Trang 8

Hình 3.11b: Đáp ứng thực nghiệm của khớp 2

Trang 9

LỜI NÓI ĐẦU

Ngày nay, trong các dây chuyền sản xuất với mức độ tự động hóa cao, robot công nghiệp đóng vai trò quan trọng trong việc giảm cường độ lao động cho người lao động, tăng năng suất và độ chính xác gia công, giảm giá thành sản phẩm

Mục tiêu ứng dụng của kỹ thuật Robot trong công nghiệp nhằm nâng cao năng suất các dây chuyền công nghệ, nâng cao chất lượng và khả năng cạnh tranh của sản phẩm, đồng thời cải thiện điều kiện lao động Sự cạnh tranh hàng hóa đặt ra một vấn đề thời sự là làm sao để hệ thống tự động hóa sản xuất phải có tính linh hoạt nhằm đáp ứng với sự biến động thường xuyên của thị trường hàng hóa Robot công nghiệp là bộ phận cấu thành không thể thiếu trong hệ thống sản xuất tự động linh hoạt đó

Gần nửa thế kỷ có mặt trong sản xuất Robot công nghiệp đã có một lịch sử phát triển hấp dẫn Ngày nay, Robot công nghiệp được ứng dụng rộng rãi ở nhiều lĩnh vực sản xuất Điều đó xuất phát từ những ưu điểm cơ bản của các loại Robot đã được lựa chọn và đúc kết qua bao nhiêu năm ứng dụng ở nhiều nước.Ở nước ta trước những năm 1990 hầu như chưa du nhập về kỹ thuật Robot Từ năm 1990 nhiều cơ sở công nghiệp đã bắt đầu nhập ngoại nhiều loại Robot thực hiện các nhiệm vụ riêng như tháo lắp dụng cụ cho các trung tâm CNC, lắp ráp các linh kiện điện tử, hàn vỏ xe ô tô, xe máy và phun phủ bề mặt … Có những nơi đã bắt đầu thiết kế, chế tạo và lắp ráp Robot Có thể nói, Robot đang đóng một vai trò hết sức quan trọng trong công cuộc tự động hóa sản xuất

Trong lĩnh vực Robot hiện nay, phần cơ khí (Robot Mechanics), hệ thống Điều khiển (Robot Control) và hệ thống lập trình (Programming system) được coi là các thành phần độc lập và được các nhà sản xuất chào bán độc lập

Trên thế giới nói chung và ở nước ta nói riêng, trong những năm gần đây, các hoạt động nghiên cứu, phát triển về Robot vẫn không ngừng phát triển và có rất nhiều công trình nghiên đưa các phương pháp để điều khiển cánh tay robot Có thể

kể đến ở đây như:

- Nguyễn Văn Minh Trí, Lê Văn Mạnh, “Thiết kế bộ điều khiển PID bền vững cho hệ thống phi tuyến bậc hai nhiều đầu vào – Nhiều đầu ra và ứng dụng trong điều khiển tay máy công nghiệp”, Tạp chí Khoa học và Công nghệ, Đại học

Đà Nẵng , số 4(39).2010

Trang 10

- Nguyễn Manh Hùng, Ngô Thanh Quyền, “Thiết kế bộ điều khiển mờ một đầu vào cho cánh tay robot”, Tạp Chí Đại Học Công Nghiệp, số 9(06).2011

- Nguyễn Manh Hùng, Ngô Thanh Quyền, “Điều khiển bám đuổi mạng neural thích nghi cho cánh tay robot bao gồm động lực học cơ cấu truyền động”

Tạp Chí Đại Học Công Nghiệp, số 9(06).2011

- Asgari, Pouya, Zarafshan, Payam ; Moosavian, S.Ali A.“Dynamics modelling and stable motion control of a Ballbot equipped with a manipulator”,

IEEE Conference Publications - Publication Year: 2013 , Page(s): 259 – 264

- YaoNan Wang, ThanhQuyen Ngo, ThangLong Mai, ChengZhong Wu

“Adaptive Recurrent Wavelet Fuzzy CMAC Tracking Control for De-icing Robot Manipulator”, Proceedings of World Congress on Engineering and Computer

Science 2012 Vol I WCECS 2012, October 24-26, 2012, San Francisco, USA

Các phương pháp này ít nhiều cũng đã giải quyết được những khó khăn khi điều khiển robot như hệ có cấu trúc phi tuyến, tham số bất định, thay đổi, ảnh hưởng bởi nhiễu…Với luận văn này tác giả dự định sẽ áp dụng thuật toán LFFC (Leaning Feedforward Control) dựa trên MRAS (Model Reference Adaptive System) để điều khiển tay máy robto RD5NT với mong muốn bộ điều khiển LFFC

có khả năng tự học sẽ giải quyết được sự ảnh hưởng của tham số bất định và nhiễu đến chất lượng bám quỹ đạo của tay máy robot, cho phép cải thiện hơn nữa chất lượng điều khiển bám quỹ đạo Vì vậy học viên đã chọn đề tài “Nghiên cứu, thiết

kế thay thế bộ điều khiển mô hình cánh tay robot tại phòng thí nghiệm của trường ĐH KTCN” là đề tài nghiên cứu cho luận văn thạc sỹ của mình, trước hết với mục đích thiết kế được bộ điều khiển cho 2 trong 5 bậc cánh tay Robot 5 bậc tự

do RD5NT

Mô hình thí nghiệm Cánh tay Robot 5 bậc tự do, nhãn hiệu RD5NT nói riêng

là một mô hình thí nghiệm trường học, mô hình hóa một cánh tay Robot 5 bậc tự do khá phổ biến trong các dây chuyền sản xuất hiện nay Mô hình Cánh tay Robot 5 bậc tự do RD5NT có 5 khớp, mỗi khớp được hoạt động bởi một động cơ điện một chiều.Sự thành công của phương pháp điều khiển thích nghi bám quỹ đạo cho robot RD5NT sử dụng thuật toán LFFC dựa trên MRAS kỳ vọng mang lại khả năng chống nhiễu tốt, chất lượng bám quỹ đạo được nâng cao Đối tượng của đề tài là robot RD5NT tại phòng thí nghiệm của trường ĐH KTCN với mục tiêu thiết kế bộ điều khiển cho 2 trong 5 bậc của mô hình cánh tay robot từ đó thay thế cho bộ điều khiển cũ, phục vụ cho công tác thí nghiệm của nhà trường

Trang 11

Luận văn bao gồm nội dung chính sau:

Chương 1: Tổng quan về PID,Learning feed forward control (LFFC) và Hệ thống điều khiển thích nghi mô hình mẫu (MRAS), bộ điều khiển PID cho mô hình cánh tay Robot RD5NT

Chương 2: Các khái niệm cơ bản, cơ sở mô hình toán, động lực học của cánh tay robot 2 bậc tự do, thiết kế và mô phỏng hệ thống

Chương 3: Kết quả thực nghiệm và kết luận

Do điều kiện thời gian không cho phép, tác giả chỉ dừng lại ở việc thiết kế bộ điều khiển phối hợp 2 trong 5 khớp của mô hình Tuy nhiên, đề tài này sẽ là cơ sở cho các nghiên cứu về sau có thể xây dựng một bộ điều khiển mà có thể điều khiển phối hợp toàn bộ 5 khớp của mô hình

Thái Nguyên, ngày tháng năm 2015

Học viên

Trần Quế Sơn

Trang 12

CHƯƠNG 1 TỔNG QUAN VỀPID, LEARNING FEED FORWARD CONTROL(LFFC)VÀ MODEL REFERENCE ADAPTIVE SYSTEMS (MRAS), BỘ ĐIỀU KHIỂN PID CHO MÔ HÌNH

CÁNH TAY ROBOT RD5NT

Như chúng ta đã biết, robot là đối tượng có tính phi tuyến mạnh vì vậy cần

có phương pháp để nâng cao độ chính xác về vị trí khi điều khiển cánh tay robot.Trong nội dung chương này, tác giảđề cậpvà phân tích hiệu suất của bộ điều khiển sử dụng thuật toán PID cho mô hình cánh tay robot, đồngthời đề xuất một phương pháp điều khiển mới nhằm cải thiện khả năng bám quỹ đạo của cánh tay robot

1.1 Tổng quan về PID

Thuật toán PID đưa ra tín hiệu điều khiển dựa trên sự tổng hơp của cả ba thành phần: tỉ lệ (P), tích phân (I) và vi phân (D) Chúng có cấu trúc và nguyên lý làm việc đơn giản, có nhiệm vụ đưa sai lệch e(t) của hệ thống về 0 sao cho quá trình quá độ thỏa mãn các yêu cầu cơ bản về chất lượng Do đó bộ điều khiển PID được

sử dụng rộng rãi trong các nghành công nghiệp hiện nay

Bộ điều khiển PID được mô tả dưới phương trình sau:

Trong đó:

: Hệ số khuếch đại bộ điều khiển

: Hằng số tích phân

: Hằng số vi phân

Từ mô hình vào ra ta có hàm truyền đạt của bộ điều khiển:

Tương ứng với hàm truyền đạt:

Trong đó:

: Hệ số khuếch đại tỷ lệ

Trang 13

: Hệ số khuếch đại tích phân

: Hệ số khuếch đại vi phân

Thuật toán PID là sự mở rộng từ thuật toán PI với việc thêm thành phần vi phân nhằm cải thiện đặc tính động học của hệ thống Bản chất của tác động vi phân

là đoán được trước chiều hướng và tốc độ thay đổi của biến được điều khiển và đưa

ra phản ứng thích hợp, do đó có tác dụng làm tăng tốc độ đáp ứng của hệ kín với thay đổi của giá trị đặt hoặc tác động của nhiễu

Bên cạnh đó, quan trọng hơn nữa là sự có mặt của thành phần vi phân giúp cho bộ điều khiển có thể ổn định được một số quá trình mà bình thường không ổn định được với các bộ điều khiển P hoặc PI

Hàm truyền đạt của bộ điều khiển PID cùng với bộ lọc bậc nhất được biểu diễn như sau:

Trong đó:

E: Sai lệch (vị trí hoặc tốc độc)

V: Điện áp

: Hằng số thời gian bộ lọc

Hình 1.1: Sơ đồ khối của bộ điều khiển PID với bộ lọc bậc nhất

Từ sơ đồ khối trên, ta rút ra được các phương trình sau:

Trang 14

Từ các phương trình trên ta có không gian trạng thái của bộ điều khiển PID:

Hệ phương trình này được viết gọn lại như sau:

1.2 Tổng quan về Learning Feed-forward Control (LFFC)

Trong phần này của luận văn, giới thiệu về LFFC, nhưng trước tiên, đề cập một số khái niệm mới

1.2.1 Điều khiển học (Learning Control - LC)

Các bộ điều khiển học LC thường được hình dung giống như là một hệ

thống điều khiển của con người và do đó nó có các thuộc tính giống với con người

Trang 15

Trong luận văn này không nghiên cứu bộ LC theo quan điểm sinh học nhưng dựa trên một số định nghĩa sau:

Định nghĩa 1.1: Một bộ LC là một hệ thống điều khiển bao gồm trong đó

một hàm xấp xỉ các ánh xạ đầu vào – đầu ra tương ứng trong suốt quá trình điều khiển sao cho hoạt động mong muốn của hệ thống điều khiển đạt được

Định nghĩa 1.2 (Hàm xấp xỉ): Một hàm xấp xỉ là một ánh xạ vào/ra được

xác định bởi một hàm được lựa chọn F ., , với các véc tơ thông số  được lựa chọn để hàm F được xấp xỉ tốt nhất

Lưu ý: (Điều khiển tự học và điều khiển thích nghi): Theo hướng này, điều

khiển thích nghi có thể được xem xét giống như là một dạng của LC trong đó một

bộ xấp xỉ hàm được sử dụng có thể chỉ xấp xỉ một lớp giới hạn của hàm mục tiêu

Thông thường, một bộ LC sẽ bao gồm một bộ xấp xỉ hàm cho một đối tượng có

nhiều hàm mục tiêu hơn

Ta có thể sử dụng nhiều kiểu xấp xỉ hàm như mạng neural, mạng neuro – fuzzy v v Nói chung một cách sơ bộ, các bộ xấp xỉ hàm có thể được sử dụng theo

khiển này được gọi là LC gián tiếp

Từ khi bộ LC đầu tiên được phát triển vào năm 1963 cho tới nay, lĩnh vực

LC đã và đang phát triển rất rộng rãi Rất nhiều các cấu trúc của bộ điều khiển khác

nhau đã được đề xuất và các thuộc tính của chúng (như tính ổn định và tốc độ hội tụ

đã được phân tích cả trong thực tế và lý thuyết) Tuy nhiên, mặc dù tất cả chúng đều

được nghiên cứu nhưng chỉ có một số bộ LC được ứng dụng trong sản phẩm mang

tính thương mại Có thể vì những lý do sau đây:

Việc chứng minh sự ổn định được đánh giá cao Phần lớn các nghiên cứu lý thuyết của bộ LC được tập trung vào tính ổn định Tuy nhiên, một bộ LC ổn định cũng không cần thiết mang lại một đáp ứng ngắn hạn học tốt….Hoạt động của bộ

LC đối với một con robot đã được quan sát bằng mô phỏng Sau khi thực hiện với chuyển động 6 bậc tự do, sai số hiệu chỉnh giảm xuống hệ số 2.8 Khi tiếp tục tự

Trang 16

học, sai số hiệu chỉnh lên đến hệ số 1051 tại bước lặp thứ 62.000 và cuối cùng giảm xuống hệ số 10-18 tại bước lặp thứ 250.000 Như vậy, mặc dù thực tế cuối cùng sai

số hiệu chỉnh nhỏ đã đạt được nhưng bộ LC không có giá trị thực nghiệm vì nó có dải sai số hiệu chỉnh rất rộng ở giữa

Không nên quá quan tâm tới sai số hiệu chỉnh điểm 0 Một số LC cố gắng

đạt được sai số hiệu chỉnh điểm 0 Tuy nhiên, điều này yêu cầu có những tín hiệu điều khiển lớn ở những tần số trên băng thông hệ thống, các tần số này có thể gây nguy hiểm cho các cơ cấu chấp hành và nói chung là không đạt được như mong

muốn Loại sai số của hàm xấp xỉ Trong đại đa số các bộ LC, hàm xấp xỉ được thực

hiện với vai trò như một mạng nơ ron (Multi Layer Perceptron – MLP) Như chúng tôi sẽ bàn tới ở dưới đây, loại mạng nơ ron này không tương thích một cách đặc biệt cho việc điều khiển

Trên cơ sở những suy xét này, chúng ta có thể đưa ra một số các thuộc tính

sau mà một bộ LC nên để trở thành một mặt hàng ưa chuộng về mặt thương mại:

Dễ dàng sử dụng trong một hệ thống điều khiển có sẵn Điều này có nghĩa

là khi một đáp ứng ngắn hạn học tốt thì hiệu suất cực tiểu được bảo đảm Ví dụ như

là trong một bộ điều khiển hiện nay Thậm chí trong suốt quá trình huấn luyện đối tượng vẫn có thể được duy trì trong quá trình vận hành mà không gây ra những tổn thất của quá trình sản xuất

Có khả năng sử dụng những kiến thức dự đoán của đối tượng Nói chung các nhà thiết kế và/hoặc người vận hành có một số kiến thức về đối tượng, ví dụ như trong cấu trúc của mô hình toán học( đơn giản) dưới dạng các hàm, một giản đồ Bode của đối tượng hoặc một mô tả dưới dạng biến ngôn ngữ của hành vi đối

tượng Bộ LC nên cho phép loại kiến thức này được kết hợp vào trong thiết kế bộ

điều khiển, để chọn các thông số của bộ điều khiển hợp lý và để tốc độ lệ học

Bộ xấp xỉ hàm nên phù hợp cho việc điều khiển Điều này có nghĩa rằng: Cần sử dụng dung lượng nhớ nhỏ Trong thực tế, bộ điều khiển được thực hiện bằng phần mềm được gắn vào máy tính Dung lượng bộ nhớ là có hạn, do đó

số lượng các thông số của bộ xấp xỉ hàm mà yêu cầu phải xấp xỉ tín hiệu điều khiển không thể quá rộng

Việc tính toán đầu ra của hàm xấp xỉ và sự tương thích của quan hệ vào/ra phải được thực hiện một cách nhanh chóng Trong môi trường thời gian thực, trong một khoảng thời gian lấy mẫu, các thông số của hàm xấp xỉ phải tương ứng

Trang 17

và đầu ra tính được Rất nhiều hệ thống chuyển động cơ điện tử yêu cầu thời gian mẫu nhỏ và cho phép thời gian tính toán là rất ít Các hàm xấp xỉ mà bao gồm một lượng lớn các tính toán phức tạp do đó chúng không phù hợp cho việc điều khiển

Cơ chế học cần hội tụ nhanh Để giữ được lượng thời gian trong đó quá trình vận hành của hệ thống được điều khiển tối ưu từng phần, tiến tới mức cực tiểu, cơ chế học cần hội tụ nhanh

Cơ chế học không nên bị cực tiểu cục bộ, khi bị lưu giữ trong mức cực tiểu cục bộ, thì cơ chế học cho rằng các giá trị đạt được của các thông số của hàm xấp xỉ, được biểu thị bởi loc, sinh ra sai số xấp xỉ cực tiểu, được biểu thị bởi )

( loc

E  Mặc dù glob  loctồn tại, làm cho E( glob) E( loc)

Hình 1.2 Cực tiểu cục bộ trong kỹ thuật học

Trong hình dưới đây một ví dụ theo một chiều của hiện tượng như vậy được giới thiệu Ở mức cực tiểu cục bộ độ   loc, gradient của sai số xấp xỉ bằng 0 Cơ cấu học mà sử chỉ sử dụng gradient của sai số xấp xỉ thì không thể thoát khỏi mức cực tiểu cục bộ

Khi cơ chế học dễ dàng lưu lại ở mức tối thiểu cục bộ, rất khó để huấn

luyện LC để thu được hiệu quả cao Quan hệ vào/ ra phải tương thích một cách cục

bộ Trong một số hàm xấp xỉ, quan hệ vào/ ra này là tương thích toàn cục Điều này

có nghĩa là nếu giá trị của một trong các thông số của hàm xấp xỉ được tương thích,

thì quan hệ vào /ra trên toàn bộ phạm vi đầu vào bị thay đổi Xét một bộ LC được huấn luyện để thực hiện một số chuyển động Khi bộ LC được huấn luyện để thực

hiện một chuyển động mới, điều này liên quan tới việc tương ứng các thông số của hàm xấp xỉ Bởi vì mối quan hệ vào ra được tương thích toàn cục nên các tín hiệu điều khiển học trước đó bị thay đổi có thể gây ra nhưng tổn thất trong quá trình làm

Trang 18

việc Do đó điều mong đợi ở đây là mối quan hệ vào ra của hàm xấp xỉ được tương thích một cách cục bộ Trong trường hợp này, việc học một chuyển động mới sẽ không làm thay đổi các tín hiệu đã được học trước đó

Hàm xấp xỉ có khả năng tự khái quát hoá tốt Khả năng tự khái quát hoá

là khả năng tạo ra một đầu ra nhạy cho một đầu vào không được thể hiện trong quá trình huấn luyện nhưng nó tương tự như các huấn luyện mẫu Khi hàm xấp xỉ

có khả năng khái quát hoá tốt, bộ LC cũng sẽ thu được một hiệu quả bám cao cho các chuyển động tương tự các chuyển động được huấn luyện Vì vậy nó đủ để huấn luyện LC với một lượng nhỏ các đặc tính chuyển động huấn luyện Khi bộ xấp xỉ không có khả năng tự khái quát hoá tốt, bộ LC phải được huấn luyện cho mỗi chuyển động quan trọng, nó tạo ra một quá trình huấn luyện mở rộng

Sự mềm mại của giá trị xấp xỉ cần điều khiển được Như nói ở phần trước

đây, bộ LC không chỉ thu được sai số bằng không đối với một vài tần số, khi tín hiệu điều khiển có tần số cao sẽ không thỏa mãn theo mong muốn Người sử dụng phải có khả năng quyết định tần số lớn nhất của đầu ra của hàm xấp xỉ

Đáp ứng ngắn hạn là học tốt Đáp ứng ngắn hạn của bộ LC nên là loại đáp

ứng mà có sai số bám dần hội tụ về giá trị mong muốn Việc tăng sai số bám trong pha trung gian của quá trình học có thể làm hỏng đối tượng, hơn thế nữa, đây là trường hợp quá trình làm việc tối thiểu có thể không còn được bảo đảm khi bộ điều khiển được sử dụng như một thiết bị ghép thêm cho một bộ điều khiển đã có sẵn

Sự ổn định lâu dài cần phải được bảo đảm Việc tự học có thể được thực

hiện một cách liên tục hoặc được thực hiện trước khi vận hành Việc học liên tục được yêu cầu khi các thông số của đối tượng thay đổi trong suốt quá trình vận hành Ví dụ, do hao mòn hay chịu ảnh hưởng của môi trường Trong trường hợp này, một bộ điều khiển phải có khả năng đảm bảo việc học ổn định bất chấp các điều kiện vận hành thay đổi như thế nào

1.2.2 Bộ điều khiển học sử dụng sai lệch phản hồi (Feedback Error Learning - FEL)

Cấu trúc bộ điều khiển này được trình bày ở hình 1.3

Hệ thống LC bao gồm 2 phần:

- Bộ điều khiển Feef-forward: Được biểu thị bằng F, nghĩa là 1 hàm/ánh xạ

 r

F

u F  Một bộ điều khiển Feed - forward thông thường có thể được sử dụng để

bù thêm cho các hệ thống động học và theo cách này sẽ thu được độ bám chính xác

Trang 19

Hình 1.3: Cấu trúc bộ điều khiển phản hồi sai lệch

cao Khi bộ điều khiển feed-forward bằng với đối tượng nghịch đảo F P 1, thì đầu ra của đối tượng y sẽ bằng tín hiệu đặt r

Đối tượng P, luôn chịu sự tác động của nhiễu Các loại nhiễu ở bao gồm cả nhiễu ngẫu nhiên và nhiễu có bản chất chu kỳ Những nhiễu chu kỳ tái diễn giống nhau khi một chuyển động cụ thể được lặp lại Điều này có nghĩa rằng chúng có thể

được xem xét như một hàm trạng thái của đối tượng x và có thể lường trước

- Bộ điều khiển phản phản hồi : Như đã được nói tới, bộ điều khiển phản hồi,C,cung cấp các tín hiệu học cho bộ điều khiển feed-forward Hơn thế, nó

xác định quá trình bám cực tiểu tại thời điểm bắt đầu học Cuối cùng, bộ điều khiển phản hồi bù các nhiễu ngẫu nhiên

Bộ điều khiển FEL đã được thực hiện trong nhiều ứng dụng ví dụ như như:

Hệ thống phanh tự động ô tô

Điều khiển hệ thống camera

Điều khiển cánh tay robot

Máy hàn

Các ứng dụng chỉ ra rằng bộ điều khiển FEL đã cải thiện một cách rõ ràng dựa trên quá trình vận hành của bộ điều khiển phản hồi và các ứng dụng này cũng chỉ ra có thể thu được chất lượng bám cao mà không cần mô hình mở rộng Cách hoạt động của một bộ FEL được so sánh với cách hoạt động của hệ thống điều khiển thích nghi Kết luận rằng, trong trường hợp mô hình đối tượng chính xác được sử dụng trong các hệ thống điều khiển thích nghi, quá trình bám của bộ điều khiển thích nghi và của bộ điều khiển FEL là tương tự như nhau Khi FEL hội tụ chậm hơn bộ điều khiển thích nghi, trong tình huống này bộ điều khiển thích nghi được ưa chuộng hơn Tuy nhiên khi chưa có một mô hình

Hàm xấp xỉ

Trang 20

đối tượng chính xác, thì bộ điều khiển thích nghi sẽ không thể thu được hiệu suất bám như mong muốn Bộ điều khiển FEL không phải trải qua điều này và nó vẫn đem lại hệ số bám chính xác Khả năng này nâng cao giả thiết rằng bộ FEL có phù hợp cho hang loạt các ứng dụng mở rộng khi trong thực tế các đối tượng thường khó có một mô hình chính xác Câu hỏi đặt ra là nếu xét về mặt thương mại thì nên sử dụng bộ điều khiển nào? Để trả lời cho câu hỏi này chúng ra sẽ đi đánh giá xem bộ điều khiển FEL có đáp ứng được đầy đủ các chỉ tiêu chất lượng mà

ta đã đưa ra trong mục Learning Control hay không

- Dễ dàng sử dụng trên hệ thống điều khiển có sẵn: Sự mở rộng duy nhất đối

với hệ thống điều khiển có sẵn là hàm xấp xỉ Khi hệ thống điều khiển được thực hiện bằng phần mềm điều này yêu cầu ít có sự thay đổi và có thể dễ dàng được thực hiện

- Sự hợp nhất các kiến thức quan trọng trong thiết kế: Khi cấu trúc của đối

tượng động học được xác định, thì mạng MLP trong bộ điều khiển forward có thể tách ra thành một vài mạng MLP nhỏ hơn Mỗi một mạng con này sẽ bù cho một phần riêng biệt của đối tượng động học Những thí nghiệm đã chỉ ra rằng mạng này đã nâng tốc độ học lên đáng kể

feed Sự ổn định được xác lập: Điều này đã được chứng minh bằng lý thuyết

rằng bộ điều khiển FEL sử dụng cho điều khiển cánh tay robot cho kết quả là hội tụ Với các hệ thống khác, sự ổn định chưa được xét đến trên phương diện lý thuyết

- Đáp ứng quá độ tốt: Trong quá trình học, sai lệch bám sẽ dần hội tụ đến

giá trị cực tiểu của nó Giống như sự ổn định, đáp ứng ngắn hạn cũng chưa được xét tới trên phương diện lý thuyết

- Hàm xấp xỉ phù hợp cho việc điều khiển: Rất nhiều các giá trị thực của bộ một LC phụ thuộc vào loại hàm xấp xỉ được sử dụng Mặc dù thực tế là bộ điều

khiển FEL cũng đạt được chất lượng bám cao nhưng cách học không phải là tối

ưu cho mạng MLP

- Yêu cầu bộ nhớ nhỏ: Một trong số những thuộc tính tốt của MLP là nó

có thể xấp xỉ các hàm mục tiêu đa chiều với một số ít các thông số Do đó tổng dung lượng bộ nhớ của máy tính yêu cầu cho việc thực hiện là rất nhỏ Tốn kém cho việc tính toán giá trị Việc tính toán đầu ra của mạng MLP và trọng số của bộ thích nghi bao gồm một số lượng lớn các tính toán phức tạp Do đó, với một

số ứng dụng điều khiển thời gian thực thì loại mạng mạng nơ ron này có thể không phù hợp

Trang 21

Cơ chế học hội tụ chậm và trải qua vùng giá trị cực tiểu cục bộ Cơ chế học

dễ dàng đạt được tại vùng giá trị cực tiểu cục bộ Hàm trọng lượng của mạng kết thúc ở vùng cực tiểu nào phụ thuộc vào hàm trọng lượng ban đầu của mạng Do đó

nó cần phải thực hiện nhiều thử nghiệm huấn luyện mạng với các cài đặt hàm trọng lượng ban đầu khác nhau, để thu được độ bám chính xác có thể chấp nhận được

Có khả năng tổng quát hoá tốt Một thuận lợi thực tế là mối quan hệ vào ra chỉ có thể thích ứng toàn bộ đó là khi MLP có khả năng tổng quát tốt khi quá trình huấn luyện được thực hiện một cách tổng thể Khi một hệ thống chuyển động phải vận hành ở tốc độ thấp, bộ điều khiển FEL có khuynh hướng đưa ra hiệu suất kém Điều này là do thực tế mạng MLP gặp khó khăn trong việc học các dữ liệu có tương quan với nhau ở mức cao Khi các dữ liệu có tương quan với nhau ở mức cao, mạng

có khuynh hướng chuẩn hoá tín hiệu theo dữ liệu cuối cùng, kết quả là đưa ra khả năng khái quát hoá kém

Sự trơn tru của các giá trị xấp xỉ là không hoàn toàn điều khiển được Số lượng các thông số của một bộ MLP quyết định tính chính xác cực đại của giá trị xấp xỉ Nó không đảm bảo được độ trơn tru nhất định Nhờ việc học, mạng MLP có thể xấp xỉ rất gần các hàm mục tiêu trong phạm vi đầu vào và rất chính xác ở phần còn lại

Nhìn vào các thuộc tính ở trên, ta có thể kết luận rằng trong trường hợp mà cách học tốt, bộ điều khiển FEL có khả năng đáp ứng rất tốt Các nghiên cứu khác nhau nhằm mục đích khắc phục các vấn đề tồn tại của bộ điều khiển FEL Theo đó

ta sẽ giới thiệu tóm lược 3 phương pháp: 2 phương pháp đầu thay đổi cấu trúc của

bộ điều khiển học Trong khi ở phương pháp còn lại sử dụng hàm xấp xỉ

Trước tiên, phương pháp thứ nhất có thể cải thiện cách học bằng cách chọn các đầu vào khác nhau cho hàm xấp xỉ Sai số tín hiệu được thêm vào như một đầu vào của bộ xấp xỉ, điều này sẽ làm thay đổi bộ điều khiển LC từ chỗ hoàn toàn là 1

bộ điều khiển feed-forward nguyên bản chuyển sang bộ điều khiển feed-forward

dưới đây Các thí nghiệm đã chỉ ra rằng bộ LC này khắc phục được một số lỗi của

bộ điều khiển FEL gốc

Trang 22

Hình 1.4 Học theo sai số phản hồi

Phương thức thứ 2 là sử dụng nhiều bộ điều khiển feed-forward, mỗi một

bộ được huấn luyện để thực hiện một nhiệm vụ cụ thể Mỗi một mạng nơ ron giám sát học xem là bộ feed-forward nào được sử dụng cho nhiệm vụ nào Bộ LC này đã được kiểm tra trên tay máy mà phải thực hiện các chuyển động với các đối tượng có trọng lượng khác nhau Sau khi học, mỗi bộ điều khiển feed-forward đã học sẽ phải đảm nhiệm cho một đối tượng xác định Mạng giám sát đã học từ bộ điều khiển feed-forward nào được áp dụng cho đối tượng đó

Khi mạng MLP là nguyên nhân chính gây nên các khó khăn của điều khiển FEL, một phương pháp rõ ràng ở đây là phải tìm ra những hàm xấp xỉ khác nhau Mạng MLP được thay thế bởi mạng (Cerebellar Model Articulation Controller CMAC) Mạng CMAC phụ thuộc vào các lớp mạng nơ ron mà làm việc với hàm cơ

sở Trong trường hợp mạng CMAC, hàm cơ sở bao gồm các hàm đa thức thông minh mà có giá trị khác không trên phần không gian đầu vào Ở mỗi điểm trong không gian đầu vào p các hàm cơ sở chồng chéo lên nhau Thông số của p được biết đến như là một thông số khái quát hoá và có thể được lựa chọn bởi nhà thiết kế Đầu

ra của CMAC là tổng các trọng số của hàm ước lượng cơ sở Việc học được tiến hành bằng cách mô phỏng theo các trọng số của mạng, chứ không phải là theo bản thân các hàm cơ sở Tất cả điều này nhằm mục đích cải thiện những vấn đề sau:

- Độ hội tụ nhanh hơn Khi việc học diễn ra một cách cục bộ, chỉ có 1 số nhỏ các hàm trọng được thích nghi tạo ra độ hội tụ nhanh



+

-

+ +

y

Trang 23

- Có thể học các dữ liệu tương quan: Các vùng của hàm cơ sở đã được trộn lẫn, điều này có ích cho quá trình học các dữ liệu tương quan

- Không có cực tiểu địa phương: Cơ cấu học không trải qua vùng cực tiểu cục bộ

Tuy nhiên một bất lợi là người thiết kế bộ điều khiển phải lựa chọn sự phân phối của các hàm cơ sở Điều này yêu cầu phải có một số kiến thức nền tảng về ánh

xạ vào/ra theo mong muốn và việc điều chỉnh sự phân phối của hàm cơ sở là cần thiết trước khi đạt được hiệu suất có thể chấp nhận được Các thínghiệm đã chỉ ra rằng việc thay thế mạng MLP bởi mạng CMAC đem lại một quá trình học tốt hơn

và độ bám chính xác hơn

1.2.3 Learning Feedforward Control (LFFC)

Trong luận văn này một hệ thống LC được xét có cấu trúc tương tự như cấu

trúc của bộ điều khiển FEL (hình 1.2) Tuy nhiên, phần feed-forward của bộ điều khiển LC được thực hiện bởi các thông số am, bm, cm, dm của bộ điều khiển thích nhi theo mô hình mẫu

1.3 Lý thuyết điều khiển thích nghi theo mô hình mẫu (MRAS)

1.3.1 Lịch sử phát triển của hệ điều khiển thích nghi

Điều khiển thích nghi (ĐKTN) ra đời năm 1958 để đáp ứng yêu cầu của thực

tế mà các hệ điều khiển truyền thống không thoả mãn được Trong các hệ điều khiển truyền thống, các xử lý điều khiển thường dùng những mạch phản hồi là chính Vì vậy, chất lượng ra của hệ bị thay đổi khi có nhiễu tác động hoặc tham số của hệ thay đổi Trong hệ ĐKTN cấu trúc và tham số của bộ điều khiển có thể thay đổi được vì vậy chất lượng ra của hệ được đảm bảo theo các chỉ tiêu đã định

Điều khiển thích nghi khởi đầu là do nhu cầu về hoàn thiện các hệ thống điều khiển máy bay Do đặc điểm của quá trình điều khiển máy bay có nhiều tham số thay đổi và có nhiều yếu tố ảnh hưởng đến quá trình ổn định quỹ đạo bay, tốc độ bay Ngay từ năm 1958, trên cơ sở lý thuyết về chuyển động của Boócman, lý thuyết điều khiển tối ưu… hệ thống điều khiển hiện đại đã ra đời Ngay sau khi ra đời lý thuyết này đã được hoàn thiện nhưng chưa được thực thi vì số lượng phép tính quá lớn mà chưa có khả năng giải quyết được Ngày nay, nhờ sự phát triển mạnh mẽ của công nghệ thông tin, điện tử, máy tính… cho phép giải được những bài toán đó một cách thuận lợi nên hệ thống ĐKTN đượa ứng dụng đáng kể vào thực tế

Trang 24

Hệ ĐKTN có mô hình mẫu MRAC (Moded Reference Adaptive Control) đã được Whitaker đề xuất khi giải quyết vấn đề điều khiển lái tự động máy bay năm

1958 Phương pháp độ nhậy và luật MIT đã được dùng để thiết kế luật thích nghi với mục đích đánh giá các thông số không biết trước trong sơ đồ MRAC

Thời gian đó việc điều khiển các chuyến bay do còn tồn tại nhiều hạn chế như: thiếu phương tiện tính toán, xử lý tín hiệu và lý thuyết cũng chưa thật hoàn thiện Đồng thời những chuyến bay thí nghiệm bị tai nạn là cho việc nghiên cứu về

lý thuyết điều khiển thích nghi) bị lắng xuống vào cuối thập kỷ 50 và đầu năm

1960

Thập kỷ 60 là thời kỳ quan trọng nhất trong việc phát triển các lý thuyết tựđộng, đặc biệt là lý thuyết ĐKTN Kỹ thuật không gian trạng thái và lý thuyết ổnđịnh dựa theo luật Liapunov đã được phát triển Một loạt các thuyết như: Điềukhiển đối ngẫu, điều khiển ngẫu nhiên, nhận dạng hệ thống, đánh giá thông số

… rađời cho phép tiếp tục (nghiên cứu lại) phát triển và hoàn thiện lý thuyết ĐKTN Vàonăm 1966 Park và các đồng nghiệp đã tìm được phương pháp mới để tính toán lạiluật thích nghi sử dụng luật MIT ứng dụng vào các sơ đồ MRAC của những năm 50 bằng cách ứng dụng lý thuyết của Liapunov

Tiến bộ của các lý thuyết điều khiển những năm 50 cho phép nâng cao hiểu biết về ĐKTN và đóng góp nhiều vào đổi mới lĩnh vực này Những năm 70 nhờ sự phát triển của kỹ thuật điện tử và máy tính đã tạo ra khả năng ứng dụng lý thuyết này vào điều khiển các hệ thống phức tạp trong thức tế

Tuy nhiên những thành công của thập kỷ 70 còn gây nhiều tranh luận trong ứng dụng ĐKTN Đầu năm 1979 người ta chỉ ra rằng những sơ đồ MRAC của thập

kỷ 70 dễ mất ổn định do nhiễu tác động Tính bền vững trong ĐKTN trở thành mục tiêu tập trung nghiên cứu của các nhà khoa học vào năm 1980

Những năm 80 nhiều thiết kế đã được cải tiến, dẫn đến ra đời lý thuyết ĐKTN bền vững Một hệ ĐKTN được gọi là bền vững nếu như nó đảm bảo chất lượng ra cho một lớp đối tượng trong đó có đối tượng đang xét Nội dung của bài toán bễn vững trong ĐKTN là điều khiển những đối tượng có thông số không biết trước và biến đổi theo thời gian Cuối thập kỷ 80 có các công trình nghiên cứu về hệ thống ĐKTN bền vững, đặc biệt là MRAC cho các đối tượng có thông số biến thiên theo thời gian

Các nghiên cứu của những năm 90 đến nay tập trung vào đánh giá kết quả của nghiên cứu những năm 80 và nghiên cứu các lớp đối tượng phi tuyến có tham

Trang 25

số bất định Những cố gắng này đã đưa ra một lớp sơ đồ MRAC xuất phát từ lý

thuyết hệ thống phi tuyến

1.3.2 Khái quát về hệ điều khiển thích nghi

Trong luận văn này một vài dạng của hệ thống thích nghi mô hình tham chiếu đã được bàn tới Chúng ta bắt đầu với một phương pháp trực quan, phương pháp này chỉ ra rằng ý tưởng phản hồi cơ bản giúp tìm ra các thuật toán cho việc chỉnh định tham số Ta thấy phát sinh hai câu hỏi : Đầu tiên là có cách nào để tìm ra những tín hiệu phù hợp mà chỉnh định đúng tham số tại đúng thời điểm thích hợp ; Điều thứ hai là làm cách nào đảm bảo ổn định cho hệ thống thích nghi mà bản thân

nó vốn là phi tuyến do sự đa dạng có mặt trong hệ thống Cái nhìn rõ nét trong câu hỏi đầu tiên đạt được bởi việc xem xét phương pháp mô hình độ nhậy Trạng thái ổn định có thể được đảm bảo bằng việc sử dụng lý thuyết ổn định của Liapunov cho việc thiết kế hệ thống thích nghi

* Mục đích của việc nghiên cứu

Sau khi hoàn tất những điều vừa lưu ý trên dự kiến ta sẽ biết được:

+ Những tín hiệu phù hợp nào đóng vai trò trong hệ thống thích nghi

+ Bằng cách nào mà hệ thống thích nghi có thể được thiết kế dựa trên phương pháp độ nhậy

+ Bằng cách nào mà hệ thống thích nghi có thể được thiết kế dựa trên phương pháp (trạng thái ổn định) Liapunov

* Giới thiệu:

Có một vài cấu trúc mà có thể đưa ra một hệ thống điều khiển có khả năng phản ứng với sự biến đổi những tham số của bản thân nó hoặc phản ứng với những biến đổi đặc tính của nhiễu (hệ thống) Một hệ thống phản hồi thông thường mặc

dù có mục đích là giảm nhỏ sự nhạy cảm đối với những loại thay đổi này Tuy nhiên, khi những biến đổi thậm chí với cả một hệ thống có phản hồi mà hệ số khuếch đại tốt vẫn không thỏa mãn Lúc đó một cấu trúc điều khiển phức tạp hơn được cần đến và tính chất thích nghi chắc chắn phải được đưa vào (giới thiệu) Một

hệ thống thích nghi có thể được định nghĩa như sau

“Một hệ thống thích nghi là một hệ thống mà trong bản thân nó đã bổ sung vào cấu trúc (phản hồi) cơ bản, kết quả đo chính xác được đưa vào để bù lại một cách tự động đối với những thay đổi trong mọi điều kiện hoạt động, với những thay đổi trong những quá trình động học, hoặc với những biến đổi do nhiễu hệ thống, nhằm để duy trì một quá trình thực hiện tối ưu cho hệ thống”

Trang 26

Nhiều định nghĩa khác đã được đưa ra trong lĩnh vực điều khiển Hầu hết trong số đó chỉ miêu tả một vài phân loại tiêu biểu của hệ thống thích nghi

Định nghĩa đưa ra ở đây giả sử như là một chuẩn cấu trúc phản hồi thông thường cho phản ứng cơ bản đối với những thay đổi của nhiễu (hệ thống) và tham

số Cấp thứ hai là một cơ cấu thích nghi hiệu chỉnh hệ số khuyếch đại của bộ điều khiển gốc, thay đổi cấu trúc bản thân cơ cấu thích nghi và tạo ra các tín hiệu bổ sung và v.v Trong một hệ thống thích nghi, việc thiết lập như vậy được chỉnh định bởi người sử dụng ở cấp thứ 2

* Lịch trình hệ số, các dạng chuyển đổi

Theo định nghĩa quá trình biến đổi tự động từ một chế độ làm việc này tới một chế độ làm việc khác được xem xét như một tính chất (đặc điểm) thích nghi Dùng kiến thức về ảnh hưởng của biến ngoài tác động đến hành vi của hệ thống cũng được hiểu là một đặc điểm thích nghi Loại thích nghi này có thể được thực hiện theo hai cách khác nhau: hoặc bằng cách đo từng nhiễu và tạo ra các tín hiệu

để bù lại cho chúng (điều khiển feedforward) Hoặc là hiệu chỉnh hệ số bộ điều khiển phản hồi theo một lịch trình lập sẵn dựa trên sự hiểu biết về ảnh hưởng của những thay đổi tham số của hệ thống (lịch trình hệ số) Khả năng khác là sử dụng một ngân hàng của bộ điều khiển và chọn bộ điều khiển tốt nhất gần như tương tự với phương pháp lịch trình hệ số Cách làm này được gọi là mô hình chuyển mạch

Sự thay đổi có dựa trên ý tưởng này là phương pháp mô hình đa chiều Các kết quả đầu ra trong mô hình mẫu được so sánh với đầu ra của đối tượng để đưa vào điều khiển Bộ điều khiển có thể được thiết kế và cài đặt dựa trên mô hình mẫu khi đầu

ra của mô hình có sự giống nhất với đầu ra của đối tượng

Trong thực tế không thể áp dụng “lịch trình hệ số” hoặc áp dụng bộ điều khiển feedforward cho nhiều thay đổi khác nhau Một vài loại hệ thống thích nghi, theo một nghĩa hẹp hơn, đã được phát triển Nó cho phép một hệ thống được tối ưu hoá mà không cần bất kỳ sự hiểu biết gì về nguyên nhân sinh ra những biến đổi quá trình động học Thông thường, khái niệm điều khiển thích nghi bị hạn chế bởi mỗi loại hệ thống thích nghi Không có sự phân biệt rõ giữa điều khiển thích nghi và điều khiển học Khái niệm điều khiển học thường được dùng cho nhiều hệ thống phức tạp hơn, nơi nhiều sự nhớ là phức tạp và có cả những vấn đề không thể được giải quyết bằng bộ điều khiển tiêu chuẩn, dựa trên hàm truyền, bởi vì chúng cần một dạng khác biểu diễn sự hiểu biết Ví dụ giống như cấu trúc hệ thống mạng nơron,

Trang 27

những điều ghi chú trong luận văn này nói về 1 loại điều khiển thích nghi đặc biệt,

nó được biết đến là bộ điều khiển thích nghi theo mô hình tham chiếu

Hệ thống điều khiển thích nghi có thể được phân loại theo một vài cách khác nhau Một khả năng tạo ra sự phân biệt giữa chúng là:

Điều khiển thích nghi trực tiếp và điều khiển thích nghi gián tiếp

+ Hệ thống với sự chỉnh định trực trực tiếp các tham số điều khiển mà không nhận dạng rõ các tham số của đối tượng (điều khiển thích nghi tiếp)

+ Hệ thống với sự điều chỉnh gián tiếp các tham số điều khiển với việc nhận dạng rõ các tham số của đối tượng (điều khiển thích nghi gián tiếp)

Hệ thống điều khiển thích nghi mô hình tham chiếu, hầu hết được gọi là MRAC hay MRAS, chủ yếu áp dụng điều khiển thích nghi trực tiếp Tuy nhiên, việc áp dụng MRAS để nhận dạng hệ thống cũng sẽ được minh hoạ ở nhiên cứu này

Triết lý cơ bản đằng sau việc áp dụng MRAC đó là đặc trưng mong muốn của hệ thống được đưa ra bởi một mô hình toán học, hay còn gọi là mô hình mẫu Khi hành vi của đối tượng khác với hành vi “lý tưởng” mà hành vi này được xác định bởi mô hình mẫu, đối tượng sẽ được sửa đổi theo 2 cách, hoặc bằng cách chỉnh định các thông số của bộ điều khiển (Hình 1.5a), hoặc bằng cách tạo ra tín hiệu bổ xung đầu vào cho đối tượng này (Hình 1.5b) Điều này có thể được chuyển thành bài toán tối ưu hoá, ví dụ tối thiểu hoá các tiêu chuẩn:

Ngoài việc tối thiểu hoá sai lệch giữa những tín hiệu đầu ra của đối tượng

và mô hình mẫu, thì tất cả các biến trạng thái của đối tượng và mô hình mẫu còn được đưa vào tính toán Khi các biến trạng thái của đối tượng được ký hiệu là (xP)

và các biến trạng thái của mô hình mẫu ký hiệu là (xm), véc tơ sai lệch e được định nghĩa là:

Trong trường hợp này, bài toán tối ưu hoá có thể được chuyển thành tối thiểu hoá tiêu chuẩn:

Trang 28

Những xem xét sau đây đóng một vai trò nhất định trong việc lựa chọn giữa thích nghi tham số và thích nghi tín hiệu Một tính chất quan trọng của hệ thống với việc thích nghi tham số đó là vì hệ thống có nhớ Ngay khi các tham số của đối

Đối tượng

Bộ điều khiển Thích nghi

Trang 29

tượng đã được điều chỉnh đúng với giá trị của chúng và những tham số này không thay đổi nữa, vòng lặp thích nghi trong thực tế không còn cần thiết: đối tượng thực

và mô hình mẫu hiển thị các trạng thái như nhau Sự nhớ nói chung là không được thể hiện trong hệ thống cùng với thích nghi tín hiệu Do đó, vòng lặp thích nghi vẫn còn cần thiết trong mọi trường hợp, để nhằm liên tục tạo ra những tín hiệu phù hợp

ở đầu vào Do vậy, các hệ thống thích nghi tín hiệu cần phải phản ứng nhanh hơn hẳn đối với những thay đổi động học của đối tượng so với các hệ thống thích nghi tham số vì hệ thích nghi tín hiệu không sử dụng thông tin từ quá khứ Trong những

hệ thống mà các thông số liên tục thay đổi trong một phạm vi rộng, sự có mặt của tính chất nhớ là rất có lợi Tuy nhiên, trong một môi trường ngẫu nhiên, ví dụ như trong các hệ thống với rất nhiều nhiễu, điều này lại là bất lợi Hệ số cao trong vòng thích nghi có thể gây nhiễu đưa tới đầu vào của đối tượng

Khi các tham số của đối tượng thay đổi chậm hoặc chỉ thời gian ngắn ngay sau đó và ngay lúc đó, những hệ thống với sự thích nghi tham số đưa ra một cách thực hiện tốt hơn vì chúng có nhớ Cũng có một vài thuật toán thích nghi mà kết hợp những ưu điểm của cả hai phương pháp trên Trong những lưu ý sau chủ yếu sẽ được tập trung vào các hệ thống thích nghi tham số, mặc dù vậy việc kết hợp giữa thích nghi tham số và thích nghi tín hiệu cũng sẽ được bàn đến

Một cách khác để xem xét hệ thống như sau Các vòng điều khiển phản hồi tiêu chuẩn được xem như là một hệ thống điều khiển sơ cấp phản ứng nhanh, chính xác mà nó buộc phải loại ra nhiễu “thông thường” Những biến thiên lớn trong các tham số hoặc là nhiễu lớn được xử lý bởi hệ thống điều khiển thích nghi (thứ hai) phụ tác động chậm hơn (Hình 1.6)

Trang 30

1.3.3 Cơ chế thích nghi – thiết kế bộ điều khiển thích nghi dựa vào luật MIT

Trong lĩnh vực điều khiển nâng cao này, một vài phương pháp đã được mô tả

để thiết kế hệ thống thích nghi Nhưng chúng ta có thể có được cái nhìn sâu sắc hơn với phương pháp này bằng cách tư duy làm cách nào tự tìm đựơc các thuật toán cho mình Điều này giúp ta thực sự hiểu được những gì đang diễn ra Do đó, trong lúc này chúng ta sẽ hoãn lại việc xem xét những hàm toán học và xem xét các ý tưởng

cơ bản của MRAS với một ví dụ đơn giản Khi chúng ta cố gắng thiết kế một bộ điều khiển thích nghi cho hệ thống đơn giản này, chúng ta sẽ gặp phải những vấn đề

mà cần đến nền lý thuyết cơ bản hơn Những tính chất nói chung với những phương pháp thiết kế khác nhau cũng như là sự khác biệt của các phương pháp này sẽ trở lên rõ ràng

Đối tượng

Bộ điều khiển Thích nghi

Bộ điều khiển thứ nhất của hệ

Bộ điều khiển thứ hai của hệ

Hình 1.6: Điều khiển ở cấp 1 và cấp 2

Trang 31

Tất nhiên việc “điều khiển” với tham số Ka và Kb không phải là một bộ điều khiển thực tế Trong thực tế, chúng tôi giả thiết ở phần này là các thông số đối tượng có thể được chỉnh định trực tiếp

Trong ví dụ này, đối tượng (tuyến tính) được mô tả bằng hàm truyền:

b

s + a s +1 hoặc

2 n

_ +

Trang 33

chỉnh Ki chỉ được thực hiện khi sai lệch giữa đối tượng và mô hình mẫu là nhạy cảm với sự thay đổi của những tham số điển hình này

Ví dụ:

Đối tượng trong Hình 1.6 có thể được mô tả bởi phương trình vi phân:

yP (a P K a)yP y P  (K b b u P) (1.13)

Ở đó y ký hiệu cho dy/dt và yd y dt2 / 2

Sau đó tham số KV được đưa vào công thức (1.13) có thể được viết lại thành công thức (1.15)

yPK y V Py P  (K bb u P) (1.15) Đạo hàm công thức này theo KV mang lại:

Phương trình vi phân (1.16) tương đương với phương trình (1.13), ngoại trừ

đối với tín hiệu vào Phương trình (1.16) được gọi là mô hình độ nhạy Khi 1 ước

lượng được tạo ra với giá trị của KV, ví dụ bằng việc lựa chọn nó bằng với giá trị mong muốn am, hệ số độ nhạy y P/ K i có thể đo được Từ phương trình (1.13) dẫn đến:

Giả sử rằng tham số đối tượng aP thay đổi chậm hơn so với tham số chỉnh định

Ka do sự thích nghi, sau đó từ biểu thức (1.14) thấy rằng:

dt

V dK a dt

Trang 34

Phương pháp độ nhạy có ưu điểm là đơn giản và không phức tạp Bất lợi

chính đó là sự ổn định có thể chỉ được chứng minh bằng mô phỏng hoặc kiểm

nghiệm thực tế Một chứng minh toán học giải thích về sự ổn định không được đưa

ra rõ ràng

1.3.5 Phương pháp ổn định của Liapunov

Việc thiết kế các hệ thống thích nghi dựa trên lý thuyết ổn định được bắt

nguồn từ những bài toán về ổn định trong thiết kế ví dụ như những bài toán dựa trên

các mô hình độ nhạy Phương pháp thứ 2 của Liapunov là phương pháp phổ biến

nhất Một phương pháp khác có liên quan dựa trên lý thuyết “siêu ổn định” Cả hai

phương pháp có thể mang đến kết quả giống nhau, đến nỗi mà không có một sự

thích trực tiếp nào đối với một trong hai về các thuật toán kết quả

Việc sử dụng lý thuyết ổn định Liapunov cho thiết kế các hệ thống thích nghi

được đưa ra bởiPark năm 1966 Nguồn gốc luật thích nghi được thực hiện dễ dàng

nhất khi đối tượng và mô hình mẫu được mô tả dưới dạng mô hình không gian trang

thái Đối tượng có thể được mô tả:

+

++

+ __

_

Mô hình độ nhạy

Đố

i

tượn

g

Hình 1.8: Hệ thống điều khiển thích nghi dựa trên mô hình độ nhậy K a

được chỉnh định để bù cho sự thay đổi trong a P

Trang 35

B là tham số đối tượng thay đổi mà có thể được bù bởi các tham

số bộ điều khiển Ka, Kb Mô tả mô hình mẫu có thể được mô tả

một giải pháp cân bằng ổn định Theo lý thuyết ổn định Liapunov điều này có thể

thực hiện được khi chúng ta có thể tìm được một hàm (vô hướng) Liapunov V(e)

với tính chất sau:

V(e) xác định dương (nghĩa là V> 0 với e 0, và V= 0 khi e=0)

V(e) xác định âm (nghĩa là V<0 với e 0, và V = 0 khi e = 0)

( )

V e   khi e  

Khi hàm Liapunov V(e) đã được chọn chính xác, các luật thích nghi được trực

tiếp dẫn ra từ các điều kiện dưới mà V e ( ) xác định âm Vấn đề chính (về lý thuyết)

là lựa chọn một V(e) thích hợp Có thể tìm được nhiều hàm Liapunov phù hợp

Những hàm Liapunov khác nhau dẫn đến những luật thích nghi khác nhau Việc tìm hàm Liapunov là một công việc khó khăn Tuy nhiên, trong các tài liệu một vài hàm lipunov “tiêu chuẩn” đã đưa ra mà những luật thích nghi hữu ích” Những hàm thích nghi đơn giản và khả dụng được tìm thấy khi chúng ta sử dụng hàm Liapunov:

( ) T T T

Ở đó:

- P là ma trận đối xứng dương tùy ý

- a, b là những vector gồm những phần tử khác 0 của ma trận A,B

Trang 36

-  và  là ma trận đường chéo, có những phần tử dương xác định tốc độ thích nghi

Việc lựa chọn hàm Liapunov đưa ra trong biểu thức (1.27) không quá phức tạp Hàm Liapunov biểu diễn một loại năng lượng tồn tại trong hệ thống và khi loại năng lượng này khi tiến dần về 0, hệ thống đạt tới điểm cân bằng ổn định Trong nhiều hệ thống động năng lượng này có mặt trong những khâu tích phân, năng lượng này cũng có thể được coi như là những biến trạng thái của hệ thống Các thành phần e, a, b là những biến trạng thái của hệ thống được mô tả trong biểu thức

(1.28) Các thành phần a, b là những sai lệch tham số và có thể coi như là những

điều kiện ban đầu sai của các tham số bộ điều khiển thích nghi Vì vậy yêu cầu đặt

ra là tất cả các biến trạng thái e, a, b đều tiến về 0

Với cách lựa chọn này của P, và   , V(e) là một hàm xác định dương Đạo hàm V(e):

Bởi vì ma trận A m thuộc về một hệ thống ổn định (mô hình mẫu) nên theo định

lý Malkin thì Q là một ma trận xác định dương, dẫn đến phần tử đầu của biểu thức

 

Định dạng
Số trang	73
Dung lượng	2,01 MB