Nghiên cứu ứng dụng Learning Feed Forward trên cơ sở điều khiển thích nghi theo mô hình mẫu (Mras) điều khiển vị ytis cánh tay Robot

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vnLỜI CẢM ƠN Sau thời gian nghiên cứu, làm việc khẩn trương và được sự hướng dẫn tận tình giúp đỡ của thầy gi

Trang 1

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

ĐẠI HỌC THÁI NGUYÊN

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP

-

NGUYỄN THỊ GIANG

NGHIÊN CỨU ỨNG DỤNG LEARNING FEED FORWARD TRÊN CƠ SỞ ĐIỀU KHIỂN THÍCH NGHI THEO MÔ HÌNH MẪU (MRAS) ĐIỀU KHIỂN

Trang 2

LỜI CAM ĐOAN

Tên tôi là: Nguyễn Thị Giang

Sinh ngày 18 tháng 10 năm 1987

Học viên lớp cao học khoá 13 - Tự động hoá - Trường đại học kỹ thuật Công nghiệp Thái Nguyên

Hiện đang công tác tại Trường Cao đẳng nghề Cơ điện và xây dựng Bắc Ninh

Xin cam đoan luận văn “Nghiên cứu ứng dụng Learning Feed Forward

(LFFC) trên cơ sở điều khiển thích nghi theo mô hình mẫu (MRAS) điều khiển vị trí cánh tay Robot ” do thầy giáo T.S Nguyễn Duy Cương hướng dẫn là công trình

nghiên cứu của riêng tôi Tất cả các tài liệu tham khảo đều có nguồn gốc, xuất xứ rõ ràng

Tác giả xin cam đoan tất cả những nội dung trong luận văn đúng như nội dung trong đề cương và yêu cầu của thầy giáo hướng dẫn Nếu có vấn đề gì trong nội dung của luận văn tác giả xin hoàn toàn chịu trách nhiệm với lời cam đoan của mình

Thái Nguyên, ngày tháng năm 2012

Học viên

Nguyễn Thị Giang

Trang 3

LỜI CẢM ƠN

Sau thời gian nghiên cứu, làm việc khẩn trương và được sự hướng dẫn tận tình

giúp đỡ của thầy giáo T.S Nguyễn Duy Cương, luận văn với đề tài “Nghiên cứu

ứng dụng Learning Feed Forward (LFFC) trên cơ sở điều khiển thích nghi theo

mô hình mẫu (MRAS) điều khiển vị trí cánh tay Robot” đã được hoàn thành

Tác giả xin bày tỏ lòng biết ơn sâu sắc tới:

Thầy giáo hướng dẫn T.S Nguyễn Duy Cương đã tận tình chỉ dẫn, giúp đỡ tác

giả hoàn thành luận văn

Thầy giáo Nguyễn Văn Chí – Bộ môn Đo lường và điều khiển tự động- Khoa

Điện tử, cùng các thầy cô giáo Trường Đại học kỹ thuật công nghiệp Thái Nguyên

và một số đồng nghiệp, đã quan tâm động viên, giúp đỡ tác giả trong suốt quá trình học tập để hoàn thành luận văn này

Mặc dù đã cố gắng hết sức, song do điều kiện thời gian và kinh nghiệm thực tế của bản thân còn ít, cho nên đề tài không thể tránh khỏi thiếu sót Vì vậy, tác giả mong nhận được sự đóng góp ý kiến của các thầy giáo, cô giáo và các bạn bè đồng nghiệp

Tôi xin chân thành cảm ơn!

Thái Nguyên, ngày….tháng….năm 2012

Tác giả

Trang 4

MỤC LỤC

LỜI CAM ĐOAN 1

LỜI CẢM ƠN 3

MỤC LỤC 4

DANH MỤC CÁC CHỮ VIẾT TẮT 6

DANH MỤC CÁC HÌNH VẼ 7

LỜI NÓI ĐẦU 9

CHƯƠNG 1 : TỔNG QUAN VỀ ĐIỀU KHIỂN ROBOT CÔNG NGHIỆP 11

Giới thiệu: 11

1.1.TỔNG QUAN VỀ ROBOT CÔNG NGHIỆP 11

1.1.1.Khái niệm về Robot công nghiệp 11

1.1.2 Phân loại Robot công nghiệp 13

1.1.3 Sơ đồ tổ chức kỹ thuật của Robot 16

1.2 PHƯƠNG TRÌNH ĐỘNG HỌC CỦA ROBOT 18

Kết luận chương 1: 20

CHƯƠNG 2 : TỔNG QUAN VỀ LEARNING FEED FORWARD CONTROL (LFFC) VÀ MODEL REFERENCE ADAPTIVE YSTEM(MRAS) 21

Giới thiệu: 21

2.1 TỔNG QUAN VỀ LFFC 21

2.1.1 Giới thiệu 21

2.1.2 Điều khiển học (Learning Control - LC) 22

2.1.3 Bộ điều khiển học sử dụng sai lệch phản hồi (Feedback Error Learning - FEL) 26

2.1.4 Learning Feed forward Control (LFFC) 33

2.2 ĐIỀU KHIỂN THÍCH NGHI THEO MÔ HÌNH MẪU 34

2.2.1 Khái quát chung 34

2.2.2 Cơ chế thích nghi 39

2.2.3 Mô hình độ nhạy: 47

2.2.4 Phương pháp ổn định của Liapunov 49

2.3 BỘ ĐIỀU KHIỂN LFFC TRÊN CƠ SỞ MRAS 61

Trang 5

2.3.1 Khái niệm chung 61

2.3.3 Luật điều khiển thích nghi 65

Kết luận chương 2: 70

CHƯƠNG 3 : THIẾT KẾ VÀ MÔ PHỎNG BỘ ĐIỀU KHIỂN LFFC TRÊN CƠ SỞ MRAS ĐỂ ĐIỀU KHIỂN VỊ TRÍ CÁNH TAY ROBOT 71

3.1 THIẾT KẾ BỘ ĐIỀU KHIỂN 71

3.1.1 Chọn khâu khởi tạo tín hiệu đặt 72

3.1.2 Chọn bộ điều khiển PD 72

3.1.3 Tính toán bộ điều khiển LFFC 73

3.2 Mô phỏng hệ thống 75

3.2.1 Cấu trúc mô phỏng 75

3.2.2.Kết quả mô phỏng 81

Kết luận Chương 3 87

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI 88

TÀI LIỆU THAM KHẢO 89

Trang 6

DANH MỤC CÁC CHỮ VIẾT TẮT

Trang 7

Trang 8

có bổ xung khâu tỷ lệ

mô hình mẫu

Viscous

Trang 9

LỜI NÓI ĐẦU

Ngày nay, điều khiển robot công nghiệp đã và đang được ứng dụng rộng rãi

trong nhiều lĩnh vực sản xuất và đời sống Để điều khiển robot đã có rất nhiều phương pháp khác nhau như dùng bộ điều khiển truyền thống PID,

LQR(Linear Quadratic Regulator), LQG (Linear Quadratic Gaussian), STR (Self

Tuning Regulator) Các bộ điều khiển trên được thiết kế trên cơ sở mô hình tuyến tính hoá với những thông số biết trước Tuy nhiên Robốt là hệ cấu trúc có tính phi tuyến mạnh, các tham số không rõ và thay đổi hoặc chứa các thành phần phi tuyến Ngoài ra trong quá trình làm việc hệ còn chịu tác động của các nhiễu bên ngoài có tham số thay đổi [8] Do vậy đối với các robot làm việc với yêu cầu đồng thời có độ

ổn định và độ chính xác cao thì các bộ điều khiển trên thể hiện các hạn chế

Hệ thống điều khiển thích nghi là hệ thống mà cấu trúc và tham số của bộ điều khiển có thể thay đổi theo sự biến thiên thông số của hệ sao cho chất lượng đảm bảo các chỉ tiêu đã định [1], [6] Đặc biệt hệ điều khiển Learning Feed Forward (LFFC)[2] trên cơ sở thích nghi theo mô hình mẫu (Model Reference Adaptive System: MRAS) [3], đã được nghiên cứu và thiết kế ứng dụng trong thực tế [7],[4]

Bộ điều khiển này có ưu điểm là có khả năng kháng nhiễu hệ thống (System Noise)

có hiệu quả, nhờ đó độ chính xác và độ ổn định của hệ có thể đồng thời đạt được Việc ứng dụng Learning Feed Forward trên cơ sở MRAS để điều khiển vị trí cánh tay rôbốt sẽ nâng cao chất lượng của hệ thống Vì vậy tác giả lựa chọn đề tài

”Nghiên cứu ứng dụng Learning Feed - Forward (LFFC) trên cơ sở điều khiển

thích nghi theo mô hình mẫu (MRAS) điều khiển vị trí cánh tay Robot”

Luận văn tập trung nghiên cứu xây dựng bộ điều khiển vị trí cánh tay robot dựa trên các lý thuyết cơ bản về bộ điều khiển LFFC trên cơ sở MRAS

Phương pháp nghiên cứu của đề tài như sau:

- Nghiên cứu lý thuyết và xây dựng mô hình toán của robot, thiết kế bộ điều khiển

- Kiểm chứng kết quả thiết kế thông qua mô phỏng bằng phần mềm Matlab

Simulink

Trang 10

Luận văn bao gồm các phần chính như sau:

Chương 1: Tổng quan về điều khiển Rôbốt công nghiệp

Chương 2: Tổng quan về LFFC và MRAS

Chương 3: Thiết kế bộ điều khiển và mô phỏng hệ thống điều khiển vị trí robot 2

khâu ứng dụng LFFC trên cơ sở MRAS

Kết luận và hướng phát triển của đề tài

Thái Nguyên, ngày tháng năm 2012

Học viên

Trang 11

CHƯƠNG 1 TỔNG QUAN VỀ ĐIỀU KHIỂN ROBOT CÔNG NGHIỆP

1.1.TỔNG QUAN VỀ ROBOT CÔNG NGHIỆP

1.1.1.Khái niệm về Robot công nghiệp

Robot là một hệ thống phức tạp, ta có thể hiểu nó thông qua cách nhìn nhận

từ nhiều phương diện sau:

1) Phương diện vật lý:

Là một hệ thống lớn bao gồm nhiều hệ thống con (sub_system) Để vận hành được

nó phải có đầy đủ các yếu tố: Năng lượng; Cơ khí (các thanh nối, khớp, thân, ); Điều khiển;

2) Phương diện truyền tin:

Trang 12

Là một hệ thống truyền tin và xử lý tin khép kín bao gồm: Phần chuyển động; phần nhận dạng và điều khiển

a) Cơ cấu chuyển động: Có tác dụng thực hiện các chuyển động theo yêu cầu của công nghệ Phần chuyển động được thực hiện bằng các kỹ thuật truyền động sau: Truyền động thuỷ lực; Truyền động khí nén và truyền động điện Trong

đó truyền động điện có thể dùng động cơ điện một chiều hay động cơ điện xoay chiều đi kèm bộ điều khiển

b) Cơ cấu nhận dạng: Là hệ thống các cảm biến bao gồm cảm biến lực, cảm biến vị trí, cảm biến tốc độ, Các thông tin đo được từ các cảm biến được chuyển tới bộ phận điều khiển

Hình 1.1 Sơ đồ hệ thống điều khiển vị trí

Quỹ đạo đặt

BỘ ĐIỀU KHIỂN

HỆ THỐNG ĐO (CÁC SENSOR)

ROBOT

Tín hiệu điều

Trang 13

1.1.2 Phân loại Robot công nghiệp

Có nhiều cách phân loại Robot, dựa trên các cơ sở kỹ thuật khác nhau có các cách phân loại khác nhau Sau đây là một số cách phân loại:

1 Phân loại theo số bậc tự do trong môi trường công tác

Lấy hai hình thức chuyển động nguyên thuỷ làm chuẩn

 Chuyển động tịnh tiến theo các hướng x,y,z trong không gian Đềcác (Ký hiệu là P: Prasmatic)

 Chuyển động quay xung quanh các trục x, y, z (Ký hiệu là R: Rotation)

Thông thường các chuyển động trên được ký hiệu như sau

Chuyển động tịnh tiến Chuyển động quay

Dạng Đề các Dạng trụ

Dạng cầu Dạng khớp

Hình.1.2 Các dạng Robot 3 bậc tự do

Trang 14

Như vậy chỉ với 3 bậc tự do, Robot sẽ chuyển động trong môi trường công tác với hình khối phụ thuộc vào tổ hợp P và R như hình minh hoạ ở Hình 1.2

PPP trường công tác là hình hộp chữ nhật hoặc lập phương

RPP trường công tác là khối trụ

RRP trường công tác là khối cầu

RRR trường công tác là khối cầu

Lĩnh vực hoạt động của Robot ngày càng mở rộng, với yêu cầu các khả năng thao tác ngày càng khéo léo và tinh vi Vì vậy số bậc tự do có thể không hạn chế Do vậy

để giải quyết bài toán điều khiển trong Robot thì bên cạnh hệ toạ độ chuẩn U ta còn đặt đặt nhiều hệ toạ độ khác như:

2 Phân loại theo phương pháp điều khiển

Có 2 kiểu điều khiển là điều khiển hở và điều khiển kín

- Điều khiển hở, dùng truyền động bước (dùng động cơ điện hoặc động cơ thủy lực, khí nén ) mà quãng đường hoặc góc dịch chuyển tỉ lệ với số xung điều khiển Kiểu này đơn giản nhưng độ chính xác thấp

- Điều khiển kín (điều khiển servo) sử dụng tín hiệu phản hồi vị trí để tăng

độ chính xác điều khiển Có 2 kiểu điều khiển kín là điểm - điểm và điều khiển đường

 Điều khiển điểm - điểm (Point to Point): phần công tác dịnh chuyển từ điểm này đến điểm kia theo đường thẳng với tốc độ không cao Nó chỉ làm việc tại các điểm dừng Kiểu điều khiển này dùng trên các robot hàn điểm, vận chuyển, tán đinh, bắn đinh…

Trang 15

 Điều khiển theo đường (Contour): đảm bảo cho phần công tác dịch chuyển theo quỹ đạo bất kì với tốc độ có thể điều khiển được Kiều điều khiển này dùng trên các robot hàn hồ quang, phun sơn,

3 Phân loại theo hệ thống năng lượng

Dựa vào cơ cấu sinh nguồn năng lượng động lực ta chia ra thành 2 loại

Thường dùng các động cơ truyền động là động cơ một chiều hoặc động cơ bước Với hệ này có đặc điểm là hoạt động chính xác, tin cậy, ít phần tử phi tuyến

dễ điều khiển, ngoài ra còn có một số đặc tính khác như kết cấu gọn nhẹ, hệ truyền năng lượng đơn giản nhưng có nhược điểm là cho hệ số quá tải thấp

Đối với hệ thuỷ lực có thể đạt công suất cao, đáp ứng được những điều kiện làm việc nặng nề, tuy nhiên hệ này thường có kết cấu cồng kềnh do cấu tạo có thêm

bể dầu, van lọc, hệ thống dẫn ngược ngoài ra với hệ này sử dụng thuỷ lực có độ phi tuyến cao do vậy điều khiển khó

Với hệ khí nén có cấu tạo gọn nhẹ hơn do không cần dẫn ngược, nhưng phải gắn liền với một trung tâm tạo khí nén Hệ này làm việc với công suất trung bình và nhỏ, kém chính xác

Như vậy hệ năng lượng điện điều khiển chính xác dễ điều khiển, kết cấu gọn nhẹ nhưng công suất hạn chế, không cho phép quá tải lớn do vậy hệ này chỉ phù hợp với hệ công suất trung bình và nhỏ và yêu câù thao tác chính xác cao Đối với

hệ năng lượng thuỷ lực và khí động thì có kết cấu cồng kềnh điều khiển khó nhưng

bù lại có hệ số quá tải lớn do vậy với hệ này thì phù hợp với tải có công suất lớn và yêu cầu chính xác truyền động không cao

Trang 16

1.1.3 Sơ đồ tổ chức kỹ thuật của Robot

Tổ chức kỹ thuật của Robot được chia thành 4 khối chức năng chính được minh hoạ như Hình 1.3

Khối A:

Gồm hai thành phần:

 Teach pendant: Có nhiệm vụ thực hiện các quá trình dạy học cho Robot

 Record buttum: Lưu trữ và chuyển giao các dữ liệu cảm nhận vật lý trong quá trình học gọi là “Bộ cảm nhận vật lý” thông qua khối này tín hiệu đặc trưng cho độ dài và toạ độ góc của vị trí đầu và vị trí cuối của quỹ đạo chuyển động được cảm nhận

Ví dụ :  0,h0;f,h f  

Khối B:

Là khối xử lý của Robot gồm các cụm vi xử lý để giải quyết các vấn đề sau :

Hình 1.3 Sơ đồ tổ chức kỹ thuật của Robot

Inverts Kinematic

Cartesianpont storage

Trajectory Phaner

Motor Dymanic

Robot Dynamic

Physical Postion Computer

Block A

Block B

Block D Block C

Trang 17

 Nhóm Forword Kinematic: Thiết lập và giải các bài toán động học trên cơ sở

 Nhóm Cartesian Point Storage: Lưu trữ và chuyển giao các kết quả của quá trình giải “Bài toán động học thuận”

 Nhóm Trajectory Planer: Lập trình quỹ đạo đi qua các điểm đã hoặc chưa “Dạy”

Thông qua sự chia ra từng khối theo tổ chức kỹ thuật cho thấy có ba bộ thông số chủ yếu sau :

 Bộ thông số cảm nhận vị trí;

 Bộ thông số hình học;

 Bộ thông số điều khiển

Nó được biến đổi và chuyển liên tục từ nhóm chức năng này sang nhóm chức năng khác (Được thể hiện bằng ký hiệu trên hệ thống) Do đó nhiệm vụ chủ yếu của quá trình thiết kế động học Robot là thiết lập giải bài toán động học thuận và bài toán động học ngược Kết quả tìm được sẽ đóng vai trò quan trọng trong việc đưa ra tín hiệu điều khiển chính xác theo mong muốn

s

Trang 18

1.2 PHƯƠNG TRÌNH ĐỘNG HỌC CỦA ROBOT

Với robot công nghiệp có nhiều loại khác nhau và sử dụng nhiều luật điều khiển khác nhau Trong khuôn khổ luận văn này tác giả khảo sát robot 2 bậc tự do dùng Feedback kết hợp LFFC (Learning Feedforward Control) trên cơ sở điều khiển thích nghi theo mô hình mẫu(MRAS)

Phương trình động học của robot hai bậc tự do được miêu tả bởi công thức sau: [2]

Với:

Trong hình sau mô tả mô hình robot 2 bậc tự do:

Hình 1.4 Mô hình robot 2 bậc tự do

Phương trình động học của robot 2 bậc tự do được chỉ ra bởi biểu thức (1.2) sau:

Trang 19

1 2 2

2 1 1 1 2 1 2 2 2

2 2

1

2 1 2 1 2 1 2

1 2

2

1

2 2 2 2 1 2 2 2

2

1

2

1 2

2 2 2 1

1 2

2 2 1 2

2

2 2 2 1 2 2 1 2 1 2 1 2 2 1 2

sin

sin sin

2

cos 2

u

u l

gm

m m gl

l gm s

s

d

d m

l

m l l m

l

l m r

J m

l l l

m l l m l l l

l l

0

,0

0

1 1

1

1 1

I

u M

S M G

M

D M

C M

I

(1.3)

I

C1

Trang 20

Như vậy có thể kết luận rằng: Góc quay của cánh tay robot có thể được điều khiển bởi LFFC Tín hiệu điều khiển Feed – forward mong muốn là:

u d Cd,ddDd G d Ssgn   d Md d (1.6)

Từ (1.6)cho thấy tín hiệu đầu vào khối điều khiển sau khi đã đơn giản hóa bao gồm

Trang 21

CHƯƠNG 2 TỔNG QUAN VỀ LEARNING FEED FORWARD CONTROL(LFFC) VÀ

MODEL REFERENCE ADAPTIVE SYSTEM(MRAS)

để tạo ra các sản phẩm có chất lượng tốt hơn Điều này được nhìn nhận trong thị trường đối với sản phẩm mà chúng ta sẽ xem xết trong luận văn này, ví dụ như các

hệ thống truyền động cơ điện tử Theo quan điểm cơ điện tử, chất lượng của các hệ thống cơ điện tử có thể được cải tiến bằng việc thay đổi thiết kế cơ khí và bộ điều khiển Ví dụ như khi nghiên cứu các cánh tay robot, nơi mà chuyển động chính xác phụ thuộc vào độ cứng và quán tính của hệ thống Nếu cánh tay không đạt được các yêu cầu nhất định, độ cứng của nó có thể tăng lên hoặc quán tính của nó có thể được giảm bớt bằng cách thay đổi kết cấu cơ khí hoặc bằng việc ứng dụng các vật liệu mới

Việc thay đổi điều khiển có thể được thực hiện hoặc bằng cách thay đổi thông số của bộ điều khiển đang tồn tại hoặc bằng cách thiết kế bộ điều khiển mới Khi một bộ điều khiển được cải tiến, chỉ đơn thuần là yêu cầu thay đổi phần mềm

và trong một số trường hợp là thêm các sensor cách đánh giá này tương đối dễ dàng thực hiệ được, khi đem so sánh với các cấu trúc tương ứng Trong luận văn này, tác giả sẽ tập trung vào việc nâng cao chất lượng của hệ thống bằng bộ điều khiển

Việc thiết kế một bộ điều khiển nói chung thường dựa trên một mô hình của một đối tượng Mô hình đối tượng càng chính xác bao nhiêu thì việc thiết kế bộ

Trang 22

điều khiển càng hiệu quả bấy nhiêu Khi mô hình hóa đối tượng, các vấn đề sau có thể gặp phải:

- Hệ thống quá phức tạp để có thể hiểu được hoặc trình bày một cách đơn giản

- Mô hình quá khó hoặc quá đắt để đánh giá Một số đặc tính của một số tính chất (phi tuyến) khó có thể đạt được, ví dụ như ma sát…

- Đối tượng có thể chịu ảnh hưởng lớn của nhiễu tác động từ môi trường, điều này khó dự đoán trước được

- Các thông số của đối tượng có thể biến đổi theo thời gian

Bộ điều khiển thích nghi có thế là một giải pháp khi cấu trúc của mô hình động học của đối tượng và nhiễu mô hình tác động lên nó được biết trước trong khi các giá trị của các thông số thì không thể xác định được Khi mô hình không xác định hoặc có nhiều thông số không xác định thì lúc đó điều khiển học sẽ được xét đến

2.1.2 Điều khiển học (Learning Control - LC)

Các bộ LC thường được hình dung gần giống như là một hệ thống điều khiển của con người và do đó nó có các thuộc thính giống với con người Trong luận văn này không nghiên cứu bộ LC theo quan điểm sinh học nhưng đồng ý với một số định nghĩa sau:

Định nghĩa 2.1: Một bộ LC là một hệ thống điều khiển bao gồm trong đó 1 hàm xấp xỉ các ánh xạ đầu vào – đầu ra tương ứng trong suốt quá trình điều khiển

mà một hoạt động mong muốn của hệ thống điều khiển đạt được

Định nghĩa 2.2 (hàm xấp xỉ): Một hàm xấp xỉ là một ánh xạ vào/ra được xác

Lưu ý 2.1 (điều khiển tự học và điều khiển thích nghi): Theo hướng này, điều khiển thích nghi có thể được xem xét giống như là một dạng của LC trong đó một hàm xấp xỉ được sử dụng có thể chỉ xấp xỉ một lớp giới hạn của mục tiêu Nói chung, một bộ LC sẽ bao gồm một hàm xấp xỉ cho một đối tượng có nhiều hàm mục tiêu hơn

Trang 23

Một biến mở rộng của các hàm xấp xỉ có thể được sử dụng như mạng nơ ron, mạng mờ - nơ ron (cũng được biết đến với tên các bộ điều khiển logic mờ thích nghi) v v Nói chung một cách sơ bộ, các bộ hàm xấp xỉ có thể được sử dụng theo

2 cách:

Trước hết, hàm xấp xỉ có thể được sử dụng để tạo (một phần) tín hiệu điều khiển Việc học được thay thế bới việc thích nghi véc tơ thông số của hàm xấp xỉ theo cách mà một số các hàm giá trị chứa đựng sai lệch điều khiển là cực tiểu Bộ điều khiển này được gọi là LC trực tiếp

Thứ hai, hàm xấp xỉ có thể được sử dụng để học một mô hình đối tượng tương ứng được kiểm soát ví dụ như là để làm giảm giá trị của sai số dự báo Dựa trên cơ sở của mô hình đã được học một bộ điều khiển được xây dựng, bộ điều khiển này được gọi là LC gián tiếp

Từ khi bộ LC đầu tiên được phát triển vào năm 1963 cho tới nay, lĩnh vực

LC đã và đang phát triển rất rộng rãi Rất nhiều các cấu trúc của bộ điều khiển khác nhau đã được đề xuất và các thuộc tính của chúng (như tính ổn định và tốc độ hội tụ

đã được phân tích cả trong thực tế và lý thuyết) Tuy nhiên, mặc dù tất cả chúng đều được nghiên cứu nhưng chỉ có một số bộ LC được ứng dụng trong sản phẩm mang tính thương mại Có thể vì những lý do sau đây:

Việc chứng minh sự ổn định được đánh giá cao Phần lớn các nghiên cứu lý thuyết của bộ LC được tập trung vào tính ổn định Tuy nhiên, một bộ LC ổn định cũng không cần thiết mang lại một đáp ứng ngắn hạn học tốt….Hoạt động của bộ

LC đối với một con robot đã được quan sát bằng mô phỏng Sau khi thực hiện với chuyển động 6 bậc tự do, sai số hiệu chỉnh giảm xuống hệ số 2.8 Khi tiếp tục tự

tại bước lặp thứ 62.000 và cuối cùng giảm

số hiệu chỉnh nhỏ đã đạt được nhưng bộ LC không có giá trị thực nghiệm vì nó có dải sai số hiệu chỉnh rất rộng ở giữa

Không nên quá quan tâm tới sai số hiệu chỉnh điểm 0 Một số LC cố gắng đạt được sai số hiệu chỉnh điểm 0 Tuy nhiên, điều này yêu cầu có những tín hiệu điều khiển lớn ở những tần số trên băng thông hệ thống, các tần số này có thể gây

Trang 24

nguy hiểm cho các cơ cấu chấp hành và nói chung là không đạt được như mong muốn Loại sai số của hàm xấp xỉ Trong đại đa số các bộ LC, hàm xấp xỉ được thực hiện với vai trò như một mạng nơ ron (Multi Layer Perceptron – MLP) Như chúng tôi sẽ bàn tới ở dưới đây, loại mạng nơ ron này không tương thích một cách đặc biệt cho việc điều khiển

Trên cơ sở những suy xét này, chúng ta có thể đưa ra một số các thuộc tính sau mà một bộ LC nên để trở thành một mặt hàng ưa chuộng về mặt thương mại:

Dễ dàng sử dụng trong một hệ thống điều khiển có sẵn Điều này có nghĩa

là khi một đáp ứng ngắn hạn học tốt thì hiệu suất cực tiểu được bảo đảm Ví dụ như

là trong một bộ điều khiển hiện nay Thậm chí trong suốt quá trình huấn luyện đối tượng vẫn có thể được duy trì trong quá trình vận hành mà không gây ra những tổn thất của quá trình sản xuất

Có khả năng sử dụng những kiến thức dự đoán của đối tượng Nói chung các nhà thiết kế và/hoặc người vận hành có một số kiến thức về đối tượng, ví dụ như trong cấu trúc của mô hình toán học( đơn giản) dưới dạng các hàm, một giản đồ Bode của đối tượng hoặc một mô tả dưới dạng biến ngôn ngữ của hành vi đối tượng Bộ LC nên cho phép loại kiến thức này được kết hợp vào trong thiết kế bộ điều khiển, để chọn các thông số của bộ điều khiển hợp lý và để tốc độ lệ học

Hàm xấp xỉ nên phù hợp cho việc điều khiển Điều này có nghĩa rằng: Cần sử dụng dung lượng nhớ nhỏ Trong thực tế, bộ điều khiển được thực hiện bằng phần mềm được gắn vào máy tính Dung lượng bộ nhớ là có hạn, do đó

số lượng các thông số của hàm xấp xỉ mà yêu cầu phải xấp xỉ tín hiệu điều khiển không thể quá rộng

Việc tính toán đầu ra của hàm xấp xỉ và sự tương thích của quan hệ vào/ra phải được thực hiện một cách nhanh chóng Trong môi trường thời gian thực, trong một khoảng thời gian lấy mẫu, các thông số của hàm xấp xỉ phải tương ứng

và đầu ra tính được Rất nhiều hệ thống chuyển động cơ điện tử yêu cầu thời gian mẫu nhỏ và cho phép thời gian tính toán là rất ít Các hàm xấp xỉ mà bao gồm một lượng lớn các tính toán phức tạp do đó chúng không phù hợp cho việc điều khiển

Trang 25

Cơ chế học cần hội tụ nhanh Để giữ được lượng thời gian trong đó quá trình vận hành của hệ thống được điều khiển tối ưu từng phần, tiến tới mức cực tiểu, cơ chế học cần hội tụ nhanh

Cơ chế học không nên bị cực tiểu cục bộ, khi bị lưu giữ trong mức cực tiểu cục bộ, thì cơ chế học cho rằng các giá trị đạt được của các thông số của hàm

)

( loc

Hình 2.1 Cực tiểu cục bộ trong kỹ thuật học

Trong hình dưới đây một ví dụ theo một chiều của hiện tượng như vậy được

cấu học mà sử chỉ sử dụng gradient của sai số xấp xỉ thì không thể thoát khỏi mức

cực tiểu cục bộ

Khi cơ chế học dễ dàng lưu lại ở mức tối thiểu cục bộ, rất khó để huấn luyện LC để thu được hiệu quả cao Quan hệ vào/ ra phải tương thích một cách cục

bộ Trong một số hàm xấp xỉ, quan hệ vào/ ra này là tương thích toàn cục Điều này

có nghĩa là nếu giá trị của một trong các thông số của hàm xấp xỉ được tương thích, thì quan hệ vào /ra trên toàn bộ phạm vi đầu vào bị thay đổi Xét một bộ LC được huấn luyện để thực hiện một số chuyển động Khi bộ LC được huấn luyện để thực hiện một chuyển động mới, điều này liên quan tới việc tương ứng các thông số của hàm xấp xỉ Bởi vì mối quan hệ vào ra được tương thích toàn cục nên các tín hiệu điều khiển học trước đó bị thay đổi có thể gây ra nhưng tổn thất trong quá trình làm

Trang 26

việc Do đó điều mong đợi ở đây là mối quan hệ vào ra của hàm xấp xỉ được tương thích một cách cục bộ Trong trường hợp này, việc học một chuyển động mới sẽ không làm thay đổi các tín hiệu đã được học trước đó

Hàm xấp xỉ có khả năng tự khái quát hoá tốt Khả năng tự khái quát hoá

là khả năng tạo ra một đầu ra nhạy cho một đầu vào không được thể hiện trong quá trình huấn luyện nhưng nó tương tự như các huấn luyện mẫu Khi hàm xấp xỉ

có khả năng khái quát hoá tốt, bộ LC cũng sẽ thu được một hiệu quả bám cao cho các chuyển động tương tự các chuyển động được huấn luyện Vì vậy nó đủ để huấn luyện LC với một lượng nhỏ các đặc tính chuyển động huấn luyện Khi bộ xấp xỉ không có khả năng tự khái quát hoá tốt, bộ LC phải được huấn luyện cho mỗi chuyển động quan trọng, nó tạo ra một quá trình huấn luyện mở rộng

Sự mềm mại của giá trị xấp xỉ cần điều khiển được Như nói ở phần trước

đây, bộ LC không chỉ thu được sai số bằng không đối với một vài tần số, khi tín hiệu điều khiển có tần số cao sẽ không thỏa mãn theo mong muốn Người sử dụng phải có khả năng quyết định tần số lớn nhất của đầu ra của hàm xấp xỉ

Đáp ứng ngắn hạn là học tốt Đáp ứng ngắn hạn của bộ LC nên là loại đáp

ứng mà có sai số bám dần hội tụ về giá trị mong muốn Việc tăng sai số bám trong pha trung gian của quá trình học có thể làm hỏng đối tượng, hơn thế nữa, đây là trường hợp quá trình làm việc tối thiểu có thể không còn được bảo đảm khi bộ điều khiển được sử dụng như một thiết bị ghép thêm cho một bộ điều khiển đã có sẵn

Sự ổn định lâu dài cần phải được bảo đảm Việc tự học có thể được thực

hiện một cách liên tục hoặc được thực hiện trước khi vận hành Việc học liên tục được yêu cầu khi các thông số của đối tượng thay đổi trong suốt quá trình vận hành Ví dụ, do hao mòn hay chịu ảnh hưởng của môi trường Trong trường hợp này, một bộ điều khiển phải có khả năng đảm bảo việc học ổn định bất chấp các điều kiện vận hành thay đổi như thế nào

2.1.3 Bộ điều khiển học sử dụng sai lệch phản hồi (Feedback Error Learning - FEL)

2.1.3.1 Cấu trúc điều khiển

Trang 27

Một bộ LC thú vị cho các cánh tay robot mà phải bám theo các quỹ đạo ngẫu nhiên Nói chung bộ điều khiển này được biết đến với cái tên là bộ điều khiển học sai lệch phản hồi: Bộ điều khiển (Feedback Error Learning- FEL)

Hệ thống LC bao gồm 2 phần:

Bộ điều khiển Feef-forward được biểu thị bằng F, nghĩa là 1 hàm/ánh xạ

 r

F

bù thêm cho các hệ thống động học và theo cách này sẽ thu được độ bám chính xác cao Khi bộ điều khiển feed-forward bằng với đối tượng nghịch đảo

1



Hình 2.2 Bộ điều khiển phản hồi sai lệch (FEL)

Hình 2.2: Bộ điều khiển phản hồi sai lệch

nhiễu ngẫu nhiên và nhiễu có bản chất chu kỳ Những nhiễu chu kỳ tái diễn giống nhau khi một chuyển động cụ thể được lặp lại Điều này có nghĩa rằng chúng có thể được xem xét như một hàm trạng thái của đối tượng x và có thể lường trước

Hình 2.3 Đối tượng và nhiễu phát sinh

Hàm xấp xỉ

P

d(x)

+ +

u

x

y

Trang 28

2.1.3.2 Một ví dụ về ma sát phụ thuộc vị trí:

Giống như đối tượng động học, các nhiễu tái sinh có thể được bù bởi một

bộ điều khiển feed-forward

Để bù chính xác cho hệ thống động học và nhiễu tái sinh, yêu cầu cần phải

có một mô hình chi tiết Sự không chính xác về mô hình có thể làm cho bộ điều khiển feed-forward vận hành kém Khi một mô hình chính xác khó có thể xác định được, thì một phương pháp thay thế có thể được thực hiện

Thay vì đi thiết kế một bộ điều khiển feed-forward dựa trên những đặc điểm

cơ bản của mô hình thực hiện bộ điều khiển feed-forward giống như là một hàm xấp

hàm xấp xỉ được tự thích ứng để học các đối tượng nghịch đảo và để bù các nhiễu phát sinh Khó khăn chính ở đây là lựa chọn tín hiệu học mà chỉ ra được mối quan hệ vào/ra của hàm xấp xỉ phải được tương thích như thế nào Tín hiệu học có thể thu được theo rất nhiều cách Theo lý thuyết đã chứng minh chỉ ra rằng khi đầu

ra của bộ điều khiển phản hồi được sử dụng làm tín hiệu học thì quan hệ vào/ra của hàm xấp xỉ hội tụ tới đối tượng nghịch đảo và giá trị bù của nhiễu tái sinh Loại hàm xấp xỉ mà chúng ta sử dụng ở đây là mạng nơ ron MLP

3 , 3 , 3 , 2 , 2 , 2 , 1 , 1 , 1

r d d d d d d d d d T (2.1) Trong trường hợp cánh tay 3 bậc tự do DOF (Degrees Of Freedom), đầu vào

3 2

 (2.2)

Bộ điều khiển phản phản hồi Như đã được nói tới, bộ điều khiển phản hồi trạng thái, đem lại các tín hiệu học cho bộ điều khiển feed-forward Hơn thế, nó xác định quá trình bám cực tiểu tại thời điểm bắt đầu học Cuối cùng, bộ điều khiển phản hồi bù các nhiễu ngẫu nhiên Bộ điều khiển FEL đã được thực hiện trong nhiều ứng dụng của nhiều tác giả; ví dụ như là:

Hệ thống phanh tự động ô tô

Điều khiển hệ thống camera

Trang 29

Điều khiển cánh tay robot

Dễ dàng sử dụng trên hệ thống điều khiển có sẵn Sự mở rộng duy nhất đối với hệ thống điều khiển có sẵn là hàm xấp xỉ Khi hệ thống điều khiển được thực hiện bằng phần mềm điều này yêu cầu ít có sự thay đổi và có thể dễ dàng được thực hiện

Sự hợp nhất các kiến thức quan trọng trong thiết kế Khi cấu trúc của đối tượng động học được xác định, thì mạng MLP trong bộ điều khiển feed-forward có thể tách ra thành một vài mạng MLP nhỏ hơn Mỗi một mạng con này sẽ bù cho một phần riêng biệt của đối tượng động học Những thí nghiệm đã chỉ ra rằng mạng này đã nâng tốc độ học lên đáng kể

Trang 30

Sự ổn định được xác lập Điều này đã được chứng minh bằng lý thuyết rằng

bộ điều khiển FEL sử dụng cho điều khiển cánh tay robot cho kết quả là hội tụ Với các hệ thống khác, sự ổn định chưa được xét đến trên phương diện lý thuyết

Đáp ứng ngắn hạn tốt Trong quá trình học, sai lệch bám sẽ dần hội tụ đến giá trị cực tiểu của nó Giống như sự ổn định, đáp ứng ngắn hạn cũng chưa được xét tới trên phương diện lý thuyết

Hàm xấp xỉ phù hợp cho việc điều khiển Rất nhiều các giá trị thực của bộ một LC phụ thuộc vào loại hàm xấp xỉ được sử dụng Mặc dù thực tế là bộ điều khiển FEL cũng đạt được chất lượng bám cao nhưng cách học không phải là tối

ưu cho mạng MLP

Yêu cầu bộ nhớ nhỏ Một trong số những thuộc tính tốt của MLP là nó

có thể xấp xỉ các hàm mục tiêu đa chiều với một số ít các thông số Do đó tổng dung lượng bộ nhớ của máy tính yêu cầu cho việc thực hiện là rất nhỏ Tốn kém cho việc tính toán giá trị Việc tính toán đầu ra của mạng MLP và trọng số của bộ thích nghi bao gồm một số lượng lớn các tính toán phức tạp Do đó, với một

số ứng dụng điều khiển thời gian thực thì loại mạng mạng nơ ron này có thể không phù hợp

Cơ chế học hội tụ chậm và trải qua vùng giá trị cực tiểu cục bộ Cơ chế học

dễ dàng đạt được tại vùng giá trị cực tiểu cục bộ Hàm trọng lượng của mạng kết thúc ở vùng cực tiểu nào phụ thuộc vào hàm trọng lượng ban đầu của mạng Do đó

nó cần phải thực hiện nhiều thử nghiệm huấn luyện mạng với các cài đặt hàm trọng lượng ban đầu khác nhau, để thu được độ bám chính xác có thể chấp nhận được

Có khả năng tổng quát hoá tốt Một thuận lợi thực tế là mối quan hệ vào ra chỉ có thể thích ứng toàn bộ đó là khi MLP có khả năng tổng quát tốt khi quá trình huấn luyện được thực hiện một cách tổng thể Khi một hệ thống chuyển động phải vận hành ở tốc độ thấp, bộ điều khiển FEL có khuynh hướng đưa ra hiệu suất kém Điều này là do thực tế mạng MLP gặp khó khăn trong việc học các dữ liệu có tương quan với nhau ở mức cao Khi các dữ liệu có tương quan với nhau ở mức cao, mạng có khuynh hướng chuẩn hoá tín hiệu theo dữ liệu cuối cùng, kết quả là đưa ra khả năng khái quát hoá kém

Trang 31

Sự trơn tru của các giá trị xấp xỉ là không hoàn toàn điều khiển được Số lượng các thông số của một bộ MLP quyết định tính chính xác cực đại của giá trị xấp xỉ Nó không đảm bảo được độ trơn tru nhất định Nhờ việc học, mạng MLP có thể xấp xỉ rất gần các hàm mục tiêu trong phạm vi đầu vào và rất chính xác ở phần còn lại

Nhìn vào các thuộc tính ở trên, ta có thể kết luận rằng trong trường hợp mà cách học tốt, bộ điều khiển FEL có khả năng đáp ứng rất tốt Các nghiên cứu khác nhau nhằm mục đích khắc phục các vấn đề tồn tại của bộ điều khiển FEL Theo đó

ta sẽ giới thiệu tóm lược 3 phương pháp: 2 phương pháp đầu thay đổi cấu trúc của

bộ điều khiển học Trong khi ở phương pháp còn lại sử dụng hàm xấp xỉ

Trước tiên, phương pháp thứ nhất có thể cải thiện cách học bằng cách chọn các đầu vào khác nhau cho hàm xấp xỉ Sai số tín hiệu được thêm vào như một đầu vào của bộ xấp xỉ, điều này sẽ làm thay đổi bộ điều khiển LC từ chỗ hoàn toàn là 1

bộ điều khiển feed-forward nguyên bản chuyển sang bộ điều khiển feed-forward dưới đây Các thí nghiệm đã chỉ ra rằng bộ LC này khắc phục được một số lỗi của

bộ điều khiển FEL gốc

Hình 2.4 Học theo sai số phản hồi

Phương thức thứ 2 là sử dụng nhiều bộ điều khiển feed-forward, mỗi một

bộ được huấn luyện để thực hiện một nhiệm vụ cụ thể Mỗi một mạng nơ ron giám sát học xem là bộ feed-forward nào được sử dụng cho nhiệm vụ nào Bộ LC này đã được kiểm tra trên tay máy mà phải thực hiện các chuyển động với các đối tượng có

y

Trang 32

trọng lượng khác nhau Sau khi học, mỗi bộ điều khiển feed-forward đã học sẽ phải đảm nhiệm cho một đối tượng xác định Mạng giám sát đã học từ bộ điều khiển feed-forward nào được áp dụng cho đối tượng đó

Khi mạng MLP là nguyên nhân chính gây nên các khó khăn của điều khiển FEL, một phương pháp rõ ràng ở đây là phải tìm ra những hàm xấp xỉ khác nhau Mạng MLP được thay thế bởi mạng (Cerebellar Model Articulation Controller CMAC) Mạng CMAC phụ thuộc vào các lớp mạng nơ ron mà làm việc với hàm cơ

sở Trong trường hợp mạng CMAC, hàm cơ sở bao gồm các hàm đa thức thông minh mà có giá trị khác không trên phần không gian đầu vào Ở mỗi điểm trong không gian đầu vào p các hàm cơ sở chồng chéo lên nhau Thông số của p được biết đến như là một thông số khái quát hoá và có thể được lựa chọn bởi nhà thiết kế Đầu

ra của CMAC là tổng các trọng số của hàm ước lượng cơ sở Việc học được tiến hành bằng cách mô phỏng theo các trọng số của mạng, chứ không phải là theo bản thân các hàm cơ sở Tất cả điều này nhằm mục đích cải thiện những vấn đề sau:

- Độ hội tụ nhanh hơn Khi việc học diễn ra một cách cục bộ, chỉ có 1 số nhỏ các hàm trọng được thích nghi tạo ra độ hội tụ nhanh

- Có thể học các dữ liệu tương quan Các vùng của hàm cơ sở đã được trộn lẫn, điều này có ích cho quá trình học các dữ liệu tương quan

- Không có cực tiểu cục bộ Cơ cấu học không trải qua vùng cực tiểu cục

và độ bám chính xác hơn

Trang 33

2.1.4 Learning Feed forward Control (LFFC)

Trong luận văn này một hệ thống LC được xét có cấu trúc tương tự như cấu trúc của bộ điều khiển FEL (hình 2.2) Tuy nhiên, phần feed-forward của bộ điều

theo mô hình mẫu

Trang 34

2.2 ĐIỀU KHIỂN THÍCH NGHI THEO MÔ HÌNH MẪU

Hệ thống điều khiển thích nghi là hệ thống mà cấu trúc và tham số của bộ điều khiển có thể thay đổi theo sự biến thiên thông số của hệ sao cho đảm bảo các chỉ tiêu đã định Hệ thống điều khiển thích nghi theo mô hình mẫu có nhiều dạng khác nhau Chúng ta bắt đầu bằng một cách tiếp cận trực giác, chỉ ra rằng các ý tưởng hồi tiếp cơ sở giúp chúng ta tìm ra các thuật toán hiệu chỉnh tham số Chúng

ta chú ý rằng sẽ có hai câu hỏi nảy sinh ra Thứ nhất đó là làm thế nào để tìm các tín hiệu thích hợp mà hiệu chỉnh các tham số thích hợp ở những thời điểm thích hợp Thứ hai là làm thế nào để đảm bảo sự ổn định cho một hệ thống thích nghi mà vốn đã phi tuyến do sự xuất hiện của các bộ nhân trong hệ thống Chúng ra sẽ có cái nhìn sâu hơn đối với câu hỏi đầu tiên bằng cách xét phương pháp mô hình nhạy cảm Sự ổ định có thể được bảo đảm bằng cách ứng dụng lý thuyết ổn định Liapunov’s cho việc thiết kế các hệ thống thích nghi

2.2.1 Khái quát chung

Có những cấu trúc khác nhau mà có thể mang đến cho một hệ thống điều khiển khả năng phản ứng với những thay đổi trong các tham số của nó hoặc với sự thay đổi các đặc tính của nhiễu Một hệ thống hồi tiếp thông thường cũng có mục tiêu là làm giảm độ nhạy cảm của các dạng thay đổi này Tuy nhiên, khi những sự thay đổi là lớn, thậm chí một hệ thống hồi tiếp hệ số khuếch đại hằng số thiết kế chuẩn sẽ không hoạt động một cách như mong muốn Khi đó một cấu trúc bộ điều

khiển phức tạp hơn được yêu cầu và các thuộc tính thích nghi đã biết phải được đưa

ra Một hệ thống thích nghi có thể được định nghĩa như sau:

“ Một hệ thống thích nghi là một hệ thống mà trong đó thêm vào cấu trúc (hồi tiếp) cơ bản, các phép đo tường minh được thực hiện để bù tự động cho những thay đổi về các điều kiện hoạt động, cho những thay đổi về động học quá trình hoặc cho những thay đổi về nhiễu, để duy trì một hoạt động tối ưu của hệ thống”

Nhiều định nghĩa khác đã được đưa ra trong tài liệu; hầu hết chúng chỉ miêu

tả một lớp điển hình của các hệ thống thích nghi

Định nghĩa được đưa ra ở đây … một cấu trúc hồi tiếp thông thường đầu tiên phản ứng đối với sự thay đổi của nhiễu và tham số Ở một cấp độ thứ hai một cơ

Trang 35

chế thích nghi hiệu chỉnh các hệ số khuếch đại của bộ điều khiển sơ cấp, thay đổi cấu trúc của nó, và tạo ra các tín hiệu bổ sung … Trong một hệ thống thích nghi như vậy những thiết lập mà được hiệu chỉnh bởi người sử dụng ở cấp độ thứ hai

Dựa trên định nghĩa thì sự thay đổi tự động từ một chế độ hoạt động này sang một chế độ khác được xem như là một đặc trưng thích nghi Việc sử dụng kiến thức về ảnh hưởng của một biến bên ngoài đối với hoạt động của một hệ thống cũng

là một đặc trưng thích nghi Dạng thích nghi này có thể được nhận thấy theo hai cách khác nhau: hoặc thông qua việc đo lường những nhiễu riêng và tạo ra các tín hiệu để bù chúng (điều khiển feedforward), hoặc thông qua việc hiệu chỉnh các hệ

số khuếch đại của bộ điều khiển hồi tiếp theo một chương trình dựa trên kiến thức

về ảnh hưởng của các biến lên tham số hệ thống (gain scheduling) Khả năng khác

là sử dụng một ngân hàng các bộ điều khiển và lựa chọn bộ điều khiển tốt nhất theo

một cách tương tự với gain scheduling Đây được gọi là sự chuyển chế độ Sự mới

mẻ ở ý tưởng này là một phương pháp tiếp cận đa mô hình Đầu ra của tất cả các mô hình trong ngân hàng của các mô hình được so sánh với đầu ra của đối tượng được điều khiển Một bộ điều khiển có thể được thiết kế và thực hiện dựa trên mô hình

mà đầu ra của nó tương đồng nhất với đầu ra của đối tượng Trong thực tế không thể áp dụng điều khiển feedfoward hoặc gain scheduling đối với nhiều biến khác nhau

Một vài dạng của hệ thống thích nghi, hiểu một cách chính xác, đã được phát triển để cho phép hệ thống được tối ưu hóa mà không cần quan tâm đến nguyên nhân của những sự thay đổi động học đối tượng Thông thường khái niệm điều khiển thích nghi được giới hạn theo những dạng hệ thống thích nghi này Không có

sự phân biệt rõ ràng giữa điều khiển thích nghi và learning control Khái niệm learning control thường được sử dụng cho những hệ thống phức tạp hơn ở đó chứa đựng nhiều bộ nhớ và cho những bài toán mà không thể giải quyết được bằng phương pháp của các bộ điều khiển tiêu chuẩn, dựa trên hàm truyền, bởi vì chúng yêu cầu hình thức khác của sự biểu diễn kiến thức, ví dụ, cấu trúc mạng nơron Bài viết này đề cập đến một dạng đặc biệt của điều khiển thích nghi, đó là Điều khiển Thích nghi Mô hình Mẫu

Trang 36

Các hệ thống điều khiển thích nghi có thể được phân loại theo nhiều cách khác nhau Một trong những cách phân loại đó là dựa trên sự khác nhau giữa:

- Những hệ thống với sự điều chỉnh trực tiếp của các tham số của bộ điều

khiển, không cần nhận dạng rõ ràng các tham số của đối tượng (điều khiển thích

nghi trực tiếp)

- Những hệ thống với sự điều chỉnh gián tiếp của các tham số bộ điều khiển,

không cần nhận dạng rõ ràng các tham số của đối tượng (điều khiển thích nghi gián

tiếp)

Các hệ thống điều khiển thích nghi mô hình mẫu, hầu hết đều sử dụng MRAC hoặc MRAS, chủ yếu được áp dụng cho điều khiển thích nghi trực tiếp Tuy nhiên, dưới đây sẽ chứng minh ứng dụng của MRAS để nhận dạng hệ thống

Triết lý cơ bản đối với ứng dụng của MRAS là hiệu suất mong muốn của hệ thống được đưa ra bởi một mô hình toán học, mô hình mẫu Khi hoạt động của mạch khác với hoạt động “lý tưởng”, mà được xác định bởi mô hình mẫu, đối tượng

sẽ được thay đổi, hoặc bằng hiệu chỉnh các tham số của bộ điều khiển (hình 2.5) hoặc bằng tạo ra một tính hiệu đầu vào bổ sung cho đối tượng (hình 2.6) Những thay đổi này được chuyển thành một bài toán tối ưu, đó là tối giản hóa tiêu chuẩn:

ở đó

e = y m - y p

Thay vì việc chỉ tối tối thiểu hóa sai số giữa tín hiệu đầu ra của đối tượng và

mô hình mẫu, tất cả các biến trạng thái cùa đối tượng và mô hình mẫu có thể được

e = xm - xp (2.5) Trong trường hợp đó bài toán tối ưu hóa có thể được biến đổi thành tối giản hóa tiêu chuẩn:

T 2 0

(2.4)

(2.6)

Trang 37

ở đó P là một ma trận xác định dương

Hình 2.5 Hệ thích nghi tham số

Hình 2.6 Hệ thích nghi tín hiệu

Những sự xem xét dưới đây có thể đóng một vai trò trong việc lựa chọn giữa

sự thích nghi của các tham số và thích nghi tín hiệu Một đặc tính quan trọng của các hệ thống với thích nghi tham số là những hệ thống này có bộ nhớ Ngay khi các tham số của đối tượng được hiệu chỉnh tới giá trị chính xác, và không có một sự thay đổi mới nào, vòng thích nghi trên thực tế là không cần thiết nữa: đối tượng và

mô hình mẫu thể hiện như nhau Nhìn chung bộ nhớ không xuất hiện trong những

hệ thống với thích nghi tín hiệu Vì vậy, vòng thích nghi vẫn cần thiết trong tất cả

Trang 38

các trường hợp, để tạo ra một tín hiệu đầu vào chính xác Do đó, các hệ thống thích nghi tín hiệu phải phản ứng nhanh hơn để thay đổi động học đối tượng so với các hệ thống thích nghi tham số bởi vì không có kiến thức từ quá khứ được sử dụng Trong những hệ thống mà ở đó các tham số thay đổi liên tục trên một phạm vi rộng thì đây

là một ưu điểm Tuy nhiên, trong một môi trường ngẫu nhiên, tức là trong những hệ thống với nhiều nhiễu, việc này có thể là một nhược điểm Hệ số khuếch đại lớn trong vòng thích nghi cũng có thể dẫn tới nhiều nhiễu trong tín hiệu đầu vào

Khi các tham số của đối tượng thay đổi chậm hoặc không thường xuyên, các

hệ thống với thích nghi tham số sẽ mang đến một hiệu suất tốt hơn nhờ vào bộ nhớ của chúng Đồng thời cũng có những thuật toán thích nghi kết hợp ưu điểm của cả hai phương pháp này Ở nội dung tiếp theo chúng ta sẽ chủ yếu tập trung vào các hệ thống thích nghi tham số, mặc dù sự kế hợp của thích nghi tham số và tín hiệu cũng được đề cập đến

Một cách khác để quan sát hệ thống được trình bày dưới đây “Vòng điều khiển hồi tiếp tiêu chuẩn” được xem như là hệ thống điều khiển sơ cấp tác động mà phải loại bỏ nhiễu “thông thường” Những thay đổi lớn hơn của các tham số hoặc nhiễu lớn hơn được giải quyết bởi hệ thống điều khiển (thích nghi) cấp hai tác động chậm hơn (Hình 2.7)

Hình 2.7 Điều khiển sơ cấp và cấp hai

Trang 39

2.2.2 Cơ chế thích nghi

Trong các tài liệu một vài phương pháp đã được đưa ra để thiết kế các hệ thống thích nghi Nhưng ta có thể có được cái nhìn sâu hơn vào một phương pháp bằng cách tự tư duy làm thế nào để tìm ra được các thuật toán Việc này giúp ta thực

sự hiểu được phải làm gì tiếp theo Do đó, lúc này chúng ta sẽ tạm thời hoãn lại những vấn đề về toán học và phân tích những ý tưởng cơ bản của MRAS với một ví

dụ đơn giản Khi cố gắng thiết kế một bộ điều khiển thích nghi cho hệ thống đơn giản này, chúng ta sẽ bắt gặp những vấn đề mà phải cần đến một nền tảng lý thuyết vững chắc hơn Những những đặc điểm chung của những phương pháp thiết kế khác nhau cũng như là sự khác biệt của chúng sẽ trở lên rõ ràng Trong Hình 2.8 là

sơ đồ khối được đưa ra cho một hệ thống mà sẽ được dùng như là một ví dụ xuyên suốt tài liệu này

Hình 2.8 Mô hình mẫu và đối tượng

Trang 40

Trong ví dụ này, đối tượng (tuyến tính) được mô tả bằng hàm truyền:

Kω

này được thể hiện một cách trực tiếp từ hàm truyền của bộ điều khiển cộng đối tượng trong Hình 2.8:

K (t) = K (0) + β edt (2.11)

Định dạng
Số trang	89
Dung lượng	1,69 MB