Bài giảng hệ thống điều khiển thông minh chương 5 điều khiển thích nghi và điều khiển học

Sơ đồ khối hệ thống điều khiển thích nghi Hệ thống điều khiển trong đó thông số và cấu trúc của bộ điềukhiển thay đổi trong quá trình vận hành nhằm đảm bảo chất lượngđiều khiển khi có s

Trang 1

Môn học

HỆ THỐNG ĐIỀU KHIỂN THÔNG MINH

Giảng viên: TS Huỳnh Thái Hoàng

B ä â Đi à Khi å Tư Đ ä

Bộ môn Điều Khiển Tự Động

Khoa Điện – Điện Tử Đại học Bách Khoa TP.HCM Email: hthoang@hcmut edu vn Homepage: http://www4.hcmut.edu.vn/~hthoang

Trang 3

Điề khiể hí h hi

Nội dung chương 4

Điều khiển thích nghi

Điều khiển học

Trang 4

ĐIỀU KHIỂN THÍCH NGHI

Trang 5

Sơ đồ khối hệ thống điều khiển thích nghi

Hệ thống điều khiển trong đó thông số (và cấu trúc) của bộ điềukhiển thay đổi trong quá trình vận hành nhằm đảm bảo chất lượngđiều khiển khi có sự hiện diện của các yếu tố bất định hoặc biến đổikhông biết trước gọi là hệ thống điều khiển thích nghi

Trang 6

Phân loại hệ thống điều khiển thích nghi

Đối t

Đối tượng:

Tuyến tính hoặc phi tuyến

SISO hoặc MIMO (vuông, không vuông) ặ ( g, g g)

Hệ có bậc tương đối tổng quát

Có nhiễu hệ thống, nhiễu đo lường

Cơ sở của thuật toán điều khiển thích nghi:

Điều khiển hồi tiếp tuyến tính hóa p y

Điều khiển trượt

Thuật toán thích nghi:

Liên tục hoặc rời rạc

Trang 7

Đặt bài toán

Đối tượng: hệ phi tuyến SISO mô tả bởi phương trình vi phân:

⎨

⎧x& = f (x) + g(x)u

⎩

⎨ = )y h (x

Bài toán đặt ra là điều khiển tín hiệu ra y(t) bám theo tín hiệu đặt

Bài toán đặt ra là điều khiển tín hiệu ra y(t) bám theo tín hiệu đặt

y m (t)

Trang 8

Đối tượng điều khiển

Nếu đối tượng có bậc tương đối bằng r, đối tượng có thể được mô tả bằng phương trình sau:

u b

x x

L ( ) ( ) ( ) ( ) , , ( ) 1( ), ( )

1

x x

x

x x

f x

1

∂ k− φ

L

)(

)

()

(

1

x

f x

x x

∂

= φφ

k f k

f

L L

)

()

Trang 9

Luật điều khiển hồi tiếp tuyến tính hóa

L ật điề khiể hồi tiế t ế tí h hó

Luật điều khiển hồi tiếp tuyến tính hóa:

[ ( ) ( )]

) (

1 )

(

*

t v

a b

x

) (

b x

Trang 10

Các giả thiết

Trang 11

Tính ổn định của luật điều khiển hồi tiếp tuyến tính hóa

(t →

0)

(t →

⇒ y(t) bám theo ym (t) với sai số xác lập bằng 0

Trang 12

Ý tưởng điều khiển thích nghi

Điều khiển thích nghi trên cơ sở xấp xỉ luật điều khiển hồi tiếp tuyến tính hóa :

[ ( ) ( )]

1)

(

*

t v a

Lý do:

[ ( ) ( )]

)(

Lý do:

hàm a(x) và b(x) chưa biết

hoặc hàm a(x) và b(x) đã biết nhưng thay đổi trong quá trình vận hành

Hai phương pháp điều khiển thích nghi:

Điều khiển thích nghi gián tiếp

Điều khiển thích nghi trực tiếp

Trang 13

Điều khiển thích nghi gián tiếp

Nhận dạng trực tuyến a(x) và b(x) dùng mô hình và , sau

đó tính tín hiệu điều khiển theo nguyên lý chắc chắn tương đương

)(

ˆ x

a b (x)

[ ˆ ( ) ( )]

) ( ˆ

1 )

b

x x

Mô hình và có thể là mô hình mờ, mạng thần kinh hoặc mô hình hộp đen phi tuyến tổng quát

)(

ˆ x

a b ˆ x( )

)()

(

ˆ x a T a x

a =θ ξ

)()

(

ˆ x x

b

T b

b( ) =θb ξξb( )Các vector và là vector thông số của mô hình.θa θb

Trang 14

Điều khiển thích nghi gián tiếp (tt)

(sup

minarg

*

x

Tξθθ

b b

ξθ

a a

ξθ

θ

Gọi và là sai số giữa mô hình tối ưu và đặc tính động học chính xác của đối tượng Mô hình đúng của đối tượng có thể biểu diễn như sau:

()

(x a*T a x a x

a =θ ξ +δ

)()

()

(x b*T b x b x

b =θ ξ +δ

Trang 15

Điều khiển thích nghi gián tiếp (tt)

ố

Sai lệch giữa mô hình nhận dạng được và mô hình đúng của hệ thống:

)()

()(

~)

()

(

ˆ x x T a x a x

a t a

)()

()(

~)

()

(

b b

T

b t b

*

)()

(

~

a a

(

~

b b

b t θ t θ

hệ thống ổn định sử dụng thêm thành phần điều khiển trượt usi

Tín hiệu điều khiển là tổng gồm 2 thành phần:

u ce điều khiển hệ thống bám quỹ đạo chuẩn

u si đảm bảo hệ thống ổn định

si

ce u u

u = +

Trang 16

Các giả thiết cần để thiết kế bộ điều khiển thích nghi gián tiếp

Quỹ đạo chuẩn mong muốn khả vi liên tục bị chặn đến bậc y m (t) r

và các đạo hàm , , có thể đo được.y&m (t) y m(r)(t)

Sai số cấu trúc giữa mô hình và đặc tính chính xác của đối tượng bị chặn bởi các cận biết trước:

∞

∈

≤ ( ) L)

(x b x

δb( ) b( ) ∞

Trang 17

Trình tự thiết kế bộ điều khiển thích nghi:

Viết biểu thức mô tả động học sai số bám

Chọn hàm Lyapunov V (là hàm toàn phương theo sai số bám và sai số thông số)

Luật thích nghi thông số được chọn sao sai số thông số bị triệt tiêu khỏi đạo hàm theo thời gian của hàm Lyapunov ( không phụ

V&

thuộc vào sai số thông số của mô hình)

Thành phần điều khiển chế độ trượt được chọn sao cho đảm bảo đạo hàm theo thời gian của hàm Lyapunov âm ( V& < 0) khi sai số

đạo hàm theo thời gian của hàm Lyapunov âm ( ) khi sai số cấu trúc nằm trong giới hạn định trước

0

<

V

Trang 18

Thiết kế bộ điều khiển thích nghi gián tiếp

Biểu thức mô tả động học sai số bám

T

T ~ 1 ~ ~

~ 1

si ce

a

T a s

e

2

1 2

~ ) (

2

ce s b b

b

T b s

a a

a

T a ce

b a

s s

ξ

θ & = Q− − 1

b b

s ce b b

⇒

⇒ Hệ thống ổn định

Trang 19

Sơ đồ khối hệ thống điều khiển thích nghi gián tiếp

Trang 20

Thí dụ: Điều khiển thích nghi gián tiếp hệ bồn kép dùng mô hình mờ

Đặc tính động học của hệ thống mô tả bởi các phương trình sau:

) (

1 )

1 1

h A

t

( ( ( ) ( )) | ( ) ( ) | ( ))

1 )

h& (sgn( ( ) ( )) 2 | ( ) ( ) | 2 ( ))

) (

1 )

2 2

h A

t

i min

A i i = i +

Trang 21

Điều khiển thích nghi trực tiếp

Luật điều khiển hồi tiếp tuyến tính hóa lý tưởng:

[ ( ) ( )]

) (

1 )

Dùng mô hình phi tuyến để nhận dạng trực tiếp u*(x):

) ( )

ˆ x

u

) ( )

(x u u x

hộp đen phi tuyến tổng quát

là vector độ đúng của mệnh đề điều kiện của mô hình mờ, vector ngõ ra lớp ẩn của mạng thần kinh, hoặc vector hàm cơ sở

Trang 22

Điều khiển thích nghi trực tiếp (tt)

x

ξθ

θ

G i δ ( ) là i ố iữ ô hì h ối à l ậ điề khiể hồi iế

Gọi là sai số giữa mô hình tối ưu và luật điều khiển hồi tiếp tuyến tính hóa lý tưởng Luật điều khiển tuyến tính hóa có thể biểu diễn như sau:

()

( *

*

x x

u =θ ξ + δ

Trang 23

Điều khiển thích nghi trực tiếp (tt)

S i lệ h iữ l ật điề khiể hậ d đ à l ật điề khiể hồi

Sai lệch giữa luật điều khiển nhận dạng được và luật điều khiển hồi tiếp tuyến tính hóa:

)()

(

~)

()

(

~

u u

trong đó:

)()

()

(x u x u u x u x

Sai số mô hình luôn tồn tại trong các ứng dụng thực tế Để đảm bảo

hệ thống ổn định sử dụng thêm thành phần điều khiển trượt u d

hệ thống ổn định sử dụng thêm thành phần điều khiển trượt usd

Tín hiệu điều khiển là tổng gồm 2 thành phần:

û xấp xỉ luật điều khiển hồi tiếp tuyến tính hóa lý tưởng

u sd đảm bảo hệ thống ổn định

sd

u u

u = ˆ +

Trang 24

Các giả thiết cần để thiết kế bộ điều khiển thích nghi trực tiếp

bị hặ)

|)(

và các đạo hàm , , có thể đo được.y&m (t) y m(r)(t)

Sai số cấu trúc giữa luật điều khiển nhận dạng và luật điều khiển hồi tiếp tuyến tính hóa bị chặn bởi cận biết trước:

)()

( δ

δu(x) ≤ δu(x)∈L∞

δ

Trang 25

Trình tự thiết kế bộ điều khiển thích nghi:

Viết biểu thức mô tả động học sai số bám

Chọn hàm Lyapunov V (là hàm toàn phương theo sai số bám và sai số thông số)

Luật thích nghi thông số được chọn sao sai số thông số bị triệt tiêu khỏi đạo hàm theo thời gian của hàm Lyapunov ( không phụ

V&

thuộc vào sai số thông số của mô hình)

Thành phần điều khiển chế độ trượt được chọn sao cho đảm bảo đạo hàm theo thời gian của hàm Lyapunov âm ( V& < 0) khi sai số

đạo hàm theo thời gian của hàm Lyapunov âm ( ) khi sai số cấu trúc nằm trong giới hạn định trước

0

<

V

Trang 26

Thiết kế bộ điều khiển thích nghi trực tiếp

Biểu thức mô tả động học sai số bám

sd u

u

T u s

e& +η = − θ~ ξ + δ −

~

~1

1

u s

e b

2

12

e u

u u

s sd

b

e e

u

e b

Luật thích nghi thông số:g g θ&u u = Q Q u u− 1ξξu u e s s

Thành phần điều khiển chế độ trượt: sgn( )

2 2 s s

b u

Trang 27

Sơ đồ khối hệ thống điều khiển thích nghi trực tiếp

Trang 28

Thí dụ điều khiển thích nghi trực tiếp cánh tay máy

u(t): moment tác động lên trục quay của cánh tay máy

φ(t): góc quay (vị trí) của cánh tay máy,

J: moment quán tính của cánh tay máy (J = 0.05 kg.m2)

M: khối lượng của cánh tay máy (M = 1 0kg)

M: khối lượng của cánh tay máy (M = 1.0kg)

m: khối lượng vật nặng (m = 0.1 kg)

l: chiều dài cánh tay máy (l = 0.4 m)

l C : khoảng cách từ trọng tâm cánh tay máy đến trục

l C : khoảng cách từ trọng tâm cánh tay máy đến trục quay (l C = 0.15 m)

(sin)

()()

()(J + ml2 φ&& t + Bφ& t + ml + Ml C g φ t = u t

Giả sử trong quá trình vận hành, thông số cánh tay máy (thí dụg q ậ , g y y ( ụnhư trọng lượng tải) thay đổi

Trang 29

Phương trình ngõ ra cánh tay máy

Phương trình vi phân mô tả cánh tay máy 1 bậc tự do:

)()

(sin)

()()

()(J + ml2 φ&& t + Bφ& t + ml + Ml C g φ t = u t

Đặt: y(t) = φ(t)

T

t x t x

a

y&& = (x) + (x)

Phương trình ngõ ra cánh tay máy:

)(

)(cos)

()

ml J

t x g

Ml ml

(

b x

)(

)

ml J

b

+

=

x

Trang 30

Sơ đồ mô phỏng hệ thống điều khiển thích nghi trực tiếp cánh tay máy

Trang 31

Thiết kế bộ điều khiển thích nghi trực tiếp

hiệu điều khiển hồi

tiếp tuyến tính hóa lý

tưởng:

)()

()

(x = ξ x ξ x ξ x

ξ

u u

2 1

1 ) ( ) ] [(

)

i

i x x

μ

μξ

− +

Trang 32

ĐIỀU KHIỂN HỌC

Trang 33

Khái niệm điều khiển học

Hệ thống điều khiển học là hệ thống điều khiển có khả năng cảithiện chất lượng điều khiển trong tương lai, dựa vào thông tin kinhnghiệm mà hệ thống thu thập được trong quá khứ, thông qua tươngtác vòng kín với đối tượng và môi trường

Đặc điểm của hệ thống điều khiển học:

Hệ thống điều khiển học có khả năng tự chủ (autonomy), vì nó

có thể cải thiện chất lượng của chính nó

Hệ thống điều khiển học có bộ nhớ vì thông tin quá khứ là yếu tốthen chốt để cải thiện chất lượng tương lai

Để cải thiện chất lượng, hệ thống điều khiển học phải nhận thôngtin phải hồi chất lượng dựa trên một hàm mục tiêu mà hệ thốngtìm cực trị

Trang 34

So sánh điều khiển học và điều khiển thích nghi

định lại thông số khi ngay cả khi tình huống cũ lặp lại

Hệ thống điều khiển học có bộ nhớ lưu trữ các cấu trúc và thông

số điều khiển đã học trong quá khứ -> không cần quá trình thích

số điều khiển đã học trong quá khứ > không cần quá trình thíchnghi khi tình huống thay đổi lặp lại tình huống trong quá khứ

Trang 35

Sơ đồ khối hệ thống điều khiển học

Trang 36

Thực thi hệ thống điều khiển học

ứng với miền tín hiệu vào

Rất nhiều hệ thống điều khiển học được thực hiện theo cách này

Khuyết điểm của phương pháp này là tổ hợp các miền tín hiệu

Khuyết điểm của phương pháp này là tổ hợp các miền tín hiệuvào tăng lên khi không gian trạng thái tăng lên hoặc số miềnphân chia mỗi chiều không gian trạng thái tăng lên

Trang 37

Thực thi hệ thống điều khiển học

trúc này có thể cố định hay biến đổi và có nhiều thông số tự do

Thực thi hệ thống điều khiển học bằng cách xấp xỉ hàm có một

số ưu điểm hơn so với các tra bảng:

Thứ nhất, các hàm liên tục nói chung được mô tả một cáchhiệu quả hơn thông qua các thông số tự do, và do đó, cách

xấp xỉ hàm cần ít bộ nhớ hơn để biểu diễn một hàm liên tục

so với cách tra bảng

Thứ hai cấu trúc xấp xỉ hàm có tính chất tổng quát hóa (tức

là nội suy giữa những điểm tín hiệu vào)

Các cấu trúc xấp xỉ hàm được sử dụng phổ biến: mạng thần kinh(MLP, RBF) và mô hình mờ (Mamdani, Takagi - Sugeno)

Trang 38

Thí dụ điều khiển học dùng mạng RBF

Đối tượng mô tả bởi mô hình toán học:

(

)()()

()()

1(

k k

y

k u v k

v k

Cx

B x

A x

.1

95.0)

2(

665

0)

13

.0)

e v

v k

]) 1 , 0 ([

) (k = rand

μ

Trang 39

Thí dụ điều khiển học dùng mạng RBF (tt)

Giả thiết hú t hỉ biết bậ ủ hệ thố (bậ 2) à khô biết

Giả thiết chúng ta chỉ biết bậc của hệ thống (bậc 2) mà không biếtảnh hưởng của điểm làm việc đến đặc tính động học của hệ thốngnhư thế nào (tức là không biết cụ thể A(v) và B(v) phụ thuộc vào v

Trang 40

S đồ khối hệ thố điề khiể h t tiế

Sơ đồ khối hệ thống điều khiển học trực tiếp:

Trang 41

Mô hình chuẩn:

16250

80

0025

0)

(s =

G m

Luật điều khiển hồi tiếp trạng thái:

)()

()

(k K1x1 k K2x2 k K3r k

1625

08

0 ++ s s

m

K1, K2: độ lợi hồi tiếp trạng thái, K3: độ lợi đầu vào

)()

()

( 1 1 2 2 3

Trang 42

1 ,0357.

0[−

Trang 43

Quá trình học: Tại mỗi thời điểm lấy mẫu hệ thống học thực hiện các tác vụ sau:

Đo lường biến hoạch định điểm làm việc

Đọc độ lợi điều khiển từ ngõ ra mạng RBF:

k v K k

v K k

)()

()

(k K1x1 k K2x2 k K3r k

Xuất tín hiệu điều khiển tác động vào đối tượng

Sai lệch giữa đáp ứng của đối tượng với tín hiệu ra mong muốn của mô hình chuẩn được sử dụng để cập nhật trọng số mạng RBF

Trang 44

RBF được tính dựa vào sai số giữa tín hiệu ra của mô hình chuẩn

và tín hiệu ra của hệ thống theo công thức:

)()())

((v k e k k

Trong đó: α là hệ số dương nhỏ

)()

()

(k y k y k

e = ref −

k k

k

k) ( ) ( ) ( )(

k r k

x k

x

k) ( ) ( ) ( )( = 1 2

φ

Bước 2: các trọng số lớp ra của mạng RBF được cập nhật bằng

thuật toán suy giảm độ dốc:

Trong đó: z là ngõ ra của tế bào thần kinh thứ i ở lớp ẩn

))((

) ( )

1 (

k v K z w

w ij l+ = ij l −η iδ j (i =1 31; j =1 3)Trong đó: zi là ngõ ra của tế bào thần kinh thứ i ở lớp ẩn

Trang 45

Mô phỏng kết quả:

Cứ 60 chu kỳ lấy mẫu giá trị μ(k) thay đổi một lần

Ba giá trị đầu tiên của μ(k) được gán bằng 0 1; 0 3; 0 6

Ba giá trị đầu tiên của μ(k) được gán bằng 0.1; 0.3; 0.6

Các giá trị sau đó được gán ngẫu nhiên trong đoạn [0,1]

Trang 46

Kết quả học luật điều khiển: Độ lợi hồi tiếp trạng thái K1(v)

Trang 47

Trang 48

Trang 49

Thí dụ điều khiển học mờ

Đối tượng: tên lửa một tầng có mô hình toán học đơn giản cho bởi

Đối tượng: tên lửa một tầng có mô hình toán học đơn giản cho bởiphương trình:

)

Bài toán đặt ra là điều khiển vận tốc của tên lửa theo tín hiệu đặt

Trang 50

Thí dụ điều khiển học mờ (tt)

Sơ đồ khối hệ thống điều khiển học mờ:

Trang 51

Cơ chế học của hệ thống như sau:

Quan sát dữ liệu vào ra của hệ thống điều khiển mờ

Đánh giá chất lượng của hệ thống điều khiển

Tự chỉnh thông số bộ điều khiển mờ để đạt được chất lượng

mong muốn (chất lượng mong muốn xác định bởi mô hình chuẩn trong sơ đồ điều khiển)

trong sơ đồ điều khiển)

Lưu trữ tri thức (qui luật chỉnh định thông số) vào bộ nhớ

Trang 52

Bộ điều khiển:Bộ điều khiển được sử dụng là bộ điều khiển PD mờ

Bộ điều khiển:Bộ điều khiển được sử dụng là bộ điều khiển PD mờ gồm các qui tắc Sugeno với mệnh đề kết luận là hằng số

Tín hiệu vào của bộ điều khiển PD mờ là:

sai số

biến thiên sai số:

)()

()

(k r k y k

T k

e k

e( ) = [ ( ) − ( − 1 )] /

Δ

Tín hiệu ra của bộ điều khiển là u(k) Các hệ số chuẩn hóa ở ngõ

và ngõ ra của bộ điều khiển là K E, K D, và K U được chọn như sau:

1

=

K K = 1 K =10000

Trang 53

Hàm liên thuộc của các tập mờ định nghĩa cho biến vào e(k) và Δe(k):

Trang 54

Các qui tắc điều khiển có dạng:

Trang 55

Mô hình chuẩn:

2.0

2

0)

R

s

Y m

Chất lượng của hệ thống được tính bằng sai lệch giữa tín hiệu ra của

mô hình chuẩn và tín hiệu ra của đối tượng:

)()

()

(k y k y k

e m = m −

Trang 56

Ngược lại, nếu chất lượng mong muốn không thỏa mãn (em (k)

lớn) thì cơ chế học sẽ điều chỉnh bộ điều khiển mờ

Trang 57

hình chuẩn

Tín hiệu vào mô hình ngược là: em (k) và Δe m (k)

Tín hiệu ra mô hình ngược là: p(k)g p( )

Trang 58

Hệ qui tắc mô tả mô hình ngược mờ:

Trang 59

Khối điều chỉnh cơ sở tri thức:

Điều chỉnh bộ điều khiển mờ để hệ thống đạt được chất lượng điều khiển tốt hơn

Cho thông tin về thay đổi cần thiết ở ngõ vào của đối tượng là

p(k), bộ điều chỉnh cơ sở tri thức sẽ cập nhật cơ sở tri thức của bộ

điều khiển mờ (mệnh đề kết luận của các qui tắc điều khiển) sao

điều khiển mờ (mệnh đề kết luận của các qui tắc điều khiển) sao cho tác động điều khiển trước đó (tức u(k−1)) sẽ được thay đổi một lượng là p(k)

M ốn đạt được điề nà ngõ ra của các q i tắc mờ tác động ở

) ( )

1 (

) 1 (

*

k p k

u k

Muốn đạt được điều này ngõ ra của các qui tắc mờ tác động ở

thời điểm lấy mẫu thứ (k−1) phải được thay đổi một lượng là:

)()

1(

)(k α k + p k

αi(k) = αi(k −1) + p(k) (k) p(k)

α

U K

p k

)( =

Định dạng
Số trang	61
Dung lượng	749,99 KB