1. Trang chủ
  2. » Luận Văn - Báo Cáo

CHƯƠNG 9 điều KHIỂN học

38 63 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 38
Dung lượng 3,38 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Ngành Điều khiển học thì lấy mốc năm 1948 làm năm ra đời ngành bởi vì vào năm cuốn sách "Điều khiển học: Điều khiển và Truyền thông trong Sinh vật và Máy móc" về Các vòng nhân quả và Cơ

Trang 1

BÁO CÁO ĐIỀU KHIỂN THÔNG MINH CHƯƠNG 9 : ĐIỀU KHIỂN HỌC

Trang 2

PHẦN 1 : GIỚI THIỆU

Điều khiển học là ngành khoa học của thời đại mới, nghiên cứu truyền thông và điều khiển, tiêu biểu là cơ chế điều chỉnh phản hồi, trong cơ thể sống, máy móc và sự kết hợp của cả máy móc lẫn sinh học

Trang 3

Điển hình là mạng thông tin, kết nối nhiều thiết bị với nhau, điều khiển qua máy chủ.

Trang 4

Một định nghĩa mang tính triết học hơn được Louis Couffignal - một nhà tiên phong của điều khiển học gợi ý năm 1956 gọi điều khiển học là "Nghệ thuật đảm bảo cho hoạt động hiệu quả" Cùng với thời gian, điều khiển học dần dần được hiểu là nghiên cứu và đưa

ra những nguyên lý trừu tượng của việc tổ chức những hệ thống từ đơn giản tới phức tạp

Điều khiển học trở thành một thành phần căn bản của khoa học về các hệ thống (Systems Sciences), là tập hợp nhiều lĩnh vực nghiên cứu nhằm khảo sát các thuộc tính chung của sự phức tạp, sự phát triển của các hệ thống Những thuộc tính ấy biểu lộ trong những hệ tiến hóa, hệ thích nghi phức tạp và sự sống nhân tạo

Trang 5

LỊCH SỬ CỦA ĐIỀU KHIỂN HỌC

Điều khiển học khởi đầu như một ngành nghiên cứu đa lĩnh vực: điều khiển hệ thống cơ khí, lý thuyết mạng điện, mô hình lôgic và thần kinh học vào những năm 1940 Tên gọi Điều khiển học do Norbert Wiener đề xuất để đặt cho các nghiên cứu cơ chế hoạt động có mục đích”

Ngành Điều khiển học thì lấy mốc năm 1948 làm năm ra đời ngành bởi vì vào năm cuốn sách "Điều khiển học: Điều khiển và Truyền thông trong Sinh vật và Máy móc" về Các vòng nhân quả và Cơ chế phản hồi của Wiener được xuất bản lần đầu tiên cùng lúc tại Mỹ, Anh, Pháp

Càng về sau, từ điều khiển học sản sinh ra các ngành khoa học hiện đại như: khoa học máy tính, đặc biệt là Lý thuyết Thông tin, Lý thuyết automata, Trí tuệ Nhân tạo và Mạng thần kinh nhân tạo, Mô hình hóa và mô phỏng bằng máy tính, Những hệ thống động, kỹ thuật robot… từ đó điều khiển học thực sự phổ biến

Trang 7

Hệ thống điều khiển học là hệ thống điều khiển có khả năng cải thiện chất lượng điều khiển trong tương lai, dựa vào thông tin kinh nghiệm mà hệ thống thu thập được trong quá khứ, thông qua tương tác vòng kín với đối tượng và môi trường.

PHẦN 2 : HỆ THỐNG ĐIỀU KHIỂN HỌC

KHÁI NIỆM

Trang 8

* Hệ thống điều khiển học có khả năng tự chủ (autonomy), vì nócó thể cải thiện chất lượng của chính nó.

* Hệ thống điều khiển học có bộ nhớ vì thông tin quá khứ là yếu tố then chốt để cải thiện chất lượng tương lai

* Để cải thiện chất lượng, hệ thống điều khiển học phải nhận thông tin phải hồi chất lượng dựa trên một hàm mục tiêu mà hệ thống tìm cực trị

ĐẶC ĐIỂM

Trang 10

* Khác nhau:

- Khác biệt cơ bản giữa điều khiển thích nghi và điều khiển học là khả năng sử dụng thông tin kinh nghiệm trong quá khứ

- Hệ thống điều khiển thích nghi không có bộ nhớ nên phải chỉnh

định lại thông số khi ngay cả khi tình huống cũ lặp lại

- Hệ thống điều khiển học có bộ nhớ lưu trữ các cấu trúc và thông số điều khiển đã học trong quá khứ

-> không cần quá trình thích nghi khi tình huống thay đổi lặp lại tình huống trong quá khứ

Trang 11

SƠ ĐỒ KHỐI HỆ THỐNG ĐIỀU KHIỂN HỌC

Trang 12

Tra bảng:

Phân chia không gian tín hiệu vào thành các miền rời nhau sao cho tín hiệu ra có thể được xác định bằng cách "tra bảng" tương ứng với miền tín hiệu vào.

Rất nhiều hệ thống điều khiển học được thực hiện theo cách này Khuyết điểm của phương pháp này là tổ hợp các miền tín hiệu vào tăng lên khi không gian trạng thái tăng lên hoặc số miền

phân chia mỗi chiều không gian trạng thái tăng lên

THỰC THI HỆ THỐNG ĐIỀU KHIỂN HỌC

Trang 13

Xấp xỉ hàm:

Các hệ thống điều khiển học cao cấp hơn có thể phát triển dựatrên cấu trúc toán học có thể xấp xỉ một họ các hàm liên tục; cấutrúc này có thể cố định hay biến đổi và có nhiều thông số tự do

Thực thi hệ thống điều khiển học bằng cách xấp xỉ hàm có một

số ưu điểm hơn so với các tra bảng:

Trang 14

Thứ nhất, các hàm liên tục nói chung được mô tả một cách

hiệu quả hơn thông qua các thông số tự do, và do đó, cách

xấp xỉ hàm cần ít bộ nhớ hơn để biểu diễn một hàm liên tục

so với cách tra bảng

Thứ hai, cấu trúc xấp xỉ hàm có tính chất tổng quát hóa (tức

là nội suy giữa những điểm tín hiệu vào)

Các cấu trúc xấp xỉ hàm được sử dụng phổ biến: mạng thần kinh(MLP, RBF) và mô hình mờ (Mamdani, Takagi - Sugeno

Trang 15

Thí dụ 1: điều khiển học dùng mạng RBF

Trong đó v là biến hoạch định điểm làm việc, giả sử v thay đổi theo

qui luật sau: v(k + 1) = 0.9v(k) + 0.1μ(k)

Trang 16

Giả thiết chúng ta chỉ biết bậc của hệ thống (bậc 2) mà không biết ảnh hưởng của điểm làm việc đến đặc tính động học của hệ

thống như thế nào (tức là không biết cụ thể A(v) và B(v) phụ thuộc vào v như thế nào)

Mục tiêu điều khiển là bám theo tín hiệu vào với đáp ứng quá độ ch o t r ư ớ c

Trang 17

Sơ đồ khối hệ thống điều khiển học trực tiếp :

Trang 18

1

Trang 19

[−0.0357, 1.0357]

Trang 20

Quá trình học: Tại mỗi thời điểm lấy mẫu hệ thống học thực hiện các tác vụ sau:

* Đo lường biến hoạch định điểm làm việc:

* Đọc độ lợi điều khiển từ ngõ ra mạng RBF:

* Tính tín hiệu điều khiển hồi tiếp trạng thái:

u(k) = -K1x1 (k) – K2 x2 (k) + K3 r(k)

* Xuất tín hiệu điều khiển tác động vào đối tượng:

Sai lệch giữa đáp ứng của đối tượng với tín hiệu ra mong muốn

của mô hình chuẩn được sử dụng để cập nhật trọng số mạng RBF

K (v(k)) = [K1 (v(k)) K2 (v(k)) K3 (v(k))] T

Trang 22

Mô phỏng kết quả:

Cứ 60 chu kỳ lấy mẫu giá trị μ(k) thay đổi một lần

Ba giá trị đầu tiên của μ(k) được gán bằng 0,1; 0,3 và 0,6

Các giá trị sau đó được gán ngẫu nhiên trong đoạn [0,1]

Trang 23

Kết quả học luật điều khiển: Độ lợi hồi tiếp trạng thái K1(v)

Trang 24

Kết quả học luật điều khiển: Độ lợi hồi tiếp trạng thái K2(v)

Trang 25

Kết quả học luật điều khiển: Độ lợi hồi tiếp trạng thái K3(v)

Trang 27

Sơ đồ khối hệ thống điều khiển học mờ:

Trang 28

Cơ chế học của hệ thống như sau:

Quan sát dữ liệu vào ra của hệ thống điều khiển mờ

Đánh giá chất lượng của hệ thống điều khiển.

Tự chỉnh thông số bộ điều khiển mờ để đạt được chất lượng

mong muốn (chất lượng mong muốn xác định bởi mô hình chuẩn trong sơ đồ điều khiển) Lưu trữ tri thức (qui luật chỉnh định thông số) vào bộ nhớ.

Trang 29

Bộ điều khiển:Bộ điều khiển được sử dụng là bộ điều khiển PD mờ gồm

các qui tắc Sugeno với mệnh đề kết luận là hằng số

Tín hiệu vào của bộ điều khiển PD mờ là:Sai số: e(k) = r(k) y(k)

Biến thiên sai số: Δe(k ) = [e(k ) e(k 1)] / T Tín hiệu ra của bộ điều khiển là u(k) Các hệ số chuẩn hóa ở ngõ và ngõ ra của bộ điều khiển là K E , K D , và K U được chọn như sau:

Trang 30

Hàm liên thuộc của các tập mờ định nghĩa cho biến vào e(k) và Δ(k):

Trang 31

Các qui tắc điều khiển có dạng:

Trang 33

Cơ chế học:

Nếu chất lượng mong muốn được thỏa mãn (em(k) ≈ 0) thì cơ chế học sẽ không điều chỉnh bộ điều khiển mờ.

Ngược lại, nếu chất lượng mong muốn không thỏa mãn (em(k) lớn) thì cơ chế học sẽ điều chỉnh bộ điều khiển mờ

Trang 34

Mô hình ngược mờ:

Mô hình ngược mờ mô tả định tính đặc tính động học ngược của đối tượng điều khiển

Mô hình ngược được dùng để xác định sự thay đổi ở ngõ vào của đối tượng làm cho ngõ ra của đối tượng giống như ngõ ra của mô hình chuẩn

Tín hiệu vào mô hình ngược là: e m (k) và Δe m (k)

Tín hiệu ra mô hình ngược là: p(k)

Trang 35

Hệ qui tắc mô tả mô hình ngược mờ:

Trang 36

Khối điều chỉnh cơ sở tri thức:

Điều chỉnh bộ điều khiển mờ để hệ thống đạt được chất lượng điều khiển tốt hơn

Cho thông tin về thay đổi cần thiết ở ngõ vào của đối tượng là p(k), bộ điều chỉnh cơ sở tri thức sẽ cập nhật cơ sở tri thức của bộ điều khiển mờ (mệnh đề kết luận của các qui tắc điều khiển) sao cho tác động điều khiển trước đó (tức u(k−1)) sẽ được thay đổi một lượng là

p(k).

u* (k − 1) = u(k − 1) + p(k )

Muốn đạt được điều này ngõ ra của các qui tắc mờ tác động ở

thời điểm lấy mẫu thứ (k−1) phải được thay đổi một lượng là:

Trang 37

Kết quả điều khiển:

Trang 38

Sai số điều khiển:

Ngày đăng: 25/02/2019, 22:28

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w