Ngành Điều khiển học thì lấy mốc năm 1948 làm năm ra đời ngành bởi vì vào năm cuốn sách "Điều khiển học: Điều khiển và Truyền thông trong Sinh vật và Máy móc" về Các vòng nhân quả và Cơ
Trang 1BÁO CÁO ĐIỀU KHIỂN THÔNG MINH CHƯƠNG 9 : ĐIỀU KHIỂN HỌC
Trang 2PHẦN 1 : GIỚI THIỆU
Điều khiển học là ngành khoa học của thời đại mới, nghiên cứu truyền thông và điều khiển, tiêu biểu là cơ chế điều chỉnh phản hồi, trong cơ thể sống, máy móc và sự kết hợp của cả máy móc lẫn sinh học
Trang 3Điển hình là mạng thông tin, kết nối nhiều thiết bị với nhau, điều khiển qua máy chủ.
Trang 4Một định nghĩa mang tính triết học hơn được Louis Couffignal - một nhà tiên phong của điều khiển học gợi ý năm 1956 gọi điều khiển học là "Nghệ thuật đảm bảo cho hoạt động hiệu quả" Cùng với thời gian, điều khiển học dần dần được hiểu là nghiên cứu và đưa
ra những nguyên lý trừu tượng của việc tổ chức những hệ thống từ đơn giản tới phức tạp
Điều khiển học trở thành một thành phần căn bản của khoa học về các hệ thống (Systems Sciences), là tập hợp nhiều lĩnh vực nghiên cứu nhằm khảo sát các thuộc tính chung của sự phức tạp, sự phát triển của các hệ thống Những thuộc tính ấy biểu lộ trong những hệ tiến hóa, hệ thích nghi phức tạp và sự sống nhân tạo
Trang 5LỊCH SỬ CỦA ĐIỀU KHIỂN HỌC
Điều khiển học khởi đầu như một ngành nghiên cứu đa lĩnh vực: điều khiển hệ thống cơ khí, lý thuyết mạng điện, mô hình lôgic và thần kinh học vào những năm 1940 Tên gọi Điều khiển học do Norbert Wiener đề xuất để đặt cho các nghiên cứu cơ chế hoạt động có mục đích”
Ngành Điều khiển học thì lấy mốc năm 1948 làm năm ra đời ngành bởi vì vào năm cuốn sách "Điều khiển học: Điều khiển và Truyền thông trong Sinh vật và Máy móc" về Các vòng nhân quả và Cơ chế phản hồi của Wiener được xuất bản lần đầu tiên cùng lúc tại Mỹ, Anh, Pháp
Càng về sau, từ điều khiển học sản sinh ra các ngành khoa học hiện đại như: khoa học máy tính, đặc biệt là Lý thuyết Thông tin, Lý thuyết automata, Trí tuệ Nhân tạo và Mạng thần kinh nhân tạo, Mô hình hóa và mô phỏng bằng máy tính, Những hệ thống động, kỹ thuật robot… từ đó điều khiển học thực sự phổ biến
Trang 7Hệ thống điều khiển học là hệ thống điều khiển có khả năng cải thiện chất lượng điều khiển trong tương lai, dựa vào thông tin kinh nghiệm mà hệ thống thu thập được trong quá khứ, thông qua tương tác vòng kín với đối tượng và môi trường.
PHẦN 2 : HỆ THỐNG ĐIỀU KHIỂN HỌC
KHÁI NIỆM
Trang 8* Hệ thống điều khiển học có khả năng tự chủ (autonomy), vì nócó thể cải thiện chất lượng của chính nó.
* Hệ thống điều khiển học có bộ nhớ vì thông tin quá khứ là yếu tố then chốt để cải thiện chất lượng tương lai
* Để cải thiện chất lượng, hệ thống điều khiển học phải nhận thông tin phải hồi chất lượng dựa trên một hàm mục tiêu mà hệ thống tìm cực trị
ĐẶC ĐIỂM
Trang 10* Khác nhau:
- Khác biệt cơ bản giữa điều khiển thích nghi và điều khiển học là khả năng sử dụng thông tin kinh nghiệm trong quá khứ
- Hệ thống điều khiển thích nghi không có bộ nhớ nên phải chỉnh
định lại thông số khi ngay cả khi tình huống cũ lặp lại
- Hệ thống điều khiển học có bộ nhớ lưu trữ các cấu trúc và thông số điều khiển đã học trong quá khứ
-> không cần quá trình thích nghi khi tình huống thay đổi lặp lại tình huống trong quá khứ
Trang 11SƠ ĐỒ KHỐI HỆ THỐNG ĐIỀU KHIỂN HỌC
Trang 12Tra bảng:
Phân chia không gian tín hiệu vào thành các miền rời nhau sao cho tín hiệu ra có thể được xác định bằng cách "tra bảng" tương ứng với miền tín hiệu vào.
Rất nhiều hệ thống điều khiển học được thực hiện theo cách này Khuyết điểm của phương pháp này là tổ hợp các miền tín hiệu vào tăng lên khi không gian trạng thái tăng lên hoặc số miền
phân chia mỗi chiều không gian trạng thái tăng lên
THỰC THI HỆ THỐNG ĐIỀU KHIỂN HỌC
Trang 13Xấp xỉ hàm:
Các hệ thống điều khiển học cao cấp hơn có thể phát triển dựatrên cấu trúc toán học có thể xấp xỉ một họ các hàm liên tục; cấutrúc này có thể cố định hay biến đổi và có nhiều thông số tự do
Thực thi hệ thống điều khiển học bằng cách xấp xỉ hàm có một
số ưu điểm hơn so với các tra bảng:
Trang 14Thứ nhất, các hàm liên tục nói chung được mô tả một cách
hiệu quả hơn thông qua các thông số tự do, và do đó, cách
xấp xỉ hàm cần ít bộ nhớ hơn để biểu diễn một hàm liên tục
so với cách tra bảng
Thứ hai, cấu trúc xấp xỉ hàm có tính chất tổng quát hóa (tức
là nội suy giữa những điểm tín hiệu vào)
Các cấu trúc xấp xỉ hàm được sử dụng phổ biến: mạng thần kinh(MLP, RBF) và mô hình mờ (Mamdani, Takagi - Sugeno
Trang 15Thí dụ 1: điều khiển học dùng mạng RBF
Trong đó v là biến hoạch định điểm làm việc, giả sử v thay đổi theo
qui luật sau: v(k + 1) = 0.9v(k) + 0.1μ(k)
Trang 16Giả thiết chúng ta chỉ biết bậc của hệ thống (bậc 2) mà không biết ảnh hưởng của điểm làm việc đến đặc tính động học của hệ
thống như thế nào (tức là không biết cụ thể A(v) và B(v) phụ thuộc vào v như thế nào)
Mục tiêu điều khiển là bám theo tín hiệu vào với đáp ứng quá độ ch o t r ư ớ c
Trang 17Sơ đồ khối hệ thống điều khiển học trực tiếp :
Trang 181
Trang 19[−0.0357, 1.0357]
Trang 20Quá trình học: Tại mỗi thời điểm lấy mẫu hệ thống học thực hiện các tác vụ sau:
* Đo lường biến hoạch định điểm làm việc:
* Đọc độ lợi điều khiển từ ngõ ra mạng RBF:
* Tính tín hiệu điều khiển hồi tiếp trạng thái:
u(k) = -K1x1 (k) – K2 x2 (k) + K3 r(k)
* Xuất tín hiệu điều khiển tác động vào đối tượng:
Sai lệch giữa đáp ứng của đối tượng với tín hiệu ra mong muốn
của mô hình chuẩn được sử dụng để cập nhật trọng số mạng RBF
K (v(k)) = [K1 (v(k)) K2 (v(k)) K3 (v(k))] T
Trang 22
Mô phỏng kết quả:
Cứ 60 chu kỳ lấy mẫu giá trị μ(k) thay đổi một lần
Ba giá trị đầu tiên của μ(k) được gán bằng 0,1; 0,3 và 0,6
Các giá trị sau đó được gán ngẫu nhiên trong đoạn [0,1]
Trang 23Kết quả học luật điều khiển: Độ lợi hồi tiếp trạng thái K1(v)
Trang 24Kết quả học luật điều khiển: Độ lợi hồi tiếp trạng thái K2(v)
Trang 25Kết quả học luật điều khiển: Độ lợi hồi tiếp trạng thái K3(v)
Trang 27Sơ đồ khối hệ thống điều khiển học mờ:
Trang 28Cơ chế học của hệ thống như sau:
Quan sát dữ liệu vào ra của hệ thống điều khiển mờ
Đánh giá chất lượng của hệ thống điều khiển.
Tự chỉnh thông số bộ điều khiển mờ để đạt được chất lượng
mong muốn (chất lượng mong muốn xác định bởi mô hình chuẩn trong sơ đồ điều khiển) Lưu trữ tri thức (qui luật chỉnh định thông số) vào bộ nhớ.
Trang 29Bộ điều khiển:Bộ điều khiển được sử dụng là bộ điều khiển PD mờ gồm
các qui tắc Sugeno với mệnh đề kết luận là hằng số
Tín hiệu vào của bộ điều khiển PD mờ là:Sai số: e(k) = r(k) − y(k)
Biến thiên sai số: Δe(k ) = [e(k ) − e(k −1)] / T Tín hiệu ra của bộ điều khiển là u(k) Các hệ số chuẩn hóa ở ngõ và ngõ ra của bộ điều khiển là K E , K D , và K U được chọn như sau:
Trang 30Hàm liên thuộc của các tập mờ định nghĩa cho biến vào e(k) và Δ(k):
Trang 31Các qui tắc điều khiển có dạng:
Trang 33Cơ chế học:
Nếu chất lượng mong muốn được thỏa mãn (em(k) ≈ 0) thì cơ chế học sẽ không điều chỉnh bộ điều khiển mờ.
Ngược lại, nếu chất lượng mong muốn không thỏa mãn (em(k) lớn) thì cơ chế học sẽ điều chỉnh bộ điều khiển mờ
Trang 34Mô hình ngược mờ:
Mô hình ngược mờ mô tả định tính đặc tính động học ngược của đối tượng điều khiển
Mô hình ngược được dùng để xác định sự thay đổi ở ngõ vào của đối tượng làm cho ngõ ra của đối tượng giống như ngõ ra của mô hình chuẩn
Tín hiệu vào mô hình ngược là: e m (k) và Δe m (k)
Tín hiệu ra mô hình ngược là: p(k)
Trang 35Hệ qui tắc mô tả mô hình ngược mờ:
Trang 36Khối điều chỉnh cơ sở tri thức:
Điều chỉnh bộ điều khiển mờ để hệ thống đạt được chất lượng điều khiển tốt hơn
Cho thông tin về thay đổi cần thiết ở ngõ vào của đối tượng là p(k), bộ điều chỉnh cơ sở tri thức sẽ cập nhật cơ sở tri thức của bộ điều khiển mờ (mệnh đề kết luận của các qui tắc điều khiển) sao cho tác động điều khiển trước đó (tức u(k−1)) sẽ được thay đổi một lượng là
p(k).
u* (k − 1) = u(k − 1) + p(k )
Muốn đạt được điều này ngõ ra của các qui tắc mờ tác động ở
thời điểm lấy mẫu thứ (k−1) phải được thay đổi một lượng là:
Trang 37Kết quả điều khiển:
Trang 38Sai số điều khiển: