Tham số của bộ điều khiển được xác định nhờ việc giải phương trình RICATI khi biết mô hình toán tuyến tính của đối tượng.. Khi không có được mô hình toán tuyến tính của đối tượng thì khô
Trang 1ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP
-KHƯƠNG TRỌNG NGHĨA
NGHIÊN CỨU GIẢI THUẬT DI TRUYỀN ĐỂ TỐI ƯU HÓA THAM SỐ BỘ ĐIỀU KHIỂN LQR TRONG ĐIỀU KHIỂN HỆ
CHUYỂN ĐỘNG
Chuyên ngành : Tự Động Hóa
Mã số :
TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT
THÁI NGUYÊN - 2011
Trang 2Luận văn được hoàn thành tại trường Đại học Kỹ tuật Công nghiệp Thái Nguyên
Cán bộ HDKH : TS Đỗ Trung Hải
Phản biện 1 : TS Trần Xuân Minh
Phản biện 2 : TS Nguyễn Văn Vị
Luận văn đã được bảo vệ trước hội đồng chấm luận văn, họp tại: Phòng cao học số
2, trường Đại học Kỹ thuật Công nghiệp Thái Nguyên
Vào 16 giờ 30 phút ngày 08 tháng 12 năm 2011
Có thể tìm hiểu luận văn tại Trung tâm Học liệu tại Đại học Thái Nguyên và Thư viện trường Đại học Kỹ thuật Công nghiệp Thái Nguyên
Trang 3MỞ ĐẦU
Việc nghiên cứu và ứng dụng lý thuyết điều khiển thông minh vào thực tế với mục đích giải phóng sức lao động, tăng năng suất và hạ giá thành sản phẩm; đồng thời sản phẩm tạo ra đáp ứng được các yêu cầu ngày càng cao (chất lượng, hình thức, …) của xã hội là việc làm cần thiết
Bộ điều khiển tối ưu tuyến tính dạng toàn phương LQR (Linear Quadratic regulator) là thuật toán điều khiển được xây dựng dựa trên cơ sở nguyên lý phản hồi trạng thái Tham số của bộ điều khiển được xác định nhờ việc giải phương trình RICATI khi biết
mô hình toán tuyến tính của đối tượng Khi không có được mô hình toán tuyến tính của đối tượng thì không thể có lời giải cho bài toán điều khiển tối ưu LQR theo các biểu thức giải tích thông thường Trong trường hợp này ta có thể dùng thuật toán di truyền để tìm lời giải tối ưu và đây cũng là hướng nghiên cứu chính của bản luận văn
Kết cấu của luận văn gồm:
Mở đầu
Chương 1: Tổng quan về điều khiển tối ưu, điều khiển LQR.
Chương 2: Thuật toán di truyền và ứng dụng trong việc xác định tham số tối ưu bộ điều khiển LQR.
Chương 3: Mô phỏng kiểm chứng bằng phần mềm Matlab – Simulink.
Kết luận
Tôi xin trân trọng bày tỏ lòng biết ơn sâu sắc đến thầy TS Đỗ Trung Hải -người
đã hướng dẫn tận tình và giúp đỡ tôi hoàn thành luận văn thạc sĩ này
Tôi xin chân thành cám ơn các thầy cô ở Khoa Điện – Trường Đại học Kỹ thuật Công nghiệp đã đóng góp nhiều ý kiến và tạo điều kiện thuận lợi cho tôi hoàn thành luận văn
Tôi xin chân thành cám ơn Khoa đào tạo sau Đại học, xin chân thành cám ơn Ban Giám Hiệu Trường Đại Học Kỹ Thuật Công Nghiệp đã tạo những điều kiện thuận lợi nhất
về mọi mặt để tôi hoàn thành khóa học
Tôi xin chân thành cám ơn!
Thái Nguyên, ngày 25 tháng 11 năm 2011
Trang 4Người thực hiện
Khương Trọng Nghĩa
Trang 5CHƯƠNG 1 TỔNG QUAN VỀ ĐIỀU KHIỂN TỐI ƯU, ĐIỀU KHIỂN LQR
1.1 CHẤT LƯỢNG TỐI ƯU
1.1.1 Đặc điểm của bài toán tối ưu
1.1.1.1 Khái niệm
Một hệ điều khiển được thiết kế ở chế độ làm việc tốt nhất là hệ luôn ở trạng thái tối ưu theo một tiêu chuẩn chất lượng nào đó ( đạt được giá trị cực trị ) Trạng thái tối ưu
có đạt được hay không tùy thuộc vào yêu cầu chất lượng đặt ra, vào sự hiểu biết về đối tượng và các tác động lên đối tượng, vào điều kiện làm việc của hệ điều khiển …
1.1.1.2 Điều kiện thành lập bài toán tối ưu
Để thành lập bài toán tối ưu thì yêu cầu đầu tiên là hệ thống phải có đặc tính phi tuyến có cực trị
1.1.1.3 Tối ưu hoá tĩnh và động
Chúng ta cần phân biệt hai dạng bài toán tối ưu hoá tĩnh và tối ưu hóa động Tối ưu hóa tĩnh là bài toán không phụ thuộc vào thời gian Còn đối với tối ưu hóa động thì thời gian cũng là một biến mà chúng ta cần phải xem xét đến
1.1.2 Xây dựng bài toán tối ưu
1.1.2.1 Tối ưu hóa không có điều kiện ràng buộc
1.1.2.2 Tối ưu hóa với các điều kiện ràng buộc
1.2 CÁC PHƯƠNG PHÁP ĐIỀU KHIỂN TỐI ƯU
1.2.1 Phương pháp biến phân cổ điển Euler_Lagrange
1.2.1.1 Giới thiệu
Nhiệm vụ của điều khiển tối ưu là giải bài toán tìm cực trị của phiếm hàm [ ( ), ( )]
L x t u t bằng cách chọn tín hiệu điều khiển u(t) với những điều kiện hạn chế của đại
lượng điều khiển và tọa độ pha Một trong những công cụ toán học để xác định cực trị là
phương pháp biến phân cổ điển Euler_Lagrange.
1.2.2 Phương pháp quy hoạch động Bellman
1.2.2.1 Giới thiệu
Phương pháp quy hoạch động được dựa trên nguyên lý tối ưu sơ khai của Bellman:
Trang 6Nguyên lý tối ưu của Bellman: “ Bất kỳ một đoạn cuối cùng nào của quỹ đạo tối ưu
cũng là một quỹ đạo tối ưu”
1.2.2.2 Hệ rời rạc
Phương pháp quy hoạch động cũng có thể dễ dàng áp dụng cho hệ phi tuyến
Ngoài ra, nếu có càng nhiều điều kiện ràng buộc đối với tín hiệu điều khiển và biến trạng thái thì ta có được lời giải càng đơn giản
1.2.2.3 Phương pháp điều khiển số
Chúng ta có thể rời rạc hóa, giải bài toán tối ưu cho hệ rời rạc và sau đó dùng khâu giữ bậc 0 để tạo ra tín hiệu điều khiển số
1.2.3 Nguyên lý cực tiểu Pontryagin _ Hamilton
1.2.3.1 Nguyên lý cực tiểu của Pontryagin.
1.2.3.2 Điều khiển Bang-Bang
1.2.4 Kết luận
Phương pháp biến phân cổ điển Euler_Lagrange thuận lợi khi giải bài toán tối ưu
mà phiếm hàm có dạng phi tuyến, còn tín hiệu điều khiển là những hàm trơn mà ta có thể
dự đoán trước dựa trên bản chất vật lý của chúng Phương pháp này gặp nhiều khó khăn khi áp dụng cho các trường hợp mà tín hiệu điều khiển có thể là hàm gián đoạn Trên thực
tế ta thường gặp bài toán tối ưu mà tín hiệu điều khiển lại là hàm liên tục từng đoạn, cho nên phương pháp biến phân cổ điển bị hạn chế khả năng sử dụng trong thực tế rất nhiều
Đối với hệ thống gián đoạn tốt nhất ta nên áp dụng phương pháp quy hoạch động
của Belman Đặc biệt với các bài toán tối ưu phức tạp dùng máy tính số tác động nhanh
giải quyết bằng phương pháp này rất có hiệu quả Tuy nhiên, do hàm mô tả tín hiệu điều khiển tìm được theo bảng số liệu rời rạc nên biểu thức giải tích của tín hiệu điều khiển chỉ
là gần đúng Phương pháp quy hoạch động còn gặp hạn chế khi áp dụng đối với hệ thống
liên tục vì rất khó giải phương trình Belman.
Nguyên lý cực tiểu Pontryagin áp dụng tốt cho các bài toán tối ưu có điều kiện ràng
buộc bất kể điều kiện ràng buộc cho theo hàm liên tục hoặc hàm gián đoạn Nhưng đối với
bài toán tối ưu phi tuyến thì nguyên lý cực tiểu Pontryagin lại gặp khó khăn, đặc biệt trong
việc xác định các hàm phụ ( )i t để cho hàm H đạt cực đại.
Trang 71.3 ĐIỀU KHIỂN TỐI ƯU CÁC HỆ TUYẾN TÍNH VỚI PHIẾM HÀM DẠNG TOÀN PHƯƠNG LQR
1.3.1 Ổn định Lyapunov đối với hệ thống tuyến tính
Tiêu chuẩn ổn định thứ hai của Lyapunov ( điều kiện đủ )
1.3.2 Điều khiển tối ưu hệ tuyến tính với chỉ tiêu chất lượng dạng toàn phương _ Phương trình Riccati đối với hệ liên tục
1.3.3 Phương trình Riccati đối với hệ rời rạc
1.3.4 Các bước giải bài toán toàn phương tuyến tính
B
ư ớc 1:
Thành lập hệ phương trình trạng thái:
x Ax Bu
c Dx
Xác định các thông số A, B, D.
B
ư ớc 2:
Xác định ma trận trọng lượng Q, R từ chỉ tiêu chất lượng J cho dưới dạng toàn
phương tuyến tính
B
ư ớc 3:
Tìm nghiệm S của phương trình Riccati:
- Đối với hệ liên tục: S A S SA SBR B S Q T 1 T
- Đối với hệ rời rạc:
B
ư ớc 4:
Chỉ tiêu chất lượng tối ưu đối với hệ dừng:
minJ x T 0 Sx 0
B
ư ớc 5:
Luật điều khiển tối ưu:
- Đối với hệ liên tục: uR B Sx 1 T
Trang 8- Đối với hệ rời rạc: 1 1 1
1.3.5 Kết luận
Phương trình Riccati dùng để tổng hợp các hệ tuyến tính với chỉ tiêu chất lượng
dạng toàn phương Với cách giải quyết này, ta vừa đảm bảo được tính ổn định của hệ thống
( do cách chọn hàm năng lượng V(x) theo tiêu chuẩn ổn định thứ hai của Lyapunov ), vừa cực tiểu hoá được chỉ tiêu chất lượng J theo yêu cầu bài toán đặt ra.
Tuy nhiên, để giải được phương trình Riccati thì các ma trận trong phương trình
này phải là tuyến tính và xác định Trong trường hợp các phần tử trong ma trận này là phi tuyến thì việc giải phương trình tối ưu Riccati khó thực hiện Luận văn nghiên cứu và đề xuất giải pháp dùng thuật toán di truyền để giải quyết bài toán trên
CHƯƠNG 2 THUẬT TOÁN DI TRUYỀN (GA) VÀ ỨNG DỤNG TRONG VIỆC XÁC ĐỊNH THAM SỐ TỐI ƯU BỘ ĐIỀU KHIỂN LQR
2.1 KHÁI QUÁT
Thuật toán di truyền là thuật toán tối ưu ngẫu nhiên dựa trên cơ chế chọn lọc tự nhiên và tiến hóa di truyền
Quá trình tiến hóa thể hiện tính tối ưu ở chỗ, thế hệ sau bao giờ cũng tốt hơn (phát triển hơn, hoàn thiện hơn) thế hệ trước bởi tính kế thừa và đấu tranh sinh tồn.[6]
Thuật giải di truyền (GA) là kỹ thuật chung giúp giải quyết vấn đề-bài toán bằng cách mô phỏng sự tiến hóa của con người hay của sinh vật nói chung (dựa trên thuyết tiến hóa muôn loài của Darwin) trong điều kiện qui định sẵn của môi trường GA là một thuật giải, nghĩa là mục tiêu của GA không nhằm đưa ra lời giải chính xác tối ưu mà là đưa ra lời
giải tương đối tối ưu
2.2 CÁC NGUYÊN LÝ TRONG THUẬT GIẢI DI TRUYỀN
2.2.1 Nguyên lý về xác định cấu trúc dữ liệu Để có thể giải bài toán bằng thuật giải
di truyền, cần " gen hóa" cấu trúc dữ liệu của bài toán
2.2.1.1 Mảng byte
2.2.1.2 Mảng byte nén
2.2.1.3 Mảng INTEGER nén để tối ưu truy xuất
Trang 92.2.1.4 Biểu diễn số thực bằng chuỗi nhị phân
2.2.2 Biễu diễn gen bằng chuỗi số thực
2.2.3 Cấu trúc cây
2.2.4 Độ thích nghi tiêu chuẩn
2.2.5 Độ thích nghi xếp hạng (rank method)
2.3 CÁC PHÉP TOÁN CỦA THUẬT TOÁN DI TRUYỀN
2.3.1 Tái sinh (Reproduction)
Tái sinh là quá trình chọn quần thể mới thỏa phân bố xác suất dựa trên độ thích nghi Độ thích nghi là một hàm gán một giá trị thực cho cá thể trong quần thể Các cá thể
có độ thích nghi lớn sẽ có nhiều bản sao trong thế hệ mới Hàm thích nghi có thể không tuyến tính,không đạo hàm, không liên tục bởi vì thuật toán di truyền chỉ cần liên kết hàm thích nghi với các chuỗi số
2.3.2 Lai ghép (Crossover)
Phép lai là quá trình hình thành nhiễm sắc thể mới trên cơ sở các nhiễm sắc thể cha
- mẹ, bằng cách ghép một hay nhiều đoạn gen của hai (hay nhiều) nhiễm sắc thể cha - mẹ
với nhau Phép lai xảy ra với xác suất p c, được thực hiện như sau:
2.3.3 Đột biến (Mutation)
Đột biến là hiện tượng cá thể con mang một (số) tính trạng không có trong mã di
truyền của cha mẹ Phép đột biến xảy ra với xác suất p m, nhỏ hơn rất nhiều so với xác suất
lai p c
2.4 CẤU TRÚC THUẬT TOÁN DI TRUYỀN TỔNG QUÁT
Thuật toán di truyền bao gồm các bước sau:
- Bước 1: Khởi tạo quần thể các nhiễm sắc thể
- Bước 2: Xác định giá trị thích nghi của từng nhiễm sắc thể
- Bước 3: Sao chép lại các nhiễm sắc thể dựa vào giá trị thích nghi của chúng
và tạo ra những nhiễm sắc thể mới bằng các phép toán di truyền
- Bước 4: Loại bỏ những thành viên không thích nghi trong quần thể
- Bước 5: Chèn những nhiễm sắc thể mới vào quần thể để hình thành một quần thể mới
Trang 10- Bước 6: Nếu mục tiêu tìm kiếm đạt được thì dừng lại, nếu không trở lại bước 3.[1]
2.5 ỨNG DỤNG CỦA GA TRONG THIẾT KẾ BỘ ĐIỀU KHIỂN LQR
GA cho phép các cá thể trong một quần thể phát triển theo quy luật lựa chọn để tối
ưu hóa hàm đánh giá Cấu trúc cơ bản của GA bao gồm: mã hóa, lựa chọn, ghép lai, đột biến Và quy trình thiết kế GA bao gồm các bước sau:
Bước 1: Mã hóa: Người ta sử dụng mã số nhị phân và số lượng bit phụ thuộc vào
độ chính xác được yêu cầu Giả sử biên độ tham số x là [Lx, Ux] và độ chính xác được yêu cầu là thì ta có số lượng bit như sau:
B log (U L ) / (2.4)
Đối với các tham số của ma trận số Q và R (qi và ri) thì số lượng bit trong hệ nhiễm sắc thể là:
n1 và n2 là tổng tham số có trong Q và R tương ứng
Bước 2: Phân chia khoảng không nghiên cứu: trước tiên chia các khoảng không
nghiên cứu tham số bị chặn thành những phần nhỏ để tránh việc giải bị nhầm lẫn ở các miền nhỏ
Bước 3: Sắp xếp, khởi tạo quần thể: Lượng quần thể ban đầu ngẫu nhiên được sản
sinh ra các cá thể M Mỗi cá thể là một vec tơ có chiều dài gen nhất định như trong hình (3.2) Mỗi gen được mã hóa bằng mã nhị phân với chiều dài bit nhất định (Nbit)
Hình 2.2: Thông số có trong gen trong hệ nhiễm sắc thể
Bước 4: Bình thường hóa bài toán: Giá trị nhị phân của mỗi gen được bình thường
hóa chỉ trong khoảng [qi min, qi max] và [rmin, r max] bằng hàm:
Trang 11i min i max i min
NBit
gene(i)
(2.6)
NBit
gene(i)
(2.7) Trong đó y (i) là giá trị nhị phân của mỗi gen
Nbit là số bít trên mỗi gien
Bước 5: Phép tính tương ứng: kết quả của các giải pháp về tập hợp lai tạo được tính
bằng cách sử dụng công thức sau:
GA
ev
M
F
(2.8)
Trong đó, f ev là là chức năng chi phí và được đánh giá bằng diện tích có nghĩa gốc
Do đó, cứ với các nhiễm sắc thể có điểm cao hơn lại có giá trị tương ứng thấp hơn
Bước 6 Sao chép: các lựa chọn về sao chép quyết định cách GA tạo ra những thế hệ
sau tiếp theo từ thế hệ trước Trong này xét đến 2 loại sao chép:
Sao chép giao nhau: phương thức này được coi là thuật toán có khả năng tách các gen tốt nhất, cho từng cá thể khác nhau bằng cách chọn gen của một cặp cá thể cùng thế
hệ, sau đó tái hợp chúng sinh ra thế hệ sau có tiềm năng tốt hơn Việc chọn ngẫu nhiên
điểm num_c để giao nhau đồng thời sử dụng phương pháp giao nhau động, tiếp đến là tần
số động bằng tỉ số giao nhau (Pc) của mỗi gen (Gen) được tính như sau:
Pc exp( Gen / Max _ Gen) (2.9)
Sao chép đột biến: Chức năng này tạo ra ít biến đổi ngẫu nhiên trong các cá thể, tạo
ra sự đa dạng gen và tăng mức độ sinh kế từ đó thuật toán sẽ tạo ra các cá thể có giá trị tương ứng tốt hơn Cứ với mỗi cá thể trong tập hợp sẽ tạo ra một con số ngẫu nhiên nằm trong khoảng (0, 1) Nếu các số ngẫu nhiên này thấp hơn một số ngưỡng đột biến xác định,
lúc đó sẽ xảy ra đột biến gen Các điểm num_ m được lựa chọn ngẫu nhiên trong này để
đột biến và được sử dụng cho đột biến động với tỉ số đột biến của mỗi gen (Gen) được tính như sau:
Pm exp(0.05 Gen / Max _ Gen) 1 (2.10)
Trang 12Bước 7 Hoán vị: Các thế hệ mới trong bước 6 được sẽ thay thế cho tập hợp lai tạo
hiện tại
Bước 8: Lặp lại các bước từ 3 đến 7 cho đến khi đạt được: các bước từ 3 đến 6 lặp
lại trong thế hệ mới cho đến khi đạt đến điểm tập hợp Thuật toán này vô hiệu khi tiếp xúc với bất kỳ một trong ba tiêu chuẩn dừng
Bước 9 Ấn định vị trí tối ưu cho cá thể sau khi được hình thành trong 1 khu vực:
sau khi đạt được tiêu chí tập hợp GA, các thế hệ sau chiếm được vị trí tối ưu của giá trị tương ứng sẽ được ấn định các quyết định trong vùng
Bước 10 Lặp lại các bước từ 2 đến 9 để đạt không gian con cuối cùng.[8]
2.5 KẾT LUẬN
GA là một thuật toán tìm kiếm dựa trên quá trình tiến hóa trong tự nhiên với khả năng hội tụ cao, yêu cầu tính toán thấp và không bị hạn chế về số biến
Do có sự trao đổi thông tin giữa các đỉnh cực trị trong phép toán di truyền do đó hạn chế khă năng rơi vào cực trị cục bộ Quá trình làm việc với chuỗi ký hiệu (chuối nhiễm sắc thể) và chỉ cần đánh giá hàm mục tiêu trong quá trình tìm kiếm mà không cần bất kỳ thông tin nào khác nên nó được ứng dụng trong các bài toán tìm cực trị hàm phi tuyến không yêu cầu về tính khả vi
Trang 13CHƯƠNG 3
MÔ PHỎNG KIỂM CHỨNG BẰNG PHẦN MỀM MATLAB- SIMULINK
3.1 Mô hình động của hệ thống con lắc ngược
Trong đề tài lựa chọn mô hình con lắc ngược để mô phỏng kiểm chứng có sơ đồ như hình 3.1
Hình 3.1: (a) Hệ thống con lắc ngược; (b) Sơ đồ tách rời của hệ thống Tổng hợp các lực của hệ thống theo các phương ngang và thẳng đứng, ta có phương trình chuyển động sau:
2
(M m)x bx ml cos ml sin F (3.1)
2
(I ml ) mglsin mlx cos (3.2) Thiết lập phương trình trạng thái như sau :
2
2
2 2
cos
x
(3.3)
0 0 1 0
x x
x
(3.4)