tóm tắt luận văn thạc sĩ kỹ thuật NGHIÊN cứu GIẢI THUẬT DI TRUYỀN để tối ưu hóa THAM số bộ điều KHIỂN LQR TRONG điều KHIỂN hệ CHUYỂN ĐỘNG

Tham số của bộ điều khiển được xác định nhờ việc giải phương trình RICATI khi biết mô hình toán tuyến tính của đối tượng.. Khi không có được mô hình toán tuyến tính của đối tượng thì khô

Trang 1

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP

-KHƯƠNG TRỌNG NGHĨA

NGHIÊN CỨU GIẢI THUẬT DI TRUYỀN ĐỂ TỐI ƯU HÓA THAM SỐ BỘ ĐIỀU KHIỂN LQR TRONG ĐIỀU KHIỂN HỆ

CHUYỂN ĐỘNG

Chuyên ngành : Tự Động Hóa

Mã số :

TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT

THÁI NGUYÊN - 2011

Trang 2

Luận văn được hoàn thành tại trường Đại học Kỹ tuật Công nghiệp Thái Nguyên

Cán bộ HDKH : TS Đỗ Trung Hải

Phản biện 1 : TS Trần Xuân Minh

Phản biện 2 : TS Nguyễn Văn Vị

Luận văn đã được bảo vệ trước hội đồng chấm luận văn, họp tại: Phòng cao học số

2, trường Đại học Kỹ thuật Công nghiệp Thái Nguyên

Vào 16 giờ 30 phút ngày 08 tháng 12 năm 2011

Có thể tìm hiểu luận văn tại Trung tâm Học liệu tại Đại học Thái Nguyên và Thư viện trường Đại học Kỹ thuật Công nghiệp Thái Nguyên

Trang 3

MỞ ĐẦU

Việc nghiên cứu và ứng dụng lý thuyết điều khiển thông minh vào thực tế với mục đích giải phóng sức lao động, tăng năng suất và hạ giá thành sản phẩm; đồng thời sản phẩm tạo ra đáp ứng được các yêu cầu ngày càng cao (chất lượng, hình thức, …) của xã hội là việc làm cần thiết

Bộ điều khiển tối ưu tuyến tính dạng toàn phương LQR (Linear Quadratic regulator) là thuật toán điều khiển được xây dựng dựa trên cơ sở nguyên lý phản hồi trạng thái Tham số của bộ điều khiển được xác định nhờ việc giải phương trình RICATI khi biết

mô hình toán tuyến tính của đối tượng Khi không có được mô hình toán tuyến tính của đối tượng thì không thể có lời giải cho bài toán điều khiển tối ưu LQR theo các biểu thức giải tích thông thường Trong trường hợp này ta có thể dùng thuật toán di truyền để tìm lời giải tối ưu và đây cũng là hướng nghiên cứu chính của bản luận văn

Kết cấu của luận văn gồm:

Mở đầu

Chương 1: Tổng quan về điều khiển tối ưu, điều khiển LQR.

Chương 2: Thuật toán di truyền và ứng dụng trong việc xác định tham số tối ưu bộ điều khiển LQR.

Chương 3: Mô phỏng kiểm chứng bằng phần mềm Matlab – Simulink.

Kết luận

Tôi xin trân trọng bày tỏ lòng biết ơn sâu sắc đến thầy TS Đỗ Trung Hải -người

đã hướng dẫn tận tình và giúp đỡ tôi hoàn thành luận văn thạc sĩ này

Tôi xin chân thành cám ơn các thầy cô ở Khoa Điện – Trường Đại học Kỹ thuật Công nghiệp đã đóng góp nhiều ý kiến và tạo điều kiện thuận lợi cho tôi hoàn thành luận văn

Tôi xin chân thành cám ơn Khoa đào tạo sau Đại học, xin chân thành cám ơn Ban Giám Hiệu Trường Đại Học Kỹ Thuật Công Nghiệp đã tạo những điều kiện thuận lợi nhất

về mọi mặt để tôi hoàn thành khóa học

Tôi xin chân thành cám ơn!

Thái Nguyên, ngày 25 tháng 11 năm 2011

Trang 4

Người thực hiện

Khương Trọng Nghĩa

Trang 5

CHƯƠNG 1 TỔNG QUAN VỀ ĐIỀU KHIỂN TỐI ƯU, ĐIỀU KHIỂN LQR

1.1 CHẤT LƯỢNG TỐI ƯU

1.1.1 Đặc điểm của bài toán tối ưu

1.1.1.1 Khái niệm

Một hệ điều khiển được thiết kế ở chế độ làm việc tốt nhất là hệ luôn ở trạng thái tối ưu theo một tiêu chuẩn chất lượng nào đó ( đạt được giá trị cực trị ) Trạng thái tối ưu

có đạt được hay không tùy thuộc vào yêu cầu chất lượng đặt ra, vào sự hiểu biết về đối tượng và các tác động lên đối tượng, vào điều kiện làm việc của hệ điều khiển …

1.1.1.2 Điều kiện thành lập bài toán tối ưu

Để thành lập bài toán tối ưu thì yêu cầu đầu tiên là hệ thống phải có đặc tính phi tuyến có cực trị

1.1.1.3 Tối ưu hoá tĩnh và động

Chúng ta cần phân biệt hai dạng bài toán tối ưu hoá tĩnh và tối ưu hóa động Tối ưu hóa tĩnh là bài toán không phụ thuộc vào thời gian Còn đối với tối ưu hóa động thì thời gian cũng là một biến mà chúng ta cần phải xem xét đến

1.1.2 Xây dựng bài toán tối ưu

1.1.2.1 Tối ưu hóa không có điều kiện ràng buộc

1.1.2.2 Tối ưu hóa với các điều kiện ràng buộc

1.2 CÁC PHƯƠNG PHÁP ĐIỀU KHIỂN TỐI ƯU

1.2.1 Phương pháp biến phân cổ điển Euler_Lagrange

1.2.1.1 Giới thiệu

Nhiệm vụ của điều khiển tối ưu là giải bài toán tìm cực trị của phiếm hàm [ ( ), ( )]

L x t u t bằng cách chọn tín hiệu điều khiển u(t) với những điều kiện hạn chế của đại

lượng điều khiển và tọa độ pha Một trong những công cụ toán học để xác định cực trị là

phương pháp biến phân cổ điển Euler_Lagrange.

1.2.2 Phương pháp quy hoạch động Bellman

1.2.2.1 Giới thiệu

Phương pháp quy hoạch động được dựa trên nguyên lý tối ưu sơ khai của Bellman:

Trang 6

Nguyên lý tối ưu của Bellman: “ Bất kỳ một đoạn cuối cùng nào của quỹ đạo tối ưu

cũng là một quỹ đạo tối ưu”

1.2.2.2 Hệ rời rạc

Phương pháp quy hoạch động cũng có thể dễ dàng áp dụng cho hệ phi tuyến

Ngoài ra, nếu có càng nhiều điều kiện ràng buộc đối với tín hiệu điều khiển và biến trạng thái thì ta có được lời giải càng đơn giản

1.2.2.3 Phương pháp điều khiển số

Chúng ta có thể rời rạc hóa, giải bài toán tối ưu cho hệ rời rạc và sau đó dùng khâu giữ bậc 0 để tạo ra tín hiệu điều khiển số

1.2.3 Nguyên lý cực tiểu Pontryagin _ Hamilton

1.2.3.1 Nguyên lý cực tiểu của Pontryagin.

1.2.3.2 Điều khiển Bang-Bang

1.2.4 Kết luận

Phương pháp biến phân cổ điển Euler_Lagrange thuận lợi khi giải bài toán tối ưu

mà phiếm hàm có dạng phi tuyến, còn tín hiệu điều khiển là những hàm trơn mà ta có thể

dự đoán trước dựa trên bản chất vật lý của chúng Phương pháp này gặp nhiều khó khăn khi áp dụng cho các trường hợp mà tín hiệu điều khiển có thể là hàm gián đoạn Trên thực

tế ta thường gặp bài toán tối ưu mà tín hiệu điều khiển lại là hàm liên tục từng đoạn, cho nên phương pháp biến phân cổ điển bị hạn chế khả năng sử dụng trong thực tế rất nhiều

Đối với hệ thống gián đoạn tốt nhất ta nên áp dụng phương pháp quy hoạch động

của Belman Đặc biệt với các bài toán tối ưu phức tạp dùng máy tính số tác động nhanh

giải quyết bằng phương pháp này rất có hiệu quả Tuy nhiên, do hàm mô tả tín hiệu điều khiển tìm được theo bảng số liệu rời rạc nên biểu thức giải tích của tín hiệu điều khiển chỉ

là gần đúng Phương pháp quy hoạch động còn gặp hạn chế khi áp dụng đối với hệ thống

liên tục vì rất khó giải phương trình Belman.

Nguyên lý cực tiểu Pontryagin áp dụng tốt cho các bài toán tối ưu có điều kiện ràng

buộc bất kể điều kiện ràng buộc cho theo hàm liên tục hoặc hàm gián đoạn Nhưng đối với

bài toán tối ưu phi tuyến thì nguyên lý cực tiểu Pontryagin lại gặp khó khăn, đặc biệt trong

việc xác định các hàm phụ ( )i t để cho hàm H đạt cực đại.

Trang 7

1.3 ĐIỀU KHIỂN TỐI ƯU CÁC HỆ TUYẾN TÍNH VỚI PHIẾM HÀM DẠNG TOÀN PHƯƠNG LQR

1.3.1 Ổn định Lyapunov đối với hệ thống tuyến tính

Tiêu chuẩn ổn định thứ hai của Lyapunov ( điều kiện đủ )

1.3.2 Điều khiển tối ưu hệ tuyến tính với chỉ tiêu chất lượng dạng toàn phương _ Phương trình Riccati đối với hệ liên tục

1.3.3 Phương trình Riccati đối với hệ rời rạc

1.3.4 Các bước giải bài toán toàn phương tuyến tính

B

ư ớc 1:

Thành lập hệ phương trình trạng thái:

x Ax Bu

c Dx











Xác định các thông số A, B, D.

B

ư ớc 2:

Xác định ma trận trọng lượng Q, R từ chỉ tiêu chất lượng J cho dưới dạng toàn

phương tuyến tính

B

ư ớc 3:

Tìm nghiệm S của phương trình Riccati:

- Đối với hệ liên tục: S A S SA SBR B S Q T  1 T

- Đối với hệ rời rạc:

B

ư ớc 4:

Chỉ tiêu chất lượng tối ưu đối với hệ dừng:

   

minJ x T 0 Sx 0

B

ư ớc 5:

Luật điều khiển tối ưu:

- Đối với hệ liên tục: uR B Sx 1 T

Trang 8

- Đối với hệ rời rạc:  1  1 1

1.3.5 Kết luận

Phương trình Riccati dùng để tổng hợp các hệ tuyến tính với chỉ tiêu chất lượng

dạng toàn phương Với cách giải quyết này, ta vừa đảm bảo được tính ổn định của hệ thống

( do cách chọn hàm năng lượng V(x) theo tiêu chuẩn ổn định thứ hai của Lyapunov ), vừa cực tiểu hoá được chỉ tiêu chất lượng J theo yêu cầu bài toán đặt ra.

Tuy nhiên, để giải được phương trình Riccati thì các ma trận trong phương trình

này phải là tuyến tính và xác định Trong trường hợp các phần tử trong ma trận này là phi tuyến thì việc giải phương trình tối ưu Riccati khó thực hiện Luận văn nghiên cứu và đề xuất giải pháp dùng thuật toán di truyền để giải quyết bài toán trên

CHƯƠNG 2 THUẬT TOÁN DI TRUYỀN (GA) VÀ ỨNG DỤNG TRONG VIỆC XÁC ĐỊNH THAM SỐ TỐI ƯU BỘ ĐIỀU KHIỂN LQR

2.1 KHÁI QUÁT

Thuật toán di truyền là thuật toán tối ưu ngẫu nhiên dựa trên cơ chế chọn lọc tự nhiên và tiến hóa di truyền

Quá trình tiến hóa thể hiện tính tối ưu ở chỗ, thế hệ sau bao giờ cũng tốt hơn (phát triển hơn, hoàn thiện hơn) thế hệ trước bởi tính kế thừa và đấu tranh sinh tồn.[6]

Thuật giải di truyền (GA) là kỹ thuật chung giúp giải quyết vấn đề-bài toán bằng cách mô phỏng sự tiến hóa của con người hay của sinh vật nói chung (dựa trên thuyết tiến hóa muôn loài của Darwin) trong điều kiện qui định sẵn của môi trường GA là một thuật giải, nghĩa là mục tiêu của GA không nhằm đưa ra lời giải chính xác tối ưu mà là đưa ra lời

giải tương đối tối ưu

2.2 CÁC NGUYÊN LÝ TRONG THUẬT GIẢI DI TRUYỀN

2.2.1 Nguyên lý về xác định cấu trúc dữ liệu Để có thể giải bài toán bằng thuật giải

di truyền, cần " gen hóa" cấu trúc dữ liệu của bài toán

2.2.1.1 Mảng byte

2.2.1.2 Mảng byte nén

2.2.1.3 Mảng INTEGER nén để tối ưu truy xuất

Trang 9

2.2.1.4 Biểu diễn số thực bằng chuỗi nhị phân

2.2.2 Biễu diễn gen bằng chuỗi số thực

2.2.3 Cấu trúc cây

2.2.4 Độ thích nghi tiêu chuẩn

2.2.5 Độ thích nghi xếp hạng (rank method)

2.3 CÁC PHÉP TOÁN CỦA THUẬT TOÁN DI TRUYỀN

2.3.1 Tái sinh (Reproduction)

Tái sinh là quá trình chọn quần thể mới thỏa phân bố xác suất dựa trên độ thích nghi Độ thích nghi là một hàm gán một giá trị thực cho cá thể trong quần thể Các cá thể

có độ thích nghi lớn sẽ có nhiều bản sao trong thế hệ mới Hàm thích nghi có thể không tuyến tính,không đạo hàm, không liên tục bởi vì thuật toán di truyền chỉ cần liên kết hàm thích nghi với các chuỗi số

2.3.2 Lai ghép (Crossover)

Phép lai là quá trình hình thành nhiễm sắc thể mới trên cơ sở các nhiễm sắc thể cha

- mẹ, bằng cách ghép một hay nhiều đoạn gen của hai (hay nhiều) nhiễm sắc thể cha - mẹ

với nhau Phép lai xảy ra với xác suất p c, được thực hiện như sau:

2.3.3 Đột biến (Mutation)

Đột biến là hiện tượng cá thể con mang một (số) tính trạng không có trong mã di

truyền của cha mẹ Phép đột biến xảy ra với xác suất p m, nhỏ hơn rất nhiều so với xác suất

lai p c

2.4 CẤU TRÚC THUẬT TOÁN DI TRUYỀN TỔNG QUÁT

Thuật toán di truyền bao gồm các bước sau:

- Bước 1: Khởi tạo quần thể các nhiễm sắc thể

- Bước 2: Xác định giá trị thích nghi của từng nhiễm sắc thể

- Bước 3: Sao chép lại các nhiễm sắc thể dựa vào giá trị thích nghi của chúng

và tạo ra những nhiễm sắc thể mới bằng các phép toán di truyền

- Bước 4: Loại bỏ những thành viên không thích nghi trong quần thể

- Bước 5: Chèn những nhiễm sắc thể mới vào quần thể để hình thành một quần thể mới

Trang 10

- Bước 6: Nếu mục tiêu tìm kiếm đạt được thì dừng lại, nếu không trở lại bước 3.[1]

2.5 ỨNG DỤNG CỦA GA TRONG THIẾT KẾ BỘ ĐIỀU KHIỂN LQR

GA cho phép các cá thể trong một quần thể phát triển theo quy luật lựa chọn để tối

ưu hóa hàm đánh giá Cấu trúc cơ bản của GA bao gồm: mã hóa, lựa chọn, ghép lai, đột biến Và quy trình thiết kế GA bao gồm các bước sau:

Bước 1: Mã hóa: Người ta sử dụng mã số nhị phân và số lượng bit phụ thuộc vào

độ chính xác được yêu cầu Giả sử biên độ tham số x là [Lx, Ux] và độ chính xác được yêu cầu là thì ta có số lượng bit như sau:

B  log (U  L ) /  (2.4)

Đối với các tham số của ma trận số Q và R (qi và ri) thì số lượng bit trong hệ nhiễm sắc thể là:

n1 và n2 là tổng tham số có trong Q và R tương ứng

Bước 2: Phân chia khoảng không nghiên cứu: trước tiên chia các khoảng không

nghiên cứu tham số bị chặn thành những phần nhỏ để tránh việc giải bị nhầm lẫn ở các miền nhỏ

Bước 3: Sắp xếp, khởi tạo quần thể: Lượng quần thể ban đầu ngẫu nhiên được sản

sinh ra các cá thể M Mỗi cá thể là một vec tơ có chiều dài gen nhất định như trong hình (3.2) Mỗi gen được mã hóa bằng mã nhị phân với chiều dài bit nhất định (Nbit)

Hình 2.2: Thông số có trong gen trong hệ nhiễm sắc thể

Bước 4: Bình thường hóa bài toán: Giá trị nhị phân của mỗi gen được bình thường

hóa chỉ trong khoảng [qi min, qi max] và [rmin, r max] bằng hàm:

Trang 11

i min i max i min

NBit

gene(i)





(2.6)

NBit

gene(i)



 (2.7) Trong đó y (i) là giá trị nhị phân của mỗi gen

Nbit là số bít trên mỗi gien

Bước 5: Phép tính tương ứng: kết quả của các giải pháp về tập hợp lai tạo được tính

bằng cách sử dụng công thức sau:

GA

ev

M

F



 (2.8)

Trong đó, f ev là là chức năng chi phí và được đánh giá bằng diện tích có nghĩa gốc

Do đó, cứ với các nhiễm sắc thể có điểm cao hơn lại có giá trị tương ứng thấp hơn

Bước 6 Sao chép: các lựa chọn về sao chép quyết định cách GA tạo ra những thế hệ

sau tiếp theo từ thế hệ trước Trong này xét đến 2 loại sao chép:

Sao chép giao nhau: phương thức này được coi là thuật toán có khả năng tách các gen tốt nhất, cho từng cá thể khác nhau bằng cách chọn gen của một cặp cá thể cùng thế

hệ, sau đó tái hợp chúng sinh ra thế hệ sau có tiềm năng tốt hơn Việc chọn ngẫu nhiên

điểm num_c để giao nhau đồng thời sử dụng phương pháp giao nhau động, tiếp đến là tần

số động bằng tỉ số giao nhau (Pc) của mỗi gen (Gen) được tính như sau:

Pc exp( Gen / Max _ Gen)   (2.9)

Sao chép đột biến: Chức năng này tạo ra ít biến đổi ngẫu nhiên trong các cá thể, tạo

ra sự đa dạng gen và tăng mức độ sinh kế từ đó thuật toán sẽ tạo ra các cá thể có giá trị tương ứng tốt hơn Cứ với mỗi cá thể trong tập hợp sẽ tạo ra một con số ngẫu nhiên nằm trong khoảng (0, 1) Nếu các số ngẫu nhiên này thấp hơn một số ngưỡng đột biến xác định,

lúc đó sẽ xảy ra đột biến gen Các điểm num_ m được lựa chọn ngẫu nhiên trong này để

đột biến và được sử dụng cho đột biến động với tỉ số đột biến của mỗi gen (Gen) được tính như sau:

Pm exp(0.05 Gen / Max _ Gen) 1    (2.10)

Trang 12

Bước 7 Hoán vị: Các thế hệ mới trong bước 6 được sẽ thay thế cho tập hợp lai tạo

hiện tại

Bước 8: Lặp lại các bước từ 3 đến 7 cho đến khi đạt được: các bước từ 3 đến 6 lặp

lại trong thế hệ mới cho đến khi đạt đến điểm tập hợp Thuật toán này vô hiệu khi tiếp xúc với bất kỳ một trong ba tiêu chuẩn dừng

Bước 9 Ấn định vị trí tối ưu cho cá thể sau khi được hình thành trong 1 khu vực:

sau khi đạt được tiêu chí tập hợp GA, các thế hệ sau chiếm được vị trí tối ưu của giá trị tương ứng sẽ được ấn định các quyết định trong vùng

Bước 10 Lặp lại các bước từ 2 đến 9 để đạt không gian con cuối cùng.[8]

2.5 KẾT LUẬN

GA là một thuật toán tìm kiếm dựa trên quá trình tiến hóa trong tự nhiên với khả năng hội tụ cao, yêu cầu tính toán thấp và không bị hạn chế về số biến

Do có sự trao đổi thông tin giữa các đỉnh cực trị trong phép toán di truyền do đó hạn chế khă năng rơi vào cực trị cục bộ Quá trình làm việc với chuỗi ký hiệu (chuối nhiễm sắc thể) và chỉ cần đánh giá hàm mục tiêu trong quá trình tìm kiếm mà không cần bất kỳ thông tin nào khác nên nó được ứng dụng trong các bài toán tìm cực trị hàm phi tuyến không yêu cầu về tính khả vi

Trang 13

CHƯƠNG 3

MÔ PHỎNG KIỂM CHỨNG BẰNG PHẦN MỀM MATLAB- SIMULINK

3.1 Mô hình động của hệ thống con lắc ngược

Trong đề tài lựa chọn mô hình con lắc ngược để mô phỏng kiểm chứng có sơ đồ như hình 3.1

Hình 3.1: (a) Hệ thống con lắc ngược; (b) Sơ đồ tách rời của hệ thống Tổng hợp các lực của hệ thống theo các phương ngang và thẳng đứng, ta có phương trình chuyển động sau:

2

(M m)x bx ml cos          ml sin    F (3.1)

2

(I ml )     mglsin   mlx cos   (3.2) Thiết lập phương trình trạng thái như sau :

2

2 2

cos

x



 



(3.3)

0 0 1 0

x x

x



 

 



(3.4)

Định dạng
Số trang	20
Dung lượng	424,5 KB