Nghiên cứu điều khiển tối ưu cho cánh tay robot bằng phương pháp quy hoạch phi tuyến
Trang 1THUYẾT MINH LUẬN VĂN THẠC SỸ KỸ THUẬT
ĐỀ TÀI
NGHIÊN CỨU ĐIỀU KHIỂN TỐI ƯU CHO CÁNH
TAY ROBOT BẰNG PHƯƠNG PHÁP QUY HOẠCH
PHI TUYẾN
Học viên: Nguyễn Trung Thành
Lớp: CH K10 Chuyên ngành: Tự động hoá
Người HD Khoa học: PGS.TS Nguyễn Hữu Công
PGS.TS Nguyễn Hữu Công
HỌC VIÊN
Nguyễn Trung Thành
Trang 3LỜI CAM ĐOAN Tên tôi là: Nguyễn Trung Thành
Sinh ngày 13 tháng 11 năm 1980
Học viên lớp Cao học Khoá 10 Chuyên ngành Tự động hoá- Trường Đại Học Kỹ Thuật Công Nghiệp Thái Nguyên
Đơn vị công tác: Trường Đại học Kỹ thuật Công nghiệp Thái Nguyên
Xin cam đoan: Đề tài: “Nghiên cứu điều khiển tối ưu cho cánh tay Robot
bằng phương pháp Quy hoạch phi tuyến’’ do PGS.TS Nguyễn Hữu Công hướng
dẫn là công trình nghiên cứu của riêng tôi Tất cả các tài liệu tham khảo đều có nguồn gốc, xuất xứ rõ ràng
Nếu sai tôi hoàn toàn chịu trách nhiệm
Thái Nguyên, ngày 20 tháng 10 năm 2009
Tác giả
Trang 4MỤC LỤC
Lời cam đoan 1
Mục lục 2
Danh mục các thuật ngữ, kí hiệu, từ viết tắt 5
Danh mục các bảng biểu 7
Danh mục các hình vẽ, đồ thị 8
Lời nói đầu ……… 9
CHƯƠNG I GIỚI THIỆU CHUNG VỀ ĐIỀU KHIỂN TỐI ƯU………… 11
1.1 Địnhnghĩa 11
1.2 Điều kiện hạn chế ……… 11
1.3 Bài toán điều khiển tối ưu……… ……… 12
1.3.1 Điều khiển tối ưu tĩnh……….…… 12
1.3.1.1 Mô tả toán học……… ……….……… 13
1.3.1.2 Biểu diễn hình học……….…… 13
1.3.1.3 Giả thiết cho lời giải ……….…… 14
1.3.1.4 Một số phương pháp tìm nghiệm……… 16
1.3.2 Điều khiển tối ưu động……… ………… 24
1.3.2.1 Phương pháp biến phân……… …… 24
1.3.2.2 Phương pháp quy hoạch động của Bellman……… …… 29
1.3.2.3 Nguyên lý cực đại……….……… 34
CHƯƠNG 2: ROBOT CÔNG NGHIỆP VÀ GIỚI THIỆU BÀI TOÁN ĐIỀU KHIỂN ĐỘNG HỌC NGƯỢC ROBOT 39
2.1 Tổng quan về robot công nghiệp 39
2.1.1 Tự động hóa và robot công nghiệp……….……… 43
2.1.2 Các đặc tính của robot công nghiệp……….……… 45
2.1.2.1 Tải trọng……….……… 45
2.1.2.2 Tầm với ……….……… 45
2.1.2.3 Độ phân giải không gian……… 45
2.1.2.4 Độ chính xác……… 46
Trang 52.1.2.5 Độ lặp lại ……….……… 47
2.1.2.6 Độ nhún ……… 47
2.2 Chất lượng quá trình làm việc và các thông số điều khiển ……… 48
2.2.1 Yêu cầu về chất lượng trong điều khiển Robot……….……… 48
2.2.2 Giới thiệu bài toán điều khiển động học ngược Robot ………… 49
2.2.3 Bài toán động học trên quan điểm điều khiển thời gian thực ……… 54
2.2.3.1 Yêu cầu về thời gian thực trong điều khiển động học robot ……… 54
2.2.3.2 Hiệu quả giải thuật trên quan điểm điều khiển thời gian thực…… 56
CHƯƠNG 3: GIẢI BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU CHO CÁNH TAYROBOT 58
3.1 Thành lập bài toán điều khiển……… 58
3.1.1 Mô hình đối tượng……… ……….… 58
3.1.2 Phiếm hàm mục tiêu ……… 61
3.1.2.1 Bài toán tối ưu về độ chính xác về vị trí và hướng của khâu chấp
hành……… 61
3.1.2.2 Bài toán di chuyển tối thiểu……… … 62
3.1.3 Điều kiện giới hạn của các biến 63
3.2 Khả năng ứng dụng của giải thuật trên máy tính……….… 64
3.3 Thành lập bài toán cho một số dạng robot……… 65
3.3.1 Robot cơ cấu 3 khâu phẳng (3 khớp quay)……… 65
3.3.1.1 Phương trình động học (Mô hình toán học) 65
3.3.1.2 Hàm mục tiêu 66
3.3.1.3 Điều kiện hạn chế 67
3.3.2 Robot Elbow (Sáu bậc tự do toàn khớp quay)……….…….… 67
3.3.2.1 Phương trình động học (Mô hình toán học) 67
3.3.2.2 Hàm mục tiêu 68
3.3.2.3 Điều kiện hạn chế ……… ……… … … 69
3.3.3 Robot Puma (Sáu bậc tự do toàn khớp quay)……… 69
3.3.3.1 Phương trình động học (Mô hình toán học) ……….… 69
Trang 63.3.3.2 Hàm mục tiêu 71
3.3.3.3 Điều kiện hạn chế 71
3.4 Giới thiệu bài toán quy hoạch phi tuyến với ràng buộc dạng chuẩn và nghiệm tối ưu của nó …… 72
3.4.1 Bài toán quy hoạch phi tuyến ………….… 72
3.4.2 Nhận định chung 72
3.4.3 Tính chính xác 73
3.5 Lời giải bài toán điều khiển tối ưu cho Robot cơ cấu 3 khâu phẳng (3 khớp quay) 73
3.5.1 Khởi tạo một số ma trận thế ngẫu nhiên cho lời giải……… 74
3.5.2 Ứng dụng Optimization Toolbox trong Matlab để giải bài toán…… 74
3.5.2.1.Giới thiệu Optimization Toolbox trong Matlab……… 74
3.5.2.2 Sử dụng Optimization Toolbox trong Matlab để giải bài toán…… 77
3.5.3 Ứng dụng phương pháp giải thuật di truyền (GA) giải bài toán … … 79
3.5.3.1 Giới thiệu phương pháp giải thuật di truyền (GA)……….…… 79
3.5.3.2 Các kỹ thuật trong giải thuật di truyền GA……… 80
3.5.3.3 Giải bài toán bằng phương pháp di truyền (GA)………….…… … 84
3.5.4 Sử dụng phương pháp khai triển thành đa thức để giải bài toán……… 86
3.5.4.1 Đặt vấn đề……… … 86
3.5.4.2 Đa thức nội suy ……….… … 87
3.5.4.3 Đa thức nội suy Lagrange 88
3.5.4.4 Áp dụng cho bài toán cụ thể……… 88
CHƯƠNG 4 KẾT LUẬN VÀ KIẾN NGHỊ……… 92
4.1 Các kết quả nghiên cứu của Luận văn……… … … 92
4.2 Một số kiến nghị cho hướng nghiên cứu tiếp theo……… … 93
Tài liệu tham khảo……… … 94
Tóm tắt……….… 97
Trang 7DANH MỤC CÁC THUẬT NGỮ, KÝ HIỆU, CÁC TỪ VIẾT TẮT
3 Ai Ma trận truyền giữa khâu (i-1) và khâu (i)
4 aij Hệ số thứ (i) của đa thức nội suy thứ (j)
5 AT Transpose (A)
7 D Miền thoả mãn của ràng buộc vậy lý của các khớp
14 J Vectơ định vị điểm đặt robot so với hệ quy chiếu chung
15 li Lower bound (i)
16 MRO Minimal Represent Orient
17 n(…) Normal (Vectơ pháp tuyến của mặt phẳng chứa s, a)
Trang 823 i-1Ti Biểu diễn của hệ quy chiếu (i) trong hệ quy chiếu (i-1)
24 ui Upper bound (i)
26 Vectơ gradien
Trang 9DANH MỤC CÁC BẢNG BIỂU
KÝ
2.1 Số lượng Robot sản xuất ở một số nước công nghiệp phát triển 41
3.3 Kết quả bài toán ngược cơ cấu 3 khâu phẳng giải bằng hàm
3.4 Kết quả giải bài toán ngược cơ cấu 3 khâu phẳng bằng phương
Trang 10DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
KÝ
1.4 Nguyên lý cực đại là trường hợp tổng quát của công thức biến
2.6 Sơ đồ điều khiển trong không gian công tác 50
3.1 Các vectơ định vị trí và định hướng của bàn tay máy 59 3.2 Sơ đồ động học cơ cấu 3 khâu phẳng (3 khớp quay) 65
3.5 Sơ đồ cấu trúc kỹ thuật trong giải thuật di truyền 80
Trang 11LỜI NÓI ĐẦU
Khoa học kỹ thuật và công nghệ ở các nước trong khu vực và trên thế giới đang trong thời kỳ phát triển như vũ bão đã đưa Việt Nam đứng trước rất nhiều thời
cơ vận hội và thách thức mới trên con đường hội nhập với nền kinh tế thế giới
Để đáp ứng nhu cầu phát triển của xã hội, phục vụ công cuộc đổi mới của đất nước đòi hỏi đội ngũ các nhà khoa học, cán bộ kỹ thuật và công nhân lành nghề phải không ngừng nghiên cứu, học tập nâng cao trình độ để kịp thời tiếp cận làm chủ các kiến thức khoa học kỹ thuật hiện đại và công nghệ tiên tiến
Các khoá đào tạo thạc sỹ tại Trường Đại học Kỹ Thuật Công Nghiệp Thái Nguyên nhằm đào tạo những cán bộ khoa học có trình độ cao để tiếp thu và làm chủ
kỹ thuật hiện đại để phục vụ cho công tác nghiên cứu, giảng dạy và sản xuất Là một giáo viên giảng dạy tại một trường kỹ thuật tôi rất vinh dự được học tập tại khoá đào tạo thạc sỹ khoá 10 của trường Để đánh giá kết quả học tập trong toàn
khoá học tôi được giao đề tài luận văn tốt nghiệp: “Nghiên cứu điều khiển tối ưu
cho cánh tay Robot bằng phương pháp Quy hoạch phi tuyến”
Trong quá trình công nghiệp hoá, hiện đại hoá đất nước, các ngành công nghiệp đang phát triển hết sức nhanh chóng, nhiều nhà máy xí nghiệp được xây dựng với quy mô và công nghệ hiện đại, tiên tiến đáp ứng được nhu cầu của tình hình sản xuất hiện nay Trong đó phải kể đến sự tiến bộ vượt bậc của khoa học kỹ thuật, nhất là sự ra đời của máy tính và công nghệ thông tin đã tạo tiền đề cho sự phát triển mạnh mẽ của nền sản xuất có tính chất tự động hoá cao, đã dần thay thế sức lao động của con người đồng thời hiệu quả của nó đem lại cho nền kinh tế là rất lớn
Hiện nay sự xuất hiện của các Robot trong các ngành công nghiệp, cũng như trong đời sống sinh hoạt đã trở nên phổ biến Chúng được ứng dụng rộng rãi trong nhiều lĩnh vục khác nhau, đặc biệt trong các ngành sản xuất có tính dây truyền và công nghệ cao Robot đóng vai trò quan trọng, chúng vừa đảm bảo độ chính xác vừa đảm bảo tính liên tục của dây truyền mà với con người hay những máy móc thông
Trang 12thường khó có thể đạt được Đồng thời nó có thể thay thế con người làm việc trong những môi trường độc hại, nơi con người khó có thể đặt chân tới như vũ trụ… Nói chung, ứng dụng của Robot là hết sức to lớn, vì vậy mà trong tương lai đây
là nhân tố rất quan trọng trong sự phát triển của các ngành sản xuất của nền kinh tế hiện đại Do vậy việc nghiên cứu các vấn đề về Robot mang tính thời sự
Để Nghiên cứu điều khiển tối ưu cho cánh tay Robot bằng phương pháp Quy
hoạch phi tuyến, luận văn của tôi gồm bốn chương:
Chương 1: Giới thiệu chung về điều khiển tối ưu
Chương 2: Robot công nghiệp và giới thiệu bài toán điều khiển động học ngược
robot Chương 3 Giải bài toán điều khiển tối ưu cho cánh tay robot
Chương 4: Kết luận và kiến nghị
Đề tài đã được hoàn thành đúng thời hạn dưới sự hướng dẫn tận tình của
PGS.TS Nguyễn Hữu Công - Trưởng Khoa Điện Tử - Trường Đại học Kỹ thuật
Công nghiệp Thái Nguyên và các bạn đồng nghiệp cùng sự nỗ lực của bản thân Tôi xin chân thành cảm ơn thầy giáo hướng dẫn, các thầy giáo, cô giáo thuộc trường Đại học kỹ thuật Công nghiệp Thái Nguyên đã giúp đỡ tôi trong quá trình học tập cũng như quá trình nghiên cứu thực hiện luận văn
Vì nhiều điều kiện khách quan và khả năng của bản thân, luận văn hoàn thành chắc chắn còn thiếu sót Rất mong sự góp ý của các thầy cô giáo và các bạn đồng nghiệp
Tôi xin chân thành cảm ơn!
Tác giả
Nguyễn Trung Thành
Trang 13CHƯƠNG 1 : GIỚI THIỆU CHUNG VỀ ĐIỀU KHIỂN TỐI ƯU
1.1 Định nghĩa
Điều khiển tối ưu là một chuyên ngành cơ bản trong điều khiển tự động, nó có vai trò xác định và tạo lập những luật điều khiển cho hệ thống để hệ thống đạt được
chỉ tiêu về tính hiệu quả đã được định trước dưới dạng ( phiếm) hàm mục tiêu Q
Trong thực tế tồn tại các bài toán điều khiển tối ưu như sau:
- Bài toán tối ưu cực tiểu:
+ Xác định tham số của mô hình sao cho bình phương sai lệch trung bình giữa
mô hình và đối tượng đạt giá trị nhỏ nhất, ví dụ như huấn luyện mạng nơ-ron, nhận dạng đối tượng,
+ Điều khiển một quá trình đạt chỉ tiêu chất lượng, kỹ thuật cho trước sao cho tổn hao năng lượng là nhỏ nhất
+ Tạo ra một sản phẩm đạt chỉ tiêu chất lượng cho trước nhưng chi phí là nhỏ nhất
+ Bài toán tìm đường đi ngắn nhất giữa hai điểm bất kỳ, ví dụ như xác định quĩ đạo chuyển động của cánh tay robot, đường đi thu rác, thu tiền điện, thu tiền nước,
đi chào hàng
- Bài toán tối ưu cực đại
+ Tạo ra sản phẩm với chi phí cho trước, nhưng có chất lượng cao nhất
+ Bài toán tìm đường căng
- Bài toán tối ưu tác động nhanh: Thời gian xảy ra quá trình là ngắn nhất, ví dụ như điều khiển tên lửa
Trang 141.3 Bài toán điều khiển tối ƣu
Bài toán tối ưu được xây dựng dựa trên các giả thiết sau:
+ Có một mô hình toán học
+ Không có nhiễu tác động
+ Biết các điều kiện biên của mô hình như : điểm làm việc, thời gian làm việc của hệ thống
+ Biết miền giá trị cho phép của các đầu vào u
+ Biết hàm mục tiêu Q mô tả tính hiệu quả mà hệ thống cần đạt được
Mục đích của điều khiển tối ưu là tìm tín hiệu tối ưu u*
để hàm mục tiêu Q đạt giá trị cực đại hoặc cực tiểu
Với những giả thiết này có rất nhiều phương pháp giải bài toán điều khiển tối
ưu khác nhau Trong nội dung của Luận văn sẽ giới thiệu các phương pháp cơ bản nhất của lĩnh vực điều khiển tối ưu, được chia thành hai nhóm chính như sau:
+ Điều khiển tối ưu tĩnh
+ Điều khiển tối ưu động
1.3.1 Điều khiển tối ƣu tĩnh
Bài toán điều khiển tối ưu tĩnh là bài toán trong đó quan hệ vào, ra và biến trạng thái của mô hình không phụ thuộc vào thời gian Giá trị đầu ra tại một thời điểm chỉ phụ thuộc vào các đầu đầu vào và trạng thái tại thời điểm đó
Mô hình hệ thống được cho như sau:
yk = fk(u1, u2, ur), với k = 1, 2, , m, viết gọn lại thành y = f(u) Hàm mục tiêu như sau: Q = Q(u,y)
Trang 15Thay y = f(u) vào hàm mục tiêu được: Q = Q(u,y) = Q(u,f(u)) = Q(u), như vậy
Q chỉ phụ thuộc vào các đầu vào và đầu ra
Hàm mục tiêu có dạng như sau: Q = Q(u,y) = Q(u,f(u)) = Q(u)
Không mất tính tổng quát nếu giả thiết tiêu chuẩn tối ưu là: Q(u) min
Bài toán điều khiển tối ưu tĩnh được phát biểu như sau: Tìm tín hiệu tối ưu
u* U, sao cho Q(u*) đạt giá trị nhỏ nhất Khi đó, ta có
)1()
()
(u* Q u u U
Q
Nếu u* thoả mãn (1) với mọi u thuộc U, thì u*
được gọi là véc tơ tối ưu toàn cục
Nếu u* thoả mãn (1) với mọi u thuộc lân cận u*
, thì u* được gọi là véc tơ tối ưu cục bộ
1.3.1.2 Biểu diễn hình học
Xét hệ thống có hai tín hiệu đầu vào u1 và u2 Hàm mục tiêu Q chỉ phụ thuộc vào u1 và u2, Q = Q(u1,u2)
Giả thiết hàm mục tiêu Q có đồ thị như hình 1.1
Vậy điểm tối ưu u*
* 1
Trang 16Tập hợp các điểm nằm trong mặt phẳng (u1,u2), tại các điểm đó hàm mục tiêu Q có cùng giá trị được gọi là đường đồng mức
1.3.1.3 Giả thiết cho lời giải
a Bài toán tối ƣu không có giới hạn
- Nghiệm u* của bài toán tối ưu không có giới hạn là một điểm cực trị Các điểm
cực trị thoả mãn hệ phương trình vi phân k r
u
Q
k
, 2 , 1
(
2 1
Q u
Q u
Q u
, véc tơ đạo hàm riêng grad Q có các tính chất sau:
+ Có phương vuông góc với mặt cong Q
+ Có hướng chỉ chiều tăng giá trị của các đường đồng mức
Trang 17+ Có độ lớn thể hiện tốc độ tăng hay giảm giá trị của Q Do đó tại điểm cực trị của mặt cong Q phải có grad Q = 0 (*) Hệ phương trình này chỉ là điều kiện cần để tìm nghiệm tối ưu u*
Để giải hệ phương trình (*) sẽ gặp những vấn đề sau:
+ Hệ phương trình (*) là hệ phi tuyến, dẫn đến việc giải trực tiếp khó thực hiện được
Kiểm tra điều kiện
Nếu || uk - uk-1 || chuyển sang bước 5
Nếu || uk - uk-1 || > quay về bước 2
+ Bước 5:
Nghiệm tối ưu gần đúng là u*
= uk với độ chính xác là
b Bài toán tối ƣu có giới hạn
Bản chất là tìm nghiệm tối ưu u*
gần đúng cho bài toán mà u bị giới hạn bởi miền thích hợp U Thuật toán tìm nghiệm từng bước về cơ bản cũng giống như trên, nhưng cần phải chú ý các trường hợp sau:
Trang 18+ Nếu nghiệm tối ưu u*
không nằm trên biên của U thì grad Q = 0 vẫn là điều kiện cần để tìm u*
+ Nếu trong miền thích hợp U không tồn tại nghiệm u*
thoả mãn điều kiện gradQ = 0, khi đó nghiệm tối ưu u* nằm trên biên của U và tại điểm u* véc tơ đạo hàm riêng grad Q phải có hướng vào trong miền U
Thuật toán tìm nghiệm tối ưu u*
cho bài toán tối ưu có giới hạn:
Kiểm tra điều kiện
Nếu || uk - uk-1 || chuyển sang bước 5
Nếu || uk - uk-1 || > quay về bước 2
Trang 19Chính vì những lý do này, mà cần phải có các phương pháp tìm nghiệm tối ưu u*
mà không dùng véc tơ đạo hàm riêng (gradient)
a.2 Phương pháp Gauss/ Seidel
Cho mô hình hệ thống y = f(u)
Hàm mục tiêu được định nghĩa là Q = Q(u)
Tìm u* để cho Q đạt giá trị nhỏ nhất, tức là Qmin
Giả sử u* nghiệm tối ưu thoả mãn Qmin, ký hiệu u*
= argminQ
Nội dung của phương pháp Gauss/Seidel
+ Hướng tìm được chọn song song với các trục toạ độ ui với i = 1, 2, , r Kí hiệu hướng tìm ở bước thứ k là hk
+ Khoảng cách bước tìm ở bước thứ k được ký hiệu là sk, sk được xác định như sau: s*k argminQ(u k s k h k)
Thuật toán tìm nghiệm của Gauss/Seidel
k
h , hk là véc tơ có r hàng, chỉ có hàng thứ
k + 1 có giá trị bằng 1, các hàng khác đều bằng không
- Xác định khoảng cách bước tìm sk: sk được xác định sao cho hàm mục tiêu đạt giá trị nhỏ nhất trên hướng tìm hk sk* = argminQ(uk + skhk)
+ Bước 3:
uk+1 = uk + sk*hk
+ Bước 4: Kiểm tra điều kiện
Trang 20Nếu || uk+1 - uk || chuyển sang bước 5
Nếu || uk+1 - uk || > quay về bước 2
11
0 0
0 0
1
s s
h s u
u Q
, suy ra s0 = -1 Vậy s0
10
11
0 0
0 0
1
s s
h s u
1 1 1
2
1
01
01
0
s s
h s u
u Q
, suy ra s1 = -1
Trang 21* 1 2
s u
11
2 2
2 2
3
s s
h s u
u Q
, suy ra s2 = 0 Vậy s2
Sau hai vòng tính ta đã tìm được nghiệm tối ưu u*
Trang 22b Phương pháp Newton-Raphson
b.1 Nội dung của phương pháp
Phương pháp tìm nghiệm tối ưu sử dụng đạo hàm bậc nhất và bậc hai của hàm mục tiêu nên phải giả thiết hàm mục tiêu Q(u) khả vi hai lần Để giải hệ phương
(**) bằng phương pháp giải tích, trước tiên hệ (**) được khai
triển thành chuỗi Taylor tại uk thuộc lân cận nghiệm tối ưu u* và là nghiệm của (**) như sau:
0
)(
)()
()
u
u Q u
u
u
Q
tiếp theo, bỏ qua các đạo hàm bậc cao Khi đó u*
sẽ không phải là nghiệm đúng nữa
mà chỉ là nghiệm gần đúng Gọi nghiệm gần đúng này là là uk+1 u* , thay vào hệ phương trình trên ta có:
0uu
)u(Q)uu
(u
2 k 1 k k
2
1
2 2
1 2
.
.
r r
r
u
Q u
u Q
u u
Q u
Trang 23Tính H(uk)
Bước 3:
Tính uk+1 = uk - H-1(uk)gk
Bước 4: Kiểm tra điều kiện
Nếu || uk+1 - uk || chuyển sang bước 5
Nếu || uk+1 - uk || > quay về bước 2
2 1 2
1
8
6)
(
u u
u u
u Q u
Q u
16)
(
2 2 2
1 2
2
2 1
2
2 1 2
u
Q u
u Q
u u
Q u
Q u
1847
1)
Trang 241
0 1 2
2 1
u u
1847
1)()
1
u H u
161
1847
11
0)
(
0 0
1 0
6
0
0 1 2
2 1
u u
1847
1)()
1
u H u
061
1847
10
0)
(
1 1
1 1
Trang 25Cho hàm mục tiêu Q(u) Tìm
U u
u Q u
,(min
arg
)
(
được tìm theo công thức sau:
*
u u
c.2 Hàm chặn
Trong quá trình tìm từng bước nghiệm tối ưu, hàm chặn được sử dụng để ngăn cản việc giá trị uk hiện tại có thể sẽ vượt ra ngoài miền U Việc ngăn cản của hàm chặn thường là bằng những giá trị rất lớn (một cách không bình thường) tại những điểm gần biên, bên trong hoặc bên ngoài
Thay Q(u) = Q(u) + S(u), với điều kiện:
S(u) = 0 nếu u cách xa biên
S(u) = nếu u ở gần biên
là một số dương đủ lớn
Áp dụng các phương pháp giải bài toán tối ưu không ràng buộc để tìm nghiệm
min)
,(minarg
)
(
được tìm theo công thức sau:
*
u u
Trang 261.3.2 Điều khiển tối ưu động
Bài toán điều khiển tối ưu động là bài toán trong đó mô hình toán học có ít nhất một phương trình vi phân
) ,
( u x f
Các đầu ra của hệ thống là y g ( u x , ) với y ( y1, y2, , ym)
Hàm mục tiêu được định nghĩa như sau: Q f x u dt
T
0
0( , ) , trontg đó T là thời gian xảy ra quá trình tối ưu
Với bài toán điều khiển tối ưu tĩnh, đây chính là bài toán cực trị với những điều kiện ràng buộc Có nhiều phương pháp giải bài toán cực trị, ở đây chúng ta chỉ nghiên cứu các phương pháp phi tuyến:
+ Các phương pháp không dùng đạo hàm riêng
+ Các phương pháp đạo hàm riêng
+ Phương pháp hướng liên hợp
+ Phương pháp Newton-Raphson
Với bài toán điều khiển tối ưu động, chỉ nghiên cứu các phương pháp sau:
+ Phương pháp biến phân kinh điển
+ Phương pháp nguyên lý cực đại của Pontrjagin
+ Phương pháp qui hoạch động của Bellman
1.3.2.1 Phương pháp biến phân
Biến phân là một phương pháp được xây dựng từ điều kiện cần phải có của nghiệm tối ưu u(t) của bài toán tối ưu động, liên tục, có khoảng thời gian T xác định, cho trước và không bị ràng buộc bởi điều kiện U, hoặc nếu có bị ràng buộc thì tập U của các (vector) tín hiệu điều khiển thích hợp phải là một tập hở
Trang 27Ý tưởng chính của biến phân có thể được tóm tắt như sau:
- Từ giả thiết u(t) là tín hiệu điều khiển tối ưu, x(t) là quỹ đạo trạng thái tối ưu, người ta xây dựng một tín hiệu điều khiển khác có một sai lệch nhỏ so với nó là:
t u t t
u~ u , trong đó u t là rất nhỏ (1.1)
Và xem u t
~
chưa phải là tín hiệu tối ưu
- Tiếp theo, người ta giả thiết quỹ đạo trạng thái x t
~
do u t
~
tạo ra cho hệ thống cũng chỉ có một sai lệch rất nhỏ so với quỹ đạo trạng thái tối ưu x(t), tức là:
Người ta xác định tính chất của điều khiển tối ưu u(t), gọi là tính chất biến phân
Xét bài toán tối ưu động, liên tục, có điểm đầu x0 và thời gian T cố định, cho trước:
0,
x
Q
x x u x f
là vector tín hiệu điều khiển được biến phân từ
u(t) theo công thức (1.1) và x t
~
là quỹ đạo trạng thái tương ứng của nó thỏa mãn điều kiện biến phân (1.2) Hiển nhiên khi đó ta có bất đẳng thức (1.3) Hình 1.2 minh họa trực quan hai quỹ đạo trạng thái x(t) và x t
~
Từ hình minh họa đó ta rút
ra ngay được quan hệ giữa lượng biến phân trạng thái x t và điểm trạng thái cuối
x như sau:
Trang 28- Nếu xT là cố định và cho trước thì phải có x T 0
- nếu xT không cố định, chẳng hạn bị ràng buộc, thì có thể sẽ có x T 0
g u
g x
u Q u x Q
0
~
~
, ,
g x
g x
g x
g
, , ,
2 1
và
mu
g u
g u
g u
g
, , ,
2 1
là các ký hiệu Jacobi của hàm nhiều biến g(x,u)
Hoàn toàn tương tự, từ mô hình trạng thái (1.4) của hệ ta cũng có:
x
u x
f dt
x d
Trang 29
0 0
, ,
x T u
x x
u x
u x
x
u
f x
f dt
d p u
f x
f dt
d
u
f x
f u
x f u
x f dt
n
x
f x
f
x
f x
m
u
f u
f
u
f u
f
u f
1
1 1
1
là các ma trận Jacobi của véc tơ hàm f(x,u)
Kết hợp chung (1.5) và (1.6) lại với nhau ta đi đến:
x T u x
u
f x
f dt
d p u
g x
f p dt
p d u
f p u
g T
T p
T
x T
T u
T x
Vì x 0 0, do điểm đầu x0 là điểm xác định cho trước (hình 1.2)
Nhưng do vector p(t) là vector bất kỳ nên có thể chọn:
x
g x
f p
với điều kiện biên pT T x T 0
Khi đó p(t) được gọi là vector đồng trạng thái (costate), đồng thời bất đẳng thức (1.7a) trở thành:
dt u
f p u
gT
Trang 30Cuối cùng, sử dụng ký hiệu hàm Hamilton:
p d
Điều kiện cần: nếu u(t) là nghiệm của bài toán tối ưu động liên tục (1.4) có điểm
đầu x0 và khoảng thời gian T cho trước thì nghiệm đó phải thỏa mãn:
u
p u
x
H
0,
dt
dx
2
1 2
min,u x u dt
1,
Trang 318
1
21
- giải hệ phương trình vi phân trên được:
2 1
4 3
2 1
s s
s s
e k e
k
p
e k e
2 2 2
,0
014,4
014,00
4
t t
e e
t
x
k
k e
k e
e e
1.3.2.2 Phương pháp quy hoạch động của Bellman
Phương pháp quy hoạch động được dựa trên nguyên lý tối ưu sơ khai của Bellman:
Một chiến lược tối ưu có tính chất không phụ thuộc vào những quyết định trước đó (ví dụ như những luật điều khiển) song các quyết định còn lại phải cấu thành nên chiến lược tối ưu có liên quan với kết quả của những quyết định trước đó
Trang 32Nguyên lý tối ưu của Bellman có nội dung như sau: “ Mỗi đoạn cuối của quỹ đạo trạng thái tối ưu cũng sẽ là một quỹ đạo trạng thái tối ưu”
Có thể kiểm chứng tính đúng đắn của nguyên lý Bellman nhờ hình minh họa Hình1.3 Giả sử quỹ đạo liền nét đi từ điểm x0 qua xk đến xN là tối ưu (gồm hai đoạn
γα) trong đó phần quỹ đạo α từ xk đến xN lại không phải tối ưu Vậy thì phải tồn tại đoạn tối ưu từ xk đến xN (đoạn β) Như vậy hàm mục tiêu Q từ xk đến xN theo đoạn
β phải có giá trị nhỏ hơn là theo đoạn α và do đó dọc theo hai đoạn γβ hàm Q có giá trị nhỏ hơn là theo đoạn γα Điều này trái với giả thiết rằng đoạn là tối ưu
Dựa vào nguyên lý tối ưu, ta xác định được quan hệ uk(xk), k = 0, 1, 2, …, N-1 cần phải có giữa tín hiệu điều khiển tối ưu uk và trạng thái tối ưu xk bằng cách lập công thức biểu diễn giá trị hàm mục tiêu cho từng đoạn cuối như sau ( gọi là hàm
i i
B , k = 0, 1, …, N (1.13)
Các hàm Bellman Bk , k = N, N-1, …, 1, 0 phải có giá trị nhỏ nhất dọc theo quỹ đạo trạng thái tối ưu Bởi vậy, khi đã có giá trị hàm Bk+1 của đoạn cuối tối ưu tính từ điểm trạng thái xk+1 ta cũng sẽ xác định được quan hệ uk(xk) phải có của tín hiệu điều khiển tối ưu ứng với điểm trạng thái xk theo quy tắc:
Trang 33min
u u k k u
k
u
u
B u
x g B
N k k
Hai vòng tính của phương pháp: Vòng ngược (kỹ thuật nhúng) và vòng xuôi
Công thức (1.14) với điểm xuất phát (1.15) là công cụ giúp ta xây dựng được các bước xác định quan hệ uk(xk) phải có giữa tín hiệu điều khiển và trạng thái tối
ưu Ta sẽ gọi các bước tính này là vòng ngược vì nó có thứ tự thực hiện đi ngược từ
k = N ( ứng với điểm trạng thái cuối xN ) đến k = 0 ( ứng với điểm trạng thái đầu x0 ) Vòng tính ngược này còn được Bellman gọi là kỹ thuật nhúng (imbedding technique)
Nội dung của vòng ngược như sau:
Sẽ được hàm BN-1 tối ưu chỉ còn phụ thuộc theo xN-1
- Với N-2 ≥ k ≥ 0 thì do hàm Bk+1 chỉ phụ thuộc theo xk+1, tức là Bk+1(xk+1), nên:
Bk = g(xk,uk) + Bk+1(xk+1)
= g(xk,uk) + Bk+1(f(xk,uk))
k
u min (1.17a) Giải bài toán tối ưu (tĩnh) trên ta có quan hệ tối ưu:
uk(xk) (1.17b)
Thay quan hệ (1.17b) vừa tìm được vào (1.17a) để được hàm Bellman tối ưu:
B = B (x ) (1.17c)
Trang 34Bằng N bước tính ngược từ k = N-1 đến k = 0 như trên ta có được N công thức
mô tả quan hệ uk = uk(xk) phải có giữa tín hiệu điều khiển và trạng thái tối ưu Sau khi đã có các quan hệ này thì từng giá trị cụ thể của uk sẽ được tính nhờ mô hình (1.15) mô tả đối tượng Ta gọi các bước tính này là vòng xuôi vì nó được thực hiện lần lượt từ k = 0 tới k = N-1
Nội dung của vòng xuôi như sau:
Suy ra hàm Bellman tối ưu B3 x32 u32 2x32
k = 2: Ta phải tìm quan hệ u x2( 2) tối ưu để được:
Trang 35521
Trang 36trong đó U là một tập con đóng của m, có điểm trạng thái đầu x0 x (0)
và khoảng thời gian T cho trước, còn điểm trạng thái cuối xT là tuỳ ý ( hoặc bị ràng buộc bởi ST)
Cũng giống như ở phương pháp biến phân, ta định nghĩa:
Do tập U là tập đóng, nghiệm tối ưu có thể nằm trên biên của U, nên ta
không thể xác định u t ( ) tối ưu bằng điều kiện H 0T
Trang 37hai tín hiệu điều khiển nào đó thuộc U , cũng như x t ( )
T T
d p
A p a x x dt p T x T x T dt
Trang 38Tiếp tục, sử dụng các quan hệ (1.19) và (1.20) với:
Tính chất (1.24) được gọi là nguyên lý cực đại, phát biểu cho lớp bài toán
(1.18) Ta cũng có thể thấy, do bị ràng buộc bởi tập U , công thức biến phân
0T
H
u
đã được thay thế bằng nguyên lý cực đại (1.24) Hơn nữa, nguyên lý cực
đại (1.24) còn tổng quát hơn công thức biến phân, vì nếu nghiệm tối ưu u t ( ) là
điểm trong của U thì từ nguyên lý cực đại (1.24) ta cũng suy ra được công thức biến
phân, nhưng điều ngược lại thì không, chẳng hạn như trường hợp minh hoạ ở hình 1.4 với nghiệm nằm trên biên
Trang 39Nguyên lý cực đại (1.24) gợi ý cho ta có thể tìm tín hiệu điều khiển tối ưu
( )
u t U cho bài toán (1.18) với những bước như sau:
1) Lập hàm Hamitol (1.19)
2) Xác định quan hệ u x p( , )phải có của tín hiệu tối ưu u t( )U từ nguyên
lý cực đại (1.24) phát biểu trong định lý 1
3) Thay quan hệ tìm được vào phương trình Euler – Lagrange (1.20) và giải các phương trình đó với những điều kiện biên x(0) x0,p T( )0 để
H(x, p, u)
Hình 1.4 : Nguyên lý cực đại là trường hợp tổng quát
của công thức biến phân
Trang 400 1
1 0
với điều kiện biên
0(1)0