Mô hình nội sử dụng mạng nơron RBF cho phép thiết kế bộ điều khiển dựa vào mạng nơron mà không cần có mô hình toán học của đối tượng phi tuyến vẫn cho ra được chất lượng điều khiển tốt,
Trang 1Đại Học Quốc Gia Tp Hồ Chí Minh
TRƯỜNG ĐẠI HỌC BÁCH KHOA
Trang 2TÓM TẮT
Luận văn này trình bày một phương pháp điều khiển mực nước của bồn nước bầu dục, dựa trên nguyên lý Điều khiển mô hình nội sử dụng mạng nơron RBF Mục tiêu chính của việc điều khiển là biến ngõ ra, mực nước, bằng việc điều chỉnh biến ngõ vào, tín hiệu điều khiển Mô hình nơron được sử dụng như là một mô hình nội để xác định tín hiệu điều khiển cần thiết để mực nước bám theo tín hiệu tham chiếu Hai phương pháp, điều khiển nơron trực tiếp và điều khiển nơron gián tiếp, dựa vào mạng nơron RBF
Từ khóa : Điều khiển nơron trực tiếp, điều khiển nơron gián tiếp, điều khiển mô hình nội sử dụng mạng nơron RBF
Mạng nơron RBF đã cho thấy khả năng tuyệt vời để mô phỏng hàm phi tuyến bất kỳ với mức độ chính xác cần thiết Chính vì lý do này, mạng RBF phù hợp cho việc nhận dạng và điều khiển đối tượng phi tuyến Cấu trúc của mạng nơron gồm ba lớp khác nhau Lớp vào được tạo thành từ các nút nguồn nối với môi trường ‘vào’ Lớp thứ hai là lớp ẩn, biến đổi phi tuyến không gian ‘vào’ sang không gian ‘ẩn’ Lớp
ra cung cấp đáp ứng ra của mạng Phép chuyển đổi từ không gian vào sang không gian ẩn là phi tuyến, ngược lại sự chuyển đổi từ không gian đơn vị ẩn sang không gian ngõ ra là tuyến tính
Việc nhận dạng đối tượng phi tuyến phức tạp đóng vai trò quan trọng trong toàn bộ cấu trúc của bộ điều khiển sử dụng mạng nơron Trong luận văn này, em trình bày một phương pháp nhận dạng mạng nơron RBF, được huấn luyện online Tổng quát, đối tượng phi tuyến được biểu diễn bằng tập dữ liệu vào ra như sau :
y(k+1) = f{y(k), y(k-1), ; u(k), u(k-1), ]
Trang 3Phương pháp xấp xỉ online sử dụng mạng RBF, ynet(k)=wiT(k-1)Gi(k-1) được sử dụng như là tín hiện nhận dạng cho y(k), wi(k) là tham số điều chỉnh của nhận dạng online, G(k) là hàm cơ sở tương ứng Sử dụng phương pháp Gradient Descent để điều chỉnh trọng số wi(k) sao cho sai số e(k) (e(k) = y(k) – ynet(k)) là cực tiểu
Em đề cử một qui trình thiết kế cho Điều khiển mô hình nội sử dụng mạng nơron RBF Giả sử rằng, mô hình rời rạc của bồn nước bầu dục là sẳn có Có hai bước để thiết kế Điều khiển mô hình nội sử dụng mạng nơron RBF cho bồn nước bấu dục Đầu tiên, việc nhận dạng được thực hiện để nhận dạng hành vi động của đối tượng Sau khi nhận dạng, ngõ ra nhận dạng ynet(k) cung cấp thông tin cho bộ điều khiển nơron Thứ hai, bộ điều khiển được thành lập dựa trên thông tin của ngõ ra của đối tượng và ngõ ra nhận dạng, u(k) = h[y(k),ynet(k)] = wT(k).G(k) sử dụng phương pháp Gradient Descent để điều chỉnh trọng số w(k) sao cho sao số (e(k)=r(k)-y(k)) giữa tín hiệu tham chiếu r(k) và ngõ ra của đối tượng y(k) cực tiểu
Trang 4RBF neural network have shown an excellent ability to model any nonlinear function with a necessary degree of accuracy Because of this property, they are suitable for the identification and control nonlinear plants The construction of a radial basis function (RBF) network in its most basis form involves three entirely different layers The input layer is made up of source nodes The second layer is a hidden layer of high enough dimension, which serves a different purpose from that
in a multilayer perceptron The output layer supplies the response of the network to the activation patterns applied to the input layer The transformation from the input space to the hidden unit space is nonlinear, whereas the transformation from the hidden unit space to the output space is linear
The identification of complex and nonlinear plants plays an important role in the overall architecture of controller using neural network In this thesis, I present
an identification approach based on Radial Basis Function neural network that is
Trang 5trained online In general, a nonlinear plant can be represented in terms of input output data as follows :
y(k+1) = f{y(k), y(k-1), ; u(k), u(k-1), ]
The online approximation method using RBF neural network, ynet(k) =
wiT(k-1)Gi(k-1) are used as identification of y(k), where wi(k) are the adjustable parameters of the online identification, G(k) are the coresponding basis functions Using the Gradient Descent method to adjust weights wi(k) so that the error (e(k) = y(k) – ynet(k)) is minimum
I propose a design procedure of Internal Model Control using RBF Neural Network I assume that a stable discrete time model of the surge tank is available There are two steps to design the Internal Model Control using RBF Neural Network for the surge tank First, identification is performming in order to identify the dynamic behavior of the plant After identification, identification output (ynet(k)) supply the information to neural controller Second, controller is established that base on information of plant output and identification output, u(k) = h[y(k),ynet(k)] = wT(k).G(k) Using the Gradient Descent method to adjust weights w(k) so that the error (e(k) = r(k) – y(k)) between reference signal r(k) and plant output y(k) is minimum
Trang 6LỜI CẢM TẠ
Em xin chân thành cảm ơn các Thầy Cô thuộc phòng Sau Đại Học và khoa Tự động hóa của trường Đại học Bách Khoa Tp Hồ Chí Minh đã hướng dẫn và giúp đỡ
em hoàn thành tốt luận văn này
Em đặc biệt xin cám ơn Thầy Nguyễn Thiện Thành, giáo viên hướng dẫn thực hiện luận văn, người đã tận tình hướng dẫn và chỉnh sửa để luận văn được hoàn chỉnh hơn
Bên cạnh đó, em cũng xin cám ơn các bạn bè đã hỗ trợ cho em trong quá trình học tập và làm luận văn
Nguyễn Hồng Huy
Trang 7LỜI GIỚI THIỆU
Điều khiển nơron trực tiếp thì cần xác định mô hình toán học của một đối tượng phi tuyến rồi mới đưa ra được mô hình toán học cho bộ điều khiển nơron Nếu như không xác định được mô hình toán học của đối tượng phi tuyến thì không thể đưa ra mô hình toán học cho bộ điều khiển Khi có nhiễu tác động đến đối tượng sẽ làm thay đổi đặc tính động của đối tượng nên ảnh hưởng đến chất lượng của điều khiển Điều khiển nơron gián tiếp có ưu điểm là không cần biết mô hình toán học của đối tượng mà vẫn đưa ra được mô hình toán học cho bộ điều khiển Chất lượng của hệ thống điều khiển nơron gián tiếp không bằng chất lượng của điều khiển nơron trực tiếp
Mô hình nội sử dụng mạng nơron RBF cho phép thiết kế bộ điều khiển dựa vào mạng nơron mà không cần có mô hình toán học của đối tượng phi tuyến vẫn cho ra được chất lượng điều khiển tốt, ngay cả khi hệ thống bị tác động bởi nhiễu
Trang 8MỤC LỤC Trang
Chương 1 : Tổng quan về các hệ thộng điều khiển 1
1.1)Điều khiển truyền thống 1
1.2)Điều khiển tối ưu và bền vững 4
1.3)Điều khiển mờ 7
1.4)Điều khiển nơron 10
Chương 2 : Nhận dạng và Điều khiển hệ phi tuyến sử dụng mạng nơron 14
2.1)Mạng nơron nhân tạo 14
2.1.1)Cấu trúc mạng 14
2.1.2)Hàm kích hoạt 19
2.1.3)Phương pháp học và giải thuật 21
2.2)Nhận dạng hệ phi tuyến sử dụng mạng nơron 23
2.2.1)Mô hình nhận dạng thuận 23
2.2.2)Mô hình nhận dạng đảo 26
2.3)Điều khiển hệ phi tuyến dùng mạng nơron 28
2.3.1)Điều khiển trực tiếp 28
2.3.2) Điều khiển gián tiếp 31
2.3.3) Điều khiển mô hình nội 34
Chương 3 : Mạng nơron RBF 37
3.1)Giới thiệu về mạng nơron RBF 37
3.1.1)Cấu trúc mạng 37
3.1.2)Hàm xuyên tâm 38
3.1.3)Khảo sát không gian vào các điểm xuyên tâm 40
Trang 93.2)Học giám sát với mạng RBF 44
3.2.1)Học cải thiện các thông số của hàm xuyên tâm 46
3.2.2)Học cải thiện trọng số 47
3.3)Học không giám sát với mạng RBF 48
Chương 4 : Mô hình nội dùng mạng nơron RBF 52
4.1) Điều khiển nơron trực tiếp dùng mạng nơron RBF 55
4.2) Điều khiển nơron gián tiếp dùng mạng nơron RBF 58
4.3) Điều khiển mô hình nội dùng mạng nơron RBF 64
Chương 5 : Báo cáo kết quả mô phỏng 69
5.1)Điều khiển trực tiếp 69
5.1.1) Không có nhiễu 69
5.1.2) Có nhiễu 70
5.2)Điều khiển gián tiếp 71
5.2.1) Không nhiễu 71
5.2.2) Có nhiễu 73
5.3)Mô hình nội sử dụng mạng nơron RBF 74
5.3.1) Có nhiễu 74
5.3.2) Không nhiễu 75
Trang 10CHƯƠNG 1 : TỔNG QUAN VỀ CÁC HỆ THỐNG ĐIỀU KHIỂN
1.1) Điều khiển truyền thống
Điều khiển là một quá trình thu thập thông tin, xử lý thông tin và tác động lên hệ thống để đáp ứng của hệ thống “gần” với mục đích định trước Điều khiển tự động là một quá trình điều khiển không cần sự tác động của con ngưới
Lý thuyết điều khiển kinh điển mô tả hệ thống trong miền tần số (phép biến đổi Fourier) và mặt phẳng s (phép biến đổi Laplace) Do dựa trên phép biến đổi này, lý thuyết điều khiển kinh điển chủ yếu áp dụng cho hệ tuyến tính (Hệ thống tuyến tính không tồn tại trong thực tế, vì tất cả các hệ thống vật lý đều phi tuyến.) bất biến theo thời gian, mặt dù có một vài mở rộng để áp dụng cho hệ phi tuyến, thí dụ như phương pháp hàm mô tả Lý thuyết điều khiển kinh điển thích hợp để thiết kế hệ thống một ngõ vào – một ngõ ra (SISO), rất khó áp dụng cho các hệ thống nhiều ngõ vào – nhiều ngõ ra (MIMO) và các hệ thống biến đổi theo thời gian Các phương pháp phân tích và thiết kế hệ thống trong lý thuyết điều khiển kinh điển gồm có phương pháp Nyquist, Bode và phương pháp quỹ đạo nghiệm số Để thiết kế hệ thống dùng phương pháp Nyquist và Bode cần mô tả hệ thống dưới dạng đáp ứng tần số (đáp ứng biên độ và đáp ứng pha), đây là một thuận lợi vì đáp ứng tần số có thể đo được bằng thực nghiệm Mô tả hệ thống cần để thiết kế dùng phương pháp quỹ đạo nghiệm số là hàm truyền, hàm truyền cũng có thể tính được từ đáp ứng tần số Hàm truyền của hệ thống phức tạp được tính bằng cách sử dụng sơ đồ khối hay sơ đồ dòng tín hiệu Mô tả chính xác đặc tính động học bên trong hệ thống là không cần thiết đối với các phương pháp thiết kế kinh điển, chỉ có quan hệ giữa ngõ vào và ngõ ra là quan trọng
Trang 11Các khâu hiệu chỉnh đơn giản như hiệu chỉnh vi tích phân tỉ lệ PID, hiệu chỉnh sớm trể pha, thường được sử dụng trong các hệ thống điều khiển kinh điển Aûnh hưởng của các khâu hiệu chỉnh này đến biểu đồ Nyquist, biểu đồ Bode và quỹ đạo nghiệm số có thể thấy được dễ dàng, nhờ đó có thể dễ dàng lựa chọn được khâu hiệu chỉnh thích hợp
Kỹ thuật thiết kế hệ thống điều khiển hiện đại dựa trên miền thời gian Mô tả toán học dùng để phân tích và thiết kế hệ thống là phương trình trạng thái Mô hình không gian trạng thái có ưu điểm là mô tả đặc tính động học bên trong hệ thống (các biến trạng thái) và có thể dễ dàng áp dụng cho hệ đa ngõ vào – đa ngõ ra (MIMO) và hệ thống biến đổi theo thời gian Lý thuyết điều khiển hiện đại ban đầu được phát triển chủ yếu cho hệ tuyến tính, sau đó được mở rộng cho hệ phi tuyến bằng cách sử dụng lý thuyết của Lyapunov
Bộ điều khiển được sử dụng chủ yếu trong thiết kế hệ thống điều khiển hiện đại là bộ điều khiển hồi tiếp trạng thái Tùy theo cách tính vecto hồi tiếp trạng thái mà ta có phương pháp phân bố cực, điều khiển tối ưu, điều khiển bền vững Với sự phát triển của lý thuyết điều khiển số và hệ thống rời rạc, lý thuyết điều khiển hiện đại rất thích hợp để thiết kế các bộ điều khiển là các chương trình phần mềm chạy trên vi xử lý và máy tính số Điều này cho phép thực thi được các bộ điều khiển có đặc tính động phức tạp hơn nhưng cũng hiệu quả hơn so với các bộ điều khiển đơn giản như PID hay sớm trễ pha trong lý thuyết điều khiển kinh điển
Hệ thống điều khiển vòng hở :
Hệ thống điều khiển vòng hở là hệ thống điều khiển mà ngõ ra y(t) không có ảnh hưởng gì đến bộ điều khiển Ngõ ra của hệ thống y(t) không được hồi tiếp về hay so sánh với ngõ vào tham chiếu r(t) Hình 1.1 biểu diễn mối quan hệ vào – ra
Trang 12của hệ thống điều khiển vòng hở Chẳng hạn như máy bơm nước : hết nước thì nhấn nút bơm, nước đủ thì nhấn nút dừng máy bơm Trong hệ thống điều khiển vòng hở, không có sự so sánh giữa ngõ ra y(t) và ngõ vào tham chiếu r(t), mỗi ngõ vào tham chiếu là tương ứng với một tín hiệu điều khiển u(t) Độ chính xác của hệ thống phụ thuộc vào việc chuẩn hóa tín hiệu điều khiển của bộ điều khiển
r(t)
Hình 1.1 Sơ đồ khối hệ thống điều khiển vòng hở
Hệ thống điều khiển vòng kín :
Hệ thống điều khiển vòng kín là hệ thống mà tín hiệu ngõ ra y(t) ảnh hưởng trực tiếp đến bộ điều khiển Hệ thống điều khiển vòng kín hay còn gọi là hệ thống hồi tiếp Sai số giữa tín hiệu tham chiếu r(t) và tín hiệu ngõ ra y(t) được đưa vào bộ điều khiển, nhiệm vụ của bộ điều khiển là cung cấp tín hiệu điều khiển sao cho sai số về không (tín hiệu ngõ ra y(t) tiến đến tín hiệu tham chiếu r(t)) Hình 1.2 biểu diễn sơ đồ khối của hệ thống điều khiển vòng kín
r(t)
Hình 1.2 Sơ đồ khối hệ thống điều khiển vòng kín e(t)
Trang 131.2) Điều khiển tối ưu bền vững
Điều khiển tối ưu là một chuyên ngành trong Điều khiển tự động, có vai trò xác định và tạo lập những luật điều khiển cho hệ thống để hệ thống đạt được chỉ tiêu về tính hiệu quả đã được định trước dưới dạng hàm đánh giá J miền nghiên cứu và ứng dụng của điều khiển tối ưu không chỉ riêng ở các hệ thống kỹ thuậtmà có thể tìm thấy ở hầu hết các hệ thống không là kỹ thuật khác như hệ sinh học, kinh tế, Trong điều khiển tối ưu, có hai phương pháp cơ bản là : điều khiển tối ưu tĩnh và điều khiển tối ưu động
Điều khiển tối ưu tĩnh : Khi mô hình hệ thống có dạng tĩnh, tức là quan hệ trạng thái vào – ra không phụ thuộc vào biến thời gian, chẳng hạn giá trị của biến ra tại một thời điểm chỉ phụ thuộc vào giá trị biến vào và trạng thái tại đúng thời điểm đó Mô hình tĩnh có dạng phương trình đại số như sau :
Trang 14Hàm đánh giá trong bài toán tối ưu tĩnh chỉ phụ thuộc vào tín hiệu điều khiển u(t) và tín hiệu ngõ ra y(t) (J = J(u,y)) Còn đối với bài toán tối ưu động, hàm đánh giá phụ thuộc vào phần vi phân và phần đại số như sau :
giá trị trong một miền U kín, giới nội thuộc R’ Có thể thấy vấn đề điều khiển tối ưu
tĩnh chính là bài toán cực trị với những điều kiện ràng buộc
Điều khiển bền vững là một phần của lý thuyết điều khiển nâng cao, có nhiệm vụ xây dựng cơ sở lý thuyết phục vụ cho việc phân tích và tổng hợp các bộ điều khiển C(z), sao cho tính ổn định và chất lượng của hệ tổng hợp được sẽ “bền vững” với:
Các sai lệch cho phép giữa mô hình tham chiếu R(z) và đối tượng P(z)
Aûnh hưởng của nhiễu tác động vào hệ
Trang 15Để dễ trực quan được khái niệm bền vững, hãy xét một hệ đơn giản gồm một vòng hồi tiếp âm và ba tín hiệu nhiễu n1, n2, n3 Khâu điều khiển có hàm truyền đạt C(z), đối tượng P(z) như hình 1.3 và không có giới hạn là chỉ một đầu vào – một đầu
ra (SISO), nói cách khác là khâu điều khiển và đối tượng có thể là những khâu nhiều đầu vào – nhiều đầu ra (MIMO) Các tín hiệu e(t), x(t), y(t) được gọi là các tínhiệu nội của hệ thống, còn u(t), n1(t), n2(t), n3(t) là các tín hiệu ngoại tác động vào hệ Khâu điều khiển C(z) được xây dựng dựa trên kiến thức và hiểu biết về đối tượng P được mô tả lại bằng mô hình P(z), song không có sự đảm bảo nào cho rằng mô hình P(z) phản ánh được đối tượng một cách hoàn toàn chính xác cho dù mô hình P(z) có độ phức tạp cao, và như vậy trong thực tế bao giờ cũng tồn tại một sai lệch ΔP giữa đối tượng P và mô hình P(z) Vấn đề phải giải quyết ở đây là khâu điều khiển C(z) được xây dựng cho mô hình đối tượng P(z) nhưng thực tế lại làm việc trên đối tượng thực P mà sự sai lệch ΔP giữa đối tượng và mô hình không biết trước Tuy nhiên vẫn thiết kế bộ điều khiển C(z) thỏa mãn các yêu cầu về chất lượng hệ thống thực Bộ điều khiển C(z) đáp ứng các yêu cầu về chất lượng và khả năng làm việc thích ứng với các sai lệch ΔP càng lớn, có nghĩa là với một mô hình ℘ cho đối tượng càng rộng, thì tính bền vững của bộ điều khiển càng cao Như vậy khái niệm về bền vững được hiểu như sau :
Một hệ thống được gọi là bền vững nếu chất lượng E của hệ thống không
những thỏa mãn cho riêng mô hình đối tượng P(z) đang nghiên cứu mà cho một lớp
các mô hình đối tượng ℘ với P(z) là một phần tử, hoặc cho một lớp các sai lệch D so
với P(z)
Trang 16Một bộ điều khiển C(z) được gọi là bền vững nếu nó làm cho hệ thống bền
vững với chất lượng E cho một lớp các mô hình đối tượng ℘ hoặc cho một lớp các sai lệch D so với P(z)
Mặc dù các dạng sai lệch mô hình – đối tượng là không bết trước nhưng ta có thể phân chia chúng thành hai loại cơ bản như sau :
Sai lệch có cấu trúc, được hiểu là loại sai lệch mô tả được dưới dạng sai số
Sai lệch không có cấu trúc, gồm tất cả các sai lệch còn lại, ví dụ như sai lệch về bậc mô hình, hay mô hình là tuyến tính nh7ng đối tượng là phi tuyến, Để mô tả loại sai lệch không có cấu trúc người ta phải nhờ đến
các khái niệm như metric, chuẩn trong không gian hàm số
Tính bền vững của hệ đối với một chất lượng thường được đánh giá bởi :
Tính định lượng bền vững : Một hệ thống được gọi là có tính định lượng bền
vững nếu yêu cầu chất lượng E của hệ thống không những được thỏa mãn với một lớp các mô hình đối tượng ℘, hoặc một các sai lệch D, mà còn thích ứng
và duy trì trong một môi trường có nhiễu tác động vào hệ thống
Tính ổn định bền vững : Một hệ được gọi là ổn định bền vững nếu nó ổn định
nội với một các mô hình đối tượng ℘, hoặc với một lớp các sai lệch D so với
đối tượng
1.3) Điều khiển mờ
Điều khiển mờ chiếm một vị trí quan trọng trong điều khiển học kỹ thuật hiện đại Ngay từ buổi đầu, điều khiển mờ đã đem lại sự ngạc nhiên đáng kể rằng hoàn toàn trái ngược với tên của nó, kỹ thuật điều khiển này đồng nghĩa với độ chính xác
Trang 17và khả năng thực hiện Tuy là ngành kỹ thuật còn non trẻ nhưng những ứng dụng trong công nghiệp của bộ điều khiển mờ thật rộng rãi như : điều khiển nhiệt độ, điều khiển giao thông vận tải, điều khiển trong các lĩnh vực sản xuất hàng hóa dân dụng… Trong thực tế, nhiều giải pháp tổng hợp, thiết kế bộ điều khiển kinh điển thường bị bế tắc khi gặp những bài toán có độ phức tạp của hệ thống cao, độ phi tuyến lớn, sự thường xuyên thay đổi trạng thái và cấu trúc của đối tượng , hoặc giả có thể tổng hợp được trong phạm vi lý thuyết thì khi thực hiện cũng gặp không ít những khó khăn về giá thành và độ tin cậy của sản phẩm Các khó khăn đó sẽ không còn là những vấn đề nan giải khi bộ điều khiển được thiết kế dựa trên cơ sở lôgíc mờ và càng đơn giản hơn khi thực hiện giải pháp này Các bộ điều khiển được thiết kế trên
cơ sở lôgíc mờ có tên gọi là bộ điều khiển mờ Chúng có chung một đặc điểm là làm việc theo nguyên tắc sao chép lại kinh nghiệm, tri thức của con người, vận hành máy móc So với các giải pháp kỹ thuật từ trước tới nay được áp dụng để tổng hợp các hệ thống điều khiển, phương pháp tổng hợp hệ thống bằng lôgíc mờ chỉ ra những ưu điểm rõ rệt như sau :
Khối lượng công việc giảm đi nhiều do không cần sử dụng mô hình đối tượng, với các bài toán thiết kế có độ phức tạp cao, giải pháp dùng bộ điều khiển mờ cho phép giảm khối lượng tính toán và giá thành sản phẩm
Bộ điều khiển mờ dễ hiểu hơn so với các bộ điều khiển khác và dễ dàng thay đổi
Trong nhiều trường hợp bộ điều khiển mờ làm việc ổn định hơn, bền vững hơn và chất lượng điều khiển cao hơn
Trang 18Các thành phần cơ bản của bộ điều khiển mờ :
Khâu mờ hóa : là quá trình chuyển đổi các biến vật lý với các giá trị rõ sang biến ngôn ngữ với các giá trị mờ (tập mờ)
Qui tắc mờ : Giả sử có hai biến ngôn ngữ là x và y Nếu biến x nhận giá trị mờ A với hàm liên thuộc μA(x) và y nhận giá trị mờ B với hàm liên thuộc μB(x) thì biểu thức : x = A được gọi là mệnh đề điều kiện và y = B là mệnh đề kết luận Tổng hợp hai mệnh đề điều kiện và kết luận, ta có một mệnh đề chung
Mờ hóa
Luật hợp thành mờ
Giải mờ
Hình 1.4 Sơ đồ bộ điều khiển mờ cơ bản Về nguyên tắc, bộ điều khiển mờ không khác gì so với các hệ thống điều khiển thông thường khác Sự khác biệt ở đây là bộ điều khiển mờ làm việc có tư duy như
“bộ não” dưới dạng trí tuệ nhân tạo Hệ thống điều khiển mờ có thể coi như một hệ
Trang 19thống điều khiển mà không cần biết trước mô hình đối tượng Hình 1.5 biểu diễn sơ đồ khối của hệ thống điều khiển mờ với bộ điều khiển mờ là hình 1.4
1.4) Điều khiển nơron
Mạng nơron là sự tái tạo bằng kỹ thuật những chức năng của hệ thần kinh con người Trong quá trình tái tạo không phải tất cả các chức năng của bộ não con người có đều được tái tạo, mà chỉ có những chức năng cần thiết Bên cạnh đó còn có những chức năng mới được tạo ra nhằm giải quyết một bài toán điều khiển đã định hướng trước Cấu trúc cơ bản của mạng nơron gồm có lớp nơron đầu vào, lớp nơron ẩn và lớp nơron đầu ra Quá trình hệ bắt đầu tiếp xúc một vài đối tượng cho đến khi hệ làm
ra một số quyết định để điều khiển một vài phần tử được gọi là huấn luyện và cường độ kết nối của một số nơron thích hợp được gia tăng theo trong thời gian hệ đang tiếp xúc đối tượng được gọi là luật học
Trang 20Các thành phần cơ bản của mạng nơron là:
Phần tử xử lý: một mạng nơron nhân tạo được kết nối bằng nhiều thân nơron, mỗi thân nơron là một phần tử xử lý Mỗi phần tử xử lý có nhiều đầu vào và một đầu ra Để kết hợp với các đầu vào của phần tử xử lý thứ i đó là một hàm tổng hợp fi có chức năng tổng hợp tất cả thông tin từ các nguồn bên ngoài hoặc bằng nhiều phần tử xử lý khác gởi đến và để kết hợp với đầu ra của mỗi phần tử xử lý thứ i đó là một hàm tác động a(fi)
Mô hình kết nối của mạng nơron nhân tạo có thể được chia làm hai loại: mạng nuôi tiến (được xây dựng bằng cách đầu ra của nơron ở lớp đứng trước chính là đầu vào của nơron lớp dứng ngay sau nó) và mạng nuôi lùi (được xây dựng khi các đầu ra được định hướng lùi về làm các đầu vào cho các nơron ở cùng lớp hoặc ở lớp đứng trước nó)
Luật học thông số tổng quát cho các mạng nơron: Có hai cách học trong các mạng nơron nhân tạo, đó là học thông số (là phương pháp học bằng cách cập nhật các hệ số trọng lượng kết nối) và học cấu trúc ( là phương pháp học bằng cách thay đổi bên trong cấu trúc mạng bao gồm số của các phần tử xử lý và các mô hình hình của kết nối mạng)
Hình 1.6 Cấu trúc tế bào nơron
của não người
Hình 1.7 Mô hình nhân tạo của một nơron
Trang 21Các hàm kích hoạt cơ bản :
01
)(
f
f f
01
)(
f
f f
10
11
)(
f
f f
f f
a
f
e f
+
=1
1)
(
+ Hàm Unipolar sigmoid:
f
e f
+
=1
1)
Trang 22Sai số trung bình bình phương tối thiểu :
Ví dụ về mạng truyền thẳng một lớp (MLP): là mạng có cấu trúc đơn giản nhất Tính đơn giản này sẽ không hạn chế miền ứng dụng của nó vì mọi mạng truyền thẳng một lớp với các nơron thuộc lớp ẩn và lớp đầu vào có tính tuyến tính đều chuyển được về dạng một lớp Do đó khả năng đại diện tổng quát cho mạng truyền thẳng với tính chất tuyến tính của các nơron lớp ẩn và lớp đầu vào nên mạng nơron một lớp còn có tên gọi là mạng tuyến tính
Véctơ ngõ vào : x = [x1 xm]
Véctơ ngõ ra : y = [y1 yn]
Véctơ trọng số của nơron thứ i : wi = [wi 1 wi m ]
Ngõ ra của mạng nơron : yi = wiT x , với i = 1, , n
Trang 23CHƯƠNG 2 : NHẬN DẠNG VÀ ĐIỀU KHIỂN HỆ PHI TUYẾN SỬ DỤNG MẠNG NƠRON
2.1) Mạng nơron nhân tạo
Trí tuệ nhân tạo phát triển mạnh mẽ trong những năm gần đây tạo ra cơ sở xây dựng các hệ chuyên gia, những hệ có khả năng cung cấp “kinh nghiệm điều khiển hệ thống” hay còn gọi là các hệ trợ giúp quyết định Trí tuệ nhân tạo được xây dựng dựa trên mạng nơron nhân tạo
2.1.1) Cấu trúc mạng
Mạng nơron là sự biểu diễn bằng nhân tạo về bộ não của con người, cố gắng mô phỏng quy trình học của nó Trong quá trình tái tạo không phải tất cả các chức năng của bộ não con người đều được tái tạo, mà chỉ có những chức năng cần thiết Bên cạnh đó còn có những chức năng mới được tạo ra nhằm giải quyết bài toán điều khiển đã định hướng trước Mạng nơron gồm có vô số các nơron được liên kết truyền thông với nhau trong mạng
rể
rể
rểmàng membran
nhân
Hình 2.1 Mô hình nơron
Trang 24Hình 2.1 là một phần cơ bản của mạng nơron Mạng nơron gồm các thành phần
cơ bản sau :
Thân nơron được giới hạn trong một màng membran và trong cùng là nhân Từ thân nơron có rất nhiều đường rẽ nhánh tạm gọi là rễ
“Bus” liên kết nơron này với các nơron khác được gọi là axon, trên axon có các đường rẽ nhánh Nơron còn có thể liên kết liên kết với các nơron khác qua các rễ Chính vì cách liên kết đa dạng như vậy nên mạng nơron có độ liên kết rất cao
Các rễ của nơron được chia thành hai loại : loại nhận thông tin từ nơron khác qua axon, mà ta sẽ gọi là rễ đầu vào và loại đưa thông tin qua các axon tới các nơron khác, gọi là rễ đầu ra Một nơron có thể có nhiều đầu vào, nhưng chỉ có một rễ đầu
ra Bởi vậy nếu xem nơron như một khâu điều khiển thì nó chính là khâu nhiều đầu vào, một đầu ra (khâu MISO) - hình 2.2
Hình 2.2 Mô hình nhân tạo của một nơron
Trang 25Quá trình hoạt động của nơron là một quá trình điện hóa tự nhiên Ơû trạng thái cân bằng (trạng thái tĩnh) điện áp của màng membran khoảng -75mV Khi có tác động từ bên ngoài vào nơron (mức điện áp kích thích khoảng 35mV), trong tế bào nơron xảy ra hàng loạt các phản ứng hóa học tạo thành lực tác động làm nơron bị thích thích hoàn toàn (bốc cháy) Thế năng sinh ra khi nơron ở trạng thái bị thích thích hoàn toàn này chỉ tồn tại khoảng vài mili giây sau đó nơron lại trở về trạng thái cân bằng cũ Thế năng này được truyền vào mạng qua axon và có khả năng kích thích hoặc kìm hãm tự nhiên các nơron khác trong mạng Một nơron sẽ ở trạng thái kích thích khi tại đầu vào xuất hiện một tín hiệu tác động vượt qua ngưỡng cân bằng của nơron
Một tính chất rất cơ bản của mạng nơron sinh học là các đáp ứng theo kích thích có khả năng thay đổi theo thời gian Các đáp ứng có thể tăng lên, giảm đi hoặc hoàn toàn biến mất Qua các nhánh axon liên kết tế bào nơron này với các nơron khác, sự thay đổi trạng thái của một nơron cũng kéo theo sự thay đổi trạng thái của nơron khác và do đó là sự thay đổi toàn bộ mạng nơron Việc thay đổi trạng thái của mạng nơron có thể thực hiện qua quá trình “dạy” hoặc do khả năng “học” tự nhiên Sự thay đổi những tính chất này bằng một mô hình toán học tương đương được gọi là mạng nơron nhân tạo Mạng nơron nhân tạo có thể được chế tạo bằng nhiều cách khác nhau vì vậy trong thực tế tồn tại rất nhiều kiểu mạng nơron nhân tạo Liên kết các đầu vào và đầu ra của nhiều nơron với nhau ta được một mang nơron Việc ghép nối các nơron trong mang với nhau có thể theo một nguyên tắc bất kỳ nào đó, vì về nguyên tắc một nơron là một hệ MISO Từ đó có thể phân biệt các loại nơron khác nhau như các loại nơron mà các đầu vào nhận thông tin từ môi trường bên ngoài với các loại nơron mà các đầu vào được nối với các nơron khác
Trang 26trong mạng Các nơron mà đầu vào giữ chức năng nhận thông tin từ môi trường bên ngoài với chức năng “đầu vào” của mạng Cũng tương tự như vậy, một nơron có một đầu ra, đầu ra của nơron này có thể là đầu vào của nhiều nơron khác hoặc có thể đưa
ra môi trường bên ngoài Những nơron có đầu ra đưa tín hiệu vào môi trường bên ngoài được gọi là “đầu ra” của mạng Nguyên lý cấu tạo của mạng nơron bao gồm nhiều lớp, mỗi lớp bao gồm nhiều nơron có cùng chức năng trong mạng
Các cấu trúc mạng nơron :
Mạng truyền thẳng : là một mạng gồm một hay nhiều lớp mắc nối tiếp với nhau đi từ đầu vào đến đầu ra Trong mạng không tồn tại bất kỳ một mạch hồi tiếp nào kể cả hồi tiếp nội lẫn hồi tiếp từ đầu ra trở về đầu vào Sơ đồ bên dưới biểu diễn mạng nơron truyền thẳng
Hình 2.3 Mạng truyền thẳng một lớp
Trang 27Lớp vào Lớp ẩn Lớp ra
Hình 2.4 Mạng truyền thẳng ba lớp
Mạng hồi tiếp : là mạng nơron có đường phản hồi từ đầu ra của một nơron tới đầu vào của nơron cùng lớp hoặc thuộc lớp nơron phía trước
Hình 2.5 Mạng hồi tiếp một lớp
Trang 28Lớp vào Lớp ẩn Lớp ra
Hình 2.6 Mạng hồi tiếp ba lớp
2.1.2) Hàm kích hoạt
Giá trị ra y của một nơron biểu diễn biểu diễn trạng thái kích thích đến các nơron tiếp theo trong mạng Tín hiệu ra y phụ thuộc vào độ kích hoạt của nơron, thông thường được so sánh theo mức cắt ngưỡng Quan hệ này được mô tả qua hàm kích hoạt của mô hình nơron Xuất phát từ quan điểm lôgíc kinh điển Có thể coi nơron như một phần tử làm việc theo nguyên tắc đóng mở, tức là chỉ tồn tại ở hai trạng thái : nơron bị kích hoạt và nơron không bị kích hoạt, chúng ta tạo ra được bộ tạo chức năng ra đơn giản nhất Hàm kích hoạt trong trường hợp này, có thể biểu diễn dưới dạng hàm bậc thang
Trang 29x khi
x khi
y = f(x) =
y1
Giá trị ra y có thể là một hằng số nào đó, không nhất thiết phải là 0 và 1 Giá trị c chính là ngưỡng quyết đinh trạng thái nơron bị kích hoạt Thông thường sự chuyển trạng thái của nơron từ không bị kích hoạt sang trạng thái kích hoạt và ngược lại là quá trình liên tục Quá trình chuyển đổi này có thể so sánh với quá trình chuyển đổi từ tập rõ sang tập mờ, đó là quá trình chuyển đổi trơn từ giá trị 0 sang giá trị 1 Các hàm kích hoạt thường được sử dụng :
01
x khi
x khi
Hàm ngưỡng: y = f(x) =
y1-1
10
11
x khi
x khi
x
x khi
y1
Trang 30e−
+1
1
Hàm Unipolar sigmoid: y = f(x) =
y
x1
0
2.1.3) Phương pháp học và giải thuật học
Mạng nơron khi mới hình thành còn chưa có tri thức, tri thức của mạng hình thành dần sau một quá trình học Mạng nơron được dạy bằng cách đưa vào đầu vào những kích hoạt và mạng được hình thành những đáp ứng tương ứng, những đáp ứng phù hợp với từng loại kích hoạt sẽ được lưu giữ, giai đoạn này được gọi là giai đoạn học của mạng Khi đã hình thành, tri thức của mạng có thể giải quyết các vấn đề cụ thể một cách đúng đắn
Mục đích của quá trình học là tạo ra một tri thức cho mạng thông qua huấn luyện Nguyên tắc học được thực hiện cho một mạng mà cấu trúc của mạng cũng như các phần nơron cố định, chính là thay đổi giá trị của các phần tử trong véc tơ hàm trọng số, véc tơ nối giữa các phần tử nơron trong mạng
Có hai cách học trong các mạng nơron nhân tạo
Học thông số là phương pháp học bằng cách cập nhật các hệ số trọng số kết nối Học thông số có thể chia làm ba loại là: học giám sát, học cũng cố, học không giám sát Sơ đồ dưới đây biểu diễn sự khác nhau giữa các phương pháp học thông số
Trang 31Ngõ vào x
Sai số eHình 2.7 Học giám sát
Ngõ vào x
Sai số eHình 2.8 Học cũng cố
Mạng nơron
w
Ngõ ra thực y Ngõ vào x
Hình 2.9 Học không giám sát
Phương pháp học giám sát (hình 2.7), mỗi giá trị ngõ vào x(k) đưa vào mạng nơron, ngõ ra mong muốn tương ứng yd (k) cũng đưa vào mạng Sai số giữa ngõ
ra mong muốn với ngõ ra thực được đưa vào mạng để điều chỉnh trọng số sao cho ngõ ra thực tiến gần đến ngõ ra mong muốn Phương pháp học cũng cố (hình 2.8), ngõ ra thực được xác định là đúng hay sai so với tín hiệu cũng cố,
Trang 32thông tin hồi tiếp này được đưa vào mạng nhằm tạo ra một tín hiệu ước lượng hồi tiếp tốt hơn Phương pháp học không giám sát (hình 2.9), không có tín hiệu tiếp từ bên ngoài để xác nhận ngõ ra thực là đúng hay không, mạng phải tự tìm phương pháp, mối liên quan, thuộc tính, điều chỉnh, , trong dữ liệu ngõ vào và mã hóa chúng thành ngõ ra
Học cấu trúc là phương pháp học bằng cách thay đổi bên trong cấu trúc mạng bao gồm số của các phần tử xử lý và các mô hình hình của kết nối mạng
2.2) Nhận dạng hệ phi tuyến dùng mạng nơron
Các kỹ thuật nhận dạng truyền thống gặp khó khăn khi đối mặt với việc sao chép đối tượng phi tuyến phức tạp Khắc phục các hạn chế đó, Narendra và Parthasarath đã sử dụng mạng nơron trong việc nhận dạng hệ thống động phi tuyến
Ưu điểm của việc áp dụng mạng nơron trong lĩnh vực nhận dạng hệ thống là không đòi hỏi các kiến thức chi tiết về đối tượng cần được nhận dạng Thay vào đó, chúng được huấn luyện để mô phỏng hệ thống bằng việc “học” từ tập dữ liệu vào – ra Nhận dạng hệ thống dựa vào mạng nơron có thể được phân chia làm hai loại : mô hình nhận dạng thuận và mô hình nhận dạng đảo
2.2.1) Mô hình nhận dạng thuận
Nhận dạng mô hình thuận có nghĩa là áp dụng mạng nơron để mô phỏng đặc tính động của hệ thống một cách trực tiếp
Trong hình 2.10, u(t) là ngõ vào tác động, yp (t+1) là ngõ ra của đối tượng, ynet
(t+1) là ngõ ra của mô hình nhận dạng thuận sử dụng mạng nơron, e(t+1) là sai số nhận dạng; được sử dụng để huấn luyện mạng nơron Ở đây, cấu trúc học có
giám sát được sử dụng cho mạng nơron lan truyền ngược (BP) Mục tiêu của quy
Trang 33Đối tượng phi tuyến
yp (t+1) = ϕ[yp (t), , yp (t-n+1); u(t), , u(t-m +1)] (2.1) Phương trình (2.1) mô tả hệ thống động, vì ϕ[.] có thể là hàm tuyến tính hay phi tuyến (giả sử ϕ[.] là hàm phi tuyến chưa biết), m và n là các bậc của tín hiệu vào – ra của đối tượng Có hai cấu trúc bổ sung cho sơ đồ nhận dạng sử dụng mạng nơron; cấu trúc song song (đường kết nối bằng các nét gạch ngang) và cấu
Cấu trúc song song – nối tiếp (đường kết nối bằng các điểm), được biểu diễn trong hình 2.11
Phương trình biểu diễn ynet :
y (t+1) = net ϕ ˆ[y (t), , y (t-n+1); u(t), , u(t-m +1)] net net (2.2)
Trang 34Đối tượng phi tuyến
Các mô hình huấn luyện cho mạng nơron lan truyền ngược được chia thành thuật học theo phân nhóm (batch) hay thuật học theo mô hình (pattern) Nhận dạng off – line, huấn luyện mạng nơron sử dụng thuật học phân nhóm, không cần giới hạn thời gian huấn luyện Ưu điểm của thuật học phân nhóm là đặc tính hội tụ ổn định
Trang 352.2.2) Mô hình nhận dạng đảo
Mô hình nhận dạng đảo cho đối tượng là một quá trình đảo của nhận dạng thuận Yêu cầu thông thường cho mô hình đảo là xây dựng sơ đồ điều khiển hệ thống đặc tính động đảo Mô hình nhận dạng đảo dựa vào mạng nơron trực tiếp được minh họa ở hình 2.12
Đối tượng phi tuyến
Mạng nơron
Thuận học
unet (t) e(t+1)
_ +
Hình 2.12 Sơ đồ mô hình nhận dạng đảo; cấu trúc song song (đường kết nối bằng các nét gạch ngang) và cấu trúc song song – nối tiếp (đường kết nối bằng các điểm)
TDL
TDL
Trong hình 2.12 unet (t) là ngõ ra bộ nhận dạng đảo Tương tự như mô hình nhận dạng thuận, mô hình nhận dạng cũng có hai cấu trúc, cấu trúc song song (đường gạch ngang) và cấu trúc song song – nối tiếp (các điểm) Phương trình cho nhận dạng mô hình đảo sử dụng cấu trúc song song – nối tiếp như sau :
unet (t) = ϕ ˆ -1 [yp (t+1), yp (t), , yp (t-n+1); u(t), , u(t-m +1)] (2.3)
và phương trình cho nhận dạng mô hình đảo sử dụng cấu trúc song song :
unet (t) = ϕ ˆ -1 [yp (t+1), ynet (t) , y (t-n+1); u(t), , u(t-m +1)] net (2.4)
Bên cạnh mô hình nhận dạng đảo trực tiếp còn có mô hình nhận dạng đảo gián tiếp, được biểu diễn ở hình 2.13
Trang 36Tín hiệu tham chiếu được áp dụng như là tín hiệu huấn luyện Sự khác nhau giữa tín hiệu tham chiếu và ngõ ra của mô hình nhận dạng thuận được đưa vào để huấn luyện mạng nơron đảo Nếu chúng ta giả sử rằng mô hình nhận dạng thuận mô tả chính xác các đặc tính động của đối tượng, sự khác nhau đó cũng
Đối tượng phi tuyến
ynet (t+1)
e(t+1)
_ +
Hình 2.13 Sơ đồ mô hình nhận dạng đảo sử dụng mạng nơron gián tiếp
Mô hình nhận dạng thuận
Thuật học ref(t)
để tạo ra một sơ đồ nhận dạng thông qua mô hình thuận và đảo Đặc tính động chính là sai số điều chỉnh cho hệ thống điều khiển vòng kín Do đó mạng nơron được huấn luyện của mô hình đảo được biểu diễn cho cấu trúc nối tiếp – song song như sau :
unet (t) = ϕ ˆ -1 [ref(t), yp (t+1), , y(t-n+1); u(t), , u(t-m +1)] (2.5) và cấu trúc song song :
unet (t) = ϕ ˆ -1 [ref(t), y (t+1), , y (t-n+1); u(t), , u(t-m +1)] net net (2.6)
D H Nguyen and B Widrow đã đưa ra phương pháp mô hình nhận dạng đảo gián tiếp mà được minh họa ở trên
Một cách khác để thực hiện mô hình nhận dạng đảo là kết hợp hai phương pháp, trực tiếp và gián tiếp Chính xác hơn, đầu tiên mạng nơron được huấn luyện bằng phương pháp trực tiếp mô hình đảo gần đúng của đối tượng Tín hiệu huấn
Trang 37luyện có thể được chọn lọc một cách ngẫu nhiên trong toàn bộ khoảng hoạt động Nó không cần gần với tín hiệu tham chiếu Công việc này được thực hiện off – line Thực ra, phương pháp trực tiếp có thể được xem như bước khởi động cho giai đoạn thứ hai Phương pháp gián tiếp được áp dụng on – line ở giai đoạn thứ hai Theo tín hiệu tham chiếu thực, mạng nơron sẽ nhận dạng mô hình đảo chính xác của đối tượng xung quanh điểm hoạt động Công việc đó là để tinh chỉnh mô hình trong bước trước đó theo tín hiệu tham chiếu thực Sự hợp nhất của hai phương pháp này sẽ tăng nhanh quá trình huấn luyện cho mạng nơron, và có thể tránh việc tìm kiếm trọng số rơi vào cực tiểu cục bộ
H F VanLandingham, S Bingulac and M Tran đã so sánh bằng mô phỏng giữa các phương pháp nhận dạng truyền thống và nhận dạng sử dụng mạng nơron Các kết quả cho thấy : đối với hệ thống tuyến tính nhiều ngõ vào – nhiều ngõ ra, thì các kết quả nhận dạng là hơi giống nhau ; tuy nhiên, đối với “mô hình tự do” phương pháp nhận dạng sử dụng mạng nơron có ưu điểm vượt trội Không cần thông tin về hệ thống Đặc điểm này là quan trọng đối với hệ thống phi tuyến, các phương pháp nhận dạng truyền thống gặp rất nhiều khó khăn trong việc nhận dạng hệ thống
2.3) Điều khiển hệ phi tuyến dùng mạng nơron
2.3.1) Điều khiển trực tiếp
Giả sử đối tượng phi tuyến được biểu diễn bằng phương trình sau :
x = x x x là véc tơ trạng thái,
u : là tín hiệu ngõ vào
y : là tín hiệu ngõ ra
Trang 38L h x v là vi phân Lie thứ d của hàm hi(x,v) đã được điều
i k N
i
i i
i k
Trang 39rm(k)
+_
(),(
v x B dt
v v x
( ) , (
1
1 1
v v x
i i
i N i
γ ξ
α ξ
i u
i k
i u
T i
∈
)(
),υ,(sup
u T i u
i
u x S x v S v
i u
φθθ
Trang 40[ ( ,υ, ) ( )] (υ)
1
i N
i
i k
i u T i
u
i u
)υ(),()
υ(2
)υ()(
1 2
1 0
1
s N
i
i i
u N
i
i i
N
i
s i i
c x
B u
ξ
(2.22)
Và ta sử dụng luật cập nhật :
υ)(),υ,()
s
i u
i u
2.3.2) Điều khiển gián tiếp
Trong trường hợp điều khiển thích nghi gián tiếp, chúng ta cho = =
0 với tất cả t ≥ 0 và tồn tại hằng số xác định dương và sao cho 0 ≤ ≤ (x,v) ≤ khi i = 1, 2, … , N
)
(t
i k