Cần phải đạt được những đòi hỏi điều khiển tăng nhanh trong những hệ thống điều khiển động phức tạp dưới những thay đổi quan trọng đã làm cho việc dùng những kỹ thuật thông minh như mạng
Trang 1- 1 -
MỞ ĐẦU
Những kỹ thuật điều khiển truyền thống như điều khiển Tích phân tỉ lệ(PI)
hay điều khiển Vi tích phân tỉ lệ(PID) được ứng dụng thành công trong điều
khiển những quá trình tuyến tính Gần đây, điều khiển tiên đoán mô hình
(MPC) cũng thực hiện thành công trong điều khiển những hệ thống tuyến tính
Tuy nhiên, khoảng 90% những quá trình sinh học và hoá học là phi tuyến cao
và hầu hết chúng là những hệ MIMO.Khi hệ thống là phi tuyến và/hoặc MIMO,
những kỹ thuật truyền thống trên thường mắc phải sai sót khi điều khiển những
hệ thống như thế Ngày nay, những hệ thống được dùng trong công nghiệp đòi
hỏi độ tự quản cao và những kỹ thuật trên không có khả năng để đạt được điều
này
Cần phải đạt được những đòi hỏi điều khiển tăng nhanh trong những hệ thống
điều khiển động phức tạp dưới những thay đổi quan trọng đã làm cho việc dùng
những kỹ thuật thông minh như mạng nơron, lôgic mờ và thuật giải di truyền
trong những hệ thống điều khiển trở nên hấp dẫn Những lý do chính đằng sau
điều này là khả năng của chúng có thể “học” để xấp xỉ hàm và phân loại mẫu và
tiềm năng của chúng trong thực thi phần cứng song song đồ sộ, phương pháp
điều khiển thông minh phỏng theo quá trình xử lý thông tin không rõ ràng và ra
quyết định điều khiển của con người cũng như bắt chước quá trình tiến hoá sinh
học để tạo ra giải pháp tối ưu Nói cách khác, chúng có khả năng thực thi (cả
phần mềm và phần cứng) nhiều chức năng cần thiết để điều khiển hệ thống với
độ tự quản cao
Sơ đồ hệ thống điều khiển được mô tả như sau:
Hình i Sơ đồ điều khiển đối tượng phi tuyến
Như vậy, ở đây có hai bộ điều khiển:
Kết quả mô phỏng cho thấy sơ đồ điều khiển trên đã lái đối tượng phi tuyến đi xuyên suốt khoảng công tác của nó với độ chính xác cao
Phần sau đây sẽ đề cập đến đối tượng phi tuyến và những kỹ thuật điều khiển được thiết lập trong luận văn
Trong bối cảnh hiện thời, việc sản xuất năng lượng đối mặt với rất nhiều vấn
đề khó khăn Trong số đó, điều quan trọng nhất là: tuổi thọ của thiết bị chính tại những tổ hợp năng lượng, đầu tư tài chính không chắc chắn cho những tổ hợp mới, việc cạnh tranh giữa những nhà sản xuất năng lượng độc lập để thoả mãn đòi hỏi năng lượng của người dùng và những áp lực để đạt được những yêu cầu quản lý nghiêm ngặt để sử dụng tối đa nguồn tài nguyên thiên nhiên và tối thiểu ảnh hưởng đến môi trường
Việc vận hành của tổ hợp năng lượng nhiên liệu than (NLNLT), loại tổ hợp được dùng rộng rãi nhất cho việc sản xuất năng lượng, đã bị tác động mạnh Đầu tiên, một NLNLT phải hổ trợ mục tiêu chính của hệ thống năng lượng là đáp ứng yêu cầu tải cho năng lượng điện ở mọi thời điểm, ở điện áp không đổi
và tần số không đổi Sau đó là việc cạnh tranh giữa tính thiết thực và yêu cầu thị trường khác đã tăng cường việc dùng NLNLT [Armor 1985] Cuối cùng, những yêu cầu nghiêm ngặt trong việc bảo trì và kéo dài tuổi thọ của thiết bị chính và những luật giảm ảnh hưởng đến môi trường cần phải được tuân thủ Trong đó:
Những yêu cầu vận hành chu kỳ của NLNLT trong khoảng tải rộng mặc
dù chúng được thiết kế cho vận hành ở tải không đổi Những yêu cầu biến đổi tải có thể đến từ những chiến lược kinh tế được tính toán tại những trung tâm năng lượng hay từ những dao động tải hệ thống Vận hành theo tải tin cậy và hiệu quả sẽ đảm bảo việc thoả mãn hàng ngày, hàng tuần và theo mùa của yêu cầu năng lượng điện và những thay đổi tải ngẫu nhiên không đoán trước cho đến những giới hạn vật lý của tổ hợp
Việc kéo dài tuổi thọ thiết bị là quan trọng vì nó tối đa việc dùng tài sản, giới hạn thời gian chết và tối thiểu những chi phí vận hành và bảo trì Nguyên nhân chính của vòng đời ngắn của bất kỳ hệ thống nào là vận hành ứng suất cao Trong NLNLT, những ứng suất nhiệt phụ thuộc vào những dao động áp suất và nhiệt độ hơi là đặc biệt quan trọng Hầu hết ứng suất nghiêm trọng xảy ra trong suốt quá trình khởi động và những biến đổi tải lớn đột ngột
Trang 2- 3 -
Một NLNLT có hiệu suất trong khoảng 30 đến 35%, nghĩa là tốc độ nhiệt
trong khoảng 11400-9800 Btu/KWh Tốc độ nhiệt chịu ảnh hưởng bởi
nhiều hệ số, chẳng hạn những điều kiện hơi, áp suất bộ ngưng tụ, nhiệt độ
nước làm mát, nhiệt độ môi trường, khí áp,…Tốc độ nhiệt tăng khi làm
việc tại những tải khác với tải cơ sở Việc tiêu tốn nhiên liệu và giá cả
làm cho việc cải tiến tốc độ nhiệt như là một tiêu chuẩn về mặc kinh tế
Việc trộn không hoàn hảo giữa không khí và nhiên liệu sẽ làm vượt quá
lượng không khí để tránh việc nhiên liệu không được đốt hết, mà sẽ dẫn
đến việc tạo khói đen và khí CO độc cũng như những lượng nhiên liệu dư
khá nguy hiểm Bên cạnh đó lượng không khí dư sẽ dễ hình thành những
chất không mong muốn khác như sunfua dioxit, nitrogen oxit và làm
giãm hiệu suất boiler do nhiệt bị tiêu phí trong khí nhiên liệu
Tấ cả những yêu cầu được đề cập ở trên đã dẫn đến việc phát triển những
phương pháp điều khiển linh hoạt và toàn diện hơn Chúng cũng cung cấp
những chức năng cần thiết cho việc vận hành theo tải diện rộng chất lượng cao
và đồng thời cũng thoả mãn những ràng buộc trong việc bảo quản và kéo dài
tuổi thọ của thiết bị chính, giải phóng chất ô nhiễm và tiêu tốn nhiên liệu dưới
những thay đổi vật lý và những điều kiện kinh tế Do đó, ngay cả khi theo tải
cũng cần xem xét việc ổn định tần số và điện áp, những hệ thống điều khiển
hiệu quả hơn cũng cần được thiết kế để thoả mãn tối ưu những mục tiêu vận
hành, những xung đột tổng quát để mà NLNLT có thể vận hành thành công
dưới bất kỳ tình huống hoạt động nào
Bên cạnh đó, dưới những đòi hỏi của thị trường hiện thời, một phương pháp
toàn bộ cho vận hành và điều khiển những tổ hợp năng lượng là rất quan trọng
cho sự tồn tại của bất kỳ hệ thống điện nào Khi được ứng dụng hoàn hảo,
những hệ thống điều khiển và những thiết bị có thể tăng cường hiệu suất vận
hành máy, tính ổn định và tin cậy cũng như sự sẵn sàng, vì thế làm giảm việc
tiêu tốn nhiên liệu, chi phí vận hành và bảo trì mà hầu như rất tốn kém trong
một tổ hợp năng lượng Vì vậy, thật cần thiết để phát triển những hệ thống tự
động hiệu quả và liên quan mật thiết đến toàn bộ chiến lược và hệ thống điều
khiển của tổ hợp để giữ chúng vận hành hiệu quả và có lợi
Cũng cần lưu ý rằng việc sử dụng rất nhiều hệ thống điều khiển và thiết bị
dựa trên máy tính với những dụng cụ kỹ thuật số xử lý thông tin mạnh mẽ và tin
cậy hơn cho phép những nhà thiết kế tập trung nhiều hơn trên việc thực thi
những ứng dụng phần mềm đáp ứng những thử thách được đề cập ở phần trên
Vì tính linh hoạt của phần mềm, và những chi phí cho việc phát triển và bảo trì
có thể dễ dàng cài đặt vào những phần cứng mà nó chạy trong đó, những nổ lực
lớn trong việc thiết kế và phát triển những hệ thống phần mềm toàn diện và
tổng quát để dễ dàng kết hợp những ứng dụng vận hành tiện lợi( ví dụ, bảo vệ,
điều khiển và tự động hoá) để tăng cường hiệu suất của những tổ hợp năng
lượng [Garduno and Sanchez 1995, Garcia and Garduno 1998]
- 4 - Trong luận văn này tác giả sẽ thiết kế một hệ thống điều khiển toàn bộ Hệ thống này sẽ kết hợp giữa các lĩnh vực kỹ thuật điều khiển, kỹ thuật phần mềm
và kỹ thuật quá trình Trong đó kỹ thuật phần mềm được xem là rất quan trọng
để thiết kế hệ thống điều khiển cho NLNLT
Trang 3- 5 -
CHƯƠNG I
TỔNG QUAN 1.1 Giới thiệu về mạng nơron và logic mờ
Vào cuối thập kỷ 80 công ty Addison Wesley Publishing Company đã gây
xôn xao dư luận khi tung ra thị trường Neural Network (Mạng trí tuệ thần kinh)
được ví như là một kỹ xảo kỹ thuật gia công các thông tin mới, nhanh và chính
xác Chúng là các máy tính bắt chước cách sống giống hệ thống thần kinh, các
máy tính này làm việc khá khác biệt so với các máy tính thông thường Nơron
Network xử lý nhiều dữ liệu song song tại cùng một thời điểm, không phải là
xử lý từng dữ liệu một Chúng xử lý rất nhiều dữ liệu đầu vào cùng một lúc,
củng cố tăng cường một vài cái này, thu nhỏ giảm bớt những cái khác Đa số
chúng đều phải làm theo một khuôn mẫu cho trước Chúng tìm kiếm mẫu trong
hàng loạt các thí dụ, nhận dạng mẫu, tìm kiếm các mẫu đầy đủ từ nguồn dữ liệu
trong hệ thống, hoặc xây dựng lại mẫu đúng từ cái bị bóp méo Rất nhiều các ví
dụ phải làm với sự am hiểu sáng sưốt và các dữ liệu khách quan như thị giác,
thính giác và các tín hiệu khác Nhìn chung, các ví dụ chứng tỏ cách chạy này
có nhiều đặc tính của con người hơn là các máy tính được lập trình sẵn
Ngày nay, trí tuệ nhân tạo đang phát triển mạnh mẽ nhằm tạo ra cơ sở xây
dựng các hệ chuyên gia, hệ trợ giúp quyết định Trí tuệ nhân tạo được xây dựng
trên cơ sở mạng nơron nhân tạo và ứng dụng trong thiết kế hệ thống điều khiển
thông minh mà trong đó bộ điều khiển có khả năng tư duy như bộ não của con
người đang là xu hướng mới trong điều khiển tự động Mạng nơron là sự tái tạo
bằng kỹ thuật những chức năng của hệ thần kinh con người với vô số các nơron
được liên kết truyền thông với nhau trong mạng
Điều khiển mờ là một phương pháp điều khiển thông minh phỏng theo quá
trình xử lý thông tin không rõ ràng và ra quyết định điều khiển của con người
Phương pháp này rất thích hợp để điều khiển các đối tượng phức tạp, không xác
định được mô hình toán và các đối tượng phi tuyến Tuy nhiên, bộ điều khiển
mờ thường được thiết kế bởi quan điểm, cách nhìn riêng của người thiết kế
Người thiết kế biến sự hiểu biết, kinh nghiệm của mình về quá trình cần điều
khiển thành các biến ngôn ngữ và các qui tắc mờ mô tả mối quan hệ giữa
chúng Do đó công việc thiết kế thường mang nặng tính “thử sai”, khi gặp các
đối tượng phức tạp người thiết kế sẽ mất rất nhiều thời gian mà kết quả có được
có thể sẽ không tối ưu Vấn đề tự chỉnh bộ điều khiển mờ là một trong những
vấn đề đã được quan tâm nghiên cứu rất nhiều từ khi điều khiển mờ khẳng định
được là một phương pháp hiệu quả để điều khiển các đối tượng phức tạp
- 6 -
Do đó để giảm đi việc tính toán thủ công và rút ngắn thời gian thiết kế,người
ta kết hợp logic mờ và mạng nơron tạo ra khả năng tự chỉnh cho các tập mờ Và
hệ thống này được gọi là hệ neuro-mờ
Hầu hết những quá trình công nghiệp là phi tuyến và biến đổi theo thời gian Nhận dạng hệ thống phi tuyến đang trở thành một công cụ quan trọng mà có thể được dùng để cải tiến quá trình điều khiển và đạt được độ bền vững cao Có nhiều kỹ thuật nhận dạng phi tuyến khác nhau,trong đó có nhận dạng bằng mạng nơron ,nhận dạng bằng mô hình mờ và những phương pháp dựa trên mô hình neuro-mờ đang dần được thiết lập không những trong giáo trình mà cả trong những ứng dụng công nghiệp Mô hình neuro-mờ được xem như là một
kỹ thuật hộp xám nằm giữa mạng nơron và mô hình mờ định tính Những công
cụ để xây dựng những mô hình neuro-mờ dựa trên sự kết hợp những thuật toán
từ lĩnh vực mạng nơron,xác nhận đặc tính và phân tích hồi quy Phương pháp neuro-mờ cho nhận dạng hệ thống phi tuyến có ưu điểm là cân bằng giữa sự chính xác của mạng nơron và tính diễn giải được
1.2.Tình hình nghiên cứu mạng nơron và logic mờ trên toàn cầu:
Nghiên cứu về mạng Nơron đã được quan tâm từ những năm 40 của thế kỷ
20 Khoảng những năm 90 Nơron được đặc biệt chú ý bởi khả năng ứng dụng rộng lớn của nó
Chương trình nghiên cứu về Nơron tập chung nghiên cứu ở Mỹ (50 tổ chức trong các viện nghiên cứu và trường đại học,riêng California đã có 15 tổ chức nghiên cứu) Ở Anh có 20 tổ chức,Đức (7),Nhật (7), Pháp (6), Thụy sỹ(4),Thụy điển (4),Hà lan (4),Australia (3), Ytalia (3),Canađa (3), Nga(1),Czech (1),Balan(1),Hungary(1), Hàn quốc (1),Singapor (1),Hong kong (1)v.v…Ơ Mỹ, tại bang California,Trường Đại học California San diego có Chương trình tính toán và Hệ thống Nơron của Caltech, Viện tính toán Nơron, Nhóm nghiên cứu khoa học Máy tính Nhận thức,Trung tâm nghiên cứu Ngôn ngữ,Phòng thí nghiệm Kỹ thuật Nơron,Trung tâm Sloan Sinh học Nơron Lý thuyết Đại học California Santa Cruz có Nhóm Máy Dạy học, Nhóm Sinh học tính toán Đại học Nam California có Phòng thí nghiệm Tính toán Nơron Đại học Stanford có nhóm Lập trình Gen Ở Carlsbad có Động lực học Nơron ứng dụng Ở Moffett Field có Nhóm Kỹ thuật Nơron NASA
Bang Massachusetts, có Trung tâm Dạy học Tính toán và Sinh học tại Viện Công nghệ Massachusetts -MIT,Nhóm tính toán ở khoa Não và khoa học Nhận thức thuộc MIT,NeuoDyne Ins, Cambridge
Bang Washington có Phòng Thí nghiệm ứng dụng,Trí tuệ Tính toán thuộc Đại học Washington,Nhóm Nghiên cứu Nơron tại Phòng thí nghiệm Xử lý Thông tin Nhóm nghiên cứu Nơron thuộc Phòng thí nghiệm Pacific Northwest tại Washington
Trang 4- 7 - Bang Texas có Phòng thí nghiệm Kỹ thuật Nơron R&D thuộc Đại học Texas ở
Austin.Phòng thí nghiệm Tính toán Ứng dụng tại đại học Kỹ thuật Texas
Bang Pensylvania có Trung tâm Cơ sở Nơron của Nhận thức tại Carnegie
Melon
Bang Ohio có Phòng Thí nghiệm Hệ thống Nơron Nhân tạo thuộc Đại học
Cincinnati
Bang New Mexico có Nhóm Tính toán Thích nghi thuộc Đại học New
Mexico Nhóm Tính toán Thích nghi Phi tuyến thuộc Phòng thí nghiệm Quốc
gia Los Alamos
Bang New Jersey có Nhóm Nghiên cứu Nơron Nhân tạo ở Viện nghiên cứu
NEC,Princeton Nhóm Nhận thức,Trí tuệ và Tính toán dựa trên DNA,ở Viện
nghiên cứu NEC,Princeton v.v…
Anh: có Trung tâm Mạng Nơron tại trường Hoàng gia London Trung tâm
Hệ thống Nơron tại Đại học Edinburgh Nhóm Nghe,Nhìn và Robot Đại học
Cambridge Nhóm Nghe,Nhìn và Hệ thống Thông minh Đại học
Southhampton.Nhóm Nghiên cứu Trí tuệ Nhân tạo thuộc Đại học Nottingham
Nhóm nghiên cứu Hệ thống Thông minh, khoa Khoa Học Máy tính thuộc Đại
học London v.v…
Nhật: có Phòng Thí nghiệm Robot và Cơ -Điện tử thuộc Đại học Nagoya
Phòng thí nghiệm Okabe và Hirose thuộc Đại học Tokyo Phòng thí nghiệm
Sinh-Điện tử thuộc Đại học Nagoya.Phòng thí nghiệm Nghiên cứu Xử lý Thông
tin Người ở Kyoto v.v…
Đức: có Viện Tin học Nơron ở Đại học Ruhr,Bochum Nhóm nghiên cứu Mờ
và Tính toán Mềm tại Đại học Braunschweig Nhóm Nhiên cứu Mờ và Nơron
tại Đại học Công nghệ Damstardt Nhóm Nhìn- Máy tính và Nhận dạng thuộc
Đại học Bon Trung tâm nghiên cứu Trí tuệ Nhân tạo Đức DFKI thuộc
Kaiserlautern Nhóm Nghiên cứu Nơron của GMD FIRST tại Berlin.Viện
Logic, Tổ hợp và Hệ thống Suy diễn tại Đại học Karlsruhe
Pháp: có Nhóm nghiên cứu Tin-Sinh học Trường Cao cấp,Pari Nhóm tính
toán Nơron thuộc Phòng Tin học Pari Nord Nhóm nghiên cứu Nơron ở
LEIBNIZ, Grenoble Nhóm nghiên cứu Laplace,Mô hình gần đúng trong Robot
và Trí tuệ Nhân tạo ở LEIBNIZ, Grenoble
Hungary: có Nhóm Xử lý thông tin Nơron thuộc Đại học Eotvos Lorand,
Budapest
1.3.Một số công trình nghiên cứu mạng Nơron đã công bố ở nước ngoài:
Đa số các nhà nghiên cứu các Hệ thống Thông minh chấp nhận rằng : Trí tuệ
Tính toán (Computational Intelligence) do Hội đồng Mạng Nơron Thế giới đưa
ra vào năm 1991 và Tính toán mềm (Soft computing) do Lofti A Zadeh, giáo sư
đại học California Berkeley đua ra năm 1990 là đồng nghĩa và được sử dụng
thay thế lẫn nhau Trí tuệ Tính toán được chấp nhận là một thuật ngữ để biểu
- 8 - diễn các kỹ thuật cho việc ra quyết định dựa trên việc xử lý thông tin không chắc chắn Về cơ bản, Trí tuệ Tính toán bao gồm Logic Mờ, Mạng Nơron , Thuật giải Di truyền, Lập luận Xác xuất,các Phương pháp Học, Lý thuyết Hỗn độn, các Hệ chuyên gia Một điều quan trọng cần nhấn mạnh là Trí tuệ Nhân tạo không chỉ là một tập hợp các phương pháp luận cho lập luận dựa trên thông tin không chắc chắn mà là sự liên kết các phương pháp trong đó mỗi phương pháp đều có lợi thế riêng để tiến tới đạt mục tiêu chung Bởi vậy, các thành phần của Trí tuệ Tính toán phải được xem như các phần bổ xung cho nhau chứ không phải tương đương Tất cả các kỹ thuật đó nhằm mục đích đưa ra một dạng “ Máy Thông minh “nào đó mà nó có thể bắt chước sự sưy nghĩ của con người trong việc ra quyết định Động cơ chủ yếu cho việc sử dụng Trí tuệ Tính toán
là khai thác khả năng xử lý thông tin không chính xác, không chắc chắn, chỉ đúng một phần và kết quả đạt được là tính dễ áp dụng,sự năng động và các giải pháp chi phí thấp cho các vấn đề phức tạp Đây cũng là mục tiêu do giáo sư Lofti A Zadeh , Đại học California Berkeley (người sáng tạo Lý thuyết Tập Mờ 1965) đưa ra vào đầu những năm 1990 đối với sự phát triển của các Hệ Thông minh
Hai dạng của Mạng Nơron thường được sử dụng trong Kỹ thuật Robot là Mạng Hopfield và Mạng Perceptron nhiều lớp do Hopfied đa ra 1982, Kohonen
1984, Rumelhart 1986 Những mạng khác bao gồm Mạng Cạnh tranh & Hợp tác do Amari &Arbib nghiên cứu năm 1977 và Mạng Thưởng phạt do A.G.Barto&C.W.Anderson 1983
Hệ thống Robot bao gồm 3 hệ thống phụ là : Hệ thống truyền động, Hệ thống Nhận dạng và Hệ thống Điều khiển Những vấn đề chính của Điều khiển Robot bao gồm Động học, Động lực học, Lập kế hoạch đường đi (Thiết lập quĩ đạo ), Điều khiển, Cảm biến, Lập trình và Trí tuệ (Thông minh)
Mạng Nơron có thể giảm tổ hợp tính toán và giải những bài toán robot được đưa ra “yếu” Lời giải giải tích của động học ngược làm chính xác kết quả số, trong khi lời giải Mạng Nơron nói chung không làm chính xác.Công việc phát triển Động học ngược Nơron được T.Iberall phát triển năm 1987, A.Guez năm1988
Trong Động lực học Robot Nơron , M.Kawato,Furukawa,Sưzuki phát triển năm 1987 Y.Uno &M.Isobe 1988 S.G.Tzafestas1986, M.Kawato,Y.Maeda,Y.Uno &Sưzuki 1990
Mạng Nơron sử dụng nhằm thiết lập quĩ đạo được K.Tsưtsưmi 1988, H.liu1988, R.Ecmiller 1987
Bài toán lập quĩ đạo tránh vật cản sử dụng Mạng Hopfield được H.matsưmoto& K.Tsưtsưmi phát triển
Trường hợp Robot Di động, Thiết lập quĩ đạo với Mạng Nơron được nghiên cứu bởi V.Seshadri1988.Ở đây Mạng Nơron cố gắng cực tiểu hoá độ dài đường
đi Nick Vallidis đã nghiên cứu điều khiển Hexapod di động bằng mạng Nơron ,
Trang 5- 9 -
2000 L.M.Reyneri, M.Chiaberge Khoa điện tử, Đại học Bách khoa Torino-
Italy nghiên cứu phần cứng-Mạng Mờ-Nơron điều khiển Hexapod Di động,
1993-2000
Điều khiển Robot bằng Mạng Nơron được gọi là Điều khiển khớp bằng mô
hình tiểu não CMAC do Albus 1975 –1979 Giáo s F.L.Lewis,Viện nghiên cứu
Robot và Tự động hoá, Đại học Texas –Arlington USA đã ứng dụng CMAC để
điều khiển hệ động lực phi tuyến, 1997
Nhận dạng hệ động lực phi tuyến sử dụng mạng Nơron được
S.J.Jagannathan, Liên hợp Phân tích Tự động hoá, USA nghiên cứu năm 1996
Y.Pao&D.Sobasic 1987 thực hiện hệ thống điều khiển vị trí robot hai bậc tự do
sử dụng Mạng Nơron Perceptron
A.Guez sử dụng mô hình thích nghi (MRAC) W.T Miler sử dụng kỹ thuật
CMAC trong liên kết với phương pháp điều khiển mô men R.Elsley thực hiện
điều khiển Jacobi ngược,sử dụng Mạng Perceptron nhiều lớp
Mạng Nơron Được sử dụng trong cảm biến và điều khiển Robot nhiều lớp, liên
tục bởi R.Esley, &Y.Pati 1988
Điều khiển thích nghi hệ động lực học phi tuyến sử dụng mạng Nơron được
giáo sư A.M.Annaswamy, Phòng thí nghiệm Điều khiển thích nghi - Khoa Chế
tạo Máy – Viện Công nghệ Massachusetts –MIT nghiên cứu, 1997
Ứng dụng Mạng Nơron điều khiển ngược theo vết được giáo sư K S
Narendra, Trung tâm Khoa học Hệ thống, Đại học Yale,USA nghiên cứu, 1999
Giáo sư Vukobratovic, Trung tâm Robot, Viện Mikhailo Pupin, Nam tư (cũ
), phó chủ tịch Viện Hàn lâm Khoa học, đã nghiên cứu phân loại mô hình động
lực học môi trường trên cơ sở Nơron để điều khiển robot,1998
Bộ điều khiển Mờ-Nơron để dẫn huớng Robot Di động và hộ tống đội robot
được giáo sư M.M.Trivedi Khoa Kỹ thuật Điện và Máy tính, Đại học California
San Diego,USA nghiên cứu,1998
Giáo sư, Viện sĩ, Vámos Tibor, nguyên Viện trưởng Viện Tin học và Tự động
hoá- Hungary, - nguyên chủ tịch Hội Máy tính Neyman János (Von Neyman),
nguyên chủ tịch Hội Điều khiển Tự động Quốc tế IFAC đã nghiên cứu kỹ thuật
Nhận dạng –Trí tuệ Nhân tạo cho robot
Giáo sư,Viện sĩ Hyungsưck Cho, Khoa Chế tạo máy,Viện Khoa học &Công
nghệ Cao cấp Hàn quốc- KAIST, Hãng Thép và Kim loại Pohang-POSCO,
Viện trưởng Viện Điều khiển,Tự động hoá và Kỹ thuật Hệ thống, đã nghiên cứu
điều khiển và cảm biến nano cho robot,2001
Giáo sư T.Fukuda, Khoa Kỹ thuật Vi Hệ thống,Trung tâm Hợp tác Khoa học
&Công nghệ Cấp cao, Đại học Nagoya- Nhật bản, nguyên Chủ tịch Hội Robot
và Tự động hóa Quốc tế, Chủ tịch Hội đồng Công nghệ Nano Quốc tế, đã
nghiên cứu Mạng Mờ-Nơron -Thuật giải AND để điều khiển robot, 2000 Công
nghệ Nano đang mở ra những triển vọng to lớn Việc chế tạo ra những robot
- 10 - nhỏ cỡ Nano 10-9mm đòi hỏi những nghiên cứu mới về cơ sở lý thuyết cũng như công nghệ Giáo sư Toshio Fukuda, đặc biệt nhấn mạnh tầm quan trọng của Robot Micro-Nano trong Kỹ thuật Robot và Tự động hoá tương lai
Giáo sư,Viện sĩ G.M.Edelman,giải thưởng Nobel, Viện trưởng Viện Khoa học Nơron - USA,Chủ tịch Hội nghiên cứu Khoa học Nơron Quốc tế, đã mô phỏng Nơron hệ thống Nghe-Nhìn của loài chim để điều khiển robot,1999 Giáo sư đã khẳng định, việc nghiên cứu này đặc biệt quan trọng dưới ánh sáng của lý thuyết Não Hiện đại, nhấn mạnh tầm quan trọng của môi trường và thực nghiệm Motor-Cảm biến Nơron Sự hiểu biết những nguyên tắc cơ bản của não sẽ có ảnh hưởng mạnh mẽ đến thiết kế Hệ thống Nhân tạo hoạt động trong thế giới thực.Chúng ta tin tưởng rằng những nghiên cứu mô hình Nơron tổng hợp sẽ tham gia một cách có ý nghĩa bởi sự thiết lập mối liên hệ trực tiếp giữa khoa học Tự nhiên và Khoa học Kỹ thuật, đưa ra tư tưởng mới trong lĩnh vực Robot
và Trí tuệ Nhân tạo
1.4.Một số công trình nghiên cứu mạng Nơron đã công bố ở trong nước:
Ở Việt nam bắt đầu nghiên cứu Nơron từ năm 1992 tại Viện Cơ học và Viện Tin học trong khuôn khổ đề tài cấp Nhà nuớc KC-02 Điều khiển thời gian thực Hiện nay một số cơ sở đang nghiên cứu như Trung tâm Tự động hoá-Viện tin học, Khoa Công nghệ Thông tin - ĐHBK.HN, Bộ môn Điều khiển Tự động ĐHBK.HN, Học viện Bưu chính Viễn thông, Khoa Công nghệ Thông tin ĐHBK.HCM,Đại học Giao thông Vận tải, Viện Vật lý, Viện toán học, VietcomBank, Viện Năng lượng Nguyên tử, Học viện Kỹ thuật Quân sự, Đại học Quốc gia - HCM Công tác đào tạo được triển khai, đã có những luận án Tiến sĩ (2), Thạc sĩ và buớc đầu được giảng dạy cho sinh viên Tuy nhiên những nghiên cứu thường rải rác,chưa tập trung thành những nhóm nghiên cứu mạnh
để có thể bước đầu đưa vào ứng dụng và có thể hợp tác với các tổ chức quốc tế
1.5 Tổng quan về tình hình nghiên cứu tổ hợp năng lượng nhiên liệu than
Một NLNLT cung cấp năng lượng điện là kết quả của những quá trình chuyển đổi năng lượng Cụ thể, những chuyển đổi chính là sự đốt cháy nhiên liệu đầu vào, tạo hơi, phát triển chuyển động quay, sản xuất năng lượng điện và ngưng tụ hơi Tất cả những chuyển đổi này tạo thành một chu trình nhiệt động lực học lớn và phụ thuộc lẫn nhau cao độ
Những chiến lược điều khiển hiện thời cho phép tạo ra năng lượng cần thiết
để thoả mãn yêu cầu tải trong khi duy trì sự cân bằng giữa những quá trình chuyển đổi trong tổ hợp Chủ yếu, chúng gắn kết ngõ ra năng lượng lưu lượng hơi của boiler với năng lượng được yêu cầu bởi tuabin-máy phát để đạt được tải điện ở mọi thời điểm Sơ đồ điều khiển tổ hợp cấu thành lớp cao nhất của hệ thống điều khiển và nó chịu trách nhiệm cho việc điều khiển boiler-tuabin-máy
Trang 6- 11 - phát như một đối tượng đơn Đặc tính nổi bật của tổ hợp được quản lý thông
qua những vòng điều khiển năng lượng và áp suất Việc phát triển từ những cấu
hình vòng điều khiển SISO dựa trên thuật toán điều khiển PID, những chiến
lược này có thể phân loại thành ba lớp: điều khiển theo boiler, điều khiển theo
tuabin và điều khiển boiler-tuabin
Sơ đồ theo boiler được dùng đầu tiên Trong sơ đồ này, boiler sẽ chờ đợi
hành động của tuabin để sản xuất năng lượng Những van điều khiển tuabin
điều chỉnh lưu lượng hơi vào trong tuabin với đối số là công suất yêu cầu Sau
đó, điều khiển boiler tương ứng với những thay đổi trong lưu lượng hơi và áp
suất Sai lệch áp suất tiết lưu so với setpoint được dùng bởi điều khiển quá trình
đốt nhiên liệu để điều chỉnh lượng nhiên liệu và không khí vào trong buồng đốt,
và việc tạo hơi được hiệu chỉnh theo yêu cầu của tuabin Thuận lợi của phương
pháp này là đáp ứng nhanh với thay đổi tải: tuabin là một dụng cụ hoạt động
nhanh có thể đáp ứng rất nhanh với những yêu cầu tải sử dụng năng lượng nhiệt
được lưu trữ trong boiler Điều bất lợi là phương pháp này thể hiện việc điều
khiển áp suất tiết lưu ít ổn định vì boiler có xu hướng vượt quá vì nó đòi hỏi
thời gian để hoà hợp với tuabin
Sơ đồ điều khiển theo tuabin được dùng trong những năm 60-70 Trong sơ
đồ này, tuabin sẽ theo những hoạt động của boiler Yêu cầu công suất được
dùng bởi điều khiển đốt tại boiler để điều chỉnh lượng nhiên liệu và không khí
vào trong buồng đốt để điều chỉnh việc sản xuất hơi Sau đó điều khiển tuabin
đáp ứng bằng cách hiệu chỉnh những van tiết lưu để giữ áp suất tại setpoint
Tuabin chịu trách nhiệm hoàn toàn trong việc điều khiển áp suất tiết lưu Thuận
lợi của phương pháp này là đáp ứng rất ổn định với những thay đổi tải với sự
dao động áp suất hơi và nhiệt độ tối thiểu, vì những thay đổi tải phụ thuộc vào
hoạt động của boiler là thiết bị chậm hơn so với tuabin Bất lợi chính của
phương pháp là không sử dụng khả năng lưu trữ năng lượng của boiler, vì thế
tạo ra đáp ứng chậm hơn
Được sử dùng nhiều nhất trong thập kỷ 50 là sơ đồ điều khiển phù
hợp(coordinated control (CC)) Trong sơ đồ này, công suất được đưa đồng thời
đến boiler và tuabin Phụ thuộc vào các cặp biến được điều khiển và điều
khiển, có hai sơ đồ cho CC: sơ đồ theo boiler và sơ đồ theo tuabin [Landis and
Wulfsohn 1988] Với sơ đồ thứ nhất, bộ điều khiển tải tạo lệnh cho van tiết lưu
hơi từ yêu cầu tải tổ hợp và công suất tạo ra, bộ điều khiển áp suất tạo lệnh cho
cho van nhiên liệu/không khí từ áp suất tiết lưu đo được và setpoint áp suất mà
sẽ có được từ yêu cầu tải tổ hợp thông qua ánh xạ phi tuyến (hình 1.1) Trong
sơ đồ thứ hai, bộ điều khiển tải tạo lệnh cho những van nhiên liệu/không khí từ
yêu cầu tải tổ hợp và công suất tạo ra Lệnh đến van tiết lưu được tính toán từ
áp suất hơi tiết lưu đo được và setpoint áp suất mà sẽ có được từ yêu cầu tải tổ
hợp thông qua ánh xạ phi tuyến (hình 1.2)
Những chiến lược điều khiển phù hợp sẽ kết hợp những thuận lợi của hai
chiến lược trên và tối thiểu những bất lợi cuả chúng, nghĩa là , chúng cố gắng
giữ đặc tính đáp ứng ổn định của sơ đồ theo tuabin và đặc tính đáp ứng nhanh
- 12 - của sơ đồ theo boiler Để đạt được đáp ứng nhanh,tuabin-máy phát được phép
sử dụng năng lượng được lưu trữ trong boiler Để đạt được ổn định, điều khiển boiler hiệu chỉnh tốc độ đánh lửa theo tải yêu cầu, trong khi giữ cho tuabin không vượt quá năng lượng được cung cấp bởi boiler Đáp ứng tổ hợp ở CC phải nhanh hơn sơ đồ theo tuabin nhưng không nhanh bằng sơ đồ theo boiler Những ưu điểm khác của phương pháp điều khiển phù hợp là khả năng dễ dàng thực hiện giảm tải và biến đổi áp suất với điều khiển tải chính xác
Từ quan điểm thực tế, người ta mong muốn có một cấu trúc tổng quát cho điều khiển phù hợp mà có thể cấu hình lại với bất kỳ sơ đồ hoạt vận hành nào, hoặc có thể được điều chỉnh để thể hiện bất kỳ ứng xử nào giữa các sơ đồ điều khiển Những cấu trúc này chứa những cấu hình nhiều vòng lặp phân tán của những bộ điều khiển SISO dùng những thuật toán cổ điển PI hay PID Những
sơ đồ này đối mặt với những thách thức nghiêm trọng bởi những yêu cầu vận hành theo tải diện rộng Trong những điều kiện này, hiệu suất có thể giảm do những biến đổi phi tuyến lớn và những hiệu ứng kết hợp của những quá trình động Người ta đã dùng những bộ bù để tăng cường sơ đồ điều khiển phù hợp nhiều vòng lặp bằng cách giảm những hiệu ứng tương tác giữa các vòng điều khiển Rất nhiều nghiên cứu đã được thực hiện trong nhiều thập kỷ qua nhưng hầu hết các kết quả đều là những sản phẩm riêng của những nhà phát triển và không có một phương pháp được chấp nhận rộng rãi hay tổng quát để thực thi chúng, vì thế cần thiết những phương pháp thiết kế mang tính hệ thống và tổng quát hơn Điểm cốt yếu là việc thiết kế bộ bù tương tác dựa trên mô hình toán học là gần như không thể thực hiện và trở nên quá phức tạp sẽ loại bỏ ứng dụng của nó
Hình 1.1 Sơ đồ điều khiển theo boiler
Trang 7- 13 -
Hình 1.2 Sơ đồ điều khiển theo tuabin
1.5.1 Những hệ thống điều khiển tiên tiến
Mặc dù không có định nghĩa chung cho điều khiển tiên tiến, nhiều phương pháp
đã dùng những mô hình toán học của quá trình, hoặc là ở quá trình thiết kế hay
trong suốt quá trình vận hành, hiện thời được gọi là tiên tiến Hầu hết sự chú ý
tập trung vào chỉ số hiệu suất toàn phương Ứng dụng thực tế của kỹ thuật này
cho điều khiển toàn bộ bị giới hạn bởi tính phức tạp của việc thực thi, dễ bị ảnh
hưởng bởi sự không chắc chắn của mô hình, cần phải reset lại hoạt động của
các bộ điều khiển, và việc dùng những kỹ thuật điều khiển tuyến tính trong
những hệ thống phi tuyến cao độ Mặc dù không phải là một chiến lược điều
khiển tổ hợp toàn bộ, ứng dụng liên quan nhất của những kỹ thuật điều khiển tối
ưu nhiều biến mà [Nakamura và Uchida 1989] đã đưa vào vận hành một bộ
điều chỉnh toàn phương tuyến tính cho những nhiệt độ hơi trong boiler của một
tổ máy 500MW tại Kyushu Electric Company, Japan, 1978 Bước đột phá này,
trong đó những sơ đồ điều khiển nhiệt độ, gồm những kỹ thuật khác như nhận
dạng và dự đoán không gian trạng thái, lập trình toán học phi tuyến, điều khiển
thích nghi tham khảo mô hình và tối ưu đã trở thành chuẩn cho những tổ hợp
năng lượng than của người Nhật trong suốt 25 năm qua, cho phép họ vận hành
với những mức cao nhất của hiệu suất nhiệt
Người ta cũng thực hiện nhiều nghiên cứu để áp dụng những phương pháp
tách riêng ra(decoupling) để làm giảm hay loại bỏ những ảnh hưởng tương tác
giữa các vòng điều khiển Trong sơ đồ điều khiển tổ hợp theo boiler dùng bộ bù
dựa trên hồi tiếp trạng thái để giảm ảnh hưởng tương tác của hệ thống cho tổ
hợp 150 MW ở Ontario Hydro, Canada Bộ bù tạo ra những tín hiệu bù cho bốn
ngõ vào điều khiển chính là tổng của những tín hiệu điều khiển chính và vectơ
- 14 - trạng thái quá trình sử dụng những ma trận độ lợi hằng số, được tính từ mô hình tuyến tính không gian trạng thái bậc 9 của máy Vectơ trạng thái được dự đoán dùng bộ lọc Kalman Những kết quả mô phỏng cho thấy tải có khả năng vận hành trong khoảng 75% đến 100% khoảng vận hành tải với lỗi biến quá trình và ảnh hưởng tương tác giảm Không có chi tiết về số lượng mô hình tuyến tính được dùng trong khoảng tải cũng như những ma trận độ lợi trong khoảng đó Những bộ điều khiển tách rời dựa trên mô hình bậc 12 được thực thi trong máy thực So với điều khiển truyền thống, sơ đồ tách riêng xấp xỉ làm cho lỗi điều khiển giảm, tăng độ ổn định tải thấp, hiệu chỉnh thông số đơn giản và không nhạy với những biến đổi máy Khó khăn chính với phương pháp tách riêng là thiết kế bộ bù tách riêng Thiết kế bộ bù động là quá nặng nề và sự phức tạp ngăn cản ứng dụng của chúng
Về nguyên tắc, điều khiển thích nghi dường như rất phù hợp cho điều khiển toàn bộ nhà máy điện Khả năng của hệ thống điều khiển liên quan với những thay đổi động của quá trình rất hấp dẫn cho vận hành diện rộng Trong [Marc, et
al 1980] ảnh hưởng của nhiễu và biến đổi thông số trong thiết kế một bộ điều khiển thích nghi cho máy phát hơi 250 MW được xem xét Trong [Mabius, et
al 1980] một cơ cấu thích nghi tham khảo mô hình được đề nghị để cung cấp những tín hiệu điều khiển tăng cường cộng vào những tín hiệu điều khiển của điều khiển vòng mở Giả sử vận hành xung quanh một điểm vận hành cố định,
lý thuyết điều khiển tuyến tính được dùng để thiết kế bộ điều khiển, những thông số luật điều khiển được điều chỉnh dùng sơ đồ dựa trên Lyapunov để bảo đảm sự ổn định của vòng kín Không may, chỉ có thiết kế được thể hiện mà không có kết quả về hiệu suất hệ thống điều khiển
Những phuơng pháp điều khiển bền vững cũng được đề nghị cho điều khiển
tổ hợp Trong [Weng and Ray 1997] một chiến lược điều khiển truyền hồi tiếp được đề xuất cho điều khiển theo tải bền vững diện rộng Điều khiển truyền thẳng tối ưu những ngõ vào điều khiển, nhận những ràng buộc của chúng, dọc theo khoảng vận hành diện rộng và điều khiển hồi tiếp được dùng để khắc phục những bất định mô hình máy và nhiễu ngoại sinh đảm bảo ổn định và hiệu suất bền vững Điều khiển truyền thẳng giải quyết bài toán lập trình phi tuyến cho hàm tối ưu và những ràng buộc dọc theo đặc tính tải đã cho Điều khiển hồi tiếp được thiết kế dùng kỹ thuật H Phương pháp này thoả mãn yêu cầu hiệu suất trong khoảng 40-100% khoảng tải và loại bỏ tốt nhiễu biết trước Một vài nhược điểm là những yêu cầu tính toán quá nhiều, cùng với thông tin đáp ứng tần số và mô hình tuyến tính của máy
Mặc dù có tiến bộ lớn trong lý thuyết hệ thống điều khiển, những thực thi những sơ đồ tiên tiến cho NLNLT vẫn còn hiếm Do những sơ đồ đề xuất không thể hiện tốt dưới những yêu cầu thế giới thực chẳng hạn hiệu suất thời gian thực, khoảng vận hành diện rộng, động quá trình phức tạp và nhiều chiều hay những điều kiện giả sử hiếm khi xảy ra trong thực tế là nhiễu Gauss, thông
số quá trình hằng số, đo đúng và chính xác, động quá trình được biết Có lẽ, bất
Trang 8- 15 - lợi chính của hầu hết những phương pháp tiên tiến này là yêu cầu những mô
hình toán học chính xác cho thiết kế và vận hành Bậc và độ phức tạp cao của
của tổ hợp năng lượng đã ngăn cản việc thực thi những sơ đồ điều khiển tập
trung dựa trên mô hình toán học Nói cách khác, tính huống này đã thúc đẩy sự
tồn tại lâu dài của những cấu hình nhiều vòng dựa trên những thuật toán điều
khiển PID truyền thống
1.5.2 Những phương pháp lai thông minh
Vẫn có một phương pháp thứ ba áp dụng những kỹ thuật thông minh nhân
tạo nổi bật gần đây hay sự pha trộn của chúng với điều khiển tiên tiến và truyền
thống, trong một nổ lực liên quan đến những phức tạp mà không được giải
quyết thoả mãn bởi những kỹ thuật được đề cập ở phần trên
Trong [Mamdani 1974, Mamdani and Assilian 1975], một bộ điều khiển dựa
trên lý thuyết tập mờ [Zadeh 1965, Zadeh 1968, Zadeh 1973] được giới thiệu
lần đầu tiên Giải thuật mờ mô phỏng quá trình lập luận của con người, được
dùng để điều khiển máy hơi nước trong phòng thí nghiệm Áp suất hơi và tốc độ
rotor được điều chỉnh bằng cách thao tác ngõ vào nhiệt boiler và độ mở tiết lưu
máy theo một tập những luật ngôn ngữ Thực nghiệm chỉ ra rằng những kết quả
tương tự hay tốt hơn so với những bộ điều khiển cổ điển Công việc này minh
hoạ tính khả thi trong việc xây dựng những giải thuật xác định thời gian thực
hiệu quả, mở đầu một lĩnh vực mới trong kỹ thuật điều khiển
Trong [Ray and Majumder 1985] lý thuết tách rời phi tuyến và lôgic mờ
được dùng để điều chỉnh áp suất bao hơi và mức nước bao hơi trong một tổ hợp
200MW ở những điều kiện vận hành khác nhau Đầu tiên, một luật điều khiển
tách rời được thiết kế cho mô hình máy phi tuyến bậc ba với giả sử rằng thông
số hệ thống được biết chính xác và là những hệ con SISO không tương tác Sau
đó, những bộ điều khiển lôgic mờ được dùng cho điều khiển vòng kín trong mỗi
hệ con Hiệu suất tốt của sơ đồ điều khiển đạt được khi tính với nhiễu trạng thái,
biến đổi thông số ngẫu nhiên và từng phần, thay đổi setpoint, nhạy thông
số,tách rời không hoàn hảo và thiếu tách rời
Trong [Marcelle, et al 1994] một sơ đồ điều khiển kết hợp logic mờ và điều
khiển tối ưu cho vận hành chu trình của những tuabin hơi lớn được thể hiện
Ứng suất tua bin tổng và lỗi tải được tối thiểu bằng cách gắn kết điều khiển van
điều chỉnh tuabin và áp suất hơi boiler Một hệ thống mờ ưu tiên những đối
tượng hiệu suất và cung cấp những trọng số trong hàm gía trị mà được dùng bởi
bộ điều khiển tối ưu Sau đó, một thuật toán điều khiển dự đoán mô hình được
dùng để tính van tối ưu và những giá trị setpoint áp suất để cân bằng giữa theo
tải tốt và tối thiểu ứng suất Hiệu suất tốt hơn khi so sánh với bộ điều khiển áp
suất biến đổi và áp suất hằng số và cũng với một bộ điều khiển dự đoán mô
hình với những độ lợi cố định và thời gian dự đoán cố định
Trong [Dimeo and Lee 1995] giải thuật di truyền được dùng để tinh chỉnh tối
ưu sơ đồ điều khiển kết hợp dựa trên PI và bộ điều khiển hồi tiếp trạng thái cho
- 16 - một tổ hợp phi tuyến bậc ba Đối tượng điều khiển là theo đáp ứng bước ở ngõ
ra áp suất và công suất Trong khi nững ứng dụng khả thi của giải thuật di truyền là cơ cấu tinh chỉnh hoàn hảo, vẫn có một vài sai xót trong những cấu trúc điều khiển được đề xuất Vị trí của những độ lợi kết hợp chéo trong sơ đồ điều khiển kết hợp dựa trên PI là không thuận tiện, vì nó tạo ra đáp ứng dao động và sơ đồ điều khiển tối ưu giả sử rằng tất cả các biến trạng thái sẵn sàng cho mô phỏng
Trong [Tevera 1995] một sơ đồ tổ hợp có thể cấu hình lại có thể chuyển giữa những chiến lược điều khiển khác nhau( ví dụ, theo boiler, theo tuabin và điều khiển hoà hợp) Cấu hình lại hệ thống được thực hiện trực tuyến bởi bốn hệ chuyên gia làm việc cùng nhau tại mức giám sát Hệ đầu tiên nhận định trạng thái vận hành và những yêu cầu cho tổ hợp Hệ thứ hai tính toán hiệu suất của
sơ đồ điều khiển khi vận hành Hệ thứ ba tính toán hiệu suất của những sơ đồ khác dưới những điều kiện hiện thời Cuối cùng, hệ thứ tư sơ đồ nào là tiện lợi nhất và chuyển sơ đồ nếu được phép của người vận hành Điều khiển được thực hiện thành công trong một hệ thống phát triển và tính toán phần mềm điều khiển dùng mô hình tổ hợp toàn bộ
Trong [Garduno and Lee 1997], một sơ đồ điều khiển thứ tự hai mức cho vận hành diện rộng NLNLT được thể hiện Tại mức giám sát một bộ quản lý tham chiếu mờ tạo những quỹ đạo setpoint theo chính sách vận hành áp suất biến đổi
để điều khiển tải theo bất kỳ đặc tính nào.Tại mức điều khiển, thực thi chiến lược truyền thẳng-hồi tiếp Điều khiển truyền thẳng gồm một tập những hệ suy luận mờ MISO được thiết kế từ dữ liệu vào ra trạng thái xác lập Đường hồi tiếp gồm những bộ điều khiển PID với cấu hình nhiều vòng Với chiến lược này, đường truyền thẳng cung cấp hầu hết tín hiệu điều khiển cho vận hành diện rộng, giàm bớt những nổ lực điều khiển của những bộ điều khiển PID Đường hồi tiếp cung cấp tín hiệu điều khiển bù để điều chỉnh và loại nhiễu trong những lân cận nhỏ quanh những quỹ đạo lệnh Những kết quả mô phỏng cho thấy tính khả thi của sơ đồ điều khiển để đạt được vận hành theo tải chu kỳ
Những nghiên cứu lớn được thực hiện ở Nhật để phát triển những sơ đồ lai để đạt được cải tiến kỹ thuật trong vận hành máy điện[Matsuoka, et al.1993] Sau những thực thi thành công của điều khiển tối ưu nhiều biến trong suốt hơn hai mươi năm qua, người Nhật đang tạo ra bước đột phá kỹ thuật thứ hai trong điều khiển máy điện thông qua việc thực thi những sơ đồ lai dựa trên những giải thuật và những hệ neuro-mờ Những cách giải hoàn tất được tìm kiếm để giải quyết những vấn đề sau:1) những quá trình lớn hơn và phức tạp hơn gồm mô hình toán học của chúng, 2)độ phi tuyến mạnh hơn, kết hợp và tương tác biến đổi theo thời gian giữa những hệ con và 3)thoả mãn những yêu cầu chặt chẽ trong ổn định và tối ưu hệ thống
Ở Mỹ Intelligent Control Systems Initiative, được thành lập với sự liên kết giữa Electric Power Research Institute (EPRI) và National Science Foundation (NSF) năm 1993 gồm hai mươi mốt dự án nghiên cứu để tìm những ứng dụng
có giá trị và sáng kiến mới và thiết lập lý thuyết nền tảng và những chương
Trang 9- 17 - trình tin cậy cho việc thiết kế và phát triển những hệ thống thông minh và thích
nghi Một vài phương pháp điều khiển thông minh được đầu tư là:1) lập kế
hoạch giám sát off-line và on-line bằng lập luận tự động hay học từ những ví dụ
của con người, 2) mô hình định tính dùng những hệ chuyên gia và lôgic mờ và
3)trí tuệ nhân tạo và học máy dùng những phương pháp mạng nơron, giải thuật
di truyền, tiến hoá và học cưỡng bức, đôi khi kết hợp với những kỹ thuật tối ưu
toán học
1.5.3 Phát biểu vấn đề
Luận văn này sẽ trình bày ý tưởng cho việc phát triển những hệ thống điều
khiển thông minh cho đối tượng phi tuyến mà cụ thể là tổ hợp năng lượng,
nghĩa là phát triển những hệ thống quản lý năng lượng nhân tạo được thiết kế
điều khiển thông minh bởi hệ thống máy tính giống như bộ não con người
Những những yêu cầu chính cho hệ thống điều khiển là:
Thiết kế mở cung cấp những yêu cầu chức năng và vận hành để đạt được
độ linh hoạt, cho ứng dụng trong môi trường thị trường biến đổi cao
Vận hành người dùng cuối đơn giản và hiệu suất cao, liên kết với tự
động hoá và kỹ thuật điều khiển
Kiến trúc hệ thống có cấu trúc, điều này sẽ dẫn đến việc phát triển phần
mềm điều khiển và tự động hoá tương ứng
Từ những kết quả đạt được, có thể thấy rằng những chiến lược điều khiển phù
hợp cấu thành mức điều khiển cao nhất trong NLNLT hiện thời và chúng cũng
chịu trách nhiệm cho việc điều khiển boiler-tuabin-máy phát như một đối tượng
đơn Kế đến, NLNLT là một quá trình phức tạp, chịu nhiều thay đổi điều kiện
vận hành mà sẽ thể hiện như một hệ thống thông minh mà với nó khái niệm
điều khiển tích hợp tiên tiến là cần thiết
Việc phát triển kỹ thuật khi thiết kế hệ thống điều khiển tổ hợp năng lượng để
hổ trợ và làm cho dễ dàng hơn việc thực thi những hệ thống điều khiển năng
lượng phân tán và thứ bậc lớn và để tích hợp những kỹ thuật thông minh nhân
tạo liên kết tính hệ thống với sự phức tạp của quá trình và những yêu cầu vận
hành của nó Trong luận văn này sẽ thiết lập một sơ đồ điều khiển tổng quát gọi
là hệ thống điều khiển phù hợp thông minh ứng dụng những kỹ thuật thông
minh nhân tạo là mạng nơron, logíc mờ và thuật giải di truyền để đưa đối tượng
được điều khiển vào đúng quỹ đạo của nó với những yêu cầu vận hành khác
nhau Để làm được điều này, hệ thống điều khiển trên tích hợp những chức
năng học máy, quan sát ứng xử, cơ cấu thích nghi, tạo lệnh và tính toán điều
khiển, tất cả chúng đều cần thiết cho những đặc tính vận hành tự quản hiệu quả
và linh hoạt
1.5.4 Đối tượng và phạm vi
- 18 -
Đối tượng chính của đề tài nghiên cứu này là tăng cường mức điều khiển tự động những máy năng lượng thông qua việc mở rộng khái niệm điều khiển phù hợp cho NLNLT và tính hiện thực của nó qua những kỹ thuật thông minh nhân tạo
Phạm vi của đề tài sẽ tập trung vào những điểm sau:
Tất cả những nghiên cứu và phát triển trong đề tài này sẽ tập trung ở tổ hợp máy điện nhiên liệu than loại bao hơi truyền thống(NLNLT), vì chúng thể hiện kỹ thuật được dùng nhiều nhất để tạo năng lượng điện và cấu thành cách chính để điều chỉnh những thông số quan trọng nhất (công suất, tần số và điện áp) ảnh hưởng đến chất lượng năng lượng điện trong những hệ thống năng lượng liên kết
Chỉ những điều kiện động bình thường cùa NLNLT được xem xét Đề tài tập trung trong hệ thống điều khiển cần thiết cho trạng thái vận hành bình thường mà chiếm đến 99% thời gian vận hành Không nổ lực nào liên quan đến báo động, khẩn cấp, quá mức, hồi phục trạng thái Cần lưu ý rằng trạng thái bình thường không phải là trạng thái xác lập vì trong thực
tế nhà máy điện không bao giờ vận hành ở trạng thái xác lập
Thiết kế hệ thống điều khiển sẽ bao hàm chỉ chiến lược điều khiển nền tảng Việc phát triển những chiến lược tự động hoá, khoá liên động và bảo vệ như được cho trong bất kỳ hệ thống điều khiển nào sẽ không được thực hiện Cũng thế, đề tài chỉ đề cập đến những chức năng điều khiển cơ bản để lái quá trình trong suốt pha vận hành tải, không có chức năng khởi động và shutdown
Việc phát triển hệ thống điều khiển sẽ được giới hạn ở vấn đề hệ thống và tính khả thi của nó Tất cả chương trình sẽ được mô phỏng trên máy tính
cá nhân dùng môi trường phần mềm phòng thí nghiệm Không có việc thực thi hệ thống ở môi trường thực Đây cũng là bản chất nghiên cứu của đề tài
Đề tài sẽ chỉ phát triển tập hàm tối thiểu cần thiết cho điều chỉnh và tự động hoá hệ thống năng lượng toàn bộ, đề xuất tính linh hoạt tối đa để hổ trợ điều khiển tải và điều khiển nhiều tổ hợp trong những sơ đồ nhà máy điện
Phương pháp đề xuất sẽ được tính toán và so sánh với những phương pháp truyền thống Thậm chí loại hệ thống điều khiển này không tồn tại,
việc tính toán sẽ được thực hiện với hiệu suất theo tải là yêu cầu quan
trọng nhất cần được thoả mãn
1.5.5 Tổng quan đề tài
Việc phát triển hệ thống điều khiển phù hợp thông minh(ICCS) gồm bộ giám sát nhiều đại diện thông minh sẽ tính toán điều khiển ở mức trực tiếp Những chức năng giám sát gồm tạo lệnh và tối ưu, học và thích nghi, giám sát trạng
Trang 10- 19 - thái và hiệu suất(Hình 1.3) Mức trực tiếp gồm những sơ đồ điều khiển truyền
thẳng/hồi tiếp nhiều biến Việc thực thi lõi của hệ thống được hình thành bởi ba
môđun: sepoint, bộ xử lý điều khiển truyền thẳng và bộ xử lý điều khiển hồi
tiếp (hình 1.4) Giám sát hiệu suất và trạng thái cũng như những hàm học và
thích nghi được thực thi hoặc là ở dạng off-line hoặc bao gồm hoàn toàn trong
môđun chính
Hình 1.3 Hệ thống điều khiển phù hợp thông minh
Hình 1.4.Sơ đồ khối điều khiển Với bất kỳ quỹ đạo lệnh tải nào, bộ tạo setpoint sẽ tạo những quỹ đạo
setpoint cho những vòng điều khiển mức thấp hơn thông qua nhóm những ánh
xạ được thiết kế tối ưu Ánh xạ setpoint được thiết kế bằng cách giải bài toán tối
ưu nhiều đối tượng, trong đó những hàm đối tượng và hàm phù hợp của chúng
- 20 -
có thể là bất kỳ Phương pháp này cho phép tối ưu quá trình và cung cấp những phương pháp chỉ định chính sách vận hành cung cấp độ phân tán lớn những tình huống vận hành theo nhiều đối tượng vận hành Sơ đồ điều khiển truyền thẳng-hồi tiếp hai bậc tự do được đề xuất là một mở rộng của sơ đồ điều khiển hồi tiếp SISO tuyến tính với cả hai điều khiển truyền thẳng tham chiếu và nhiễu, cho trường hợp nhiều biến phi tuyến để đạt được vận hành diện rộng Bộ xử lý điều khiển truyền thẳng được thực thi dùng những hệ thống suy luận mờ MISO, được thiết kế từ dữ liệu vào ra xác lập, dùng kỹ thuật học mạng nơron Đường điều khiển hồi tiếp được thực thi như một sơ đồ điều khiển nhiều vòng phân tán dựa trên bộ điều khiển PID mờ và bù tương tác Những bộ điều khiển PID mờ kết hợp những kỹ thuật điều khiển gain-scheduling và multimode dùng hệ thống
suy luận mờ loại Sugeno
Trang 11- 21 -
CHƯƠNG 2
MẠNG NƠRON, LÔGIC MỜ
VÀ NHỮNG ỨNG DỤNG CỦA CHÚNG
TRONG ĐIỀU KHIỂN QUÁ TRÌNH
Chương này sẽ thể hiện những ứng dụng nổi bật của mạng nơron trong điều
khiển quá trình Người ta nhận thấy rằng những phương pháp lai dùng mạng
nơron dang hứa hẹn nhiều triển vọng cho điều khiển những hệ thống phi tuyến
và/hoặc MIMO mà không thể điều khiển thành công bằng những kỹ thuật
truyền thống
2.1.Giới thiệu
Những kỹ thuật điều khiển truyền thống như điều khiển Tích phân tỉ lệ(PI)
hay điều khiển Vi tích phân tỉ lệ(PID) được ứng dụng thành công trong điều
khiển những quá trình tuyến tính Gần đây, Điều khiển tiên đoán mô hình
(MPC) cũng thực hiện thành công trong điều khiển những hệ thống tuyến tính
Tuy nhiên, khoảng 90% những quá trình sinh học và hoá học là phi tuyến cao
và hầu hết chúng là những hệ MIMO.Khi hệ thống là phi tuyến và/hoặc MIMO,
những kỹ thuật truyền thống trên thường mắc phải sai sót khi điều khiển những
hệ thống như thế Ngày nay, những hệ thống được dùng trong công nghiệp đòi
hỏi độ tự quản cao và những kỹ thuật trên không có khả năng để đạt được điều
này
Cần phải đạt được những đòi hỏi điều khiển tăng nhanh trong những hệ thống
điều khiển động phức tạp dưới những thay đổi quan trọng đã làm cho việc dùng
Mạng nơron (NN) trong những hệ thống điều khiển trở nên hấp dẫn Những lý
do chính đằng sau điều này là khả năng của chúng có thể “học” để xấp xỉ hàm
và phân loại mẫu và tiềm năng của chúng trong thực thi phần cứng song song
đồ sộ Nói cách khác, chúng có khả năng thực thi (cả phần mềm và phần cứng)
nhiều chức năng cần thiết để điều khiển hệ thống với một độ tự quản cao
Do có khả năng học những liên hệ hàm số phi tuyến phức tạp, mạng nơron
được dùng trong điều khiển những quá trình phi tuyến và/hoặc MIMO Trong
thập kỷ qua,ứng dụng mạng nơron trong nhận dạng và điều khiển đã tăng theo
hàm mũ
Những ứng dụng rộng rãi này là do những đặc tính hấp dẫn sau:
1 Mạng nơron có khả năng xấp xỉ bất kỳ hàm số phi tuyến nào;
2 Chúng có thể được huấn luyện dễ dàng bằng cách dùng những bản ghi dữ
2.2.Điều khiển quá trình
Trong phát triển, thiết kế và vận hành những máy móc quá trình, những kỹ sư quá trình luôn gắn liền với năm khái niệm cơ bản:trạng thái,trạng thái cân bằng, bảo toàn,tốc độ và điều khiển
Nhận dạng một hệ thống đòi hỏi xác định trạng thái nhiệt động theo đó tất
cả thuộc tính của một hệ thống là cố định Những hệ thống sinh học,vật lý và
hoá học không thể vận hành ngoài khoảng giới hạn của trạng thái cân bằng
nhiệt động, mà giới hạn khoảng cho phép của những điều kiện vật lý và hoá học
để quá trình diễn ra trong hệ thống
Bảo toàn khối lượng,động lượng và năng lượng yêu cầu những số lượng nào
đó cần được bảo toàn trong quá trình vì khối lượng, năng lượng và động lựơng cân bằng Đặc tính loại và kích thước của thiết bị quá trình của một hệ thống
phụ thuộc vào lượng vật liệu đưa vào quá trình và tốc độ tại đó những quá trình
sinh học, hoá học và vật lý diễn ra trong thiết bị Khái niệm này được bao trùm trong lĩnh vực động lực sinh học và hoá học
Một quá trình có thể khả thi cả về mặt nhiệt động và động lực nhưng vẫn không hoạt động vì hiệu suất vận hành kém Điều này có thể là kết quả của việc không điều khiển được của quá trình và vì những điều kiện không kinh tế Vì
thế,điều khiển hệ thống để thoả mãn hiệu suất vận hành, vật lý và kinh tế là rất
quan trọng trong thiết kế và vận hành một hệ thống quá trình cũng như khái niệm trạng thái cân bằng và tốc độ của quá trình
Điều khiển quá trình là sự điều chỉnh các quá trình sinh học, vật lý và hoá
học để loại bỏ những ảnh hưởng của nhiễu bên ngoài,để đảm bảo sự ổn định của quá trình và để tối ưu hiệu suất của quá trình
Một vài đặc tính quan trọng của điều khiển quá trình được lập danh sách ở đây:
Xem xét điều khiển quá trình đầu tiên đòi hỏi xem xét những thay đổi phụ thuộc thời gian Vấn đề không thể được hình thành mà không có cấu trúc động Điều khiển bất kỳ quá trình nào chỉ có thể được xem xét cẩn thận bằng một phân tích chi tiết đáp ứng trạng thái không ổn định mà có được từ mô hình động của quá trình
Những hệ thống điều khiển quá trình là những hệ thống xử lý thông tin Chúng nhận thông tin, xử lý nó, tương tác với nó và tạo thông tin như những tín hiệu
Tất cả những hệ thống điều khiển quá trình là những hệ thống tích hợp những bộ phận, trong đó mỗi bộ phận ảnh hưởng hiệu suất toàn bộ của hệ
Trang 12- 23 - thống Vì thế, phương pháp tổng quát xem xét toàn bộ hệ thống và môi
trường của nó như một thực thể là quan trọng
Hầu hết hệ thống điều khiển quá trình là những hệ thống hồi tiếp trong đó
thông tin được tạo bởi hệ thống được xử lý lần nữa để điều chỉnh đáp ứng
của hệ thống
Cuối cùng, tính kinh tế luôn liên kết với những đối tượng hiệu suất của hệ
thống điều khiển quá trình
Những hệ thống điều khiển quá trình trong công nghiệp như quá trình vật lý,
sinh học và hoá học được mô tả bởi những chuẩn hiệu suất và những thay đổi
của yêu cầu thị trường Cũng thế, những quá trình này là phi tuyến cao và
không thể được mô hình hoá thật tốt Vì thế, điều khiển phải được thực hiện
bằng cách cập nhật những biến được thao tác trực tuyến để thoả mãn thay đổi
chuẩn hiệu suất khi gặp phải thay đổi đặc tính của thiết bị Nhiều kỹ thuật điều
khiển dựa trên khác biệt chuẩn hiệu suất và miêu tả quá trình được dùng để giải
quyết những vấn đề này
Trong quá trình vận hành của một thiết bị, một vài yêu cầu cần được thoả
mãn và có thể được xem xét như những tiêu chuẩn hiệu suất Một vài chuẩn
được liệt kê ở đây:
1 Luật an toàn và môi trường,
2 Đặc tính sản phẩm,
3 Điều kiện vận hành,
4 Tính kinh tế
Những tiêu chuẩn này cần được chuyển dịch thành những biểu thức toán học
để viết luật điều khiển Chúng có thể được phân loại như những đối tượng(hàm
của những biến cần được tối ưu động) và hạn chế ((hàm của những biến cần
được giữ trong khoảng cần thiết)
Chuyển đổi chuẩn hiệu suất thành những biểu thức toán học có thể yêu cầu
vài giả định Những giả định này không những làm đơn giản cách giải quyết
vấn đề mà còn làm cho vấn đề có thể thực thi trong những phần cứng đang có
Tất cả những bộ điều khiển dùng một mô tả hay một mô hình của quá trình
Nói chung, trong những quá trình sinh học và hoá học, những mô hình là phi
tuyến và những thông số mô hình thường không biết được Vì thế, luôn luôn có
sự không phù hợp giữa tiên đoán mô hình và ngõ ra quá trình thật Những lý do
khác của sự khác biệt này là do những thay đổi trong những điểm vận hành và
thiết bị
Những khác biệt giữa một thiết bị và mô hình của nó tạo ra sự không thoả
mãn để cân bằng tiêu chuẩn hiệu suất Những thông số điều chỉnh được có thể
giúp cân bằng giữa theo dõi điểm đặt nhanh và đáp ứng biến thao tác trơn
Người ta luôn mong muốn tối thiểu lượng điều chỉnh trực tuyến bằng cách dùng
- 24 - một mô hình quá trình khi thiết kế mà bao gồm mô tả những trạng thái không rõ ràng
Mặc dù mô tả trạng thái không rõ ràng được dùng, luôn cần cập nhật những thông số mô hình trực tuyến theo cách thích nghi Bộ điều khiển tiên đoán mô hình (MPC) là những bộ điều khiển trong đó luật điều khiển dựa trên mô hình quá trình MPC là một hệ thống điều khiển trong đó bộ điều khiển xác định tiểu
sử biến được thao tác mà tối ưu đối tượng hiệu suất vòng lặp mở trong khoảng thời gian kéo dài từ thời điểm hiện tại đến thời điểm hiện tại cộng với khoảng thời gian tiên đoán MPC phù hợp cho những vấn đề có một lượng lớn những biến được thao tác hay được điều khiển, những hạn chế cho cả hai loại biến này,thay đổi điều khiển đối tượng và/hoặc sai sót thiết bị, và thời gian trễ Một
mô hình quá trình được thực hiện trực tiếp trong thuật toán để tiên đoán ngõ ra quá trình tương lai
Thường thì trong nhiều bài toán điều khiển quá trình,những mô hình điều khiển không được xác định tốt; hoặc là chúng mất hoặc những thông số hệ thống có thể biến đổi theo thời gian Mạng nơron có nhiều tiện lợi để thu được những mô hình vào-ra của hệ thống vì chúng có thể “bắt chước” đáp ứng của hệ thống sau khi được “huấn luyện“ Thậm chí mô hình mạng nơron hay nhận dạng có thể không phù hợp với thiết bị khi bắt đầu,nhưng nó sẽ trở nên tốt hơn khi tiến trình huấn luyện trực tuyến diễn ra Vì thế, huấn luyện trực tuyến làm cho mạng nơron nắm giữ những thông số thay đổi theo thời gian trong thiết bị một cách trực tiếp
Bằng cách huấn luyện mạng nơron để học “mô hình ngược” của một thiết bị,nó có thể được dùng như một “bộ điều khiển “ cho thiết bị này Những bộ điều khiển mạng nơron cũng có thể được dùng trong những cấu trúc MPC như
là những bộ đánh giá hay/và bộ điều khiển
Vì những quá trình sinh học và hoá học thường phức tạp, thay vì dùng mạng nơron một mình trong điều khiển những quá trình này, nên dùng chúng kết hợp với những phương pháp truyền thống như những kỹ thuật điều khiển PI hay PID hay những kỹ thuật gần đây như những hệ thống chuyên gia dựa trên quy luật hay lôgic mờ, theo cách lai ghép, sẽ cải tiến hiệu suất của toàn bộ điều khiển
2.3.Dùng Mạng nơron trong Điều khiển
Trong những ứng dụng hệ thống điều khiển, mạng nơron nhiều lớp feedforward với huấn luyện có giám sát thường được dùng nhất Một đặc tính chính của những mạng này là chúng có thể tạo những ánh xạ vào-ra mà có thể xấp xỉ bất kỳ hàm nào với độ chính xác mong muốn Mạng nơron được dùng trong những hệ thống điều khiển chủ yếu là nhận dạng và điều khiển hệ thống Trong nhận dạng hệ thống, để mô hình đáp ứng vào-ra của một hệ thống động, mạng được huấn luyện dùng dữ liệu vào-ra và trọng số mạng được điều
Trang 13- 25 - chỉnh thường dùng thuật toán backpropagation(lan truyền ngược) Giả định duy
nhất là ánh xạ tĩnh phi tuyến được tạo bởi mạng có thể đại diện đầy đủ đáp ứng
động của hệ thống trong khoảng khảo sát của một ứng dụng cụ thể Mạng nơron
cần được cung cấp thông tin về lịch sử hệ thống : những ngõ vào và ra ở những
lần trước Bao nhiêu thông tin được yêu cầu phụ thuộc vào độ chính xác mong
muốn và ứng dụng cụ thể
Khi một mạng nhiều lớp được huấn luyện như một bộ điều khiển,hoặc như
một vòng lặp kín hay mở, hầu hết những vấn đề này đều tương tự trường hợp
nhận dạng Khác biệt cơ bản là ngõ ra mong muốn của mạng là ngõ vào điều
khiển thích hợp được dẫn đến thiết bị, là không có được nhưng phải được sưy ra
từ ngõ ra mong muốn của thiết bị Để đạt được điều này, người ta dùng hoặc là
xấp xỉ dựa trên mô hình toán học của thiết bị(nếu có được),hay mô hình mạng
nơron động của thiết bị hay thậm chí mô hình động đảo ngược của thiết bị
Mạng nơron có thể được kết hợp để nhận dạng và điều khiển thiết bị, vì thế
hình thành cấu trúc điều khiển thích nghi
Chúng ta sẽ giới thiệu vài cách cơ bản trong đó dữ liệu huấn luyện mạng
nơron có thể thu được trong những công việc liên quan đến điều khiển :
Sao chép từ một bộ điều khiển hiện có: Nếu có một bộ điều khiển có
thể điều khiển một thiết bị,thì thông tin yêu cầu để huấn luyện một mạng
nơron có thể thu được từ nó Mạng nơron học sao chép bộ điều khiển
hiện có Một lý do để sao chép một bộ điều khiển hiện có là nó có thể là
một dụng cụ không thực tế để dùng, chẳng hạn như một chuyên gia
Trong một vài trường hợp,chỉ vài cặp vào-ra hữu hạn của một bộ điều
khiển mong muốn được biết Thì một mạng nơron có thể được huấn
luyện để thi đua với bộ điều khiển mong muốn bằng cách nội sưy những
cặp vào-ra này
Nhận dạng hệ thống :Trong trường hợp nhận dạng,dữ liệu huấn luyện
có thể thu được bằng cách quan sát đáp ứng vào-ra của một thiết bị
Trong những trường hợp phức tạp hơn, ngõ vào mô hình có thể chứa vài
giá trị trễ của những ngõ vào thiết bị và mô hình mạng có thể là đệ quy
Nhận dạng hệ thống ngược: Trong trường hợp này,ngõ vào mạng là
ngõ ra của thiết bị và ngõ ra của mạng là ngõ vào thiết bị Khi thu được
mạng nơron ngược của thiết bị,nó được cung cấp ngõ ra thiết bị mong
muốn và ngõ ra của nó là ngõ vào điều khiển mong muốn của thiết bị
Vấn đề chính với nhận dạng ngược là mô hình ngược của một thiết bị
không phải luôn luôn được xác định tốt
Bộ điều khiển tiên đoán mô hình : Đầu tiên một mạng nơron nhiều lớp
được huấn luyện để nhận dạng mô hình thuận của thiết bị, sau đó một
mạng khác,ví dụ bộ điều khiển,sử dụng bộ nhận dạng này như một bộ
quan sát thiết bị trong một cấu trúc MPC Mô hình này có ưu điểm của
một bộ điều khiển thích nghi, nhưng nó đòi hỏi phải tính Jacobian của
ta giả thiết rằng f và g có thể được xấp xỉ đến một độ chính xác mong muốn bất
kỳ trên những tập đóng bởi mạng nơron nhiều lớp Do giả thiết này, bất kỳ thiết
bị nào cũng có thể được đại diện bởi một mô hình mạng nơron tổng quát hoá
Để nhận dạng một thiết bị,một mô hình nhận dạng được chọn dựa trên thông tin liên quan đến lớp mà nó thuộc Ví dụ, giả sử thiết bị có cấu trúc được mô tả bởi mô hình III, chúng ta có hai loại bộ nhận dạng:
2.3.1 Mô hình song song: Trong trường hợp này, cấu trúc của bộ nhận dạng
giống hệt thiết bị với f và g được thay thế bởi những mạng nơron N1 và N2 tương ứng Mô hình này được mô tả bởi phương trình:
(2.5)
2.3.2 Mô hình song song-nối tiếp: Mô hình này được mô tả bởi phương trình:
(2.6) Khi một thiết bị được nhận dạng, một bộ điều khiển thích hợp có thể được thiết kế dựa trên mô hình nhận dạng này Khi nhiễu bên ngoài không hiện diện trong hệ thống,có thể điều chỉnh những thông số nhận dạng và điều khiển đồng thời Tuy nhiên, khi có nhiễu hiện diện, cập nhật thông số bộ điều khiển được thực hiện với thời gian chậm hơn để đảm bảo độ tin cậy
Trang 14- 27 -
2.4 Mạng nơron cấu trúc truyền thẳng
Những mạng nơron thông minh là những mô hình cấu trúc tính toán sinh học
đặc biệt, gồm những đơn vị xử lý thông tin phân tán và vì thế sở hữu những khả
năng của tính toán song song Cơ sở của mạng nơron thông minh là nó có nhiều
đơn vị xử lý được kết nối với nhau, được gọi là những nơron mà hình thành
những cấu hình đặt lớp Ứng xử của mỗi nơron là đơn vị tính toán cơ bản mô tả
những hoạt động xử lý thông tin nơron Mỗi đơn vị tính toán trong mạng dựa
trên khái niệm nơron lý tưởng Một nơron lý tưởng được giả sử là đáp ứng tối
ưu với những ngõ vào Mạng nơron là một tập hợp những đơn vị nơron như thế,
trong đó những nơron đơn được kết nối thông qua những kết nối khớp phức tạp
được đặc tính bởi những hệ số trọng số và mỗi nơron tạo phân phối của nó
hướng đến những đặc điểm tính toán của toàn bộ hệ thống
Về bản chất, những nơron sinh học rất nhiều cảm biến phức tạp, điều khiển,
và nhận dạng những khía cạnh toán học và những quá trình tạo quyết định Rất
nhiều ánh xạ toán học phức tạp và những hàm xử lý có thể được đồng nhất với
những quá trình sinh học Việc nghiên cứu những mô hình toán học của những
đơn vị nơron bắt đầu tại thời điểm khi mà bài toán mô tả toán học của bộ não
con người thu hút sự chú ý của những nhà nghiên cứu Mô hình đầu tiên của
nơron được đề xuất bởi McCulloch và Pitts năm 1943 Gần đây, việc phát triển
những phương pháp thích nghi đã đưa ra cơ hội giả hàm học của những quá
trình nơron sinh học Một vài mô hình nơron như thế được phát triển vào thập
niên 60 Nói chung, như một bộ xử lý thông tin, một nơron đơn thực hiện một
kết hợp trên những ngõ vào được trọng số của nó và tạo ra một ngõ vào thông
qua hàm kích hoạt phi tuyến với một ngưỡng
Ngay từ đầu lấy ý tưởng từ những nơron trong bộ não con người, những
nơron thông minh là những đơn vị xử lý tín hiệu được sắp xếp thành những
mạng được kết nối để thực hiện những công việc xử lý thông tin phức tạp chẳng
hạn nhận dạng đặc tính, nhóm dữ liệu và phân loại, xấp xỉ hàm,… Một mô hình
tổng quát của một nơron thông monh được xem như một hàm xử lý ngõ vào và
một hàm xử lý ngõ ra
Hình 2.1.Nơron thông minh
- 28 - Hàm ngõ vào f(.), kết hợp tất cả những tín hiệu vào thành một ngõ vào mạng đơn.Thông thường, một hàm ngõ vào là một kết hợp tuyến tính của những ngõ vào xi:
(2.7) với wi i=1,…,n được gọi là những trọng số liên kết Hàm ngõ ra g(.) cung cấp tín hiệu ngõ ra của nơron với toán hạng ngõ vào mạng được cho bởi f Hàm ngõ
ra thường dùng là hàm sigmod:
(2.8) Một mạng nơron thông minh là một mảng gồm những nơron liên kết với nhau Giữa nhiều cấu hình kết nối khác nhau, một cấu hình thông thường và hữu dụng nhất là mạng truyền thẳng nhiều lớp, trong đó không có nơron ngõ ra nào là ngõ vào cho một nơron trong cùng hay thuộc lớp đứng trước Đây là điểm nổi bật nhất của loại mạng này
Hình 2.2.Mạng truyền thẳng nhiều lớp Lớp nơron nhận ngõ vào mạng được gọi là lớp ngõ vào Lớp ngõ vào không thực hiện bất kỳ công việc xử lý tín hiệu nào mà chỉ phân bố những tín hiệu vào Những ngõ ra mạng được tạo bởi lớp ngõ ra Bất kỳ lớp nào nằm giữa lớp ngõ vào và ngõ ra đều được gọi là lớp ẩn vì nó không có liên hệ trực tiếp với môi trường mạng
2.4.1.Hàm truyền
Có nhiều loại hàm truyền,nhưng có ba loại thông dụng nhất là:
Trang 15- 29 -
Hình 2.3.Hàm truyền bước Hàm truyền này giới hạn ngõ ra của nơron là 0,nếu đối số ngõ vào mạng n nhỏ
hơn hay bằng 0;hay 1 nếu n lớn hơn hay bằng 0
Hình 2.4 Hàm truyền tuyến tính
Hình 2.5 Hàm truyền sigmod Hàm truyền sidmod nhận ngõ vào,có bất kỳ giá trị nào và tạo ngõ ra nằm trong
khoảng 0 và 1
2.4.2 Thích nghi và học cho những thành phần ngưỡng nơron
Một công việc quan trọng là làm cách nào để thiết kế một thuật toán hiệu quả
để thích nghi những trọng số và ngưỡng của một đơn vị Lập trình tuyến tính có
thể cung cấp một giải pháp thay thế cho một tập những bất phương trình mà có
thể nhận được từ một hàm chuyển mạch được cho Vì tất cả những giá trị hợp lý
của hàm này hiện diện trong một chương trình tổng hợp như thế tại cùng thời
điểm, thuật toán này được xem là có bản chất song song Trong trường hợp này,
một máy tính được lập trình để thực hiện một chương trình mà phải có đủ bộ
- 30 - nhớ để lưu trữ toàn bộ hàm chuyển mạch hoặc là một bảng kết hợp hay một hàm Boolean
Đối ngược với điều trên có một số chương trình mà có thể thực hiện theo vòng lặp hay theo chuỗi Nghĩa là, tại bất kỳ thời điểm nào , chương trình cho một giá trị hàm chỉ với một kết hợp ngõ vào và không cần bộ nhớ để lưu trữ những giá trị hàm ở các thời điểm trước Cần có bộ nhớ để lưu trữ ước lượng hiện thời của chương trình cho việc nhận dạng đúng và chứa những giá trị trọng
số và ngưỡng Khi giá trị hàm cho một vài kết hợp ngõ vào thì có được một tín hiệu lỗi giữa giá trị hàm này và ước lượng hiện thời và được hồi tiếp để mà chương trình có thể thay đổi ước lượng hiện thời nhưng không lưu trữ thông tin khác Ý tưởng là sau mỗi hiện diện của ngõ vào với một lượng thời gian đủ thì ước lượng của chương trình sẽ hội tụ đến đến một giá trị đúng Loại chương trình này được gọi lả thích nghi hay học vì mối liên hệ nào đó đến những quá trình trong những nơron sinh học
Cho một tập gồm n biến ngõ vào x1,x2,…,xn như hình sau, ngõ ra của bộ kết hợp tuyến tính(linear combiner) được xác định đơn giản như sau:
(2.9) Định nghĩa những véctơ đối số của những ngõ vào và trọng số nơron , ta có:
(2.10)
Hình 2.6.Sơ đồ khối của một bộ kết hợp tuyến tính
Trang 16Vì thế, với một hàm chuyển mạch f(x1,x2,…,xn) một quá trình thích nghi cho
những thành phần ngưỡng có thể được xem như một bộ kết hợp tuyến tính được
đặt nối tiếp với hàm giới hạn như trong hình 1.4 Tín hiệu lỗi giữa hàm chuyển
mạch đã biết và ngõ ra của thành phần ngượng nơron được cho như sau:
(2.12) với d(k) = f(x1,x2,…,xn) là một hàm của những biến xi, i=1,…,n Thuật toán
thích nghi là một chương trình tối thiểu hàm lỗi sẽ được bàn đến sau
2.4.3 Luật thích nghi Perceptron
Luật học perceptron nhị phân của Rosenblatt cho một thành phần ngưỡng được
thể hiện lần đầu tiên vào năm 1958 Cho một đáp ứng mong muốn d(k), việc
thích nghi được cập nhật với với luật perceptron dùng một “lỗi lượng tử hoá”
e(k), được định nghĩa là khác biệt giữa đáp ứng mong muốn và ngõ ra của thành
phần ngưỡng
(2.13) chỉ có ba giá trị hợp lý cho e(k):
- 32 -
Như trong chương trình được dùng cho giải thuật LMSđược mô tả trong phần sau, cho a k là một ước lượng của véctơ trong số tại thời điểm k Ta có thể viết lại lỗi tức thời e(k) như sau:
(2.14) Với một ngõ vào cố định x(k) và đáp ứng mong muốn d(k), lỗi tức thời mới liên quan với những thông số trọng số được cập nhật tại thời điểm (k+1) được viết như sau:
(2.15) với
(2.16) Mục đích của chúng ta là tìm một luật cập nhật trọng số a k để mà
e(k+1)0 (2.17) hay
(2.18) Nếu e(k)=2
Hay tương đương d(k)=1 và
Có thể chọn
(2.19)
để mà
(2.20) Ngược lại, nếu
e(k)=-2 hay tương đương
(2.23)
Và
(2.24) Trong đó 0 được gọi là tốc độ học
Trang 17- 33 -
Từ (2.23), ta kết luận rằng sự thay đổi i k tương quan với tín hiệu ngõ vào
xi(k) và tín hiệu lỗi e(k) Nếu sự tương quan là 0, nghĩa là e(k)xi(k)=0 thì thay
đổi i k cũng là 0 Sơ đồ khối của thuật toán cập nhật được cho trong hình 2.8
Hình 2.8 Những thành phần với luật thích nghi perceptron
2.4.4 Luật thích nghi Mays
Một luật học biến thể của luật học -perceptron được thể hiện ở hình 2.9 được
gọi là luật học May Thích nghi tăng dần ở dạng tổng quát của nó dùng một
“vùng chết” với bán kính 0cho ngõ ra tuyến tính
(2.25) Nếu ngõ ra s(k) nằm ngoài vùng chết , nghĩa là
k
s (2.26) Thì thích nghi theo sau một biến đổi chuẩn hoá của luật perceptron tăng dần cố
định với x a 2 được dùng thay cho Nếu ngõ ra tuyến tính nằm trong
vùng chết s k , thì bất kể đáp ứng ngõ ra y(k) đúng hay không những trọng
số được cập nhật bởi biến đổi chuẩn hoá của luật học -perceptron với
Hình 2.9 Luật thích nghi Mays với ngõ ra tuyến tính và lỗi tuyến tính
Về mặt toán học, thuật toán thích nghi tăng dần Mays được diễn tả như sau:
với e(k) là lỗi lượng tử tại thời điểm k được định nghĩa như sau:
e(k)=d(k)-sgn(s(k))
và d(k) là đáp ứng mong muốn tại thời điểm k
Hiển nhiên là nếu bán kính của vùng chết là 0 Thì luật thích nghi Mays trở thành luật thích nghi perceptron
2.4.5 Thành phần tuyến tính thích nghi (ADALINE)
Thành phần tuyến tính thích nghi (ADALINE) được dùng như là khối xây dụng
cơ bản trong nhiều mạng nơron truyền thẳng, được nghiên cứu lần đầu tiên bởi Widrow và các đồng sự trong thập kỷ 1960 Một bộ kết hợp tuyến tính thích nghi đơn giản được cho ở hình 2.10, với ngõ ra của đơn vị là tổng trọng số của tất cả ngõ vào
Để thực hiện quá trình thích nghi trong miền thời gian rời rạc, người ta giả sử rằng thành phần này nhận véctơ đặc tính ngõ vào x(k)=[x1(k),…,xn(k)]T và một đáp ứng mong muốn d(k), là một hàm của thời điểm k Những thành phần của véctơ ngõ vào được trọng số bởi một tập những hệ số hay trọng số được biểu thị bởi véctơ trong số w=[w1,…,wn]T trong đó những thành phần của nó có cả những giá trị dương và âm Dùng ký hiệu của những véctơ đối số, một ngõ ra tuyến tính tại thời điểm k có được bằng tích của véctơ đặc tính ngõ vào và véctơ trọng số như sau:
Trang 18- 35 -
(2.27)
Hình 2.10.Thành phần tuyến tính thích nghi (ADALINE)
2.4.6 Giải thuật LMS(Bình phương trung bình nhỏ nhất)
Giải thuật LMS cung cấp một công thức thích nghi hiệu quả và đơn giản cho
những trọng số của bộ kết hợp tuyến tính trong hình 2.10 Giải thuật này có
được dùng nguyên tắc nhiễu nhỏ nhất và được đề xuất bởi Widrow và
Hoff(1960)
Cho wa(k)=[w0(k),…,wn(k)]T là một ước lượng của véctơ trọng số wa tại thời
điểm k Lỗi tuyến tính giữa đáp ứng mong muốn d(k) và ngõ ra tuyến tính s(k)
với ước lượng hiện thời của những trọng số wa(k) được định nghĩa như sau:
(2.28) Lỗi kế tiếp được định nghĩa là khác biệt giữa đáp ứng mong muốn d(k) và ngõ
ra tuyến tính s(k) với những ước lượng kế tiếp của những trọng số wa(k+1) là:
(2.29)
Có thể thấy rằng tại thời điểm k thay đổi trọng số sẽ dẫn đến những thay đổi
tương ứng của lỗi:
(2.30) Công việc kế tiếp là tìm một luật cập nhật để mà lỗi el(k) sẽ hội tụ tiệm cận đến
0 Để bảo đảm rằng sự hội tụ của lỗi phụ thuộc vào cập nhật trọng số, ta giả sử
(2.31) Nghĩa là:
- 36 -
với là một hằng số được chọn để mà lỗi el(k) sẽ ổn định tiệm cận:
(2.32) Như vậy ta có được:
(2.33) Nhân cả hai vế của phương trình này với xa(k) ta được
(2.34)
Vì thế ,cuối cùng ta có được:
Do đó
(2.35) Đây là một số gia Phương trình (2.52) là luật Widrow-Hoff delta Với một giá trị ban đầu bất kỳ của el(0),el(k) có thể được diễn tả như sau:
0 (2.38) Không giống như luật perceptron, ngõ vào của một Adaline có thể là nhị phân hay tương tự Một Adaline có thể được dùng để nhận ra những hàm ngưỡng bằng cách hiệu chỉnh thích hợp những trọng số Thậm chí nếu cả hai luật học perceptron và LMSđược dùng trong những chương trình sữa lỗi và có những
công thức cập nhật tương tự, chúng vẫn có những ứng xử khá khác biệt(Widrow and Lehr 1990) Khác biệt chính giữa hai thuật toán này là luật của Rosenblatt khai thác một lỗi lượng tử e=(d-sgn(s)) trong khi giải thuật LMSkhai thác lỗi
tuyến tính el=d-s Điều này có nghĩa là giải thuật perceptron gồm một hàm phi tuyến của những tín hiệu qua hàm truyền bước, ngược lại giải thuật LMSlà một quá trình tuyến tính
Trang 19- 37 -
2.4.7 Phương pháp lỗi bình phương trung bình
2.4.7.1 Công thức không lặp lại
Theo Widrow và Lehr, khái niệm lỗi bình phương trung bình có thể được dùng
để xác định véctơ trọng số cho một ngõ vào và những đặc tính dữ liệu mong
muốn dùng giải thuật lặp hay không lặp Không mất tính tổng quát, giả sử rằng
ngõ vào x(k) và ngõ ra mong muốn d(k) được rút từ việc thống kê Bình phương
của lỗi giữa ngõ ra của bộ kết hợp tuyến tính và ngõ ra mong muốn tại thời
điểm k được mở rộng như sau:
(2.39)
Vì bộ kết hợp tuyến tính sẽ tạo ra một lỗi el(k) tại mỗi thời điểm k, trung bình
toán bộ của bình phương lỗi trong (2.39) là:
(2.40) Thuật ngữ bên trái được gọi là lỗi bình phương trung bình (MSE) Đặt:
là véctơ tương quan chéo giữa ngõ ra mong muốn d(k) và véctơ ngõ vào nơron
xa(k)
Tương tự, định nghĩa ma trận tương quan ngõ vào R
Là một ma trận xác định dương,đối xứng và thực hay trong những trường hợp ít
gặp hơn là ma trận bán xác định dương Vì thế lỗi bình phương được viết lại
như sau:
(2.41) Gradient a của hàm MSE tương ứng với véctơ trọng số wa có được bằng
cách đạo hàm (2.41) như sau:
- 38 - Đây là một phương trình véctơ tuyến tính của véctơ trọng số Véctơ trọng số tối
ưu w* cũng được gọi là véctơ trọng số Wiener đạt được bằng cách đặt gradient
là 0 Vì thế trọng số tối ưu là:
wa=R-1p (2.42) Cách giải này gồm một chương trình tính toán nghịch đảo ma trận R Với số lượng lớn những ngõ vào, điều này có thể dẫn đến việc tốn rất nhiều thời gian, thậm chí một vài giải thuật tính ma trận cải tiến chẳng hạn phân rã giá trị suy biến(SVD) được dùng để tránh tính nghịch đảo ma trận trực tiếp Vì thế, một phương pháp giảm gradient lặp sẽ được giới thiệu để giải quyết việc tín toán phức tạp này
2.4.7.2 Gải thuật bình phương tring bình nhỏ nhất LMS
LMS
có thể được phát triển từ phương pháp giảm gradient truyền thống, nơi
mà việc tìm kiếm véctơ trọng số tối ưu được tím kiếm trong không gian trọng
số dọc theo hướng được cung cấp bởi gradient của một lỗi bình phương tức thời giữa ngõ ra hiện thời và ngõ ra mong muốn Vì nó là một hàm bình phương cùa những trọng số, bề mặt này là lồi và có một tối thiểu toàn cục duy nhất Từ (2.57) gradient tức thời có thể đạt được dựa trên hàm lỗi tuyến tính tức thời như sau:
(2.43)
Vì thế, giải thuật học giảm gradient được viết như sau:
(2.44) Đây là giải thuật LMScủa Widrow, với tốc độ học 0 quyết định độ hội tụ của chương trình học Theo Widrow và Lehr , phải thoả:
(2.45) Giải thuật LMS hội tụ trung bình đến w*, là cách giải Wiener tối ưu được cho bởi (2.43)
Thể hiện hình học của luật LMSđược cho trong hình 2.11 Theo (2.44) wa(k+1) bằng với wa(k) cộng với một số gia a k mà tương ứng với véctơ đặc
Trang 20- 39 - tính ngõ vào xa(k) Nói cách khác, biến đổi của lỗi phụ thuộc vào biến đổi của
véctơ trọng số bằng với tích âm của xa(k) và a k Vì giải thuật LMS chọn
k
a
cộng tuyến với xa(k), tương quan lỗi mong muốn đạt được với biến đổi
véctơ trọng số có biên độ ổn định Khi việc cập nhật tương ứng hoàn hảo với
đặc tính ngõ vào mới, những đáp ứng với những đặc tính huấn luyện trước đây
sẽ được cập nhật tối thiểu
Hình 2.11 Giải thích hình học của những giải thuật LMSvà LMS
Khi so sánh hai thuật toán LMSvà LMS, điều thú vị là luật LMS là
một phiên bản tự chuẩn hoá của luật LMSvì luật LMSdễ dàng được viết
như sau:
(2.46) với
(2.47) tương ứng là lỗi chuẩn hoá, đáp ứng mong muốn chuẩn hoá và những đặc tính
ngõ vào chuẩn hoá Phương trình (2.65) là luật học LMSvới 2được thay
bởi Vì thế, cập nhật trọng số được thiết kế bởi luật LMStương đương với
giải thuật LMSvới sự hiện diện của một tập huấn luyện khác là tập huấn
luyện được chuẩn hoá định nghĩa bởi phương trình (2.66)
- 40 - Một phiên bản thời gian liên tục của giải thuật LMS ở trên có thể dễ dàng đạt được bằng cách tối thiểu hàm lỗi
(2.48)
là ước lượng tức thời của lỗi bình phương trung bình và wa(t) là một ước lượng của véctơ trọng số wa tại thời điểm t Áp dụng phương pháp giảm gradient độ dốc lớn nhất ta được:
(2.49)
Sơ đồ khối của việc thực thi giải thuật LMS thời gian liên tục dùng những
bộ nhân và tích phân tương tự được cho trong hình 2.12
2.5 Giải thuật lan truyền ngược cho mạng nơron truyền thẳng nhiều lớp(MFNN)
Bây giờ chúng ta sẽ nói về những giải thuật lan truyển ngược(BP) một cách chi tiết
Một mạng truyền thẳng nhiều lớp có khả năng xấp xỉ rất nhiều hàm phi tuyến với độ chính xác mong muốn, nó được khai thác rộng rãi trong các ứng dụng như những bài toán nhận dạng và điều khiển hệ thống, nhận dạng đặc tính Bây giờ chúng ta sẽ đề cập đến mô hình tổng quát và giải thuật học BP của MFNN
Hình 2.12 Sơ đồ khối của giải thuật LMS thời gian liên tục
Trang 21- 41 -
2.5.1 Cấu trúc nơron tổng quát cho MFNN
Trong một MFNN những nơron được tổ chức trong những lớp mà không có
đường hồi tiếp hay liên kết chéo Lớp thấp nhất của MFNN là lớp ngõ vào trong
đó những thành phần xử lý nhận tất cả những ngõ vào và ngõ ra cung cấp cho
những thành phần xử lý của lớp ẩn thứ nhất Lớp cao nhất của MFNN là lớp
ngõ ra Những ngõ ra từ một lớp bất kỳ sẽ chỉ truyền đến lớp cao hơn Mỗi cấu
trúc cơ bản của những MFNN với những kết nối truyền thẳng được thể hiện
trong hình 2.13
Chúng ta sẽ đánh số những lớp nơron từ lớp thứ nhất và gọi M là tổng số lớp
của MFNN gồm lớp ngõ vào, ngõ ra và lớp ẩn
Gọi nơron thứ I trong lớp thứ s được biểu thị bởi neuron(s,i) và ns là tổng số
nơron trong lớp thứ s Ngõ vào lớp thứ nhất ( lớp ngõ vào) là n
R
x Ngõ ra của lớp đầu tiên là một hàm phi tuyến của tổng những ngõ vào nhân hệ số, và
những ngõ ra này sẽ được truyền đến tất cả những đơn vị nơron trong lớp thứ
hai Quá trình này tiếp tục cho những lớp kế Những định nghĩa cơ bản cùng với
ý nghĩa được dùng trong MFNN được lập danh sách trong bảng 2.1 Xử lý tín
hiệu trong mỗi nơron đơn được cho trong hình 2.14
Hình 2.13 Một mạng nơron truyền thẳng nhiều lớp với lớp ngõ vào, ngõ ra và
- 42 - wjl(i)
Số lượng nơron trong lớp thứ i
Số lớp trong mạng
Hình 2.14 Thể hiện sơ đồ khối của neuron(i,j) trong lớp thứ i
Hình 2.15 Những hoạt động nhân trọng số và kết hợp trong neuron(i,j)
Về mặt toán học, những hoạt động này được xác định như sau:
(a) Hoạt động nhân trọng số:
(b) Hoạt động kết hợp
Phương trình thứ nhất thể hiện hoạt động nhân trong đó những tín hiệu sẽ được nhân bởi những trọng số trên đường kết nối và những phương trình thứ
Trang 22- 43 - hao và thứ ba thực thi hoạt động kết hợp gồm tổng của tất cả ngõ ra và ngưỡng
Hoạt động phi tuyến này được viết lại như sau:
ra thứ l của mạng Véctơ ngõ ra nhiều chiều từ lớp (i-1) sau đó được dùng trực
tiếp như véctơ ngõ vào của lớp thứ i
Những dạng đối số của những ngõ vào nơron và những trọng số nơron được
viết như sau:
Việc giới thiệu những véctơ ngõ ra đối số và những ma trận trọng số phụ
thuộc vào sự tồn tại của ngưỡng trong hàm kích hoạt nơron phi tuyến Với
những ký hiệu này, phương trình hoạt động và hàm truyền của mạng được viết
như sau:
(2.50)
Tổng trọng số nT trong một mạng MFNN được cho bởi:
với số hạng thứ nhất là số lượng của tất cả những trọng số kết nối và số hạng
thứ hai là số lượng của tất cả ngưỡng
Một thể hiện tường minh của mối liên hệ vào-ra của mạng với véctơ ngõ vào
n chiều x R n và véctơ ngõ ra m chiều y 1 , 1m được cho như sau:
- 44 -
(2.51)
với
Và
Thể hiện trên sơ đồ cùa ánh xạ tuyến tính này được cho ở hình 2.16
Hình 2.16 Ánh xạ tuyến tính được thực thi bởi mạng nơron truyền thẳng M lớp
Vì hàm kích hoạt phi tuyến .là liên tục và đạo hàm được hàm ánh xạ f(.) trong phương trình (2.41) là một hàm phi tuyến liên tục và đạo hàm được từ không gian vào đến không gian ra Vì thế, hàm ánh xạ phi tuyến f(.) chứa những trọng số kết nối có thể được xem như hàm ánh xạ nơron phi tuyến từ không gian đặc tính ngõ vào đến không gian đặc tính ngõ ra, nơi mà hàm ánh xạ này được hình thành thông qua quá trình học ngược với lập trình trước trong những phương pháp truyền thống Nói cách khác, trong cấu trúc MFNN, thông tin ngõ vào được truyền thẳng đệ quy đến những lớp ẩn cao hơn và cuối cùng là lớp ngõ ra Vì lý do này mà mạng được gọi là mạng lan truyền Vì quan hệ vào-
ra của một MFNN được mô tả bởi những phương trình đại số tĩnh, những ngõ
Trang 23- 45 -
ra mạng được tính khá dễ Những mạng MFNN là những mạng nơron tĩnh và
không có bất kỳ bản chất động nào Mặc dù phiên bản mở rộng của MFNN có
thể có tính động
2.5.2 Thiết lập giải thuật lan truyền ngược
Giả sử rằng ta đã có véctơ ngõ ra mong muốn d(k), thuật toán BP cho mang
MFNN sẽ tối thiểu hàm lỗi E là tổng bình phương của các sai lệch giữa ngõ
mong muốn d(k) và những ngõ ra mạng nơron thực sự y(k) đã đề cập ở trên,
được cho như sau:
(2.52) với
(2.53)
(2.54)
Hình 2.17 Giải thuật BP để thích nghi những trọng số wj(i) của nơron(i,j)
Điều kiện ban đầu để tính toán đệ quy là từ lớp ngõ ra như sau:
- 46 - (2.55) với
(2.56) với một nơron thì giải thuật học trọng số ở trên được cho trong hình 2.17 Và xử
lý tín hiệu thuận và ngược trong hình 2.18 Ở đây, đường thuận được dùng để lan truyền tín hiệu hàm ngõ vào trong khi những đường ngược được thiết kế để truyền những tín hiệu ngõ ra
Hình 2.18 Sơ đồ của quá trình lan truyền thuận của tín hiệu vào và ngược của
tín hiệu lỗi giữa lớp thứ i và lớp thứ (i+1)
2.5.3 Tính toán đệ quy cho s
Trang 24- 47 - Những công thức cập nhật được cho trong (2.52) - (2.56) gồm tính toán đệ quy
cho sdần dần từ lớp ngõ ra cho đến những lớp ẩn thấp hơn Khai triển những
phương trình trên bằng cách đạo hàm riêng phần sta được:
Gradient của E tương ứng với những véctơ trọng số là:
Trong đó toán hạng thứ hai bên tay phải chỉ phụ thuộc vào đặc tính của nơron
và không liên quan đến hệ số đo lỗi E Vì thế, từ:
Ta có được
(2.57) Điều này cho thấy đã rút được BP từ những phương trình (2.52)-(2.56) Trong suốt pha học BP như thế, mỗi thể hiện đặc tính trong những thành phần ngõ ra khác với những thành phần mong muốn Sau thể hiện toàn tập dữ liệu, những thông số mạng được sữa đổi được mô tả bởi những trọng số và ngưỡng
mà tối thiểu lỗi bình phương trung bình E
Thuật ngữ lan truyền ngược được dùng để thể hiện một giải thuật học có giám sát hoàn toàn với việc chọn lựa cụ thể hàm truyền nơron và luật cập nhật trọng số Nói cách khác, thật là tiện lợi để dùng nó khi thể hiện những thành phần đơn của giải thuật này mà xác định những đạo hàm riêng phần liên quan bằng lan truyền ngược Điều này đơn giản là một chuỗi những tính toán Vì thế, giải thuật lan truyền ngược là một giải thuật học có giám sát mà dùng lan truyền ngược để tính những đạo hàm riêng phần
2.6 Thiết lập giải thuật BP dùng nguyên tắc sai phân
Giải thuật học BP được xem như là một trong những chương trình học hiệu quả nhất cho MFNN Một lý do cho việc thành công của giải thuật này là tính đơn giản của nó Thực tế, giải thuật BP có nhiều ứng dụng hơn là chỉ trong chuỗi mắc xích và phương pháp giảm gradient
Có nhiều phương pháp để thiết lập giải thuật BP Cách đơn giản nhất được thể hiện ở phần trên Bên cạnh đó nguyên tắc sai phân cũng được dùng để đạt được những công thức giải thuật BP Phương pháp này lấy ý tưởng từ lý thuyết điều khiển tối ưu, mà dùng những bộ nhân Lagrange để tìm những giá trị tối ưu cho những biến điều khiển Tính toán sai phân có thể giúp chúng ta tìm một hàm mà tối thiểu hàm mục tiêu có những ràng buộc Một chương trình để đạt được giải thuật BP được thể hiện ở ngay phần sau
Trang 25- 49 -
2.6.1 Những điều kiện tối ưu
Một MFNN có M lớp nơron, những phương trình mạng hay hàm truyền của
những nơron trong những lớp khác nhau là:
Bài toán tối ưu thông số cho một công việc cụ thể được mô tả như sau:
(2.58)
Để giải bài toán trên, ta dùng phương pháp Lagrange
(2.59) với iR là những hệ số nhân Lagrange Như ta thấy L gồm hai toán hạng
Toán hạng đầu tiên là lỗi ngõ ra bình phương và toán hạng thứ hai phụ thuộc
vào những phương trình mạng mà cung cấp những ràng buộc cho những thông
số của MFNN Sai phân lần đầu ta được:
(2.60) Điều kiện cần là cho 0 sẽ xác định tối thiểu cục bộ cho hàm lỗi E tương
ứng với những phương trình ràng buộc mạng Điều kiện này mô tả hoàn toàn
ứng xử của mạng, suy ra những điều kiện tối ưu sau:
là những toán hạng gradient Phương trình thứ ba không thể hiện cập nhật trực tiếp trọng số, nhưng nó thể hiện điều kiện tối ưu cần phải thoả mãn
Dễ dàng thấy rằng (2.61) thể hiện những phương trình mạng Từ (2.62) ta có:
(2.64)
Và
(2.65) Phương trình tối ưu thứ ba (2.56) thể hiện:
(2.66) Nghĩa là
(2.67) Điều kiện này nói rằng những véctơ trọng số waj(i) tương ứng với điểm tĩnh L là một tối thiểu cục bộ hay một điểm yên ngựa
2.6.2 Cập nhật trọng số
Tìm một điểm cực tiểu của hàm lỗi tương ứng với những véctơ trọng số tương đương với tìm cực tiểu của L trong khi thoả mãn những phương trình mạng và phương trình (2.60) Những phương trình mạng (2.64) và (2.67) tạo thành một hệ thống hoàn chỉnh cho bài toán được thể hiện bởi một bài toán giá trị biên hai điểm Không có cách giải nào May mắn thay, phương pháp giảm gradient cung cấp giải thuật lặp trọng số sau:
(2.68) Thế kết quả này vào (2.59) và (2.60) ta được:
(2.69)
Trang 26- 51 - tương đương với những công thức cập nhật BP ở phần trước với những liên hệ
sau:
Rõ ràng chương trình này đơn giản hơn chương trình dùng phương pháp giảm
gradient và luật chuỗi
2.6.3 Chuyển đổi không gian thông số
Giải thuật BP dựa trên phương pháp giảm gradient thường được xem như là
một quá trình tìm kiếm lặp cho điểm cực tiểu của hàm lỗi trong không gian
trọng số Trong một vài trường hợp, điều thú vị là những trọng số không phải là
những biến độc lập mà là một hàm của vài thông số cơ sở trong không gian
thông số Những hàm dùng những thông số cơ sở được xem xét ở hai khía cạnh:
(1) điều này cho phép người thiết kế đưa những kiến thừc ưu tiên về công việc
vào trong mạng ( ví dụ một vài bất phương trình ràng buộc giữa vài trọng số để
làm cho đáp ứng của mạng bất biến với một vài loại tín hiệu nào đó) và (2) khi
không gian trọng số thiếu điều kiện hay quá phức tạp để tìm kiếm những hàm
truyền xấp xỉ có thể được dùng để cải thiện những đặc tính hình học của nó và
(2.70) Hay tương đương:
(2.71)
Vì thế, giải thuật lặp cho véctơ thông số đạt được như sau:
(2.72) Nghĩa là
(2.73)
2.7 Mô hình mờ Takagi-Sugeno và bù phân tán song song
Những năm gần đây những hệ thống điều khiển mờ dùng trong những ứng dụng
kỹ thuật đã phát triển nhanh chóng Một số lượng lớn những ứng dụng thành
- 52 - công của điều khiển mờ đã tạo nên những động lực để phân tích và thiết kế những hệ thống điều khiển mờ Trong phần này sẽ giới thiệu mô hình mờ Takagi-Sugeno và bù phân tán song song, một cấu trúc bộ điều khiển phù hợp với những mô hình mờ
Phần này sẽ bắt đầu với việc giới thiệu mô hình mờ Takagi-Sugeno (mô hình
mờ TS) và những chương trình để xây dựng những mô hình mờ như thế Vì thế việc thiết kế bộ điều khiển mờ dựa trên mô hình dùng khái niệm “bù phân tán song song” sẽ được mô tả sau đó Ý tưởng chính của việc thiết kế bộ điều khiển
là nhận được mỗi luật điều khiển bù mỗi luật của một hệ mờ
Hệ mờ liên tục:CFS Luật mô hình thứ i:
Nếu z1(t) là Mí và … và zp(t) là Mip thì
(2.74)
Hệ mờ rời rạc:DFS Luật mô hình thứ i:
Nếu z1(t) là Mí và … và zp(t) là Mip thì
(2.75)
Ở đây Mij là tập mờ và r là số luật mô hình; x(t) là véctơ trạng thái, u(t) là véctơ ngõ vào, y(t) là véctơ ngõ ra, Ai,Bi và Ci;z1(t),…,zp(t) là những biến giả thiết đã biết mà có thể là những hàm của những biến trạng thái, nhiễu bên ngoài và thời gian Chúng ta sẽ dùng z(t) để biểu thị véctơ chứa tất cả những thành phần riêng z1(t),…,zp(t) Chúng ta cũng giả sử rằng những biến giả thiết không là những hàm của những biến ngõ vào u(t) Điều này sẽ tránh quá trình mờ hoá phức tạp những bộ điều khiển mờ Và lưu ý rằng những điều khiển ổn định nhận được trong phần này cũng có thể áp dụng cho trường hợp biến giả thiết là hàm của
Trang 27- 53 - những biến vào u(t) Mỗi phương trình kết luận tuyến tính được thể hiện bởi
Aix(t)+Biu(t) được gọi là hệ con
Với môt cặp (x(t),u(t)) những ngõ ra cuối cùng của những hệ mờ được suy
luận như sau:
CFS
(2.76) DFS
(2.77)
với
- 54 -
(2.78) Toán hạng Mij(zj(t)) là độ liên thuộc của zj(t) trong Mij
2.7.2.1 Bù phân tán song song
Lịch sử của bù phân tán song song(PDC) bắt đầu với thủ tục thiết kế dựa trên
mô hình bởi Kang và Sugeno Tuy nhiên sự ổn định của những hệ thống điều khiển không được xem xét trong thủ tục thiết kế này Người ta đã cái tiến và tạo
sự ổn định cho những hệ thống điều khiển và đạt cho chương trình này cái tên
là bù phân tán song song
Bù phân tán song song đưa ra một thủ tục để thiết kế nột bộ điều khiển mờ từ
mô hình mờ T-S đã cho Một đối tượng được điều khiển (hệ phi tuyến) được thể hiện trước tiên bởi một mô hình mờ T-S Nhiều hệ thống thực chẳng hạn những
hệ cơ khí hay hệ hỗn độn có thể được thể hiện bởi những mô hình mờ T-S
Trang 28- 55 - Trong thiết kế PDC, mỗi luật điều khiển được thiết kế từ luật tương ứng của
một mô hình mờ T-S Bộ điều khiển mờ chia sẽ cùng tập mờ với mô hình mờ
trong phần giả thiết Sau đây ta sẽ xây dựng bộ điều khiển mờ qua PDC:
Hình 2.19 Thiết kế điều khiển mờ dựa trên mô hình
2.7.2.2 Luật điều khiển i:
Nếu z1(t) là Mi1 và … và zp(t) là Mip , thì u(t) = - Fix(t), i=1,2,…,r
Những luật điều khiển mờ có một bộ điều khiển tuyến tính ( luật điều khiển
hồi tiếp trạng thái) trong phần kết luận Ta cũng có thể dùng những bộ điều
khiển khác chẳng hạn những bộ điều khiển hồi tiếp ngõ ra và những bộ điều
khiển hồi tiếp ngõ ra động
Bộ điều khiển mờ toàn bộ được thể hiện như sau:
(2.81) Thiết kế bộ điều khiển mờ là xác định những độ lợi hồi tiếp cục bộ Fi trong
những phần kết luận Với PDC ta có một thủ tục đơn giản và tự nhiên để đạt
được những hệ thống điều khiển phi tuyến Những kỹ thuật điều khiển phi
tuyến khác đòi hỏi những kiến thức chuyên sâu và bao quát hơn
Cũng cần lưu ý rằng mặc dù bộ điều khiển mờ được xây dựng dùng cấu trúc
thiết kế cục bộ, những độ lợi hồi tiếp Fi cần xác định dùng những điều kiện thiết
kế toàn cục Những điều kiện thiết kế toàn cục là cần thiết để bảo đảm ổn định
toàn cục và hiệu suất điều khiển
- 56 -
2.7.3 Mô hình Neuro-mờ
Một lợi ích của những hệ thống mờ là cơ sở luật có thể được tạo từ kiến thức chuyên gia, dùng chỉ định những luật mờ để phân chia tất cả các biến và số lượng những luật mờ để mô tả liên hệ vào/ra của bài toán Tuy nhiên, một hệ thống mờ được xây dựng chỉ bởi kiến thức chuyên gia thường không thể hiện như mong muốn khi được ứng dụng vì chuyên gia có thể sai trong việc định vị trí của những tập mờ và số lượng quy luật Một quá trình tinh chỉnh thủ công cần được đưa vào tầng thiết kế mà kết quả là sẽ hiệu chỉnh những hàm liên thuộc và/hoặc cơ sở quy luật của những hệ thống mờ Quá trình tinh chỉnh này
có thể tốn rất nhiều thời gian và gặp rất nhiều lỗi Bên cạnh đó, trong nhiều ứng dụng kiến thức chuyên gia chỉ là những biến riêng phần và không phải là tất cả
Vì thế thật là hữu ích khi hổ trợ cho việc định nghĩa những cơ sở quy luật tập
mờ bằng những phương pháp học tự động mà sẽ sử dụng dữ liệu mẫu hợp lý Điều này là có thể vì khi chúng ta đưa những thành phần của hệ thống mờ vào trong định dạng thông số, những hệ thống suy luận mờ trở thành những mô hình thông số mà có thể được tinh chỉnh bởi một chương trình học Ý tưởng này chính là cơ sở cho mt neuro-mờ (Brown M and Harris C.J., 1994; Jang J-S.R and Sun C-T., 1993;Wang L and Mendel J.M., 1992a) với lý thuyết sau:
Lý thuyết Khi những toán hạng đại số được dùng để thực thi những hàm lôgic
mờ, những ngõ vào rõ được mờ hoá dùng mờ hoá đơn điểm và giải mờ trọng tâm được khai thác, ánh xạ vào ra của hệ thống mờ Mamdani có thể được thể hiện bởi một kết hợp tuyến tính của những hàm liên thuộc mờ ngõ vào được
chuẩn hoá:
(2.82) với K là số lượng luật và bk là tâm của những tập mờ Bk
Từ (2.82) ta có thể thấy rằng ngõ ra của hệ thống mờ Mamdani có thể được thể hiện đơn giản như một kết hợp tuyến tính của những hàm cơ bản phi tuyến (những hàm liên thuộc ngõ vào nhiều biến được chuẩn hoá), vì thế nó có thể được đề cập đến như là kỹ thuật mô hình cục bộ.(Add) Và ngõ ra của một hệ
mờ TS có thể được đề cập như là kết hợp tuyến tính của những những hàm liên thuộc ngõ vào nhiều biến được chuẩn hoá Thật ra, nếu một hệ mờ TS dùng chuẩn trung bình trọng số để kết hợp những thể hiện cục bộ, thì ngõ ra cho một ngõ vào x được tính như là tổng chuẩn hoá:
(2.83) Công thức (2.83)làm cho hệ mờ TS trở thành một ví dụ cụ thể của phương pháp cục bộ được tổng quát hoá với hk(.) là những mô hình cục bộ và những hàm cơ
bản là
Trang 29- 57 -
những hàm này sẽ xác định mô hình cục bộ nào là phù hợp với một ngõ vào cụ
thể được cho
Vì những hệ mờ có thể được xem như là một trường hợp đặc biệt của những
phương pháp mô hình cục bộ, với không gian ngõ vào được phân chia thành
một số lượng những vùng mờ được thể hiện bởi những hàm liên thuộc nhiều
biến Với mỗi vùng, một luật được định nghĩa mà có thể chỉ định ngõ ra của hệ
thống trong vùng đó Lớp các hàm có thể được tạo ra chính xác bởi mô hình
kết quả được xác định bởi ánh xạ phi tuyến được thể hiện bởi những hàm liên
thuộc mờ nhiều biến Kết quả này đã tạo được những ấn tượng mạnh khi so
sánh giữa những hệ mờ và những kỹ thuật truyền thống khác Nếu những hàm
liên thuộc hình chuông (Gauss) được dùng , thì một hệ mờ TS tương đương với
một loại mạng RBF đặc biệt (Jang J.-S and C.-T Sun, 1993) Những lý thuyết
và phân tích nhận được từ phương pháp mô hình cục bộ có thể được áp dụng
trực tiếp cho những hệ mờ Tương tự, những hệ mờ cũng cho phép ứng dụng dễ
dàng những kỹ thuật học được dùng trong những phương pháp cục bộ để nhận
dạng những luật mờ từ dữ liệu Mặt khác, những hệ mờ khác biệt với những kỹ
thuật mô hình cục bộ khác cho khả năng dễ dàng định trước cấu trúc và sự tích
hợp kiến thức ưu tiên
Nhiều giải thuật học từ lĩnh vực mô hình cục bộ và những kỹ thuật đặc biệt
hơn được phát triển cho vài loại mạng nơron được mở rộng để tinh chỉnh tự
động những luật mờ dựa trên dữ liệu hợp lý Những kỹ thuật này đã xem hệ mờ
như là một kiến trúc đặt lớp, tương tự như mạng nơron thông minh Bằng cách
như thế, hệ mờ trở thành hệ neuro-mờ-một kiến trúc mạng nơron đặc biệt Lin
và Lee (1991) đã lần đầu tiên đề xuất việc thực thi những mô hình mờ Mamdani
dùng kiến trúc truyền thẳng đặt lớp Vì thế, ví dụ nổi tiếng nhất của mạng
neuro-mờ là hệ suy luận mờ dựa trên mạng thích nghi(Adaptive
Network-based Fuzzy Inference System (ANFIS)) được phát triển bởi Jang
(1995), đã thực thi một hệ mờ TS trong một kiến trúc mạng, và ứng dụng hỗn
hợp của giải thuật lan truyền ngược và bình phương nhỏ nhất để huấn luyện hệ
Hình 2.20 là một ví dụ của một mô hình mờ với hai luật được thể hiện như một
đề (ở đây là toán hạng ‘và’) Nút chuẩn hoá N và nút tổngthực hiện toán hạng trung bình mờ
Một vài hệ neuro-mờ được đề xuất (Kosko B.,1992; Sun C., 1994; Halgamuge S.K and Glesner M., 1994; Lin Y and Cunningham III G.A., 1995; Shann J.J and Fu H., 1995; Kasabov N., 1996; Nauck D and Kruse R., 1996; Juang C.-F and Lin C.-T., 1998; Kim J and Kasabov N.,1999; Quek C and Zhou R.W., 1999) Hầu hết chúng dựa trên một cấu trúc kết nối tương tự như mạng nơron truyền thẳng nhiều lớp
2.7.4 Mô hình với những hệ neuro-mờ
Khi xem xét những mô hình mờ, có hai pha khác nhau cần được thực hiện đó
là nhận dạng cấu trúc và nhận dạng thông số Nhận dạng cấu trúc gồm có xác định cấu trúc của luật, ví dụ số luật và số tập mờ được dùng để phân chia mỗi biến trong không gian vào và ra để nhận được những tên biến ngôn ngữ Khi một cấu trúc đã thoả mãn, tiếp theo là cần phải nhận dạng thông số để tinh chỉnh vị trí của tất cả hàm liên thuộc cùng với hình dạng của chúng là những mối quan tâm chính
Như đã thấy trước đây, để giải quyết hạn chế của việc dùng những kiến thức chuyên gia khi định nghĩa những luật mờ, cần có những phương pháp dựa theo
dữ liệu để tạo những hệ mờ Với những phương pháp như thế cả thông số và cấu trúc nhận được chỉ phụ thuộc vào dữ liệu huấn luyện Có vài cách khác nhau mà học cấu trúc và học thông số có thể được kết hợp trong một hệ neuro-
mờ Chúng có thể thực hiện theo tuần tự: học cấu trúc được dùng trước tiên để cấu trúc thích hợp cho cho cơ sở luật mờ và sau đó học thông số được dùng để nhận dạng thông số của mỗi luật Trong vài hệ neuro-mờ, cấu trúc là cố định và chỉ có học thông số là được thực hiện Những thuật toán được phát sinh bởi học mạng nơron thường được dùng cho học thông số Học cấu trúc thường không xuất phát từ mạng nơron Có nhiều phương pháp khác nhau tồn tại để tự động xác định cấu trúc của mạng nơron, nhưng không có phương pháp nào thích hợp
để nhận dạng cấu trúc trong những mô hình neuro-mờ Trong phần sau đây sẽ thể hiện vài phương pháp khác nhau được dùng cho nhận dạng cấu trúc và thông số trong những mô hình neuro-mờ Trong đó nhiều phương pháp lấy ý tưởng từ những phương pháp mô hình hoá cục bộ Có rất nhiều kết hợp cấu trúc/ thông số để làm cho mô hình mờ trở nên thoả mãn, vì thế việc tìm kiếm
mô hình tốt nhất không phải là một công việc dễ dàng Thường thì, những mô hình mờ đơn giản được chuộng hơn so với những mô hình phức tạp, vì thế trong việc tìm kiếm mô hình tốt nhất cần xem xét hai mục tiêu chính là độ chính xác tốt và độ phức tạp tối thiểu
2.7.4.1 Nhận dạng thông số
Trang 30- 59 - Hai loại thông số đặc tính hoá một mô hình mờ: những thông số xác định
hình dáng và sự phân bố của những tập mờ ngõ vào và những thông số mô tả
những tập mờ ngõ ra (hay những mô hình tuyến tính)
Nhiều hệ neuro-mờ dùng tối ưu phi tuyến trực tiếp để nhận dạng tất cả thông
số của một hệ mờ Nhiều kỹ thuật tối ưu khác nhau có thể được dùng cho mục
đích này Được dùng rộng rãi nhất là một mở rộng của thuật toán lan truyền
ngược được thực thi bởi giảm gradient Một số lượng rất lớn những hệ
neuro-mờ dựa trên những thuật toán giống như lan truyền ngược để nhận dạng những
thông số của một hệ mờ, từ nổi tiếng nhất là ANFIS (Jang J-S.R., 1995) đến rất
nhiều những phương pháp được đề nghị trong (Lin C.T and Lee C.S.G., 1991;
Nomura H et al., 1992; Halgamuge S.K and Glesner M., 1994; Wang L and
Mendel J.M., 1992b; Shi Y et al., 1996; Shi Y.and Mizumoto M., 2000) Một
hạn chế của việc dùng những kỹ thuật giảm gradient là những hàm liên thuộc và
tất cả những hàm tham gia vào trong suy luận của cơ sở luật mờ phải đạo hàm
được Kết quả là, học giảm gradient có thể được ứng dụng dễ dàng để nhận
dạng thông số của một mô hình mờ bởi vì chỉ toán hạng tích được dùng cho
phần giao và ngõ ra được tính như là tổng trọng số Những phương pháp
neuro-mờ gần đây chọn việc thực thi lan truyền ngược bởi những phương pháp thực
nghiệm đơn giản thay vì giảm gradient để nhận dạng những thông số của mô
hình mờ loại Mamdani (Nauck D and Kruse R., 1995; Nauck D and Kruse R.,
1999) Ý tưởng chung của những phương pháp như thế là hiệu chỉnh từ từ
những hàm liên thuộc của một luật mờ theo đó bao nhiêu phân phối mà luật tác
động lên ngõ ra toàn bộ của hệ mờ
Những phương pháp khác để học thông số của những mô hình mờ không
yêu cầu tính toán gradient và vì thế không cần tính đạo hàm được, là học củng
cố (reinforcement)(Berenji H.R and Khedkar P., 1992; Berenji H.R., 1990) mà
chỉ yêu cầu tính giá trị vô hướng của ngõ ra và giải thuật di truyền (GA) thực
hiện việc tìm kiếm ngẫu nhiên trong không gian thông số, sử dụng một cộng
đồng những cá thể, trong đó mỗi cá thể mã hoá những thông số của một luật
mờ (Castellano G et al., 1998; Leitch D.D., 1995; Homaifar A and
McCormick E., 1995; Wong C.C and Feng S.M., 1995; Perneel C et al., 1995;
Lim M.H et al., 1996; Farag W.A et al., 1998) Một vấn đề với GA là với mã
hoá nhị phân truyền thống chiều dài của mỗi cá thể tăng theo số lượng ngõ vào,
số lượng tập mờ và số lượng luật Chiến lược tiến hoá (Evolution Strategies
(ES)) là kỹ thuật phù hợp hơn để tinh chỉnh những thông số luật mờ phụ thuộc
vào sơ đồ mã hoá trực tiếp của chúng.GA và ES cũng cho phép nhận dạng đồng
thời thông số và cấu trúc (số luật) của một mô hình mờ, nhưng trong trường hợp
như thế những kỹ thuật tính toán này yêu cầu tính toán rất phức tạp vì những cá
thể sẽ chứa rất nhiều vùng
Việc nhận dạng toàn bộ tập thông số bởi những kỹ thuật tối ưu phi tuyến có
thể yêu cầu tính toán nhiều, thời gian hội tụ lâu Để tăng tốc quá trình nhận
dạng thông số, nhiều hệ thống neuro-mờ tuân theo chương trình học nhiều tầng
để tìm và tối ưu những thông số Thường xem xét hai tầng Trong tầng đầu tiên
- 60 - không gian ngõ vào được phân chia thành những vùng bởi học không giám sát
và từ mỗi vùng những thông số giả thuyết ( và cuối cùng là kết luận) của một luật sẽ nhận được Trong tầng thứ hai những thông số kết quả được dự đoán bằng kỹ thuật học có giám sát Trong hầu hết trường hợp, tầng thứ hai cũng thực hiện việc tinh chỉnh những thông số giả thuyết đạt được trong tầng thứ nhất dùng những kỹ thuật tối ưu phi tuyến Hầu hết những kỹ thuật được dùng trong tầng đầu tiên thuộc một trong những loại sau:
2.7.4.2 Phân chia theo lưới
Với phương pháp này, miền của những biến ngõ vào được phân chia ưu tiên thành số lượng tập mờ được chỉ định Cơ sở luật sau đó được thiết lập để bao phủ không gian ngõ vào bằng cách dùng tất cả những kết hợp có thể của những tập mờ ngõ vào vì những tập mờ nhiều biến mô tả tiền đề của luật Những thông
số kết quả được dự đoán bằng phương pháp bình phương nhỏ nhất sử dụng dữ liệu vào-ra hợp lý Định dạng này cho những tập mờ nhiều biến sẽ hình thành những phần mắt lưới trong không gian ngõ vào, nơi mà mỗi sự kết hợp của những tập mờ đơn biến được định nghĩa theo những trục ngõ vào khác nhau được nhân với nhau Điều này bảo đảm rằng cơ sở luật trãi mỏng ra để cho một ngõ vào chỉ có một vài luật sẽ góp phần vào ngõ ra của mô hình Một ví dụ của phân chia không gian dựa trên lưới được cho trong hình 2.21
Hình 2.21 Một ví dụ phân chia ngõ vào dựa trên lưới Lợi ích của phương pháp này là rất nhiều tập mờ có thể diễn giải được tạo ra Tuy nhiên, nhược điểm rõ ràng của phương pháp này là số lượng tập mờ nhiều biến và vì thế là số lượng luật là một hàm mũ của những ngõ vào Điều này đã hạn chế việc dùng những mô hình mờ chỉ cho những bài toán có kích thước nhỏ( số lượng ngõ vào ít)
2.7.4.3 Phương pháp hướng cụm(cluster)
Phương pháp này cố gắng nhóm dữ liệu huấn luyện thành những cụm và
dùng chúng để định nghĩa những tập mờ nhiều biến mô tả phần giả thuyết của những luật mờ Những phương pháp hướng cụm phổ biến được dùng để tìm
Trang 31- 61 - tâm của những hàm liên thuộc nhiều biến là nhóm trung bình k(K-means
clustring)(Bezdek J.C and Pal S.K., 1992;Pedrycz W.,1984; Sugeno M and
Yasukawa T., 1994), ánh xạ đặc điểm tự tổ chức (SOM)(Kohonen T.,
1984;Farag W.A et al., 1998; M.-C Su and C.-Y Tew, 2000) và rất nhiều loại
học cạnh tranh (Chen J.-Q.and Xi Y.-G., 1998) Những giải thuật hướng cụm
mờ (Bezdek J., 1981; Bezdek J and Pal S.K., 1992; Baraldi A and Blonda P.,
1999) cũng được dùng để tạo những luật mờ bằng cách tìm kiếm những cụm
hình cầu hay siêu êlip Trong hướng cụm mờ, dữ liệu được nhóm thành những
cụm chồng nhau mà mức độ liên quan được diễn giải như là những giá trị liên
thuộc, vì thế những cụm này là những tập mờ chồng nhau nhiều chiều Mỗi cụm
mờ có thể được chuyển thành một luật mờ, bằng cách chiếu độ liên thuộc của
dữ liệu huấn luyện trên mỗi chiều (Klawon F and Kruse R., 1995; Sugeno M
and Yasukawa T., 1993; Babuska R., 1996) Tất cả phương pháp hướng cụm
tạo những hàm liên thuộc thông qua phép chiếu Trong khi những phương pháp
hướng cụm tạo ra sự phân chia linh hoạt tương ứng với những phương pháp dựa
trên lưới, phân chia mắt lưới của không gian ngõ vào bị bỏ qua và điều này sẽ
làm cho cơ sở luật không thể được diễn giải tốt Trong hình 2.22, việc chiếu
những cụm để đạt được những luật mờ sẽ hình thành những tập mờ vô nghĩa
chồng nhau và rất khó để diễn giải Cũng thế, trong trường hợp hướng cụm mờ,
phép chiếu sẽ làm mất thông tin vì tích Cartesian của những hàm liên thuộc sẽ
không tạo ra những cụm mờ chính xác Việc mất thông tin này mạnh nhất trong
trường hợp siêu êlip hướng bất kỳ
Hình 2.22 Một ví dụ của phân chia ngõ vào dựa trên hướng cụm Khi những
cụm được chiếu để tạo những luật mờ, việc mất thông tin xảy ra và có rất nhiều
tập mờ tương tự nhau
Để làm cho vấn đề này dễ dàng thao tác hơn thì khả năng là chỉ tìm kiếm cho
những siêu êlip trục song song Một hậu quả khác của phép chiếu cụm là với
mỗi biến những tập mờ được suy riêng lẻ cho mỗi luật và với mỗi đặc điểm sẽ
có nhiều tập mờ khác nhau vì số lượng cụm Một vài trong số những tập mờ
này là tương tự, và thường là không đồng nhất Để có một diễn giải tốt cần có
- 62 - một phân chia mờ của vài tập mờ và mỗi tập thể hiện rõ ràng một khái niệm ngôn ngữ Để loại bỏ sự thừa thải trên, việc đo độ tương tự có thể được dùng để
để đánh giá mức độ chồng nhau giữa những tập mờ kế cận và kết hợp những mà quá giống nhau (Chao C.T et al., 1996;Setnes M et al., 1998)
2.7.4.4 Nhận dạng cấu trúc
Trước khi những thông số luật mờ được tối ưu, cấu trúc của cơ sở luật mờ cần phải được định nghĩa Điều này gồm có xác định số lượng luật và tính chất của không gian dữ liệu, ví dụ số lượng tập mờ được dùng để phân chia mỗi biến Trong những hệ thống dựa trên luật mờ, như trong bất kỳ mỹ thuật mô hình hoá khác, có một sự cân bằng giữa độ chính xác và độ phức tạp Càng nhiều luật, càng tốt hơn sự xấp xỉ ánh xạ phi tuyến mà có thể đạt được bởi hệ
mờ, nhưng cũng có nhiều thông số hơn cần phải tính toán, vì thế chi phí và độ phức tạp sẽ tăng lên Một phương pháp hữu dụng để nhận dạng cấu trúc là thực hiện tìm kiếm từng bước xuyên qua không gian mô hình mờ Và một lần nữa, những chiến lược tìm kiếm này sẽ thuộc một trong hai nhóm sau: chọn lựa theo chiều thuận(forward selection) và loại bỏ theo chiều lùi(backward elimination)
Chọn lựa theo chiều thuận Bắt đầu từ một cơ sở luật rất đơn giản,
những luật mờ mới được thêm vào hay mật độ của những tập mờ tăng dần Một ví dụ của những kỹ thuật như thế được cho trong (Royas I et al., 2000)
Loại bỏ theo chiều lùi Một cơ sở luật mờ ban đầu, được xây dựng từ
một kiến thức ưu tiên hay bằng cách học từ dữ liệu, được giảm dần, cho đến khi điểm cực tiểu của hàm lỗi được tìm thấy Vài thuật toán lược bớt
đã hổ trợ việc giảm số lượng luật trong khi vẫn duy trì hiệu suất ban đầu được đề xuất trong (Shann J.J and Fu H., 1995; Castellano G and Fanelli A.M.,1996; Chao C.T et al., 1996; Yen J and Wang L., 1999; Pal N.R and Pal T., 1999; Wang X and Hong J., 1999; Nauck D., 2000) Cấu trúc của những luật mờ cũng có thể được tối ưu bằng GA để mà đạt được cơ
sở luật mờ chặt (Ishibuchi H et al., 1995)
Những thuật toán được đề nghị trong (Wu S and Er M.J., 2000) là một ví dụ của thích nghi cấu trúc trong những hệ neuro-mờ Những luật được tuyển và loại bỏ tuỳ thuộc vào tầm quan trọng của chúng đối với hiệu suất hệ thống, để
mà cấu trúc tinh giản nhất với hiệu suất cao được chọn Sự điều chỉnh cũng có thể được chọn để tìm cấu trúc tối ưu của những mô hình mở TS trong (Johansen T.A., 1996)
Khi những luật mờ ban đầu được tạo bằng cách hướng cụm, số lượng cụm (số luật) nên được chỉ định trước khi nhóm Nếu không có kiến thức ưu tiên nào
đề xuất số lượng cụm, một chương trình tự động có thể được ứng dụng Ví dụ,
số lượng cụm có thể được tìm thấy bằng cách tính giá trị đã cho, ví dụ một tiêu chuẩn để đánh giá chất lượng của các cụm và chọn số lượng cụm mà tối thiểu
Trang 32- 63 - (tối da) những giá trị đã cho Một phương pháp khác là kết hợp cụm, phương
pháp này bắt đầu với số lượng lớn những cụm và giảm chúng lần lượt bằng
cách kết hợp những cụm tương thích cho đến khi đạt được vài ngưỡng và không
có thêm cụm nào có thể kết hợp (Krishnapuram R and Freg C.-P., 1992;
Kaymak U and Babuska R., 1995)
2.7.5 Tính diễn giải được và độ chính xác của những mô hình neuro-mờ
Như chúng ta có thể thấy trong những phần trước, những hệ neuro-mờ về bản
chất là những hệ mờ mà có khả năng học của mạng nơron Những hệ mờ kết
nối những lợi ích của những phương pháp mô hình hoá hướng dự đoán và
những phương pháp mô hình hoá hướng hiểu được, cung cấp những mô hình
phù hợp cho cả dự đoán và hiểu Vì thế chúng ta cần xem xét khả năng những
lợi ích của những hệ mờ đối với mô hình dự đoán được giữ gìn khi chúng được
chuyển cho những hệ neuro-mờ
Bảng 2.2 Tính diễn giải được và độ chính xác trong những hệ mờ
Tính diễn giải được Độ chính xác
Ít thông số Nhiều thông số
Ít luật Nhiều luật
Mô hình Mamdani Mô hình TS Hai mặt của những hệ mờ dẫn đến một sự cân bằng giữa tính đọc được và độ
chính xác như trong bảng 1 Chúng ta có thể buộc những hệ mờ có được những
dự đoán chính xác bất kỳ, nhưng sẽ mất đi tính diễn giải được Để đạt được sự
chính xác, một hệ mờ cấn có không gian dữ liệu tốt và nhiều luật mờ Điều hiển
nhiên rằng khi số luật mờ càng trở nên lớn thì càng ít đi tính diễn giải được
Nếu chúng ta muốn giữ cho mô hình đơn giản, thì sự dự đoán càng ít chính xác
Để giải quyết sự cân bằng này , tính diễn giải được (cũng có nghĩa là tính đơn
giản) của một hệ mờ cần được xem như là lợi ích chính và vì thế nó cần được
theo đuổi nhiều hơn độ chính xác Sự thật thì những hệ mờ không phải là những
bộ xấp xỉ hàm hay bộ phân loại tốt hơn những phương pháp khác Nếu chúng ta
thích thú với dự đoán chính xác thì thường chúng ta sẽ không để ý nhiều đến
tính diễn giải được của bài toán Trong trường hợp này, chúng ta chỉ dùng một
đặc tính của những hệ mờ: sự kết hợp tiện lợi của những mô hình cục bộ cho
một cách giải toàn cục Với vấn đề này, mô hình loại Sugeno phù hợp hơn mô
hình loại Mamdani bởi vì chúng thường linh hoạt hơn trong những kết quả của
luật Tuy nhiên, nếu hiệu suất tối ưu là mục tiêu chính, chúng ta nên xem xét
nếu một hệ mờ là một phương pháp phù hợp nhất và có được sự so sánh ở mọi
khía cạnh và chuyên sâu với những phương pháp liên quan khác (những
phương pháp cục bộ và những phương pháp cục bộ được tổng quát hoá), khi đề
cập đến hiệu suất, sự tính toán và tính khả thi Tóm lại, những hệ mờ nên được
dùng cho mô hình dự đoán nếu một mô hình có thể diễn giải được là cần thiết
và cũng có thể được dùng để mở rộng dự đoán
- 64 - Vấn đề về tính diễn giải được của những hệ mờ được thảo luận trong (Bersini
H and Bontempi G., 1997a; Nauck D and Kruse R., 1998a; Nauck D and Kruse R., 1998b; Nauck D., 2000) với việc xem xét vấn đề cân bằng giữa tính diễn giải được của mô hình và độ chính xác Tính diễn giải được của một mô hình mờ không có nghĩa là có một kết hợp chính xác giữa mô tả ngôn ngữ của
mô hình và những thông số mô hình Tính diễn giải được có nghĩa là những người dùng mô hình có thể chấp nhận sự thể hiện của những thuật ngữ ngôn ngữ, nhiều hay ít hơn Sự thể hiện này nên tương ứng rõ ràng với hiểu biết trực giác của họ với những thuật ngữ ngôn ngữ Vì thế, tính diễn giải được không có nghĩa là bất kỳ người nào cũng có thể hiểu được mô hình mờ Nó có nghĩa là những người dùng có ít nhất những kiến thức chuyên gia trong khu vực mà mô hình dự đoán diễn ra có thể hiểu được mô hình
Vì chính tính diễn giải được cũng là một khái niệm mờ và chủ quan, thật khó
để tìm thấy một danh sách rõ ràng và thấu đáo những điều kiện, khi bị vi phạm, tạo cho mô hình mờ mất đi khả năng đọc của nó Chúng ta sẽ tóm tắt những hệ
số chính mà tác động đến tính diễn giải được của một hệ mờ:
Chọn lựa loại mô hình mờ: Những hệ mờ loại Mamdani được ưa
chuộng hơn loại TS, bởi vì những kết quả của luật bao gồm những tập
mờ có thể diễn giải được
Số lượng luật mờ:một hệ mờ với cơ sở luật lớn thì ít đi tính diễn giải so
với một hệ mờ chỉ cần vài luật
Số lượng biến ngõ vào:mỗi luật chỉ nên sử dụng vài biến như có thể
Số lượng tập mờ trên biến:Chỉ một lượng trung bình những tập mờ
được dùng để phân chia một biến Khi có quá nhiều nhãn ngôn ngữ thì sẽ tạo nên những khó khăn cho việc đọc được mô hình mờ, vì thế cần phải tránh trường hợp này
Thể hiện rõ ràng những toán hạng ngôn ngữ:mỗi toán hạng ngôn ngữ
nên được thể hiện chỉ với một tập mờ Những luật khác nhau dùng cùng một diễn giải ngôn ngữ (ví dụ x là nhỏ) có thể không thể hiện toán hạng ngôn ngữ tương ứng (ví dụ nhỏ) bởi những tập mờ khác
Đặc tính của những luật mờ:những luật mờ phải đầy đủ ví dụ với bất
kỳ ngõ vào nào, hệ mờ có thể tạo ra được câu trả lời Tập mờ cũng cần nhất quán, ví dụ không có những luật mâu thuẫn mà có cùng tiền đề nhưng khác kết luận Chỉ những không nhất quán riêng phần là được chấp nhận Và bất kỳ dạng dư thừa nào cũng cần phải tránh,ví dụ không
có những luật mà tiền đề là một tập con của tiền đề của một luật khác, và
không có luật nào xuất hiện nhiều hơn một lần trong cơ sở luật
Đặc tính của những tập mờ:những tập mờ nên có thể diễn giải được với
người dùng hệ mờ Điều này có nghĩa là những hàm liên thuộc nên bình thường, lồi và chúng nên bảo đảm một độ bao phủ hoàn toàn miền ngõ vào tương ứng, để mà người dùng có thể dán nhãn mỗi tập mờ bởi một
Trang 33- 65 - thuật ngữ ngôn ngữ Cũng cần tránh quá nhiều sự chồng nhau giữa những
hàm liên thuộc để có những tập mờ phân biệt
Những kỹ thuật mô hình neuro-mờ truyền thống và trong những phương
pháp dựa trên dữ liệu để học những luật mờ từ dữ liệu, được hổ trợ để tối ưu độ
chính xác dự đoán cho mô hình mờ Tuy nhiên,trong khi cải tiến độ chính xác
thì tính thông suốt của mô hình sau khi học có thể bị mất Sự chồng nhau của
những hàm liên thuộc tăng và những tình huống kỳ lạ có thể xảy ra, khi một vài
hàm liên thuộc có thể chứa trong những hàm khác hay những hàm liên thuộc
chuyển đổi vị trí của chúng Điều này cản trở tính diễn giải được của mô hình
cuối cùng Với mục đích là tính diễn giải được, chương trình học nên nhận ngữ
nghĩa học của mô hình mờ mong muốn là những đối số và bám vào những ràng
buộc nào đó, để mà nó không thể ứng dụng tất cả những sự hiệu chỉnh tiềm tàng
cho những thông số của hệ mờ Ví dụ những thuật toán học nên bị ràng buộc để
mà những hàm liên thuộc kế cận không thay đổi vị trí, không di chuyển từ phần
dương sang phần âm của miền hay ngược lại, có một độ chồng nhau nào đó
Trong (de Oliveira J.V., 1999) một tập bao quát những đặc tính ngữ nghĩa học
mà những hàm liên thuộc cần có để duy trì tính diễn giải được được quy định và
thêm vào một tập những ràng buộc được dùng trong một sơ đồ tối ưu có thể
thoả mãn những đặc tính này
Một yêu cầu quan trọng khác để đạt được tính diễn giải là làm cho cơ sở luật
nhỏ Một mô hình mờ với những hàm liên thuộc diễn giải được nhưng có số
lượng luật lớn sẽ xa rời tính diễn giải được Bằng cách làm giảm độ phức tạp,
ví dụ số lượng thông số của một mô hình mờ không chỉ quản lý được cơ sở luật
mà còn cung cấp mô tả quá trình dễ đọc hơn Và việc dùng cơ sở luật đơn giản
sẽ làm giảm overfitting, vì thế cải tiến sự tổng quát hoá
Gần đây, vài phương pháp học luật mờ dựa trên dữ liệu đã hỗ trợ việc cải tiến
tính diễn giải được của những mô hình mờ ở cả cơ sở luật nhỏ và những tập mờ
dễ đọc hơn Những ví dụ được cho trong (Chao C.T et al., 1996; Setnes M et
al., 1998; Y Jin et al., 1999; Y Jin, 2000)
2.8 Kết luận
Những mô hình mờ được xem như là những chuyển đổi ngôn ngữ của một
ánh xạ số và như là phương pháp mô hình hoá cục bộ mạnh Hai mặt này của
những hệ mờ đã dẫn đến việc phát triển những kỹ thuật mô hình hoá neuro-mờ
như là một phương pháp phá vỡ sự thiếu hụt của kiến thức chuyên gia và khai
thác những dữ liệu thực nghiệm để chiết xuất được mô hình trong định dạng
của những luật mờ Những hệ neuro-mờ về cơ bản là những hệ mờ với khả
năng-dựa trên những dữ liệu phù hợp- để bù cho những thiếu sót của kiến thức
con người bằng cách trích tự động những luật mờ từ dữ liệu dựa trên học thích
nghi được dùng trong mạng nơron
Lợi ích của mô hình hoá neuro-mờ là khả năng sử dụng cả kiến thức định
tính và kiến thức số Kiến thức định tính ở dạng cơ sở luật mờ mô tả cách ứng
- 66 -
xử của quá trình, trong khi kiến thức số là những dữ liệu quan sát được dùng để thực hiện mô hình dự đoán Mô hình kết quả mô tả những liên hệ quan trọng giữa dữ liệu ở cả định tính thông qua những luật mờ và định lượng qua những liên hệ đại số từng phần đơn giản
Hai điều trên có thể không tương thích ở một vài phạm vi, ví dụ việc tìm kiếm cho một mô hình có thể diễn giải được có thể được thực hiện mà phải trả giá bằng tổn hao hiệu suất trong xấp xỉ dữ liệu thực Vì thế cẩn phải lấp đầy khe hở giữa hai vấn đề trên Một hệ neuro-mờ hỗ trợ người dùng trong việc tìm kiếm những hệ mờ mong muốn dựa trên dữ liệu huấn luyện, nhưng nó không thể làm tất cả mọi việc Những vấn đề ngữ nghĩa học sẽ xảy ra nếu những hệ mờ không
có những cơ cấu để bảo đảm tất cả những thay đổi gây ra bởi chương trình học
có thể diễn giải được trong ngôn ngữ của những luật mờ Khi kiến thức ưu tiên duy trì tính dễ đọc, thì những ràng buộc thêm vào về cấu trúc và thông số là cần thiết Vì vậy, đầu tiên dùng bất kỳ thuật toán tối ưu để tinh chỉnh tự động cấu trúc và những thông số của mô hình mờ, việc định nghĩa rõ ràng mức độ dễ đọc của mô hình mờ cần được cho Khi được cung cấp định nghĩa này, việc duy trì tính diễn giải được yêu cầu hoặc là giảm bậc tự do của mô hình hoặc/và sử dụng một phương pháp tối ưu có ràng buộc mà bù cho tất cả những giải pháp
mà không diễn giải được
Từ những giới hạn được thảo luận ở đây, chúng ta thấy rõ rằng những phương pháp neuro-mờ cho phép xây dựng những mô hình mờ có thể diễn giải được và tinh giản nhất Đây cũng là động lực chính của luận án này mà những điểm chính là việc phát triển một phương pháp dựa trên dữ liệu để nhận dạng những mô hình mờ mà đảm bảo được độ chính xác và tính diễn giải được, vì thế chúng có thể được dùng để khám phá và thể hiện những mối liên hệ cơ bản trong dữ liệu Trong chương tiếp theo sẽ mô tả phương pháp luận chi tiết cho
mô hình neuro-mờ
Trang 34- 67 -
CHƯƠNG 3
PHƯƠNG PHÁP LUẬN MÔ HÌNH NEURO-MỜ
VÀ THUẬT GIẢI DI TRUYỀN
3.1 Giới thiệu
Động lực quan trọng nhất để dùng hệ mờ cho mô hình dự đoán là mô hình
được tạo ra được đặc tả bởi ngữ nghĩa phụ thuộc vào ngôn ngữ mà cho phép
con người hiểu dễ dàng Vì thế, những phương pháp để xây dựng những mô
hình mờ từ dữ liệu không chỉ được định hướng để tìm sự xấp xỉ tốt nhất cho dữ
liệu mà còn quan trọng hơn, chúng nên chiết xuất kiến thức từ dữ liệu trong
định dạng những luật mờ mà có thể dễ dàng hiểu và diễn giải Vì thế, những
thuật toán nhận dạng những mô hình mờ chính xác và diễn giải được cần được
triển khai Đây là công việc chính được mô tả trong chương này
Như được mô tả trong phần trước, có hai thiết kế chính được dùng cho mô
hình hoá mờ: nhận dạng cấu trúc và thông số của cơ sở luật mờ Độ chính xác
và tính diễn giải được của mô hình mờ được trích phụ thuộc vào những định
nghĩa hoàn hảo của hai hệ số này
Hầu hết những phương pháp mô hình mờ tự động và những phương pháp
neuro-mờ đặc biệt chú trọng độ chính xác và bỏ qua tính diễn giải được để mà
những mô hình kết quả thường không có điểm chung so với mô hình mờ ban
đầu Điều này tạo nên những khó khăn chính trong việc hình thành mô tả toán
học của khái niệm thông suốt và diễn giải ngôn ngữ của những luật mờ Hiện
thời, không tồn tại những định nghĩa được thiết lập tốt cho tính diễn giải được
của một hệ mờ Để đối phó với khó khăn này, nhiều tác giả đã cố gắng tìm
những điều kiện hợp lý mà tính diễn giải được của một hệ mờ phải thoả Chúng
ta thấy rằng tính diễn giải được của một mô hình mờ phụ thuộc vào hai khía
cạnh chính:độ phức tạp của cơ sở luật mờ ( ví dụ số luật) và tính dễ đọc của
những tập mờ được dùng trong những luật mờ
Đầu tiên, số lượng luật là điều kiện cốt yếu để đạt được diễn giải ngôn ngữ
mô hình mờ Vì thế, vấn đề tìm kiếm cân bằng giữa độ phức tạp (kích thước cơ
sở luật) và độ chính xác của mô hình mờ cần phải được chú ý nhiều Điều này
có nghĩa là phương pháp mô hình mờ dựa trên dữ liệu có thể tối thiểu cả lỗi
ngõ ra và độ phức tạp mô hình kết quả Nguyên tắc cơ bản này của mô hình tinh
giản là yêu cầu cơ bản cho tất cả những kỹ thuật mô hình hoá hỗ trợ tính diễn
giải được và khả năng tổng quát hoá Tuy nhiên, nhiều kỹ thuật thiết kế
neuro-mờ chỉ quan tâm đến nhận dạng thông số và bỏ qua nhận dạng cấu trúc, vì thế
không được tối ưu hay biến đổi
Thứ hai, với những luật mờ dễ dàng hiểu phân chia mờ nên hoàn toàn và
phân biệt để mà ý nghĩa vật lý (thuật ngữ ngôn ngữ) có thể liên quan với mỗi
- 68 - tập mờ trong vùng chia Có vài trường hợp mà phân chia mờ của vài biến ngõ vào không còn đầy đủ và phân biệt sau khi những hàm liên thuộc mờ được tối
ưu Sau khi học từ dữ liệu, ý nghĩa vật lý của vài tập mờ có thể không còn rõ ràng, điều này có nghĩa là chúng thiếu độ phân biệt và phân chia mờ trở nên không đầy đủ Hình 3.1 thể hiện hai ảnh hưởng không mong muốn này Mặc dù những ảnh hưởng này khá dễ dàng giải thích bởi vì tất cả những thuật toán tối
ưu đều cố gắng hiệu chỉnh phân bố của những hàm liên thuộc theo sự phân bố của tập dữ liệu, chúng xần phải tránh vì chúng sẽ làm cho việc diễn giải những luật được tạo khó khăn Cụ thể, tính phân biệt của những tập mờ là điều đầu tiên cần xem xét để cải tiến tính diễn giải của một hệ mờ
Hình 3.1 Hai ảnh hưởng chính khi những luật mờ được học từ dữ liệu: (a) Phân chia mờ không đầy đủ (b) thiếu tính phân biệt Trong luận án này đề xuất một phương pháp luận dựa trên dữ liệu để mô hình hoá neuro-mờ Để nhận được một mô hình mờ chính xác cũng như diễn giải được từ dữ liệu số, người ta đã định nghĩa phương pháp mô hình ba pha Theo phương pháp neuro-mờ, một mạng nơron được đề xuất thực thi hệ mờ,
để việc nhận dạng cấu trúc và thông số của cơ sở luật mờ được thực hiện bằng cách định nghĩa, thích nghi và tối ưu tôpô và những thông số của mạng neuro-
mờ tương ứng chỉ dựa trên những dữ liệu hợp lý Mạng này được xem như là một hệ thống suy luận mờ thích nghi với khả năng học những luật mờ từ dữ liệu
và như là một kiến trúc kết nối được cung cấp ý nghĩa ngôn ngữ Những luật
mờ được trích từ những ví dụ huấn luyện bởi một sơ đồ học lai gồm ba pha chính:
1 Cho cấu trúc và thông số giá trị ban đầu để nhận được một mô hình mờ
mà có thể được ứng dụng cho cả nhận dạng và phân loại Phần 3.3 mô tả kiến trúc mạng nơron được dùng để thực thi mô hình mờ trên và trong phần 3.4 giới
Trang 35- 69 - thiệu sơ đồ học theo tầng Sau đó ba pha học của chiến lược học được mô tả chi
tiết trong các phần 3.5,3.6 và 3.7 Kết luận được tóm tắt trong phần 3.8
3.2 Hệ mờ ứng cử
Trong phần này chúng ta trình bày cơ sở của sơ đồ lập luận mờ mà có thể ứng
dụng cho cả những bài toán nhận dạng và phân loại
Giả sử một tập huấn luyện , N t1
N x t y t
D gồm N dữ liệu vào-ra mô tả cách ứng xử của một quá trình Véctơ ngõ vào x=(x1,…,xn) thể hiện những biến
độc lập trong trường hợp nhận dạng hay là véctơ đặc tính trong trường hợp bài
toán phân loại Véctơ ngõ ra y=(y1,…,ym) thể hiện những biến phụ thuộc trong
trường hợp nhận dạng hay những giá trị liên thuộc phân loại rõ trong trường
hợp phân loại Với bài toán nhận dạng mục đích là nhận được một mô hình mà
mô tả những giá trị của những biến phụ thuộc (y1,…,ym) khi cho giá trị của
những biến độc lập (x1,…,xn) Với công việc phân loại, mục đích là nhận được
một mô hình mà gán đặc tính x cho một trogn m lớp dựa trên những giá trị đặc
điểm của nó Trong cả hai trường hợp chúng ta phải xấp xỉ một hàm chưa biết
mà ánh xạ những biến vào thành những biến ra:
(3.1)
Đề mô hình sự phụ thuộc (4.1) giữa những biến vào và biến ra, chúng ta xem
xét những luật mờ theo dạng sau:
Nếu (x1 là A1) và …(xn là An) thì (y1 là b1k) và …(ym là bmk)
với k=1,…,K trong đó K là số luật mờ, Aik(i=1,…,n) là những tập mờ được
định nghĩa qua những biến vào xi và bjk (j=1…m) là những singleton mờ được
định nghĩa trên những biến ra yj Vì thế một mô hình mờ singleton được chấp
nhận ở đây
Những loại hàm liên thuộc khác nhau có thể được dùng cho những tập mờ
tiền đề Trong luận án này, những hàm liên thuộc Gauss được dùng vì chúng sở
hữu nhiều đặc tính mong muốn lý tưởng để thể hiện những hàm liên thuộc mờ
trong những ứng dụng mô hình :
Chúng là những hàm bình thường, một trạng thái và trơn;
dạng toán học được thông số hoá của chúng hổ trợ việc tính toán và lập
trình;
chúng khá lý tưởng để thể hiện những nhãn ngôn ngữ mờ, phổ biến hơn
những hàm tam giác và hình thang;
Chúng sở hữu một đáp ứng cục bộ mặc dù chúng không phải là tập đóng
hoàn toàn;
Chúng có thể đạo hàm bất kỳ nơi nào, một đặc tính hữu ích cho học dựa
trên những kỹ thuật giảm gradient
Loại hàm Gauss được dùng cho những tập mờ Aik có dạng
;
;
ij ij j ij
ij j A
c x c
x
(3.2) với cij và ij là tâm và độ rộng của hàm Gauss
Dựa trên một tập gồm K luật, ngõ ra của bất kỳ véctơ ngõ vào x(0) đạt được bằng chương trình lập luận mờ sau:
1 Tính độ đáp ứng của luật thứ k, với k=1…K bằng toán hạng tích
(3.3)
2 Tính ngõ ra suy luận ˆy j 0 bằng cách lấy trung bình trọng số của những giá trị kết quả bjk tương ứng với cường độ kích hoạt luật k 0:
(3.4)
Hệ suy luận mờ có thể được tổng hợp như một hàm .,. được định nghĩa trên không gian ngõ vào X và không gian thông số W theo cách sau: (3.5) Với bài toán nhận dạng, đặc tính ánh xạ trong (3.5) giảm thành:
Ví dụ ngõ ra suy luận ˆ y j 0 , 1 thể hiện độ liên thuộc của đặc tính x thuộc lớp
Cj Điều này sinh ra phân loại “mềm” Ngược lại, công việc phân loại rõ có thể được thể hiện như một ánh xạ:
E
X
: (3.7) với
(3.8)
để mà x(0) thuộc lớp C l xe l
Để đạt được một phân loại “cứng” (rõ) từ một bộ phân loại mờ, một bước tính toán khác cần có sau quá trình suy luận để mà bộ phận cao nhất véctơ ngõ ra được ánh xạ đến 1 trong khi những bộ phận khác được ánh xạ đến 0 Để làm điều này, một đặc tính x(0) được gán cho lớp Cl để mà đặc tính đúng:
x(0) thuộc lớp C l j 1 , ,m yˆl 0 yˆj 0(với những lớp có cùng giá trị liên thuộc, một giá trị ngẫu nhiên được chọn) Để hình thành việc chuyển mờ đến rõ của kết quả phân loại chúng ta định nghĩa hàm sau:
m E
1 , 0 :
(3.9)
Trang 36- 71 - với 1m biểu thị véctơ đơn vị m chiều và những hàm max(.) và m .,.được định
nghĩa như sau:
R
R m
: max (3.10)
Và (3.11)
(3.12)
Để đơn giản, vai trò của hàm . là để chọn thành phần cao nhất của một véctơ
m chiều và đặt nó là 1, trong khi những thành phần khác là 0 Bằng cách ứng
dụng hàm . đến kết quả suy luận của bộ phân loại mờ, chúng ta có được kết
quả phân loại rõ Vì thế, một bộ phân loại mờ được chuyển thành một bộ phân
loại rõ bằng cách tổng hợp các hàm . và .,.,để mà hàm phân loại đích .
được xấp xỉ bởi hàm hợp:
E W
: (3.13) Trong phần sau chúng ta sẽ chỉ định hệ mờ bởi hàm .,. được định nghĩa trong
(3.5), cả cho bài toán nhận dạng và phân loại Hàm hợp (3.13) sẽ chỉ được dùng
khi sự tách biệt là cần thiết
3.3 Mạng neuro-mờ
Hệ mờ được giới thiệu bên trên có thể được xem như một hệ gồm:luật, những
tập mờ được dùng trong những luật này và những hoạt động suy luận mờ, chỉ
có một phần mà có thể được định nghĩa thông qua việc học là cấu trúc của cơ sở
luật (được định nghĩa với thuật ngữ là số lượng luật) và những thông số giả thiết
và kết luận liên hệ với luật Bài toán có thể được phát biểu theo một cách chính
xác là tìm một cấu hình hoàn hảo của những hàm liên thuộc và tạo ra một tập
những luật mờ từ tập dữ liệu DN của N cặp vào-ra để mà hệ mờ .,. xấp xỉ gần
nhất với hàm chưa biết f(.) sử dụng cân bằng giữa độ phức tạp và chính xác của
cơ sở luật
Để làm được điều này, hệ mờ được thực thi dùng mạng nơron Mạng nơron
này mã hoá một tập những luật mờ thành tôpô của nó và xử lý thông tin theo
cách mà gắn kết với sơ đồ lập luận mờ Mạng neuro-mờ được đề xuất là một
kiến trúc truyền thẳng
Thông số
Không gian thông số có thể hiệu chỉnh của mạng, được biểu thị bởi W, gồm
không gian con những thông số giả thiết WP và không gian con những thông số
kết luận WC Chúng ta có,
W=WPWC (3.14) với (3.15)
những véctơ thông số giả thiết véctơ thông số kết luận
3.4 Thuật toán học lai
Những mô hình neuro-mờ tự động chiết một mô hình mờ (ví dụ, một tập những luật mờ) sử dụng những thông tin hợp lý là một tập những cặp vào-ra mong muốn Những luật được tạo để mà mô hình kết quả có thể thể hiện đủ ánh
xạ với tập dữ liệu được cho, với cả thuật ngữ dự đoán và mô tả Nói cách khác, mục đích chính của phương pháp đề xuất là đạt được mô hình mờ mà có cả độ chính xác (ví dụ với khả năng tổng quát hoá tốt) và tính diễn giải được (ví dụ dễ dàng hiểu bởi người dùng) Mô hình mờ nhận được hoàn toàn từ dữ liệu thông qua học của mạng nơron Thuật toán học dựa trên một sơ đồ lai gồm ba pha:
1 Khởi đầu thông số và cấu trúc Trong pha học đầu tiên,cấu trúc và
thông số ban đầu của mạng được thiết lập Trong hầu hết các phương pháp neuro-mờ đang tồn tại, một số lượng khá thích hợp những luật mờ
và những luật mờ và những hàm liên thuộc (kích thước của tôpô mạng), cùng với những giá trị ban đầu của thông số luật (trọng số mạng) được xác định đồng thời mà không cần phải có sự đánh giá của người vận hành, vì thế cho phép xây dựng cơ sở luật theo cách tự tổ chức Mục đích của tầng đầu tiên này là có được một tập hợp những luật mờ là xấp xỉ đầu
tiên của mô hình mờ
2 Tinh chỉnh thông số toàn cục Trong pha học thứ hai, tất cả các thông
số của những luật mờ được tinh chỉnh phù hợp bằng kỹ thuật giảm gradient với nỗ lực tăng độ chính xác của mô hình mờ chẳng hạn để tìm
sự vừa khít tốt nhất với dữ liệu
3 Tối ưu thông số và cấu trúc Tầng mô hình thứ ba được hỗ trợ để cải
tiến tính diễn giải được của mô hình mờ kết quả Đạt được điều này bằng cách giàm số lượng luật thông qua một chương trìn tối ưu cấu trúc và bằng cách ép những ràng buộc trên những hàm liên thuộc ngõ vào thông
qua tinh chỉnh thông số cục bộ
Toàn bộ chương trình học được thể hiện ở hình 3.2 Mỗi khối biểu đồ thể
hiện một tầng học, sẽ được mô tả chi tiết trong những phần sau
Trang 37- 73 -
3.5 Khởi đầu thông số và cấu trúc
Trong pha học đầu tiên, một cơ sở lậu mờ ban đầu được tạo tự động từ dữ liệu
đã cho Vì thế, pha này có mục đích là tìm đồng thời số luật ( và số lượng tập
mờ ngõ vào được dùng để phân chia những miền ngõ vào) và những thông số
định nghĩa phần giả thiết và kết luận của mỗi luật
3.5.1 Phân chia không gian ngõ vào
Bước đầu tiên của phương pháp là phân chia không gian ngõ vào thành những
miền con Chiếu những miền này dọc theo những chiều ngõ vào khác nhau sẽ
nhận được những hàm liên thuộc trong phần giả thiết của mỗi luật Vì thế, cả số
lượng luật và những thông số giả thiết của chúng có trực tiếp từ quá trình phân
chia
Để tìm được phân chia thích hợp không gian ngõ vào, chúng ta định nghĩa ba
phương pháp mà sẽ được trình bày chi tiết trong phần sau
3.5.1.1 Cây K-D mờ thích nghi
Trong phương pháp đầu tiên này sẽ đề xuất thuật toán cây K-D mờ thích nghi
Những cây K-D ban đầu được phát triển như là một cơ cấu lưu trữ dữ liệu hiệu
quả (Orenstein J.A., 1982; Overmans M.H and Leeuwen J.V., 1982), là một
giải thuật nổi tiếng để phân chia cục bộ không gian ngõ vào thành những tập
con Thuật giải cây K-D sẽ lặp lại việc phân chia không gian nhiều chiều thành
những siêu hình chữ nhật bằng cách chia cắt liên tục các trục trực giao Mỗi lần
chia cắt sẽ được thực hiện qua toàn bộ miền của một miền đang có và tạo ra hai
miền mới mà chính chúng cũng lại được chia cắt sau đó Một cấu trúc cây xác
định được tạo ra mà những lá của nó thể hiện những vùng cục bộ của không
gian ngõ vào Hình 3.3 mô tả bốn vòng lặp đầu tiên của một cây giải thuật k-d
Những ý tưởng gần đây nhất đã mở rộng để tạo ra những cây k-d mờ để nhận
dạng thông số những hàm liên thuộc mờ hình thang cho những mô hình mờ TS
Trong những trường hợp như thế, những giá trị liên thuộc được liên kết với mỗi
phần chia có được từ việc phân chia để mà mỗi siêu hình chữ nhật có thể được
xem như phần của những tập mờ nhiều biến Chính xác hơn, tâm của mỗi hình
chữ nhật chính là tâm của mỗi hàm liên thuộc Gauss Độ rộng của hàm này
được chọn tỉ lệ với kích thước của siêu hình chữ nhật
Theo sau những ý tưởng này, chúng ta sẽ phát triển một thuật toán cây k-d
mờ thích nghi mà lặp lại việc phân chia không gian ngõ vào thành những vùng
con siêu hình chữ nhật, với mỗi vùng con thể hiện phần giả thiết của luật mờ
Thuật toán làm việc như sau Tại mỗi lần lặp, một vùng con được phân chia
thành hai nữa vùng con Khi bắt đầu bước thứ K, không gian ngõ vào được
phân chia thành K siêu hình chữ nhật Sau đó, việc phân chia lại được áp dụng
- 74 - cho một trong những siêu hình chữ nhật để phân chia toàn bộ vùng thành K+1 phần
Hình 3.2 Sơ đồ học ba pha
Hình 3.3 Phân chia không gian hai chiều bằng cây k-d
Có rất nhiều cách để quyết định miền nào được phân chia và nơi phân chia tại mỗi bước Một vài cách chỉ dựa trên phân bố của ví dụ huấn luyện Phương