Luận văn Thạc sĩ ngành Điều khiển tự độngĐHBKHN Mạng điều khiển Fuzzy và Neural

Cần phải đạt được những đòi hỏi điều khiển tăng nhanh trong những hệ thống điều khiển động phức tạp dưới những thay đổi quan trọng đã làm cho việc dùng những kỹ thuật thông minh như mạng

Trang 1

- 1 -

MỞ ĐẦU

Những kỹ thuật điều khiển truyền thống như điều khiển Tích phân tỉ lệ(PI)

hay điều khiển Vi tích phân tỉ lệ(PID) được ứng dụng thành công trong điều

khiển những quá trình tuyến tính Gần đây, điều khiển tiên đoán mô hình

(MPC) cũng thực hiện thành công trong điều khiển những hệ thống tuyến tính

Tuy nhiên, khoảng 90% những quá trình sinh học và hoá học là phi tuyến cao

và hầu hết chúng là những hệ MIMO.Khi hệ thống là phi tuyến và/hoặc MIMO,

những kỹ thuật truyền thống trên thường mắc phải sai sót khi điều khiển những

hệ thống như thế Ngày nay, những hệ thống được dùng trong công nghiệp đòi

hỏi độ tự quản cao và những kỹ thuật trên không có khả năng để đạt được điều

này

Cần phải đạt được những đòi hỏi điều khiển tăng nhanh trong những hệ thống

điều khiển động phức tạp dưới những thay đổi quan trọng đã làm cho việc dùng

những kỹ thuật thông minh như mạng nơron, lôgic mờ và thuật giải di truyền

trong những hệ thống điều khiển trở nên hấp dẫn Những lý do chính đằng sau

điều này là khả năng của chúng có thể “học” để xấp xỉ hàm và phân loại mẫu và

tiềm năng của chúng trong thực thi phần cứng song song đồ sộ, phương pháp

điều khiển thông minh phỏng theo quá trình xử lý thông tin không rõ ràng và ra

quyết định điều khiển của con người cũng như bắt chước quá trình tiến hoá sinh

học để tạo ra giải pháp tối ưu Nói cách khác, chúng có khả năng thực thi (cả

phần mềm và phần cứng) nhiều chức năng cần thiết để điều khiển hệ thống với

độ tự quản cao

Sơ đồ hệ thống điều khiển được mô tả như sau:

Hình i Sơ đồ điều khiển đối tượng phi tuyến

Như vậy, ở đây có hai bộ điều khiển:

Kết quả mô phỏng cho thấy sơ đồ điều khiển trên đã lái đối tượng phi tuyến đi xuyên suốt khoảng công tác của nó với độ chính xác cao

Phần sau đây sẽ đề cập đến đối tượng phi tuyến và những kỹ thuật điều khiển được thiết lập trong luận văn

Trong bối cảnh hiện thời, việc sản xuất năng lượng đối mặt với rất nhiều vấn

đề khó khăn Trong số đó, điều quan trọng nhất là: tuổi thọ của thiết bị chính tại những tổ hợp năng lượng, đầu tư tài chính không chắc chắn cho những tổ hợp mới, việc cạnh tranh giữa những nhà sản xuất năng lượng độc lập để thoả mãn đòi hỏi năng lượng của người dùng và những áp lực để đạt được những yêu cầu quản lý nghiêm ngặt để sử dụng tối đa nguồn tài nguyên thiên nhiên và tối thiểu ảnh hưởng đến môi trường

Việc vận hành của tổ hợp năng lượng nhiên liệu than (NLNLT), loại tổ hợp được dùng rộng rãi nhất cho việc sản xuất năng lượng, đã bị tác động mạnh Đầu tiên, một NLNLT phải hổ trợ mục tiêu chính của hệ thống năng lượng là đáp ứng yêu cầu tải cho năng lượng điện ở mọi thời điểm, ở điện áp không đổi

và tần số không đổi Sau đó là việc cạnh tranh giữa tính thiết thực và yêu cầu thị trường khác đã tăng cường việc dùng NLNLT [Armor 1985] Cuối cùng, những yêu cầu nghiêm ngặt trong việc bảo trì và kéo dài tuổi thọ của thiết bị chính và những luật giảm ảnh hưởng đến môi trường cần phải được tuân thủ Trong đó:

 Những yêu cầu vận hành chu kỳ của NLNLT trong khoảng tải rộng mặc

dù chúng được thiết kế cho vận hành ở tải không đổi Những yêu cầu biến đổi tải có thể đến từ những chiến lược kinh tế được tính toán tại những trung tâm năng lượng hay từ những dao động tải hệ thống Vận hành theo tải tin cậy và hiệu quả sẽ đảm bảo việc thoả mãn hàng ngày, hàng tuần và theo mùa của yêu cầu năng lượng điện và những thay đổi tải ngẫu nhiên không đoán trước cho đến những giới hạn vật lý của tổ hợp

 Việc kéo dài tuổi thọ thiết bị là quan trọng vì nó tối đa việc dùng tài sản, giới hạn thời gian chết và tối thiểu những chi phí vận hành và bảo trì Nguyên nhân chính của vòng đời ngắn của bất kỳ hệ thống nào là vận hành ứng suất cao Trong NLNLT, những ứng suất nhiệt phụ thuộc vào những dao động áp suất và nhiệt độ hơi là đặc biệt quan trọng Hầu hết ứng suất nghiêm trọng xảy ra trong suốt quá trình khởi động và những biến đổi tải lớn đột ngột

Trang 2

- 3 -

 Một NLNLT có hiệu suất trong khoảng 30 đến 35%, nghĩa là tốc độ nhiệt

trong khoảng 11400-9800 Btu/KWh Tốc độ nhiệt chịu ảnh hưởng bởi

nhiều hệ số, chẳng hạn những điều kiện hơi, áp suất bộ ngưng tụ, nhiệt độ

nước làm mát, nhiệt độ môi trường, khí áp,…Tốc độ nhiệt tăng khi làm

việc tại những tải khác với tải cơ sở Việc tiêu tốn nhiên liệu và giá cả

làm cho việc cải tiến tốc độ nhiệt như là một tiêu chuẩn về mặc kinh tế

 Việc trộn không hoàn hảo giữa không khí và nhiên liệu sẽ làm vượt quá

lượng không khí để tránh việc nhiên liệu không được đốt hết, mà sẽ dẫn

đến việc tạo khói đen và khí CO độc cũng như những lượng nhiên liệu dư

khá nguy hiểm Bên cạnh đó lượng không khí dư sẽ dễ hình thành những

chất không mong muốn khác như sunfua dioxit, nitrogen oxit và làm

giãm hiệu suất boiler do nhiệt bị tiêu phí trong khí nhiên liệu

Tấ cả những yêu cầu được đề cập ở trên đã dẫn đến việc phát triển những

phương pháp điều khiển linh hoạt và toàn diện hơn Chúng cũng cung cấp

những chức năng cần thiết cho việc vận hành theo tải diện rộng chất lượng cao

và đồng thời cũng thoả mãn những ràng buộc trong việc bảo quản và kéo dài

tuổi thọ của thiết bị chính, giải phóng chất ô nhiễm và tiêu tốn nhiên liệu dưới

những thay đổi vật lý và những điều kiện kinh tế Do đó, ngay cả khi theo tải

cũng cần xem xét việc ổn định tần số và điện áp, những hệ thống điều khiển

hiệu quả hơn cũng cần được thiết kế để thoả mãn tối ưu những mục tiêu vận

hành, những xung đột tổng quát để mà NLNLT có thể vận hành thành công

dưới bất kỳ tình huống hoạt động nào

Bên cạnh đó, dưới những đòi hỏi của thị trường hiện thời, một phương pháp

toàn bộ cho vận hành và điều khiển những tổ hợp năng lượng là rất quan trọng

cho sự tồn tại của bất kỳ hệ thống điện nào Khi được ứng dụng hoàn hảo,

những hệ thống điều khiển và những thiết bị có thể tăng cường hiệu suất vận

hành máy, tính ổn định và tin cậy cũng như sự sẵn sàng, vì thế làm giảm việc

tiêu tốn nhiên liệu, chi phí vận hành và bảo trì mà hầu như rất tốn kém trong

một tổ hợp năng lượng Vì vậy, thật cần thiết để phát triển những hệ thống tự

động hiệu quả và liên quan mật thiết đến toàn bộ chiến lược và hệ thống điều

khiển của tổ hợp để giữ chúng vận hành hiệu quả và có lợi

Cũng cần lưu ý rằng việc sử dụng rất nhiều hệ thống điều khiển và thiết bị

dựa trên máy tính với những dụng cụ kỹ thuật số xử lý thông tin mạnh mẽ và tin

cậy hơn cho phép những nhà thiết kế tập trung nhiều hơn trên việc thực thi

những ứng dụng phần mềm đáp ứng những thử thách được đề cập ở phần trên

Vì tính linh hoạt của phần mềm, và những chi phí cho việc phát triển và bảo trì

có thể dễ dàng cài đặt vào những phần cứng mà nó chạy trong đó, những nổ lực

lớn trong việc thiết kế và phát triển những hệ thống phần mềm toàn diện và

tổng quát để dễ dàng kết hợp những ứng dụng vận hành tiện lợi( ví dụ, bảo vệ,

điều khiển và tự động hoá) để tăng cường hiệu suất của những tổ hợp năng

lượng [Garduno and Sanchez 1995, Garcia and Garduno 1998]

- 4 - Trong luận văn này tác giả sẽ thiết kế một hệ thống điều khiển toàn bộ Hệ thống này sẽ kết hợp giữa các lĩnh vực kỹ thuật điều khiển, kỹ thuật phần mềm

và kỹ thuật quá trình Trong đó kỹ thuật phần mềm được xem là rất quan trọng

để thiết kế hệ thống điều khiển cho NLNLT

Trang 3

- 5 -

CHƯƠNG I

TỔNG QUAN 1.1 Giới thiệu về mạng nơron và logic mờ

Vào cuối thập kỷ 80 công ty Addison Wesley Publishing Company đã gây

xôn xao dư luận khi tung ra thị trường Neural Network (Mạng trí tuệ thần kinh)

được ví như là một kỹ xảo kỹ thuật gia công các thông tin mới, nhanh và chính

xác Chúng là các máy tính bắt chước cách sống giống hệ thống thần kinh, các

máy tính này làm việc khá khác biệt so với các máy tính thông thường Nơron

Network xử lý nhiều dữ liệu song song tại cùng một thời điểm, không phải là

xử lý từng dữ liệu một Chúng xử lý rất nhiều dữ liệu đầu vào cùng một lúc,

củng cố tăng cường một vài cái này, thu nhỏ giảm bớt những cái khác Đa số

chúng đều phải làm theo một khuôn mẫu cho trước Chúng tìm kiếm mẫu trong

hàng loạt các thí dụ, nhận dạng mẫu, tìm kiếm các mẫu đầy đủ từ nguồn dữ liệu

trong hệ thống, hoặc xây dựng lại mẫu đúng từ cái bị bóp méo Rất nhiều các ví

dụ phải làm với sự am hiểu sáng sưốt và các dữ liệu khách quan như thị giác,

thính giác và các tín hiệu khác Nhìn chung, các ví dụ chứng tỏ cách chạy này

có nhiều đặc tính của con người hơn là các máy tính được lập trình sẵn

Ngày nay, trí tuệ nhân tạo đang phát triển mạnh mẽ nhằm tạo ra cơ sở xây

dựng các hệ chuyên gia, hệ trợ giúp quyết định Trí tuệ nhân tạo được xây dựng

trên cơ sở mạng nơron nhân tạo và ứng dụng trong thiết kế hệ thống điều khiển

thông minh mà trong đó bộ điều khiển có khả năng tư duy như bộ não của con

người đang là xu hướng mới trong điều khiển tự động Mạng nơron là sự tái tạo

bằng kỹ thuật những chức năng của hệ thần kinh con người với vô số các nơron

được liên kết truyền thông với nhau trong mạng

Điều khiển mờ là một phương pháp điều khiển thông minh phỏng theo quá

trình xử lý thông tin không rõ ràng và ra quyết định điều khiển của con người

Phương pháp này rất thích hợp để điều khiển các đối tượng phức tạp, không xác

định được mô hình toán và các đối tượng phi tuyến Tuy nhiên, bộ điều khiển

mờ thường được thiết kế bởi quan điểm, cách nhìn riêng của người thiết kế

Người thiết kế biến sự hiểu biết, kinh nghiệm của mình về quá trình cần điều

khiển thành các biến ngôn ngữ và các qui tắc mờ mô tả mối quan hệ giữa

chúng Do đó công việc thiết kế thường mang nặng tính “thử sai”, khi gặp các

đối tượng phức tạp người thiết kế sẽ mất rất nhiều thời gian mà kết quả có được

có thể sẽ không tối ưu Vấn đề tự chỉnh bộ điều khiển mờ là một trong những

vấn đề đã được quan tâm nghiên cứu rất nhiều từ khi điều khiển mờ khẳng định

được là một phương pháp hiệu quả để điều khiển các đối tượng phức tạp

- 6 -

Do đó để giảm đi việc tính toán thủ công và rút ngắn thời gian thiết kế,người

ta kết hợp logic mờ và mạng nơron tạo ra khả năng tự chỉnh cho các tập mờ Và

hệ thống này được gọi là hệ neuro-mờ

Hầu hết những quá trình công nghiệp là phi tuyến và biến đổi theo thời gian Nhận dạng hệ thống phi tuyến đang trở thành một công cụ quan trọng mà có thể được dùng để cải tiến quá trình điều khiển và đạt được độ bền vững cao Có nhiều kỹ thuật nhận dạng phi tuyến khác nhau,trong đó có nhận dạng bằng mạng nơron ,nhận dạng bằng mô hình mờ và những phương pháp dựa trên mô hình neuro-mờ đang dần được thiết lập không những trong giáo trình mà cả trong những ứng dụng công nghiệp Mô hình neuro-mờ được xem như là một

kỹ thuật hộp xám nằm giữa mạng nơron và mô hình mờ định tính Những công

cụ để xây dựng những mô hình neuro-mờ dựa trên sự kết hợp những thuật toán

từ lĩnh vực mạng nơron,xác nhận đặc tính và phân tích hồi quy Phương pháp neuro-mờ cho nhận dạng hệ thống phi tuyến có ưu điểm là cân bằng giữa sự chính xác của mạng nơron và tính diễn giải được

1.2.Tình hình nghiên cứu mạng nơron và logic mờ trên toàn cầu:

Nghiên cứu về mạng Nơron đã được quan tâm từ những năm 40 của thế kỷ

20 Khoảng những năm 90 Nơron được đặc biệt chú ý bởi khả năng ứng dụng rộng lớn của nó

Chương trình nghiên cứu về Nơron tập chung nghiên cứu ở Mỹ (50 tổ chức trong các viện nghiên cứu và trường đại học,riêng California đã có 15 tổ chức nghiên cứu) Ở Anh có 20 tổ chức,Đức (7),Nhật (7), Pháp (6), Thụy sỹ(4),Thụy điển (4),Hà lan (4),Australia (3), Ytalia (3),Canađa (3), Nga(1),Czech (1),Balan(1),Hungary(1), Hàn quốc (1),Singapor (1),Hong kong (1)v.v…Ơ Mỹ, tại bang California,Trường Đại học California San diego có Chương trình tính toán và Hệ thống Nơron của Caltech, Viện tính toán Nơron, Nhóm nghiên cứu khoa học Máy tính Nhận thức,Trung tâm nghiên cứu Ngôn ngữ,Phòng thí nghiệm Kỹ thuật Nơron,Trung tâm Sloan Sinh học Nơron Lý thuyết Đại học California Santa Cruz có Nhóm Máy Dạy học, Nhóm Sinh học tính toán Đại học Nam California có Phòng thí nghiệm Tính toán Nơron Đại học Stanford có nhóm Lập trình Gen Ở Carlsbad có Động lực học Nơron ứng dụng Ở Moffett Field có Nhóm Kỹ thuật Nơron NASA

Bang Massachusetts, có Trung tâm Dạy học Tính toán và Sinh học tại Viện Công nghệ Massachusetts -MIT,Nhóm tính toán ở khoa Não và khoa học Nhận thức thuộc MIT,NeuoDyne Ins, Cambridge

Bang Washington có Phòng Thí nghiệm ứng dụng,Trí tuệ Tính toán thuộc Đại học Washington,Nhóm Nghiên cứu Nơron tại Phòng thí nghiệm Xử lý Thông tin Nhóm nghiên cứu Nơron thuộc Phòng thí nghiệm Pacific Northwest tại Washington

Trang 4

- 7 - Bang Texas có Phòng thí nghiệm Kỹ thuật Nơron R&D thuộc Đại học Texas ở

Austin.Phòng thí nghiệm Tính toán Ứng dụng tại đại học Kỹ thuật Texas

Bang Pensylvania có Trung tâm Cơ sở Nơron của Nhận thức tại Carnegie

Melon

Bang Ohio có Phòng Thí nghiệm Hệ thống Nơron Nhân tạo thuộc Đại học

Cincinnati

Bang New Mexico có Nhóm Tính toán Thích nghi thuộc Đại học New

Mexico Nhóm Tính toán Thích nghi Phi tuyến thuộc Phòng thí nghiệm Quốc

gia Los Alamos

Bang New Jersey có Nhóm Nghiên cứu Nơron Nhân tạo ở Viện nghiên cứu

NEC,Princeton Nhóm Nhận thức,Trí tuệ và Tính toán dựa trên DNA,ở Viện

nghiên cứu NEC,Princeton v.v…

Anh: có Trung tâm Mạng Nơron tại trường Hoàng gia London Trung tâm

Hệ thống Nơron tại Đại học Edinburgh Nhóm Nghe,Nhìn và Robot Đại học

Cambridge Nhóm Nghe,Nhìn và Hệ thống Thông minh Đại học

Southhampton.Nhóm Nghiên cứu Trí tuệ Nhân tạo thuộc Đại học Nottingham

Nhóm nghiên cứu Hệ thống Thông minh, khoa Khoa Học Máy tính thuộc Đại

học London v.v…

Nhật: có Phòng Thí nghiệm Robot và Cơ -Điện tử thuộc Đại học Nagoya

Phòng thí nghiệm Okabe và Hirose thuộc Đại học Tokyo Phòng thí nghiệm

Sinh-Điện tử thuộc Đại học Nagoya.Phòng thí nghiệm Nghiên cứu Xử lý Thông

tin Người ở Kyoto v.v…

Đức: có Viện Tin học Nơron ở Đại học Ruhr,Bochum Nhóm nghiên cứu Mờ

và Tính toán Mềm tại Đại học Braunschweig Nhóm Nhiên cứu Mờ và Nơron

tại Đại học Công nghệ Damstardt Nhóm Nhìn- Máy tính và Nhận dạng thuộc

Đại học Bon Trung tâm nghiên cứu Trí tuệ Nhân tạo Đức DFKI thuộc

Kaiserlautern Nhóm Nghiên cứu Nơron của GMD FIRST tại Berlin.Viện

Logic, Tổ hợp và Hệ thống Suy diễn tại Đại học Karlsruhe

Pháp: có Nhóm nghiên cứu Tin-Sinh học Trường Cao cấp,Pari Nhóm tính

toán Nơron thuộc Phòng Tin học Pari Nord Nhóm nghiên cứu Nơron ở

LEIBNIZ, Grenoble Nhóm nghiên cứu Laplace,Mô hình gần đúng trong Robot

và Trí tuệ Nhân tạo ở LEIBNIZ, Grenoble

Hungary: có Nhóm Xử lý thông tin Nơron thuộc Đại học Eotvos Lorand,

Budapest

1.3.Một số công trình nghiên cứu mạng Nơron đã công bố ở nước ngoài:

Đa số các nhà nghiên cứu các Hệ thống Thông minh chấp nhận rằng : Trí tuệ

Tính toán (Computational Intelligence) do Hội đồng Mạng Nơron Thế giới đưa

ra vào năm 1991 và Tính toán mềm (Soft computing) do Lofti A Zadeh, giáo sư

đại học California Berkeley đua ra năm 1990 là đồng nghĩa và được sử dụng

thay thế lẫn nhau Trí tuệ Tính toán được chấp nhận là một thuật ngữ để biểu

- 8 - diễn các kỹ thuật cho việc ra quyết định dựa trên việc xử lý thông tin không chắc chắn Về cơ bản, Trí tuệ Tính toán bao gồm Logic Mờ, Mạng Nơron , Thuật giải Di truyền, Lập luận Xác xuất,các Phương pháp Học, Lý thuyết Hỗn độn, các Hệ chuyên gia Một điều quan trọng cần nhấn mạnh là Trí tuệ Nhân tạo không chỉ là một tập hợp các phương pháp luận cho lập luận dựa trên thông tin không chắc chắn mà là sự liên kết các phương pháp trong đó mỗi phương pháp đều có lợi thế riêng để tiến tới đạt mục tiêu chung Bởi vậy, các thành phần của Trí tuệ Tính toán phải được xem như các phần bổ xung cho nhau chứ không phải tương đương Tất cả các kỹ thuật đó nhằm mục đích đưa ra một dạng “ Máy Thông minh “nào đó mà nó có thể bắt chước sự sưy nghĩ của con người trong việc ra quyết định Động cơ chủ yếu cho việc sử dụng Trí tuệ Tính toán

là khai thác khả năng xử lý thông tin không chính xác, không chắc chắn, chỉ đúng một phần và kết quả đạt được là tính dễ áp dụng,sự năng động và các giải pháp chi phí thấp cho các vấn đề phức tạp Đây cũng là mục tiêu do giáo sư Lofti A Zadeh , Đại học California Berkeley (người sáng tạo Lý thuyết Tập Mờ 1965) đưa ra vào đầu những năm 1990 đối với sự phát triển của các Hệ Thông minh

Hai dạng của Mạng Nơron thường được sử dụng trong Kỹ thuật Robot là Mạng Hopfield và Mạng Perceptron nhiều lớp do Hopfied đa ra 1982, Kohonen

1984, Rumelhart 1986 Những mạng khác bao gồm Mạng Cạnh tranh & Hợp tác do Amari &Arbib nghiên cứu năm 1977 và Mạng Thưởng phạt do A.G.Barto&C.W.Anderson 1983

Hệ thống Robot bao gồm 3 hệ thống phụ là : Hệ thống truyền động, Hệ thống Nhận dạng và Hệ thống Điều khiển Những vấn đề chính của Điều khiển Robot bao gồm Động học, Động lực học, Lập kế hoạch đường đi (Thiết lập quĩ đạo ), Điều khiển, Cảm biến, Lập trình và Trí tuệ (Thông minh)

Mạng Nơron có thể giảm tổ hợp tính toán và giải những bài toán robot được đưa ra “yếu” Lời giải giải tích của động học ngược làm chính xác kết quả số, trong khi lời giải Mạng Nơron nói chung không làm chính xác.Công việc phát triển Động học ngược Nơron được T.Iberall phát triển năm 1987, A.Guez năm1988

Trong Động lực học Robot Nơron , M.Kawato,Furukawa,Sưzuki phát triển năm 1987 Y.Uno &M.Isobe 1988 S.G.Tzafestas1986, M.Kawato,Y.Maeda,Y.Uno &Sưzuki 1990

Mạng Nơron sử dụng nhằm thiết lập quĩ đạo được K.Tsưtsưmi 1988, H.liu1988, R.Ecmiller 1987

Bài toán lập quĩ đạo tránh vật cản sử dụng Mạng Hopfield được H.matsưmoto& K.Tsưtsưmi phát triển

Trường hợp Robot Di động, Thiết lập quĩ đạo với Mạng Nơron được nghiên cứu bởi V.Seshadri1988.Ở đây Mạng Nơron cố gắng cực tiểu hoá độ dài đường

đi Nick Vallidis đã nghiên cứu điều khiển Hexapod di động bằng mạng Nơron ,

Trang 5

- 9 -

2000 L.M.Reyneri, M.Chiaberge Khoa điện tử, Đại học Bách khoa Torino-

Italy nghiên cứu phần cứng-Mạng Mờ-Nơron điều khiển Hexapod Di động,

1993-2000

Điều khiển Robot bằng Mạng Nơron được gọi là Điều khiển khớp bằng mô

hình tiểu não CMAC do Albus 1975 –1979 Giáo s F.L.Lewis,Viện nghiên cứu

Robot và Tự động hoá, Đại học Texas –Arlington USA đã ứng dụng CMAC để

điều khiển hệ động lực phi tuyến, 1997

Nhận dạng hệ động lực phi tuyến sử dụng mạng Nơron được

S.J.Jagannathan, Liên hợp Phân tích Tự động hoá, USA nghiên cứu năm 1996

Y.Pao&D.Sobasic 1987 thực hiện hệ thống điều khiển vị trí robot hai bậc tự do

sử dụng Mạng Nơron Perceptron

A.Guez sử dụng mô hình thích nghi (MRAC) W.T Miler sử dụng kỹ thuật

CMAC trong liên kết với phương pháp điều khiển mô men R.Elsley thực hiện

điều khiển Jacobi ngược,sử dụng Mạng Perceptron nhiều lớp

Mạng Nơron Được sử dụng trong cảm biến và điều khiển Robot nhiều lớp, liên

tục bởi R.Esley, &Y.Pati 1988

Điều khiển thích nghi hệ động lực học phi tuyến sử dụng mạng Nơron được

giáo sư A.M.Annaswamy, Phòng thí nghiệm Điều khiển thích nghi - Khoa Chế

tạo Máy – Viện Công nghệ Massachusetts –MIT nghiên cứu, 1997

Ứng dụng Mạng Nơron điều khiển ngược theo vết được giáo sư K S

Narendra, Trung tâm Khoa học Hệ thống, Đại học Yale,USA nghiên cứu, 1999

Giáo sư Vukobratovic, Trung tâm Robot, Viện Mikhailo Pupin, Nam tư (cũ

), phó chủ tịch Viện Hàn lâm Khoa học, đã nghiên cứu phân loại mô hình động

lực học môi trường trên cơ sở Nơron để điều khiển robot,1998

Bộ điều khiển Mờ-Nơron để dẫn huớng Robot Di động và hộ tống đội robot

được giáo sư M.M.Trivedi Khoa Kỹ thuật Điện và Máy tính, Đại học California

San Diego,USA nghiên cứu,1998

Giáo sư, Viện sĩ, Vámos Tibor, nguyên Viện trưởng Viện Tin học và Tự động

hoá- Hungary, - nguyên chủ tịch Hội Máy tính Neyman János (Von Neyman),

nguyên chủ tịch Hội Điều khiển Tự động Quốc tế IFAC đã nghiên cứu kỹ thuật

Nhận dạng –Trí tuệ Nhân tạo cho robot

Giáo sư,Viện sĩ Hyungsưck Cho, Khoa Chế tạo máy,Viện Khoa học &Công

nghệ Cao cấp Hàn quốc- KAIST, Hãng Thép và Kim loại Pohang-POSCO,

Viện trưởng Viện Điều khiển,Tự động hoá và Kỹ thuật Hệ thống, đã nghiên cứu

điều khiển và cảm biến nano cho robot,2001

Giáo sư T.Fukuda, Khoa Kỹ thuật Vi Hệ thống,Trung tâm Hợp tác Khoa học

&Công nghệ Cấp cao, Đại học Nagoya- Nhật bản, nguyên Chủ tịch Hội Robot

và Tự động hóa Quốc tế, Chủ tịch Hội đồng Công nghệ Nano Quốc tế, đã

nghiên cứu Mạng Mờ-Nơron -Thuật giải AND để điều khiển robot, 2000 Công

nghệ Nano đang mở ra những triển vọng to lớn Việc chế tạo ra những robot

- 10 - nhỏ cỡ Nano 10-9mm đòi hỏi những nghiên cứu mới về cơ sở lý thuyết cũng như công nghệ Giáo sư Toshio Fukuda, đặc biệt nhấn mạnh tầm quan trọng của Robot Micro-Nano trong Kỹ thuật Robot và Tự động hoá tương lai

Giáo sư,Viện sĩ G.M.Edelman,giải thưởng Nobel, Viện trưởng Viện Khoa học Nơron - USA,Chủ tịch Hội nghiên cứu Khoa học Nơron Quốc tế, đã mô phỏng Nơron hệ thống Nghe-Nhìn của loài chim để điều khiển robot,1999 Giáo sư đã khẳng định, việc nghiên cứu này đặc biệt quan trọng dưới ánh sáng của lý thuyết Não Hiện đại, nhấn mạnh tầm quan trọng của môi trường và thực nghiệm Motor-Cảm biến Nơron Sự hiểu biết những nguyên tắc cơ bản của não sẽ có ảnh hưởng mạnh mẽ đến thiết kế Hệ thống Nhân tạo hoạt động trong thế giới thực.Chúng ta tin tưởng rằng những nghiên cứu mô hình Nơron tổng hợp sẽ tham gia một cách có ý nghĩa bởi sự thiết lập mối liên hệ trực tiếp giữa khoa học Tự nhiên và Khoa học Kỹ thuật, đưa ra tư tưởng mới trong lĩnh vực Robot

và Trí tuệ Nhân tạo

1.4.Một số công trình nghiên cứu mạng Nơron đã công bố ở trong nước:

Ở Việt nam bắt đầu nghiên cứu Nơron từ năm 1992 tại Viện Cơ học và Viện Tin học trong khuôn khổ đề tài cấp Nhà nuớc KC-02 Điều khiển thời gian thực Hiện nay một số cơ sở đang nghiên cứu như Trung tâm Tự động hoá-Viện tin học, Khoa Công nghệ Thông tin - ĐHBK.HN, Bộ môn Điều khiển Tự động ĐHBK.HN, Học viện Bưu chính Viễn thông, Khoa Công nghệ Thông tin ĐHBK.HCM,Đại học Giao thông Vận tải, Viện Vật lý, Viện toán học, VietcomBank, Viện Năng lượng Nguyên tử, Học viện Kỹ thuật Quân sự, Đại học Quốc gia - HCM Công tác đào tạo được triển khai, đã có những luận án Tiến sĩ (2), Thạc sĩ và buớc đầu được giảng dạy cho sinh viên Tuy nhiên những nghiên cứu thường rải rác,chưa tập trung thành những nhóm nghiên cứu mạnh

để có thể bước đầu đưa vào ứng dụng và có thể hợp tác với các tổ chức quốc tế

1.5 Tổng quan về tình hình nghiên cứu tổ hợp năng lượng nhiên liệu than

Một NLNLT cung cấp năng lượng điện là kết quả của những quá trình chuyển đổi năng lượng Cụ thể, những chuyển đổi chính là sự đốt cháy nhiên liệu đầu vào, tạo hơi, phát triển chuyển động quay, sản xuất năng lượng điện và ngưng tụ hơi Tất cả những chuyển đổi này tạo thành một chu trình nhiệt động lực học lớn và phụ thuộc lẫn nhau cao độ

Những chiến lược điều khiển hiện thời cho phép tạo ra năng lượng cần thiết

để thoả mãn yêu cầu tải trong khi duy trì sự cân bằng giữa những quá trình chuyển đổi trong tổ hợp Chủ yếu, chúng gắn kết ngõ ra năng lượng lưu lượng hơi của boiler với năng lượng được yêu cầu bởi tuabin-máy phát để đạt được tải điện ở mọi thời điểm Sơ đồ điều khiển tổ hợp cấu thành lớp cao nhất của hệ thống điều khiển và nó chịu trách nhiệm cho việc điều khiển boiler-tuabin-máy

Trang 6

- 11 - phát như một đối tượng đơn Đặc tính nổi bật của tổ hợp được quản lý thông

qua những vòng điều khiển năng lượng và áp suất Việc phát triển từ những cấu

hình vòng điều khiển SISO dựa trên thuật toán điều khiển PID, những chiến

lược này có thể phân loại thành ba lớp: điều khiển theo boiler, điều khiển theo

tuabin và điều khiển boiler-tuabin

Sơ đồ theo boiler được dùng đầu tiên Trong sơ đồ này, boiler sẽ chờ đợi

hành động của tuabin để sản xuất năng lượng Những van điều khiển tuabin

điều chỉnh lưu lượng hơi vào trong tuabin với đối số là công suất yêu cầu Sau

đó, điều khiển boiler tương ứng với những thay đổi trong lưu lượng hơi và áp

suất Sai lệch áp suất tiết lưu so với setpoint được dùng bởi điều khiển quá trình

đốt nhiên liệu để điều chỉnh lượng nhiên liệu và không khí vào trong buồng đốt,

và việc tạo hơi được hiệu chỉnh theo yêu cầu của tuabin Thuận lợi của phương

pháp này là đáp ứng nhanh với thay đổi tải: tuabin là một dụng cụ hoạt động

nhanh có thể đáp ứng rất nhanh với những yêu cầu tải sử dụng năng lượng nhiệt

được lưu trữ trong boiler Điều bất lợi là phương pháp này thể hiện việc điều

khiển áp suất tiết lưu ít ổn định vì boiler có xu hướng vượt quá vì nó đòi hỏi

thời gian để hoà hợp với tuabin

Sơ đồ điều khiển theo tuabin được dùng trong những năm 60-70 Trong sơ

đồ này, tuabin sẽ theo những hoạt động của boiler Yêu cầu công suất được

dùng bởi điều khiển đốt tại boiler để điều chỉnh lượng nhiên liệu và không khí

vào trong buồng đốt để điều chỉnh việc sản xuất hơi Sau đó điều khiển tuabin

đáp ứng bằng cách hiệu chỉnh những van tiết lưu để giữ áp suất tại setpoint

Tuabin chịu trách nhiệm hoàn toàn trong việc điều khiển áp suất tiết lưu Thuận

lợi của phương pháp này là đáp ứng rất ổn định với những thay đổi tải với sự

dao động áp suất hơi và nhiệt độ tối thiểu, vì những thay đổi tải phụ thuộc vào

hoạt động của boiler là thiết bị chậm hơn so với tuabin Bất lợi chính của

phương pháp là không sử dụng khả năng lưu trữ năng lượng của boiler, vì thế

tạo ra đáp ứng chậm hơn

Được sử dùng nhiều nhất trong thập kỷ 50 là sơ đồ điều khiển phù

hợp(coordinated control (CC)) Trong sơ đồ này, công suất được đưa đồng thời

đến boiler và tuabin Phụ thuộc vào các cặp biến được điều khiển và điều

khiển, có hai sơ đồ cho CC: sơ đồ theo boiler và sơ đồ theo tuabin [Landis and

Wulfsohn 1988] Với sơ đồ thứ nhất, bộ điều khiển tải tạo lệnh cho van tiết lưu

hơi từ yêu cầu tải tổ hợp và công suất tạo ra, bộ điều khiển áp suất tạo lệnh cho

cho van nhiên liệu/không khí từ áp suất tiết lưu đo được và setpoint áp suất mà

sẽ có được từ yêu cầu tải tổ hợp thông qua ánh xạ phi tuyến (hình 1.1) Trong

sơ đồ thứ hai, bộ điều khiển tải tạo lệnh cho những van nhiên liệu/không khí từ

yêu cầu tải tổ hợp và công suất tạo ra Lệnh đến van tiết lưu được tính toán từ

áp suất hơi tiết lưu đo được và setpoint áp suất mà sẽ có được từ yêu cầu tải tổ

hợp thông qua ánh xạ phi tuyến (hình 1.2)

Những chiến lược điều khiển phù hợp sẽ kết hợp những thuận lợi của hai

chiến lược trên và tối thiểu những bất lợi cuả chúng, nghĩa là , chúng cố gắng

giữ đặc tính đáp ứng ổn định của sơ đồ theo tuabin và đặc tính đáp ứng nhanh

- 12 - của sơ đồ theo boiler Để đạt được đáp ứng nhanh,tuabin-máy phát được phép

sử dụng năng lượng được lưu trữ trong boiler Để đạt được ổn định, điều khiển boiler hiệu chỉnh tốc độ đánh lửa theo tải yêu cầu, trong khi giữ cho tuabin không vượt quá năng lượng được cung cấp bởi boiler Đáp ứng tổ hợp ở CC phải nhanh hơn sơ đồ theo tuabin nhưng không nhanh bằng sơ đồ theo boiler Những ưu điểm khác của phương pháp điều khiển phù hợp là khả năng dễ dàng thực hiện giảm tải và biến đổi áp suất với điều khiển tải chính xác

Từ quan điểm thực tế, người ta mong muốn có một cấu trúc tổng quát cho điều khiển phù hợp mà có thể cấu hình lại với bất kỳ sơ đồ hoạt vận hành nào, hoặc có thể được điều chỉnh để thể hiện bất kỳ ứng xử nào giữa các sơ đồ điều khiển Những cấu trúc này chứa những cấu hình nhiều vòng lặp phân tán của những bộ điều khiển SISO dùng những thuật toán cổ điển PI hay PID Những

sơ đồ này đối mặt với những thách thức nghiêm trọng bởi những yêu cầu vận hành theo tải diện rộng Trong những điều kiện này, hiệu suất có thể giảm do những biến đổi phi tuyến lớn và những hiệu ứng kết hợp của những quá trình động Người ta đã dùng những bộ bù để tăng cường sơ đồ điều khiển phù hợp nhiều vòng lặp bằng cách giảm những hiệu ứng tương tác giữa các vòng điều khiển Rất nhiều nghiên cứu đã được thực hiện trong nhiều thập kỷ qua nhưng hầu hết các kết quả đều là những sản phẩm riêng của những nhà phát triển và không có một phương pháp được chấp nhận rộng rãi hay tổng quát để thực thi chúng, vì thế cần thiết những phương pháp thiết kế mang tính hệ thống và tổng quát hơn Điểm cốt yếu là việc thiết kế bộ bù tương tác dựa trên mô hình toán học là gần như không thể thực hiện và trở nên quá phức tạp sẽ loại bỏ ứng dụng của nó

Hình 1.1 Sơ đồ điều khiển theo boiler

Trang 7

- 13 -

Hình 1.2 Sơ đồ điều khiển theo tuabin

1.5.1 Những hệ thống điều khiển tiên tiến

Mặc dù không có định nghĩa chung cho điều khiển tiên tiến, nhiều phương pháp

đã dùng những mô hình toán học của quá trình, hoặc là ở quá trình thiết kế hay

trong suốt quá trình vận hành, hiện thời được gọi là tiên tiến Hầu hết sự chú ý

tập trung vào chỉ số hiệu suất toàn phương Ứng dụng thực tế của kỹ thuật này

cho điều khiển toàn bộ bị giới hạn bởi tính phức tạp của việc thực thi, dễ bị ảnh

hưởng bởi sự không chắc chắn của mô hình, cần phải reset lại hoạt động của

các bộ điều khiển, và việc dùng những kỹ thuật điều khiển tuyến tính trong

những hệ thống phi tuyến cao độ Mặc dù không phải là một chiến lược điều

khiển tổ hợp toàn bộ, ứng dụng liên quan nhất của những kỹ thuật điều khiển tối

ưu nhiều biến mà [Nakamura và Uchida 1989] đã đưa vào vận hành một bộ

điều chỉnh toàn phương tuyến tính cho những nhiệt độ hơi trong boiler của một

tổ máy 500MW tại Kyushu Electric Company, Japan, 1978 Bước đột phá này,

trong đó những sơ đồ điều khiển nhiệt độ, gồm những kỹ thuật khác như nhận

dạng và dự đoán không gian trạng thái, lập trình toán học phi tuyến, điều khiển

thích nghi tham khảo mô hình và tối ưu đã trở thành chuẩn cho những tổ hợp

năng lượng than của người Nhật trong suốt 25 năm qua, cho phép họ vận hành

với những mức cao nhất của hiệu suất nhiệt

Người ta cũng thực hiện nhiều nghiên cứu để áp dụng những phương pháp

tách riêng ra(decoupling) để làm giảm hay loại bỏ những ảnh hưởng tương tác

giữa các vòng điều khiển Trong sơ đồ điều khiển tổ hợp theo boiler dùng bộ bù

dựa trên hồi tiếp trạng thái để giảm ảnh hưởng tương tác của hệ thống cho tổ

hợp 150 MW ở Ontario Hydro, Canada Bộ bù tạo ra những tín hiệu bù cho bốn

ngõ vào điều khiển chính là tổng của những tín hiệu điều khiển chính và vectơ

- 14 - trạng thái quá trình sử dụng những ma trận độ lợi hằng số, được tính từ mô hình tuyến tính không gian trạng thái bậc 9 của máy Vectơ trạng thái được dự đoán dùng bộ lọc Kalman Những kết quả mô phỏng cho thấy tải có khả năng vận hành trong khoảng 75% đến 100% khoảng vận hành tải với lỗi biến quá trình và ảnh hưởng tương tác giảm Không có chi tiết về số lượng mô hình tuyến tính được dùng trong khoảng tải cũng như những ma trận độ lợi trong khoảng đó Những bộ điều khiển tách rời dựa trên mô hình bậc 12 được thực thi trong máy thực So với điều khiển truyền thống, sơ đồ tách riêng xấp xỉ làm cho lỗi điều khiển giảm, tăng độ ổn định tải thấp, hiệu chỉnh thông số đơn giản và không nhạy với những biến đổi máy Khó khăn chính với phương pháp tách riêng là thiết kế bộ bù tách riêng Thiết kế bộ bù động là quá nặng nề và sự phức tạp ngăn cản ứng dụng của chúng

Về nguyên tắc, điều khiển thích nghi dường như rất phù hợp cho điều khiển toàn bộ nhà máy điện Khả năng của hệ thống điều khiển liên quan với những thay đổi động của quá trình rất hấp dẫn cho vận hành diện rộng Trong [Marc, et

al 1980] ảnh hưởng của nhiễu và biến đổi thông số trong thiết kế một bộ điều khiển thích nghi cho máy phát hơi 250 MW được xem xét Trong [Mabius, et

al 1980] một cơ cấu thích nghi tham khảo mô hình được đề nghị để cung cấp những tín hiệu điều khiển tăng cường cộng vào những tín hiệu điều khiển của điều khiển vòng mở Giả sử vận hành xung quanh một điểm vận hành cố định,

lý thuyết điều khiển tuyến tính được dùng để thiết kế bộ điều khiển, những thông số luật điều khiển được điều chỉnh dùng sơ đồ dựa trên Lyapunov để bảo đảm sự ổn định của vòng kín Không may, chỉ có thiết kế được thể hiện mà không có kết quả về hiệu suất hệ thống điều khiển

Những phuơng pháp điều khiển bền vững cũng được đề nghị cho điều khiển

tổ hợp Trong [Weng and Ray 1997] một chiến lược điều khiển truyền hồi tiếp được đề xuất cho điều khiển theo tải bền vững diện rộng Điều khiển truyền thẳng tối ưu những ngõ vào điều khiển, nhận những ràng buộc của chúng, dọc theo khoảng vận hành diện rộng và điều khiển hồi tiếp được dùng để khắc phục những bất định mô hình máy và nhiễu ngoại sinh đảm bảo ổn định và hiệu suất bền vững Điều khiển truyền thẳng giải quyết bài toán lập trình phi tuyến cho hàm tối ưu và những ràng buộc dọc theo đặc tính tải đã cho Điều khiển hồi tiếp được thiết kế dùng kỹ thuật H Phương pháp này thoả mãn yêu cầu hiệu suất trong khoảng 40-100% khoảng tải và loại bỏ tốt nhiễu biết trước Một vài nhược điểm là những yêu cầu tính toán quá nhiều, cùng với thông tin đáp ứng tần số và mô hình tuyến tính của máy

Mặc dù có tiến bộ lớn trong lý thuyết hệ thống điều khiển, những thực thi những sơ đồ tiên tiến cho NLNLT vẫn còn hiếm Do những sơ đồ đề xuất không thể hiện tốt dưới những yêu cầu thế giới thực chẳng hạn hiệu suất thời gian thực, khoảng vận hành diện rộng, động quá trình phức tạp và nhiều chiều hay những điều kiện giả sử hiếm khi xảy ra trong thực tế là nhiễu Gauss, thông

số quá trình hằng số, đo đúng và chính xác, động quá trình được biết Có lẽ, bất

Trang 8

- 15 - lợi chính của hầu hết những phương pháp tiên tiến này là yêu cầu những mô

hình toán học chính xác cho thiết kế và vận hành Bậc và độ phức tạp cao của

của tổ hợp năng lượng đã ngăn cản việc thực thi những sơ đồ điều khiển tập

trung dựa trên mô hình toán học Nói cách khác, tính huống này đã thúc đẩy sự

tồn tại lâu dài của những cấu hình nhiều vòng dựa trên những thuật toán điều

khiển PID truyền thống

1.5.2 Những phương pháp lai thông minh

Vẫn có một phương pháp thứ ba áp dụng những kỹ thuật thông minh nhân

tạo nổi bật gần đây hay sự pha trộn của chúng với điều khiển tiên tiến và truyền

thống, trong một nổ lực liên quan đến những phức tạp mà không được giải

quyết thoả mãn bởi những kỹ thuật được đề cập ở phần trên

Trong [Mamdani 1974, Mamdani and Assilian 1975], một bộ điều khiển dựa

trên lý thuyết tập mờ [Zadeh 1965, Zadeh 1968, Zadeh 1973] được giới thiệu

lần đầu tiên Giải thuật mờ mô phỏng quá trình lập luận của con người, được

dùng để điều khiển máy hơi nước trong phòng thí nghiệm Áp suất hơi và tốc độ

rotor được điều chỉnh bằng cách thao tác ngõ vào nhiệt boiler và độ mở tiết lưu

máy theo một tập những luật ngôn ngữ Thực nghiệm chỉ ra rằng những kết quả

tương tự hay tốt hơn so với những bộ điều khiển cổ điển Công việc này minh

hoạ tính khả thi trong việc xây dựng những giải thuật xác định thời gian thực

hiệu quả, mở đầu một lĩnh vực mới trong kỹ thuật điều khiển

Trong [Ray and Majumder 1985] lý thuết tách rời phi tuyến và lôgic mờ

được dùng để điều chỉnh áp suất bao hơi và mức nước bao hơi trong một tổ hợp

200MW ở những điều kiện vận hành khác nhau Đầu tiên, một luật điều khiển

tách rời được thiết kế cho mô hình máy phi tuyến bậc ba với giả sử rằng thông

số hệ thống được biết chính xác và là những hệ con SISO không tương tác Sau

đó, những bộ điều khiển lôgic mờ được dùng cho điều khiển vòng kín trong mỗi

hệ con Hiệu suất tốt của sơ đồ điều khiển đạt được khi tính với nhiễu trạng thái,

biến đổi thông số ngẫu nhiên và từng phần, thay đổi setpoint, nhạy thông

số,tách rời không hoàn hảo và thiếu tách rời

Trong [Marcelle, et al 1994] một sơ đồ điều khiển kết hợp logic mờ và điều

khiển tối ưu cho vận hành chu trình của những tuabin hơi lớn được thể hiện

Ứng suất tua bin tổng và lỗi tải được tối thiểu bằng cách gắn kết điều khiển van

điều chỉnh tuabin và áp suất hơi boiler Một hệ thống mờ ưu tiên những đối

tượng hiệu suất và cung cấp những trọng số trong hàm gía trị mà được dùng bởi

bộ điều khiển tối ưu Sau đó, một thuật toán điều khiển dự đoán mô hình được

dùng để tính van tối ưu và những giá trị setpoint áp suất để cân bằng giữa theo

tải tốt và tối thiểu ứng suất Hiệu suất tốt hơn khi so sánh với bộ điều khiển áp

suất biến đổi và áp suất hằng số và cũng với một bộ điều khiển dự đoán mô

hình với những độ lợi cố định và thời gian dự đoán cố định

Trong [Dimeo and Lee 1995] giải thuật di truyền được dùng để tinh chỉnh tối

ưu sơ đồ điều khiển kết hợp dựa trên PI và bộ điều khiển hồi tiếp trạng thái cho

- 16 - một tổ hợp phi tuyến bậc ba Đối tượng điều khiển là theo đáp ứng bước ở ngõ

ra áp suất và công suất Trong khi nững ứng dụng khả thi của giải thuật di truyền là cơ cấu tinh chỉnh hoàn hảo, vẫn có một vài sai xót trong những cấu trúc điều khiển được đề xuất Vị trí của những độ lợi kết hợp chéo trong sơ đồ điều khiển kết hợp dựa trên PI là không thuận tiện, vì nó tạo ra đáp ứng dao động và sơ đồ điều khiển tối ưu giả sử rằng tất cả các biến trạng thái sẵn sàng cho mô phỏng

Trong [Tevera 1995] một sơ đồ tổ hợp có thể cấu hình lại có thể chuyển giữa những chiến lược điều khiển khác nhau( ví dụ, theo boiler, theo tuabin và điều khiển hoà hợp) Cấu hình lại hệ thống được thực hiện trực tuyến bởi bốn hệ chuyên gia làm việc cùng nhau tại mức giám sát Hệ đầu tiên nhận định trạng thái vận hành và những yêu cầu cho tổ hợp Hệ thứ hai tính toán hiệu suất của

sơ đồ điều khiển khi vận hành Hệ thứ ba tính toán hiệu suất của những sơ đồ khác dưới những điều kiện hiện thời Cuối cùng, hệ thứ tư sơ đồ nào là tiện lợi nhất và chuyển sơ đồ nếu được phép của người vận hành Điều khiển được thực hiện thành công trong một hệ thống phát triển và tính toán phần mềm điều khiển dùng mô hình tổ hợp toàn bộ

Trong [Garduno and Lee 1997], một sơ đồ điều khiển thứ tự hai mức cho vận hành diện rộng NLNLT được thể hiện Tại mức giám sát một bộ quản lý tham chiếu mờ tạo những quỹ đạo setpoint theo chính sách vận hành áp suất biến đổi

để điều khiển tải theo bất kỳ đặc tính nào.Tại mức điều khiển, thực thi chiến lược truyền thẳng-hồi tiếp Điều khiển truyền thẳng gồm một tập những hệ suy luận mờ MISO được thiết kế từ dữ liệu vào ra trạng thái xác lập Đường hồi tiếp gồm những bộ điều khiển PID với cấu hình nhiều vòng Với chiến lược này, đường truyền thẳng cung cấp hầu hết tín hiệu điều khiển cho vận hành diện rộng, giàm bớt những nổ lực điều khiển của những bộ điều khiển PID Đường hồi tiếp cung cấp tín hiệu điều khiển bù để điều chỉnh và loại nhiễu trong những lân cận nhỏ quanh những quỹ đạo lệnh Những kết quả mô phỏng cho thấy tính khả thi của sơ đồ điều khiển để đạt được vận hành theo tải chu kỳ

Những nghiên cứu lớn được thực hiện ở Nhật để phát triển những sơ đồ lai để đạt được cải tiến kỹ thuật trong vận hành máy điện[Matsuoka, et al.1993] Sau những thực thi thành công của điều khiển tối ưu nhiều biến trong suốt hơn hai mươi năm qua, người Nhật đang tạo ra bước đột phá kỹ thuật thứ hai trong điều khiển máy điện thông qua việc thực thi những sơ đồ lai dựa trên những giải thuật và những hệ neuro-mờ Những cách giải hoàn tất được tìm kiếm để giải quyết những vấn đề sau:1) những quá trình lớn hơn và phức tạp hơn gồm mô hình toán học của chúng, 2)độ phi tuyến mạnh hơn, kết hợp và tương tác biến đổi theo thời gian giữa những hệ con và 3)thoả mãn những yêu cầu chặt chẽ trong ổn định và tối ưu hệ thống

Ở Mỹ Intelligent Control Systems Initiative, được thành lập với sự liên kết giữa Electric Power Research Institute (EPRI) và National Science Foundation (NSF) năm 1993 gồm hai mươi mốt dự án nghiên cứu để tìm những ứng dụng

có giá trị và sáng kiến mới và thiết lập lý thuyết nền tảng và những chương

Trang 9

- 17 - trình tin cậy cho việc thiết kế và phát triển những hệ thống thông minh và thích

nghi Một vài phương pháp điều khiển thông minh được đầu tư là:1) lập kế

hoạch giám sát off-line và on-line bằng lập luận tự động hay học từ những ví dụ

của con người, 2) mô hình định tính dùng những hệ chuyên gia và lôgic mờ và

3)trí tuệ nhân tạo và học máy dùng những phương pháp mạng nơron, giải thuật

di truyền, tiến hoá và học cưỡng bức, đôi khi kết hợp với những kỹ thuật tối ưu

toán học

1.5.3 Phát biểu vấn đề

Luận văn này sẽ trình bày ý tưởng cho việc phát triển những hệ thống điều

khiển thông minh cho đối tượng phi tuyến mà cụ thể là tổ hợp năng lượng,

nghĩa là phát triển những hệ thống quản lý năng lượng nhân tạo được thiết kế

điều khiển thông minh bởi hệ thống máy tính giống như bộ não con người

Những những yêu cầu chính cho hệ thống điều khiển là:

 Thiết kế mở cung cấp những yêu cầu chức năng và vận hành để đạt được

độ linh hoạt, cho ứng dụng trong môi trường thị trường biến đổi cao

 Vận hành người dùng cuối đơn giản và hiệu suất cao, liên kết với tự

động hoá và kỹ thuật điều khiển

 Kiến trúc hệ thống có cấu trúc, điều này sẽ dẫn đến việc phát triển phần

mềm điều khiển và tự động hoá tương ứng

Từ những kết quả đạt được, có thể thấy rằng những chiến lược điều khiển phù

hợp cấu thành mức điều khiển cao nhất trong NLNLT hiện thời và chúng cũng

chịu trách nhiệm cho việc điều khiển boiler-tuabin-máy phát như một đối tượng

đơn Kế đến, NLNLT là một quá trình phức tạp, chịu nhiều thay đổi điều kiện

vận hành mà sẽ thể hiện như một hệ thống thông minh mà với nó khái niệm

điều khiển tích hợp tiên tiến là cần thiết

Việc phát triển kỹ thuật khi thiết kế hệ thống điều khiển tổ hợp năng lượng để

hổ trợ và làm cho dễ dàng hơn việc thực thi những hệ thống điều khiển năng

lượng phân tán và thứ bậc lớn và để tích hợp những kỹ thuật thông minh nhân

tạo liên kết tính hệ thống với sự phức tạp của quá trình và những yêu cầu vận

hành của nó Trong luận văn này sẽ thiết lập một sơ đồ điều khiển tổng quát gọi

là hệ thống điều khiển phù hợp thông minh ứng dụng những kỹ thuật thông

minh nhân tạo là mạng nơron, logíc mờ và thuật giải di truyền để đưa đối tượng

được điều khiển vào đúng quỹ đạo của nó với những yêu cầu vận hành khác

nhau Để làm được điều này, hệ thống điều khiển trên tích hợp những chức

năng học máy, quan sát ứng xử, cơ cấu thích nghi, tạo lệnh và tính toán điều

khiển, tất cả chúng đều cần thiết cho những đặc tính vận hành tự quản hiệu quả

và linh hoạt

1.5.4 Đối tượng và phạm vi

- 18 -

Đối tượng chính của đề tài nghiên cứu này là tăng cường mức điều khiển tự động những máy năng lượng thông qua việc mở rộng khái niệm điều khiển phù hợp cho NLNLT và tính hiện thực của nó qua những kỹ thuật thông minh nhân tạo

Phạm vi của đề tài sẽ tập trung vào những điểm sau:

 Tất cả những nghiên cứu và phát triển trong đề tài này sẽ tập trung ở tổ hợp máy điện nhiên liệu than loại bao hơi truyền thống(NLNLT), vì chúng thể hiện kỹ thuật được dùng nhiều nhất để tạo năng lượng điện và cấu thành cách chính để điều chỉnh những thông số quan trọng nhất (công suất, tần số và điện áp) ảnh hưởng đến chất lượng năng lượng điện trong những hệ thống năng lượng liên kết

 Chỉ những điều kiện động bình thường cùa NLNLT được xem xét Đề tài tập trung trong hệ thống điều khiển cần thiết cho trạng thái vận hành bình thường mà chiếm đến 99% thời gian vận hành Không nổ lực nào liên quan đến báo động, khẩn cấp, quá mức, hồi phục trạng thái Cần lưu ý rằng trạng thái bình thường không phải là trạng thái xác lập vì trong thực

tế nhà máy điện không bao giờ vận hành ở trạng thái xác lập

 Thiết kế hệ thống điều khiển sẽ bao hàm chỉ chiến lược điều khiển nền tảng Việc phát triển những chiến lược tự động hoá, khoá liên động và bảo vệ như được cho trong bất kỳ hệ thống điều khiển nào sẽ không được thực hiện Cũng thế, đề tài chỉ đề cập đến những chức năng điều khiển cơ bản để lái quá trình trong suốt pha vận hành tải, không có chức năng khởi động và shutdown

 Việc phát triển hệ thống điều khiển sẽ được giới hạn ở vấn đề hệ thống và tính khả thi của nó Tất cả chương trình sẽ được mô phỏng trên máy tính

cá nhân dùng môi trường phần mềm phòng thí nghiệm Không có việc thực thi hệ thống ở môi trường thực Đây cũng là bản chất nghiên cứu của đề tài

 Đề tài sẽ chỉ phát triển tập hàm tối thiểu cần thiết cho điều chỉnh và tự động hoá hệ thống năng lượng toàn bộ, đề xuất tính linh hoạt tối đa để hổ trợ điều khiển tải và điều khiển nhiều tổ hợp trong những sơ đồ nhà máy điện

 Phương pháp đề xuất sẽ được tính toán và so sánh với những phương pháp truyền thống Thậm chí loại hệ thống điều khiển này không tồn tại,

việc tính toán sẽ được thực hiện với hiệu suất theo tải là yêu cầu quan

trọng nhất cần được thoả mãn

1.5.5 Tổng quan đề tài

Việc phát triển hệ thống điều khiển phù hợp thông minh(ICCS) gồm bộ giám sát nhiều đại diện thông minh sẽ tính toán điều khiển ở mức trực tiếp Những chức năng giám sát gồm tạo lệnh và tối ưu, học và thích nghi, giám sát trạng

Trang 10

- 19 - thái và hiệu suất(Hình 1.3) Mức trực tiếp gồm những sơ đồ điều khiển truyền

thẳng/hồi tiếp nhiều biến Việc thực thi lõi của hệ thống được hình thành bởi ba

môđun: sepoint, bộ xử lý điều khiển truyền thẳng và bộ xử lý điều khiển hồi

tiếp (hình 1.4) Giám sát hiệu suất và trạng thái cũng như những hàm học và

thích nghi được thực thi hoặc là ở dạng off-line hoặc bao gồm hoàn toàn trong

môđun chính

Hình 1.3 Hệ thống điều khiển phù hợp thông minh

Hình 1.4.Sơ đồ khối điều khiển Với bất kỳ quỹ đạo lệnh tải nào, bộ tạo setpoint sẽ tạo những quỹ đạo

setpoint cho những vòng điều khiển mức thấp hơn thông qua nhóm những ánh

xạ được thiết kế tối ưu Ánh xạ setpoint được thiết kế bằng cách giải bài toán tối

ưu nhiều đối tượng, trong đó những hàm đối tượng và hàm phù hợp của chúng

- 20 -

có thể là bất kỳ Phương pháp này cho phép tối ưu quá trình và cung cấp những phương pháp chỉ định chính sách vận hành cung cấp độ phân tán lớn những tình huống vận hành theo nhiều đối tượng vận hành Sơ đồ điều khiển truyền thẳng-hồi tiếp hai bậc tự do được đề xuất là một mở rộng của sơ đồ điều khiển hồi tiếp SISO tuyến tính với cả hai điều khiển truyền thẳng tham chiếu và nhiễu, cho trường hợp nhiều biến phi tuyến để đạt được vận hành diện rộng Bộ xử lý điều khiển truyền thẳng được thực thi dùng những hệ thống suy luận mờ MISO, được thiết kế từ dữ liệu vào ra xác lập, dùng kỹ thuật học mạng nơron Đường điều khiển hồi tiếp được thực thi như một sơ đồ điều khiển nhiều vòng phân tán dựa trên bộ điều khiển PID mờ và bù tương tác Những bộ điều khiển PID mờ kết hợp những kỹ thuật điều khiển gain-scheduling và multimode dùng hệ thống

suy luận mờ loại Sugeno

Trang 11

- 21 -

CHƯƠNG 2

MẠNG NƠRON, LÔGIC MỜ

VÀ NHỮNG ỨNG DỤNG CỦA CHÚNG

TRONG ĐIỀU KHIỂN QUÁ TRÌNH

Chương này sẽ thể hiện những ứng dụng nổi bật của mạng nơron trong điều

khiển quá trình Người ta nhận thấy rằng những phương pháp lai dùng mạng

nơron dang hứa hẹn nhiều triển vọng cho điều khiển những hệ thống phi tuyến

và/hoặc MIMO mà không thể điều khiển thành công bằng những kỹ thuật

truyền thống

2.1.Giới thiệu

Những kỹ thuật điều khiển truyền thống như điều khiển Tích phân tỉ lệ(PI)

hay điều khiển Vi tích phân tỉ lệ(PID) được ứng dụng thành công trong điều

khiển những quá trình tuyến tính Gần đây, Điều khiển tiên đoán mô hình

(MPC) cũng thực hiện thành công trong điều khiển những hệ thống tuyến tính

Tuy nhiên, khoảng 90% những quá trình sinh học và hoá học là phi tuyến cao

và hầu hết chúng là những hệ MIMO.Khi hệ thống là phi tuyến và/hoặc MIMO,

những kỹ thuật truyền thống trên thường mắc phải sai sót khi điều khiển những

hệ thống như thế Ngày nay, những hệ thống được dùng trong công nghiệp đòi

hỏi độ tự quản cao và những kỹ thuật trên không có khả năng để đạt được điều

này

Cần phải đạt được những đòi hỏi điều khiển tăng nhanh trong những hệ thống

điều khiển động phức tạp dưới những thay đổi quan trọng đã làm cho việc dùng

Mạng nơron (NN) trong những hệ thống điều khiển trở nên hấp dẫn Những lý

do chính đằng sau điều này là khả năng của chúng có thể “học” để xấp xỉ hàm

và phân loại mẫu và tiềm năng của chúng trong thực thi phần cứng song song

đồ sộ Nói cách khác, chúng có khả năng thực thi (cả phần mềm và phần cứng)

nhiều chức năng cần thiết để điều khiển hệ thống với một độ tự quản cao

Do có khả năng học những liên hệ hàm số phi tuyến phức tạp, mạng nơron

được dùng trong điều khiển những quá trình phi tuyến và/hoặc MIMO Trong

thập kỷ qua,ứng dụng mạng nơron trong nhận dạng và điều khiển đã tăng theo

hàm mũ

Những ứng dụng rộng rãi này là do những đặc tính hấp dẫn sau:

1 Mạng nơron có khả năng xấp xỉ bất kỳ hàm số phi tuyến nào;

2 Chúng có thể được huấn luyện dễ dàng bằng cách dùng những bản ghi dữ

2.2.Điều khiển quá trình

Trong phát triển, thiết kế và vận hành những máy móc quá trình, những kỹ sư quá trình luôn gắn liền với năm khái niệm cơ bản:trạng thái,trạng thái cân bằng, bảo toàn,tốc độ và điều khiển

Nhận dạng một hệ thống đòi hỏi xác định trạng thái nhiệt động theo đó tất

cả thuộc tính của một hệ thống là cố định Những hệ thống sinh học,vật lý và

hoá học không thể vận hành ngoài khoảng giới hạn của trạng thái cân bằng

nhiệt động, mà giới hạn khoảng cho phép của những điều kiện vật lý và hoá học

để quá trình diễn ra trong hệ thống

Bảo toàn khối lượng,động lượng và năng lượng yêu cầu những số lượng nào

đó cần được bảo toàn trong quá trình vì khối lượng, năng lượng và động lựơng cân bằng Đặc tính loại và kích thước của thiết bị quá trình của một hệ thống

phụ thuộc vào lượng vật liệu đưa vào quá trình và tốc độ tại đó những quá trình

sinh học, hoá học và vật lý diễn ra trong thiết bị Khái niệm này được bao trùm trong lĩnh vực động lực sinh học và hoá học

Một quá trình có thể khả thi cả về mặt nhiệt động và động lực nhưng vẫn không hoạt động vì hiệu suất vận hành kém Điều này có thể là kết quả của việc không điều khiển được của quá trình và vì những điều kiện không kinh tế Vì

thế,điều khiển hệ thống để thoả mãn hiệu suất vận hành, vật lý và kinh tế là rất

quan trọng trong thiết kế và vận hành một hệ thống quá trình cũng như khái niệm trạng thái cân bằng và tốc độ của quá trình

Điều khiển quá trình là sự điều chỉnh các quá trình sinh học, vật lý và hoá

học để loại bỏ những ảnh hưởng của nhiễu bên ngoài,để đảm bảo sự ổn định của quá trình và để tối ưu hiệu suất của quá trình

Một vài đặc tính quan trọng của điều khiển quá trình được lập danh sách ở đây:

 Xem xét điều khiển quá trình đầu tiên đòi hỏi xem xét những thay đổi phụ thuộc thời gian Vấn đề không thể được hình thành mà không có cấu trúc động Điều khiển bất kỳ quá trình nào chỉ có thể được xem xét cẩn thận bằng một phân tích chi tiết đáp ứng trạng thái không ổn định mà có được từ mô hình động của quá trình

 Những hệ thống điều khiển quá trình là những hệ thống xử lý thông tin Chúng nhận thông tin, xử lý nó, tương tác với nó và tạo thông tin như những tín hiệu

 Tất cả những hệ thống điều khiển quá trình là những hệ thống tích hợp những bộ phận, trong đó mỗi bộ phận ảnh hưởng hiệu suất toàn bộ của hệ

Trang 12

- 23 - thống Vì thế, phương pháp tổng quát xem xét toàn bộ hệ thống và môi

trường của nó như một thực thể là quan trọng

 Hầu hết hệ thống điều khiển quá trình là những hệ thống hồi tiếp trong đó

thông tin được tạo bởi hệ thống được xử lý lần nữa để điều chỉnh đáp ứng

của hệ thống

 Cuối cùng, tính kinh tế luôn liên kết với những đối tượng hiệu suất của hệ

thống điều khiển quá trình

Những hệ thống điều khiển quá trình trong công nghiệp như quá trình vật lý,

sinh học và hoá học được mô tả bởi những chuẩn hiệu suất và những thay đổi

của yêu cầu thị trường Cũng thế, những quá trình này là phi tuyến cao và

không thể được mô hình hoá thật tốt Vì thế, điều khiển phải được thực hiện

bằng cách cập nhật những biến được thao tác trực tuyến để thoả mãn thay đổi

chuẩn hiệu suất khi gặp phải thay đổi đặc tính của thiết bị Nhiều kỹ thuật điều

khiển dựa trên khác biệt chuẩn hiệu suất và miêu tả quá trình được dùng để giải

quyết những vấn đề này

Trong quá trình vận hành của một thiết bị, một vài yêu cầu cần được thoả

mãn và có thể được xem xét như những tiêu chuẩn hiệu suất Một vài chuẩn

được liệt kê ở đây:

1 Luật an toàn và môi trường,

2 Đặc tính sản phẩm,

3 Điều kiện vận hành,

4 Tính kinh tế

Những tiêu chuẩn này cần được chuyển dịch thành những biểu thức toán học

để viết luật điều khiển Chúng có thể được phân loại như những đối tượng(hàm

của những biến cần được tối ưu động) và hạn chế ((hàm của những biến cần

được giữ trong khoảng cần thiết)

Chuyển đổi chuẩn hiệu suất thành những biểu thức toán học có thể yêu cầu

vài giả định Những giả định này không những làm đơn giản cách giải quyết

vấn đề mà còn làm cho vấn đề có thể thực thi trong những phần cứng đang có

Tất cả những bộ điều khiển dùng một mô tả hay một mô hình của quá trình

Nói chung, trong những quá trình sinh học và hoá học, những mô hình là phi

tuyến và những thông số mô hình thường không biết được Vì thế, luôn luôn có

sự không phù hợp giữa tiên đoán mô hình và ngõ ra quá trình thật Những lý do

khác của sự khác biệt này là do những thay đổi trong những điểm vận hành và

thiết bị

Những khác biệt giữa một thiết bị và mô hình của nó tạo ra sự không thoả

mãn để cân bằng tiêu chuẩn hiệu suất Những thông số điều chỉnh được có thể

giúp cân bằng giữa theo dõi điểm đặt nhanh và đáp ứng biến thao tác trơn

Người ta luôn mong muốn tối thiểu lượng điều chỉnh trực tuyến bằng cách dùng

- 24 - một mô hình quá trình khi thiết kế mà bao gồm mô tả những trạng thái không rõ ràng

Mặc dù mô tả trạng thái không rõ ràng được dùng, luôn cần cập nhật những thông số mô hình trực tuyến theo cách thích nghi Bộ điều khiển tiên đoán mô hình (MPC) là những bộ điều khiển trong đó luật điều khiển dựa trên mô hình quá trình MPC là một hệ thống điều khiển trong đó bộ điều khiển xác định tiểu

sử biến được thao tác mà tối ưu đối tượng hiệu suất vòng lặp mở trong khoảng thời gian kéo dài từ thời điểm hiện tại đến thời điểm hiện tại cộng với khoảng thời gian tiên đoán MPC phù hợp cho những vấn đề có một lượng lớn những biến được thao tác hay được điều khiển, những hạn chế cho cả hai loại biến này,thay đổi điều khiển đối tượng và/hoặc sai sót thiết bị, và thời gian trễ Một

mô hình quá trình được thực hiện trực tiếp trong thuật toán để tiên đoán ngõ ra quá trình tương lai

Thường thì trong nhiều bài toán điều khiển quá trình,những mô hình điều khiển không được xác định tốt; hoặc là chúng mất hoặc những thông số hệ thống có thể biến đổi theo thời gian Mạng nơron có nhiều tiện lợi để thu được những mô hình vào-ra của hệ thống vì chúng có thể “bắt chước” đáp ứng của hệ thống sau khi được “huấn luyện“ Thậm chí mô hình mạng nơron hay nhận dạng có thể không phù hợp với thiết bị khi bắt đầu,nhưng nó sẽ trở nên tốt hơn khi tiến trình huấn luyện trực tuyến diễn ra Vì thế, huấn luyện trực tuyến làm cho mạng nơron nắm giữ những thông số thay đổi theo thời gian trong thiết bị một cách trực tiếp

Bằng cách huấn luyện mạng nơron để học “mô hình ngược” của một thiết bị,nó có thể được dùng như một “bộ điều khiển “ cho thiết bị này Những bộ điều khiển mạng nơron cũng có thể được dùng trong những cấu trúc MPC như

là những bộ đánh giá hay/và bộ điều khiển

Vì những quá trình sinh học và hoá học thường phức tạp, thay vì dùng mạng nơron một mình trong điều khiển những quá trình này, nên dùng chúng kết hợp với những phương pháp truyền thống như những kỹ thuật điều khiển PI hay PID hay những kỹ thuật gần đây như những hệ thống chuyên gia dựa trên quy luật hay lôgic mờ, theo cách lai ghép, sẽ cải tiến hiệu suất của toàn bộ điều khiển

2.3.Dùng Mạng nơron trong Điều khiển

Trong những ứng dụng hệ thống điều khiển, mạng nơron nhiều lớp feedforward với huấn luyện có giám sát thường được dùng nhất Một đặc tính chính của những mạng này là chúng có thể tạo những ánh xạ vào-ra mà có thể xấp xỉ bất kỳ hàm nào với độ chính xác mong muốn Mạng nơron được dùng trong những hệ thống điều khiển chủ yếu là nhận dạng và điều khiển hệ thống Trong nhận dạng hệ thống, để mô hình đáp ứng vào-ra của một hệ thống động, mạng được huấn luyện dùng dữ liệu vào-ra và trọng số mạng được điều

Trang 13

- 25 - chỉnh thường dùng thuật toán backpropagation(lan truyền ngược) Giả định duy

nhất là ánh xạ tĩnh phi tuyến được tạo bởi mạng có thể đại diện đầy đủ đáp ứng

động của hệ thống trong khoảng khảo sát của một ứng dụng cụ thể Mạng nơron

cần được cung cấp thông tin về lịch sử hệ thống : những ngõ vào và ra ở những

lần trước Bao nhiêu thông tin được yêu cầu phụ thuộc vào độ chính xác mong

muốn và ứng dụng cụ thể

Khi một mạng nhiều lớp được huấn luyện như một bộ điều khiển,hoặc như

một vòng lặp kín hay mở, hầu hết những vấn đề này đều tương tự trường hợp

nhận dạng Khác biệt cơ bản là ngõ ra mong muốn của mạng là ngõ vào điều

khiển thích hợp được dẫn đến thiết bị, là không có được nhưng phải được sưy ra

từ ngõ ra mong muốn của thiết bị Để đạt được điều này, người ta dùng hoặc là

xấp xỉ dựa trên mô hình toán học của thiết bị(nếu có được),hay mô hình mạng

nơron động của thiết bị hay thậm chí mô hình động đảo ngược của thiết bị

Mạng nơron có thể được kết hợp để nhận dạng và điều khiển thiết bị, vì thế

hình thành cấu trúc điều khiển thích nghi

Chúng ta sẽ giới thiệu vài cách cơ bản trong đó dữ liệu huấn luyện mạng

nơron có thể thu được trong những công việc liên quan đến điều khiển :

 Sao chép từ một bộ điều khiển hiện có: Nếu có một bộ điều khiển có

thể điều khiển một thiết bị,thì thông tin yêu cầu để huấn luyện một mạng

nơron có thể thu được từ nó Mạng nơron học sao chép bộ điều khiển

hiện có Một lý do để sao chép một bộ điều khiển hiện có là nó có thể là

một dụng cụ không thực tế để dùng, chẳng hạn như một chuyên gia

Trong một vài trường hợp,chỉ vài cặp vào-ra hữu hạn của một bộ điều

khiển mong muốn được biết Thì một mạng nơron có thể được huấn

luyện để thi đua với bộ điều khiển mong muốn bằng cách nội sưy những

cặp vào-ra này

 Nhận dạng hệ thống :Trong trường hợp nhận dạng,dữ liệu huấn luyện

có thể thu được bằng cách quan sát đáp ứng vào-ra của một thiết bị

Trong những trường hợp phức tạp hơn, ngõ vào mô hình có thể chứa vài

giá trị trễ của những ngõ vào thiết bị và mô hình mạng có thể là đệ quy

 Nhận dạng hệ thống ngược: Trong trường hợp này,ngõ vào mạng là

ngõ ra của thiết bị và ngõ ra của mạng là ngõ vào thiết bị Khi thu được

mạng nơron ngược của thiết bị,nó được cung cấp ngõ ra thiết bị mong

muốn và ngõ ra của nó là ngõ vào điều khiển mong muốn của thiết bị

Vấn đề chính với nhận dạng ngược là mô hình ngược của một thiết bị

không phải luôn luôn được xác định tốt

 Bộ điều khiển tiên đoán mô hình : Đầu tiên một mạng nơron nhiều lớp

được huấn luyện để nhận dạng mô hình thuận của thiết bị, sau đó một

mạng khác,ví dụ bộ điều khiển,sử dụng bộ nhận dạng này như một bộ

quan sát thiết bị trong một cấu trúc MPC Mô hình này có ưu điểm của

một bộ điều khiển thích nghi, nhưng nó đòi hỏi phải tính Jacobian của

ta giả thiết rằng f và g có thể được xấp xỉ đến một độ chính xác mong muốn bất

kỳ trên những tập đóng bởi mạng nơron nhiều lớp Do giả thiết này, bất kỳ thiết

bị nào cũng có thể được đại diện bởi một mô hình mạng nơron tổng quát hoá

Để nhận dạng một thiết bị,một mô hình nhận dạng được chọn dựa trên thông tin liên quan đến lớp mà nó thuộc Ví dụ, giả sử thiết bị có cấu trúc được mô tả bởi mô hình III, chúng ta có hai loại bộ nhận dạng:

2.3.1 Mô hình song song: Trong trường hợp này, cấu trúc của bộ nhận dạng

giống hệt thiết bị với f và g được thay thế bởi những mạng nơron N1 và N2 tương ứng Mô hình này được mô tả bởi phương trình:

(2.5)

2.3.2 Mô hình song song-nối tiếp: Mô hình này được mô tả bởi phương trình:

(2.6) Khi một thiết bị được nhận dạng, một bộ điều khiển thích hợp có thể được thiết kế dựa trên mô hình nhận dạng này Khi nhiễu bên ngoài không hiện diện trong hệ thống,có thể điều chỉnh những thông số nhận dạng và điều khiển đồng thời Tuy nhiên, khi có nhiễu hiện diện, cập nhật thông số bộ điều khiển được thực hiện với thời gian chậm hơn để đảm bảo độ tin cậy

Trang 14

- 27 -

2.4 Mạng nơron cấu trúc truyền thẳng

Những mạng nơron thông minh là những mô hình cấu trúc tính toán sinh học

đặc biệt, gồm những đơn vị xử lý thông tin phân tán và vì thế sở hữu những khả

năng của tính toán song song Cơ sở của mạng nơron thông minh là nó có nhiều

đơn vị xử lý được kết nối với nhau, được gọi là những nơron mà hình thành

những cấu hình đặt lớp Ứng xử của mỗi nơron là đơn vị tính toán cơ bản mô tả

những hoạt động xử lý thông tin nơron Mỗi đơn vị tính toán trong mạng dựa

trên khái niệm nơron lý tưởng Một nơron lý tưởng được giả sử là đáp ứng tối

ưu với những ngõ vào Mạng nơron là một tập hợp những đơn vị nơron như thế,

trong đó những nơron đơn được kết nối thông qua những kết nối khớp phức tạp

được đặc tính bởi những hệ số trọng số và mỗi nơron tạo phân phối của nó

hướng đến những đặc điểm tính toán của toàn bộ hệ thống

Về bản chất, những nơron sinh học rất nhiều cảm biến phức tạp, điều khiển,

và nhận dạng những khía cạnh toán học và những quá trình tạo quyết định Rất

nhiều ánh xạ toán học phức tạp và những hàm xử lý có thể được đồng nhất với

những quá trình sinh học Việc nghiên cứu những mô hình toán học của những

đơn vị nơron bắt đầu tại thời điểm khi mà bài toán mô tả toán học của bộ não

con người thu hút sự chú ý của những nhà nghiên cứu Mô hình đầu tiên của

nơron được đề xuất bởi McCulloch và Pitts năm 1943 Gần đây, việc phát triển

những phương pháp thích nghi đã đưa ra cơ hội giả hàm học của những quá

trình nơron sinh học Một vài mô hình nơron như thế được phát triển vào thập

niên 60 Nói chung, như một bộ xử lý thông tin, một nơron đơn thực hiện một

kết hợp trên những ngõ vào được trọng số của nó và tạo ra một ngõ vào thông

qua hàm kích hoạt phi tuyến với một ngưỡng

Ngay từ đầu lấy ý tưởng từ những nơron trong bộ não con người, những

nơron thông minh là những đơn vị xử lý tín hiệu được sắp xếp thành những

mạng được kết nối để thực hiện những công việc xử lý thông tin phức tạp chẳng

hạn nhận dạng đặc tính, nhóm dữ liệu và phân loại, xấp xỉ hàm,… Một mô hình

tổng quát của một nơron thông monh được xem như một hàm xử lý ngõ vào và

một hàm xử lý ngõ ra

Hình 2.1.Nơron thông minh

- 28 - Hàm ngõ vào f(.), kết hợp tất cả những tín hiệu vào thành một ngõ vào mạng đơn.Thông thường, một hàm ngõ vào là một kết hợp tuyến tính của những ngõ vào xi:

(2.7) với wi i=1,…,n được gọi là những trọng số liên kết Hàm ngõ ra g(.) cung cấp tín hiệu ngõ ra của nơron với toán hạng ngõ vào mạng được cho bởi f Hàm ngõ

ra thường dùng là hàm sigmod:

(2.8) Một mạng nơron thông minh là một mảng gồm những nơron liên kết với nhau Giữa nhiều cấu hình kết nối khác nhau, một cấu hình thông thường và hữu dụng nhất là mạng truyền thẳng nhiều lớp, trong đó không có nơron ngõ ra nào là ngõ vào cho một nơron trong cùng hay thuộc lớp đứng trước Đây là điểm nổi bật nhất của loại mạng này

Hình 2.2.Mạng truyền thẳng nhiều lớp Lớp nơron nhận ngõ vào mạng được gọi là lớp ngõ vào Lớp ngõ vào không thực hiện bất kỳ công việc xử lý tín hiệu nào mà chỉ phân bố những tín hiệu vào Những ngõ ra mạng được tạo bởi lớp ngõ ra Bất kỳ lớp nào nằm giữa lớp ngõ vào và ngõ ra đều được gọi là lớp ẩn vì nó không có liên hệ trực tiếp với môi trường mạng

2.4.1.Hàm truyền

Có nhiều loại hàm truyền,nhưng có ba loại thông dụng nhất là:

Trang 15

- 29 -

Hình 2.3.Hàm truyền bước Hàm truyền này giới hạn ngõ ra của nơron là 0,nếu đối số ngõ vào mạng n nhỏ

hơn hay bằng 0;hay 1 nếu n lớn hơn hay bằng 0

Hình 2.4 Hàm truyền tuyến tính

Hình 2.5 Hàm truyền sigmod Hàm truyền sidmod nhận ngõ vào,có bất kỳ giá trị nào và tạo ngõ ra nằm trong

khoảng 0 và 1

2.4.2 Thích nghi và học cho những thành phần ngưỡng nơron

Một công việc quan trọng là làm cách nào để thiết kế một thuật toán hiệu quả

để thích nghi những trọng số và ngưỡng của một đơn vị Lập trình tuyến tính có

thể cung cấp một giải pháp thay thế cho một tập những bất phương trình mà có

thể nhận được từ một hàm chuyển mạch được cho Vì tất cả những giá trị hợp lý

của hàm này hiện diện trong một chương trình tổng hợp như thế tại cùng thời

điểm, thuật toán này được xem là có bản chất song song Trong trường hợp này,

một máy tính được lập trình để thực hiện một chương trình mà phải có đủ bộ

- 30 - nhớ để lưu trữ toàn bộ hàm chuyển mạch hoặc là một bảng kết hợp hay một hàm Boolean

Đối ngược với điều trên có một số chương trình mà có thể thực hiện theo vòng lặp hay theo chuỗi Nghĩa là, tại bất kỳ thời điểm nào , chương trình cho một giá trị hàm chỉ với một kết hợp ngõ vào và không cần bộ nhớ để lưu trữ những giá trị hàm ở các thời điểm trước Cần có bộ nhớ để lưu trữ ước lượng hiện thời của chương trình cho việc nhận dạng đúng và chứa những giá trị trọng

số và ngưỡng Khi giá trị hàm cho một vài kết hợp ngõ vào thì có được một tín hiệu lỗi giữa giá trị hàm này và ước lượng hiện thời và được hồi tiếp để mà chương trình có thể thay đổi ước lượng hiện thời nhưng không lưu trữ thông tin khác Ý tưởng là sau mỗi hiện diện của ngõ vào với một lượng thời gian đủ thì ước lượng của chương trình sẽ hội tụ đến đến một giá trị đúng Loại chương trình này được gọi lả thích nghi hay học vì mối liên hệ nào đó đến những quá trình trong những nơron sinh học

Cho một tập gồm n biến ngõ vào x1,x2,…,xn như hình sau, ngõ ra của bộ kết hợp tuyến tính(linear combiner) được xác định đơn giản như sau:

(2.9) Định nghĩa những véctơ đối số của những ngõ vào và trọng số nơron , ta có:

(2.10)

Hình 2.6.Sơ đồ khối của một bộ kết hợp tuyến tính

Trang 16

Vì thế, với một hàm chuyển mạch f(x1,x2,…,xn) một quá trình thích nghi cho

những thành phần ngưỡng có thể được xem như một bộ kết hợp tuyến tính được

đặt nối tiếp với hàm giới hạn như trong hình 1.4 Tín hiệu lỗi giữa hàm chuyển

mạch đã biết và ngõ ra của thành phần ngượng nơron được cho như sau:

(2.12) với d(k) = f(x1,x2,…,xn) là một hàm của những biến xi, i=1,…,n Thuật toán

thích nghi là một chương trình tối thiểu hàm lỗi sẽ được bàn đến sau

2.4.3 Luật thích nghi Perceptron

Luật học perceptron nhị phân của Rosenblatt cho một thành phần ngưỡng được

thể hiện lần đầu tiên vào năm 1958 Cho một đáp ứng mong muốn d(k), việc

thích nghi được cập nhật với với luật perceptron dùng một “lỗi lượng tử hoá”

e(k), được định nghĩa là khác biệt giữa đáp ứng mong muốn và ngõ ra của thành

phần ngưỡng

(2.13) chỉ có ba giá trị hợp lý cho e(k):

- 32 -

Như trong chương trình được dùng cho giải thuật LMSđược mô tả trong phần sau, cho  a k là một ước lượng của véctơ trong số tại thời điểm k Ta có thể viết lại lỗi tức thời e(k) như sau:

(2.14) Với một ngõ vào cố định x(k) và đáp ứng mong muốn d(k), lỗi tức thời mới liên quan với những thông số trọng số được cập nhật tại thời điểm (k+1) được viết như sau:

(2.15) với

(2.16) Mục đích của chúng ta là tìm một luật cập nhật trọng số  a k để mà

e(k+1)0 (2.17) hay

(2.18) Nếu e(k)=2

Hay tương đương d(k)=1 và

Có thể chọn

(2.19)

để mà

(2.20) Ngược lại, nếu

e(k)=-2 hay tương đương

(2.23)

Và

(2.24) Trong đó  0 được gọi là tốc độ học

Trang 17

- 33 -

Từ (2.23), ta kết luận rằng sự thay đổi  i k tương quan với tín hiệu ngõ vào

xi(k) và tín hiệu lỗi e(k) Nếu sự tương quan là 0, nghĩa là e(k)xi(k)=0 thì thay

đổi  i k cũng là 0 Sơ đồ khối của thuật toán cập nhật được cho trong hình 2.8

Hình 2.8 Những thành phần với luật thích nghi perceptron

2.4.4 Luật thích nghi Mays

Một luật học biến thể của luật học -perceptron được thể hiện ở hình 2.9 được

gọi là luật học May Thích nghi tăng dần ở dạng tổng quát của nó dùng một

“vùng chết” với bán kính  0cho ngõ ra tuyến tính

(2.25) Nếu ngõ ra s(k) nằm ngoài vùng chết , nghĩa là

 k 

s (2.26) Thì thích nghi theo sau một biến đổi chuẩn hoá của luật perceptron tăng dần cố

định với  x a 2 được dùng thay cho  Nếu ngõ ra tuyến tính nằm trong

vùng chết s k , thì bất kể đáp ứng ngõ ra y(k) đúng hay không những trọng

số được cập nhật bởi biến đổi chuẩn hoá của luật học -perceptron với

Hình 2.9 Luật thích nghi Mays với ngõ ra tuyến tính và lỗi tuyến tính

Về mặt toán học, thuật toán thích nghi tăng dần Mays được diễn tả như sau:

với e(k) là lỗi lượng tử tại thời điểm k được định nghĩa như sau:

e(k)=d(k)-sgn(s(k))

và d(k) là đáp ứng mong muốn tại thời điểm k

Hiển nhiên là nếu bán kính của vùng chết là 0 Thì luật thích nghi Mays trở thành luật thích nghi perceptron

2.4.5 Thành phần tuyến tính thích nghi (ADALINE)

Thành phần tuyến tính thích nghi (ADALINE) được dùng như là khối xây dụng

cơ bản trong nhiều mạng nơron truyền thẳng, được nghiên cứu lần đầu tiên bởi Widrow và các đồng sự trong thập kỷ 1960 Một bộ kết hợp tuyến tính thích nghi đơn giản được cho ở hình 2.10, với ngõ ra của đơn vị là tổng trọng số của tất cả ngõ vào

Để thực hiện quá trình thích nghi trong miền thời gian rời rạc, người ta giả sử rằng thành phần này nhận véctơ đặc tính ngõ vào x(k)=[x1(k),…,xn(k)]T và một đáp ứng mong muốn d(k), là một hàm của thời điểm k Những thành phần của véctơ ngõ vào được trọng số bởi một tập những hệ số hay trọng số được biểu thị bởi véctơ trong số w=[w1,…,wn]T trong đó những thành phần của nó có cả những giá trị dương và âm Dùng ký hiệu của những véctơ đối số, một ngõ ra tuyến tính tại thời điểm k có được bằng tích của véctơ đặc tính ngõ vào và véctơ trọng số như sau:

Trang 18

- 35 -

(2.27)

Hình 2.10.Thành phần tuyến tính thích nghi (ADALINE)

2.4.6 Giải thuật LMS(Bình phương trung bình nhỏ nhất)

Giải thuật LMS cung cấp một công thức thích nghi hiệu quả và đơn giản cho

những trọng số của bộ kết hợp tuyến tính trong hình 2.10 Giải thuật này có

được dùng nguyên tắc nhiễu nhỏ nhất và được đề xuất bởi Widrow và

Hoff(1960)

Cho wa(k)=[w0(k),…,wn(k)]T là một ước lượng của véctơ trọng số wa tại thời

điểm k Lỗi tuyến tính giữa đáp ứng mong muốn d(k) và ngõ ra tuyến tính s(k)

với ước lượng hiện thời của những trọng số wa(k) được định nghĩa như sau:

(2.28) Lỗi kế tiếp được định nghĩa là khác biệt giữa đáp ứng mong muốn d(k) và ngõ

ra tuyến tính s(k) với những ước lượng kế tiếp của những trọng số wa(k+1) là:

(2.29)

Có thể thấy rằng tại thời điểm k thay đổi trọng số sẽ dẫn đến những thay đổi

tương ứng của lỗi:

(2.30) Công việc kế tiếp là tìm một luật cập nhật để mà lỗi el(k) sẽ hội tụ tiệm cận đến

0 Để bảo đảm rằng sự hội tụ của lỗi phụ thuộc vào cập nhật trọng số, ta giả sử

(2.31) Nghĩa là:

- 36 -

với là một hằng số được chọn để mà lỗi el(k) sẽ ổn định tiệm cận:

(2.32) Như vậy ta có được:

(2.33) Nhân cả hai vế của phương trình này với xa(k) ta được

(2.34)

Vì thế ,cuối cùng ta có được:

Do đó

(2.35) Đây là một số gia Phương trình (2.52) là luật Widrow-Hoff delta Với một giá trị ban đầu bất kỳ của el(0),el(k) có thể được diễn tả như sau:

0  (2.38) Không giống như luật perceptron, ngõ vào của một Adaline có thể là nhị phân hay tương tự Một Adaline có thể được dùng để nhận ra những hàm ngưỡng bằng cách hiệu chỉnh thích hợp những trọng số Thậm chí nếu cả hai luật học perceptron và LMSđược dùng trong những chương trình sữa lỗi và có những

công thức cập nhật tương tự, chúng vẫn có những ứng xử khá khác biệt(Widrow and Lehr 1990) Khác biệt chính giữa hai thuật toán này là luật của Rosenblatt khai thác một lỗi lượng tử e=(d-sgn(s)) trong khi giải thuật LMSkhai thác lỗi

tuyến tính el=d-s Điều này có nghĩa là giải thuật perceptron gồm một hàm phi tuyến của những tín hiệu qua hàm truyền bước, ngược lại giải thuật LMSlà một quá trình tuyến tính

Trang 19

- 37 -

2.4.7 Phương pháp lỗi bình phương trung bình

2.4.7.1 Công thức không lặp lại

Theo Widrow và Lehr, khái niệm lỗi bình phương trung bình có thể được dùng

để xác định véctơ trọng số cho một ngõ vào và những đặc tính dữ liệu mong

muốn dùng giải thuật lặp hay không lặp Không mất tính tổng quát, giả sử rằng

ngõ vào x(k) và ngõ ra mong muốn d(k) được rút từ việc thống kê Bình phương

của lỗi giữa ngõ ra của bộ kết hợp tuyến tính và ngõ ra mong muốn tại thời

điểm k được mở rộng như sau:

(2.39)

Vì bộ kết hợp tuyến tính sẽ tạo ra một lỗi el(k) tại mỗi thời điểm k, trung bình

toán bộ của bình phương lỗi trong (2.39) là:

(2.40) Thuật ngữ bên trái được gọi là lỗi bình phương trung bình (MSE) Đặt:

là véctơ tương quan chéo giữa ngõ ra mong muốn d(k) và véctơ ngõ vào nơron

xa(k)

Tương tự, định nghĩa ma trận tương quan ngõ vào R

Là một ma trận xác định dương,đối xứng và thực hay trong những trường hợp ít

gặp hơn là ma trận bán xác định dương Vì thế lỗi bình phương được viết lại

như sau:

(2.41) Gradient  a của hàm MSE tương ứng với véctơ trọng số wa có được bằng

cách đạo hàm (2.41) như sau:

- 38 - Đây là một phương trình véctơ tuyến tính của véctơ trọng số Véctơ trọng số tối

ưu w* cũng được gọi là véctơ trọng số Wiener đạt được bằng cách đặt gradient

là 0 Vì thế trọng số tối ưu là:

wa=R-1p (2.42) Cách giải này gồm một chương trình tính toán nghịch đảo ma trận R Với số lượng lớn những ngõ vào, điều này có thể dẫn đến việc tốn rất nhiều thời gian, thậm chí một vài giải thuật tính ma trận cải tiến chẳng hạn phân rã giá trị suy biến(SVD) được dùng để tránh tính nghịch đảo ma trận trực tiếp Vì thế, một phương pháp giảm gradient lặp sẽ được giới thiệu để giải quyết việc tín toán phức tạp này

2.4.7.2 Gải thuật bình phương tring bình nhỏ nhất LMS

LMS

 có thể được phát triển từ phương pháp giảm gradient truyền thống, nơi

mà việc tìm kiếm véctơ trọng số tối ưu được tím kiếm trong không gian trọng

số dọc theo hướng được cung cấp bởi gradient của một lỗi bình phương tức thời giữa ngõ ra hiện thời và ngõ ra mong muốn Vì nó là một hàm bình phương cùa những trọng số, bề mặt này là lồi và có một tối thiểu toàn cục duy nhất Từ (2.57) gradient tức thời có thể đạt được dựa trên hàm lỗi tuyến tính tức thời như sau:

(2.43)

Vì thế, giải thuật học giảm gradient được viết như sau:

(2.44) Đây là giải thuật LMScủa Widrow, với tốc độ học  0 quyết định độ hội tụ của chương trình học Theo Widrow và Lehr , phải thoả:

(2.45) Giải thuật LMS hội tụ trung bình đến w*, là cách giải Wiener tối ưu được cho bởi (2.43)

Thể hiện hình học của luật LMSđược cho trong hình 2.11 Theo (2.44) wa(k+1) bằng với wa(k) cộng với một số gia  a k mà tương ứng với véctơ đặc

Trang 20

- 39 - tính ngõ vào xa(k) Nói cách khác, biến đổi của lỗi phụ thuộc vào biến đổi của

véctơ trọng số bằng với tích âm của xa(k) và  a k Vì giải thuật LMS chọn

 k

a



 cộng tuyến với xa(k), tương quan lỗi mong muốn đạt được với biến đổi

véctơ trọng số có biên độ ổn định Khi việc cập nhật tương ứng hoàn hảo với

đặc tính ngõ vào mới, những đáp ứng với những đặc tính huấn luyện trước đây

sẽ được cập nhật tối thiểu

Hình 2.11 Giải thích hình học của những giải thuật LMSvà LMS

Khi so sánh hai thuật toán LMSvà LMS, điều thú vị là luật LMS là

một phiên bản tự chuẩn hoá của luật LMSvì luật LMSdễ dàng được viết

như sau:

(2.46) với

(2.47) tương ứng là lỗi chuẩn hoá, đáp ứng mong muốn chuẩn hoá và những đặc tính

ngõ vào chuẩn hoá Phương trình (2.65) là luật học LMSvới 2được thay

bởi  Vì thế, cập nhật trọng số được thiết kế bởi luật LMStương đương với

giải thuật LMSvới sự hiện diện của một tập huấn luyện khác là tập huấn

luyện được chuẩn hoá định nghĩa bởi phương trình (2.66)

- 40 - Một phiên bản thời gian liên tục của giải thuật LMS ở trên có thể dễ dàng đạt được bằng cách tối thiểu hàm lỗi

(2.48)

là ước lượng tức thời của lỗi bình phương trung bình và wa(t) là một ước lượng của véctơ trọng số wa tại thời điểm t Áp dụng phương pháp giảm gradient độ dốc lớn nhất ta được:

(2.49)

Sơ đồ khối của việc thực thi giải thuật LMS thời gian liên tục dùng những

bộ nhân và tích phân tương tự được cho trong hình 2.12

2.5 Giải thuật lan truyền ngược cho mạng nơron truyền thẳng nhiều lớp(MFNN)

Bây giờ chúng ta sẽ nói về những giải thuật lan truyển ngược(BP) một cách chi tiết

Một mạng truyền thẳng nhiều lớp có khả năng xấp xỉ rất nhiều hàm phi tuyến với độ chính xác mong muốn, nó được khai thác rộng rãi trong các ứng dụng như những bài toán nhận dạng và điều khiển hệ thống, nhận dạng đặc tính Bây giờ chúng ta sẽ đề cập đến mô hình tổng quát và giải thuật học BP của MFNN

Hình 2.12 Sơ đồ khối của giải thuật LMS thời gian liên tục

Trang 21

- 41 -

2.5.1 Cấu trúc nơron tổng quát cho MFNN

Trong một MFNN những nơron được tổ chức trong những lớp mà không có

đường hồi tiếp hay liên kết chéo Lớp thấp nhất của MFNN là lớp ngõ vào trong

đó những thành phần xử lý nhận tất cả những ngõ vào và ngõ ra cung cấp cho

những thành phần xử lý của lớp ẩn thứ nhất Lớp cao nhất của MFNN là lớp

ngõ ra Những ngõ ra từ một lớp bất kỳ sẽ chỉ truyền đến lớp cao hơn Mỗi cấu

trúc cơ bản của những MFNN với những kết nối truyền thẳng được thể hiện

trong hình 2.13

Chúng ta sẽ đánh số những lớp nơron từ lớp thứ nhất và gọi M là tổng số lớp

của MFNN gồm lớp ngõ vào, ngõ ra và lớp ẩn

Gọi nơron thứ I trong lớp thứ s được biểu thị bởi neuron(s,i) và ns là tổng số

nơron trong lớp thứ s Ngõ vào lớp thứ nhất ( lớp ngõ vào) là n

R

x  Ngõ ra của lớp đầu tiên là một hàm phi tuyến của tổng những ngõ vào nhân hệ số, và

những ngõ ra này sẽ được truyền đến tất cả những đơn vị nơron trong lớp thứ

hai Quá trình này tiếp tục cho những lớp kế Những định nghĩa cơ bản cùng với

ý nghĩa được dùng trong MFNN được lập danh sách trong bảng 2.1 Xử lý tín

hiệu trong mỗi nơron đơn được cho trong hình 2.14

Hình 2.13 Một mạng nơron truyền thẳng nhiều lớp với lớp ngõ vào, ngõ ra và

- 42 - wjl(i)

Số lượng nơron trong lớp thứ i

Số lớp trong mạng

Hình 2.14 Thể hiện sơ đồ khối của neuron(i,j) trong lớp thứ i

Hình 2.15 Những hoạt động nhân trọng số và kết hợp trong neuron(i,j)

Về mặt toán học, những hoạt động này được xác định như sau:

(a) Hoạt động nhân trọng số:

(b) Hoạt động kết hợp

Phương trình thứ nhất thể hiện hoạt động nhân trong đó những tín hiệu sẽ được nhân bởi những trọng số trên đường kết nối và những phương trình thứ

Trang 22

- 43 - hao và thứ ba thực thi hoạt động kết hợp gồm tổng của tất cả ngõ ra và ngưỡng

Hoạt động phi tuyến này được viết lại như sau:

ra thứ l của mạng Véctơ ngõ ra nhiều chiều từ lớp (i-1) sau đó được dùng trực

tiếp như véctơ ngõ vào của lớp thứ i

Những dạng đối số của những ngõ vào nơron và những trọng số nơron được

viết như sau:

Việc giới thiệu những véctơ ngõ ra đối số và những ma trận trọng số phụ

thuộc vào sự tồn tại của ngưỡng trong hàm kích hoạt nơron phi tuyến Với

những ký hiệu này, phương trình hoạt động và hàm truyền của mạng được viết

như sau:

(2.50)

Tổng trọng số nT trong một mạng MFNN được cho bởi:

với số hạng thứ nhất là số lượng của tất cả những trọng số kết nối và số hạng

thứ hai là số lượng của tất cả ngưỡng

Một thể hiện tường minh của mối liên hệ vào-ra của mạng với véctơ ngõ vào

n chiều x  R n và véctơ ngõ ra m chiều y 1 , 1m được cho như sau:

- 44 -

(2.51)

với

Và

Thể hiện trên sơ đồ cùa ánh xạ tuyến tính này được cho ở hình 2.16

Hình 2.16 Ánh xạ tuyến tính được thực thi bởi mạng nơron truyền thẳng M lớp

Vì hàm kích hoạt phi tuyến  .là liên tục và đạo hàm được hàm ánh xạ f(.) trong phương trình (2.41) là một hàm phi tuyến liên tục và đạo hàm được từ không gian vào đến không gian ra Vì thế, hàm ánh xạ phi tuyến f(.) chứa những trọng số kết nối có thể được xem như hàm ánh xạ nơron phi tuyến từ không gian đặc tính ngõ vào đến không gian đặc tính ngõ ra, nơi mà hàm ánh xạ này được hình thành thông qua quá trình học ngược với lập trình trước trong những phương pháp truyền thống Nói cách khác, trong cấu trúc MFNN, thông tin ngõ vào được truyền thẳng đệ quy đến những lớp ẩn cao hơn và cuối cùng là lớp ngõ ra Vì lý do này mà mạng được gọi là mạng lan truyền Vì quan hệ vào-

ra của một MFNN được mô tả bởi những phương trình đại số tĩnh, những ngõ

Trang 23

- 45 -

ra mạng được tính khá dễ Những mạng MFNN là những mạng nơron tĩnh và

không có bất kỳ bản chất động nào Mặc dù phiên bản mở rộng của MFNN có

thể có tính động

2.5.2 Thiết lập giải thuật lan truyền ngược

Giả sử rằng ta đã có véctơ ngõ ra mong muốn d(k), thuật toán BP cho mang

MFNN sẽ tối thiểu hàm lỗi E là tổng bình phương của các sai lệch giữa ngõ

mong muốn d(k) và những ngõ ra mạng nơron thực sự y(k) đã đề cập ở trên,

được cho như sau:

(2.52) với

(2.53)

(2.54)

Hình 2.17 Giải thuật BP để thích nghi những trọng số wj(i) của nơron(i,j)

Điều kiện ban đầu để tính toán đệ quy là từ lớp ngõ ra như sau:

- 46 - (2.55) với

(2.56) với một nơron thì giải thuật học trọng số ở trên được cho trong hình 2.17 Và xử

lý tín hiệu thuận và ngược trong hình 2.18 Ở đây, đường thuận được dùng để lan truyền tín hiệu hàm ngõ vào trong khi những đường ngược được thiết kế để truyền những tín hiệu ngõ ra

Hình 2.18 Sơ đồ của quá trình lan truyền thuận của tín hiệu vào và ngược của

tín hiệu lỗi giữa lớp thứ i và lớp thứ (i+1)

2.5.3 Tính toán đệ quy cho  s

Trang 24

- 47 - Những công thức cập nhật được cho trong (2.52) - (2.56) gồm tính toán đệ quy

cho  sdần dần từ lớp ngõ ra cho đến những lớp ẩn thấp hơn Khai triển những

phương trình trên bằng cách đạo hàm riêng phần  sta được:

Gradient của E tương ứng với những véctơ trọng số là:

Trong đó toán hạng thứ hai bên tay phải chỉ phụ thuộc vào đặc tính của nơron

và không liên quan đến hệ số đo lỗi E Vì thế, từ:

Ta có được

(2.57) Điều này cho thấy đã rút được BP từ những phương trình (2.52)-(2.56) Trong suốt pha học BP như thế, mỗi thể hiện đặc tính trong những thành phần ngõ ra khác với những thành phần mong muốn Sau thể hiện toàn tập dữ liệu, những thông số mạng được sữa đổi được mô tả bởi những trọng số và ngưỡng

mà tối thiểu lỗi bình phương trung bình E

Thuật ngữ lan truyền ngược được dùng để thể hiện một giải thuật học có giám sát hoàn toàn với việc chọn lựa cụ thể hàm truyền nơron và luật cập nhật trọng số Nói cách khác, thật là tiện lợi để dùng nó khi thể hiện những thành phần đơn của giải thuật này mà xác định những đạo hàm riêng phần liên quan bằng lan truyền ngược Điều này đơn giản là một chuỗi những tính toán Vì thế, giải thuật lan truyền ngược là một giải thuật học có giám sát mà dùng lan truyền ngược để tính những đạo hàm riêng phần

2.6 Thiết lập giải thuật BP dùng nguyên tắc sai phân

Giải thuật học BP được xem như là một trong những chương trình học hiệu quả nhất cho MFNN Một lý do cho việc thành công của giải thuật này là tính đơn giản của nó Thực tế, giải thuật BP có nhiều ứng dụng hơn là chỉ trong chuỗi mắc xích và phương pháp giảm gradient

Có nhiều phương pháp để thiết lập giải thuật BP Cách đơn giản nhất được thể hiện ở phần trên Bên cạnh đó nguyên tắc sai phân cũng được dùng để đạt được những công thức giải thuật BP Phương pháp này lấy ý tưởng từ lý thuyết điều khiển tối ưu, mà dùng những bộ nhân Lagrange để tìm những giá trị tối ưu cho những biến điều khiển Tính toán sai phân có thể giúp chúng ta tìm một hàm mà tối thiểu hàm mục tiêu có những ràng buộc Một chương trình để đạt được giải thuật BP được thể hiện ở ngay phần sau

Trang 25

- 49 -

2.6.1 Những điều kiện tối ưu

Một MFNN có M lớp nơron, những phương trình mạng hay hàm truyền của

những nơron trong những lớp khác nhau là:

Bài toán tối ưu thông số cho một công việc cụ thể được mô tả như sau:

(2.58)

Để giải bài toán trên, ta dùng phương pháp Lagrange

(2.59) với  iR là những hệ số nhân Lagrange Như ta thấy L gồm hai toán hạng

Toán hạng đầu tiên là lỗi ngõ ra bình phương và toán hạng thứ hai phụ thuộc

vào những phương trình mạng mà cung cấp những ràng buộc cho những thông

số của MFNN Sai phân lần đầu ta được:

(2.60) Điều kiện cần là cho   0 sẽ xác định tối thiểu cục bộ cho hàm lỗi E tương

ứng với những phương trình ràng buộc mạng Điều kiện này mô tả hoàn toàn

ứng xử của mạng, suy ra những điều kiện tối ưu sau:

là những toán hạng gradient Phương trình thứ ba không thể hiện cập nhật trực tiếp trọng số, nhưng nó thể hiện điều kiện tối ưu cần phải thoả mãn

Dễ dàng thấy rằng (2.61) thể hiện những phương trình mạng Từ (2.62) ta có:

(2.64)

Và

(2.65) Phương trình tối ưu thứ ba (2.56) thể hiện:

(2.66) Nghĩa là

(2.67) Điều kiện này nói rằng những véctơ trọng số waj(i) tương ứng với điểm tĩnh L là một tối thiểu cục bộ hay một điểm yên ngựa

2.6.2 Cập nhật trọng số

Tìm một điểm cực tiểu của hàm lỗi tương ứng với những véctơ trọng số tương đương với tìm cực tiểu của L trong khi thoả mãn những phương trình mạng và phương trình (2.60) Những phương trình mạng (2.64) và (2.67) tạo thành một hệ thống hoàn chỉnh cho bài toán được thể hiện bởi một bài toán giá trị biên hai điểm Không có cách giải nào May mắn thay, phương pháp giảm gradient cung cấp giải thuật lặp trọng số sau:

(2.68) Thế kết quả này vào (2.59) và (2.60) ta được:

(2.69)

Trang 26

- 51 - tương đương với những công thức cập nhật BP ở phần trước với những liên hệ

sau:

Rõ ràng chương trình này đơn giản hơn chương trình dùng phương pháp giảm

gradient và luật chuỗi

2.6.3 Chuyển đổi không gian thông số

Giải thuật BP dựa trên phương pháp giảm gradient thường được xem như là

một quá trình tìm kiếm lặp cho điểm cực tiểu của hàm lỗi trong không gian

trọng số Trong một vài trường hợp, điều thú vị là những trọng số không phải là

những biến độc lập mà là một hàm của vài thông số cơ sở trong không gian

thông số Những hàm dùng những thông số cơ sở được xem xét ở hai khía cạnh:

(1) điều này cho phép người thiết kế đưa những kiến thừc ưu tiên về công việc

vào trong mạng ( ví dụ một vài bất phương trình ràng buộc giữa vài trọng số để

làm cho đáp ứng của mạng bất biến với một vài loại tín hiệu nào đó) và (2) khi

không gian trọng số thiếu điều kiện hay quá phức tạp để tìm kiếm những hàm

truyền xấp xỉ có thể được dùng để cải thiện những đặc tính hình học của nó và

(2.70) Hay tương đương:

(2.71)

Vì thế, giải thuật lặp cho véctơ thông số đạt được như sau:

(2.72) Nghĩa là

(2.73)

2.7 Mô hình mờ Takagi-Sugeno và bù phân tán song song

Những năm gần đây những hệ thống điều khiển mờ dùng trong những ứng dụng

kỹ thuật đã phát triển nhanh chóng Một số lượng lớn những ứng dụng thành

- 52 - công của điều khiển mờ đã tạo nên những động lực để phân tích và thiết kế những hệ thống điều khiển mờ Trong phần này sẽ giới thiệu mô hình mờ Takagi-Sugeno và bù phân tán song song, một cấu trúc bộ điều khiển phù hợp với những mô hình mờ

Phần này sẽ bắt đầu với việc giới thiệu mô hình mờ Takagi-Sugeno (mô hình

mờ TS) và những chương trình để xây dựng những mô hình mờ như thế Vì thế việc thiết kế bộ điều khiển mờ dựa trên mô hình dùng khái niệm “bù phân tán song song” sẽ được mô tả sau đó Ý tưởng chính của việc thiết kế bộ điều khiển

là nhận được mỗi luật điều khiển bù mỗi luật của một hệ mờ

Hệ mờ liên tục:CFS Luật mô hình thứ i:

Nếu z1(t) là Mí và … và zp(t) là Mip thì

(2.74)

Hệ mờ rời rạc:DFS Luật mô hình thứ i:

Nếu z1(t) là Mí và … và zp(t) là Mip thì

(2.75)

Ở đây Mij là tập mờ và r là số luật mô hình; x(t) là véctơ trạng thái, u(t) là véctơ ngõ vào, y(t) là véctơ ngõ ra, Ai,Bi và Ci;z1(t),…,zp(t) là những biến giả thiết đã biết mà có thể là những hàm của những biến trạng thái, nhiễu bên ngoài và thời gian Chúng ta sẽ dùng z(t) để biểu thị véctơ chứa tất cả những thành phần riêng z1(t),…,zp(t) Chúng ta cũng giả sử rằng những biến giả thiết không là những hàm của những biến ngõ vào u(t) Điều này sẽ tránh quá trình mờ hoá phức tạp những bộ điều khiển mờ Và lưu ý rằng những điều khiển ổn định nhận được trong phần này cũng có thể áp dụng cho trường hợp biến giả thiết là hàm của

Trang 27

- 53 - những biến vào u(t) Mỗi phương trình kết luận tuyến tính được thể hiện bởi

Aix(t)+Biu(t) được gọi là hệ con

Với môt cặp (x(t),u(t)) những ngõ ra cuối cùng của những hệ mờ được suy

luận như sau:

CFS

(2.76) DFS

(2.77)

với

- 54 -

(2.78) Toán hạng Mij(zj(t)) là độ liên thuộc của zj(t) trong Mij

2.7.2.1 Bù phân tán song song

Lịch sử của bù phân tán song song(PDC) bắt đầu với thủ tục thiết kế dựa trên

mô hình bởi Kang và Sugeno Tuy nhiên sự ổn định của những hệ thống điều khiển không được xem xét trong thủ tục thiết kế này Người ta đã cái tiến và tạo

sự ổn định cho những hệ thống điều khiển và đạt cho chương trình này cái tên

là bù phân tán song song

Bù phân tán song song đưa ra một thủ tục để thiết kế nột bộ điều khiển mờ từ

mô hình mờ T-S đã cho Một đối tượng được điều khiển (hệ phi tuyến) được thể hiện trước tiên bởi một mô hình mờ T-S Nhiều hệ thống thực chẳng hạn những

hệ cơ khí hay hệ hỗn độn có thể được thể hiện bởi những mô hình mờ T-S

Trang 28

- 55 - Trong thiết kế PDC, mỗi luật điều khiển được thiết kế từ luật tương ứng của

một mô hình mờ T-S Bộ điều khiển mờ chia sẽ cùng tập mờ với mô hình mờ

trong phần giả thiết Sau đây ta sẽ xây dựng bộ điều khiển mờ qua PDC:

Hình 2.19 Thiết kế điều khiển mờ dựa trên mô hình

2.7.2.2 Luật điều khiển i:

Nếu z1(t) là Mi1 và … và zp(t) là Mip , thì u(t) = - Fix(t), i=1,2,…,r

Những luật điều khiển mờ có một bộ điều khiển tuyến tính ( luật điều khiển

hồi tiếp trạng thái) trong phần kết luận Ta cũng có thể dùng những bộ điều

khiển khác chẳng hạn những bộ điều khiển hồi tiếp ngõ ra và những bộ điều

khiển hồi tiếp ngõ ra động

Bộ điều khiển mờ toàn bộ được thể hiện như sau:

(2.81) Thiết kế bộ điều khiển mờ là xác định những độ lợi hồi tiếp cục bộ Fi trong

những phần kết luận Với PDC ta có một thủ tục đơn giản và tự nhiên để đạt

được những hệ thống điều khiển phi tuyến Những kỹ thuật điều khiển phi

tuyến khác đòi hỏi những kiến thức chuyên sâu và bao quát hơn

Cũng cần lưu ý rằng mặc dù bộ điều khiển mờ được xây dựng dùng cấu trúc

thiết kế cục bộ, những độ lợi hồi tiếp Fi cần xác định dùng những điều kiện thiết

kế toàn cục Những điều kiện thiết kế toàn cục là cần thiết để bảo đảm ổn định

toàn cục và hiệu suất điều khiển

- 56 -

2.7.3 Mô hình Neuro-mờ

Một lợi ích của những hệ thống mờ là cơ sở luật có thể được tạo từ kiến thức chuyên gia, dùng chỉ định những luật mờ để phân chia tất cả các biến và số lượng những luật mờ để mô tả liên hệ vào/ra của bài toán Tuy nhiên, một hệ thống mờ được xây dựng chỉ bởi kiến thức chuyên gia thường không thể hiện như mong muốn khi được ứng dụng vì chuyên gia có thể sai trong việc định vị trí của những tập mờ và số lượng quy luật Một quá trình tinh chỉnh thủ công cần được đưa vào tầng thiết kế mà kết quả là sẽ hiệu chỉnh những hàm liên thuộc và/hoặc cơ sở quy luật của những hệ thống mờ Quá trình tinh chỉnh này

có thể tốn rất nhiều thời gian và gặp rất nhiều lỗi Bên cạnh đó, trong nhiều ứng dụng kiến thức chuyên gia chỉ là những biến riêng phần và không phải là tất cả

Vì thế thật là hữu ích khi hổ trợ cho việc định nghĩa những cơ sở quy luật tập

mờ bằng những phương pháp học tự động mà sẽ sử dụng dữ liệu mẫu hợp lý Điều này là có thể vì khi chúng ta đưa những thành phần của hệ thống mờ vào trong định dạng thông số, những hệ thống suy luận mờ trở thành những mô hình thông số mà có thể được tinh chỉnh bởi một chương trình học Ý tưởng này chính là cơ sở cho mt neuro-mờ (Brown M and Harris C.J., 1994; Jang J-S.R and Sun C-T., 1993;Wang L and Mendel J.M., 1992a) với lý thuyết sau:

Lý thuyết Khi những toán hạng đại số được dùng để thực thi những hàm lôgic

mờ, những ngõ vào rõ được mờ hoá dùng mờ hoá đơn điểm và giải mờ trọng tâm được khai thác, ánh xạ vào ra của hệ thống mờ Mamdani có thể được thể hiện bởi một kết hợp tuyến tính của những hàm liên thuộc mờ ngõ vào được

chuẩn hoá:

(2.82) với K là số lượng luật và bk là tâm của những tập mờ Bk

Từ (2.82) ta có thể thấy rằng ngõ ra của hệ thống mờ Mamdani có thể được thể hiện đơn giản như một kết hợp tuyến tính của những hàm cơ bản phi tuyến (những hàm liên thuộc ngõ vào nhiều biến được chuẩn hoá), vì thế nó có thể được đề cập đến như là kỹ thuật mô hình cục bộ.(Add) Và ngõ ra của một hệ

mờ TS có thể được đề cập như là kết hợp tuyến tính của những những hàm liên thuộc ngõ vào nhiều biến được chuẩn hoá Thật ra, nếu một hệ mờ TS dùng chuẩn trung bình trọng số để kết hợp những thể hiện cục bộ, thì ngõ ra cho một ngõ vào x được tính như là tổng chuẩn hoá:

(2.83) Công thức (2.83)làm cho hệ mờ TS trở thành một ví dụ cụ thể của phương pháp cục bộ được tổng quát hoá với hk(.) là những mô hình cục bộ và những hàm cơ

bản là

Trang 29

- 57 -

những hàm này sẽ xác định mô hình cục bộ nào là phù hợp với một ngõ vào cụ

thể được cho

Vì những hệ mờ có thể được xem như là một trường hợp đặc biệt của những

phương pháp mô hình cục bộ, với không gian ngõ vào được phân chia thành

một số lượng những vùng mờ được thể hiện bởi những hàm liên thuộc nhiều

biến Với mỗi vùng, một luật được định nghĩa mà có thể chỉ định ngõ ra của hệ

thống trong vùng đó Lớp các hàm có thể được tạo ra chính xác bởi mô hình

kết quả được xác định bởi ánh xạ phi tuyến được thể hiện bởi những hàm liên

thuộc mờ nhiều biến Kết quả này đã tạo được những ấn tượng mạnh khi so

sánh giữa những hệ mờ và những kỹ thuật truyền thống khác Nếu những hàm

liên thuộc hình chuông (Gauss) được dùng , thì một hệ mờ TS tương đương với

một loại mạng RBF đặc biệt (Jang J.-S and C.-T Sun, 1993) Những lý thuyết

và phân tích nhận được từ phương pháp mô hình cục bộ có thể được áp dụng

trực tiếp cho những hệ mờ Tương tự, những hệ mờ cũng cho phép ứng dụng dễ

dàng những kỹ thuật học được dùng trong những phương pháp cục bộ để nhận

dạng những luật mờ từ dữ liệu Mặt khác, những hệ mờ khác biệt với những kỹ

thuật mô hình cục bộ khác cho khả năng dễ dàng định trước cấu trúc và sự tích

hợp kiến thức ưu tiên

Nhiều giải thuật học từ lĩnh vực mô hình cục bộ và những kỹ thuật đặc biệt

hơn được phát triển cho vài loại mạng nơron được mở rộng để tinh chỉnh tự

động những luật mờ dựa trên dữ liệu hợp lý Những kỹ thuật này đã xem hệ mờ

như là một kiến trúc đặt lớp, tương tự như mạng nơron thông minh Bằng cách

như thế, hệ mờ trở thành hệ neuro-mờ-một kiến trúc mạng nơron đặc biệt Lin

và Lee (1991) đã lần đầu tiên đề xuất việc thực thi những mô hình mờ Mamdani

dùng kiến trúc truyền thẳng đặt lớp Vì thế, ví dụ nổi tiếng nhất của mạng

neuro-mờ là hệ suy luận mờ dựa trên mạng thích nghi(Adaptive

Network-based Fuzzy Inference System (ANFIS)) được phát triển bởi Jang

(1995), đã thực thi một hệ mờ TS trong một kiến trúc mạng, và ứng dụng hỗn

hợp của giải thuật lan truyền ngược và bình phương nhỏ nhất để huấn luyện hệ

Hình 2.20 là một ví dụ của một mô hình mờ với hai luật được thể hiện như một

đề (ở đây là toán hạng ‘và’) Nút chuẩn hoá N và nút tổngthực hiện toán hạng trung bình mờ

Một vài hệ neuro-mờ được đề xuất (Kosko B.,1992; Sun C., 1994; Halgamuge S.K and Glesner M., 1994; Lin Y and Cunningham III G.A., 1995; Shann J.J and Fu H., 1995; Kasabov N., 1996; Nauck D and Kruse R., 1996; Juang C.-F and Lin C.-T., 1998; Kim J and Kasabov N.,1999; Quek C and Zhou R.W., 1999) Hầu hết chúng dựa trên một cấu trúc kết nối tương tự như mạng nơron truyền thẳng nhiều lớp

2.7.4 Mô hình với những hệ neuro-mờ

Khi xem xét những mô hình mờ, có hai pha khác nhau cần được thực hiện đó

là nhận dạng cấu trúc và nhận dạng thông số Nhận dạng cấu trúc gồm có xác định cấu trúc của luật, ví dụ số luật và số tập mờ được dùng để phân chia mỗi biến trong không gian vào và ra để nhận được những tên biến ngôn ngữ Khi một cấu trúc đã thoả mãn, tiếp theo là cần phải nhận dạng thông số để tinh chỉnh vị trí của tất cả hàm liên thuộc cùng với hình dạng của chúng là những mối quan tâm chính

Như đã thấy trước đây, để giải quyết hạn chế của việc dùng những kiến thức chuyên gia khi định nghĩa những luật mờ, cần có những phương pháp dựa theo

dữ liệu để tạo những hệ mờ Với những phương pháp như thế cả thông số và cấu trúc nhận được chỉ phụ thuộc vào dữ liệu huấn luyện Có vài cách khác nhau mà học cấu trúc và học thông số có thể được kết hợp trong một hệ neuro-

mờ Chúng có thể thực hiện theo tuần tự: học cấu trúc được dùng trước tiên để cấu trúc thích hợp cho cho cơ sở luật mờ và sau đó học thông số được dùng để nhận dạng thông số của mỗi luật Trong vài hệ neuro-mờ, cấu trúc là cố định và chỉ có học thông số là được thực hiện Những thuật toán được phát sinh bởi học mạng nơron thường được dùng cho học thông số Học cấu trúc thường không xuất phát từ mạng nơron Có nhiều phương pháp khác nhau tồn tại để tự động xác định cấu trúc của mạng nơron, nhưng không có phương pháp nào thích hợp

để nhận dạng cấu trúc trong những mô hình neuro-mờ Trong phần sau đây sẽ thể hiện vài phương pháp khác nhau được dùng cho nhận dạng cấu trúc và thông số trong những mô hình neuro-mờ Trong đó nhiều phương pháp lấy ý tưởng từ những phương pháp mô hình hoá cục bộ Có rất nhiều kết hợp cấu trúc/ thông số để làm cho mô hình mờ trở nên thoả mãn, vì thế việc tìm kiếm

mô hình tốt nhất không phải là một công việc dễ dàng Thường thì, những mô hình mờ đơn giản được chuộng hơn so với những mô hình phức tạp, vì thế trong việc tìm kiếm mô hình tốt nhất cần xem xét hai mục tiêu chính là độ chính xác tốt và độ phức tạp tối thiểu

2.7.4.1 Nhận dạng thông số

Trang 30

- 59 - Hai loại thông số đặc tính hoá một mô hình mờ: những thông số xác định

hình dáng và sự phân bố của những tập mờ ngõ vào và những thông số mô tả

những tập mờ ngõ ra (hay những mô hình tuyến tính)

Nhiều hệ neuro-mờ dùng tối ưu phi tuyến trực tiếp để nhận dạng tất cả thông

số của một hệ mờ Nhiều kỹ thuật tối ưu khác nhau có thể được dùng cho mục

đích này Được dùng rộng rãi nhất là một mở rộng của thuật toán lan truyền

ngược được thực thi bởi giảm gradient Một số lượng rất lớn những hệ

neuro-mờ dựa trên những thuật toán giống như lan truyền ngược để nhận dạng những

thông số của một hệ mờ, từ nổi tiếng nhất là ANFIS (Jang J-S.R., 1995) đến rất

nhiều những phương pháp được đề nghị trong (Lin C.T and Lee C.S.G., 1991;

Nomura H et al., 1992; Halgamuge S.K and Glesner M., 1994; Wang L and

Mendel J.M., 1992b; Shi Y et al., 1996; Shi Y.and Mizumoto M., 2000) Một

hạn chế của việc dùng những kỹ thuật giảm gradient là những hàm liên thuộc và

tất cả những hàm tham gia vào trong suy luận của cơ sở luật mờ phải đạo hàm

được Kết quả là, học giảm gradient có thể được ứng dụng dễ dàng để nhận

dạng thông số của một mô hình mờ bởi vì chỉ toán hạng tích được dùng cho

phần giao và ngõ ra được tính như là tổng trọng số Những phương pháp

neuro-mờ gần đây chọn việc thực thi lan truyền ngược bởi những phương pháp thực

nghiệm đơn giản thay vì giảm gradient để nhận dạng những thông số của mô

hình mờ loại Mamdani (Nauck D and Kruse R., 1995; Nauck D and Kruse R.,

1999) Ý tưởng chung của những phương pháp như thế là hiệu chỉnh từ từ

những hàm liên thuộc của một luật mờ theo đó bao nhiêu phân phối mà luật tác

động lên ngõ ra toàn bộ của hệ mờ

Những phương pháp khác để học thông số của những mô hình mờ không

yêu cầu tính toán gradient và vì thế không cần tính đạo hàm được, là học củng

cố (reinforcement)(Berenji H.R and Khedkar P., 1992; Berenji H.R., 1990) mà

chỉ yêu cầu tính giá trị vô hướng của ngõ ra và giải thuật di truyền (GA) thực

hiện việc tìm kiếm ngẫu nhiên trong không gian thông số, sử dụng một cộng

đồng những cá thể, trong đó mỗi cá thể mã hoá những thông số của một luật

mờ (Castellano G et al., 1998; Leitch D.D., 1995; Homaifar A and

McCormick E., 1995; Wong C.C and Feng S.M., 1995; Perneel C et al., 1995;

Lim M.H et al., 1996; Farag W.A et al., 1998) Một vấn đề với GA là với mã

hoá nhị phân truyền thống chiều dài của mỗi cá thể tăng theo số lượng ngõ vào,

số lượng tập mờ và số lượng luật Chiến lược tiến hoá (Evolution Strategies

(ES)) là kỹ thuật phù hợp hơn để tinh chỉnh những thông số luật mờ phụ thuộc

vào sơ đồ mã hoá trực tiếp của chúng.GA và ES cũng cho phép nhận dạng đồng

thời thông số và cấu trúc (số luật) của một mô hình mờ, nhưng trong trường hợp

như thế những kỹ thuật tính toán này yêu cầu tính toán rất phức tạp vì những cá

thể sẽ chứa rất nhiều vùng

Việc nhận dạng toàn bộ tập thông số bởi những kỹ thuật tối ưu phi tuyến có

thể yêu cầu tính toán nhiều, thời gian hội tụ lâu Để tăng tốc quá trình nhận

dạng thông số, nhiều hệ thống neuro-mờ tuân theo chương trình học nhiều tầng

để tìm và tối ưu những thông số Thường xem xét hai tầng Trong tầng đầu tiên

- 60 - không gian ngõ vào được phân chia thành những vùng bởi học không giám sát

và từ mỗi vùng những thông số giả thuyết ( và cuối cùng là kết luận) của một luật sẽ nhận được Trong tầng thứ hai những thông số kết quả được dự đoán bằng kỹ thuật học có giám sát Trong hầu hết trường hợp, tầng thứ hai cũng thực hiện việc tinh chỉnh những thông số giả thuyết đạt được trong tầng thứ nhất dùng những kỹ thuật tối ưu phi tuyến Hầu hết những kỹ thuật được dùng trong tầng đầu tiên thuộc một trong những loại sau:

2.7.4.2 Phân chia theo lưới

Với phương pháp này, miền của những biến ngõ vào được phân chia ưu tiên thành số lượng tập mờ được chỉ định Cơ sở luật sau đó được thiết lập để bao phủ không gian ngõ vào bằng cách dùng tất cả những kết hợp có thể của những tập mờ ngõ vào vì những tập mờ nhiều biến mô tả tiền đề của luật Những thông

số kết quả được dự đoán bằng phương pháp bình phương nhỏ nhất sử dụng dữ liệu vào-ra hợp lý Định dạng này cho những tập mờ nhiều biến sẽ hình thành những phần mắt lưới trong không gian ngõ vào, nơi mà mỗi sự kết hợp của những tập mờ đơn biến được định nghĩa theo những trục ngõ vào khác nhau được nhân với nhau Điều này bảo đảm rằng cơ sở luật trãi mỏng ra để cho một ngõ vào chỉ có một vài luật sẽ góp phần vào ngõ ra của mô hình Một ví dụ của phân chia không gian dựa trên lưới được cho trong hình 2.21

Hình 2.21 Một ví dụ phân chia ngõ vào dựa trên lưới Lợi ích của phương pháp này là rất nhiều tập mờ có thể diễn giải được tạo ra Tuy nhiên, nhược điểm rõ ràng của phương pháp này là số lượng tập mờ nhiều biến và vì thế là số lượng luật là một hàm mũ của những ngõ vào Điều này đã hạn chế việc dùng những mô hình mờ chỉ cho những bài toán có kích thước nhỏ( số lượng ngõ vào ít)

2.7.4.3 Phương pháp hướng cụm(cluster)

Phương pháp này cố gắng nhóm dữ liệu huấn luyện thành những cụm và

dùng chúng để định nghĩa những tập mờ nhiều biến mô tả phần giả thuyết của những luật mờ Những phương pháp hướng cụm phổ biến được dùng để tìm

Trang 31

- 61 - tâm của những hàm liên thuộc nhiều biến là nhóm trung bình k(K-means

clustring)(Bezdek J.C and Pal S.K., 1992;Pedrycz W.,1984; Sugeno M and

Yasukawa T., 1994), ánh xạ đặc điểm tự tổ chức (SOM)(Kohonen T.,

1984;Farag W.A et al., 1998; M.-C Su and C.-Y Tew, 2000) và rất nhiều loại

học cạnh tranh (Chen J.-Q.and Xi Y.-G., 1998) Những giải thuật hướng cụm

mờ (Bezdek J., 1981; Bezdek J and Pal S.K., 1992; Baraldi A and Blonda P.,

1999) cũng được dùng để tạo những luật mờ bằng cách tìm kiếm những cụm

hình cầu hay siêu êlip Trong hướng cụm mờ, dữ liệu được nhóm thành những

cụm chồng nhau mà mức độ liên quan được diễn giải như là những giá trị liên

thuộc, vì thế những cụm này là những tập mờ chồng nhau nhiều chiều Mỗi cụm

mờ có thể được chuyển thành một luật mờ, bằng cách chiếu độ liên thuộc của

dữ liệu huấn luyện trên mỗi chiều (Klawon F and Kruse R., 1995; Sugeno M

and Yasukawa T., 1993; Babuska R., 1996) Tất cả phương pháp hướng cụm

tạo những hàm liên thuộc thông qua phép chiếu Trong khi những phương pháp

hướng cụm tạo ra sự phân chia linh hoạt tương ứng với những phương pháp dựa

trên lưới, phân chia mắt lưới của không gian ngõ vào bị bỏ qua và điều này sẽ

làm cho cơ sở luật không thể được diễn giải tốt Trong hình 2.22, việc chiếu

những cụm để đạt được những luật mờ sẽ hình thành những tập mờ vô nghĩa

chồng nhau và rất khó để diễn giải Cũng thế, trong trường hợp hướng cụm mờ,

phép chiếu sẽ làm mất thông tin vì tích Cartesian của những hàm liên thuộc sẽ

không tạo ra những cụm mờ chính xác Việc mất thông tin này mạnh nhất trong

trường hợp siêu êlip hướng bất kỳ

Hình 2.22 Một ví dụ của phân chia ngõ vào dựa trên hướng cụm Khi những

cụm được chiếu để tạo những luật mờ, việc mất thông tin xảy ra và có rất nhiều

tập mờ tương tự nhau

Để làm cho vấn đề này dễ dàng thao tác hơn thì khả năng là chỉ tìm kiếm cho

những siêu êlip trục song song Một hậu quả khác của phép chiếu cụm là với

mỗi biến những tập mờ được suy riêng lẻ cho mỗi luật và với mỗi đặc điểm sẽ

có nhiều tập mờ khác nhau vì số lượng cụm Một vài trong số những tập mờ

này là tương tự, và thường là không đồng nhất Để có một diễn giải tốt cần có

- 62 - một phân chia mờ của vài tập mờ và mỗi tập thể hiện rõ ràng một khái niệm ngôn ngữ Để loại bỏ sự thừa thải trên, việc đo độ tương tự có thể được dùng để

để đánh giá mức độ chồng nhau giữa những tập mờ kế cận và kết hợp những mà quá giống nhau (Chao C.T et al., 1996;Setnes M et al., 1998)

2.7.4.4 Nhận dạng cấu trúc

Trước khi những thông số luật mờ được tối ưu, cấu trúc của cơ sở luật mờ cần phải được định nghĩa Điều này gồm có xác định số lượng luật và tính chất của không gian dữ liệu, ví dụ số lượng tập mờ được dùng để phân chia mỗi biến Trong những hệ thống dựa trên luật mờ, như trong bất kỳ mỹ thuật mô hình hoá khác, có một sự cân bằng giữa độ chính xác và độ phức tạp Càng nhiều luật, càng tốt hơn sự xấp xỉ ánh xạ phi tuyến mà có thể đạt được bởi hệ

mờ, nhưng cũng có nhiều thông số hơn cần phải tính toán, vì thế chi phí và độ phức tạp sẽ tăng lên Một phương pháp hữu dụng để nhận dạng cấu trúc là thực hiện tìm kiếm từng bước xuyên qua không gian mô hình mờ Và một lần nữa, những chiến lược tìm kiếm này sẽ thuộc một trong hai nhóm sau: chọn lựa theo chiều thuận(forward selection) và loại bỏ theo chiều lùi(backward elimination)

 Chọn lựa theo chiều thuận Bắt đầu từ một cơ sở luật rất đơn giản,

những luật mờ mới được thêm vào hay mật độ của những tập mờ tăng dần Một ví dụ của những kỹ thuật như thế được cho trong (Royas I et al., 2000)

 Loại bỏ theo chiều lùi Một cơ sở luật mờ ban đầu, được xây dựng từ

một kiến thức ưu tiên hay bằng cách học từ dữ liệu, được giảm dần, cho đến khi điểm cực tiểu của hàm lỗi được tìm thấy Vài thuật toán lược bớt

đã hổ trợ việc giảm số lượng luật trong khi vẫn duy trì hiệu suất ban đầu được đề xuất trong (Shann J.J and Fu H., 1995; Castellano G and Fanelli A.M.,1996; Chao C.T et al., 1996; Yen J and Wang L., 1999; Pal N.R and Pal T., 1999; Wang X and Hong J., 1999; Nauck D., 2000) Cấu trúc của những luật mờ cũng có thể được tối ưu bằng GA để mà đạt được cơ

sở luật mờ chặt (Ishibuchi H et al., 1995)

Những thuật toán được đề nghị trong (Wu S and Er M.J., 2000) là một ví dụ của thích nghi cấu trúc trong những hệ neuro-mờ Những luật được tuyển và loại bỏ tuỳ thuộc vào tầm quan trọng của chúng đối với hiệu suất hệ thống, để

mà cấu trúc tinh giản nhất với hiệu suất cao được chọn Sự điều chỉnh cũng có thể được chọn để tìm cấu trúc tối ưu của những mô hình mở TS trong (Johansen T.A., 1996)

Khi những luật mờ ban đầu được tạo bằng cách hướng cụm, số lượng cụm (số luật) nên được chỉ định trước khi nhóm Nếu không có kiến thức ưu tiên nào

đề xuất số lượng cụm, một chương trình tự động có thể được ứng dụng Ví dụ,

số lượng cụm có thể được tìm thấy bằng cách tính giá trị đã cho, ví dụ một tiêu chuẩn để đánh giá chất lượng của các cụm và chọn số lượng cụm mà tối thiểu

Trang 32

- 63 - (tối da) những giá trị đã cho Một phương pháp khác là kết hợp cụm, phương

pháp này bắt đầu với số lượng lớn những cụm và giảm chúng lần lượt bằng

cách kết hợp những cụm tương thích cho đến khi đạt được vài ngưỡng và không

có thêm cụm nào có thể kết hợp (Krishnapuram R and Freg C.-P., 1992;

Kaymak U and Babuska R., 1995)

2.7.5 Tính diễn giải được và độ chính xác của những mô hình neuro-mờ

Như chúng ta có thể thấy trong những phần trước, những hệ neuro-mờ về bản

chất là những hệ mờ mà có khả năng học của mạng nơron Những hệ mờ kết

nối những lợi ích của những phương pháp mô hình hoá hướng dự đoán và

những phương pháp mô hình hoá hướng hiểu được, cung cấp những mô hình

phù hợp cho cả dự đoán và hiểu Vì thế chúng ta cần xem xét khả năng những

lợi ích của những hệ mờ đối với mô hình dự đoán được giữ gìn khi chúng được

chuyển cho những hệ neuro-mờ

Bảng 2.2 Tính diễn giải được và độ chính xác trong những hệ mờ

Tính diễn giải được Độ chính xác

Ít thông số Nhiều thông số

Ít luật Nhiều luật

Mô hình Mamdani Mô hình TS Hai mặt của những hệ mờ dẫn đến một sự cân bằng giữa tính đọc được và độ

chính xác như trong bảng 1 Chúng ta có thể buộc những hệ mờ có được những

dự đoán chính xác bất kỳ, nhưng sẽ mất đi tính diễn giải được Để đạt được sự

chính xác, một hệ mờ cấn có không gian dữ liệu tốt và nhiều luật mờ Điều hiển

nhiên rằng khi số luật mờ càng trở nên lớn thì càng ít đi tính diễn giải được

Nếu chúng ta muốn giữ cho mô hình đơn giản, thì sự dự đoán càng ít chính xác

Để giải quyết sự cân bằng này , tính diễn giải được (cũng có nghĩa là tính đơn

giản) của một hệ mờ cần được xem như là lợi ích chính và vì thế nó cần được

theo đuổi nhiều hơn độ chính xác Sự thật thì những hệ mờ không phải là những

bộ xấp xỉ hàm hay bộ phân loại tốt hơn những phương pháp khác Nếu chúng ta

thích thú với dự đoán chính xác thì thường chúng ta sẽ không để ý nhiều đến

tính diễn giải được của bài toán Trong trường hợp này, chúng ta chỉ dùng một

đặc tính của những hệ mờ: sự kết hợp tiện lợi của những mô hình cục bộ cho

một cách giải toàn cục Với vấn đề này, mô hình loại Sugeno phù hợp hơn mô

hình loại Mamdani bởi vì chúng thường linh hoạt hơn trong những kết quả của

luật Tuy nhiên, nếu hiệu suất tối ưu là mục tiêu chính, chúng ta nên xem xét

nếu một hệ mờ là một phương pháp phù hợp nhất và có được sự so sánh ở mọi

khía cạnh và chuyên sâu với những phương pháp liên quan khác (những

phương pháp cục bộ và những phương pháp cục bộ được tổng quát hoá), khi đề

cập đến hiệu suất, sự tính toán và tính khả thi Tóm lại, những hệ mờ nên được

dùng cho mô hình dự đoán nếu một mô hình có thể diễn giải được là cần thiết

và cũng có thể được dùng để mở rộng dự đoán

- 64 - Vấn đề về tính diễn giải được của những hệ mờ được thảo luận trong (Bersini

H and Bontempi G., 1997a; Nauck D and Kruse R., 1998a; Nauck D and Kruse R., 1998b; Nauck D., 2000) với việc xem xét vấn đề cân bằng giữa tính diễn giải được của mô hình và độ chính xác Tính diễn giải được của một mô hình mờ không có nghĩa là có một kết hợp chính xác giữa mô tả ngôn ngữ của

mô hình và những thông số mô hình Tính diễn giải được có nghĩa là những người dùng mô hình có thể chấp nhận sự thể hiện của những thuật ngữ ngôn ngữ, nhiều hay ít hơn Sự thể hiện này nên tương ứng rõ ràng với hiểu biết trực giác của họ với những thuật ngữ ngôn ngữ Vì thế, tính diễn giải được không có nghĩa là bất kỳ người nào cũng có thể hiểu được mô hình mờ Nó có nghĩa là những người dùng có ít nhất những kiến thức chuyên gia trong khu vực mà mô hình dự đoán diễn ra có thể hiểu được mô hình

Vì chính tính diễn giải được cũng là một khái niệm mờ và chủ quan, thật khó

để tìm thấy một danh sách rõ ràng và thấu đáo những điều kiện, khi bị vi phạm, tạo cho mô hình mờ mất đi khả năng đọc của nó Chúng ta sẽ tóm tắt những hệ

số chính mà tác động đến tính diễn giải được của một hệ mờ:

 Chọn lựa loại mô hình mờ: Những hệ mờ loại Mamdani được ưa

chuộng hơn loại TS, bởi vì những kết quả của luật bao gồm những tập

mờ có thể diễn giải được

 Số lượng luật mờ:một hệ mờ với cơ sở luật lớn thì ít đi tính diễn giải so

với một hệ mờ chỉ cần vài luật

 Số lượng biến ngõ vào:mỗi luật chỉ nên sử dụng vài biến như có thể

 Số lượng tập mờ trên biến:Chỉ một lượng trung bình những tập mờ

được dùng để phân chia một biến Khi có quá nhiều nhãn ngôn ngữ thì sẽ tạo nên những khó khăn cho việc đọc được mô hình mờ, vì thế cần phải tránh trường hợp này

 Thể hiện rõ ràng những toán hạng ngôn ngữ:mỗi toán hạng ngôn ngữ

nên được thể hiện chỉ với một tập mờ Những luật khác nhau dùng cùng một diễn giải ngôn ngữ (ví dụ x là nhỏ) có thể không thể hiện toán hạng ngôn ngữ tương ứng (ví dụ nhỏ) bởi những tập mờ khác

 Đặc tính của những luật mờ:những luật mờ phải đầy đủ ví dụ với bất

kỳ ngõ vào nào, hệ mờ có thể tạo ra được câu trả lời Tập mờ cũng cần nhất quán, ví dụ không có những luật mâu thuẫn mà có cùng tiền đề nhưng khác kết luận Chỉ những không nhất quán riêng phần là được chấp nhận Và bất kỳ dạng dư thừa nào cũng cần phải tránh,ví dụ không

có những luật mà tiền đề là một tập con của tiền đề của một luật khác, và

không có luật nào xuất hiện nhiều hơn một lần trong cơ sở luật

 Đặc tính của những tập mờ:những tập mờ nên có thể diễn giải được với

người dùng hệ mờ Điều này có nghĩa là những hàm liên thuộc nên bình thường, lồi và chúng nên bảo đảm một độ bao phủ hoàn toàn miền ngõ vào tương ứng, để mà người dùng có thể dán nhãn mỗi tập mờ bởi một

Trang 33

- 65 - thuật ngữ ngôn ngữ Cũng cần tránh quá nhiều sự chồng nhau giữa những

hàm liên thuộc để có những tập mờ phân biệt

Những kỹ thuật mô hình neuro-mờ truyền thống và trong những phương

pháp dựa trên dữ liệu để học những luật mờ từ dữ liệu, được hổ trợ để tối ưu độ

chính xác dự đoán cho mô hình mờ Tuy nhiên,trong khi cải tiến độ chính xác

thì tính thông suốt của mô hình sau khi học có thể bị mất Sự chồng nhau của

những hàm liên thuộc tăng và những tình huống kỳ lạ có thể xảy ra, khi một vài

hàm liên thuộc có thể chứa trong những hàm khác hay những hàm liên thuộc

chuyển đổi vị trí của chúng Điều này cản trở tính diễn giải được của mô hình

cuối cùng Với mục đích là tính diễn giải được, chương trình học nên nhận ngữ

nghĩa học của mô hình mờ mong muốn là những đối số và bám vào những ràng

buộc nào đó, để mà nó không thể ứng dụng tất cả những sự hiệu chỉnh tiềm tàng

cho những thông số của hệ mờ Ví dụ những thuật toán học nên bị ràng buộc để

mà những hàm liên thuộc kế cận không thay đổi vị trí, không di chuyển từ phần

dương sang phần âm của miền hay ngược lại, có một độ chồng nhau nào đó

Trong (de Oliveira J.V., 1999) một tập bao quát những đặc tính ngữ nghĩa học

mà những hàm liên thuộc cần có để duy trì tính diễn giải được được quy định và

thêm vào một tập những ràng buộc được dùng trong một sơ đồ tối ưu có thể

thoả mãn những đặc tính này

Một yêu cầu quan trọng khác để đạt được tính diễn giải là làm cho cơ sở luật

nhỏ Một mô hình mờ với những hàm liên thuộc diễn giải được nhưng có số

lượng luật lớn sẽ xa rời tính diễn giải được Bằng cách làm giảm độ phức tạp,

ví dụ số lượng thông số của một mô hình mờ không chỉ quản lý được cơ sở luật

mà còn cung cấp mô tả quá trình dễ đọc hơn Và việc dùng cơ sở luật đơn giản

sẽ làm giảm overfitting, vì thế cải tiến sự tổng quát hoá

Gần đây, vài phương pháp học luật mờ dựa trên dữ liệu đã hỗ trợ việc cải tiến

tính diễn giải được của những mô hình mờ ở cả cơ sở luật nhỏ và những tập mờ

dễ đọc hơn Những ví dụ được cho trong (Chao C.T et al., 1996; Setnes M et

al., 1998; Y Jin et al., 1999; Y Jin, 2000)

2.8 Kết luận

Những mô hình mờ được xem như là những chuyển đổi ngôn ngữ của một

ánh xạ số và như là phương pháp mô hình hoá cục bộ mạnh Hai mặt này của

những hệ mờ đã dẫn đến việc phát triển những kỹ thuật mô hình hoá neuro-mờ

như là một phương pháp phá vỡ sự thiếu hụt của kiến thức chuyên gia và khai

thác những dữ liệu thực nghiệm để chiết xuất được mô hình trong định dạng

của những luật mờ Những hệ neuro-mờ về cơ bản là những hệ mờ với khả

năng-dựa trên những dữ liệu phù hợp- để bù cho những thiếu sót của kiến thức

con người bằng cách trích tự động những luật mờ từ dữ liệu dựa trên học thích

nghi được dùng trong mạng nơron

Lợi ích của mô hình hoá neuro-mờ là khả năng sử dụng cả kiến thức định

tính và kiến thức số Kiến thức định tính ở dạng cơ sở luật mờ mô tả cách ứng

- 66 -

xử của quá trình, trong khi kiến thức số là những dữ liệu quan sát được dùng để thực hiện mô hình dự đoán Mô hình kết quả mô tả những liên hệ quan trọng giữa dữ liệu ở cả định tính thông qua những luật mờ và định lượng qua những liên hệ đại số từng phần đơn giản

Hai điều trên có thể không tương thích ở một vài phạm vi, ví dụ việc tìm kiếm cho một mô hình có thể diễn giải được có thể được thực hiện mà phải trả giá bằng tổn hao hiệu suất trong xấp xỉ dữ liệu thực Vì thế cẩn phải lấp đầy khe hở giữa hai vấn đề trên Một hệ neuro-mờ hỗ trợ người dùng trong việc tìm kiếm những hệ mờ mong muốn dựa trên dữ liệu huấn luyện, nhưng nó không thể làm tất cả mọi việc Những vấn đề ngữ nghĩa học sẽ xảy ra nếu những hệ mờ không

có những cơ cấu để bảo đảm tất cả những thay đổi gây ra bởi chương trình học

có thể diễn giải được trong ngôn ngữ của những luật mờ Khi kiến thức ưu tiên duy trì tính dễ đọc, thì những ràng buộc thêm vào về cấu trúc và thông số là cần thiết Vì vậy, đầu tiên dùng bất kỳ thuật toán tối ưu để tinh chỉnh tự động cấu trúc và những thông số của mô hình mờ, việc định nghĩa rõ ràng mức độ dễ đọc của mô hình mờ cần được cho Khi được cung cấp định nghĩa này, việc duy trì tính diễn giải được yêu cầu hoặc là giảm bậc tự do của mô hình hoặc/và sử dụng một phương pháp tối ưu có ràng buộc mà bù cho tất cả những giải pháp

mà không diễn giải được

Từ những giới hạn được thảo luận ở đây, chúng ta thấy rõ rằng những phương pháp neuro-mờ cho phép xây dựng những mô hình mờ có thể diễn giải được và tinh giản nhất Đây cũng là động lực chính của luận án này mà những điểm chính là việc phát triển một phương pháp dựa trên dữ liệu để nhận dạng những mô hình mờ mà đảm bảo được độ chính xác và tính diễn giải được, vì thế chúng có thể được dùng để khám phá và thể hiện những mối liên hệ cơ bản trong dữ liệu Trong chương tiếp theo sẽ mô tả phương pháp luận chi tiết cho

mô hình neuro-mờ

Trang 34

- 67 -

CHƯƠNG 3

PHƯƠNG PHÁP LUẬN MÔ HÌNH NEURO-MỜ

VÀ THUẬT GIẢI DI TRUYỀN

3.1 Giới thiệu

Động lực quan trọng nhất để dùng hệ mờ cho mô hình dự đoán là mô hình

được tạo ra được đặc tả bởi ngữ nghĩa phụ thuộc vào ngôn ngữ mà cho phép

con người hiểu dễ dàng Vì thế, những phương pháp để xây dựng những mô

hình mờ từ dữ liệu không chỉ được định hướng để tìm sự xấp xỉ tốt nhất cho dữ

liệu mà còn quan trọng hơn, chúng nên chiết xuất kiến thức từ dữ liệu trong

định dạng những luật mờ mà có thể dễ dàng hiểu và diễn giải Vì thế, những

thuật toán nhận dạng những mô hình mờ chính xác và diễn giải được cần được

triển khai Đây là công việc chính được mô tả trong chương này

Như được mô tả trong phần trước, có hai thiết kế chính được dùng cho mô

hình hoá mờ: nhận dạng cấu trúc và thông số của cơ sở luật mờ Độ chính xác

và tính diễn giải được của mô hình mờ được trích phụ thuộc vào những định

nghĩa hoàn hảo của hai hệ số này

Hầu hết những phương pháp mô hình mờ tự động và những phương pháp

neuro-mờ đặc biệt chú trọng độ chính xác và bỏ qua tính diễn giải được để mà

những mô hình kết quả thường không có điểm chung so với mô hình mờ ban

đầu Điều này tạo nên những khó khăn chính trong việc hình thành mô tả toán

học của khái niệm thông suốt và diễn giải ngôn ngữ của những luật mờ Hiện

thời, không tồn tại những định nghĩa được thiết lập tốt cho tính diễn giải được

của một hệ mờ Để đối phó với khó khăn này, nhiều tác giả đã cố gắng tìm

những điều kiện hợp lý mà tính diễn giải được của một hệ mờ phải thoả Chúng

ta thấy rằng tính diễn giải được của một mô hình mờ phụ thuộc vào hai khía

cạnh chính:độ phức tạp của cơ sở luật mờ ( ví dụ số luật) và tính dễ đọc của

những tập mờ được dùng trong những luật mờ

Đầu tiên, số lượng luật là điều kiện cốt yếu để đạt được diễn giải ngôn ngữ

mô hình mờ Vì thế, vấn đề tìm kiếm cân bằng giữa độ phức tạp (kích thước cơ

sở luật) và độ chính xác của mô hình mờ cần phải được chú ý nhiều Điều này

có nghĩa là phương pháp mô hình mờ dựa trên dữ liệu có thể tối thiểu cả lỗi

ngõ ra và độ phức tạp mô hình kết quả Nguyên tắc cơ bản này của mô hình tinh

giản là yêu cầu cơ bản cho tất cả những kỹ thuật mô hình hoá hỗ trợ tính diễn

giải được và khả năng tổng quát hoá Tuy nhiên, nhiều kỹ thuật thiết kế

neuro-mờ chỉ quan tâm đến nhận dạng thông số và bỏ qua nhận dạng cấu trúc, vì thế

không được tối ưu hay biến đổi

Thứ hai, với những luật mờ dễ dàng hiểu phân chia mờ nên hoàn toàn và

phân biệt để mà ý nghĩa vật lý (thuật ngữ ngôn ngữ) có thể liên quan với mỗi

- 68 - tập mờ trong vùng chia Có vài trường hợp mà phân chia mờ của vài biến ngõ vào không còn đầy đủ và phân biệt sau khi những hàm liên thuộc mờ được tối

ưu Sau khi học từ dữ liệu, ý nghĩa vật lý của vài tập mờ có thể không còn rõ ràng, điều này có nghĩa là chúng thiếu độ phân biệt và phân chia mờ trở nên không đầy đủ Hình 3.1 thể hiện hai ảnh hưởng không mong muốn này Mặc dù những ảnh hưởng này khá dễ dàng giải thích bởi vì tất cả những thuật toán tối

ưu đều cố gắng hiệu chỉnh phân bố của những hàm liên thuộc theo sự phân bố của tập dữ liệu, chúng xần phải tránh vì chúng sẽ làm cho việc diễn giải những luật được tạo khó khăn Cụ thể, tính phân biệt của những tập mờ là điều đầu tiên cần xem xét để cải tiến tính diễn giải của một hệ mờ

Hình 3.1 Hai ảnh hưởng chính khi những luật mờ được học từ dữ liệu: (a) Phân chia mờ không đầy đủ (b) thiếu tính phân biệt Trong luận án này đề xuất một phương pháp luận dựa trên dữ liệu để mô hình hoá neuro-mờ Để nhận được một mô hình mờ chính xác cũng như diễn giải được từ dữ liệu số, người ta đã định nghĩa phương pháp mô hình ba pha Theo phương pháp neuro-mờ, một mạng nơron được đề xuất thực thi hệ mờ,

để việc nhận dạng cấu trúc và thông số của cơ sở luật mờ được thực hiện bằng cách định nghĩa, thích nghi và tối ưu tôpô và những thông số của mạng neuro-

mờ tương ứng chỉ dựa trên những dữ liệu hợp lý Mạng này được xem như là một hệ thống suy luận mờ thích nghi với khả năng học những luật mờ từ dữ liệu

và như là một kiến trúc kết nối được cung cấp ý nghĩa ngôn ngữ Những luật

mờ được trích từ những ví dụ huấn luyện bởi một sơ đồ học lai gồm ba pha chính:

1 Cho cấu trúc và thông số giá trị ban đầu để nhận được một mô hình mờ

mà có thể được ứng dụng cho cả nhận dạng và phân loại Phần 3.3 mô tả kiến trúc mạng nơron được dùng để thực thi mô hình mờ trên và trong phần 3.4 giới

Trang 35

- 69 - thiệu sơ đồ học theo tầng Sau đó ba pha học của chiến lược học được mô tả chi

tiết trong các phần 3.5,3.6 và 3.7 Kết luận được tóm tắt trong phần 3.8

3.2 Hệ mờ ứng cử

Trong phần này chúng ta trình bày cơ sở của sơ đồ lập luận mờ mà có thể ứng

dụng cho cả những bài toán nhận dạng và phân loại

Giả sử một tập huấn luyện     , N t1

N x t y t

D gồm N dữ liệu vào-ra mô tả cách ứng xử của một quá trình Véctơ ngõ vào x=(x1,…,xn) thể hiện những biến

độc lập trong trường hợp nhận dạng hay là véctơ đặc tính trong trường hợp bài

toán phân loại Véctơ ngõ ra y=(y1,…,ym) thể hiện những biến phụ thuộc trong

trường hợp nhận dạng hay những giá trị liên thuộc phân loại rõ trong trường

hợp phân loại Với bài toán nhận dạng mục đích là nhận được một mô hình mà

mô tả những giá trị của những biến phụ thuộc (y1,…,ym) khi cho giá trị của

những biến độc lập (x1,…,xn) Với công việc phân loại, mục đích là nhận được

một mô hình mà gán đặc tính x cho một trogn m lớp dựa trên những giá trị đặc

điểm của nó Trong cả hai trường hợp chúng ta phải xấp xỉ một hàm chưa biết

mà ánh xạ những biến vào thành những biến ra:

(3.1)

Đề mô hình sự phụ thuộc (4.1) giữa những biến vào và biến ra, chúng ta xem

xét những luật mờ theo dạng sau:

Nếu (x1 là A1) và …(xn là An) thì (y1 là b1k) và …(ym là bmk)

với k=1,…,K trong đó K là số luật mờ, Aik(i=1,…,n) là những tập mờ được

định nghĩa qua những biến vào xi và bjk (j=1…m) là những singleton mờ được

định nghĩa trên những biến ra yj Vì thế một mô hình mờ singleton được chấp

nhận ở đây

Những loại hàm liên thuộc khác nhau có thể được dùng cho những tập mờ

tiền đề Trong luận án này, những hàm liên thuộc Gauss được dùng vì chúng sở

hữu nhiều đặc tính mong muốn lý tưởng để thể hiện những hàm liên thuộc mờ

trong những ứng dụng mô hình :

 Chúng là những hàm bình thường, một trạng thái và trơn;

 dạng toán học được thông số hoá của chúng hổ trợ việc tính toán và lập

trình;

 chúng khá lý tưởng để thể hiện những nhãn ngôn ngữ mờ, phổ biến hơn

những hàm tam giác và hình thang;

 Chúng sở hữu một đáp ứng cục bộ mặc dù chúng không phải là tập đóng

hoàn toàn;

 Chúng có thể đạo hàm bất kỳ nơi nào, một đặc tính hữu ích cho học dựa

trên những kỹ thuật giảm gradient

Loại hàm Gauss được dùng cho những tập mờ Aik có dạng

;

ij ij j ij

ij j A

c x c

x

 (3.2) với cij và  ij là tâm và độ rộng của hàm Gauss

Dựa trên một tập gồm K luật, ngõ ra của bất kỳ véctơ ngõ vào x(0) đạt được bằng chương trình lập luận mờ sau:

1 Tính độ đáp ứng của luật thứ k, với k=1…K bằng toán hạng tích

(3.3)

2 Tính ngõ ra suy luận ˆy j 0 bằng cách lấy trung bình trọng số của những giá trị kết quả bjk tương ứng với cường độ kích hoạt luật  k  0:

(3.4)

Hệ suy luận mờ có thể được tổng hợp như một hàm  .,. được định nghĩa trên không gian ngõ vào X và không gian thông số W theo cách sau: (3.5) Với bài toán nhận dạng, đặc tính ánh xạ trong (3.5) giảm thành:

Ví dụ ngõ ra suy luận ˆ y j  0 , 1 thể hiện độ liên thuộc của đặc tính x thuộc lớp

Cj Điều này sinh ra phân loại “mềm” Ngược lại, công việc phân loại rõ có thể được thể hiện như một ánh xạ:

E

X 

 : (3.7) với

(3.8)

để mà x(0) thuộc lớp C l xe l

Để đạt được một phân loại “cứng” (rõ) từ một bộ phân loại mờ, một bước tính toán khác cần có sau quá trình suy luận để mà bộ phận cao nhất véctơ ngõ ra được ánh xạ đến 1 trong khi những bộ phận khác được ánh xạ đến 0 Để làm điều này, một đặc tính x(0) được gán cho lớp Cl để mà đặc tính đúng:

x(0) thuộc lớp C l j 1 , ,m yˆl 0 yˆj 0(với những lớp có cùng giá trị liên thuộc, một giá trị ngẫu nhiên được chọn) Để hình thành việc chuyển mờ đến rõ của kết quả phân loại chúng ta định nghĩa hàm sau:

 m E

 1 , 0 :

 (3.9)

Trang 36

- 71 - với 1m biểu thị véctơ đơn vị m chiều và những hàm max(.) và  m .,.được định

nghĩa như sau:

R

R m

 : max (3.10)

Và (3.11)

(3.12)

Để đơn giản, vai trò của hàm  . là để chọn thành phần cao nhất của một véctơ

m chiều và đặt nó là 1, trong khi những thành phần khác là 0 Bằng cách ứng

dụng hàm  . đến kết quả suy luận của bộ phân loại mờ, chúng ta có được kết

quả phân loại rõ Vì thế, một bộ phân loại mờ được chuyển thành một bộ phân

loại rõ bằng cách tổng hợp các hàm  . và  .,.,để mà hàm phân loại đích  .

được xấp xỉ bởi hàm hợp:

E W

 : (3.13) Trong phần sau chúng ta sẽ chỉ định hệ mờ bởi hàm  .,. được định nghĩa trong

(3.5), cả cho bài toán nhận dạng và phân loại Hàm hợp (3.13) sẽ chỉ được dùng

khi sự tách biệt là cần thiết

3.3 Mạng neuro-mờ

Hệ mờ được giới thiệu bên trên có thể được xem như một hệ gồm:luật, những

tập mờ được dùng trong những luật này và những hoạt động suy luận mờ, chỉ

có một phần mà có thể được định nghĩa thông qua việc học là cấu trúc của cơ sở

luật (được định nghĩa với thuật ngữ là số lượng luật) và những thông số giả thiết

và kết luận liên hệ với luật Bài toán có thể được phát biểu theo một cách chính

xác là tìm một cấu hình hoàn hảo của những hàm liên thuộc và tạo ra một tập

những luật mờ từ tập dữ liệu DN của N cặp vào-ra để mà hệ mờ  .,. xấp xỉ gần

nhất với hàm chưa biết f(.) sử dụng cân bằng giữa độ phức tạp và chính xác của

cơ sở luật

Để làm được điều này, hệ mờ được thực thi dùng mạng nơron Mạng nơron

này mã hoá một tập những luật mờ thành tôpô của nó và xử lý thông tin theo

cách mà gắn kết với sơ đồ lập luận mờ Mạng neuro-mờ được đề xuất là một

kiến trúc truyền thẳng

 Thông số

Không gian thông số có thể hiệu chỉnh của mạng, được biểu thị bởi W, gồm

không gian con những thông số giả thiết WP và không gian con những thông số

kết luận WC Chúng ta có,

W=WPWC (3.14) với (3.15)

những véctơ thông số giả thiết véctơ thông số kết luận

3.4 Thuật toán học lai

Những mô hình neuro-mờ tự động chiết một mô hình mờ (ví dụ, một tập những luật mờ) sử dụng những thông tin hợp lý là một tập những cặp vào-ra mong muốn Những luật được tạo để mà mô hình kết quả có thể thể hiện đủ ánh

xạ với tập dữ liệu được cho, với cả thuật ngữ dự đoán và mô tả Nói cách khác, mục đích chính của phương pháp đề xuất là đạt được mô hình mờ mà có cả độ chính xác (ví dụ với khả năng tổng quát hoá tốt) và tính diễn giải được (ví dụ dễ dàng hiểu bởi người dùng) Mô hình mờ nhận được hoàn toàn từ dữ liệu thông qua học của mạng nơron Thuật toán học dựa trên một sơ đồ lai gồm ba pha:

1 Khởi đầu thông số và cấu trúc Trong pha học đầu tiên,cấu trúc và

thông số ban đầu của mạng được thiết lập Trong hầu hết các phương pháp neuro-mờ đang tồn tại, một số lượng khá thích hợp những luật mờ

và những luật mờ và những hàm liên thuộc (kích thước của tôpô mạng), cùng với những giá trị ban đầu của thông số luật (trọng số mạng) được xác định đồng thời mà không cần phải có sự đánh giá của người vận hành, vì thế cho phép xây dựng cơ sở luật theo cách tự tổ chức Mục đích của tầng đầu tiên này là có được một tập hợp những luật mờ là xấp xỉ đầu

tiên của mô hình mờ

2 Tinh chỉnh thông số toàn cục Trong pha học thứ hai, tất cả các thông

số của những luật mờ được tinh chỉnh phù hợp bằng kỹ thuật giảm gradient với nỗ lực tăng độ chính xác của mô hình mờ chẳng hạn để tìm

sự vừa khít tốt nhất với dữ liệu

3 Tối ưu thông số và cấu trúc Tầng mô hình thứ ba được hỗ trợ để cải

tiến tính diễn giải được của mô hình mờ kết quả Đạt được điều này bằng cách giàm số lượng luật thông qua một chương trìn tối ưu cấu trúc và bằng cách ép những ràng buộc trên những hàm liên thuộc ngõ vào thông

qua tinh chỉnh thông số cục bộ

Toàn bộ chương trình học được thể hiện ở hình 3.2 Mỗi khối biểu đồ thể

hiện một tầng học, sẽ được mô tả chi tiết trong những phần sau

Trang 37

- 73 -

3.5 Khởi đầu thông số và cấu trúc

Trong pha học đầu tiên, một cơ sở lậu mờ ban đầu được tạo tự động từ dữ liệu

đã cho Vì thế, pha này có mục đích là tìm đồng thời số luật ( và số lượng tập

mờ ngõ vào được dùng để phân chia những miền ngõ vào) và những thông số

định nghĩa phần giả thiết và kết luận của mỗi luật

3.5.1 Phân chia không gian ngõ vào

Bước đầu tiên của phương pháp là phân chia không gian ngõ vào thành những

miền con Chiếu những miền này dọc theo những chiều ngõ vào khác nhau sẽ

nhận được những hàm liên thuộc trong phần giả thiết của mỗi luật Vì thế, cả số

lượng luật và những thông số giả thiết của chúng có trực tiếp từ quá trình phân

chia

Để tìm được phân chia thích hợp không gian ngõ vào, chúng ta định nghĩa ba

phương pháp mà sẽ được trình bày chi tiết trong phần sau

3.5.1.1 Cây K-D mờ thích nghi

Trong phương pháp đầu tiên này sẽ đề xuất thuật toán cây K-D mờ thích nghi

Những cây K-D ban đầu được phát triển như là một cơ cấu lưu trữ dữ liệu hiệu

quả (Orenstein J.A., 1982; Overmans M.H and Leeuwen J.V., 1982), là một

giải thuật nổi tiếng để phân chia cục bộ không gian ngõ vào thành những tập

con Thuật giải cây K-D sẽ lặp lại việc phân chia không gian nhiều chiều thành

những siêu hình chữ nhật bằng cách chia cắt liên tục các trục trực giao Mỗi lần

chia cắt sẽ được thực hiện qua toàn bộ miền của một miền đang có và tạo ra hai

miền mới mà chính chúng cũng lại được chia cắt sau đó Một cấu trúc cây xác

định được tạo ra mà những lá của nó thể hiện những vùng cục bộ của không

gian ngõ vào Hình 3.3 mô tả bốn vòng lặp đầu tiên của một cây giải thuật k-d

Những ý tưởng gần đây nhất đã mở rộng để tạo ra những cây k-d mờ để nhận

dạng thông số những hàm liên thuộc mờ hình thang cho những mô hình mờ TS

Trong những trường hợp như thế, những giá trị liên thuộc được liên kết với mỗi

phần chia có được từ việc phân chia để mà mỗi siêu hình chữ nhật có thể được

xem như phần của những tập mờ nhiều biến Chính xác hơn, tâm của mỗi hình

chữ nhật chính là tâm của mỗi hàm liên thuộc Gauss Độ rộng của hàm này

được chọn tỉ lệ với kích thước của siêu hình chữ nhật

Theo sau những ý tưởng này, chúng ta sẽ phát triển một thuật toán cây k-d

mờ thích nghi mà lặp lại việc phân chia không gian ngõ vào thành những vùng

con siêu hình chữ nhật, với mỗi vùng con thể hiện phần giả thiết của luật mờ

Thuật toán làm việc như sau Tại mỗi lần lặp, một vùng con được phân chia

thành hai nữa vùng con Khi bắt đầu bước thứ K, không gian ngõ vào được

phân chia thành K siêu hình chữ nhật Sau đó, việc phân chia lại được áp dụng

- 74 - cho một trong những siêu hình chữ nhật để phân chia toàn bộ vùng thành K+1 phần

Hình 3.2 Sơ đồ học ba pha

Hình 3.3 Phân chia không gian hai chiều bằng cây k-d

Có rất nhiều cách để quyết định miền nào được phân chia và nơi phân chia tại mỗi bước Một vài cách chỉ dựa trên phân bố của ví dụ huấn luyện Phương

Định dạng
Số trang	75
Dung lượng	3,04 MB

Tài liệu tham khảo	Loại	Chi tiết
[1]Phan Xuân Minh.; Nguyễn Doãn Phước.:Lý thuyết Điều khiển mờ.Nhà xuất bản khoa học và Kỹ thuật, 1999	Khác
[2] Nguyễn Doãn Phước, Phan Xuân Minh, Hán Thành Trung.:Lý thyết điều khiển phi tuyến, Nhà xuất bản Khoa Học Và Kỹ Thuật,2003	Khác
[3] Nguyễn Phùng Quang.:Matlab và Simulink Dành Cho Kỹ Sư Điều khiển Tự Động , Nhà xuất bản Khoa Học Và Kỹ Thuật,2003	Khác
[4] N.D.Phước: Lý thuyết điều khiển tuyến tính. NXB KH & KT. 2004. ...Tiếng Anh	Khác
[5].Lakhmi Jain,Ph.D.;Anna Maria Fanelli, Ph.D.:Recent Advances in Artificial Neural Networks Design and Applications. CRC Press LLC,2000	Khác
[6].Kazuo Tanaka.;Hua O.Wang.:Fuzzy Control Systems Design & Analysis.John Wiley & Sons, Inc.2001	Khác
[7].Olaf Wolkenhauer.:Fuzzy Mathematics in Systems Theory and Data Analysis. John Wiley and Sons, Inc.2001	Khác
[8].Raul Garduno-Ramirez.:Overall Intelligent Hybrid control system for a fossil-fuel power unit,Doctor of Philosophy,2000	Khác
[9] G. F. Franklin, J. D. Power, A. E. Naeini: Feedfback Control of Dynamic Systems. Addison-Wesley. 1995	Khác
[10] Tuula Savola.:Simulation And Optimisation Of Power Production In Biomass-Fuelled Small-Scale Chp Plants,Helsinki University of Technology Department of Mechanical Engineering Energy Engineering and Environmental Protection Publications Espoo 2005	Khác
[11] Hung T. Nguyen, Michio Sugeno: Fuzzy systems Modeling and Control. Kluwer Academic Publisher. 1998	Khác
[12] Chun-Liang Lin and Huai-Wen Su.:Intelligent Control Theory in Guidance and Control System Design: an Overview,Proc. Natl. Sci, Counc. ROC(A)Vol	Khác