Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn DANH MỤC CÁC CHỮ VIẾT TẮT, TIẾNG NƯỚC NGOÀI 3 Artificial Neural Networks Mạng nơron nhân tạo 4 Back Propa
Trang 1Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
BÙI THỊ THU PHƯƠNG
THÁI NGUYÊN - 2010
Trang 2Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP
LUẬN VĂN THẠC SĨ KỸ THUẬT
NGHIÊN CỨU ỨNG DỤNG BỘ ĐIỀU KHIỂN NARMA-L2 VÀO THIẾT BỊ LÁI TỰ ĐỘNG GÓC BAY CỦA MÁY BAY BOEING
Ngành : TỰ ĐỘNG HÓA
Cán bộ hướng dẫn khoa học: TS PHẠM HỮU ĐỨC DỤC
THÁI NGUYÊN - 2010
Trang 3Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Trang 4Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
LỜI NÓI ĐẦU
Trong hệ thống điều khiển hiện đại, có rất nhiều phương pháp điều khiển đảm bảo tốt chất lượng điều khiển Trong điều khiển tự động, để điều khiển chính xác đối tượng khi chưa biết rõ được thông số, trước tiên ta phải hiểu rõ đối tượng đó Đặc biệt đối với các đối tượng phi tuyến ta cần nhận dạng được đặc tính vào - ra của nó để đảm bảo tạo ra tín hiệu điều khiển thích nghi được lựa chọn chính xác hơn Những bộ điều khiển hiện đại thường được sử dụng như lôgic mờ, mạng nơron, mạng nơron mờ để nhận dạng và điều khiển thích nghi hệ thống phi tuyến Ngày nay trên thế giới người ta dựa vào cấu trúc mạng nơron sinh vật để làm mạng nơron nhân tạo áp dụng vào các ngành khoa học kỹ thuật
Trong thời gian của khoá học cao học, chuyên ngành Tự động hoá tại trường Đại học Kỹ thuật Công nghiệp Thái Nguyên, được sự tạo điều kiện giúp
đỡ của nhà trường và Tiến sĩ Phạm Hữu Đức Dục em đã lựa chọn đề tài của
mình là: “Nghiên cứu ứng dụng bộ điều khiển Narma - L2 vào thiết bị lái tự động góc bay của máy bay BOEING” Trong quá trình thực hiện đề tài, được
sự hướng dẫn nhiệt tình của Tiến sĩ Phạm Hữu Đức Dục, sự giúp đỡ của bạn bè cùng với sự nỗ lực, cố gắng của bản thân đến nay bản luận văn của em đã hoàn thành Dù đã có nhiều cố gắng, xong bản luận văn vẫn không tránh khỏi những thiếu sót và hạn chế, em rất mong nhận được sự góp ý của các thầy để bản luận văn của em được hoàn thiện hơn
Em xin trân trọng cảm ơn!
Trang 5Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
MỤC LỤC Lời cam đoan Trang Mục lục
Danh mục các chữ viết tắt, tiếng nước ngoài
Danh mục các hình vẽ, đồ thị
PHẦN MỞ ĐẦU 1
CHƯƠNG I TỔNG QUAN VỀ MẠNG NƠRON NHÂN TẠO 3
1.1 Các loại mô hình cấu trúc mạng nơron 3
1.2 Các tính chất của mạng nơron 5
1.3.Các luật học 5
1.3.1 Học có giám sát 6
1.3.2 Học củng cố 6
1.3.3 Học không có giám sát 7
1.4 Ứng dụng của mạng nơron trong nhận dạng và điều khiển 11 1.4.1 Các vấn đề chung 11 1.4.2 Mô tả toán học của đối tượng ở rời rạc 11 1.4.3 Ứng dụng của mạng nơ ron trong nhận dạng 13
1.4.3.1 Mô hình nhận dạng song song 14
1.4.3.2 Mô hình nhận dạng nối tiếp - song song 16 1.4.4 Ứng dụng của mạng nơron trong điều khiển 17 1.4.4.1 Bộ điều khiển ổn định 18
1.4.4.2 Điều khiển ngược thích nghi 18
1.4.4.3 Mô hình điều khiển phi tuyến 19
Trang 6Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
1.4.4.5 Điều khiển thích nghi theo mô hình mẫu hoặc điều khiển 21
nơron thích nghi
1.4.4.7 Phản hồi tuyến tính hóa phản hồi thích nghi dùng mạng nơron 23
1.4.4.8 Điều khiển thích nghi trực tiếp ổn định 24 CHƯƠNG II CÁC MÔ HÌNH CỦA MẠNG MỜ NƠRON TRONG 29 MATLAB VÀ ỨNG DỤNG TRONG NHẬN DẠNG VÀ ĐIỀU KHIỂN
2.1 Giới thiệu Simulink neural toolbox của matlab 29
2.1.1 Khối các hàm chuyển đổi 29
2.2 Các mô hình ứng dụng của Matlab trong điều khiển 31
2.2.1 Bộ điều khiển dự báo sử dụng mạng nơron 33
CHƯƠNG III ỨNG DỤNG BỘ ĐIỀU KHIỂN NARMA - L2 VÀO 57 THIẾT BỊ LÁI TỰ ĐỘNG GÓC BAY CỦA MÁY BAY BOEING
3.2 Ứng dụng bộ điều khiển NARMA - L2 vào thiết bị lái tự động 60 góc bay của máy bay Boeing
Trang 7Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
3.2.3.1 Kết quả mô phỏng ở giai đoạn nhận dạng 67
3.2.3.2 Kết quả mô phỏng ở giai đoạn điều khiển 69 CHƯƠNG IV: KẾT LUẬN CHUNG VÀ KIẾN NGHỊ 73
Trang 8Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
DANH MỤC CÁC CHỮ VIẾT TẮT, TIẾNG NƯỚC NGOÀI
3 Artificial Neural Networks Mạng nơron nhân tạo
4 Back Propagation Learaning Rule Luật học lan truyền ngược
6 Fuzzy Neural Networks Mạng nơron mờ
7 Single Layer Feedforward NetWorks Mạng truyền thẳng một lớp
8 Multilayer Feedforward NetWorks Mạng truyền thẳng nhiều lớp
12 Laterat feedback network Mạng phản hồi bên
14 Lateral-inhibition network Mạng cấu trúc ngang - hạn chế
17 Parameter learning rules Luật học thông số
18 Structure learning rules Luật học cấu trúc
19 Hybrid learning rules Luật học lai
21 Transfer Function Khối các hàm chuyển đổi
22 Net Input Functions Khối đầu vào
23 Weight Functions Khối các hàm trọng số
24 NN Predictive Control Mô hình điều khiển dự báo
26 Model Reference Control Điều khiển theo mô hình mẫu
27 Nonlinear Autoregressive-
MovingAverage - NARMA
Mô hình trung bình trượt-phi tuyến tự hồi quy
Trang 9Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
STT Ký hiệu Diễn giải tên hình vẽ
1 Hình 1.1a Mạng nơron truyền thẳng một lớp
2 Hình 1.1b Mạng nơron truyền thẳng nhiều lớp
3 Hình 1.1c Mạng nơron chỉ có một nơron tự hồi quy
4 Hình 1.1d Mạng nơron hồi quy một lớp
5 Hình 1.1e Mạng có cấu trúc ngang - hạn chế
6 Hình 1.1f Mạng nơron hồi quy nhiều lớp
12 Hình 1.5 Mô hình nhận dạng song song
13 Hình 1.6 Cấu trúc của mô hình nhận dạng cho đối tượng phi tuyến
dạng 3 sử dụng các mạng nơron N1
và N2
14 Hình 1.7 Mô hình nhận dạng nối tiếp - song song
15 Hình 1.8 Bộ điều khiển ổn định
16 Hình 1.9 Hệ thống điều khiển ngược thích nghi
17 Hình 1.10 Mô hình điều khiển phi tuyến
18 Hình 1.11 Mô hình điều khiển dự báo
19 Hình 1.12 Điều khiển thích nghi theo mô hình mẫu
20 Hình 1.13 Mô hình đánh giá thích nghi
Trang 10Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
24 Hình 2.1 Các khối trong Neural Network Toolbox của Matlab
25 Hình 2.2 Khối các hàm chuyển đổi
26 Hình 2.3 Khối đầu vào
27 Hình 2.4 Khối các hàm trọng số
28 Hình 2.5 Khối các bộ điều khiển
29 Hình 2.6 Sơ đồ nhận dạng đối tượng
30 Hình 2.7 Sơ đồ cấu trúc mạng nơron nhận dạng đối tượng
31 Hình 2.8 Sơ đồ điều khiển theo mô hình dự báo
32 Hình 2.9 Mô hình bể chứa phản ứng có khuấy
33 Hình 2.10 Sơ đồ bộ điều khiển dự báo dùng mạng nơron điều khiển
bể chứa phản ứng có khuấy
34 Hình 2.11 Cửa sổ khối Neural Network Predictive Controller
35 Hình 2.12 Cửa sổ nhận dạng đôi tượng
36 Hình 2.13 Bộ dữ liệu huấn luyện
37 Hình 2.14 Đáp ứng của mô hình đối tượng sau quá trình huấn luyện
38 Hình 2.15 Đồ thị tín hiệu đầu ra đối tượng và tín hiệu mẫu
39 Hình 2.16 Cấu trúc của mạng nơron nhận dạng
40 Hình 2.17 Mô hình NARMA-L2
41 Hình 2.18 Mô hình NARMA-L2sau khi đã nhận dạng được đối
tượng, sử dụng trong bước điều khiển tìm tín hiệu điều
Trang 11Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
khiển u
42 Hình 2.19 Mô hình nam châm điện
43 Hình 2.20 Cửa sổ mô hình khối bộ điều khiển NARMA - L2
44 Hình 2.21 Cửa sổ khối nhận dạng đối tượng
45 Hình 2.22 Đồ thị tín hiệu đầu ra đối tượng và tín hiệu mẫu
46 Hình 2.23 Mô hình mạng nơron mô tả đối tượng và bộ điều khiển
dùng mạng nơron đã được cài đặt trong Neural Network Toolbook
47 Hình 2.24 Mô hình tay máy một khâu
48 Hình 2.25 Khối điều khiển tay máy một khâu theo mô hình mẫu sử
dụng mạng nơron
49 Hình 2.26 Khối Model Reference Control
50 Hình 2.27 Đồ thị dữ liệu vào ra của quá trình huấn luyện bộ điều
khiển
51 Hình 2.28 Đồ thị đáp ứng vòng kín của hệ thống sau quá trình huấn
luyện
52 Hình 2.29 Đồ thị tín hiệu đầu ra của đối tượng và tín hiệu mẫu
53 Hình 3.1 Mô hình động học của máy bay
54 Hình 3.2 Sơ đồ ứng dụng bộ điều khiển NARMA-L2 là thiết bị lái
tự động điều khiển đối tượng là góc bay
55 Hình 3.3 Cấu trúc của hai mạng nơron nhận dạng hàm f(.) và hàm
g(.)
56 Hình3 4 Mô hình NARMA-L2sau khi đã nhận dạng được đối
tượng, tính toán tín hiệu điều khiển trong giai đoạn điều khiển
Trang 12Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
57 Hình 3.5 Sơ đồ trên MATLAB Simulink ứng dụng bộ điều khiển
NARMA-L2 đóng vai trò là thiết bị lái tự động điều khiển góc bay của máy bay
58 Hình 3.6 Tín hiệu vào ở dạng ngẫu nhiên trong giai đoạn nhận
Trang 13Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
PHẦN MỞ ĐẦU
1 Tính cấp thiết của đề tài:
Máy bay là phương tiện bay hiện đại, cao cấp, ngày nay đóng vai trò không
thể thiếu trong kinh tế và đặc biệt trong quân sự Máy bay là phương tiện hiện
đại đòi hỏi đảm bảo kỹ thuật rất khắt khe vì các tai nạn máy bay thường gây thiệt
hại rất lớn về nhân mạng và tài sản Một trong những đối tượng quan trọng cần
điều khiển tự động trên máy bay là góc bay Đây là đối tượng khó điều khiển vì
phương trình động học của nó có dạng phi tuyến Yêu cầu đặt ra đối với thiết bị
điều khiển góc bay là cần tạo ra được tín hiệu điều khiển bảo đảm góc bay của
máy bay bám theo được góc bay mong muốn với độ chính xác cao Vì vậy vấn
đề đặt ra là cần trang bị cho máy bay một thiết bị lái tự động để điều khiển góc
bay của nó bám theo được góc bay mong muốn với độ chính xác cao mà không
cần có người điều khiển Mạng nơron được xây dựng mô phỏng theo cấu trúc
của bộ não con người với các luật học hữu hiệu, chúng có khả năng học bộ dữ
liệu vào-ra của đối tượng phi tuyến nhiều vào-nhiều ra (MIMO) với độ chính xác
cao Hiện nay nó đang được ứng dụng nhiều vào các lĩnh vực nhận dạng, nhận
mẫu và điều khiển Trong chương trình khoá học Cao học chuyên ngành Tự
động hoá tại trường Đại học Kỹ thuật Công nghiệp Thái Nguyên, được sự tạo
điều kiện giúp đỡ của nhà trường và Tiến sĩ Phạm Hữu Đức Dục, em đã lựa chọn
đề tài tốt nghiệp của mình là: “Nghiên cứu ứng dụng bộ điều khiển Narma L2
vào thiết bị lái tự động góc bay của máy bay BOEING”
2 Ý nghĩa khoa học và thực tiễn của đề tài
a Ý nghĩa khoa học:
Trang 14Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Điều khiển tự động đóng vai trò quan trọng trong sự phát triển khoa học
và kỹ thuật Lĩnh vực này hữu hiệu khắp nơi từ hệ thống điều khiển tên lửa, máy bay không người lái, người máy, tay máy trong các quy trình sản xuất hiện đại,
và ngay cả trong đời sống hàng ngày: điều khiển nhiệt độ, độ ẩm… Phần lớn việc thiết kế điều khiển góc bay cho máy bay từ trước tới nay thường được dựa trên lý thuyết điều khiển tuyến tính Theo đó, các yếu tố phi tuyến, bất định trong
mô hình động học của máy bay được bỏ qua và động học của máy bay được xấp
xỉ bằng các mô hình tuyến tính Sự phát triển của không quân ngày nay, với tốc
độ bay lớn, sức động cơ mạnh v.v đã tạo ra thách thức trong vấn đề nâng cao
độ chính xác thiết kế bộ phận điều khiển tự động góc bay của máy bay Do đó đề tài sẽ đề cập tới việc ứng dụng bộ điều khiển Narma -L2, bộ điều khiển trung bình trượt, phi tuyến tự hồi quy L2 vào trong thiết bị lái tự động điều khiển góc bay của máy bay Boeing
b.Ý nghĩa thực tiễn
Kết quả nghiên cứu của đề tài có thể làm cơ sở cho việc thiết kế các hệ thống điều khiển máy bay trong nước, đặc biệt làm tài liệu hỗ trợ cho việc học tập của sinh viên
3 Mục đích của đề tài
Nghiên cứu ứng dụng mạng nơron trong quá trình nhận dạng và điều khiển hệ thống phi tuyến nói chung Đặc biệt nghiên cứu sâu hơn về việc ứng dụng bộ điều khiển NARMA - L2 nhận dạng hệ thống được điều khiển, làm cơ
sở cho việc tạo ra tín hiệu điều khiển thích nghi được lựa chọn chính xác
Luận văn này được chia làm bốn chương:
Chương1 Tổng quan về ứng dụng của mạng nơron trong nhận dạng và điều khiển
Trang 15Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Trang 16Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
CHƯƠNG I TỔNG QUAN VỀ ỨNG DỤNG CỦA MẠNG NƠRON
TRONG NHẬN DẠNG VÀ ĐIỀU KHIỂN 1.1 Các loại mô hình cấu trúc mạng nơron
Mạng nơron bao gồm sự liên kết của nhiều nơron Đầu ra của mỗi nơron kết nối với các nơron khác thông qua các trọng số, hoặc tự phản hồi trở về đầu vào của chính nó
Cấu trúc của mạng nơron là kiểu kết nối hình học của mỗi nơron liên kết trong mạng, đây là đặc điểm quan trọng của từng mạng nơron, dựa vào đó tiến hành phân loại chúng Hình 1.1 mô tả một số loại nơron thường gặp
Hình 1.1a mô tả mạng truyền thẳng một lớp (single - layer feedforward networks) có đặc điểm tất cả các nơron đều nhận tín hiệu vào từ nguồn bên ngoài qua các biến trọng số và mỗi nơron đều cho ra một tín hiệu ra
Hình 1.1b mô tả mạng truyền thẳng nhiều lớp (Multilayrer feedforward networks) Lớp vào (Input layer) gồm các nơron nhận trực tiếp các tín hiệu vào lấy từ bên ngoài Lớp ra (Output layer) gồm các nơron có các tín hiệu ra, đưa ra bên ngoài mạng Lớp ẩn (hidden layer) gồm các nơron còn lại không nhận trực tiếp các tín hiệu vào lấy từ bên ngoài và không cung cấp tín hiệu ra cho bên ngoài mạng, nó chỉ có nhiệm vụ truyền tín hiệu từ các nơron ở lớp vào đến các nơron ở lớp ra Mạng nơron truyền thẳng nhiều lớp có một lớp vào, một lớp ra,
có thể không có hoặc có nhiều lớp ẩn Một mạng được gọi là liên kết đầy đủ nếu mỗi nơron ở các lớp trước liên kết với tất cả các nơron ở lớp ngay sau nó Mạng nơron ở (hình 1.1b) là loại mạng nơron truyền thẳng có 3 lớp, có liên kết không đầy đủ
Trang 17Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Nếu mạng nơron có các tín hiệu đầu ra được đưa ngược trở lại đầu vào của các nơron ở các lớp trước nó hoặc chính nó thì mạng đó được gọi là mạng phản hồi (Feedback network)
Mạng phản hồi ở các vòng kín được gọi là mạng hồi quy (recurrent network) Hình 1.1c mô tả một loại mạng hồi quy đơn giản nhất, chỉ có một nơron có tín hiệu ra tự phản hồi về đầu vào của chính nó
Mạng một lớp có liên kết phản hồi như hình 1.1d có đặc điểm tín hiệu đầu
ra của mỗi nơron được đưa ngược trở lại đầu vào của chính nó hoặc của các nơron khác được gọi là mạng hồi quy một lớp
Hình 1.1e mô tả mạng cấu trúc ngang - hạn chế (Lateral-inhibition network), mạng này có 2 loại tín hiệu đầu vào khác nhau: các đầu vào kích thích (Exitatory inputs) ứng với các tín hiệu vào có gắn kí hiệu vòng rỗng (0) và đầu vào hạn chế (Inhibition inputs) với các tín hiệu vào có gắn kí hiệu vòng đặc ()
Hình 1.1 f mô tả mạng hồi quy nhiều lớp
Trang 18Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
x1
x2
xm
(f) (e) (a) Mạng nơron truyền thẳng một lớp (b) Mạng nơron truyền thẳng nhiều lớp (c) Mạng nơron chỉ có một nơron tự hồi quy (d) Mạng nơron hồi quy một lớp (e) Mạng có cấu trúc ngang - hạn chế (f) Mạng nơron hồi quy nhiều lớp 1.2 Các tính chất của mạng nơron Mạng nơron có một số tính chất sau đây: - Là hệ phi tuyến - Là hệ xử lý song song: mạng nơron có cấu trúc song song, do đó có tốc độ tính toán rất cao, rất phù hợp với lĩnh vực nhận dạng và điều khiển - Là hệ học và thích nghi: Mạng được luyện từ các số liệu quá khứ, có khả năng tự điều chỉnh khi số liệu đầu vào bị mất, có thể điều khiển on-line - Là hệ nhiều biến, là hệ nhiều đầu vào, nhiều đầu ra (MIMO) rất tiện dùng khi điều khiển đối tượng khi có nhiều biến số 1.3 Các luật học Mạng nơron sử dụng hai nhóm luật học: nhóm các luật học thông số (Parameter learning rules) và nhóm các luật học cấu trúc (Structure learning rules) Hình 1.1 Cấu trúc của một số loại mạng nơron thường gặp y1
y2
yn
Trang 19Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Hai nhóm luật học trên có thể được áp dụng đồng thời (khi đó gọi là các luật học lai - hybrid learning rules) học cả cấu trúc và thông số, hoặc được áp dụng riêng rẽ
Sau đây trình bày các luật học thông số với các giả thiết:
Cấu trúc của mạng nơron gồm số lượng lớp nơron, số lượng nơron và cách thức liên kết của các trọng số có trong mạng đã hợp lý
Ma trận trọng số đã bao gồm tất cả các phần tử thích ứng
Nhiệm vụ của học thống số là đưa ra phương pháp nào đó để tìm ra ma trận trọng số điều chỉnh từ ma trận trọng số tùy chọn ban đầu với cấu trúc của mạng nơron đã được xác định từ trước, thỏa mãn điều kiện sai lệch trong phạm
vi cho phép
Để làm được việc đó, mạng nơron sử dụng các phương pháp học thích ứng
để tính toán được các ma trận trọng số điều chỉnh w đặc trưng cho mạng Có 3 kiểu học là: Học có giám sát, học củng cố và học không có giám sát
,x(2),…, x(p)
]T và d là véc tơ tín hiệu đầu ra mong muốn d =[(d(1)
,d(2),…, d(p)
]T
Trang 20Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Khi đưa một mẫu tín hiệu là x(k)
vào đầu vào của mạng nơron, ở đầu ra có một tín hiệu ra tương ứng là y(k) Sai lệnh giữa hai véc tơ tín hiệu d, y có nhiệm
vụ điều chỉnh véc tơ trọng số w của mạng nơron sao cho véc tơ tín hiệu ra y của mạng bám theo được véc tơ tín hiệu ra mong muốn d, nói cách khác là để giảm thiểu sai lệch giữa chúng Như vậy kiểu học có giám sát (hình 1.2a) có đặc điểm
là cần có tín hiệu đầu ra mong muốn d được lấy từ bên ngoài
1.3.2 Học củng cố
Trong quá trình học giám sát, giả thiết rằng đáp ứng đầu ra của mạng đã đạt được giá trị mong muốn nhưng ở một mẫu vào – ra nào đó bị cho rằng có kết quả không đáng tin cậy, vì vậy cần phải tiến hành kiểm tra lại mẫu nói trên Khi
đó chỉ có một bit tín hiệu của mẫu cần kiểm tra đóng vai trò là tín hiệu củng cố được đưa vào mạng để góp phần khẳng định kết quả quá trình học có giám sát đúng hay sai Kiểu học này được gọi là kiểu học củng cố (hình 1.2b) Kiểu học này cũng có tín hiệu củng cố được lấy từ bên ngoài nên nó chỉ là một trường hợp đặc biệt của kiểu học có giám sát
1.3.3 Học không có giám sát
Kiểu học này có đặc điểm là không có tín hiệu lấy từ bên ngoài Mạng cần phải tự mình tìm ra các mẫu, nét đặc trưng, sự tương thích, phân loại trong dữ liệu đầu vào và mã hóa thành các mẫu ở đầu ra Trong quá trình học không giám sát (hình 1.2c) nếu mạng không thay đổi thông số của nó thì được gọi là tự tổ chức (self-organizing)
Hình 1.3 trình bày luật học trong số ở dạng cơ bản nhất cho nơron thứ i Trong đó véc tơ tín hiệu vào: x =[(x1,x2,…, xj, xm]T có thể được lấy từ các nơron khác hoặc được lấy từ bên ngoài Thành phần thông số ngưỡng có thể
Trang 21Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
W
Máy phát tín hiệu sai lệch
Tín hiệu sai lệch
(a)
Trang 22Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Tín hiệu vào
Mạng nơron
Mạng nơron
W
Máy phát tín hiệu đánh giá
(b)
Trang 23Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
- Yêu cầu đối với hai kiểu học có giám sát và học củng cố
Cần phải có tín hiệu mong muốn ở đầu ra di, các trọng số của nơron thứ i được điều chính theo giá các trị của tín hiệu vào, tín hiệu đầu ra và tín hiệu đầu
ra mong muốn của nó Nghĩa là cần đưa ra một luật học với mục đích là thay đổi vectơ trọng số wi sao cho các tín hiệu đầu ra của nơron thứ i là yi bám theo được tín hiệu đầu ra mong muốn di (hình 1.3)
- Yêu cầu đối với kiểu học không có giám sát
Trọng số của nơron thứ i chỉ phụ thuộc vào giá trị của sự kết hợp của tín hiệu đầu vào and/or với tín hiệu đầu ra
Nơron thứ i
Máy phát tín hiệu học
w im =b i
Trang 24Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Nói chung các luật học trọng số đều có sự thay đổi giá trị của véctơ trọng
số liên kết của nơron thứ i là wi tại thời điểm t phù hợp với tín hiệu học r và tín hiệu vào x(t):
wi(t)= rx(t) (1.1)
Với là số dương gọi là hằng số học (learning constant) đặc trưng cho tốc
độ học của mạng, thông thường 0 < < 1
Tín hiệu học r thông thường phụ thuộc vào wi, x, di
r = fr (wi, x, di) (1.2) Biểu thức tính véc tơ trọng số của nơron thứ i tại (t+1) như sau:
wi(t+1) = (wi(t) + ft (wi(t), x(t), di(t))x(t) (1.3)
Ở dạng liên tục có thể viết lại là
dt
)t(
dwi
Từ các biểu thức trên ta thấy rằng ở các luật học trọng số nói chung đều tập trung vào xác định tín hiệu học r trong biểu thức cập nhật trọng số của mạng nơron
- Luật học lan truyền ngược của sai lệch rất hiệu quả
So với mạng nơron hồi quy thì mạng nơron hồi quy có:
- Cấu trúc phức tạp vì có các phần tử truyền tín hiệu ở đầu ra của nơron lớp ra ngược tín hiệu ở đầu vào
Trang 25Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Mạng nơron đã được ứng dụng thành công trong nhiều lĩnh vực như: các
hệ thống điều khiển, xử lý hình ảnh, tiếng nói, tối ưu, truyền thông, y học…
Vì có yêu cầu ngày càng tăng về điều khiển, các hệ thống động học phức tạp với điều kiện thông tin không đầy đủ hoặc không xác định nên việc sử dụng mạng nơron rất hấp dẫn bởi khả năng học tập để xấp xỉ hàm và phân loại mẫu của mạng Ngoài ra còn bởi tính xử lý song song mạnh mẽ của phần cứng thực thi mạng
Thông thường người ta hay dùng mạng nơron truyền thẳng nhiều lớp với luật dạy học có giám sát Ưu điểm lớn nhất của các mạng loại này là khả năng tổng quát hoá ánh xạ đầu vào - đầu ra để có thể xấp xỉ bất cứ hàm nào với độ chính xác tuỳ ý Chủ yếu mạng nơron sử dụng để nhận dạng và điều khiển hệ thống
1.4.2 Mô tả toán học của đối tƣợng ở rời rạc
Xét hệ thống có phương trình trạng thái ở dạng sau đây:
Trang 26Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
y(t) = [y1(t), y2(t), ym(t)]T
p, m tương ứng là số đầu vào, đầu ra của hệ thống bậc n: ui(t), yi(t), tương ứng là các tín hiệu vào, tín hiệu ra: xi(t) là các biến trạng thái: (.), (.) là các hàm phi tuyến dừng được định nghĩa tương ứng với Rn Rp Rn và Rn RmViết lại (1.5) ở dạng rời rạc, ta có:
x(k+1) = [x(k),u(k)]
với u(k), x(k), y(k) là các đại lượng cho ở dạng dãy rời rạc
Giả thiết hệ rời rạc (1.6) là tuyến tính và bất biến, có thể viết lại ở dạng:
x(k+1) = Ax(k) + Bu(k)
với A, B, C tương ứng là các ma trận có kích thước (nn), (np) và (mn)
* Đối tượng tuyến tính
Xét hệ một vào - một ra (SISO), dạng rời rạc, có thông số tuyến tính bất biến với thời gian được cho ở dạng:
1 m 0 j j p
iy (k i) u(k j) (1.8) trong đó i, j là các hằng số chưa biết : m n
Tín hiệu ra yp(k+1) là tổ hợp tuyến tính của các giá trị quá khứ của cả tín hiệu đầu vào u(k-j)(j=0,1, ,(m-1)) và tín hiệu đầu ra yp(k-i)(i=1,2, ,(n-1))
* Đối tượng phi tuyến
Đối tượng phi tuyến được biểu diễn theo mô hình rời rạc theo bốn dạng sau đây:
+ Dạng 1:
Trang 27Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
yp(k+1)= y (k i) g[u(k),u(k 1), ,u(k m 1)]
1 n 0 t
yp(k+1) phụ thuộc tuyến tính vào các giá trị quá khứ yp(k - i) (i =0,1, , (n-1)) và
phụ thuộc phi tuyến vào giá trị quá khứ đầu vào u(k), , u(k-m+1)
iu(k i) (1.10)
yp(k+1) phụ thuộc tuyến tính vào giá trị quá khứ đầu vào u(k-i)(i=0,1, ,(m-1))
và phụ thuộc phi tuyến vào giá trị quá khứ đầu ra yp(k), , yp(k-n+1)
+ Dạng 3:
yp(k+1) = f [(yp (k), ,yp(k-n+1)]+g[u(k), u(k-m+1)] (1.11)
yp(k+1) phụ thuộc phi tuyến vào giá trị quá khứ đầu vào u(k), , u(k-m+1), phụ thuộc phi tuyến vào giá trị quá khứ đầu ra yp(k), , yp(k- n+1)
+ Dạng 4:
yp(k+1) = f [(yp(k), yp(k-1), ,yp(k-n+1), u(k), u(k-1), .u(k-m+1)] (1.12)
yp(k+1) phụ thuộc phi tuyến vào giá trị quá khứ đầu ra và phụ thuộc vào các giá
trị đầu vào cùng với các giá trị quá khứ của nó, [u(k), yp (k)], là các cặp tín hiệu
vào ra của đối tượng tại thời điểm k, với m n
f(.), g(.), là các hàm chưa biết trước của đối tượng, chúng cần được xấp xỉ
gần đúng bởi mạng nơron với độ chính xác mong muốn Số lượng các lớp, số
nơron ở mỗi lớp và số lượng mối liên kết trọng số giữa các nơron mỗi lớp với
nhau của mạng nơron nhận dạng cần được chọn phù hợp với độ chính xác và đặc
tính vào ra của hàm phi tuyến tương ứng của đối tượng đã cho
Trang 28Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
1.4.3 Ứng dụng của mạng nơron trong nhận dạng
Vấn đề nhận dạng được đặt ra khi các hàm số (.), (.), của (1.6), hoặc các ma trận A, B và C của (1.7) hoặc i, j của (1.8) hoặc của các hàm phi tuyếnf(.), g(.), (từ 1.9 đến 1.12) là chưa được biết trước
Vì đầu vào và đầu ra của hệ bất biến theo thời gian, nên hệ động học rời rạc là u(k) và y(k) tương ứng: trong đó u(k) là hàm giới hạn, thay đổi theo thời gian Đối tượng được giả thiết là ổn định, nhưng chưa biết các giá trị thông số của đối tượng này
Hình 1.4 Mô hình nhận dạng
Hệ thống nhận dạng được mô tả tại hình 1.4, trong đó mô hình nhận dạng
có cùng đầu vào u(k) với đối tượng cần nhận dạng, đầu ra của mô hình cần nhận dạng là yp(k)
là biểu diễn tính toán gần đúng của đầu ra đối tượng cần nhận dạng là yp(k)
1.4.1.1 Mô hình nhận dạng song song
Trên cở sở các dạng phương trình của đối tượng tuyến tính và phi tuyến
Trang 29Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
(từ 1.8 đến 1.12), có các mô hình nhận dạng các đối tượng nói trên theo mô hình nhận dạng song song (hình 1.5) có các dạng tương ứng như sau
Hình 1.5 Mô hình nhận dạng song song
* Với đối tượng tuyến tính
1 m 0 j j p
(1.15) + Dạng 3:
Trang 30Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
yp(k1)=[yp k , ,ypkn1;u k ,u k1, ,ukm1] (1.17)
Để nhận dạng đối tượng dạng 3 (1.11), trong trường hợp này cấu trúc của
mô hình nhận dạng là giống như đối tượng với f và g được thay thế tương ứng bởi N2
và N1 Mô hình này được mô tả bởi phương trình sau đây:
Đối tƣợng
Mạng nơron
N 1
Mạng nơron
/ w1ij / w2ij
∑
∏
Trang 31Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Hình 1.6 Cấu trúc của mô hình nhận dạng cho đối tượng phi tuyến dạng 3
sử dụng các mạng nơron N 1 và N 2
1.4.1.2 Mô hình nhận dạng nối tiếp - song song
Căn cứ vào dạng phương trình của đối tượng tuyến tính và phi tuyến (từ 1.8 đến 1.12), các mô hình nhận dạng của các đối tượng nói trên theo mô hình nhận dạng nối tiếp - song song (hình 1.7) có dạng tương ứng như sau:
Hình 1.7 Mô hình nhận dạng nối tiếp - song song
* Đối tượng tuyến tính:
1 m 0 j j p
Trang 32Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
(1.21) + Dạng 3:
Trong các mô hình nhận dạng, mô hình nhận dạng song song có ưu điểm:
- Đơn giản, dễ thực hiện
- Nhận dạng đối tượng đảm bảo độ chính xác cao hiện đang được ứng dụng nhiều trong nhận dạng đối tượng
Vì vậy trong luận văn này sử dụng mô hình nhận dạng song song
1.4.2 Ứng dụng của mạng nơron trong điều khiển
Vấn đề đặt ra là cần thiết kế bộ điều khiển thảo mãn yêu cầu đề ra với điều kiện các hàm số (.) và (.) của (1.6) hoặc các ma trận A, B và C của (1.7) hoặc
i, j của (1.8) hoặc của các hàm phi tuyến f(.), g(.) (từ 1.9 đến 1.12) đã được biết trước
Trang 33Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
1.4.2.2 Điều khiển ngƣợc thích nghi
Mạng nơron mô phỏng
mô hình ngƣợc của đối tƣợng điều khiển
Thuật toán thích nghi
Bộ điều khiển
Đối tƣợng điều khiển
Tín hiệu điều khiển ngƣợc
T/h điều khiển phản hồi
Tín hiệu đầu ra đối tƣợng
Trang 34Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Hình 1.9 là mô hình cấu trúc của mô hình mẫu điều khiển ngược thich
nghi Thuật toán này có khả năng tiếp nhận sai lệch giữa đầu ra của đối tượng và
đầu ra của mô hình mẫu Thông số của bộ điều khiển được cập nhật liên tục để
giảm sai lệch Bộ điều khiển mô hình mẫu thích nghi cơ bản có thể ảnh hưởng
bởi nhiễu từ sensor và nhiễu bên ngoài tác động vào đối tượng điều khiển Loại
bỏ các loại nhiễu này bằng cách sử dụng mạng nơron mô tả đối tượng nối song
song với đối tượng điều khiển Mạng nơron được huấn luyện trên cơ sở dữ liệu
vào-ra của đối tượng điều khiển Sai lệch giữa đầu ra của đối tượng điều khiển
và của mô hình mạng nơron được phân tích như hiệu ứng của nhiễu và nhiễu ở
đầu ra đối tượng Tín hiệu sai lệch này được đưa vào mạng nơron mô phỏng mô
hình ngược của đối tượng điều khiển tạo ra tín hiệu lọc nhiều và dấu hiệu nhiễu
được loại trừ từ đầu vào đối tượng Đó chính là ý tưởng thực hiện loại bỏ được
nhiễu bên ngoài và nhiễu bên trong của đối tượng
L
+
+
Hình 1.9 Hệ thống điều khiển ngược thích nghi
1.4.2.3 Mô hình điều khiển phi tuyến
Mạng nơron mô phỏng đối tƣợng
Mạng nơron mô phỏng mô hình ngƣợc đối tƣợng
Mô hình mẫu
Thuật toán thích nghi
Nhiễu sensơ
Trang 35Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Mô hình điều khiển phi tuyến được biểu diễn trên hình 1.10 Nó gồm có
bộ điều khiển sử dụng mạng nơron, mạng nơron mô phỏng đối tượng và bộ lọc với một thông số điều khiển Bộ điều khiển sử dụng mạng nơron thường được huấn luyện để biểu diễn mô hình ngược của đối tượng (nếu mô hình ngược này tồn tại) Sai lệch giữa đầu ra của mạng nơron mô phỏng đối tượng và tín hiệu đầu ra của đối tượng được đưa về đầu vào bộ của bộ lọc, sau đó được đưa tới bộ điều khiển sử dụng mạng nơron Mạng nơron mô phỏng đối tượng và mạng nơron đóng vai trò là bộ điều khiển đối tượng (nếu nó là mô hình ngược của đối tượng) có thể được huấn luyện theo kiểu off - line sử dụng dữ liệu tập hợp từ động học của đối tượng Bộ lọc ở mô hình này là bộ lọc bậc nhất có hằng số thời gian được lựa chọn để đảm bảo mạch vòng kín ổn định
Hình 1.10 Mô hình điều khiển phi tuyến
1.4.2.4 Mô hình điều khiển dự báo
Mô hình điều khiển dự báo hình 1.11 sử dụng để tối ưu hóa đáp ứng đầu ra của đối tượng trong khoảng thời gian dự kiến Đây là cấu trúc phụ thuộc nhiều
Đầu ra đối tƣợng
+
-
Mạng nơron mô phỏng đối tƣợng
khiển nơron
Đối tƣợng điều khiển
Tín hiệu điều khiển
Dự báo đầu
ra đối tƣợng
Lệnh đầu
vào
-
+
Trang 36Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
vào mạng nơron mô tả đối tượng, bộ điều khiển sử dụng mạng nơron hàm biển diễn phản ứng đầu ra của hệ thống và thực hiện tối ưu hóa để lựa chọn tín hiệu điều khiển tốt nhất
Mạng nơron mô phỏng đối tượng được sử dụng để dự báo đầu ra của đối tượng Bộ điều khiển sử dụng mạng nơron tiến hành học, lựa chọn các đầu vào bằng quá trình tối ưu Khi quá trình huấn luyện đã hoàn thành, quá trình tối ưu hóa được thay thế bởi quá trình điều khiển sử dung bộ điều khiển nơron
Hình 1.11 Mô hình điều khiển dự báo
1.4.2.5 Điều khiển thích nghi theo mô hình mẫu hoặc điều khiển nơron
thích nghi
Điều khiển thích nghi theo mô hình mẫu sử dụng hai mạng nơron: mạng nơron thứ nhất thực hiện mô phỏng đối tượng và mạng nơron thứ hai đóng vai trò là bộ điều khiển hình 1.12 Mạng mô phỏng đối tượng được huấn luyện theo kiểu off - line sử dụng dữ liệu vào - ra của đối tượng điều khiển Bộ điều khiển
có nhiệm vụ tạo ra tín hiệu điều khiển cung cấp cho đối tượng điều khiển sao cho
Vòng tối ƣu hóa
Mô hình
mẫu
mô phỏng đối tƣợng
Đối tƣợng điều khiển
Bộ điều khiển nơron
Dự báo đầu
ra đối tƣợng
Đầu ra đối tƣợng
Tín hiệu điều khiển Lệnh đầu
vào
Trang 37Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
tín hiệu đầu ra đối tượng bám theo được tín hiệu đầu ra của mô hình mẫu Mạng nơron mô phỏng đối tượng được sử dụng để dự báo ảnh hưởng của bộ điều khiển đến sự thay đổi tín hiệu đầu ra của đối tượng điều khiển và cho phép cập nhật thông số của bộ điều khiển
Sai lệch điều khiển
Tín hiệu điều khiển
+
Mô hình mẫu
Mạng nơron
mô phỏng đối tƣợng
Bộ điều khiển nơron
Đối tƣợng điều khiển
Lệnh đầu
vào
Đầu ra đối tƣợng
+
-
Sai lệch
-
Trang 38Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Hình 1.13 Mô hình đánh giá thích nghi
1.4.2.7 Phản hồi tuyến tính hóa phản hồi thích nghi dùng mạng nơron
Phương pháp phản hồi tuyến tính hóa thích nghi dùng mạng nơron dựa vào nguyên tắc thiết kế bộ điều khiển phản hồi tuyến tính hóa hình (1.14) Phương pháp phản hồi tuyến tính hóa có đặc điểm là tín hiệu điều khiển có hai thành phần
Hệ thống phi tuyến được mô tả bởi quan hệ:
xp (n)
=f(xp)+ g(xp)u (1.24) với: xp(n)
=[(xp, x p, , x p(n-1)]T (1.25)
trong đó có n biến trạng thái và u là tín hiệu điều khiển
Mạng đánh giá (Tối ƣu hóa)
Đối tượng điều khiển
Mạng hoạt động (Bộ điều khiển)
Đối tƣợng điều khiển
Tín hiệu điều khiển
Lệnh
đối tƣợng
Trang 39Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Hình 1.14 Phương pháp phản hồi tuyến tính hoá thích nghi dùng mạng nơron
Để tìm được hệ tuyến tính hóa từ hệ thống phi tuyến mô tả bởi công thức (1.24), sử dụng tín hiệu u ở dạng:
u = [
)xp(g
1
f(xp) - kT xp+ r] (1.26) với k là hệ số phản hồi và r là tín hiệu đầu vào
Thay (1.26) vào (1.24) hệ tuyến tính có dạng:
xp(n) = - kT xp+ r (1.27)
Hệ thống được điều chỉnh bởi mạch phản hồi tuyến tính
Có thể sử dụng mạng nơron để thực hiện chiến lược phản hồi tuyến tính Thực hiện xấp xỉ các hàm f(.), g(.) bởi hai mạng nơron NNf và NNg, khi đó tín hiệu điều khiển có dạng:
Mô hình mẫu
Thích nghi cho NN g
Đối tƣợng điều khiển
e
xm
Trang 40Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
)x(NNg
)x(g
p g
p
[-NNf(xp) - kT xp+ r] (1.30) Sai lệch điều khiển được định nghĩa như sau:
1.4.2.8 Điều khiển thích nghi trực tiếp ổn định
Phương pháp này sử dụng định lý ổn định Lyapunov trong thiết kế của luật học của mạng nơron Bộ điểu khiển gồm có 3 phần: Bộ điều khiển phản hồi tuyến tính, bộ điều khiển trượt phi tuyến và bộ điều khiển mạng nơron thích nghi