1 max min 2peak * Trị số quân phương: là mức đo biên độ được dùng nhiều nhất vì ngoài đặc tính xác định tín hiệu theo thời gian, trị số này còn liên quan trực tiếp đến năng lượng của
Trang 1Đại Học Quốc Gia Tp Hồ Chí Minh TRƯỜNG ĐẠI HỌC BÁCH KHOA
-
HUỲNH CÔNG LỚN
ỨNG DỤNG PHƯƠNG PHÁP UNSUPERVISED NEURAL NETWORKS ĐỂ XÁC ĐỊNH HƯ HỎNG GÃY RĂNG, MÒN RĂNG CỦA HỘP GIẢM TỐC
MỘT CẤP RĂNG TRỤ RĂNG THẲNG
Chuyên ngành: CƠ KHÍ CHẾ TẠO MÁY
Mã ngành: 2.01.00
LUẬN VĂN THẠC SĨ
TP HỒ CHÍ MINH, tháng 12 năm 2007
Trang 2CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
Cán bộ hướng dẫn khoa học: TS Lưu Thanh Tùng
Cán bộ chấm nhận xét 1:
Cán bộ chấm nhận xét 2:
Luận văn thạc sĩ được bảo vệ tại HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC SĨ TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày tháng năm
Trang 3LỜI CẢM ƠN
Để có được những kiến thức quí giá và hoàn thành tốt luận văn tốt nghiệp được giao như ngày hôm nay, em xin chân thành cảm ơn sự quan tâm - giúp đỡ tận tình của thầy cô trường Đại học Bách Khoa Tp.HCM đã
dạy em trong suốt thời gian qua và đặc biệt là sự hướng dẫn của TS.Lưu
Thanh Tùng, đã tận tình giúp đỡ và tạo mọi điều kiện thuận lợi cho em
hoàn thành tốt nhiệm vụ của mình
Chân thành cảm ơn quí thầy cô trong Khoa Cơ Khí, Bộ môn Cơ giới hóa XN - XD đã giúp đỡ và ủng hộ cho em trong suốt quá trình học tập, nghiên cứu và nhất là trong thời gian thực hiện luận án
Chân thành cảm ơn các bạn sinh viên khóa 2003 - ngành Máy xây dựng và nâng chuyển đã dành nhiều thời gian giúp sức cho đề tài hoàn thành tốt hơn
Và cuối cùng, chân thành cảm ơn các Anh Chị đồng nghiệp và đồng học lớp Cao học Chế tạo máy khóa 15 đã dành thời gian giúp cho đề tài này hoàn thành tốt đẹp
TP.HCM, ngày 14 tháng 12 năm 2007
Trang 4Huỳnh Công Lớn
Abstract
The suitability of artificial neural networks (ANNS) for detecting fault conditions in gearbox is investigated Specifically, the ability of a neural network to act as a predictor of correct gear behaviour is examined Experimental results indicate that standard network architectures are unsuitable for temporal prediction of non-linear system behaviour An unsupervised neural network architecture designed specifically as a predictor and based on Kohonen Model is therefore proposed The performance of this network is evaluated using measured data Laboratory implementation of the fault detection system produced encouraging quantitative results, including high success rates for the detection of faults corresponding to gearbox
Trang 5
MỤC LỤC
Trang CHƯƠNG 1 1.1 1.1.1 1.1.2 1.1.3 1.2 1.2.1
1.2.2 1.2.3 1.3 GIỚI THIỆU Tổng quan
Bảo trì phục hồi
Bảo trì phòng ngừa
Bảo trì chính xác
Tổng quan các phương pháp chuẩn đoán và xác định hư hỏng của hộp truyền động
Phương pháp phân tích tín hiệu trung bình đồng thời
Phân tích miền thời gian
Phân tích phổ tần số
Nội dung thực hiện
1-9 1-4 2 3 3 4-9 4 5 6 9 CHƯƠNG 2 2.1 2.2 2.2.1 2.2.2 2.3 2.3.1 2.3.2 2.4 2.4.1 2.4.2 GIỚI THIỆU MẠNG NƠRON NHÂN TẠO Cấu trúc sinh học của nơron
Tổng quát về cấu trúc nơron nhân tạo
Giới thiệu
Tính toán trong mạng nơron
Phương pháp huấn luyện mạng
Giải thuật học có giám sát
Giải thuật học không giám sát
Cấu trúc của mạng
Cấu trúc của mạng truyền tiến
Cấu trúc mạng lan truyền ngược
10-37
10-11 11-14 11 12 14-16 15 16 17-23 17 20
Trang 62.5
2.5.1
2.5.2
2.5.3
2.5.4
Mô tả các loại mạng nơron thông dụng
Mạng perceptron
Mạng Hopfield
Mạng Kohone
Mạng RBF
23-37 23 28 30 33 CHƯƠNG 3 3.1 3.2 3.2.1 3.2.2 3.2.3 3.2.4 PHƯƠNG PHÁP THỰC HIỆN Chọn mô hình thí nghiệm
Qúa trình đo và xử lý tín hiệu
Qúa trình đo
Xử lý tín hiệu
Các phổ dao động cho trường hợp bánh răng bị gãy một răng
Các phổ dao động cho trường hợp bánh răng bị mòn
38-54 38-39 39-54 40 41 45 50 CHƯƠNG 4 4.1 4.2 4.2.1 4.2.2 4.2.3 HUẤN LUYỆN VÀ NHẬN DẠNG HƯ HỎNG Giải thuật huấn luyện
Kết quả huấn luyện
Huấn luyện mạng trong trường hợp bánh răng bình thường
Huấn luyện mạng trong trường hợp bánh răng bị gãy răng
Huấn luyện mạng trong trường hợp bánh răng bị mòn răng
55-69
55-57 58-69 58 60
63
CHƯƠNG 5
5.1
5.2
5.3
KẾT LUẬN
Kết luận Các mặt hạn chế của đề tài Các đề xuất
70-71
70 71 71
Trang 7TÀI LIỆU THAM KHẢO 72-73
PHỤ LỤC
A Các chương trình huấn luyện và nhận dạng
1 Chương trình huấn luyện nơron không giám sát
2 Chương trình kiểm tra và nhận dạng hư hỏng
3 Chương trình chuyển đổi FFT
4 Huấn luyện nơron không giám sát 2 chiều
B Một số chương trình viết để tham khảo
1 Thuật toán FFT
2 Thiết kế bộ lọc Cheblp
74-88
74-86 74 77 82 85 86-88 86 87
Trang 8BẢNG LIỆT KÊ BẢNG BIỂU VÀ HÌNH ẢNH
5 2.5 Mô hình toán của mạng truyền tiến 1 lớp 18
6 2.6 Mô hình mạng động dùng đầu ra truyền tiến và đầu vào truyền lùi 22
7 2.7 Mô hình học tổng quát cho mạng có giải thuật lan truyền ngược 23
10 2.10 Mô hình tín hiệu của mạng nơron xuất thứ k 26
14 3.1 Sơ đồ động hộp giảm tốc một cấp răng trụ răng thẳng 38
Trang 919 3.6 Phổ bánh răng gãy răng, đo lần 2 46
Trang 11Chương 1: GIỚI THIỆU
1.1 Tổng quan
Ngày nay, trong sản xuất công nghiệp hiện đại, máy móc và thiết bị đóng vai trò quan trọng trong việc quyết định năng suất, chất lượng, giá thành của sản phẩm và khả năng cạnh tranh của các doanh nghiệp Cùng với mức độ cơ khí hóa, tự động hóa ngày càng cao trong các dây chuyền sản xuất, con người nhận thức sâu sắc được tổn thất chi phí to lớn do ngừng sản xuất vì máy móc bị hư hỏng
Thời gian ngừng máy luôn ảnh hưởng đến khả năng sản xuất của thiết bị do làm giảm sản lượng, tăng chi phí vận hành và gây trở ngại cho dịch vụ khách hàng Những hậu quả của ngừng máy càng trầm trọng hơn
do công nghiệp sản xuất của thế giới có xu thế theo hệ thống sản xuất đúng lúc (Jast - in - time) Do đó chỉ cần xảy ra hư hỏng nhỏ ở bất kỳ vị trí nào của thiết bị thì toàn bộ hệ thống phải ngừng sản xuất Trong những năm gần đây sự phát triển của cơ khí hóa và tự động hóa đã làm độ tin cậy và khả năng sẵn sàng của thiết bị là một yếu tố quan trọng hàng đầu trong sản xuất
Để thấy rõ được vấn đề này, hãy xem tổn thất trong một giờ ngừng sản xuất do máy bị hư hỏng ở một số ngành công nghiệp:
- Dầu khí: vài triệu USD/giờ
- Thép: 10.000 USD/giờ
- Giấy: 10.000 ÷ 20.000 USD/giờ
- Hóa chất: 2.000 USD/giờ
Trang 12- Sản xuất lon bia: 2.000 USD/giờ
- Điện: 10.000 USD/giờ
Từ các ví dụ trên ta thấy rằng thiết bị máy móc phải có độ chính xác cao, độ tin cậy cao, tuổi thọ lớn và khả năng sẵn sàng cao Để đạt được đều này thì các doanh nghiệp cần phải có chiến lược bảo trì thiết bị hợp lý Một trong những nguyên nhân gây ra hư hỏng thiết bị máy móc đó là dao động Hơn nữa dao động cũng chính là những dấu hiệu để nhận biết được hư hỏng Do đó cần phải có chương trình giám sát rung động ở các bộ phận của máy móc để các doanh nghiệp chủ động trong công tác bảo trì nhằm kéo dài tuổi thọ của máy móc Các chiến lược bảo trì thiết bị của các doanh nghiệp làm cho thiết bị vận hành một cách an toàn và hiệu quả cao Trên thực tế có 3 chiến lược bảo trì như sau:
1.1.1 Bảo trì phục hồi:
Bảo trì phục hồi là hoạt động bảo trì được thực hiện sau khi máy bị hỏng, nhằm mục đích khôi phục lại tình trạng làm việc của chi tiết máy, cụm máy Vì vậy trong quá trình sản xuất sẽ bị ảnh hưởng rất nhiều đến kế hoạch sản xuất của doanh nghiệp, đặc biệt là các thiết bị trong các dây chuyền sản xuất tự động Hình thức bảo trì này không mang lại hiệu quả kinh tế cao, gây tổn thất về kinh tế lớn, do các nguyên nhân sau:
- Hư hỏng lan rộng ra toàn hệ thống
- Ngừng trệ dây chuyền sản xuất
- Ảnh hưởng đến quan hệ thương mại của doanh nghiệp
- Độ tin cậy của giảm
Trang 131.1.2 Bảo trì phòng ngừa:
Bảo trì phòng ngừa là bảo trì có kế hoạch Các máy móc thiết bị quan trọng sẽ được bảo trì trong những khoảng thời gian nhất định đã được lập kế hoạch trước Nguyên tắc thực hiện: thường xuyên kiểm tra bằng cách tháo lắp kiểm tra các bộ phận, bôi trơn, thay dầu, thay các chi tiết, sửa chữa phương pháp này tỏ ra khá hiệu quả giảm được nhiều hư hỏng Tuy nhiên phương pháp này có một số nhược điểm như sau:
- Khi đến thời điểm bảo trì theo kế hoạch đề ra thì phải tiến hành dừng máy và làm công tác bảo trì thiết bị Đôi khi máy móc không xảy ra tình trạng hư hỏng gì, thiết bị vẫn làm việc bình thường, thì sẽ rất tốn kém về thời gian và công sức để lắp ráp lại Thậm chí có khả năng máy móc sau khi lắp lại sẽ không có trạng thái làm việc tốt như ban đầu, phải tiến hành cân chỉnh lại
- Khoảng thời gian giữa hai lần bảo trì vẫn có khả năng dừng máy
do hư hỏng Doanh nghiệp lại rơi vào tình trạng bảo trì phục hồi, không có kế hoạch, không có trình tự
1.1.3 Bảo trì chính xác:
Đây là biện pháp bảo trì dựa theo kỹ thuật giám sát tình trạng máy, có thể tránh hư hỏng máy và chỉ can thiệp vào máy khi có báo động sắp xảy ra sự cố Tiến trình thực hiện kỹ thuật giám sát tình trạng máy bao gồm các bước sau:
Trang 14- Giám sát và chuẩn đoán thường xuyên tình trạng máy, được thực hiện bằng cách đo nhiệt, dao động bội trơn
- Thiết lập sơ đồ tình trạng máy từ các số liệu đo
- Xác định thời điểm cần thiết để can thiệp vào máy
Việc đo đạc và phân tích tình trạng máy không những cho phép xác định tình trạng máy mà còn giúp dự đoán được giá trị tới hạn của nó Như vậy phương pháp này có các ưu điểm như sau:
+ Giảm thiểu tối đa các khuyết tật
+ Giảm hư hỏng
+ Giảm chi phí bảo trì
+ Giảm chi phí sản xuất
+ Nâng cao hiệu suất máy
+ Độ tin cậy cao
+ Giảm giá thành sản phẩm
Mục đích của các chiến lược bảo trì là nhằm cực tiểu hóa chi phí, kéo dài tuổi thọ của chi tiết máy, can thiệp đúng lúc, đúng vị trí Để thực hiện được điều này thì các chi tiết máy cần được giám sát thường xuyên
Ví dụ: Dao động của máy móc có thể gây ra nhiều như hỏng Các vết nứt của vật liệu gây ra các dao động âm với tần số cao Hư hỏng cũng là nguyên nhân gây nhiệt độ máy tăng lên Bằng cách giám sát hạt của chất bôi trơn cũng có thể xác định được độ mòn của chi tiết
1.2 Tổng quan các phương pháp chuẩn đoán và xác định hư hỏng của hộp truyền động
Trang 151.2.1 Phương pháp phân tích tín hiệu trung bình đồng thời
Nguyên tắc của phương pháp này là mọi rung động liên quan đến trục hoặc bánh răng sẽ lặp lại có chu kỳ theo chu kỳ trục quay Bằng cách chia các tín hiệu rung động thành những phần liên tiếp nhau tương ứng với chu kỳ quay của trục, sau đó lấy giá trị trung bình của tất các phần rung động này để làm tín hiệu chuẩn, nếu tín hiệu rung động nào không thuộc dạng này sẽ bị loại ra Dựa vào từng loại rung động riêng biệt này, thì các loại hư hỏng ứng với mỗi rung động sẽ được chuẩn đoán chính xác Tuy nhiên phương pháp này có một số nhược điểm như sau:
- Khi hệ thống phức tạp thì cần phải sử dụng nhiều bộ chuyển đổi tín hiệu trung bình, do đó chi phí cho công tác giám sát sẽ rất cao
- Phương pháp này phụ thuộc vào việc lập trình trên máy tính nên cần phải có bộ chuyển đổi tín hiệu từ liên tục sang tín hiệu số
1.2.2 Phân tích miền thời gian:
Trước khi phương pháp phân tích phổ ra đời thì hầu hết việc phân tích rung động được thể hiện trên miền thời gian Biên độ rung động là một tham số để miêu tả tính chất quan trọng của rung động Có nhiều cách thức khác nhau để xác định biên độ dao động
* Mức đỉnh: Trị số đỉnh được dùng nhờ đặc tính cho biết giá trị cực đại tức thời mà không cần xét đến thời gian sản sinh ra nó Chính vì điều này mà trị số đỉnh rất cần thiết cho việc xác định mức độ của các loại sốc có thời gian xảy ra rất ngắn:
Trang 161 (max( ( )) min( ( ))) 2
peak
* Trị số quân phương: là mức đo biên độ được dùng nhiều nhất vì ngoài đặc tính xác định tín hiệu theo thời gian, trị số này còn liên quan trực tiếp đến năng lượng của tín hiệu, và từ đó là khả năng phá hủy của dao động:
0
1 ( ( ) )
T KMS
1 ( ( ) )
N RMS
Nhược điểm: Đối với thiết bị phức tạp và đắt tiền thì đòi hỏi phải chuẩn đoán và dự báo trước tình trạng máy móc để có biện pháp phòng ngừa Đối với yêu cầu này thì đòi hỏi phải có chuyên gia về dao động và thiết bị hỗ trợ công tác chuẩn đoán, nên phương pháp phân tích dao động miền thời gian này khó áp dụng được
1.2.3 Phân tích phổ tần số:
Trang 17Thuật ngữ phân tích phổ tần số được dùng để miêu tả việc phân tích tín hiệu dao động dựa vào miền tần số của dao động Phương pháp phân tích phổ tần số là phương pháp được sử dụng thường xuyên nhất trong kỹ thuật phân tích dao động phục vụ cho việc giám sát điều kiện làm việc của các hệ thống truyền động và cung cấp một công cụ hữu hiệu cho việc xác định và chuẩn đoán hư hỏng của các chi tiết máy Kỹ thuật phân tích phổ là sự chuyển đổi từ miền thời gian của dao động sang miền tần số Để làm được điều này thì dùng phương pháp lọc ban tần hẹp, hoặc phương pháp phổ biến hơn là biến đổi fourier rời rạc của các dữ liệu số Phương pháp biến đổi fourier được miêu tả như sau:
Trang 18- biên độ của thành phần điều hòa tại tần số nω
- góc pha của thành phần điều hòa
C =C e− - liên hợp phức của thành phần điều hòa tại tần số nω
Ưu điểm: Hiện nay có nhiều công ty cung cấp dụng cụ phân tích FFT, tốc độ và chất lượng cao với giá thành chấp nhận được cho các doanh nghiệp Hơn nữa trên thị trường của bộ phân tích FFT, nhiều công
ty sau khi bán hàng cũng cung cấp luôn các khóa huấn luyện và tài liệu hường dẫn phương pháp chuẩn đoán hư hỏng thiết bị Bởi vì sự ứng dụng rộng rãi của phương pháp phân tích phổ trong nhiều năm qua nên có rất nhiều nghiên cứu cũng như tài liệu chỉ dẫn phương pháp này để chuẩn đoán hư hỏng của máy móc thiết bị
Nhược điểm: Nhược điểm chính của phương pháp phân tích phổ là sự phức tạp của nó Khi tiến hành đo tín hiệu dao động và chuẩn đoán hư hỏng thì cần phải có mặt các chuyên gia về dao động thì mới tiến hành được chuẩn đóan chính xác tình trạng của thiết bị
Sự dao động của máy móc thiết bị được sinh ra bởi sự ma sát giữa các vật chuyển động, sự mất cân bằng của các chi tiết quay Sự phá hủy và mài mòn chi tiết máy có thể ảnh hưởng đến bất kỳ chi tiết nào, đặc biệt là trong các hệ thống truyền động từ động cơ sang bộ phận công tác của
thiết bị Mục đích của luận án là "ứng dụng phương pháp unsupervied nơron network để xác định hư hỏng gãy răng, mòn răng của hộp giảm tốc một cấp răng trụ răng thẳng " Lợi ích của phương pháp này giúp cho các
Trang 19doanh nghiệp giảm đáng kể chi phí do ngừng máy, chi phí thuê chuyên gia để giám sát và phân tích tình trạng thiết bị Để thực hiện được điều này, toàn bộ các chi tiết quan trọng của hệ thống sẽ được giám sát tình trạng liên tục nếu trong quá trình vận hành có bất cứ tín hiệu nào bất thường xảy
ra thì chương trình giám sát sẽ có những khuyến cáo chính xác về tình trạng của thiết bị cho người vận hành biết Từ đó người vận hành máy sẽ có biện pháp can thiệp và điều chỉnh kịp thời
1.3 Nội dung thực hiện:
1) Khảo sát các phương pháp chuẩn đoán hư hỏng của hệ thống truyền động được ứng dụng hiện nay
2) Sử dụng phương pháp phân tích phổ và unsupervied neural network để chuẩn đoán và xác định hư hỏng hộp giảm tốc một cấp bánh răng trụ răng thẳng
3) Chọn mô hình thí nghiệm để lấy tín hiệu cho việc huấn luyện mạng 4) Dùng Matlab để lập trình phần mềm chuẩn đoán hư hỏng của bánh răng trên hộp giảm tốc
Trang 20Chương 2 GIỚI THIỆU MẠNG NƠRON NHÂN TẠO
2.1 Cấu trúc sinh học của nơron:
Bộ não người bao gồm xấp xỉ 100 tỷ tế bào thần kinh, còn được gọi là nơron Tất cả những hoạt động của con người phụ thuộc vào những tế bào nhỏ bé này
Mỗi nơron kết hợp với nhiều nơron khác tạo thành mạng nơron Sự kết nối thành mạng tạo làm cho con ngưòi có khả năng tính toán và ghi nhớ nơron là đơn vị cơ bản của hệ thần kinh trung tâm (Central nervous System: CNS), những nơron này có chức năng xử lý và thông tin qua lại từ những bộ phận khác nhau của cơ thể con người Theo quan điểm về xử lý thông tin, mỗi nơron bao gồm 3 phần, mỗi phần liên hệ với nhau bằng một phương trình toán cụ thể:
Hình 2.1: Mô hình nơron sinh học + Denrite: có chức năng nhận thông tin từ những nơron khác
Trang 21+ Thân nơron (hay Soma): thu thập và kết nối những thông tin nhận được từ những nơron khác
+ Đầu ra Axon: mỗi nơron chỉ có một đầu ra axon có chức năng truyền thông tin đến các nơron khác
Từ cấu trúc đó, ta có thể xem nơron như là một hệ thống nhiều đầu vào và một đầu ra được mô tả như sau:
Hình 2.2: Mô hình nơron nhân tạo 2.2 Tổng quát về cấu trúc nơron nhân tạo (Artificial neural networks): 2.2.1 Giới thiệu:
Mạng nơron sinh học có đặc tính rất phức tạo và đa dạng, vì vậy việc đưa những đặc tính phức tạp này vào trong một mô hình rất khó khăn Để đạt được mục tiêu này, cấu trúc của nơron sinh học (còn gọi là nơron đơn vị) được phát triển trong mô hình mạng nơron Nơron có đầu vào nhận từ đầu ra của nơron khác hay từ môi trường bên ngoài Tổng trọng số của các đầu vào này thiết lập thành hàm tác động phi tuyến Một nơron là kích động nếu tổng trọng số tại đầu vào của nó lớn hơn giá trị ngưỡng w0
Mô hình toán cho đầu ra của nơron được định nghĩa như sau:
Trang 220 1
với [x1, x2, ,xn] là đầu vào của nơron
[w1,w2, ,wn] là trọng số
y(t) là đầu ra nơron
ψ : là hàm tác động
W0 : giá trị ngưỡng
2.2.2 Tính toán trong mạng nơron:
Mục đích của việc nghiên cứu những tính toán trong mạng nơron là để phát triển mô hình mạng nơron mà không cần thiết nghiên cứu về mặt sinh học, mô hình toán có thể thực hiện bằng những hàm tính toán khác nhau Mạng nơron nhân tạo (ANNs), hay những mạng nơron đơn giản thường được mô tả bằng những mô hình kết nối hay mạng xử lý phân bố song song (parallel distributed processing networks)
Bắt đầu với sự phát triển của những tính toán nơron dựa trên những hiểu biết về cấu trúc sinh học của nó cùng với luật học Điều này dẫn đến quá trình tính toán trong mạng nơron được thực hiện theo 3 bước sau:
+ Phát triển mô hình nơron dựa trên cấu trúc sinh học của nó
+ Mô hình kết nối và cấu trúc synapse
+ Luật học
Các nhà nghiên cứu đã khám phá ra nhiều cấu trúc mạng nơron khác nhau nhưng nếu xét về cấu trúc mạng nơron có thể phân thành mạng tĩnh, mạng động, mạng một lớp và mạng nhiều lớp Hơn nữa, những cách tính toán
Trang 23khác nhau trong mạng nơron cũng làm nảy sinh những cách kết nối synapse khác nhau giữa các nơron
Mặc dù các nhà nghiên cứu đã đưa ra nhiều cấu trúc mạng nơron cũng như giải thuật học khác nhau, những mạng nơron cũng có chung nhiều đặc tính, mà những đặc tính này là duy nhất đối với một hệ sinh học Những đặc tính này tương phản với phương pháp tính toán truyền thống Những tính toán trong mạng nơron có thể điều tiết nhiều đầu vào song song và mã hóa thông tin theo mô hình phân bố Kiểu mã hóa này tương phản với sơ đồ bộ nhớ truyền thống, ở đó những mẫu thông tin cụ thể được chứa trong một vùng bộ nhớ Sự phân phát bộ nhớ trong mạng nơron có nhiều thuận lợi, quan trọng nhất là bộ nhớ chứa dư ra nhiều thông tin tiêu biểu một lúc Vì vậy mạng nơron vẫn có thể hoạt động tốt khi bị phá hủy một vài bộ phận trong cấu trúc mạng
Thuộc tính của mạng nơron như luật học, sự tổng hợp thông tin dư thừa và dung sai cho phép là động cơ chọn lựa mô hình sinh học thích hợp cho mạng nơron Những kích thích (potential benefits) của mạng nơron có thể được tóm tắt như sau:
Ĩ Mô hình nơron có nhiều nơron liên kết với nhau theo một cấu trúc song song Vì có cấu trúc song song nên sự bất thường của một vài nơron không gây ra những ảnh hưởng quan trọng lên toàn bộ hệ thống Đặc tính này được xem như dung sai
Ĩ Chiều dài của mạng phụ thuộc vào luật học và khả năng thích nghi của nó Khả năng thích nghi và học từ môi trường có nghĩa là mạng
Trang 24nơron có thể xử lý được những dữ liệu mơ hồ, không rõ ràng (imprecise data) và những tình huống không được định nghĩa tốt (ill - defined situation) Mạng được huấn luyện thích hợp sẽ có khả năng tổng hợp khi đầu vào không xuất hiện trong quá trình huấn luyện
Ĩ Đặc tính quan trọng nhất của mạng nơron là khả năng xấp xỉ những hàm liên tục phi tuyến đến độ chính xác mong muốn Khả năng này của mạng làm cho chúng trở nên hữu ích khi xây dựng một mô hình trong bộ điều khiển phi tuyến
Ĩ Mạng nơron có thể có nhiều đầu vào và nhiều đầu ra nên có thể ứng dụng cho nhiều hệ thống khác nhau
Mặc dù một số lượng lớn những phép toán trong mạng nơron và giải thuật học được đưa ra, nhưng hầu hết những mạng này đều có một đặc tính chung nào đó với hệ nơron sinh học Cấu trúc cơ bản của một mạng nơron bao gồm nhiều nơron được phân bố song song và cách thức giải mã thông tin trong kết nối synapse và cách thức gọi thông tin với đáp ứng đầu vào hiện đại Các mạng nơron khác nhau đều có cách học tương tự nhau, chúng đều rút ra những kinh nghiệm từ những dữ liệu được đưa vào
2.3 Phương pháp huấn luyện mạng:
Trang 25Học Neural
Theo như hình vẽ, nếu chỉ xét về học thông số thì luật học có thể phân loại thành luật học giám sát và luật học không giám sát
2.3.1 Giải thuật học có giám sát
Dùng một tín hiệu mong muốn ở ngoài như một thầy giáo và sai số của tín hiệu được phát sinh bằng cách so sánh đầu ra mong muốn và đầu
ra thực sự của mạng Dựa trên tín hiệu sai số mạng nơron sẽ cải tiến trọng số để cải tiến hoạt động của hệ thống với giả sử đầu ra mong muốn của mạng được biết trước như hình sau:
Trang 26Hình 2.3: Giải thuật học có giám sát
w t+ =w t + Δw t i ) ( ) ( ).[ ( ) ( )]
w t μ x t ya t y t
với wi(t) là trọng số khi đầu vào là x(t), Δwi (t) là sự thay đổi của trọng số,
μ là hằng số học, ya(t) là đầu ra mong muốn, y(t) là đầu ra thực sự của mạng Sự lựa chọn hằng số học rất quan trọng trong luật học này, một giá trị rất nhỏ của hằng số học sẽ làm cho kết quả học chậm đi rất nhiều; một giá trị lớn của hằng số học sẽ làm cho quá trình học diễn ra nhanh hơn nhưng nó cũng có thể làm cho hệ thống trở nên dao động bất ổn định
2.3.2 Giải thuật học không giám sát :
Ngược lại, luật học không giám sát không có tín hiệu mong muốn Trong cách học này không có thông tin hồi tiếp từ môi trường để báo cáo đầu ra thực sự của mạng là đúng hay sai, mạng sẽ tự điều chỉnh các trọng số kết nối giữa các nơron bằng cách sử dụng các đầu ra thực sự của mạng Có hai cấu trúc quan trọng của luật học không giám sát đó là luật học Hebbian và luật học cạnh tranh Luật học Hebbian làm thay đổi trọng số theo đáp ứng tương quan của hai nơron nối liền nhau Luật học Hebbian đơn giản dùng để mô tả tương quan giữa tín hiệu đầu vào và tín hiệu đầu
ra được mô tả bằng phương trình:
Trang 27Hình 2.4: Giải thuật học không giám sát
2.4 Cấu trúc mạng
2.4.1 Cấu trúc của mạng truyền tiến:
Một nơron bao gồm synapse (điểm nối) và soma (thân nơron) Trong mô hình mạng nơron, đầu ra axon của nơron này được nối với các đầu vào dendrite của các nơron khác thông qua kết nối synapse và sự kết nối này quyết định trọng số giữa các nơron Mỗi soma có trung bình 104
đầu vào dendrite và soma có chức năng tổng hợp trọng số của tất cả các đầu vào này Nếu trọng số này lớn hơn giá trị ngưỡng thì nó sẽ tạo thành xung kích ở đầu ra nơron, những xung kích này thông qua axon để chuyển đến đầu vào các nơron khác
Nhìn ở góc độ về xử lý tín hiệu, nơron có hai yếu tố then chốt là synapse và soma; nó có chức năng tính toán và nhớ những dữ liệu trong quá khứ Mỗi synapse là một phần tử để lưu dữ liệu (hay trọng số) và nó
Trang 28sẽ được học để hiệu chỉnh những trọng số này cho đến khi đạt được đầu ra như mong muốn Soma có nhiệm vụ tổng hợp các trọng số đầu vào của nơron và tạo thành kích thích ở đầu ra axon thông qua hàm tác động dạng phi tuyến
Một cách đơn giản, ta có xem một nơron như là một phần tử xử lý thông tin (PE) gồm có n đầu vào:
Lúc này, mô hình của một nơron có thể được biểu diễn như sau:
Hình 2.5: Mô hình toán của mạng truyền tiến một lớp
với W(t) vectơ trọng số; ψ [.] là hàm tác động phi tuyến
Ánh xạ phi tuyến Ne bao gồm 2 thành phần là: Hàm tổng hợp và hàm tác động phi tuyến Hàm tổng hợp cung cấp trọng số, cách kết nối và giá trị ngưỡng đến đầu vào nơron Để tính toán giá trị ngưỡng chúng ta sẽ định nghĩa thêm một vectơ ở đầu vào nơron, lúc này đầu vào và trọng số của nơron được cho như sau:
Trang 29a Hàm tổng hợp:
Về mặt sinh học, hàm tổng hợp tượng trưng cho trọng số của tín hiệu đầu vào X0(t), dữ liệu được tồn trữ tại vectơ trọng số (synapse), Wa(t) sự kết nối những trọng số đầu vào được thực hiện bởi soma Synapse và soma ánh xạ tuyến tính như được mô tả ở phương trình sau:
0
( ) ( ) ( )
n T
b Chức năng của hàm tác động phi tuyến:
Các chức năng của hàm tác động phi tuyến ψ [.] ánh xạ giá trị hàm tổng hợp u(t) thành giá trị đầu ra Nhìn chung đầu ra của nơron trong khoảng [0,1] hoặc [-1,1] , và được tính như sau:
1
( ) [ a( )T a( )]
y t =ψ W t X t ∈R
c Một số hàm tác động thông thường:
+ Hàm bậc thang đơn vị:
nếu
1 ( )
f f
≥
<
+ Hàm ngưỡng hay còn gọi là hàm dấu:
Trang 30nếu
1 ( ) sgn( )
f f
2 ( )
Trọng số và phép tổng hợp được thực hiện bởi synapse và soma, chúng tạo ra phép đo đồng bộ giữa vectơ đầu vào Xa(t) và vectơ trọng số
Wa(t) Khi có một đầu vào mới thì nó sẽ được so sánh với dữ liệu ở các bước học trước để hiệu chỉnh các trọng số sao cho sai số ở đầu ra giảm đi Nói cách khác, quá trình huấn luyện là làm cho vectơ Xa(t) tương đương với Wa(t) Hầu hết cấu trúc mạng nơron đều phải trải qua quá trình học để cập nhật trọng số Giải thuật thay đổi trọng số gọi là luật học Mục đích của luật học phụ thuộc vào từng ứng dụng
Trang 312.4.2 Cấu trúc mạng lan truyền ngược
Trong những phần trước chúng ta đã trình bày ngắn gọn về cấu trúc của mạng nơron truyền tiến một lớp, nhiều lớp với cấu trúc không hồi tiếp Những mạng nơron này được gọi là mạng tĩnh, truyền tiến hoặc không tuần hoàn Những mạng như thế không có bộ nhớ động như là đáp ứng của mạng vì vậy nó phụ thuộc vào đầu vào hiện tại và trọng số, những mạng này không có hồi tiếp nên nó ổn định
Qúa trình truyền tiến và truyền lùi ảnh hưởng qua lại lẫn nhau, điều chỉnh trọng số, làm giảm sai số đầu ra trong suốt quá trình học Một mạng nơron được thành lập tốt sẽ có thể xấp xỉ hàm phi tuyến với độ chính xác như mong muốn Đặc tính này của mạng truyền tiến được các nhà nghiên cứu dùng trong mô hình động, tuy nhiên mạng này cũng có những hạn chế nhất định
Xét hai ví dụ sau:
Hình (a):
Hình (b):
Trang 33Hình 2.6: Mô hình mạng động dùng đầu ra truyền tiến và đầu vào truyền lùi
Phương trình toán mô tả nơron trong miền thời gian rời rạc được mô tả bởi phương trình:
( ) [ a( ) *T a( ) a ( ) *T a( 1)]
y k =ψ W k X k +W k Y k−
với k là biến rời rạc trong miền thời gian; ψ[.] là hàm tác động phi tuyến;
Xa(k) ∈Rn+1 là vectơ đầu vào tại thời điểm k; Ya(k) và Ya(k-1) là vectơ đầu ra tại thời điểm k và k-1; W1a (k) là ma trận trọng số truyền tiến;
W2a(k) là ma trận trọng số truyền ngược Mô hình học tổng quát cho mạng được minh họa trong hình sau:
Trang 34Hình 2.7: Mô hình học tổng quát cho mạng có giải thuật lan truyền ngược Bởi vì mạng truyền lùi có hồi tiếp từ nơron đầu ra đến nơron đầu vào nên đáp ứng của mạng được gọi là đáp ứng động Sau khi cập nhật một đầu vào mới, đầu ra sẽ được tính toán và hồi tiếp để hiệu chỉnh đầu vào, sau đó đầu ra lại được tính toán lại và quá trình tiếp tục được lập lại như thế Sự lập lại liên tục làm đầu ra có sự thay đổi ngày càng nhỏ thậm chí là hằng số Trong một vài trường hợp quá trình xử lý thông tin sẽ không kết thúc, những mạng như vậy gọi là mạng không ổn định
2.5 Mô tả các loại mạng nơron thông dụng:
2.5.1 Mạng perceptron:
a Mô tả:
Mạng perceptron là loại mạng nơron phổ biến nhất Hình 2.8 mô tả mạng perceptron 4 lớp: 1 lớp vào, 2 lớp ẩn và 1 lớp ra Các nơron trong
Trang 35lớp vào có chức năng như là một vùng đệm để chuyển tín hiệu đầu vào x1
đưa đến sau khi đã nhân với trọng số tương ứng, đầu ra của nơron j thông qua hàm kích hoạt f(.) được tính toán như sau:
Y = f ∑w x i j
Đầu ra của các nơron lớp xuất cũng được tính toán tương tự
Hình 2.8: Mạng perceptron nhiều lớp
b Huấn luyện:
Trong mạng nơron perceptron nhiều lớp, thuật toán huấn luyện thường được sử dụng là thuật toán truyền ngược (backpropagation) Thuật toán truyền ngược là thuật toán huấn luyện có giám sát, tìm kiếm theo chiều gradien âm, bao gồm 2 quá trình: truyền thuận tín hiệu và truyền ngược sai số Trong quá trình truyền thuận tín hiệu, tín hiệu đầu vào được truyền xuyên qua mạng từ lớp này đến lớp khác và tạo ra một tín hiệu đầu
ra, các trọng số của mạng là không thay đổi Trong quá trình truyền ngược, sai số (so sánh giữa đầu ra thực tế và đầu ra mong muốn) được truyền xuyên qua mạng, trong quá trình này các gia trọng trọng số được
Trang 36hiệu chỉnh sao cho đáp ứng thực tế của mạng ngày càng tiến gần đến đáp ứng mong muốn
Thuật toán truyền ngược nhằm huấn luyện cho mạng đáp ứng đúng theo một tập mẫu (xj, dj) tương ứng:
Giả thiết có sai số tại ngõ ra của nơron j ở bước lặp thứ n là:
e n =d n −y n
với j là nơron lớp xuất
Tổng bình phương các sai số tức thời của mạng: 2
=
= ∑ với M là tất cả các nơron trong lớp xuất Gía trị trung bình bình phương sai số tức thời của mạng là:
1
1 ( )
N
n
E n
N ∑= với N là số mẫu huấn luyện
Xét mô hình tín hiệu của một nơron j cho trong hình 2.9, ta có tín hiệu đầu
ra của nơron j ở bước lặp thứ n là y1(n)=ϕ (vj(n)), trong đó
, với P gồm tất cả tín hiệu đưa vào nơron j (chưa kể đến mức ngưỡng θ)
Trang 37( ) ( ) ( )
Trang 38Hình 2.10: Mô hình tín hiệu của mạng nơron xuất thứ k
Theo hình 2.10, gradien cục bộ δj(n) của nơron ẩn j được định nghĩa như sau:
k
k k j
Trang 39Gradien cục bộ của nơron trong lớp ẩn δj(n) được tính theo biểu thức sau:
, nơron j là nơron ẩn
Gradien cục bộ tùy thuộc vào nơron j thuộc lớp ẩn hay lớp xuất:
- Nếu nơron j thuộc lớp xuất: '
Trang 40Hình 2.11 Mạng Hopfield
b Huấn luyện:
Mạng Hopfield chỉ có một lớp nơron đầu ra duy nhất, số nơron bằng số tín hiệu vào, mỗi nơron liên kết đến tất cả các nơron khác Huấn luyện mạng Hopfield cũng chỉ cần 1 bước, hệ số trọng lượng wji được xác định trực tiếp như sau:
1
1 0
p
c c
i j c
yl (0) = xl 1≤ l ≤ N