Năm 1943, nhà thần kinh học Warren MeCulloch và nhà logic học Walter Pitts đã chỉ ra rằng:về nguyên tắc mạng các nơ-ron nhân tạo có thể được mô hình hoá như thiết bị ngưỡng giới hạn để t
Trang 1
TRỊNH THỊ PHƯƠNG THẢO
NHẬN DẠNG CHỮ VIẾT TAY TIẾNG VIỆT
SỬ DỤNG MẠNG NƠRON
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Thái Nguyên, Tháng 06 năm 2012
Trang 2LỜI CẢM ƠN
Xin chân thành cảm ơn Thầy giáo, PGS.TS Lê Bá Dũng đã tận tình chỉ
dạy, hướng dẫn tôi trong suốt thời gian nghiên cứu và thực hiện luận văn
Tôi cũng xin chân thành cảm ơn các Thầy giáo Viện Công nghệ Thông tin
và các Thầy giáo Trường Công nghệ thông tin và Truyền thông - ĐH Thái Nguyên đã giảng dạy, giúp đỡ trong suốt thời gian học tập
Xin cảm ơn tất cả các anh chị học viên Cao học khóa 9, cảm ơn các cán bộ công chức, giảng viên Trường Công nghệ thông tin và Truyền thông - ĐH Thái Nguyên đã tạo điều kiện tốt cho tôi trong suốt trong hai năm học qua
Xin cảm ơn các bạn bè, đồng nghiệp đã tạo diều kiện cũng như đã chỉ bảo tôi rất nhiều trong thời gian thực hiện luận văn này
Cuối cùng, xin chân thành cảm ơn gia đình đã động viên và tạo mọi điều kiện thuận lợi để tôi có được kết quả như ngày hôm nay
Thái Nguyên, tháng 06/2012
Người viết luận văn
Trịnh Thị Phương Thảo
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan đề tài luận văn “Nhận dạng chữ viết tay Tiếng Việt sử dụng mạng Nơron” là công trình nghiên cứu của bản thân tôi Các số liệu, kết
quả nghiên cứu nêu trong luận văn này là trung thực và không sao chép y nguyên
từ một công trình nào khác Tôi xin chịu trách nhiệm về luận văn của mình
Thái Nguyên, tháng 06/2012
Người viết luận văn
Trịnh Thị Phương Thảo
Trang 4MỤC LỤC
Trang
TRANG PHỤ BÌA
LỜI CẢM ƠN i
LỜI CAM ĐOAN ii
MỤC LỤC iii
DANH MỤC CÁC TỪ TIẾNG ANH VIẾT TẮT vii
DANH MỤC CÁC HÌNH viii
PHẦN MỞ ĐẦU 1
CHƯƠNG I 3
TỔNG QUAN VỀ MẠNG NƠRON NHÂN TẠO VÀ MẠNG NƠRON KOHONEN 3
1.1 Giới thiệu về mạng nơron nhân tạo 3
1.1.1 Lịch sử phát triển 3
1.1.2 Mô hình mạng nơ-ron nhân tạo 4
1.1.2.1 Nơ-ron sinh học 4
1.1.2.2 Nơ-ron nhân tạo 6
1.1.2.3 Mạng nơ-ron nhân tạo 12
1.1.2.3.1 Mạng truyền thẳng 13
1.1.2.3.2 Mạng hồi quy (Recurrent Neutral Network) 15
1.1.2.4 Luật học 16
1.2 Phạm vị ứng dụng của mang nơron nhân tạo 20
1.2.1 Những bài toán thích hợp 20
1.2.1.1 Phân loại 21
1.2.1.2 Mô hình hoá 21
Trang 51.2.1.3 Biến đổi 23
1.2.1.4 Liên kết 23
1.2.2 Các lĩnh vực ứng dụng mạng nơron 24
1.3 Mạng KOHONEN 26
1.3.1 Giới thiệu về mạng Nơron Kohonen 26
1.3.2 Cấu trúc của mạng nơron Kohonen [9] 27
1.3.3 Thực hiện mạng nơron Kohonen [9] 28
1.3.3.1 Chuẩn hóa đầu vào 28
1.3.3.2 Tính toán đầu ra cho mỗi nơron 29
1.3.3.3 Chọn nơron chiến thắng 29
1.3.3.4 Quá trình học của mạng nơron Kohonen 30
1.3.3.4.1 Tốc độ học 32
1.3.3.4.2 Hiệu chỉnh trọng số 33
1.3.3.4.3 Tính toán lỗi 34
CHƯƠNG II 36
ỨNG DỤNG MẠNG NƠRON KOHONEN TRONG BÀI TOÁN NHẬN DẠNG CHỮ VIẾT TAY TIẾNG VIỆT 36
2.1 Tổng quan về bài toán nhận dạng 36
2.2 Giới thiệu về bài toán nhận dạng chữ viết tay Tiếng Việt 39
2.3 Phương pháp nhận dạng chữ viết tay sử dụng mạng nơron 43
2.4 Phát biểu bài toán 44
2.5 Các bước giải quyết bài toán sử dụng mạng nơron Kohonen 44
2.5.1.Xây dựng giao diện vẽ 44
2.5.2 Xây dựng mạng nơron Kohonen 47
2.5.3 Xử lý dữ liệu (phân tích ảnh) 47
Trang 62.5.4 Huấn luyện mạng nơron Kohonen 48
2.5.5 Nhận dạng mạng nơron Kohonen 50
2.5.6 Kết luận 50
CHƯƠNG III 52
MÔ PHỎNG NHẬN DẠNG KÝ TỰ VlẾT TAY TIẾNG VIỆT RỜI RẠC SỬ DỤNG MẠNG NƠRON KOHONEN 52
3.1 Giới thiệu 52
3.2 Thực hiện chương trình nhận dạng ký tự 53
3.2.1 Xác định các tham số cho mạng 54
3.2.2 Vẽ hình ảnh 55
3.2.3 Lấy mẫu xuống hình ảnh 56
3.2.3.1 Lưu hình ảnh được lấy mẫu xuống 56
3.2.3.2 Kích thước và vị trí 56
3.2.3.3 Thực hiện lấy mẫu xuống 57
3.2.4 Các tập huấn luyện 58
3.2.5 Lớp mạng cơ bản 58
3.2.6 Lớp mạng nơron Kohonen 59
3.2.6.1 Tính toán đầu ra của mạng Kohonen 61
3.2.6.2 Huấn luyện mạng nơron Kohonen 62
3.3 Chương trình mô phỏng 65
3.3.1 Các chức năng của chương trình 65
3.3.2 Kết quả nhận dạng 66
3.3.3 Kết luận 68
Trang 7CHƯƠNG IV: KẾT LUẬN 71
4.1 Các kết quả đã đạt được 71
4.1.1 Về mặt lý thuyết 71
4.1.2 Về mặt thực tiễn 72
4.2 Hướng phát triển tiếp tbeo 73
4.3 Một vài suy nghĩ sau khi nghiên cứu 73
TÀI LIỆU THAM KHẢO 75
Trang 8DANH MỤC CÁC TỪ TIẾNG ANH VIẾT TẮT
STT Từ viết tắt Từ viết tường minh
1 HMM Hiden Markov Model
2 LVQ Learning Vector Quantization
3 MLP Multi Layer Perception
4 OCR Optical Character Recognation
5 PDA Personal Digital Assistant
6 RFID Radio Frequency Identification
7 SOM Self Organizing Maps
8 SVM Support Vector Machine
Trang 9DANH MỤC CÁC HÌNH
Hình 1.1 Mô hình nơ-ron sinh học 6
Đồ thị hàm đồng nhất (Identity function) 8
Đồ thị hàm bước nhị phân (Binary step function) 9
Đồ thị hàm sigmoid 10
Đồ thị hàm sigmoid lưỡng cực 10
Hình 1.2 Mô hình một nơ-ron 11
Hình 1.3 Mạng truyền thẳng một lớp 14
Hình 1.4 Mạng truyền thẳng nhiều lớp 15
Hình 1.5 Mạng một lớp có nối ngược 16
Hình 1.6 Mạng nhiều lớp có nối ngược 16
Hình 1.7: Cấu trúc của mạng Kohonen 27
Hình 1.8: Mạng nơron Kohonen điển hình 28
Hình 1.9: Huấn luyện mạng Kohonen (SOM) 30
Hình 1.10 Quá trình huấn luyện mạng nơron Kohonen 31
Hình 2.1: Mô hình chung trong nhận dạng chữ viết 42
Hình 2.2: Quá trình tìm giới hạn ký tự 45
Hình 2.3: Quá trình lấy mẫu xuống 45
Hình 2.4 Quá trình ánh xạ từ ma trận điểm sang ma trận giá trị 48
Hình 2.5 Quá trình huấn luyện mạng nơron Kohonen 49
Hình 3.1 Giao diện chương trình mô phỏng 65
Hình 3.2 Nhận dạng ký tự Ơ 67
Hình 3.3 Nhận dạng ký tự Ô 67
Hình 3.4 Nhận dạng ký tự Ư 68
Trang 11PHẦN MỞ ĐẦU
Trong ngành công nghệ thông tin hiện nay, trí tuệ nhân tạo hiện đại đang được sự quan tâm rất lớn Các máy tính và công nghệ vi điện tử hiện đại đang hy vọng ở các phương pháp này như chìa khóa mở ra thế hệ máy tính thông minh mới mô phỏng được như bộ não con người Nghiên cứu và mô phỏng trí não, cụ thể là tế bào thần kinh (Neural) là một ước muốn từ lâu của nhân loại Với khoảng 15 tỷ Neural ở não người, mỗi Neural có thể nhận hàng vạn tín hiệu từ khớp thần kinh và được coi là một cơ chế sinh vật phức tạp nhất Não người có khả năng giải quyết những vấn đề như: nghe, nhìn, nói, hồi ức thông tin, phân biệt các mẫu mặc dù sự kiện có bị méo mó, hay thiếu hụt Não thực hiện những nhiệm vụ như vậy nhờ các phần tử tính toán (Neural thần kinh) Não phân bố việc xủ lí cho hàng tỉ Neural có liên quan, điều khiển các mối liên hệ giữa các Neural đó Neural không ngừng nhận và truyền thông tin lẫn nhau Cơ chế hoạt động của Neural [1] bao gồm: liên kết (association), tổng quát hóa (generation),
và tự tổ chức (Self Orgazation) Các Nơron tự liên kết với nhau thành mạng trong xử lý Mỗi mạng gồm hàng vạn các phần tử Nơron khác nhau Mỗi phần tử Nơron có khả năng liên kết với hàng nghìn các Nơron khác
Hiện nay, mạng Nơron được đưa vào ứng dụng rộng rãi trong rất nhiều lĩnh vực Và bài toán nhận dạng là bài toán sử dụng các tính năng của mạng Nơron nhiều nhất Bài toán nhận dạng với sự trợ giúp của mạng Nơron ngày nay
đã không còn dừng ở mức độ nghiên cứu nữa mà nó trở thành một lĩnh vực để áp dụng vào thực tế Các bài toán nhận dạng được nghiên cứu nhiều nhất hiện nay tập trung vào nhận dạng mẫu hình học (vân tay, mặt người, hình khối …), nhận dạng tiếng nói và nhận dạng chữ viết Chúng được ứng dụng trong rất nhiều lĩnh
Trang 12vực như y học, dự báo thời tiết, dự báo cháy rừng, …, các lĩnh vực tự động hóa như điều khiển rô-bốt, điều khiển các thiết bị bằng giọng nói,… Trong số các bài toán nhận dạng này, nhận dạng chữ viết đang được ứng dụng rất phổ biến Nhận dạng chữ viết được ứng dụng trong quá trình tự động hóa các công việc văn phòng như nhập liệu, lưu trữ văn bản, sách báo, phân loại thư tín,…, những công việc rất nhàm chán và đòi hỏi nhiều thời gian của con người Nhận dạng bằng mạng Nơron đang được ứng dụng trong hàng loạt lĩnh vực quan trọng của cuộc sống, phục vụ lợi ích trực tiếp và thiết thực cho công việc của con người
Mục đích của luận văn là: Trình bày các kết quả nghiên cứu lý thuyết phục
vụ cho chủ đề: “Nhận dạng chữ viết tay Tiếng Việt sử dụng mạng Nơron” Tuy nhiên, do hạn chế về mặt thời gian cũng như độ phức tạp của bài toán mà trong khuôn khổ, thời lượng của luận văn, tôi chỉ đi sâu nghiên cứu và đưa ra một chương trình mô phỏng nhận dạng ký tự viết tay Tiếng Việt rời rạc trực tuyến sử dụng mạng Nơron Kohonen
Trang 13CHƯƠNG I TỔNG QUAN VỀ MẠNG NƠRON NHÂN TẠO
VÀ MẠNG NƠRON KOHONEN
1.1 Giới thiệu về mạng nơron nhân tạo
1.1.1 Lịch sử phát triển
Khái niệm mạng nơ-ron được bắt đầu vào cuối thế kỷ 19, đầu thế kỷ 20 do
có sự tham gia của ba ngành Vật lý học, Tâm lý học và Thần kinh học Các nhà khoa học như Hermann Von Hemholtz, Earnst Mach, Ivan Pavlov với các công trình nghiên cứu đi sâu vào lý thuyết tổng quát mô tả hoạt động của trí tuệ con người như: Học, nhìn, và lập luận, nhưng không đưa ra được mô hình toán học
cụ thể mô tả hoạt động của nơ-ron
Về lịch sử, quá trình nghiên cứu và phát triển mạng nơ-ron nhân tạo có thể chia thành bốn giai đoạn như sau:
+ Giai đoạn một: Từ nghiên cứu của William (1890) về tâm lý học với sự liên kết các nơ-ron thần kinh Năm 1943, nhà thần kinh học Warren MeCulloch
và nhà logic học Walter Pitts đã chỉ ra rằng:về nguyên tắc mạng các nơ-ron nhân tạo có thể được mô hình hoá như thiết bị ngưỡng (giới hạn) để thực hiện tính toán bất kỳ một hàm số học hay các phép tính logic nào Tiếp theo hai ông là Donald Hebb với giải thuật huấn luyện mạng ra đời năm 1949
+ Giai đoạn hai: Vào khoảng những năm 1960, một số mô hình nơ-ron hoàn thiện hơn có tính ứng dụng thực tiễn đã được đưa ra như: mô hình Perceptron của Frank Rosenblatt (1958), mô hình Adaline của Bernard Widrow (1962) Trong đó mô hình Perceptron rất được quan tâm vì nguyên lý đơn giản, nhưng nó cũng có hạn chế vì như Marvin Minsky và Seymour Papert của MIT
Trang 14(Massachurehs Insritute of Technology) đã phát hiện ra và chứng minh nó không dùng được cho các hàm logic phức (1969) Còn Adaline là mô hình tuyến tính,
tự chỉnh, được dùng rộng rãi trong điều khiển thích nghi, tách nhiễu và vẫn phát triển cho đến nay
+ Giai đoạn ba: Vào khoảng đầu thập niên 80, việc nghiên cứu mạng ron diễn ra rất mạnh mẽ cùng với sự ra đời của máy tính cá nhân PC Những đóng góp lớn cho mạng nơ-ron trong giai đoạn này phải kể đến Stephen Grossberg, Teuvo Kohonen, Rumelhart và John Hopfield Trong đó đóng góp lớn của nhà vật lý học người Mỹ John Hopfield gồm hai mạng phản hồi: Mạng rời rạc năm 1982 và mạng liên tục năm 1984 Đặc biệt, ông đã dự kiến nhiều khả năng tính toán lớn của mạng mà một nơ-ron không có khả năng đó Cảm nhận của Hopfield đã được Rumelhart, Hinton và Williams đề xuất thuật toán sai số truyền ngược (back –propagation) nổi tiếng để huấn luyện mạng nơ-ron nhiều lớp nhằm giải bài toán mà mạng khác không thực hiện được Nhiều ứng dụng mạnh mẽ của mạng nơ-ron ra đời cùng với các mạng theo kiểu máy Boltzmann
nơ-và mạng Neocognition của Fukushima
+ Giai đoạn bốn: từ năm 1987 - đến nay, hàng năm thế giới đều mở hội nghị toàn cầu chuyên ngành nơ-ron IJCNN (International Joint Conference on Neural Networks) Rất nhiều công trình được nghiên cứu để ứng dụng mạng nơ-ron vào các lĩnh vực cuộc sống, ví dụ như: Kỹ thuật tính, tối ưu, sinh học, y học, thống kê, giao thông, hoá học… Cho đến nay, mạng nơ-ron đã tìm được và khẳng định được vị trí của mình trong rất nhiều ứng dụng khác nhau
1.1.2 Mô hình mạng nơ-ron nhân tạo
1.1.2.1 Nơ-ron sinh học
Trang 15Bộ não con người có khoảng 1010
tế bào thần kinh liên kết chặt chẽ với nhau được gọi là các nơ-ron Mỗi nơ-ron gồm có ba phần: Thân nơ-ron với nhân ở bên trong (soma), một đầu sợi trục thần kinh ra (axon) và một hệ thống tế bào hình cây (dendrite) Tế bào hình cây có nhiệm vụ mang các tín hiệu điện tới các tế bào thân,
tế bào thân sẽ thực hiện gộp (Sum) và phân ngưỡng ( Thresholds) các tín hiệu đến Sợi trục thần kinh làm nhiệm vụ đưa các tín hiệu thân ra ngoài
Trong thực tế có rất nhiều dây thần kinh vào và chúng bao phủ một diện tích rất lớn (0.25 mm2) để nhận các tín hiệu từ các nơ-ron khác Đầu thần kinh ra được
rẽ nhánh nhằm chuyển giao tín hiệu từ thân nơ-ron tới nơ-ron khác Các nhánh của đầu thần kinh được nối với các khớp thần kinh (synapse) Các khớp thần kinh này được nối với thần kinh vào của các nơ-ron khác Sự sắp xếp của các nơ-ron và mức
độ mạnh yếu của các khớp thần kinh được quyết định bởi quá trình hóa học phức tạp, sẽ thiết lập chức năng của mạng nơ-ron, các nơ-ron có thể sửa đổi tín hiệu tại các khớp, trong các nơ-ron nhân tạo được gọi là trọng số
Có thể nói, mạng nơ-ron sinh học hoạt động chậm hơn rất nhiều so với các linh kiện điện tử (10-3
giây so với 10-9 giây), nhưng bộ não có thể thực hiện nhiều công việc nhanh hơn rất nhiều so với máy tính thông thường Do cấu trúc song song của mạng nơ-ron sinh học thể hiện toàn bộ các nơ-ron thực hiện đồng thời tại một thời điểm Mạng nơ-ron nhân tạo cũng có được đặc điểm này Các mạng nơ-ron nhân tạo chủ yếu thực nghiệm trên các máy tính mạnh có vi mạch tích hợp rất lớn, các thiết bị quang, bộ xử lý song song Điều này cũng giải thích tại sao những nghiên cứu khoa học về mạng nơ-ron nhân tạo có điều kiện phát triển cùng với sự phát triển về kỹ thuật công nghệ phần cứng máy tính
Có nhiều loại nơ-ron khác nhau về kích thước và khả năng thu phát tín hiệu Tuy nhiên, chúng có cấu trúc và nguyên lý hoạt động chung
Trang 16Hình vẽ (1.1) là một hình ảnh đơn giản hoá của một loại nơ-ron như vậy
Hình 1.1 Mô hình nơ-ron sinh học
- Hoạt động của nơ-ron sinh học có thể mô tả tóm tắt như sau:
Mỗi nơ-ron nhận tín hiệu vào từ các tế bào thần kinh khác.Chúng tích hợp các tín hiệu vào, khi tổng tín hiệu vượt quá một ngưỡng nào đó chúng tạo tín hiệu ra và gửi tín hiệu này tới các nơ-ron khác thông qua dây thần kinh Các nơ-ron liên kết với nhau thành mạng Mức độ bền vững của các liên kết này xác định một hệ số gọi là trọng số liên kết
1.1.2.2 Nơ-ron nhân tạo
Để mô phỏng các tế bào thần kinh và các khớp nối thần kinh của bộ não con người, mạng nơ-ron nhân tạo có các thành phần có vai trò tương tự là các nơ-ron nhân tạo và kết nối giữa chúng (kết nối này gọi là weights) Nơ-ron là một đơn vị tính toán có nhiều đầu vào và một đầu ra, mỗi đầu vào đến từ một
khớp nối thần kinh (synapse) Đặc trưng của nơ-ron là một hàm kích hoạt phi
tuyến chuyển đổi một tổ hợp tuyến tính của tất cả các tín hiệu đầu vào thành tín hiệu đầu ra
Trang 17Một nơ-ron nhân tạo là một đơn vị tính toán hay đơn vị xử lý thông tin cơ
sở cho hoạt động của một mạng nơ-ron
Các thành phần cơ bản của một mô hình nơ-ron
Trọng số và tổng tín hiệu đầu vào:
Mỗi nơ-ron có rất nhiều dây thần kinh vào, nghĩa là mỗi nơ-ron có thể tiếp nhận đồng thời nhiều tín hiệu Giả sử tại nơ-ron i có N tín hiệu vào, mỗi tín hiệu vào S j được gán một trọng số W ij tương ứng Ta ước lượng tổng tín hiệu đi vào nơ-ron net i theo một số dạng sau:
(i)Dạng tuyến tính:
1
N
i ij j j
(1.1) (ii)Dạng toàn phương:
2
1
N
i ij j j
Trang 18 Hàm kích hoạt (hàm chuyển):
Hầu hết các đơn vị trong mạng nơ-ron chuyển net input bằng cách sử dụng một hàm vô hướng (scalar – to – scalar function) gọi là hàm kích hoạt, kết quả của hàm này là một giá trị gọi là mức độ kích hoạt của đơn vị Trừ khả năng đơn
vị đó thuộc lớp ra, giá trị kích hoạt được đưa vào một hay nhiều đơn vị khác Các hàm kích hoạt thường bị ép vào một khoảng giá trị xác định, do đó thường được gọi là các hàm nén (squashing)
Hàm biến đổi tín hiệu đầu vào net cho tín hiệu đầu ra out được gọi là hàm kích hoạt Hàm này có đặc điểm là không âm và bị chặn, dùng để giới hạn biên độ đầu ra của nơ-ron Có nhiều dạng hàm kích hoạt, người ta thường sử dụng một hàm kích hoạt chung cho toàn mạng
Trang 19Hàm này còn gọi là hàm ngưỡng (Threshold function hay Heaviside function) Đầu ra của hàm này giới hạn một trong hai giá trị:
1,( )
Đồ thị hàm bước nhị phân (Binary step function)
Dạng hàm này thường sử dụng trong mạng một lớp Trong hình vẽ được chọn bằng 1
3) Hàm sigmoid (Sigmoid function (logsig))
Hàm sigma là dạng chung nhất của hàm kích hoạt được sử dụng trong cấu trúc mạng nơ-ron nhân tạo Nó là một hàm tăng và nó thể hiện một sự trung gian
giữa tuyến tính và phi tuyến Một ví dụ của hàm này là hàm logistics, xác định
như sau:
1( )
ở đó là tham số độ dốc của hàm sigma Bằng việc biến đổi tham số , chúng
ta thu được các hàm sigma với các độ dốc khác nhau Thực tế, hệ số góc tại x= 0
là /4 Khi tham số hệ số góc tiến tới không xác định, hàm sigma trở thành một hàm ngưỡng đơn giản Trong khi một hàm ngưỡng chỉ có giá trị là 0 hoặc 1, thì
Trang 20một hàm sigma nhận các giá trị từ 0 tới 1 Cũng phải ghi nhận rằng hàm sigma là hàm phân biệt, trong khi hàm ngưỡng thì không (Tính phân biệt của hàm là một đặc tính quan trọng trong lý thuyết mạng neuron) Hàm này thường được dùng cho các mạng được huấn luyện (trained) bởi thuật toán lan truyền ngược (back –propagation), bởi nó dễ lấy đạo hàm, làm giảm đáng kể tính toán trong quá trình huấn luyện Hàm được dùng cho các chương trình ứng dụng mà đầu ra mong muốn rơi vào khoảng [0,1]
Đồ thị hàm sigmoid 4) Hàm sigmoid lưỡng cực (Bipolar sigmoid function (tan(sig))
1 ( ) 1
x x
Trang 21Các hàm chuyển của các đơn vị ẩn (hidden units) là cần thiết để biểu diễn sự phi tuyến vào trong mạng
Nút bias:
Là một nút thêm vào nhằm tăng khả năng thích nghi của mạng nơ-ron trong quá trình học Trong các mạng nơ-ron có sử dụng bias, mỗi nơ-ron có thể
có một trọng số tương ứng với bias Trọng số này luôn có giá trị là 1
Mô hình của một nút xử lý (nút thứ i):
i j ij
U
# 1
Trang 22i: là ngưỡng (đầu vào ngoài) kích hoạt nơ-ron i
i
f : là hàm kích hoạt của nơ-ron i
1.1.2.3 Mạng nơ-ron nhân tạo
Mạng nơ-ron nhân tạo (gọi tắt là mạng nơ-ron) là mô hình toán học hay
mô hình tính toán được xây dựng dựa trên các mạng nơ-ron sinh học Nó gồm có một nhóm các nơ-ron nhân tạo(nút) nối với nhau, và xử lý thông tin bằng cách truyền theo các kết nối và tính giá trị mới tại các nút (cách tiếp cận connectionism đối với tính toán) Phần lớn mạng nơ-ron nhân tạo là một hệ
thống thích ứng (adaptive system) tự thay đổi cấu trúc của mình dựa trên các
thông tin bên ngoài hay bên trong chảy qua mạng trong quá trình học
Với việc giả lập các hệ thống sinh học, các cấu trúc tính toán, mạng ron có thể giải quyết được các lớp bài toán nhất định, như: Bài toán người du lịch, bài toán tô màu bản đồ, bài toán xếp loại, bài toán lập thời khóa biểu, bài toán tìm kiếm, bài toán nhận dạng mẫu Các bài toán phức tạp cao, không xác định Tuy nhiên, sự liên kết giữa một bài toán bất kỳ trong thực tế với một giải pháp mạng nơ-ron lại là một việc không dễ dàng
nơ-Xét một cách tổng quát, mạng nơ-ron là một cấu trúc xử lý song song thông tin phân tán mang các đặc tính nổi bật sau :
Là mô hình toán học dựa trên bản chất của nơ-ron
Bao gồm một số lượng rất lớn các nơ-ron liên kết với nhau
Mạng nơ-ron có khả năng học, khái quát hóa tập dữ liệu học thông qua việc gán và hiệu chỉnh các trọng số liên kết
Trang 23 Tổ chức theo kiểu tập hợp mang lại cho mạng nơ-ron khả năng tính toán rất lớn, trong đó không có nơ-ron nào mang thông tin riêng biệt
Ví dụ : Hình 1.2, 1.3,1.4, 1.5 là một số mô hình mạng thông dụng
Các hình trạng của mạng
Hình trạng mạng được định nghĩa bởi: số lớp (layers), số đơn vị trên mỗi lớp, và sự liên kết giữa các lớp đó Các mạng thường được chia làm hai loại dựa trên cách thức liên kết các đơn vị:
1.1.2.3.1 Mạng truyền thẳng
- Mạng truyền thẳng một lớp
Mạng perceptron một lớp do F.Rosenblatt đề xuất năm 1960 là mạng truyền thẳng chỉ một lớp vào và một lớp ra không có lớp ẩn Trên mỗi lớp này có thể có một hoặc nhiều nơ-ron Mô hình mạng nơ-ron của F.Rosenblatt sử dụng hàm ngưỡng đóng vai trò là hàm chuyển Do đó, tổng của tín hiệu vào lớn hơn giá trị ngưỡng thì giá trị đầu ra của nơ-ron sẽ là 1, còn trái lại sẽ là 0
1, 0,
i i
i
neáu net out
Với neti = wij j x là tổng thông tin đầu vào của nơ-ron i
Mô hình mạng nơ-ron truyền thẳng một lớp là mô hình liên kết cơ bản và đơn giản nhất Các nơ-ron tổ chức lại với nhau tạo thành một lớp, đường truyền tín hiệu được truyền theo một hướng nhất định nào đó Các đầu vào được nối với các nơ-ron theo các trọng số khác nhau, sau quá trình xử lý cho ra một chuỗi các tín hiệu ra
Trang 24 T
in i
y
y 1, 2, ,
n i x
w f
y
m
j
i j ij i
x
x 1, 2, ,
Trang 25Tổng thông tin đầu vào wij j x >i
Trong trường hợp trái lại nơ-ron sẽ được phân vào lớp B
- Mạng truyền thẳng nhiều lớp (Multilayer Perceptron –MLP)
Với mạng nơ-ron truyền thẳng một lớp ở trên, khi phân tích một bài toán phức tạp sẽ gặp rất nhiều khó khăn, để khắc phục vấn đề này người ta đưa ra mô hình mạng nơ-ron truyền thẳng nhiều lớp bằng việc kết hợp một số lớp nơ-ron lại với nhau Lớp nhận tín hiệu vào gọi là lớp vào, lớp đưa tín hiệu ra của mạng được gọi là lớp ra Các lớp ở giữa lớp vào và lớp ra được gọi là lớp ẩn và các nơ-ron trong các lớp ẩn có hàm chuyển (hàm kích hoạt) dạng phi tuyến Mạng nơ-ron nhiều lớp có thể giải quyết các bài toán phi tuyến nhờ vào các lớp ẩn Càng nhiều lớp ẩn thì khả năng mở rộng thông tin càng cao và xử lý tốt mạng có nhiều lớp vào và lớp ra
Hình (1.4) mô tả cấu trúc của mạng nơ-ron truyền thẳng nhiều lớp
Hình 1.4 Mạng truyền thẳng nhiều lớp
1.1.2.3.2 Mạng hồi quy (Recurrent Neutral Network)
Mạng hồi quy một lớp có phản hồi
Trang 26có thể thay đổi liên tục bởi những thay đổi của môi trường và mạng nơ-ron ghi nhớ giá trị đó
.
X1
X2
X N
Trang 27
Trong quá trình học, giá trị đầu vào được đưa vào mạng và theo dòng chảy trong mạng tạo thành giá trị đầu ra
Tiếp đến là quá trình so sánh giá trị tạo ra bởi mạng nơ-ron với giá trị mong muốn Nếu hai giá trị này giống nhau thì không thay đổi gì cả Tuy nhiên, nếu có một sai lệch giữa hai giá trị này vượt quá giá trị sai số mong muốn thì đi ngược mạng từ đầu ra về đầu vào để thay đổi một số kết nối
Đây là quá trình lặp lại liên tục và có thể không dừng khi không tìm được giá trị W sao cho đầu ra tạo bởi mạng nơ-ron bằng đúng đầu ra mong muốn Do
đó trong thực tế người ta phải thiết lập một số tiêu chuẩn dựa trên một giá trị sai
số nào đó của hai giá trị này, hay dựa trên một số lần lặp nhất định
Để tiện cho việc trình bày, ta kí hiệu y là giá trị kết xuất của mạng nơ-ron,
t là giá trị ra mong muốn, e là sai lệch giữa hai giá trị này.:
e = t - y Mạng nơ-ron có một số ưu điểm so với máy tính truyền thống Cấu trúc song song của mạng nơ-ron rất thích hợp cho những ứng dụng đòi hỏi tốc độ nhanh theo thời gian thực Khả năng huấn luyện của mạng nơ-ron có thể khai thác để phát triển hệ thống thích nghi Mặt khác, với khả năng tổng quát hóa của mạng nơ-ron, nó có thể áp dụng để điều khiển nhiều tham số phức tạp đồng thời
từ đó giải quyết dễ dàng một số bài toán thuộc lớp bài toán NP- đầy đủ Complete )
(NP-Các luật học đóng vai trò quan trọng trong việc xác định một mạng ron nhân tạo Một cách đơn giản về khái niệm học của mạng nơ-ron là cập nhật trọng số trên cơ sở các mẫu Theo nghĩa rộng thì học có thể được chia ra làm hai loại: Học tham số và học cấu trúc
Trang 28nơ Học tham số: Các thủ tục học này nhằm tìm kiếm ma trận trọng số sao cho mạng có khả năng đưa ra dự báo sát với thực tế Dạng chung của luật học tham số có thể được mô tả như sau:
+ Học có tín hiệu chỉ đạo: Là quá trình mạng học dựa vào sai số giữa đầu
ra thực và đầu ra mong muốn để làm cơ sở cho việc hiệu chỉnh trọng số Sai số này chính là hằng số học r Luật học điển hình của nhóm này là luật học Delta của Widrow (1962) nêu ra đầu tiên dùng để xấp xỉ trọng của Adaline dựa trên nguyên tắc giảm gradient
Trong nhóm luật học này cũng cần phải kể đến luật học Perceptron của Rosenblatt (1958) Về cơ bản luật học này thay đổi các giá trị trọng trong thời gian học, còn luật Perceptron thì thêm hoặc bỏ trọng tùy theo giá trị sai số dương hay âm
M j
N i
rx
W ij j, 1, , 1,
Trang 29Một loạt các luật học khác cũng được dựa trên tư tưởng này Luật Oja là cải tiến và nâng cấp của luật Delta Luật truyền ngược là luật mở rộng của luật Delta cho mạng nhiều lớp Đối với mạng truyền thẳng thường sử dụng luật truyền ngược để chỉnh trọng với tín hiệu chỉ đạo từ bên ngoài và người ta gọi mạng này là mạng lan truyền ngược
+ Học không có tín hiệu chỉ đạo: Luật học này sử dụng đầu ra của mạng
làm cơ sở để hiệu chỉnh các trọng số liên kết Hay trong luật này chính là tín hiệu
ra của mạng Điển hình là luật Hebb (1949) thường dùng cho các mạng tự liên kết, luật LVQ (Learning Vector Quantization) dùng cho mạng tự tổ chức một lớp thuộc lớp mạng ánh xạ đặc trưng của Kohonen
Luật học Hebb là luật sinh học xuất phát từ tiên đề của Hebb cho rằng: Giữa hai nơ-ron có quan hệ và có thay đổi thế năng thì giữa chúng có sự thay đổi trọng số liên kết Nói cách khác, trọng số được điều chỉnh theo mối tương quan trước và sau, nghĩa là:
N i
x y
W ij i j, 1, , 1,
Trang 30các mạng tự liên kết thành 16 dạng khác nhau theo kiểu luật Hebb, luật đối Hebb, luật Hopfield
Như vậy, ứng với mỗi nhóm mạng thường áp dụng một luật học nhất định Nếu tồn tại hàng chục loại mạng khác nhau thì các luật học dùng trong mạng nơ-ron có thể tăng lên rất nhiều lần
Đối với mạng phản hồi thường sử dụng luật Hebb và các luật cải tiến của
nó để chỉnh trọng mà không cần tín hiệu chỉ đạo từ bên ngoài
+ Học tăng cường: Trong một số trường hợp, thông tin phản hồi chỉ là tín
hiệu bao gồm hai trạng thái cho biết tín hiệu đầu ra của mạng là đúng hay sai Quá trình học dựa trên các thông tin hướng dẫn như vậy được gọi là học có củng
cố (học tăng cường) và tín hiệu mang thông tin phản hồi được gọi là tín hiệu củng cố cho quá trình học Ta có thể thấy rằng quá trình học này là một dạng của quá trình học có tín hiệu chỉ đạo bởi vì mạng nhận được một số thông tin phản hồi từ bên ngoài
- Học cấu trúc: Tìm kiếm các tham số của cấu trúc mạng để tìm ra một cấu
trúc mạng hoạt động tốt nhất Trong thực tế, việc học cấu trúc là tìm ra số lớp ẩn
và tìm ra số nơ-ron trên mỗi lớp đó Giải thuật di truyền thường được sử dụng trong các cấu trúc nhưng thường chạy rất lâu, thậm chí ngay cả đối với mạng có kích thước trung bình Ngoài ra kỹ thuật gọt tỉa mạng hay mạng tăng dần cũng được áp dụng trong việc học cấu trúc của mạng có kích thước tương đối nhỏ
1.2 Phạm vị ứng dụng của mang nơron nhân tạo
1.2.1 Những bài toán thích hợp
Mạng nơron được coi như là hộp đen biến đổi véc-tơ đầu vào m biến thành véctơ đầu ra n biến Tín hiệu ra có thể là các tham số thực, (tốt nhất nằm
Trang 31trong khoảng [0, 1], hoặc [-1, 1]), số nhị phân 0, 1, hay số lưỡng cực -1;+1 Số biến của véc-tơ vào ra không bị hạn chế xong sẽ ảnh hưởng tới thời gian tính và tải dữ liệu của máy tính Nói chung, các lớp bài toán áp dụng cho nơ-ron có thể được phân chia thành bốn loại:
1 Phân lớp (classification)
2 Mô hình hoá (modeling)
3 Biến đổi, thực hiện ánh xạ từ một không gian đa biến vào không gian đa biến khác tương ứng (transformation and mapping)
4 Liên kết và kỹ thuật dịch chuyển cửa sổ (association and moving window)
1.2.1.1 Phân loại
Một trong các công việc đơn giản và thường được sử dụng nhiều trong việc quản lý các đối tượng đa biến là phân loại (phân lớp một đối tượng vào các nhóm, nhóm con, hay chủng loại) Ví dụ: Bài toán phân lớp ảnh, nhận dạng mẫu,
Khi phải phân loại một quyết định phức tạp, chúng ta phải bắt đầu với việc nghiên cứu thống kê các mối liên quan giữa nhiều đối tượng và thuộc tính của lớp các đối tượng Có thể nói việc xây dựng một cây phân lớp các quyết định phải được thực hiện trước khi thủ tục học được tiến hành Nếu kết quả cuối cùng không thoả mãn, chúng ta cần phải xem xét lại cách biểu diễn các đối tượng hoặc cây phân lớp hoặc thay đổi cả hai
1.2.1.2 Mô hình hoá
Các hệ thống phân loại đưa ra các câu trả lời rời rạc như có, không hoặc một số nguyên định danh các đối tượng đầu vào thuộc lớp nào Mô hình hoá yêu
Trang 32cầu hệ thống phải sản sinh ra các câu trả lời mang tính liên tục Trong quá trình
mô hình hoá, cần một số lượng nhỏ các số liệu để xây dựng mô hình
Mô hình này có thể đưa ra các dự báo cho tất cả các đối tượng đầu vào Việc tìm ra đường cong phù hợp với các số liệu thực nghiệm là một trong những ứng dụng thuộc dạng này Trong bất kỳ loại mô hình nào cũng phải tuân theo một giả định là: các thay đổi nhỏ của tín hiệu vào chỉ gây ra những biến đổi nhỏ của tín hiệu ra
Trong các vấn đề đa biến, mạng nơ-ron có nhiều lợi thế hơn so với các phương pháp mô hình hoá cổ điển sử dụng các hàm giải tích Bởi vì trong phương pháp mô hình hoá cổ điển đối với mỗi đầu ra, ta phải định nghĩa một hàm cụ thể cùng một bộ các tham số, trong khi đó đối với mạng nơ-ron thì không phải quan tâm tới các hàm đó Tuy nhiên, trong các phương pháp mô hình hoá cổ điển, các hệ số có thể có một số ý nghĩa nào đó đối với vấn đề cần giải quyết, trái lại các trọng số của mạng không mang một ý nghĩa nào cả
Trong nhiều ứng dụng khá đặc biệt, khi sai số thực hiện khá lớn chúng ta
có thể mô hình hoá bằng cách cân xứng hoá giữa tín hiệu vào tín hiệu ra Trong các trường hợp này, sử dụng mạng như một bảng tra là đủ, mặc dù các bảng này
sẽ cho lời giải giống nhau trong một khoảng nào đó của tín hiệu vào
Đối với việc chọn chiến lược học, chúng ta cần quan tâm đến sự phân bố của các đối tượng dùng để học Nếu số lượng đối tượng dùng cho việc học là ít
và được phân bố tương đối đều trong toàn không gian, khi đó số liệu có thể được dùng ngay cho việc mô hình hoá Trái lại, nếu các đối tượng là nhiều, sẵn có nhưng phân bố ngẫu nhiên trong không gian biến, đầu tiên phải giảm thiểu chúng
Trang 33sao cho vẫn bao trùm toàn không gian, sau đó mới dùng làm số liệu cho việc mô hình hoá
1.2.1.3 Biến đổi
Việc biến đổi nhằm mục đích nén các đối tượng từ không gian m chiều vào không gian có số chiều nhỏ hơn rất nhiều Qua việc nén, các đối tượng này sẽ bộc lộ các đặc điểm mà chúng ta không thể nhận thấy khi chúng thuộc không gian nhiều chiều Theo một chừng mực nào đó, biến đổi tương tự như việc nhóm các đối tượng hay phân loại thể hiện ở chỗ biểu diễn các kết quả ra Trong phân loại, chúng ta muốn định danh các nhóm hoặc lớp mà đối tượng thuộc vào, còn trong biến đổi, chúng ta quan tâm đến toàn bộ các đối tượng và từ đó chúng ta thu nhận được các nhóm từ các đối tượng học Điểm quan trọng trong biến đổi là các đối tượng được biểu diễn bởi toạ độ của nơ-ron trung tâm chứ không phải là giá trị của tín hiệu ra
Một trong những ứng dụng của việc biến đổi là tiền xử lý (thường được gọi là kế hoạch hoá thực nghiệm) Thông qua quá trình tiền xử lý, chúng ta có thể chọn ra các đối tượng điển hình từ tập vô số các đối tượng ngẫu nhiên, loại trừ các đối tượng dư thừa hay trùng lặp Điều này là cực kỳ quan trọng khi lựa chọn các đối tượng làm mẫu học cho mạng lan truyền ngược sai số
1.2.1.4 Liên kết
Liên kết là tìm ra đối tượng đích có mối quan hệ với một đối tượng vào, thậm chí cả khi đối tượng vào bị hỏng hoặc hoàn toàn không biết Theo một nghĩa nào đó, liên kết có thể được coi là phân loại Thủ tục học cho vấn đề này là học có tín hiệu chỉ đạo
Trang 34Lĩnh vực nghiên cứu các quá trình phụ thuộc thời gian là một trong những lĩnh vực chính trong nghiên cứu quá trình điều khiển Ở đây người sử dụng dự báo được các hành vi của hệ thống đa biến dựa trên một chuỗi số liệu được ghi nhận theo thời gian Trong mô hình hoá phụ thuộc thời gian, các biến của tín hiệu vào bao gồm các giá trị hiện tại và quá khứ của các biến quá trình, trong đó tín hiệu ra dự báo giá trị trong tương lai của những biến quá trình đó Về nguyên tắc các hiểu biết này có thể có các độ dài tuỳ ý, nhưng trong quá trình kiểm soát hiểu biết tương lai chỉ bao gồm một bước thời gian Việc học dịch chuyển tới bước tiếp theo tạo ra các cửa sổ bao gồm số bước thời gian của véc-tơ ra Để tạo
ra mô hình hoàn chỉnh của một quá trình, tất cả các biến quá trình phải được huấn luyện tại đầu ra của mạng, nhưng không phải tất cả các biến trong quá trình đều ảnh hưởng như nhau đối với kết quả cuối cùng, chỉ có một số biến là đáng quan tâm Do đó chúng ta chỉ phải chọn các biến đó cho quá trình học Kỹ thuật dịch chuyển cửa sổ có thể được sử dụng để giải quyết các vấn đề chuỗi các sự kiện và đối tượng như trong các lĩnh vực về môi trường theo thời gian, kiểm soát
Trang 35- Nhận dạng mẫu: Gồm việc tách các nét đặc biệt của mẫu, phân loại và phân tích tín hiệu của ra đa, nhận dạng và hiểu tiếng nói, nhận dạng vân tay, ký tự, chữ viết,
- Y học: phân tích và hiểu tín hiệu điện tâm đồ, chuẩn đoán bệnh, xử lý ảnh
y học
- Các hệ thống quân sự: phát hiện thủy lôi, phân loại luồng ra đa, nhận dạng người nói
- Giải trí: Hoạt hình, các hiệu ứng đặc biệt, dự báo thị trường
- Các hệ tài chính: Gồm phân tích thị trường chứng khoán, định giá bất động sản, cho vay, kiểm tra tài sản cầm cố, đánh giá mức độ hợp tác, phân tích đường tín dụng, cấp phát thẻ tín dụng, dự báo tỷ giá tiền tệ và thương mại an toàn
- Trí tuệ nhân tạo: Gồm các hệ chuyên gia,
- Các hệ thống năng lượng
- Dự đoán: Dự đoán các trạng thái của hệ thống,
- Vấn đề lập kế hoạch, điều khiển và tìm kiếm: Gồm cài đặt song song các bài toán thỏa mãn ràng buộc, bài toán lập thời khóa biểu cho trường đại học, bài toán người đi du lịch,
- Giải các bài toán tối ưu: Vấn đề chính là tìm những thuật toán huấn luyện mạng để góp phần tìm nghiệm cho nhiều lớp bài toán tối ưu toàn cục Tóm lại, mạng nơ-ron nhân tạo được xem là một cách tiếp cận đầy tiềm năng
để giải quyết các bài toán có tính phi tuyến, phức tạp và đặc biệt trong tình hình các dữ liệu đầu vào không tường minh
Trang 361.3 Mạng KOHONEN
1.3.1 Giới thiệu về mạng Nơron Kohonen
Trong phần trước chúng ta đã nghiên cứu một số loại mạng nơron Trong khi mạng nơron truyền thẳng rất phổ biến thì một cấu trúc mạng khác cũng rất phổ biến là mạng Kohonen
Mạng Nơron Kohonen (hay còn gọi là SOM (Self-Organizing Maps) - Bản đồ
tự tổ chức) là một trong nhiều loại mạng thông minh nhân tạo (AI) do cố giáo sư, tiến sĩ Teuvo Kohonen đề xướng vào những năm 70 của thế kỷ trước Ông là một trong những nhà nghiên cứu nổi tiếng và có nhiều công trình trong lĩnh vực tính toán nơron
Thông thường, mạng nơron Kohonen gồm một lớp đầu vào và lớp đầu ra Mạng này được đặt tên bởi tên người lập ra nó, cố giáo sư, tiến sĩ T Kohonen Mạng Kohonen khác biệt so với mạng nơron lan truyền ngược dẫn tiến ở cách huấn luyện và cách nó nhớ lại một mô hình Mạng Kohonen không sử dụng một loại hàm kích hoạt nào Xa hơn là nó không sử dụng loại trọng số bias nào Đầu ra của mạng Kohonen không bao gồm đầu ra của một số nơron Khi có một mẫu được đưa vào mạng thì chỉ có một nơron đầu ra được lựa chọn gọi là nơron chiến thắng Nơron chiến thắng này chính là đầu ra của mạng Kohonen Thông thường thì các nơron chiến thắng này đại diện cho các nhóm dữ liệu đưa vào mạng Kohonen
Điểm khác biệt quan trọng nhất giữa mạng Kohonen va mạng nơron truyền thẳng lan truyền ngược là mạng nơron Kohonen học theo phương pháp học không giám sát, có nghĩa là mạng nơron Kohonen thao tác với dữ liệu nhưng đầu ra chính xác tương ứng vói dữ liệu vào không được chỉ định trước Sử dụng mạng nơron Kohonen, dữ liệu có thể được phân thành các nhóm
Trang 37Mạng nơron Kohonen được sử dụng bởi vì nó là một mạng tương đối đơn giản về cấu trúc, và có thể huấn luyện rất nhanh
1.3.2 Cấu trúc của mạng nơron Kohonen [9]
Thông thường, mạng nơron Kohonen gồm một lớp đầu vào và một lớp đầu ra Đầu tiên chúng ta xét về đầu vào và đầu ra của mạng
Các nơron đầu vào chỉ đơn giản cung cấp dữ liệu vào cho mạng chứ không có chức năng xử lý gì trên đấy Đối với mạng nơron Kohonen yêu cầu đầu vào được chuẩn hóa có giá trị trong phạm vi từ -1 đến +1
Đầu ra của mạng Kohonen không bao gồm đầu ra của một số nơron Đối với mạng nơron truyền thẳng, nếu có năm nơron đầu vào thì một đầu ra bao gồm năm giá trị Còn mạng nơron Kohonen khi có một mẫu được đưa vào mạng thì chỉ có một nơron đầu ra được lựa chọn gọi là nơron chiến thắng Nơron chiến thắng này chính là đầu ra của mạng nơron Kohonen Đầu ra của mạng nơron Kohonen thường là chỉ số của nơron chiến thắng, ví dụ Nơron #5 Thông thường thì các nơron chiến thắng này đại diện cho các nhóm dữ liệu đưa vào mạng Kohonen Cấu trúc của một mạng nơron Kohonen được cho như hình 1.7:
Hình 1.7: Cấu trúc của mạng Kohonen
Trang 38Hình 1.8 dưới đây là một mạng Kohonen điển hình
Hình 1.8: Mạng nơron Kohonen điển hình 1.3.3 Thực hiện mạng nơron Kohonen [9]
1.3.3.1 Chuẩn hóa đầu vào
Mạng Kohonen yêu cầu đầu vào được chuẩn hóa Dữ liệu đầu vào nên có giá trị nằm trong khoảng -1 đến 1 Nếu một hoặc nhiều hơn nơron đầu vào sử dụng các giá trị chỉ nằm trong khoảng từ 0 đến 1 thì mạng nơron hoạt động không đảm bảo chất lượng, Để chuẩn hóa đầu vào, việc đầu tiên chúng ta phải tính chiều dài véctơ của dữ liệu đầu vào:
x
1 2
1
Trang 391.3.3.2 Tính toán đầu ra cho mỗi nơron
Để tính toán đầu ra cho mỗi véctơ đầu vào thì phải cùng xem xét véctơ đầu vào và trọng số Đầu tiên phải tính tích vô hướng của các nơron đầu vào và các trọng số kết nối Tích vô hướng được tính bằng cách nhân mỗi phần tử trong hai véctơ với nhau Ta tính tổng của tích các phần tử của véctơ trọng số và véctơ đầu vào Giả sử đầu vào là: X= {x1, x2, ,xN}, trọng số là W={wjl, wj2, , wjN} thì tích vô hướng của X và W là:
N
i
iw x
x
1 2
Trang 40đầu ra Như vậy ta điều chỉnh trọng số này để điều chỉnh giá trị đầu ra theo như nhiệm vụ yêu cầu
1.3.3.4 Quá trình học của mạng nơron Kohonen
Quá trình học là quá trình hiệu chỉnh trọng số Toàn bộ quá trình huấn luyện cho mạng nơron Kohonen bao gồm các chu kỳ lặp lại cho đến khi mức 1ỗi của mạng dưới một mức chấp nhận được Quá trình huấn luyện cho mạng là cạnh tranh Với mỗi tập đầu vào sẽ tìm được một nơron chiến thắng Trọng số của nơron chiến thắng sẽ được hiệu chỉnh, nó sẽ tác động trở lại mạnh mẽ hơn đối với đầu vào ở lần tiếp theo Các nơron chiến thắng là khác nhau đối với các mẫu khác nhau Khả năng nhận dạng các mẫu riêng biệt của chúng sẽ được tăng lên Đầu tiên chúng ta xét tổng quan quá trình huấn luyện cho mạng nơron Kohonen
Hình 1.9: Huấn luyện mạng Kohonen (SOM)