1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

NHẬN DẠNG ẢNH MẶT NGƯỜI SỬ DỤNG MẠNG NƠRON

40 659 10
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nhận Dạng Ảnh Mặt Người Sử Dụng Mạng Nơ Ron
Tác giả Nguyễn Thanh Việt
Người hướng dẫn ThS. Huỳnh Thị Thu Hiền
Trường học Trường Đại Học Sư Phạm Kỹ Thuật TP.HCM
Chuyên ngành Công nghệ điện tử - Viễn thông
Thể loại đồ án môn học
Năm xuất bản 2014
Thành phố TP. Hồ Chí Minh
Định dạng
Số trang 40
Dung lượng 1,39 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

NHẬN DẠNG ẢNH MẶT NGƯỜI SỬ DỤNG MẠNG NƠRON

Trang 1

BỘ MÔN ĐIỆN TỬ - VIỄN THÔNG

Trang 3

LỜI CẢM ƠN

Sinh viên thực hiện xin gửi lời cảm ơn chân thành đến Cô Huỳnh Thị Thu Hiền

đã tận tình hướng dẫn giúp đỡ trong quá trình thực hiện đồ án

Sinh viên thực hiện cũng xin bày tỏ lòng biết ơn đến các thầy cô trường Đại học

Sư phạm kỹ thuật TPHCM đã tận tình giảng dạy trong thời gian qua để giúp sinh viên có được những kiến thức để hoàn thành đồ án

Cuối cùng sinh viên thực hiện xin chân thành cảm ơn sự đóng góp ý kiến của các bạn sinh viên

Sinh viên thực hiện Nguyễn Thanh Việt

Trang 4

MỤC LỤC

LỊCH TRÌNH ĐỒ ÁN MÔN HỌC……….ii

LỜI CẢM ƠN iiii

MỤC LỤC ………iv

LIỆT KÊ HÌNH……….……vi

CHƯƠNG 1: MỞ ĐẦU 1

1.1.Đặt vấn đề 1

1.2.Lý do chọn đề tài 1

1.3.Mục tiêu đề tài 1

1.4.Giới hạn đề tài 2

1.5.Bố cục của đồ án 2

CHƯƠNG 2:CƠ SỞ LÝ THUYẾT 3

2.1 Giới thiệu về hệ thống xử lí ảnh 3

2.1.1 Phần thu nhận ảnh (Image Acquisition) 3

2.1.2.Tiền xử lý (Image Processing) 3

2.1.3 Phân đoạn (Segmentation) hay phân vùng ảnh 4

2.1.4.Biểu diễn ảnh (Image Representation) 4

2.1.5 Nhận dạng và nội suy ảnh (Image Recognition and Interpretation) 4

2.1.6 Cơ sở tri thức (Knowledge Base) 5

2.2 Những vấn đề cơ bản trong hệ thống xử lí ảnh 5

2.2.1 Điểm ảnh (Picture Element) 5

2.2.2 Độ phân giải của ảnh 5

2.2.3 Mức xám của ảnh 6

2.2.4 Định nghĩa ảnh số 6

2.3 Trích chọn đặc trưng ảnh 7

2.3.1 Thuật toán biến đổi hình thái(Morphological Operations) 7

2.3.2 Thuật toán his-and-miss 8

2.4 Phương pháp hạ Gradient 9

2.5 Mạng nơron 10

2.5.1 Giới thiệu sơ nét về mạng nơron 10

2.5.2 Phân loại mạng nơ-ron nhân tạo 12

Trang 5

2.5.3 Học tham số(Parameter Learning) 12

2.5.4 Mạng lan truyền ngược 13

2.5.5 Luật học lan truyền ngược(Backpropagation Learning Rule) 14

CHƯƠNG 3: NỘI DUNG NGHIÊN CỨU 16

3.1 Thiết kế chương trình nhận dạng 16

3.1.1 Đọc ảnh dữ liệu và ảnh kiểm tra 16

3.1.2 Huấn luyện ảnh dữ liệu và ảnh kiểm tra 17

3.1.3 Chọn ảnh cần kiểm tra 20

3.1.4 So sánh ngưỡng 21

CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU 22

4.1 Phần lý thuyết 22

4.2 Phần mô phỏng 22

CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 25

5.1 Kết luận 25

5.2.Hướng phát triển 25

PHỤ LỤC 26

Phụ lục A: Code của chương trình 26

Giao diện 1 26

Giao diện 2 26

Chương trình msnn1 30

Giao diện 3………32

Phụ lục B: Tài liệu tham khào……… 34

Trang 6

LIỆT KÊ HÌNH

Hình 2.1: Các bước cơ bản trong xử lý ảnh 3

Hình 2.2 Ảnh sau khi biến đổi hình thái 8

Hình 2.3 Kết quả của thuật toán hit-and-miss 9

Hình 2.4 Cấu trúc của nơ-ron sinh hoc 10

Hình 2.5 Nơ-ron nhân tạo 11

Hình 2.6 Đồ thị hàm ngưỡng 12

Hình 2.7 Mạng lan truyền ngược dùng n lớp ẩn 14

Hình 3.1 Lưu đồ chương trình nhận dạng 16

Hình 3.2 Lưu đồ đọc ảnh 17

Hình 3.3 Lưu đồ giải thuật cho mạng lan truyền ngược 19

Hình 3.4 Ảnh kiểm tra 20

Hình 3.5 So sánh ngưỡng và chọn ảnh phù hợp 21

Hình 3.6 Ảnh thông báo lỗi 21

Hình 4.1 Chương trình chính 22

Hình 4.2 Chương trình nhận dạng 23

Hình 4.3 Chỉ số ảnh 23

Hình 4.3 Command window trong quá trình huấn luyện 24

Hình 4.4 Kết quả nhận dạng 24

Trang 7

CHƯƠNG 1: MỞ ĐẦU

1.1.Đặt vấn đề

Những năm gần đây, các bài toán nhận dạng đã có những bước tiến khá quan trọng Đối tượng nhận dạng ngày càng phong phú và đa dạng hơn, việc nhận dạng bây giờ không còn là nhận dạng offline nữa và các góc độ của mặt người không phải cố định mà nó liên tục thay đổi Để thực hiện các bài toán nhận dạng này đòi hỏi phải có những thuật toán hiệu quả để giải quyết công việc nhận dạng chính xác và trong thời gian chấp nhận được

1.2.Lý do chọn đề tài

Ngày nay, công việc nhận dạng khuôn mặt có nhiều ứng dụng quan trọng trong hệ thống bảo mật như khóa bằng vân tay, giọng nói, giác mạc mắt đến các thiết bị an ninh, truy tìm tội phạm…Ngoài ra nó còn được sử dụng trong thiết kế robot nhận dạng

Xuất phát từ những yêu cầu thực tế trên người thực hiện tiến hành tìm hiểu và nghiên cứu đề tài :“NHẬN DẠNG ẢNH MẶT NGƯỜI DÙNG MẠNG NƠRON”

1.3.Mục tiêu đề tài

Người thực hiện nghiên cứu với các mục tiêu sau:

- Tìm hiểu sơ lược về lý thuyết xử lý ảnh

- Tìm hiểu về cấu trúc của nơron nhân tạo, mạng nơron

- Tìm hiểu về thuật toán biến đổi hình thái

- Tìm hiểu các thuật toán nhận dạng và xử lý ảnh

- Nâng cao kỹ năng thiết kế và lập trình bằng ngôn ngữ matlab

- Rèn luyện kỹ năng nghiên cứu, đọc hiểu tài liệu tiếng anh

Trang 8

- Nghiên cứu trích đặc trưng dùng phương pháp biến đổi hình thái

- Nghiên cứu giải thuật và thực hiện phần mền nhận dạng trên matlab

1.5.Bố cục của đồ án

Chương 1: Giới thiệu

Chương 2: Cơ sở lý thuyết

Chương 3: Nội dung nghiên cứu

Chương 4: Kết quả nghiên cứu và thực hiện

Chương 5: Kết luận và hướng phát triển

Trang 9

CHƯƠNG 2:CƠ SỞ LÝ THUYẾT

2.1 Giới thiệu về hệ thống xử lí ảnh

Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ Nó là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính chuyên dụng riêng cho nó

Đối với một hệ thống xử lý ảnh, các công việc của nó bao gồm các bước như hình 2.1

Hình 2.1: Các bước cơ bản trong xử lý ảnh

2.1.1 Phần thu nhận ảnh (Image Acquisition)

Ảnh có thể nhận qua camera màu hoặc đen trắng Thường ảnh nhận qua camera

là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25 dòng), cũng

có loại camera đã số hoá (như loại CCD – Change Coupled Device) là loại photodiot

tạo cường độ sáng tại mỗi điểm ảnh

Camera thường dùng là loại quét dòng ; ảnh tạo ra có dạng hai chiều Chất lượng một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh)

2.1.2.Tiền xử lý (Image Processing)

Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộ tiền

xử lý để nâng cao chất lượng Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ

Phân đoạn ảnh

Biểu diễn

và mô tả

Nhận dạng và nội suy

Thu nhận

ảnh

Tiền xử lý ảnh

Cơ sở trí thức

Trang 10

2.1.3 Phân đoạn (Segmentation) hay phân vùng ảnh

Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này

2.1.4.Biểu diễn ảnh (Image Representation)

Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lận cận Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký tự giúp phân biệt ký tự này với ký tự khác

2.1.5 Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)

Nhận dạng ảnh là quá trình xác định ảnh Quá trình này thường thu được bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thư có thể được nội suy thành mã điện thoại Có nhiều cách phân loai ảnh khác nhau về ảnh Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản:

o Nhận dạng theo tham số

o Nhận dạng theo cấu trúc Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người…

Trang 11

2.1.6 Cơ sở tri thức (Knowledge Base)

Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán học đảm bảo tiện lợi cho

xử lý, người ta mong muốn bắt chước quy trình tiếp nhận và xử lý ảnh theo cách của con người Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con người Vì vậy, ở đây các cơ sở tri thức được phát huy

2.2 Những vấn đề cơ bản trong hệ thống xử lí ảnh

2.2.1 Điểm ảnh (Picture Element)

Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng Để xử lý bằng máy tính (số), ảnh cần phải được số hoá Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám) Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y)

Định nghĩa:

Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất định Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật Mỗi phần tử trong ma trận được gọi là một phần tử ảnh

2.2.2 Độ phân giải của ảnh

Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một ảnh

số được hiển thị Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh Việc lựa chọn khoảng cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân bố theo trục x

và y trong không gian hai chiều

Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh (320*200)

Trang 12

Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hình CGA 17” độ phân giải 320*200 Lý do: cùng một mật độ (độ phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn

+ Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256

là mức phổ dụng Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám: Mức xám dùng 1 byte biểu diễn: 28=256 mức, tức là từ 0 đến 255) + Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác) với mức xám ở các điểm ảnh có thể khác nhau

+ Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô tả 2 mức khác nhau Nói cách khác: mỗi điểm ảnh của ảnh nhị phân chỉ có thể

là 0 hoặc 1 Ảnh màu: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu: 28*3=224≈ 16,7 triệu màu

2.2.4 Định nghĩa ảnh số

Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp dùng để mô tả ảnh gần với ảnh thật Ảnh là một sự vật đại diện cho con người,sinh vật hay sự vật nào đó v.v… ảnh động như ta thấy trên truyền hình thực chất là tập hợp của rất nhiều ảnh tĩnh liên tiếp.khi một ảnh được số hóa thì nó trở thành ảnh số và ảnh số này lại là một tập hợp của rất nhiều phần tử ảnh được gọi là điểm ảnh hay là “pixel”.mỗi điểm ảnh lại được biểu diễn dưới dạng một số hữu hạn các bit

Chúng ta có thể chia ảnh ra làm ba loại khác nhau :

+ Ảnh đen trắng :mỗi điểm ảnh được biểu diễn bởi một bit

+ Ảnh Gray – scale :mỗi điểm ảnh được biểu diễn bằng các mức chói khác

nhau,thường thì ảnh này được biểu diễn bằng 256 mức chói hay là 8 bit cho mỗi điểm ảnh

Trang 13

+ Ảnh màu : mỗi điểm ảnh chia ra thành tín hiệu chói và tín hiệu màu

2.3 Trích chọn đặc trưng ảnh

Có nhiều phương pháp trích đặc trưng như phương pháp phân tích thành phần

chính(PCA-Principal Component Analysis), phương pháp phân tách tuyến tính(LDA

– Linear Discriminant Analysis) và phương pháp biến đổi hình thái, do những ưu

điểm và sự hiệu quả trong quá trình trích đặc trưng của phương pháp biến đổi hình

thái nên chúng ta chọn phương pháp này trong quá trình trích chọn đặc trưng

2.3.1 Thuật toán biến đổi hình thái(Morphological Operations)

Hai phương pháp PCA và LDA cho phép phân tích dựa trên các đặc điểm

mang tính thống kê của ảnh Tuy nhiên, các phương pháp này chưa xét đến

những đặc điểm về hình thái của mặt nguời Đó chính là những đặc phận trên

khuôn mặt như mắt, mũi, miệng Phương pháp biến trưng về đường nét của các

bộ đổi hình thái sẽ bổ sung cho những thiếu sót này của hai phương pháp trên

Xử lý ảnh về hình thái là một phép xử lý trong đó dạng không gian hoặc cấu trúc

của các đối tượng trong ảnh được chỉnh sửa

Thuật toán hình thái là một thuật toán mặc nạ phi tuyến mà có thể dò được khuôn

mặt Về mặt toán học thuật toán này dựa trên lý thuyết tập hợp Nó thêm vào hoặc xóa

đi các điểm ảnh từ ảnh nhị phân theo các luật đã biết phụ thuộc vào các mẫu lân cận

Phép dãn ảnh và phép co ảnh là hai thao tác xử lý hình thái cơ bản Với phép dãn

ảnh, một đối tượng sẽ nổi đều lên trong không gian, còn với phép co ảnh đối tượng sẽ

co đều xuống

Xét một ảnh đa mức xám F(j,k) được lượng tử hóa với một thang mức xám nào

đó Khi đó, phép dãn ảnh đối với ảnh đa mức xám được định nghĩa như sau:

( , ), ( , 1)( , ) AX ( 1, 1), ,

trong đó MAX{S1, ,S9} trả về giá trị lớn nhất trong các giá trị của chín điểm ảnh của

lân cận 3×3 Tương tự, phép co ảnh đối với ảnh đa mức xám được định nghĩa như sau:

( , ), ( , 1)( , ) ( 1, 1), ,

Trang 14

Hình sau là một số ảnh mặt người đã được biến đổi qua phép xử lý hình thái

Hình 2.2 Ảnh sau khi biến đổi hình thái

2.3.2 Thuật toán his-and-miss

Thuật toán hit-and-mis là một phép nhân chập dựa trên giản ảnh-co erosion-based) Nó là một bộ dò dạng hình thái mà có thể được sử dụng để tìm ra những đặc trưng của điểm ảnh trong một bức ảnh Thuật toán này có phương trình như sau:

c c

Trang 15

Hình 2.3 Kết quả của thuật toán hit-and-miss

2.4 Phương pháp hạ Gradient

Phương pháp giảm gradient gồm các bước chính sau:

 Chọn ngẫu nhiên một điểm x0 trong không gian trọng số

 Tính độ dốc của hàm lỗi tại x0

 Di chuyển điểm x0 theo hướng dốc nhất của hàm lỗi

Quá trình tính độ dốc và di chuyển này sẽ được lặp lại cho đến khi x0 tiến tới giá trị làm cho hàm lỗi đạt giá trị nhỏ nhất

Cập nhật trọng số theo phương pháp giảm gradient và sự hội tụ

Phương pháp này sẽ dựa trên đạo hàm riêng của hàm lỗi E đối với các trọng số đang xét theo công thức sau:

- t là chỉ số của lần cập nhật trọng số hiện tại

-  là hệ số học

- w là một trong những trọng bất kỳ trong mạng

Theo công thức trên,ta thấy chúng ta cập nhật trọng số ngược hướng với sai số trung bình bình phương và hệ số học  Tuy nhiên, đối với mạng MLP (MultiLayer Perceptron) thì hàm sai số bình phương thường phức tạp và có nhiều trị cục bộ, vì thế phép lặp huấn luyện mạng có thể chỉ đạt tới giá trị cục bộ của hàm sai số trung bình bình phương mà không đạt tới giá trị tổng thể Vấn đề quá trình huấn luyện sẽ hội tụ

Trang 16

như thế nào sẽ phụ thuộc vào điều kiện ban đầu của quá trình huấn luyện mạng Đặt biệt là quá trình chọn hệ số học  như thế nào để tăng khả năng hội tụ của mạng Vì thế, với mỗi bài toán khác nhau ta sẽ lựa chọn hệ số học khác nhau

Như thế, khi một quá trình huấn luyện theo thuật toán lan truyền ngược hội tụ, ta chưa có thể khẳng định được nó hội tụ có tối ưu hay không Ta cần phải thử một số điều kiện ban đầu để đảm bảo thu được phương án tối ưu

2.5 Mạng nơron

2.5.1 Giới thiệu sơ nét về mạng nơron

Mạng nơron nhân tạo được thiết kế dựa trên mô hình mạng nơron thần kinh với các phần tử nơron nhân tạo của nó là sự mô phỏng nơron sinh học

Đầu tiên, ta tìm hiểu sơ nét về mạng nơ ron sinh học

Cấu trúc nơron sinh học

Một tế bào nơron gồm bốn phần cơ bản:

- Các nhánh và rễ:Các nhánh và

rễ là các bộ phận nhận thông tin, các đầu nhạy hoặc các đầu ra của các nơron khác bám vào rễ hoặc nhánh của một nơron

- Thân thần kinh (Soma):Thân thần kinh chứa các nhân và cơ quan tổng hợp protein Các ion vào được tổng hợp và biến đổi Khi nồng độ các ion đạt đến một giá trị nhất định, xảy ra quá trình phát xung (hay kích thích) Xung đó được phát ở các đầu

ra của nơron Dây dẫn đầu ra xung được gọi là dây thần kinh

Hình 2.4 Cấu trúc của nơ-ron sinh hoc

- Dây thần kinh (Axon):Dây thần kinh là đầu ra Đó là phương tiện truyền dẫn tín hiệu Dây thần kinh được cấu tạo gồm các đốt và có thể dài từ micro mét đến vài mét tuỳ từng kết cấu cụ thể Đầu ra này có thể truyền tín hiệu đến các nơron khác

- Khớp thần kinh là bộ phận tiếp xúc của đầu ra nơron với rễ, nhánh của các nơron khác

Trang 17

Chúng có cấu trúc màng đặc biệt để tiếp nhận các tín hiệu khi có sự chênh lệch về nồng độ ion giữa bên trong và bên ngoài Nếu độ lệch về nồng độ càng lớn thì việc truyền các ion càng nhiều và ngược lại Mức độ thẩm thấu của các ion có thể coi là một đại lượng thay đổi tuỳ thuộc vào nồng độ như một giá trị đo thay đổi được gọi là trọng

Cấu trúc nơron nhân tạo

Dựa vào cấu trúc trên chúng ta cũng có thể tạo ra một tế bào nơ-ron cơ bản có các thành phần tương tự như trên đó là perceptron

Hình 2.5 Nơ-ron nhân tạo Một perceptron được mô tả như hình sau:

Nơron này sẽ hoạt động như sau: giả sử có n inputs, nơron sẽ có n weights(trọng số) tương ứng với n đường truyền inputs Nơron sẽ lấy tổng có trọng số của tất cả các inputs Sau đó lấy tổng của tất cả các kết quả thu được Đường truyền nào có weight càng lớn thì tín hiệu truyền qua đó càng lớn, như vậy có thể xem weight

là đại lượng tương đương với synapse trong nơron sinh học Có thể viết kết quả lấy tổng của nơron như sau:

Trang 18

Dạng này có phương trình tổng

quát như sau:

1 ( )

2.5.2 Phân loại mạng nơ-ron nhân tạo

Có nhiều cách để phân loại mạng nơ-ron nhân tạo, tùy theo tiêu chí đề ra: Dựa vào số lượng lớp có trong mạng, ta phân thành:

+ Mạng một lớp + Mạng nhiều lớp Dựa vào đường truyền tín hiệu trong mạng, ta phân thành:

+ Mạng truyền thẳng + Mạng phản hồi + Mạng tự tổ chức

2.5.3 Học tham số(Parameter Learning)

Mục tiêu của việc học tham số là thay đổi, cập nhật các trọng liên kết Hầu hết các luật học tồn tại thuộc kiểu học tham số Các kiểu học điển hình mà chúng ta sẽ nghiên cứu trong phần sau Thông thường, luật học tham số được chia thành ba dạng chính,

đó là: Học giám sát, học không giám sát và học củng cố

Học có thầy (Học giám sát: Supervised Learning): Với kiểu học này, tại mỗi thời điểm có đầu vào mạng nơron thì đầu ra mong muốn của hệ sẽ được cho sẵn

Học không có thầy (Học không giám sát: Unsupervised Learning): Với kiểu học này, không có bất kì một thông tin phản hồi từ môi trường nào Mạng phải tự tìm ra các mẫu, đặc tính, tính quy tắc, sự tương quan trong dữ liệu đầu vào và tập hợp lại để

Trang 19

tạo đầu ra Khi tự tìm ra các đặc điểm này, mạng đã trải qua các thay đổi về tham số của nó Quá trình này được gọi là tự tổ chức

2.5.4 Mạng lan truyền ngược

Thuật học lan truyền ngược là một trong những phát triển quan trọng trong mạng nơron Thuật toán này được áp dụng cho các mạng nhiều lớp truyền thẳng (FeedForward) gồm các phần tử xử lý với hàm kích hoạt liên tục Các mạng như vậy kết hợp với thuật toán học lan truyền ngược được gọi là mạng lan truyền Về mặt lý thuyết đã chứng minh được rằng: mạng ba lớp trở lên có thể nhận biết được mọi hàm bất kỳ Chính vì vậy, luật học truyền ngược có ý nghĩa rất quan trọng trong việc cập nhật trọng của mạng nhiều lớp truyền thẳng Nền tảng của thuật toán cập nhật trọng này cũng là phương pháp hạ Gradient Thật vậy, cho cặp mẫu đầu vào - đầu ra

ra thực sự y( )k Sau đó, tín hiệu lỗi tạo từ sai khác giữa ( )k

dy( )k sẽ được lan truyền ngược từ lớp ra quay trở lại các lớp trước đó để chúng cập nhật trọng Để minh hoạ chi tiết thuật toán lan truyền ngược, xét một mạng 3 lớp:lớp vào có m nơron, lớp ẩn có

trong đó f(.) là hàm tương tác đầu ra

+ Lớp ra: giả thiết hàm tương tác đầu ra của lớp ra giống các lớp khác, tức là f(.)Khi đó tổng đầu vào của nơron thứ i có thể xác định

Trang 20

2.5.5 Luật học lan truyền ngược(Backpropagation Learning Rule)

Cơ sở của luật học lan truyền ngược được xây dựng trên phương pháp hạ Gradient Đầu tiên, xây dựng hàm chi phí (hay còn gọi là hàm sai số giữa đầu ra mong muốn di với đầu ra thực tế yi)

Ngày đăng: 21/05/2014, 23:17

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[2]. LC Png, Morphological Shared-Weight Neural Network For Face Recognition [3].Omaima N. A. AL-Allaf, Face Recognition System Based on Different Sách, tạp chí
Tiêu đề: Morphological Shared-Weight Neural Network For Face Recognition
Tác giả: LC Png
[1]. Donna Haun, Kristi Hummel, and Marjorie Skubic, Morphological Neural Network Vision Processing for Mobile Robots Khác
[4]. PGS.TS Nguyễn Quang Hoan, Xử Lý Ảnh, Học viện công nghệ bưu chính viễn thông, 2006 Khác
[5]. Trần Sơn Hải, Nghiên cứu phương pháp kết hợp các đặc trưng màu sắc và hình dạng và vị trí để truy vấn ảnh, Đại Học Khoa Học Tự Nhiên TPHCM Khác
[6]. Võ Phúc Nguyên, Nhận dạng ảnh mặt người sử dụng mạng nơ-ron,Trường Đại học Kỹ thuật Công nghiệp – ĐH Thái NguyênArtificial Neural Networks Models and Training Algorithms Khác

HÌNH ẢNH LIÊN QUAN

Hình 2.1: Các bước cơ bản trong xử lý ảnh - NHẬN DẠNG ẢNH MẶT NGƯỜI SỬ DỤNG MẠNG NƠRON
Hình 2.1 Các bước cơ bản trong xử lý ảnh (Trang 9)
Hình sau là một số ảnh mặt người đã được biến đổi qua phép xử lý hình thái. - NHẬN DẠNG ẢNH MẶT NGƯỜI SỬ DỤNG MẠNG NƠRON
Hình sau là một số ảnh mặt người đã được biến đổi qua phép xử lý hình thái (Trang 14)
Hình 2.3 Kết quả của thuật toán hit-and-miss - NHẬN DẠNG ẢNH MẶT NGƯỜI SỬ DỤNG MẠNG NƠRON
Hình 2.3 Kết quả của thuật toán hit-and-miss (Trang 15)
Hình 2.5 Nơ-ron nhân tạo  Một perceptron đƣợc mô tả nhƣ hình sau: - NHẬN DẠNG ẢNH MẶT NGƯỜI SỬ DỤNG MẠNG NƠRON
Hình 2.5 Nơ-ron nhân tạo Một perceptron đƣợc mô tả nhƣ hình sau: (Trang 17)
Hình 2.7 Mạng lan truyền ngƣợc dùng n lớp ẩn - NHẬN DẠNG ẢNH MẶT NGƯỜI SỬ DỤNG MẠNG NƠRON
Hình 2.7 Mạng lan truyền ngƣợc dùng n lớp ẩn (Trang 20)
Hình 3.1 Lưu đồ chương trình nhận dạng - NHẬN DẠNG ẢNH MẶT NGƯỜI SỬ DỤNG MẠNG NƠRON
Hình 3.1 Lưu đồ chương trình nhận dạng (Trang 22)
Hình 3.3 Lưu đồ giải thuật cho mạng lan truyền ngược - NHẬN DẠNG ẢNH MẶT NGƯỜI SỬ DỤNG MẠNG NƠRON
Hình 3.3 Lưu đồ giải thuật cho mạng lan truyền ngược (Trang 25)
Hình 3.4 Ảnh kiểm tra - NHẬN DẠNG ẢNH MẶT NGƯỜI SỬ DỤNG MẠNG NƠRON
Hình 3.4 Ảnh kiểm tra (Trang 26)
Hình 4.1 Chương trình chính - NHẬN DẠNG ẢNH MẶT NGƯỜI SỬ DỤNG MẠNG NƠRON
Hình 4.1 Chương trình chính (Trang 28)
Hình 4.2 Chương trình nhận dạng - NHẬN DẠNG ẢNH MẶT NGƯỜI SỬ DỤNG MẠNG NƠRON
Hình 4.2 Chương trình nhận dạng (Trang 29)

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm