Bởi vì tính độc đáo và tính bất biến của nó, nhận dạng mống mắt là một trong những đặc điểm nhận dạng con người chính xác và đáng tin cậy.. Những bộ phận quan trọng của mắt người có liên
Trang 1ĐẠI HỌC QUỐC GIA TP HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
Trang 2CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
Cán bộ hướng dẫn khoa học : PGS TS Huỳnh Thái Hoàng
Ký tên:
Cán bộ chấm nhận xét 1 :
Ký tên Cán bộ chấm nhận xét 2 :
Ký tên Luận văn thạc sĩ được bảo vệ tại Trường Đại học Bách Khoa, ĐHQG Tp HCM, ngày tháng năm 201…
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: 1 ………
2 ………
3 ………
4 ………
5 ………
CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA ĐIỆN – ĐIỆN TỬ
Trang 3ĐẠI HỌC QUỐC GIA TP.HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc
NHIỆM VỤ LUẬN VĂN THẠC SĨ
I TÊN ĐỀ TÀI:
HỆ THỐNG NHẬN DIỆN MỐNG MẮT THÔNG MINH
II NHIỆM VỤ VÀ NỘI DUNG:
- Thu thập tập mẫu và trích đặc trưng
- Xây dựng bộ nhận diện dựa trên mạng thần kinh
- Kiểm tra, đánh giá phần mềm bằng cách nhận diện 100 người
III NGÀY GIAO NHIỆM VỤ: 20/01/2015
IV NGÀY HOÀN THÀNH NHIỆM VỤ: 31/12/2015
V CÁN BỘ HƯỚNG DẪN: PGS.TS Huỳnh Thái Hoàng
Tp HCM, ngày… tháng … năm 201…
CÁN BỘ HƯỚNG DẪN
PGS.TS Huỳnh Thái Hoàng
CHỦ NHIỆM BỘ MÔN ĐÀO TẠO
TS Trương Đình Châu TRƯỞNG KHOA ĐIỆN-ĐIỆN TỬ
TS Đỗ Hồng Tuấn
Trang 41
LỜI CÁM ƠN
Trong quá trình thực hiện đề tài, tôi đã nhận được sự hướng dẫn, chỉ bảo tận tình của các thầy cô trong khoa Điện – Điện tử, đặc biệt là các thầy cô trong bộ môn Điều Khiển Tự Động, sự giúp đỡ của bạn bè cũng như sự động viên, khích lệ tinh thần từ phía gia đình
Tôi xin gửi đến thầy PGS.TS Huỳnh Thái Hoàng lời biết ơn sâu sắc vì đã dành thời gian quý báu để hướng dẫn, tạo điều kiện thuận lợi cũng như cho tôi những lời khuyên bổ ích để hoàn thành luận văn này
Tôi xin cám ơn cha mẹ và các anh chị em trong gia đình đã động viên và tạo điều kiện giúp tôi vượt qua những khó khăn trong suốt quá trình học tập và nghiên cứu vừa qua
Cuối cùng, tôi cũng xin gửi lời cảm ơn đến các bạn học viên, sinh viên vì đã giúp đỡ tôi trong quá trình lấy mẫu và kiểm tra, đánh giá phần mềm của đề tài
TP Hồ Chí Minh, tháng 12/2015
NGUYỄN VĂN DŨNG
Trang 52
TÓM TẮT LUẬN VĂN
Luận văn này nghiên cứu và phát triển hệ thống nhận diện mống mắt thông minh dựa trên mạng thần kinh Khối lương luận văn thực hiện gồm 4 nhiệm vụ chính: phân đoạn mống mắt, chuẩn hóa, trích đặc trưng và tạo mạng thần kinh Phân đoạn mống mắt được thực hiên bằng bộ biến đổi Hough Circle và Hough Line Hough Circle được dùng để tách vòng trong và vòng ngoài mống mắt, Hough Line được dùng để tách mí mắt trên và mí mắt dưới
Chuẩn hóa mống mắt: dùng phương pháp chuẩn hóa Daughman Rubber Sheet
để chuẩn hóa mống mắt về hình chữ nhật kích thước 20x240 pixel
Đặc trưng được trích qua 2 bước: bước 1 dùng giải thuật Local Binary Pattern (LBP), bước 2 dùng giải thuật Principal Component Analysis (PCA) để rút gọn kích thước vector đặc trưng
Bộ nhận diện là những mạng thần kinh 2 lớp: 1 lớp vào với 40 tế bào thần kinh, 1 lớp ra với 1 tế bào thần kinh
Luận văn này sử dụng phần mềm Matlab để thực hiện xử lý ảnh và xây dụng mạng thần kinh
ABSTRACT
This thesis researches and develops an intelligent iris recognition system based
on neural network The thesis comprises of 4 main parts: iris segmentation, iris normalization, feature extraction and neural network training
Iris is segmented by using Hough Circle and Hough Line Hough Circle is used to extract inner and outer circle of iris Hough Line is used to extract top and bottom eyelid
Iris normalization: uses Daughman Rubber Sheet method to normalize iris to rectangle with size of 20x240 pixels
Trang 63
Features are extracted through 2 steps: first step uses Local Binary Pattern (LBP) method, second step uses Principle Component Analysis (PCA) to reduce size of feature vectors
Identifier is a 2 layers neural network: layer 1 consists of 40 neurals, layer 2 consists of 1 neural
This thesis uses Matlab software to process image and create neural network
Trang 74
LỜI CAM KẾT
Tôi xin cam kết các nội dung lý thuyết trình bày trong luận văn này là do tôi tham khảo các tài liệu và biên soạn lại Phần mềm nhận diện và tất cả các kết quả kiểm tra đánh giá thực nghiệm đều do chính bản thân tôi tự làm ra, hoàn toàn không phải sao chép từ bất kỳ một tài liệu hoặc công trình nghiên cứu nào khác
Nếu tôi không thực hiện đúng các cam kết nêu trên, tôi xin hoàn toàn chịu trách nhiệm trước kỷ luật của nhà trường cũng như pháp luật Nhà nước
NGUYỄN VĂN DŨNG
Trang 85
MỤC LỤC
LỜI CÁM ƠN 1
TÓM TẮT LUẬN VĂN 2
LỜI CAM KẾT 4
DANH MỤC HÌNH ẢNH 7
Chương 1 TỔNG QUAN 11
1.1Đặt vấn đề 11
1.2Tổng quan nghiên cứu 12
1.2.1 Phân tích mắt người và ảnh mống mắt 12
1.2.2 Những công trình nghiên cứu liên quan 13
1.3Mục tiêu đề tài 25
1.4Sơ lược nội dung luận văn 26
Chương 2 CƠ SỞ LÝ THUYẾT 28
2.1 Giới thiệu về hệ thống xử lý ảnh 28
2.2 Vấn đề cải thiện chất lượng ảnh 31
2.2.1 Cải thiện ảnh dùng toán tử không gian 32
2.3 Phân vùng ảnh 38
2.3.1 Phân vùng ảnh theo ngưỡng biên độ 38
2.3.2 Phân vùng ảnh theo miền đồng nhất 39
2.4 Biến đổi Hough Circle 41
2.5 Biến đổi Hough Parabol 42
2.6Biến đổi Hough Line 43
2.7Phương pháp Local Binary Patttern 45
2.8Phương pháp Principal Component Analysis - PCA 46
2.9 Mạng thần kinh 47
Chương 3 XÂY DỰNG GIẢI THUẬT 49
3.1 Nghiên cứu lý thuyết 49
3.2 Đề xuất giải thuật 50
3.2.1 Thu thập ảnh mẫu và cơ sở dữ liệu 50
3.2.2 Phân vùng mống mắt 54
Chương 4 KẾT QUẢ 76
4.1 Tổng quan phần mềm huấn luyện và nhận diện 76
Trang 96
4.2 Giao diện đồ họa người dùng 77
4.3 Kết quả thực nghiệm 78
4.3.1 Kết quả phân đoạn mống mắt 78
4.3.2 Kết quả nhận diện 80
Chương 5 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 82
5.1Các kết quả đạt được 82
5.2Hạn chế và hướng phát triển đề tài 83
5.2.1 Hạn chế 83
5.2.2 Hướng phát triển 83
TÀI LIỆU THAM KHẢO 85
PHẦN LÝ LỊCH TRÍCH NGANG 87
QUÁ TRÌNH ĐÀO TẠO 87
QUÁ TRÌNH CÔNG TÁC 87
Trang 107
DANH MỤC HÌNH ẢNH
Hình 1.1 Cấu trúc các thành phần của mắt 13
Hình 1.2 Hình mống mắt và đặc trưng 13
Hình 1.3 Tách con ngươi bằng phương pháp gán nhãn 14
Hình 1.4 Tách vòng ngoài dùng biến đổi Hough Circle 15
Hình 1.5 Dùng hình chữ nhật tìm vùng ảnh con ngươi 15
Hình 1.6 Biên giữa con ngươi và mống mắt 16
Hình 1.7 Chuẩn hóa mống mắt theo mô hình Daugman 17
Hình 1.8 Mống mắt sau khi chuẩn hóa 17
Hình 1.9 Các đặc trưng được trích dọc theo các vòng tròn trong mống mắt 18
Hình 1.10 Luồng biến đổi Ridgelet 20
Hình 1.11 Mẫu code nhị phân mống mắt sau khi dùng biến đổi Ridgelet 20
Hình 1.12 Luồng biến đổi Curvelet 21
Hình 1.13 Mẫu code nhị phân mống mắt sau khi dùng biến đổi Curvelet 21
Hình 1.14 Lượng tử hóa góc pha thành 4 mức 23
Hình 1.15 Mạng thần kinh với 1 lớp ẩn 24
Hình 1.16 Giải thuật di truyền 25
Hình 2.1 Các bước cơ bản trong xử lý ảnh 29
Hình 2.2 Sơ đồ phân tích và xử lý ảnh và lưu đồ thông tin giữa các khối 31
Hình 2.3 Sơ đồ bộ lọc thông cao 36
Hình 2.4 Khái niệm 4 liên thông và 8 liên thông 40
Hình 2.5 Minh họa biến đổi Hough Circle 42
Hình 2.6 Không gian tích lũy biến đổi Hough Circle 42
Hình 2.7 Không giai tích lũy biến đồi Hough Line 45
Hình 2.8 Ví dụ tính Local binary pattern 46
Hình 2.9 Histogram đặc trưng dựa trên LBP 46
Hình 2.10 Mạng thần kinh 47
Hình 3.1 Lưu đồ giải thuật đề xuất 50
Trang 118
Hình 3.2 Hình mống mắt được chụp trong nguồn ánh sáng nhìn thấy và trong vùng
ánh sáng hòng ngoại 51
Hình 3.3 Thiết bị chụp mống mắt IriShield™‐USB MO 2120 52
Hình 3.4 Hình ảnh mống mắt của tác giả luận văn được chụp bằng thiết bị IriShield™‐USB MO 2120 53
Hình 3.5 Camera OKIIRISPASS-h và hình trong CSDL OKIIRISPASS-h 54
Hình 3.6 Các bước phân vùng mống mắt 55
Hình 3.7 Histogram của ảnh mống mắt 56
Hình 3.8 Ảnh hưởng nhiễu lông mi sau khi lấy ngưỡng 57
Hình 3.9 Ảnh nhị phân sau khi qua bộ lọc trung vị 58
Hình 3.10 a Hình ảnh gốc | b bản đồ cạnh | c bản đồ cạnh theo phương ngang | d bản đồ cạnh theo phương dọc 60
Hình 3.11 Kết quả định vị đồng tử 61
Hình 3.12 Kết quả làm nổi cạnh trước khi làm mịn ảnh 62
Hình 3.13 Tác dụng của bộ lọc trung bình 64
Hình 3.14 Kết quả làm nổi cạnh sau khi làm mịn ảnh 65
Hình 3.15 Áp dụng biến đổi hough tròn trong bản đồ biên để tìm biên ngoài mống mắt 65
Hình 3.16 Bản đồ biên mống mắt phần trên và phần dưới 66
Hình 3.17 Tìm đường thẳng trên hai bản đồ biên bằng biến đổi hough 67
Hình 3.18 Hình ảnh sau khi loại bỏ mí mắt 67
Hình 3.19 Mô hình Daughma Rubber Sheet 68
Hình 3.20 Các pixel được chọn trong mô hình Rubber Sheet 69
Hình 3.21 Chuẩn hóa với độ phân giải 10x40 70
Hình 3.22 Hình các pixel được chọn trong quá trình chuẩn hóa 71
Hình 3.23 Kết quả chuẩn hóa 71
Hình 3.24 Mặt nạ LBP 72
Hình 3.25 Mô hình mạng thần kinh 73
Hình 3.26 Giải thuật Huấn luyện mạng thần kinh 74
Trang 1411
Chương 1
TỔNG QUAN
1.1 Đặt vấn đề
Con người có những đặc điểm khác biệt và độc đáo mà có thể được sử dụng
để phân biệt người này với người khác Một số đặc điểm đặc trưng cho đặc tính sinh
lý hay đặc tính hành vi của con người, có thể được sử dụng để nhận dạng sinh trắc học Đặc điểm sinh lý cơ bản gồm: mặt, dấu vân tay, mống mắt, võng mạc, mùi và mùi hương Tiếng nói, chữ ký, nhịp điệu gõ, dáng đi có liên quan đến đặc điểm hành vi Các thuộc tính quan trọng của những đặc điểm đó cho sự nhận diện đáng tin cậy là sự độc đáo của các đặc tính đó đối với mỗi cá nhân và sự ổn định không thay đổi theo thời gian Mống mắt của con người là đặc tính tốt nhất khi chúng ta xem xét các thuộc tính này
Mống mắt là một phần giữa con ngươi và cũng mạc trắng Các kết cấu của mống mắt phức tạp, độc đáo và rất ổn định trong suốt cuộc đời Chúng cung cấp nhiều đặc tính như tàn nhang, vành, sọc, rãnh, tiểu nang Trong cấu trúc mống mắt, hoa văn mống mắt có sự ngẫu nhiên rất cao Đây là những gì làm cho chúng có tính duy nhất Mống mắt là một cơ quan nội tạng được bảo vệ và nó có thể được sử dụng như một dữ liệu nhận dạng hoặc một mật khẩu có tính bảo mật rất cao Từ một tuổi đến khi chết, các hoa văn của mống mắt tương đối ổn định Bởi vì tính độc đáo và tính bất biến của nó, nhận dạng mống mắt là một trong những đặc điểm nhận dạng con người chính xác và đáng tin cậy
Ngày nay công nghệ sinh trắc học đóng vai trò quan trọng trong lĩnh vực an ninh công cộng và an ninh thông tin Mống mắt là một trong những sinh trắc học đáng tin cậy và chính xác, nó đóng một vai trò quan trọng trong việc nhận diện cá nhân Phương pháp nhận dạng mống mắt cung cấp kết quả chính xác trong những hoàn cảnh môi trường khác nhau
Trang 1512
Hệ thống sinh trắc học bắt đầu từ việc lấy mẫu đặc trưng như hình quét vân tay, hình chụp mống mắt Những mẫu sau khi lấy sẽ được chuyển thành một khuôn mẫu sinh trắc học bằng cách dùng nhiều hàm toán khác nhau Khuôn mẫu này được chuẩn hóa, trích đặc trưng tiêu biểu cho vật để có thể so sánh với khuôn mẫu khác
và đưa ra quyết định nhận dạng Đa số hệ thống sinh trắc học bao gồm hai chế độ hoạt động: chế độ ghi danh và chế độ nhận dạng Chế độ ghi danh cho phép thêm một khuôn mẫu vào cơ sở dữ liệu Chế độ nhận dạng để kiểm tra một khuôn mẫu mới được tạo thuộc lớp nào trong cơ sở dữ liệu
Luận văn này dùng phương pháp Local Binary Pattern and Principal Component Analysis để trích đặc trưng và dùng mạng thần kinh để xây dựng bộ nhận diện
1.2 Tổng quan nghiên cứu
1.2.1 Phân tích mắt người và ảnh mống mắt
Mắt người là một cơ quan cảm nhận ánh sáng Những bộ phận quan trọng của mắt người có liên quan đến kỹ thuật nhận dạng mống mắt bằng xử lý ảnh bao gồm:
Giác mạc (cornea) là một màng trong suốt phía trươc cầu mắt
Mống mắt (iris) là cơ điều khiển kích thước của con ngươi (pupil), giống như
lỗ mở ống kính trong một camera cho ánh sáng đi vào
Mống mắt có chi tiết, họa tiết, màu sắc khác biệt giữa người này với người khác, do đó có thể được dùng trong sinh trắc học
Màng cứng mắt (sclera) là bề mặt đai ở phía ngoài của cầu mắt và có màu trắng (tròng trắng) trong ảnh mắt
Limus là biên giữa tròng trắng và tròng đen
Đồng tử (pupil) là hình tròn đen bên trong
Trang 161.2.2 Những công trình nghiên cứu liên quan
Nhận diện mống mắt là so sánh đặc trưng trích được từ mống mắt với các đặc trưng được lưu sẵn trong cơ sở dữ liệu
Trang 1714
Nhận diện mống mắt là một trong những để tài hấp dẫn được phát triển trong những năm gần đây Đa số các phương pháp nhận diện mống mắt gồm các bước như sau:
- Bước 1: Thu thập ảnh
- Bước 2: Phân đoạn ảnh
- Bước 3: Chuẩn hóa
- Bước 4: Trích đặc trưng và mã hóa
Hình 1.3 Tách con ngươi bằng phương pháp gán nhãn
Các pixel này sẽ được gắn nhãn, các pixel kết nối với nhau sẽ được gắn cùng 1 nhãn Sau đó ta sẽ chọn ra nhãn thỏa các thuộc tính là hình tròn và thỏa điều kiện bán kính của con ngươi Tiếp theo để tách được vòng ngoài mống mắt, áp dụng bộ lọc cạnh Canny vào ảnh để làm nổi các cạnh lên Sau đó dùng biến đổi Hough Circle để tìm vòng ngoài mống mắt
Trang 1815
Hình 1.4 Tách vòng ngoài dùng biến đổi Hough Circle
- Phương pháp hình chữ nhật màu đen [8]
Phương pháp này dùng một hình chữ nhật để tìm ra một vùng trong con ngươi Chia ảnh mống mắt thành nhiều đường ngang đều nhau Dùng hình chữ nhật kích thước 10x10 pixel, bắt đầu quét từ đường ngang chính giữa, quét từ trái sang phải So sánh giá trị thang xám các pixel trong hình chữ nhật này với 1 giá trị ngưỡng, nếu tất cả các pixel này đều nhỏ hơn ngưỡng thì đó là hình chữ nhật đó đã nằm trong vùng con ngươi
Hình 1.5 Dùng hình chữ nhật tìm vùng ảnh con ngươi
Trang 1916
Từ tọa độ hình chữ nhật này, tìm ra các điểm thay đổi thang xám đột ngột theo chiều ngang và chiều dọc, đó chính là biên giữa mống mắt và con ngươi
Hình 1.6 Biên giữa con ngươi và mống mắt
Từ đó ta xác định được tâm và bán kính con ngươi
đi 10 pixel Như vậy trên mỗi vùng này tìm được 1 điểm mà sự thay đổi tổng thang xám 10 pixel liên tiếp lớn nhất Đó chính là biên ngoài mống mắt Vậy ta đã xác định được tâm và biên ngoài mống mắt
Trang 21Hình 1.9 Các đặc trưng được trích dọc theo các vòng tròn trong mống mắt
Từ các đặc trưng này xây dựng vector đặc trưng và được lưu thành dữ liệu để nhận diện
Trang 2219
d c – standard deviation của vòng tròn thứ c
Sau khi có được vector đặc trưng, dùng Hamming distance để so sánh nhận diện
Phương pháp này đơn giản dễ thực hiện nhưng hiệu quả không cao
- Phương pháp biến đổi Ridgelet [2]
Mống mắt sau khi chuẩn hóa sẽ được trích đặc trưng dùng phương pháp biến đổi Ridgelet Biến đổi Ridgelet được giới thiệu bởi Candes và Donoho năm 1999 Phương pháp trích đặc trưng này tương đối phức tạp nhưng trích được những đặc trưng hiệu quả hơn so với phương pháp thống kê Sau đây là luồng biến đổi Ridgelet
Image Fast Fourier Transform 2D Invert Fast Fourier Transform 1D Wavelet Transform
Trang 2320
Hình 1.10 Luồng biến đổi Ridgelet
Các đặc trưng trích được gồm đặc trưng ngang, đặc trưng dọc, đặc trưng chéo
và đặc trưng tổng hợp
Hình 1.11 Mẫu code nhị phân mống mắt sau khi dùng biến đổi Ridgelet
- Phương pháp biến đổi Curvelet [2]
Các bước làm tương tự như phương pháp trên, chỉ khác là trích đặc trưng dùng biến đổi Curvelet Biến đổi Curvelet cũng được giới thiệu bởi Candes và Donoho năm 1999
Trang 2421
Hình 1.12 Luồng biến đổi Curvelet
Image Wavelet Transform 2D Fast Fourier Transform 2D Invert Fast Fourier Transform 1D Wavelet Transform 1D
Hình 1.13 Mẫu code nhị phân mống mắt sau khi dùng biến đổi Curvelet
Trang 2522
- Phương pháp Local Binary Pattern [14]
Local binary pattern (LBP) được giới thiệu bởi Ojala vào năm 1996, đây là phương pháp đơn giản nhưng hiệu quả trong việc trích xuất đặc trưng dùng cho các
bộ phân loại Ưu điểm của phương pháp này là tính toán đơn giản và thời gian trích đặc trưng nhanh Vì vậy nó phù hợp cho những ứng dụng yêu cầu thời gian thực Ngoài ra phương pháp này chỉ dựa vào sự so sánh thang xám của pixel trung tâm với 8 pixel xung quanh nó trong liên kết 8, vì vậy nó tránh được ảnh hưởng điều
kiện ánh sáng môi trường lên toàn bộ ảnh
- Phương pháp biến đổi bộ bốn tương quan góc pha [5]
Một phương pháp mới trong trích đặc trưng đó là sử dụng bộ bốn tương quan góc pha Đây cũng là phương pháp hiệu quả trong việc giảm ảnh hưởng điều kiện ánh sáng môi trường lên toàn bộ ảnh Không giống như những phương pháp trích đặc trưng khác (đa số trích đặc trưng dựa trực tiếp giá trị thang xám của các pixel), trong phương pháp này từ giá trị thang xám các pixel được biến đổi sang miền số phức Bộ biến đổi có thể là Gabor 1D, hoặc Gabor 2D, hoặc Log Gabor
2 2
2 2
Trang 2623
Hình 1.14 Lượng tử hóa góc pha thành 4 mức
Như vậy mỗi pixel trong ảnh chuẩn hóa sẽ được mã hóa thành 2 bit
d) Các phương pháp nhận diện
- Phương pháp Hamming distance [4]
Đây là phương pháp đơn giản nhưng hiệu quả không cao Trong phương pháp này, ta tính khoảng cách Hamming giữa đặc trưng cần nhận diện và các đặc trưng trích trước đó được lưu trong cơ sở dữ liệu Đặc trưng nào có khoảng cách ngắn nhất thì đó là đối tượng cần nhận diện
1 1
- Phương pháp mạng thần kinh và di truyền [6]
Trong nghiên cứu này, tác giả không sử dụng hamming distance mà sử dụng mạng thần kinh và giải thuật di truyền để nhận dạng Sau khi trích được đặc trưng mống mắt, các đặc trưng này sẽ là tín hiệu đầu vào để huấn luyện mạng thần kinh
Trang 2724
Sử dụng mạng thần kinh 2 lớp, gồm 1 lớp ẩn và 1 lớp ra Các trọng số của mạng thần kinh được huấn luyện bằng giải thuật di truyền Huấn luyện bằng giải thuật di truyền có ưu điểm so với các giải thuật huấn luyện khác là thời gian huấn luyện nhanh hơn và kết quả nhận diện chính xác hơn
Hình 1.15 Mạng thần kinh với 1 lớp ẩn
Trang 2825
Hình 1.16 Giải thuật di truyền
1.3 Mục tiêu đề tài
Từ tổng quan về vấn đề nghiên cứu và ứng dụng kỹ thuật nhận dạng mống mắt
ở trên, có thể thấy đây là lĩnh vực có nhiều ứng dụng thực tiễn và còn nhiều tiềm năng nghiên cứu trong tương lai
Một số nghiên cứu gần đây đã đạt được một số hiệu quả nhất định tuy nhiên còn gặp một vài hạn chế như:
- Chịu nhiều ảnh hưởng điều kiện môi trường
- Thời gian trích đặc trưng lâu
Trang 2926
- Phương pháp nhận diện đơn giản mang lại hiệu quả chưa cao
Vì vậy, học viên chọn đề tài này với mục tiêu tìm ra phương pháp có sự kế
thừa ưu điểm của những nghiên cứu trước đây, tìm cách biến đổi tối ưu, ứng dụng
những phương pháp trích đặc trưng hiệu quả (LBP, PCA) và giải thuật nhận diện
thông minh (Neural Network) để đưa ra những phương pháp nhận dạng mống mắt
mới đáp ứng được yêu cầu về độ chính xác và thời gian thực
Hệ thống sẽ được phát triển trên nền MATLAB, với phần cứng chụp ảnh
mống mắt là thiết bị IriShield của công ty Iritech MATLAB với hộp công cụ xử lý
hình ảnh, và phương pháp lập trình cao cấp giúp tạo ra công cụ kiểm tra thuật toán
và tạo ra ứng dụng một các nhanh chóng Để kiểm tra hệ thống, hai bộ dữ liệu hình
ảnh mắt sẽ được sử dụng làm nguyên liệu đầu vào: một cơ sở dữ liệu của hình ảnh
mắt CASIA-IrisV4 được tải từ: http://biometrics.idealtest.org/dbDetailForUser.do?id=4, một cơ sở dữ liệu được
chính tác giả thu thập từ các bạn sinh viên Bách Khoa Hệ thống nhận dạng mống
mắt này được tạo thành bởi một số mô-đun, tương ứng với từng giai đoạn của nhận
dạng mống mắt Các giai đoạn này là phân vùng – định vị các khu vực trong một
hình ảnh mống mắt, chuẩn hóa – tạo ra một mẫu đại diện chiều thống nhất của vùng
mống mắt, trích đặc trưng – tạo ra một bản mẫu chỉ chứa những đặc trưng riêng
biệt nhất của mống mắt, training – huấn luyện mạng thần kinh và recognition – đưa
ra quyết định một mẫu thuộc lớp nào trong cơ sở dữ liệu
Đầu vào của hệ thống là 2 tập hình ảnh mắt người: 1 tập chứa mắt người cần
nhận dạng, 1 tập chứa mắt người không phải người cần nhận dạng, đầu ra là một
mạng thần kinh nhận dạng được mắt người cần nhận dạng và được lưu trong cơ sở
dữ liệu Từ đó, hệ thống có thể tiến hành nhận dạng mống mắt cần kiểm tra
1.4 Sơ lược nội dung luận văn
Nội dung luận văn gồm các chương sau:
Chương 1 Giới thiệu
Trang 3027
Giới thiệu sơ lược về nhận diện sinh trắc học, nhận diện mống mắt, tổng quan các công trình nghiên cứu liên quan và từ đó rút ra phương pháp nghiên cứu của đề tài Cuối chương trình bày sơ lược nội dung luận văn
Chương 2 Cơ sở lý thuyết
Trình bày sơ lược các lý thuyết xử lý ảnh Chương này cũng trình bày về các phương pháp được dùng trong luận văn để phân đoạn, trích đặc trưng và nhận diện mống mắt
Chương 3 Xây dựng giải thuật
Chương này nói đến giải thuật chương trình Giải thuật phân đoạn đồng tử, mống mắt, loại bỏ mí mắt, lông mi, giải thuật trích đặc trưng kết hợp LBP và PCA, chuẩn hóa, mô hình huấn luyện mạng thần kinh
Chương 4 Kết quả
Trình bày kết quả đạt được Nêu lên ưu nhược điểm và hướng khắc phục
Chương 5 Kết luận và hướng phát triển
Nhận xét kết quả đạt được Đưa ra hướng phát triển đề tài
Trang 31Xử lý ảnh được đưa vào giảng dạy ở bậc đại học ở nước ta khoảng chục năm nay Nó là môn học liên quan đến nhiều lĩnh vực và cần nhiều kiến thức cơ sở khác Đầu tiên phải kể đến xử lý tín hiệu số là một môn học hết sức cơ bản cho xử lý tín hiệu chung, các khái niệm về tích chập, các biến đổi Fourier, biến đổi Laplace, các
bộ lọc hữu hạn… Thứ hai, các công cụ toán như đại số tuyến tính, xác suất thống
kê Một số kiến thứ cần thiết như trí tuệ nhân tạo, mạng thần kinh nhân tạo cũng được đề cập trong quá trình phân tích và nhận dạng ảnh
Để dễ tưởng tượng, xét các bước cần thiết trong xử lý ảnh Đầu tiên, ảnh tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu (như camera, máy chụp ảnh) Trước đây, ảnh thu qua camera là các ảnh tương tự (loại camera ống kiểu CCIR) Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng được lấy
ra từ camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo (máy ảnh số hiện nay là một thí dụ gần gũi) Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh; có thể quét từ ảnh chụp bằng máy quét ảnh Hình 2.1 dưới đây
mô tả các bước cơ bản trong xử lý ảnh
Trang 3229
Hình 2.17 Các bước cơ bản trong xử lý ảnh
Sơ đồ này bao gồm các thành phần sau:
Ảnh có thể nhận qua camera màu hoặc đen trắng Thường ảnh nhận qua camera là ảnh tương tự, cũng có loại camera đã số hoá Camera thường dùng là loại quét dòng; ảnh tạo ra có dạng hai chiều Chất lượng một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong cảnh…)
Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộ tiền
xử lý để nâng cao chất lượng Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng
độ tương phản để làm ảnh rõ hơn, nét hơn
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh… Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác của ảnh Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này
Trang 3330
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn) cộng với mã liên kết với các vùng lận cận Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được
Nhận dạng ảnh là quá trình xác định ảnh Quá trình này thường thu được bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh cơ bản:
Nhận dạng theo tham số
Nhận dạng theo cấu trúc
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử), nhận dạng văn bản (text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt người, nhận dạng mống mắt…
Như đã nói ở trên, ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán học đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận
và xử lý ảnh theo cách của con người Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con người
Ảnh sau khi số hóa sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu tiếp theo để phân tích Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung lượng bộ
Trang 3431
nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công nghệ Thông thường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản là mã hoá) theo các đặc điểm của ảnh được gọi là các đặc trưng ảnh (Image Features) như: biên ảnh (Boundary), vùng ảnh (Region)
Các mã phân chia thành các vùng con tạo thành một cây phân chia các vùng đồng nhất theo sơ đồ sau:
Hình 2.18 Sơ đồ phân tích và xử lý ảnh và lưu đồ thông tin giữa các khối
2.2 Vấn đề cải thiện chất lượng ảnh
Nâng cao chất lượng là bước cần thiết trong xử lý ảnh nhằm hoàn thiện một số đặc tính của ảnh Nâng cao chất lượng ảnh gồm hai công đoạn khác nhau: tăng cường ảnh và khôi phục ảnh Tăng cường ảnh nhằm hoàn thiện các đặc tính của ảnh như:
- Lọc nhiễu, hay làm trơn ảnh
- Tăng độ tương phản, điều chỉnh mức xám của ảnh
- Làm nổi biên ảnh
Các thuật toán triển khai việc nâng cao chất lượng ảnh hầu hết dựa trên các kỹ thuật trong miền điểm, không gian và tần số Toán tử điểm là phép biến đổi đối với từng điểm ảnh đang xét, không liên quan đến các điểm lân cận khác, trong khi đó, toán tử không gian sử dụng các điểm lân cận để quy chiếu tới điểm ảnh đang xét
Trang 3532
Một số phép biến đổi có tính toán phức tạp được chuyển sang miền tần số để thực hiện, kết quả cuối cùng được chuyển trở lại miền không gian nhờ các biến đổi ngược
2.2.1 Cải thiện ảnh dùng toán tử không gian
Cải thiện ảnh là làm cho ảnh có chất lượng tốt hơn theo ý đồ sử dụng Thường
là ảnh thu nhận có nhiễu cần phải loại bỏ nhiễu hay ảnh không sắc nét bị mờ hoặc cần làm rõ các chi tiết như đường biên ảnh Các toán tử không gian dùng trong kỹ thuật tăng cường ảnh được phân nhóm theo công dụng: làm trơn nhiễu, nổi biên Để làm trơn nhiễu hay tách nhiễu, người ta sử dụng các bộ lọc tuyến tính (lọc trung bình, thông thấp) hay lọc phi tuyến (trung vị, giả trung vị, lọc đồng hình) Từ bản chất của nhiễu (thường tương ứng với tần số cao) và từ cơ sở lý thuyết lọc là: bộ lọc chỉ cho tín hiệu có tần số nào đó thông qua do đó, để lọc nhiễu người ta thường dùng lọc thông thấp (theo quan điểm tần số không gian) hay lấy tổ hợp tuyến tính
để san bằng (lọc trung bình) Để làm nổi cạnh (ứng với tần số cao), người ta dùng các bộ lọc thông cao, lọc Laplace
Trên thực tế tồn tại nhiều loại nhiễu; tuy nhiên người ta thường xem xét 3 loại nhiễu chính: nhiễu cộng, nhiễu nhân và nhiễu xung:
là Xqs, ảnh gốc là Xgốc, nhiễu là η, ảnh thu được có thể biểu diễn bởi:
Xqs = Xgốc + η (2.1)
thức:
Xqs = Xgốc* η (2.2)
a) Làm trơn nhiễu bằng lọc tuyến tính: lọc trung bình và lọc dải thông thấp:
Trang 3633
Do có nhiều loại nhiễu can thiệp vào quá trình xử lý ảnh nên cần có nhiều bộ lọc thích hợp Với nhiễu cộng và nhiễu nhân ta dùng các bộ lọc thông thấp, trung bình và lọc đồng hình (Homomorphie); với nhiễu xung ta dùng lọc trung vị, giả trung vị, lọc ngoài (Outlier)
b) Lọc trung bình không gian
Với lọc trung bình, mỗi điểm ảnh được thay thế bằng trung bình trọng số của các điểm lân cận và được định nghĩa như sau:
v(m,n): ảnh đầu ra
a(k,l): là cửa sổ lọc
với a k l( , ) 1
Nw
Trong lọc trung bình, thường người ta ưu tiên cho các hướng để bảo vệ biên của ảnh khỏi bị mờ khi làm trơn ảnh Các kiểu mặt nạ được sử dụng tùy theo các trường hợp khác nhau Các bộ lọc trên là bộ lọc tuyến tính theo nghĩa là điểm ảnh ở tâm cửa số sẽ được thay bởi tổ hợp các điểm lân cận chập với mặt nạ
Một bộ lọc trung bình không gian khác cũng hay được sử dụng Phương trình của bộ lọc đó có dạng:
Trang 37sát Do vậy ta có kết quả sau:
log(X(m, n)) = log(X m n( , ) ) + log( η(m, n)) (2.6)
Rõ ràng, nhiễu nhân có trong ảnh sẽ bị giảm Sau quá trình lọc tuyến tính, ta chuyển về ảnh cũ bằng phép biến đổi hàm e mũ
e) Làm trơn nhiễu bằng lọc phi tuyến
Các bộ lọc phi tuyến cũng hay được dùng trong kỹ thuật tăng cường ảnh Trong kỹ thuật này, người ta dùng bộ lọc trung vị, giả trung vị, lọc ngoài Với lọc trung vị, điểm ảnh đầu vào sẽ được thay thế bởi trung vị các điểm ảnh còn lọc giả trung vị sẽ dùng trung bình cộng của 2 giá trị “trung vị” (trung bình cộng của max
và min)
f) Lọc trung vị
Trung vị được viết với công thức:
V(m,n) = trungvi(y(m-k,n-l)) với {k,l} thuộc W
Kỹ thuật này đòi hỏi giá trị các điểm ảnh trong cửa sổ phải xếp theo thứ tự tăng hay giảm dần so với giá trị trung vị Kích thước cửa số thường được chọn sao cho số điểm ảnh trong cửa số là lẻ Các cửa sổ hay dùng là cửa sổ có kích thước 3x3, hay 5x5 hay 7x7
Tính chất của lọc trung vị:
Trang 3835
Trungvi(x(m)+y(m)) ≠ Trungvi(x(m)) + Trungvi(y(m))
( ) ( , ) ( )( , )
là xác định ngưỡng để loại nhiễu mà vẫn không làm mất thông tin của ảnh
h) Lọc thông thấp, thông cao và lọc dải thông
Toán tử trung bình không gian là lọc thông thấp Nếu h LP( , )m n biểu diễn bộ
được định nghĩa:
( , )
LP
H m n = δ(m, n) - h LP( , )m n (2.8)
Trang 3936
Như vậy, bộ lọc thông cao có thể cài đặt một cách đơn giản như trên hình 2.5
Bộ lọc dải thông có thể định nghĩa như sau:
( , )
LP
H m n =h L1( , )m n – h L2( , )m n (2.9)
với h L1 và h L2 là các bộ lọc thông thấp
Hình 2.19 Sơ đồ bộ lọc thông cao
Bộ lọc thông thấp thường dùng làm trơn nhiễu và nội suy ảnh Bộ lọc thông cao dùng nhiều trong trích chọn biên và làm trơn ảnh, còn bộ lọc dải thông có hiệu quả làm nổi cạnh Về biên sẽ được trình bày kỹ trong các phần sau Tuy nhiên, dễ nhận thấy, biên là điểm có độ biến thiên nhanh về giá trị mức xám theo quan điểm
về tần số tín hiệu Như vậy, các điểm biên ứng với các thành phần tần số cao Từ
đó, có thể dùng bộ lọc thông cao để cải thiện nhiễu: nghĩa là có thể lọc các thành phần tần số thấp và giữ lại các thành phần tần số cao Vì thế, lọc thông cao thường được dùng làm trơn biên trước khi tiến thành các thao tác với biên ảnh Dưới đây là một số mặt nạ dùng trong lọc thông cao:
Một số nhân chập trong lọc thông cao
Các nhân chập thông cao có đặc tính chung là tổng các hệ số của bộ lọc bằng
1 Nguyên nhân chính là ngăn cản sự tăng quá giới hạn của các giá trị mức xám (các giá trị điểm ảnh vẫn giữ được giá trị của nó một cách gần đúng không thay đổi quá nhiêu với giá trị thực)
Trang 4037
i) Khuyếch đại và nội suy ảnh
Có nhiều ứng dụng cần thiết phải phóng đại một vùng của ảnh Có nghĩa là lấy một vùng của ảnh đã cho và cho hiện lên như một ảnh lớn Có 2 phương pháp được dùng là lặp (Replication) và nội suy tuyến tính (Linear Interpolation)
Người ta lấy một vùng của ảnh kích thước MxN và quét theo hàng Mỗi điểm ảnh nằm trên đường quét sẽ được lặp lại 1 lần và hàng quét cũng được lặp lại 1 lần nữa Như vậy, ta thu được ảnh với kích thước 2Nx2N Điều này tương đương với việc chèn thêm một hàng 0 và 1 cột 0 rồi chập với mạt nạ H Mặt nạ H
Giả sử có một ma trận điểm ảnh Theo phương pháp nội suy tuyến tính, trước tiên, hàng được đặt vào giữa các điểm ảnh theo hàng Tiếp sau, mỗi điểm ảnh dọc theo cột được nội suy theo đường thẳng Thí dụ, với mức độ khuyếch đại 2x2, nội suy tuyến tính theo hàng sẽ được tính theo công thức:
v1(m,n) = u(m,n)
v1(m,2n+1) = u(m,n) + u(m,n+1) (2.10)