NHỮNG ĐÓNG GÓP MỚI CỦA LUẬN ÁN 1. Đã đưa ra hai phương pháp tiền xử lý gồm thuật toán SDWTL bù sáng cho ảnh mặt người trong không gian màu RGB và thuật toán Dijkstra đa nguồn cải tiến cho phân vùng ảnh tròng mắt, qua đó nâng cao chất lượng ảnh đầu vào và độ chính xác của toàn hệ thống nhận dạng. 2. Đã đưa ra hai phương pháp kết hợp gồm kết hợp biến đổi nhanh Curvelet, PCA, SVD và kết hợp trộn song song biến đổi Curvelet rời rạc, DTCWT để xác lập các đặc trưng ảnh tròng mắt với kích thước các chi tiết đặc trưng được giảm thiểu, qua đó nâng cao tốc độ và độ chính xác trong nhận dạng.
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHÒNG
VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHÒNG
VIỆN KHOA HỌC VÀ CÔNG NGHỆ QUÂN SỰ
LUẬN ÁN TIẾN SĨ KỸ THUẬT
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1 PGS TS Nguyễn Quốc Trung
2 TS Hà Hữu Huy
Trang 3LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu riêng của tôi Các kết quả nghiên cứu
và số liệu trình bày trong luận án là trung thực, chưa từng được ai công bố ở trong bất
kỳ công trình nào khác, các dữ liệu tham khảo được trích dẫn đầy đủ
Tác giả luận án
Nguyễn Nam Phúc
Trang 4Tôi xin bày tỏ lòng biết ơn đến tập thể thầy hướng dẫn PGS.TS Nguyễn Quốc Trung, Đại học Bách khoa Hà Nội và TS Hà Hữu Huy, Viện Khoa học và Công nghệ quân sự đã trực tiếp hướng dẫn, tận tình đưa ra các định hướng khoa học có giá trị giúp tôi hoàn thành luận án này Sự động viên, khuyến khích, những kiến thức chuyên môn
mà các thầy chia sẻ trong những năm thực hiện luận án đã giúp tôi nâng cao năng lực khoa học, phương pháp nghiên cứu và lòng yêu nghề
Tôi xin trân trọng cảm ơn Ban Giám đốc Viện Khoa học và Công nghệ quân sự, Thủ trưởng Viện Điện tử, Phòng Đào tạo - Viện Khoa học và Công nghệ quân sự đã tạo mọi điều kiện thuận lợi cho tôi trong quá trình học tập và nghiên cứu tại Viện
Xin trân trọng cảm ơn các thầy cô giáo, các nhà khoa học Viện Điện tử đã truyền đạt kiến thức, có những góp ý quý báu trong quá trình học tập và thực hiện luận án
Xin trân trọng cảm ơn Cục Công nghệ thông tin, Bộ Công an đơn vị nơi tôi công tác, đã tạo điều kiện để tôi hoàn thành nhiệm vụ
Cuối cùng, tôi xin gửi lời cảm ơn sâu sắc tới gia đình, bạn bè, đồng nghiệp cùng các anh chị em nghiên cứu sinh đã luôn động viên, giúp đỡ tôi vượt qua khó khăn để đạt được những kết quả nghiên cứu như ngày hôm nay
Tác giả luận án
Nguyễn Nam Phúc
Trang 5Trang
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT v
DANH MỤC CÁC BẢNG ix
DANH MỤC CÁC HÌNH VẼ x
MỞ ĐẦU 1
CHƯƠNG 1: TỔNG QUAN VỀ NHẬN DẠNG SINH TRẮC HỌC VÀ CÁC KỸ THUẬT BIẾN ĐỔI SỐ TRÊN ẢNH ĐẦU VÀO 8
1.1 Các hệ thống nhận dạng khuôn mặt và tròng mắt 8
1.1.1 Hệ thống nhận dạng khuôn mặt 10
1.1.2 Hệ thống nhận dạng tròng mắt 12
1.1.3 Một số CSDL sử dụng trong sinh trắc học 18
1.2 Các kỹ thuật tiền xử lý ảnh đầu vào 21
1.2.1 Tiền xử lý ảnh khuôn mặt 21
1.2.2 Tiền xử lý ảnh tròng mắt 22
1.3 Các phép biến đổi số trong xử lý ảnh 25
1.3.1 Các biến đổi không thích nghi 26
1.3.2 Các phép biến đổi thích nghi 29
1.3.3 Biến đổi Curvelet 30
1.4 Tình hình nghiên cứu ở trong và ngoài nước 33
1.4.1 Tình hình nghiên cứu và ứng dụng ngoài nước 33
1.4.2 Tình hình nghiên cứu trong nước 36
1.5 Kết luận Chương 1 37
CHƯƠNG 2: CÁC KỸ THUẬT TIỀN XỬ LÝ NHẰM NÂNG CAO HIỆU QUẢ CHO HỆ THỐNG NHẬN DẠNG KHUÔN MẶT VÀ TRÒNG MẮT 39
2.1 Thuật toán SDWTL bù sáng cho ảnh màu mặt người 39
2.1.1 Động lực nghiên cứu 39
2.1.2 Phân loại ảnh màu mặt người theo cường độ sáng 42
2.1.3 Mô hình thuật toán SDWTL 45
2.1.4 Kết quả mô phỏng và thảo luận 53
2.2 Tối ưu phân vùng ảnh bằng thuật toán Dijkstra đa nguồn cải tiến 65
2.2.1 Động lực nghiên cứu 65
Trang 62.2.3 Kết quả mô phỏng và thảo luận 72
2.3 Phạm vi ứng dụng 78
2.4 Kết luận Chương 2 79
CHƯƠNG 3: CẢI THIỆN ĐỘ CHÍNH XÁC TRONG NHẬN DẠNG BẰNG CÁC KẾT HỢP BIẾN ĐỔI SỐ RỜI RẠC 81
3.1 Biến đổi nhanh Curvelet rời rạc kết hợp các thuật toán PCA và SVD 81
3.1.1 Động lực nghiên cứu 81
3.1.2 Mô hình kết hợp thuật toán FDCT, PCA và SVD 83
3.1.3 Kết quả thực nghiệm và thảo luận 85
3.2 Kết hợp của biến đổi Curvelet nhanh rời rạc và DTCWT 87
3.2.1 Động lực nghiên cứu 87
3.2.2 Mô hình kết hợp biến đổi Curvelet và DTCWT 89
3.2.3 Kết quả thực nghiệm và thảo luận 95
3.3 Phạm vi ứng dụng 97
3.4 Kết luận Chương 3 98
KẾT LUẬN 100
DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ 103
TÀI LIỆU THAM KHẢO 104
Trang 7 Các hệ số bù sáng tương ứng với các màu cơ bản
s Hệ số kết hợp khoảng cách Hamming từ các biến đổi
1D Không gian một chiều (1 Direction)
2D Không gian hai chiều (2 Directions)
AHE Lược đồ cân bằng tương thích (Adaptive Histogram
Equalization)
AI Trí tuệ nhân tạo (Artificial Intelligence)
ALDS Biến đổi lôgarit, Cosine rời rạc, Phân giải giá trị riêng thích
nghi (Adaptive Log Discrete Singular Value Decomposition) ASVD Phân giải giá trị riêng tương thích (Adaptive Singular Value
Decomposition)
Trang 8Singular Value Decomposition Wavelet) CFLT Biến đổi Logarit với ảnh mặt màu (Color Face Log
Transformation) CMU CSDL CMU của Đại học Carnegie Mellon (Carnegie Mellon
University) CPU Đơn vị xử lý trung tâm (Central Processing Unit )
CUDA Kiến trúc thiết bị tính toán hợp nhất (Compute Unified Device
Architecture) CWT Biến đổi Wavelet phức (Complex Wavelet Transform)
DCT Biến đổi cô-sin rời rạc (Discrete Cosine Transform)
DFB Băng lọc trực tiếp (Directional Filter Bank)
DTCWT Biến đổi Wavelet phức theo cây đối ngẫu (Discrete Tree
Complex Wavelet Transforms) DWT Biến đổi Wavelet rời rạc (Discrete Wavelet Transform)
EER Tỉ lệ bình đẳng lỗi (Equal Error Rate)
FAR Tỉ lệ chấp nhận sai (False Acceptance Ratio)
FDCT Biến đổi nhanh Curvelet rời rạc (Fast Discrete Cosine
Transform) FERET CSDL FERET (Facial Recognition Technology)
GPU Đơn vị xử lý đồ họa (Graphics Processing Unit)
HDR Tỉ lệ phân bố điểm ảnh cường độ sáng cao
HE Lược đồ cân bằng (Histogram Equalization)
ICA Phân tích thành phần độc lập (Independent Component
Analysis) ICE CSDL ICE (Iris Challenge Evaluation)
IEC Hội đồng Kỹ thuật điện tử quốc tế (International
Electrotechnical Commission) IoT Internet vạn vật (Internet of Things)
ISO Tổ chức Tiêu chuẩn quốc tế (International Organization for
Standardization)
Trang 9LBP Mẫu nhị phân cục bộ (Local Binary Patterns)
LDR Tỉ lệ phân bố điểm ảnh cường độ sáng thấp
LoG Toán tử Laplac của phân bố Gauss (Laplacian of Gauss)
LT Biến đổi lôgarit (Log Transformation)
MSE Sai số toàn phương trung bình (Mean Squared Error)
NDR Tỉ lệ phân bố điểm ảnh cường độ sáng trung bình (Normal
Brightness Pixel Distribution Rate) NIR Cận hồng ngoại (Near-Infrared Spectroscopy)
NIST Viện Tiêu chuẩn và công nghệ quốc gia (National Institute of
Standards and Technology) OWA Toán tử trọng số trung bình có thứ tự (Ordered Weighted
Averaging) PCA Phân tích thành phần chính (Principal Component Analysis) PIE CSDL PIE (Vị trí, nguồn sáng và biểu cảm) (Pose,
Illumination, and Expression Database) QMA Toán tử lượng tử hóa đa số (Quantified Majority Additive) RAM Bộ nhớ truy cập ngẫu nhiên (Random Access Memory)
RCHT Biến đổi tròn giới hạn Hough (Restricted Circular Hough
Transform) RFOI Phân vùng chữ nhật cần quan tâm của gương mặt (The
Rectangular Face of Interest)
ROC Đặc trưng hoạt động thu nhận (Receiver Operating
Characteristic) SDWTL Phân giải giá trị riêng, Biến đổi Wavelet rời rạc, Biến đổi
lôgarit (Singular Value Decomposition, Discrete Wavelet Transform, Log Transformation)
SIFT Biến đổi đặc trưng theo thang (Scale Invariant Feature
Transform) SVD Phân giải giá trị riêng (Singular Value Decomposition)
Trang 10TIFF Định dạng tập tin ảnh gắn thẻ (Tagged Image File Format) TSVD Phân giải hai giá trị riêng tách biệt (Two Separated Singular
Value Decompositions)
VW Bước sóng thấy được (Visible Wavelength)
Trang 11Trang
Bảng 2.1 Kết quả nhận dạng mặt người trên CSDL CMU-PIE bằng Eigenface 59
Bảng 2.2 Kết quả nhận dạng mặt người trên CSDL CMU-PIE bằng các phương pháp Gradientface và Weberface 61
Bảng 2.3 Kết quả nhận dạng mặt người trên CSDL FERET bằng Eigenface 64
Bảng 2.4 Thời gian tính toán với các ảnh có kích thước khác nhau 65
Bảng 2.5 Thời gian khởi tạo đồ thị cho các hình trên CPU 69
Bảng 2.6 So sánh hiệu năng thời gian của các thuật toán Dijkstra trên CPU 75
Bảng 2.7 So sánh kết quả của các thuật toán dựa trên đồ thị 76
Bảng 2.8 So sánh thời gian phân vùng với thuật toán RCHT [50] 77
Bảng 3.1 Tỉ lệ nhận dạng tròng mắt của các phương pháp khác nhau [79] 82
Bảng 3.2 So sánh kết quả các phương pháp nhận dạng với các loại nhiễu ảnh 82
Bảng 3.3 So sánh độ chính xác của các phương án kết hợp 86
Bảng 3.4 So sánh kết quả nhận dạng trung bình của các phương án cho CSDL UBIRIS và CASIA 86
Bảng 3.5 Bảng so sánh thời gian tính toán của các phương án 87
Bảng 3.5 So sánh các giá trị EER của hệ thống 96
Bảng 3.6 So sánh độ chính xác của một số thuật toán biến đổi 97
Trang 12Trang
Hình 1.1 Sơ đồ hệ thống sinh trắc học cơ bản 9
Hình 1.2 Các khối chức năng trong hệ thống nhận dạng khuôn mặt 11
Hình 1.3 Cấu trúc bề mặt mắt người 12
Hình 1.4 Sơ đồ các khối chức năng trong hệ thống nhận dạng tròng mắt 13
Hình 1.5 Ảnh khuôn mặt với các thái độ biểu cảm trong CSDL CMU Multi-PIE 18
Hình 1.6 Ảnh tròng mắt trong CSDL CASIA-IrisV3 20
Hình 1.7 Ảnh tròng mắt với chất lượng ảnh tốt trong CSDL ICE 2005 20
Hình 1.8 Các yếu tố nhiễu trong ảnh đầu vào 23
Hình 1.9 Kết quả định vị tròng mắt 24
Hình 1.10 Kết quả chuẩn hóa phân vùng ảnh tròng mắt 25
Hình 1.11 Phân giải Wavelet nhị nguyên và khả năng lựa chọn hướng 27
Hình 1.12 Các gói Wavelet hội tụ theo miền tần số 29
Hình 1.13 Các cửa sổ Curvelet theo miền tần số và không gian 33
Hình 2.1 Thang giá trị cường độ xám từ 0 đến 255 42
Hình 2.2 Các ảnh màu mặt người trong CSDL CMU-PIE và phân bố màu tương ứng của các điểm ảnh 44
Hình 2.3 Các ảnh màu mặt người trong CSDL FERET và các phân bố điểm ảnh tương ứng 44
Hình 2.4 Mô hình phân bố chuẩn tắc Gauss G(μ, σ) 45
Hình 2.5 Ảnh màu mặt người trong CSDL CMU-PIE (a) và ảnh thu được sau khi sử dụng LT (b) 46
Hình 2.6 Các ảnh mặt người tối màu (a), sáng màu (c) và các ảnh tái tạo tương ứng (b), (d) khi gán các giá trị riêng bằng 1 47
Hình 2.7 Các dạng ảnh màu và các mẫu Gaus tương ứng 54
Hình 2.8 Các ảnh gốc của một người trong CSDL CMU-PIE 55
Hình 2.9 Kết quả biến đổi ASVD của các ảnh gốc trong Hình 2.8 56
Hình 2.10 Kết quả biến đổi ASVDW của các ảnh gốc trong Hình 2.8 56
Hình 2.11 Kết quả biến đổi SDWTL của các ảnh gốc trong Hình 2.8 57
Trang 13huấn luyện và kiểm tra trên CSDL CMU-PIE bằng các phương pháp ASVD, ASVDW
và SDWTL 57
Hình 2.13 Tỉ lệ nhận dạng bằng phương pháp Eigenface tương ứng với các đối tượng nhận dạng trên CSDL CMU-PIE bằng các phương pháp ASVD, ASVDW và SDWTL 58
Hình 2.14 Các ảnh SDWTL dùng cho Gradientface và Weberface 60
Hình 2.15 Kết quả xử lý bằng Gradientface của các đối tượng trong Hình 2.14 60
Hình 2.16 Kết quả xử lý bằng Weberface của các đối tượng trong Hình 2.14 60
Hình 2.17 Tỉ lệ nhận dạng bằng Gradientface và Weberface 61
Hình 2.18 Các ảnh gốc từ CSDL FERET dùng cho Eigenface 63
Hình 2.19 Kết quả xử lý bằng ASVD của các đối tượng trong Hình 2.18 63
Hình 2.20 Kết quả xử lý bằng ASVDW của các đối tượng trong Hình 2.18 63
Hình 2.21 Kết quả xử lý bằng Eigenface của các đối tượng trong Hình 2.18 64
Hình 2.22 Kết quả xử lý bằng Weberface của các đối tượng trong Hình 2.18 64
Hình 2.23 Ảnh đầu vào với hai điểm nguồn “Label 1”, “Label 2” (a) và kết quả phân vùng ảnh dựa trên khoảng cách ngắn nhất (b) 67
Hình 2.24 Ảnh đầu vào với các nhãn (trái) và kết quả phân vùng (phải) 78
Hình 2.25 Ảnh đầu vào (trái) từ CSDL FERET và kết quả loại nhiễu (phải) 78
Hình 3.1 Sơ đồ khối của hệ thống nhận dạng tròng mắt đề xuất dùng thuật toán kết hợp FDCT, PCA và SVD 83
Hình 3.2 Biểu thị đặc trưng ảnh tròng mắt 84
Hình 3.3 Sơ đồ khối của hệ thống đề xuất 90
Hình 3.4 Trích xuất ảnh con theo góc θ = 450 trong (a) và θ = 300 trong (b) 91
Hình 3.5 Các ảnh con DTCWT được trích xuất I45k ,k 1, ,8 92
Hình 3.6 Kỹ thuật đối chiếu kết hợp 93
Hình 3.7 Các chỉ số FRR và FAR của các hệ thống nhận dạng tròng mắt trên CSDL CASIA 95
Hình 3.8 Độ biến thiên của EER khi giá trị 𝛼 thay đổi 96
Trang 14MỞ ĐẦU
1 Tính cấp thiết của đề tài luận án
Trong những năm gần đây, công nghệ sinh trắc học đang trong giai đoạn phát triển bùng nổ nhằm đáp ứng các nhu cầu ngày càng cao của người sử dụng cá nhân
và tổ chức trong bối cảnh tính kết nối và hoạt động cộng đồng của xã hội ngày càng được nhấn mạnh Công nghệ sinh trắc học có thể sử dụng những đặc điểm sinh học riêng của mỗi cá thể như là khuôn mặt, vân tay, tròng mắt, mạch máu để so sánh, đối chiếu với các cơ sở dữ liệu (CSDL) được lưu trữ từ trước, từ đó xác định được chính xác danh tính của cá thể đó Các ứng dụng của công nghệ sinh trắc học có thể được thấy thường xuyên trong cuộc sống hàng ngày, đặc biệt trong các thiết bị thông minh
và các hệ thống Internet vạn vật (IoT) Người dùng có thể sử dụng vân tay, tròng mắt
để mở khóa các thiết bị điện thoại thông minh của mình, hoặc sử dụng vân tay, khuôn mặt để xác thực khi cần di chuyển qua các khu vực giới hạn được bảo mật [70]
Bên cạnh các đặc tính sinh học thường được sử dụng như vân tay, khuôn mặt các đặc điểm nhận dạng của tròng mắt người cũng là một trong những đặc tính sinh học được sử dụng phổ biến nhất cho mục đích nhận dạng Các công trình nghiên cứu được công bố gần đây đã chỉ ra rằng khu vực xung quanh tròng mắt có các dạng mẫu phức tạp và có tính đặc trưng cao, ổn định và không thay đổi trong giai đoạn nhiều năm, do đó chúng có thể được sử dụng như một dạng đặc tính sinh trắc riêng biệt phục vụ cho công nghệ nhận dạng với tỉ lệ sai sót rất thấp [19]
Để tách được các mẫu sinh trắc đặc trưng một cách hiệu quả, một trong những thuật toán biểu diễn thông tin số được sử dụng đầu tiên là biến đổi Wavelet [52], [71] cho không gian 1D Nhằm nâng cao khả năng xử lý các nội dung thông tin dạng đường cong trong các ảnh đầu vào theo nhiều chiều khác nhau, các phương án biến đổi Curvelet đã được đề xuất, cải tiến và áp dụng rộng rãi trong thực tế Trong những năm gần đây, nhiều công trình nghiên cứu đã kết hợp biến đổi nhanh Curvelet với các thuật toán sử dụng phương pháp thống kê để xác định đặc trưng ảnh sinh trắc học, qua đó nâng cao tỉ lệ nhận dạng của hệ thống [23]
Có thể thấy rằng, những nghiên cứu về hệ thống nhận dạng sinh trắc học đã
Trang 15đạt được nhiều kết quả quan trọng, đặc biệt đối với các hệ thống dựa trên biến đổi rời rạc Tuy nhiên, các hệ thống sinh trắc học phổ biến vẫn có một tỉ lệ sai sót nhất định cần khắc phục Nguyên nhân chủ yếu của vấn đề này xuất phát chủ yếu từ hai nhóm nguyên nhân chính:
- Cùng với xu thế ứng dụng công nghệ nhận dạng thời gian thực trong các hệ thống IoT, các ảnh dữ liệu đầu vào thường được chụp một cách thiếu chủ động trong các điều kiện môi trường khác nhau Điều này có thể dẫn đến khả năng các ảnh dữ liệu đầu vào có chất lượng không đồng đều Bên cạnh đó, các ảnh đầu vào, đặc biệt
là ảnh tròng mắt, có thể được chụp từ đối tượng không hoàn hảo như người bị các bệnh về mắt, phần tròng mắt bị ảnh hưởng tác động, biến dạng bởi dị vật, tổn thương Các yếu tố bất lợi trên sẽ làm phát sinh các thành phần nhiễu, làm giảm lượng thông tin có thể sử dụng trong các ảnh đầu vào, từ đó làm tăng tỉ lệ sai sót trong nhận dạng [44], [72]
- Các phương pháp xử lý số đối với ảnh đầu vào không thể luôn hoạt động tốt trong bài toán nhận dạng tổng quát Thông thường, mỗi một quá trình biến đổi số rời rạc sẽ chỉ có khả năng biểu diễn một số dạng thông tin nhất định và chỉ phù hợp với từng nhóm hệ thống nhận dạng chuyên biệt Việc áp dụng các quá trình biến đổi rời rạc một cách riêng rẽ có thể dẫn đến lượng thông tin nhận dạng hữu ích sẽ không được xử lý đầy đủ, từ đó gây ra các tỉ lệ sai sót trong kết quả cuối cùng của các hệ thống sinh trắc học [95]
Những tồn tại thực tế trên cùng với kết quả khảo sát, đánh giá các công trình khoa học công bố gần đây cho thấy việc nghiên cứu và phát triển các nội dung liên quan tới hệ thống nhận dạng dựa trên các biến đổi số rời rạc vẫn cần tiếp tục được
triển khai Đề tài của luận án “Nghiên cứu giải pháp lọc số dùng biến đổi Wavelet
nâng cao chất lượng xử lý ảnh trong kỹ thuật nhận dạng khuôn mặt và tròng mắt người” tập trung theo hướng nghiên cứu, đánh giá và tối ưu hệ thống nhận dạng
gương mặt, tròng mắt dựa trên biến đổi rời rạc sử dụng các băng lọc số Một số vấn
đề vẫn còn thách thức cũng như các đề xuất để giải quyết liên quan đến các kỹ thuật tiền xử lý và biến đổi số rời rạc sẽ được tập trung nghiên cứu, làm rõ, góp phần nâng cao tốc độ xử lý và giảm tỉ lệ sai sót của hệ thống
Trang 162 Mục tiêu nghiên cứu của luận án
Mục tiêu của luận án là nghiên cứu cơ sở khoa học và đề xuất các phương pháp tiền xử lý cải thiện chất lượng ảnh đầu vào, kết hợp với biến đổi nhanh Wavelet và các kỹ thuật biến đổi số rời rạc khác nhằm nâng cao độ chính xác của các hệ thống nhận dạng khuôn mặt và tròng mắt người
3 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của luận án là các kỹ thuật bù sáng và phân vùng với tốc độ, độ chính xác cao nhằm cải thiện chất lượng ảnh đầu vào trong bước tiền xử
lý, cùng với các kỹ thuật trích xuất, đối chiếu thông tin đặc trưng bằng các phương pháp biến đổi rời rạc, qua đó làm tăng hiệu quả trong nhận dạng khuôn mặt và tròng mắt người
Phạm vi nghiên cứu tập trung chủ yếu trong các hệ thống nhận dạng mặt người
và nhận dạng tròng mắt Các nội dung nghiên cứu lý thuyết chủ yếu bám theo các đối tượng nghiên cứu chính đã nêu ở trên Phần thực nghiệm, mô phỏng được tiến hành trên các CSDL của các tổ chức nghiên cứu uy tín, được công nhận rộng rãi
4 Nội dung nghiên cứu
Luận án thực hiện nghiên cứu và phân tích, đánh giá một số giải pháp nhằm nâng cao hiệu quả hệ thống nhận dạng (như độ chính xác, tin cậy, thời gian xử lý)
Cụ thể, luận án tập trung nghiên cứu cứu hai nội dung chính như sau, trong đó nội dung nghiên cứu đầu tập trung vào các bước tiền xử lý ảnh đầu vào, nội dung nghiên cứu thứ hai tập trung vào các kỹ thuật biến đổi số rời rạc:
* Nghiên cứu các kỹ thuật tiền xử lý ảnh đầu vào trong hệ thống nhận dạng khuôn mặt và tròng mắt: các kỹ thuật này có mục đích tăng cường chất lượng
ảnh đầu vào, qua đó cải thiện độ chính xác của toàn hệ thống nhận dạng Cụ thể, luận
án đã tập trung nghiên cứu hai hướng tiền xử lý như sau:
- Nghiên cứu phương pháp tiền xử lý hình ảnh trên miền không gian màu RGB
để cải thiện chất lượng ảnh đầu vào Với nội dung này, luận án đã xây dựng mô hình
hệ thống mới có tên là SDWTL để nhận dạng khuôn mặt màu dưới nhiều độ sáng khác nhau Trong mô hình này, kỹ thuật biến đổi DWT được sử dụng để đưa các kênh màu trong miền logarit sang miền DWT và tính toán các hệ số bù sáng riêng Sau đó
Trang 17hệ thống sử dụng biến đổi DWT ngược của các hệ số bù sáng, trộn lẫn các kênh màu
và chuẩn hóa dữ liệu Đồng thời luận án cũng thực hiện nội dung thực hành mô phỏng đánh giá hiệu quả hoạt động của mô hình đề xuất trên các CSDL tiêu chuẩn
- Đề xuất phương án phân vùng ảnh theo từng điểm ảnh dựa trên thuật toán Dijkstra đa nguồn cải tiến cho các ảnh tròng mắt, nhờ đó các phân vùng ảnh chứa các mẫu chi tiết nhận dạng và các phân vùng ảnh chứa các chi tiết dư thừa được phân tách chính xác Đặc biệt các chi tiết dư thừa có dạng mỏng nhẹ do ảnh hưởng của lông mi, khúc xạ, lông mi giả có thể được loại bỏ một cách hiệu quả mà không làm ảnh hưởng đến nội dung thông tin quan trọng cần thiết cho hệ thống nhận dạng
* Nghiên cứu các phương pháp nâng cao độ chính xác của hệ thống nhận dạng tròng mắt: bao gồm các phương pháp biến đổi số rời rạc Wavelet và Curvelet
cùng các biến thể được sử dụng kết hợp theo các cách khác nhau như sau:
- Nghiên cứu phương án cải thiện độ chính xác trong các bước trích xuất mẫu đặc trưng trong hệ thống nhận dạng tròng mắt Trong bước này, các phương pháp biến đổi nhanh Curvelet, thuật toán PCA và SVD đã được tùy biến để kết hợp với nhau thành một hệ thống chung nhằm cải thiện độ chính xác và hiệu năng trong bước xác lập các đặc trưng ảnh tròng mắt
- Nghiên cứu phương án cải thiện độ chính xác của hệ thống nhận dạng tròng mắt tại bước so khớp các mẫu đặc trưng và đưa ra quyết định Với nội dung này, luận
án đã xây dựng mô hình hệ thống nhận dạng tròng mắt sử dụng song song hai quá trình trích xuất bằng biến đổi Curvelet rời rạc và biến đổi DTCWT Sau đó, các đặc trưng Curvelet và DTCWT được xử lý và chuẩn hóa để phân loại một cách độc lập với nhau Trong bước so sánh đưa ra quyết định, các kết quả trên được kết hợp để đề xuất kết quả phù hợp nhất nhằm tăng tính chính xác của hệ thống
5 Phương pháp nghiên cứu
- Phương pháp thu thập thông tin, tài liệu, phân tích tổng hợp các công trình, bài báo khoa học đã công bố trên thế giới và trong nước Thu thập nguồn CSDL ảnh khuôn mặt và tròng mắt phổ biến, được chia sẻ bởi các tổ chức nghiên cứu uy tín nhằm sử dụng trong các bước thử nghiệm
- Nghiên cứu các kỹ thuật tiền xử lý như bù sáng ảnh màu, phân vùng ảnh bằng
Trang 18phương pháp đồ thị đa nguồn nhằm cải thiện chất lượng ảnh đầu vào, đồng thời kết hợp các phương pháp biến đổi số nhằm cải thiện hiệu năng nhận dạng khuôn mặt và tròng mắt người
- Kỹ thuật lập trình sử dụng ngôn ngữ lập trình C++, Python và ứng dụng công
nghệ tin học trong xây dựng chương trình thực hiện tính toán, mô phỏng chạy trên các vi xử lý đa nhân và trên các nhân tính toán của GPU Thực hiện mô phỏng, thực nghiệm, sau đó so sánh, kiểm chứng và phân tích nhằm minh họa hiệu quả đạt được
từ các kỹ thuật để xuất ở trên
6 Ý nghĩa khoa học và ý nghĩa thực tiễn của luận án
Ý nghĩa khoa học của luận án thể hiện ở các kết quả nghiên cứu được đề xuất, bao gồm các kỹ thuật tiền xử lý để tăng chất lượng ảnh đầu vào, kỹ thuật phân vùng ảnh tốc độ cao cũng như kỹ thuật kết hợp các phương pháp biến đổi rời rạc trong cùng một hệ thống Những đề xuất trên có thể cải thiện khả năng so sánh, đưa ra quyết định trên các kết quả biến đổi, từ đó nâng cao được phẩm chất hệ thống nhận dạng Kết quả nghiên cứu của luận án sẽ bổ sung thêm các kiến thức mới, là tài liệu tham khảo quan trọng trong việc nghiên cứu, phát triển và ứng dụng các kỹ thuật biến đổi Wavelet nói riêng và hệ thống nhận dạng sinh trắc học nói chung, phù hợp với xu hướng nghiên cứu hiện nay trên thế giới
Ý nghĩa thực tiễn của luận án thể hiện ở khả năng tính toán, chính xác cao của các phương pháp đề xuất Các kết quả nghiên cứu đạt được là phù hợp với xu thế phát triển của công nghệ và kỹ thuật hiện nay, do đó hoàn toàn thích hợp để áp dụng cho các hệ thống nhận dạng tròng mắt, khuôn mặt trong thực tế
7 Bố cục của luận án
Luận án gồm phần mở đầu, 3 chương nội dung, phần kết luận, Danh mục các công trình khoa học đã công bố liên quan đến luận án và Danh mục tài liệu tham khảo Cụ thể như sau:
- Mở đầu: Đánh giá tính cấp thiết của đề tài, ý nghĩa thực tế, ý nghĩa khoa học
của đề tài, tình hình nghiên cứu trong và ngoài nước liên quan đến đề tài Trên cơ sở
đó xác định phương pháp, nội dung nghiên cứu của luận án
- Chương 1 Tổng quan về nhận dạng sinh trắc học và các kỹ thuật biến đổi số
Trang 19trên ảnh đầu vào: Chương này trình bày tổng quan về hệ thống nhận dạng sinh trắc
học, các khối chức năng và ưu nhược điểm của các thuật toán tương ứng, trong đó đặc biệt đề cập sâu hơn tới các nội dung liên quan đến khối tiền xử lý Nội dung chương cũng đề cập đến tình hình nghiên cứu trong và ngoài nước, một số những vấn
đề thách thức trong sinh trắc học và ý tưởng tổng quan để khắc phục các vấn đề đó được đưa ra làm cơ sở cho những chương tiếp theo Một số CSDL phổ biến trong nhận dạng cũng với các đặc tính phân bố của chúng cũng được giới thiệu để góp phần minh họa cho các vấn đề kỹ thuật mà quá trình tiền xử lý ảnh cần giải quyết được Bên cạnh đó, các tham số cơ bản để phân tích, đánh giá phẩm chất hệ thống cũng được trình bày khái quát
- Chương 2 Các kỹ thuật tiền xử lý nhằm nâng cao hiệu quả cho hệ thống nhận dạng khuôn mặt và tròng mắt: Chương này đưa ra hai phương pháp kỹ thuật
tiền xử lý cho các ảnh đầu vào để nâng cao hiệu quả chung cho toàn hệ thống Phương pháp thứ nhất (SDWTL) thực hiện cân bằng ánh sáng hữu hiệu để nâng cao chất lượng ảnh trong không gian màu RGB ứng dụng trong nhận dạng mặt người Trước tiên, ảnh mặt người trong không gian màu RGB được phân tách thành ba kênh màu
và được biến đổi sang miền logarit Sau đó sử dụng biến đổi DWT để xác định các thành phần tần số thấp mang thông tin độ sáng của ảnh mặt người Các hệ số bù sáng tương ứng với ba kênh màu RGB sẽ được tính toán một cách tự động thông qua tỉ lệ các giá trị riêng lớn nhất của các ma trận hệ số biến đổi, tần số thấp của ba kênh màu
và tham chiếu Gauss Phương pháp thứ hai dựa trên việc cải tiến thuật toán tìm đường ngắn nhất Dijkstra đa nguồn ứng dụng trong phân vùng các bức ảnh đầu vào có kích thước lớn và có chứa nhiều đối tượng ảnh Các cải tiến cụ thể bao gồm việc tiền tính toán và xây dựng một đồ thị vô hướng liên kết tất cả các điểm ảnh và áp dụng quy tắc hiệu chỉnh nhãn cho thuật toán Dijkstra trên đồ thị đó nhằm tăng tốc độ tính toán các khoảng cách ngắn nhất từ các điểm ảnh nguồn đến tất cả các điểm ảnh còn lại
- Chương 3 Cải thiện độ chính xác trong nhận dạng bằng các kết hợp biến đổi số rời rạc: Trong chương này đề xuất hai hướng cải thiện để nâng cao độ chính
xác trong nhận dạng của hệ thống sinh trắc học tròng mắt Ở hướng thứ nhất, nghiên cứu sinh đã xây dựng phương pháp nhận dạng tròng mắt trên cơ sở sử dụng biến đổi
Trang 20nhanh rời rạc kết hợp thuật toán PCA và SVD Sau khi thực hiện các bước phân vùng tròng mắt, loại bỏ nhiễu và chuẩn hóa tròng mắt, biến đổi Curvelet được sử dụng để phân tích hình ảnh được chuẩn hóa, kết hợp với các thuật toán thống kê đặc trưng PCA và SVD để trích xuất và so sánh các đặc trưng có ích Ở hướng thứ thứ hai, nghiên cứu sinh đã xây dựng mô hình hệ thống nhận dạng tròng mắt với độ chính xác cao trong đó các biến đổi Curvelet rời rạc nhanh được kết hợp với các các thuật toán
sử dụng phương pháp thống kê Sau đó các điểm đối chiếu được tính toán và kết hợp dựa trên các khoảng cách Hamming và Euclid của các véc-tơ đặc trưng để đưa ra quyết định đối chiếu cuối cùng
- Kết luận: Khẳng định và nêu rõ những kết quả nghiên cứu đã đạt được trong
luận án; Chỉ ra những đóng góp khoa học mới của luận án; Đề xuất hướng ứng dụng
và phát triển của đề tài luận án
Trang 21Chương 1 TỔNG QUAN VỀ NHẬN DẠNG SINH TRẮC HỌC
VÀ CÁC KỸ THUẬT BIẾN ĐỔI SỐ TRÊN ẢNH ĐẦU VÀO
Chương 1 trình bày tổng quan về các hệ thống nhận dạng sinh trắc học phổ biến (bao gồm nhận dạng khuôn mặt và tròng mắt), các khối chức năng và ưu nhược điểm của các thuật toán tương ứng trong các hệ thống đó Bên cạnh đó, các tham số
cơ bản để phân tích, đánh giá phẩm chất hệ thống cũng được trình bày khái quát Cuối cùng, các công trình nghiên cứu tiêu biểu liên quan cũng như một số vấn đề thách thức còn tồn tại sẽ được tóm tắt lại để đưa ra một bức tranh tổng quát về tình hình nghiên cứu trong và ngoài nước, từ đó làm cơ sở cho những chương tiếp theo của luận án
1.1 Các hệ thống nhận dạng khuôn mặt và tròng mắt
Trong vài thập kỷ qua, bài toán nhận nhận dạng sinh trắc học nói chung và nhận dạng khuôn mặt, tròng mắt nói riêng luôn thu hút được sự quan tâm của các nhà nghiên cứu tại Việt Nam và trên thế giới Việc nhận dạng các cá nhân dựa trên các đặc điểm sinh trắc học có nhiều ưu điểm như không đòi hỏi đối tượng nhận dạng cần mang theo hoặc ghi nhớ thông tin đầu vào nên có nhiều ưu điểm hơn so với các phương pháp truyền thống (như dựa trên mật khẩu, mã PIN nhận dạng cá nhân, số chứng minh thư, số hộ chiếu) Mức độ bảo mật của các hệ thống nhận dạng sinh trắc học cũng cao hơn nhiều so với các phương pháp truyền thống ở trên vì việc nhận dạng được diễn ra tự động, thông tin đầu vào khó bị sao chép, giả mạo Hiện nay, các phương pháp sinh trắc học là một giải pháp đầy hứa hẹn, có tính tin cậy cao và đã được triển khai thành các hệ thống tự động để xác định hoặc xác minh danh tính của đối tượng Dauman [57] vào năm 1993 đã xây dựng một hệ thống nhận dạng tròng mắt hoàn chỉnh đầu tiên có khả năng áp dụng trong thực tế Hệ thống này hoạt động một cách ổn định với tốc độ và độ chính xác cao, là tiền đề để các công ty công nghệ (như IriScan, Iridian, Sensar, LG-Iris, Panasonic) có thể phát triển thành các sản phẩm thương mại ngày nay cung cấp cho người dùng [69]
Trang 22Hệ thống sinh trắc học có thể hoạt động dựa trên các đặc điểm sinh trắc học khác nhau như khuôn mặt, vân tay, tròng mắt, mạch máu Các đặc điểm phụ như giới tính, chủng tộc, màu mắt, màu da, các vết sẹo, hình xăm cũng có thể cung cấp một số thông tin định danh của một người Tuy nhiên, các đặc điểm phụ này không thể được coi là các bằng chứng xác thực để xác định chính xác danh tính, do đó chúng còn được gọi là các đặc điểm sinh trắc học mềm [42]
Một hệ thống sinh trắc học cơ bản bao gồm bốn khối chức năng chính như trong Hình 1.1 dưới đây:
Hình 1.1 Sơ đồ hệ thống sinh trắc học cơ bản
Khối tiếp nhận thông tin còn gọi là khối cảm biến sinh trắc học, có chức năng đảm bảo giao tiếp giữa người dùng và hệ thống sinh trắc học thông qua các thiết bị cảm biến hoặc đầu đọc/ghi Quá trình giao tiếp đó nhằm thu thập các thông tin về đặc điểm sinh trắc học từ đối tượng cần nhận dạng, sau đó biến đổi các thông tin đặc điểm
đó thành dạng thông tin số cung cấp cho khối chức năng tiếp theo Một máy ảnh kỹ thuật số có thể được sử dụng để chụp lại các mẫu ảnh của khu vực tròng mắt Hiệu quả hoạt động của toàn hệ thống sinh trắc học phụ thuộc rất nhiều vào chất lượng của các nguồn thông tin thu được này Trên thực tế, các nguồn thông tin này là kết quả của quá trình biến đổi các nguồn thông tin liên tục sang các dạng thông tin kỹ thuật
số dẫn đến các sai số hoặc thất thoát thông tin trong kết quả thu được Chất lượng của các thiết bị đọc, chất lượng môi trường và mức độ khả năng tương tác của người dùng cũng ảnh hưởng đến chất lượng của nguồn thông tin này trong hệ thống Trong một
Trang 23số hệ thống sinh trắc học, khối chức năng này có thể được liên kết với một quy trình kiểm tra chất lượng
Khối tiền xử lý và trích xuất đặc trưng thực hiện các thao tác tiền xử lý trên các đặc điểm sinh trắc học thu được ở khối trước để đạt được chất lượng như yêu cầu Các hoạt động tiền xử lý này có thể được chia thành ba bước Bước thứ nhất sẽ đánh giá chất lượng của đặc trưng sinh trắc học thu thập được, sau đó đối chiếu với các ngưỡng đã được xác định từ trước để quyết định tiếp tục thực hiện các thao tác xử lý tiếp theo hoặc cần thu thập lại đặc trưng sinh trắc học đó Bước tiếp theo sẽ thực hiện phân đoạn để tách các vùng ảnh chứa thông tin của đặc trưng ra khỏi các vùng nhiễu nền như là phát hiện vùng ảnh tròng mắt trong ảnh của toàn con mắt Cuối cùng, một
số thuật toán nâng cao chất lượng hình ảnh có thể được áp dụng trên vùng ảnh tách được ở trên để giảm thiểu các ảnh hưởng bởi nhiễu hoặc biến đổi cường độ nguồn sáng, qua đó cải thiện chất lượng lượng vùng ảnh đó Sau khi các thao tác tiền xử lý được áp dụng, một tập hợp hoặc một véc-tơ của các đặc trưng sẽ được trích xuất để gửi tới bước so khớp mẫu tiếp theo cho mục đích xác định danh tính hoặc để ghi danh lại trong CSDLcủa hệ thống như là một mẫu cho mục đích đối chiếu sau này
Khối so khớp mẫu thực hiện so sánh véc-tơ đặc trưng trích xuất được ở trên với tất cả các mẫu được lưu trước đó trong CSDL của hệ thống, sau đó đưa ra các điểm đánh giá tương đồng Các điểm đánh giá này là thước đo của các mức độ tương đồng (điểm càng cao thể hiện mức độ tương đồng càng lớn) hoặc của các mức độ khác biệt (điểm càng thấp thể hiện mức độ tương đồng càng lớn) giữa mẫu định danh
và các mẫu đối chiếu
Khối quyết định thực hiện các thao tác cuối cùng trong hệ thống sinh trắc học, trong đó danh định của đối tượng có thể được chấp nhận (cấp phép cho người dùng) hoặc bị từ chối (không cấp phép cho người dùng) dựa trên điểm đánh giá thu được trong khối so khớp mẫu
1.1.1 Hệ thống nhận dạng khuôn mặt
Nhìn chung, một hệ thống nhận dạng khuôn mặt gồm có bốn giai đoạn cơ bản (Hình 1.2) tương ứng với các khối trong một hệ thống sinh trắc học đã được mô tả
Trang 24khái quát ở trên Trong giai đoạn tiền xử lý, các quá trình chính bao gồm xác định khuôn mặt, căn chỉnh và chuẩn hóa độ sáng
Hình 1.2 Các khối chức năng trong hệ thống nhận dạng khuôn mặt
Xác định khuôn mặt và căn chỉnh (chuẩn hóa hình học) là các quá trình thiết yếu, có ảnh hưởng quan trọng tới hiệu quả trong các hệ thống nhận dạng khuôn mặt
tự động Các quá trình này có nhiệm vụ cung cấp một vùng ảnh khuôn mặt chứa thông tin nhận dạng cho giai đoạn trích xuất đặc trưng, sao cho các đặc trưng trích xuất có thể đảm bảo so sánh được với nhau Việc xác định được vùng ảnh khuôn mặt từ ảnh được chụp trong điều kiện ngẫu nhiên là một nhiệm vụ phức tạp Các công trình nghiên cứu như của Zhang và cộng sự [91] đã đưa ra các đánh giá toàn diện về các phương pháp xác định khuôn mặt được đề xuất trong những năm gần đây
Quá trình chuẩn hóa độ sáng nhằm mục đích loại bỏ sự chênh lệch độ sáng giữa các ảnh khác nhau, làm cho ảnh rõ nét hơn, qua đó giúp cho hệ thống thu được ảnh chứa đầy đủ đặc trưng cấu trúc của khuôn mặt người Các phương pháp được đề xuất để thực hiện chuẩn hóa độ sáng có thể được chia làm ba nhóm chính:
- Các phương pháp cân bằng ánh sáng ảnh mặt người [34], [59]
- Các phương pháp loại bỏ cường độ sáng, chỉ giữ lại các đặc trưng mang tính cấu trúc của khuôn mặt [80], [84]
- Các phương pháp thực hiện bù sáng trên các ảnh khuôn mặt màu, trong đó thông tin màu của ảnh khuôn mặt người được phân chia thành ba kênh màu RGB khác nhau [86]
Quá trình trích xuất các đặc trưng hữu ích từ các ảnh khuôn mặt có tầm quan trọng rất lớn đối với các hệ thống nhận dạng khuôn mặt Các phương pháp trích xuất
Trang 25đặc trưng được đề xuất trong những năm gần đây có thể được phân thành hai nhóm chính là các phương pháp toàn cục và các phương pháp cục bộ
Quá trình phân loại có mục đích so sánh các đặc trưng của hình ảnh khuôn mặt cần định danh với các đặc điểm trong các khuôn mẫu trong CSDLcủa hệ thống, sau
đó đưa ra các quyết định dựa trên các chỉ số đánh giá mức độ tương đồng Đối với các hệ thống nhận dạng khuôn mặt, các phân loại nhị phân [15], [16] thường được sử dụng hoạt động dựa trên các điểm đánh giá, trong đó đầu vào của các phân loại này
là chỉ số điểm tương đồng (khoảng cách Euclid, độ tương tự cô-sin) của hai véc-tơ đặc trưng cần so sánh
1.1.2 Hệ thống nhận dạng tròng mắt
Hệ thống nhận dạng dựa trên tròng mắt là một trong những hệ thống sinh trắc học chính xác nhất dựa trên số lượng lớn các chi tiết nhận dạng tập trung tại bộ phận tròng mắt của đối tượng cần nhận dạng Các chi tiết đó duy trì ổn định trong suốt cuộc đời giúp cho việc nhận dạng tròng mắt có tính ổn định và tin cậy cao Chúng ta có thể coi lịch sử ra đời và phát triển của các hệ thống nhận dạng tròng mắt được bắt đầu từ thế kỉ 19 dựa trên công trình "Identification anthropométrique" của Alphonse Bertillon vào năm 1893 Trong công bố của mình, Bertillon đã sử dụng yếu tố màu sắc của mắt người như là một công cụ định danh trên các đối tượng nghiên cứu Trải qua quá trình dài nghiên cứu và cải tiến, các hệ thống nhận dạng tròng mắt hiện đại
và có độ tin cậy cao đã được xây dựng hoàn chỉnh và ứng dụng trong thực tế Tại Việt Nam, lĩnh vực sinh trắc học nói chung và nhận dạng tròng mắt nói riêng đang dần trở thành một trong những lĩnh vực được quan tâm đầu tư nghiên cứu [6], [9]
Hình 1.3 Cấu trúc bề mặt mắt người
Trang 26Nói một cách tổng thể, mắt người có thể có các sắc tố khác nhau như đen, nâu, xám, xanh nước biển, v.v Tuy nhiên, bộ phận bề mặt mắt người luôn được cấu tạo
từ những phần nhất định không đổi (Hình 1.3) Phần con ngươi là phần hình cầu trung tâm và luôn có màu sắc sẫm nhất và đồng nhất so với các phần khác của tròng mắt Phần tròng mắt là khu vực nằm giữa tách biệt hai phần con ngươi và giác mạc Thông thường, phần diện tích tròng mắt được sử dụng trong sinh trắc học được giới hạn bởi hai đường tròn là đường tròn bao ngoài của phần con ngươi và đường trong bao ngoài của phần bề mặt có chứa nhiều các chi tiết mẫu dày đặc
Trong Hình 1.3, chúng ta có thể thấy rằng phần tròng mắt của con người có chứa rất nhiều các mẫu nhận dạng tương tự như các mẫu hoa văn liên kết với nhau hoặc nằm xen kẽ với nhau thành các nếp và nổi bật so với phần nền màu trắng đục nhờ các đặc trưng về sắc tố tròng mắt của riêng từng người Các nhà khoa học đã chỉ
ra rằng các chi tiết mẫu trên được hình thành một cách ngẫu nhiên ngay từ giai đoạn thai kỳ khi bộ phận mắt người bắt đầu được hình thành và phát triển Các chi tiết mẫu này ở mỗi người có sự khác nhau, thậm chí ở trên cũng một người thì các chi tiết mẫu
ở mắt phải cũng khác so với ở mắt trái Ngoài ra, các chi tiết mẫu trong khu vực tròng mắt người có thế sử dụng cho nhận dạng còn có một đặc tính quan trọng khác là chúng không chịu ảnh hưởng của các thay đổi do yếu tố môi trường xung quanh [19]
Hình 1.4 Sơ đồ các khối chức năng trong hệ thống nhận dạng tròng mắt
Trang 27Một quá trình nhận dạng tròng mắt cơ bản sẽ bao gồm các giai đoạn chính như trong Hình 1.4 Trong giai đoạn đầu tiên tiếp nhận ảnh đầu vào, các hình ảnh đầu vào
sẽ được cung cấp bởi các thiết bị chụp ảnh cùng với các trang phụ kiện hỗ trợ Chất lượng, kích thước ảnh đầu vào có thể thay đổi phụ thuộc vào đặc tính kỹ thuật của thiết bị chụp, các yếu tố môi trường xung quanh như cường độ ánh sáng, khoảng cách chụp, v.v Giai đoạn thứ hai là giai đoạn xử lý ảnh đầu vào, thường được chia thành hai bước nhỏ Trong bước đầu tiên còn được gọi là bước phân vùng ảnh, các phân vùng ảnh thuộc phần tròng mắt phục vụ cho mục đích nhận dạng sẽ được tách riêng
ra khỏi bức ảnh đầu vào, các phân vùng còn lại sẽ bị loại bỏ nhằm giảm kích thước
dữ liệu cần xử lý, tăng tính hội tụ của kết quả nhận dạng Thông thường kết quả đầu
ra của bước phân vùng ảnh sẽ là một phân vùng ảnh dạng vành khăn kín Bước tiếp theo còn được gọi là bước chuẩn hóa hình ảnh Trong bước này, phân vùng ảnh dạng vành khăn trên sẽ được biến đổi từ hệ tọa độ Cartersian thành một phân vùng ảnh hình chữ nhật tương ứng trong hệ tọa độ cực Kích thước của phân vùng ảnh hình chữ nhật này đã được lựa chọn thống nhất từ trước cho tất cả các ảnh đầu vào Ngoài ra các kỹ thuật tiền xử lý ảnh khác [9], [12] cũng có thể được sử dụng nhằm bù sáng, khử nhiễu cho ảnh đầu vào trước khi thực hiện quá trình thứ hai, qua đó tăng thêm hiệu quả của các bước phân vùng, chuẩn hóa ảnh và các giai đoạn tiếp theo Phân vùng ảnh đã chuẩn hóa sẽ được sử dụng như là dữ liệu đầu vào cho giai đoạn thứ ba còn được gọi là giai đoạn trích lọc đặc trưng Đối với mỗi một đối tượng nhận dạng, chúng ta sẽ có số đặc trưng khác nhau (do kích thước ảnh đầu vào, do đặc tính kỹ thuật của thiết bị chụp ảnh, do đặc điểm cá nhân) và số lượng các đặc trưng này là rất lớn Giai đoạn trích lọc đặc trưng sẽ chọn ra một số lượng nhỏ hơn các đặc trưng phù hợp với bài toán nhận dạng cụ thể và lưu chúng vào một vec-tơ đặc trưng Việc đưa
ra thuật toán lựa chọn và các tiêu chuẩn đánh giá đặc trưng phù hợp là một trong những nội dung được quan tâm, nghiên cứu nhiều nhất trong toàn bộ quá trình nhận dạng tròng mắt Trong giai đoạn cuối cùng là kết nối so sánh, các véc-tơ đặc trưng sẽ được so sánh với các mẫu lấy từ CSDL Sau đó hệ thống sẽ dựa trên mức độ trùng lặp mà đưa ra các xác nhận định danh của đối tượng cần được nhận dạng
Trang 281.1.2.1 Giai đoạn tiếp nhận ảnh
Mục đích của giai đoạn này nhằm đạt được các ảnh 2D của mắt người Hầu hết các hệ thống nhận dạng tròng mắt đều sử dụng các cảm biến rất nhạy với ánh sáng
có phổ tần điện từ trong khoảng cận hồng ngoại NIR (700-900nm) để có thể tái hiện lại những đặc trưng quan trọng nhất của tròng mắt [30] Một trong những ưu thế lớn nhất của NIR so với các dạng ánh sáng có bước sóng ngắn có thể nhìn thấy được là các bước sóng dài như NIR có thể loại bỏ được yếu tố màu sắc tròng mắt khác nhau
do sự khác biệt về chủng tộc
Ngược lại, việc chụp các ảnh tròng mắt sử dụng các ánh sáng có bước sóng trong khoảng nhìn thấy được có thể đảm bảo các ảnh có độ chi tiết rất cao, tuy nhiên các ảnh đó sẽ bị ảnh hưởng mạnh bởi các thành phần gây nhiễu [63] từ các nguyên nhân như phản xạ, tán xạ, đổ bóng Để có thể tận dụng được các ưu thế của cả hai nhóm bước sóng trên, các hệ thống nhận dạng tròng mắt có thế sử dụng các ảnh đa phổ tần như được đề xuất trong [20] Thông thường, các ảnh tròng mắt cần được chụp với độ phân giải (kích thước) mỗi chiều tối thiểu từ 100 đến 200 điểm ảnh trở lên và khoảng cách chụp tối đa từ 15cm đến 46cm để bảo đảm quá trình nhận dạng đạt được
độ chính xác cao [19] Đặc biệt, một số hệ thống nhận dạng có sử dụng các camera với độ phân giải rất cao như SARNOFF, LG, PANASONIC hoặc OKI nên có thể mở rộng khoảng cách chụp lên tới 3 mét [54] Ngoài ra các hệ thống còn có thể sử dụng đồng thời nhiều camera với các góc chụp khác nhau và sau đó lựa chọn ảnh có chất lượng tốt nhất để chuyển tiếp sang giai đoạn sau Nhìn chung, để nâng cao chất lượng ảnh tròng mắt, chúng ta có thể thực hiện cải tiến hệ thống trang thiết bị phần cứng [54] hoặc sử dụng các thuật toán phần mềm xử lý thông minh [62] Hướng sử dụng các thuật toán phần mềm xử lý để quản lý chất lượng ảnh trong giai đoạn tiếp theo có
ưu thế hơn về tính linh hoạt, không làm tăng độ phức tạp, kích thước và chi phí cho
hệ thống phần cứng Các nội dung khái quát hơn về các hệ thống để xây dựng hình ảnh tròng mắt có thể được tham khảo thêm trong [49]
Những bức ảnh tròng mắt đạt được từ hệ thống chụp ảnh trên được tập hợp lại
để xây dựng thành các tập CSDL ảnh tròng mắt với các đặc tính riêng khác nhau Đặc điểm phân bố cùng mức độ phong phú của các ảnh trong các CSDL này là nhân tố có
Trang 29ảnh hưởng quan trọng đến độ chính xác của kết quả nhận dạng Nội dung khái quát
về các tập CSDL ảnh phổ biến trong nhận dạng khuôn mặt và tròng mắt sẽ được trình bày chi tiết hơn trong phần kết quả mô phỏng ở các chương sau
1.1.2.2 Giai đoạn xử lý ảnh
Thông thường, các ảnh tròng mắt sẽ chứa cả những chi tiết ảnh không cần thiết như mí mắt, lông mi, võng mạc, con ngươi và một số phần diện tích da mặt khác Ngoài ra, dưới ảnh hưởng các các yếu tố khoảng cách chụp ảnh, vị trí nguồn sáng cũng có thể gây biến động về kích thước và hình dáng của khu vực tròng mắt trong ảnh Do đó, sau khi có được các ảnh nguyên bản chụp tròng mắt từ giai đoạn trước, một số bước tiền xử lý cần thiết sẽ được thực hiện trên các bức ảnh đó để tách ra các đặc trưng của tròng mắt Để đảm bảo tính đồng nhất khi thực thi các thuật toán, chỉ một khu vực chứa các thông tin nhận dạng quan trọng nhất của tròng mắt được tách
ra và chuẩn hóa theo hình dạng và kích thước cố định từ trước [30]
Trong giai đoạn này, thông qua các kỹ thuật phân tích khác nhau, các đặc tính ảnh (các khu vực nhám, mịn, mượt hoặc mấp mô) được tách ra khỏi ảnh tròng mắt đã được chuẩn hóa để tạo thành mẫu sinh học phục vụ cho giai đoạn so khớp mẫu phía sau Các kỹ thuật phân tích phổ biến sử dụng trong các hệ thống nhận dạng có thể được chia thành các nhóm chính như sau:
Bộ lọc Gabor:
Đây là một hàm tuyến tính thích hợp cho mục đích biểu diễn và phân biệt các kết cấu đặc trưng Bộ lọc Gabor được sử dụng với các nội dung ảnh có tần số khác nhau theo các hướng riêng trong một khu vực cục bộ bao quanh một điểm cho trước [45] Bộ lọc Gabor hai chiều được định nghĩa như là kết quả nhân kết hợp từ một hàm điều hòa hình sin với hàm Gauss, trong đó các hướng trực giao được biểu diễn bởi số phức gồm một thành phần thực và một thành phần ảo [38]
Biến đổi Wavelet:
Trong biến đổi Wavelet, ảnh tròng mắt đã chuẩn hóa được phân tách thành các thành phần với độ phân giải khác nhau Sau đó các đặc trưng trong ảnh sẽ được tìm kiếm trên miền tần số và không gian thông qua một tập hợp các bộ lọc với các kích thước cửa sổ khác nhau
Trang 30Một số dạng biến đổi Wavelet tiêu biểu đã được đề xuất và sử dụng phổ biến trong các hệ thống nhận dạng tròng mắt có thể kể tên là Daubechies, Haar, Biorthogonal và Mexican Hat [30], [57]
Biến đổi cô-sin rời rạc:
Dạng biến đổi này giúp phân chia ảnh tròng mắt đã chuẩn hóa thành các dải phổ nhỏ được tính toán bằng hàm cô-sin Sau đó độ chênh lệch của các hệ số cô-sin được tính toán để tạo thành mẫu nhị phân sử dụng cho giai đoạn tiếp theo [55]
1.1.2.3 So khớp mẫu
Trong giai đoạn này, các mẫu sẽ được so sánh với các CSDL để tìm ra sự tương đồng giữa hai mẫu (mẫu cần nhận dạng và mẫu để đối chiếu) dựa trên các thuật toán so khớp khác nhau [49] Một số kỹ thuật so khớp mẫu tiêu biểu được sử dụng trong các hệ thống nhận dạng tròng mắt như sau:
Khoảng cách Hamming:
Khoảng cách Hamming giữa hai mẫu nhị phân được tính toán bởi số cặp bit nhị phân tương ứng có giá trị khác nhau từ hai mẫu đó Giá trị khoảng cách Hamming càng nhỏ có nghĩa là hai mẫu được so sánh có sự tương đồng càng lớn Khoảng cách bằng 0 đồng nghĩa với việc hai mẫu hoàn toàn trùng lặp nhau [30]
Giả thiết C là một tập con của không gian A n gồm các mẫu có kích thước n Với u=(u 1 , u 2 , , u n ) và v=(v 1 , v 2 , , v n ) thuộc C, khi đó khoảng cách Hamming d(u,v)
giữa u và v được xác định bằng số lượng các cặp thành phần tương ứng từ u và v có giá trị khác nhau, nghĩa là u i ≠ v i , i = 1, 2, , n
Như vậy, khoảng cách Hamming có thể coi là một thước đo sử dụng trong C
để đánh giá mức độ khác biệt và tính đồng nhất, v.v Nếu khoảng cách Hamming
nhỏ nhất giữa các mẫu trong C là δ và vùng lân cận của một mẫu r ∈ C được xác
định là R Khi đó một quá trình mã hóa/giải mã hóa có thể phát hiện mẫu sai trong phạm vi lân cận tối đa R = δ -1 và có thể sửa chữa mẫu sai trong phạm vi lân cận
Kỹ thuật so khớp mẫu dựa trên khoảng cách Hamming có ưu điểm lớn về tốc
độ thực thi do việc tính toán dựa trên các toán tử so sánh bit nhị phân rất đơn giản và
Trang 31có thể song song hóa
Khoảng cách Euclid có trọng số:
Kỹ thuật này được áp dụng đánh giá sự tương đồng của hai mẫu dựa trên các cặp giá trị số nguyên tương ứng trong hai véc-tơ Khoảng cách Euclid trên được sử dụng cho giải thuật KNN, trong đó một mẫu cần nhận dạng được so sánh với đồng thời nhiều mẫu có sẵn trong CSDL Chỉ những mẫu có sẵn có khoảng cách nhỏ hơn ngưỡng tối thiểu cho trước mới được sử dụng lại cho các vòng so sánh tiếp theo [44]
Giả thiết u, v là hai mẫu của không gian A n của các mẫu có kích thước n Với
u=(u 1 , u 2 , , u n ) và v=(v 1 , v 2 , , v n ) Khi đó, khoảng cách Euclid có trọng số giữa
Hình 1.5 Ảnh khuôn mặt với các thái độ biểu cảm trong CSDL CMU Multi-PIE
b) CSDL FERET
CSDL ảnh FERET [58] được phát triển để đánh giá hiệu năng của các thuật
Trang 32toán có thể tự động định vị, chuẩn hóa và nhận dạng khuôn mặt trong các CSDL Quá trình kiểm tra bao gồm ba bước kiểm tra nhỏ, mỗi bước thực hiện với một tập hợp ảnh khác nhau Bước kiểm tra đầu tiên nhằm đánh giá khả năng của các thuật toán khi phát hiện gương mặt từ một nhóm 316 đối tượng khác nhau Bước kiểm tra thứ hai nhằm kiểm tra các phát hiện sai, khi đó các thuật toán không phát hiện được nếu đối tượng không nằm trong nhóm đối tượng ban đầu Bước kiểm tra cuối cùng nhằm đánh giá ảnh hưởng của các yếu tố thay đổi vị trí lên hiệu quả hoạt động của thuật toán Phiên bản cuối cùng của CSDL ảnh FERET áp dụng các giao thức kiểm tra mới, trong đó các thuật toán nhận dạng được yêu cầu đánh giá một tập hợp 3323 ảnh so với một tập hợp gồm 3816 ảnh Hay nói cách khác, các thuật toán cần thực hiện khoảng 12,6 triệu lượt đối chiếu Giao thức mới cho phép xác định được các điểm hiệu năng đối với nhiều tập hợp ảnh và đối tượng kiểm tra, sau đó đưa ra các phân tích kết quả cụ thể về ảnh hưởng của các yếu tố nguồn chiếu sáng, thời tiết môi trường xung quanh, thay đổi diện mạo khuôn mặt theo thời gian FERET chứa tổng cộng 14.126 bức ảnh khuôn mặt của 1199 đối tượng khác nhau
1.1.3.2 Các CSDL dùng cho nhận dạng tròng mắt
a) CSDL CASIA-IrisV3
CSDL ảnh CASIA IrisV3 [40] bao gồm các tập Iris-Interval, Iris-Twins và CASIA-Iris-Lamp, trong đó tổng cộng có 22.034 bức ảnh mắt được chụp từ khoảng 700 đối tượng bằng máy chiếu NIR CASIA-Iris-Interval chứa 2639 bức ảnh được lưu dưới định dạng JPEG từ 249 đối tượng được chụp bằng các máy quay cận cảnh kết hợp với các máy chiếu NIR Độ phân giải của các bức ảnh là 320x280 điểm ảnh CASIA-Iris-Twins bao gồm 3118 bức ảnh chụp từ 100 cặp sinh đôi, hầu hết là trẻ em Các bức ảnh có độ phân giải 640x480 điểm ảnh CASIA-Iris-Lamp chứa 16.212 bức ảnh có độ phân giải 640x480 điểm ảnh chụp từ 411 đối tượng riêng biệt Trong quá trình chụp, một đèn chiếu gần với đối tượng được chuyển giữa các chế độ bật và tắt để tạo thành sự thay đổi của điều kiện môi trường chụp
CASIA-Nhìn chung, CSDL ảnh CASIA-IrisV3 chứa các ảnh chịu ảnh hưởng của các yếu tố phi lý tưởng, bao gồm các hiệu ứng phản xạ, độ tương phản thấp, góc nghiêng,
Trang 33các đường biên không tròn, mắt mở hờ, lông mi tự nhiên/trang điểm, tóc, nhòe, nguồn sáng không đồng bộ, mi mắt, kính mắt và kính áp tròng
Hình 1.6 Ảnh tròng mắt trong CSDL CASIA-IrisV3
b) CSDL ICE 2005
CSDL ICE 2005 được phát triển bởi NIST [83] Nó bao gồm 2953 bức ảnh chụp từ 132 đối tượng sử dụng cảm biến LG EOU 2200 kết hợp với các nguồn sáng NIR Các bức ảnh có độ phân giải 480x460 điểm ảnh Một số ảnh bị nhiễu bởi các yếu tố như mi mắt, lông mi, mất nét, biến dạng phi tuyến tính, mắt bị nghiêng Trong các bức ảnh có chất lượng tốt, đường kính tròng mắt có giá trị hơn 200 điểm ảnh
CSDL ICE 2005 có thể được phân thành hai tập ảnh chính là ảnh mắt phải và ảnh mắt trái Kết quả nhận dạng thử nghiệm từ 12 thuật toán nhận dạng tròng mắt khác nhau cho 9 nhóm đối tượng đã được nhóm tác giả của CSDL tập hợp và phân tích, so sánh Đối với các mắt phải, tỉ lệ nhận dạng thành công có thể lên tới trên 99,5% Đối với các ảnh mắt trái, tỉ lệ này dao động từ 99% đến 99,5% ICE 2005 là CSDL ảnh đầu tiên thể hiện mối tương quan trong nhận dạng giữa mắt phải và mắt trái của cùng một đối tượng
Hình 1.7 Ảnh tròng mắt với chất lượng ảnh tốt trong CSDL ICE 2005
c) UBIRIS
CSDL UBIRIS [61] được phát triển riêng cho các hệ thống mô phỏng không
Trang 34giới hạn Nó bao gồm 11.102 bức ảnh tròng mắt được chụp từ 261 đối tượng sử dụng nguồn sáng với bước sóng thấy được Các yếu tố phi lý tưởng được điều chỉnh giống như trong thực tế, ví dụ như khoảng cách, tính di động (tốc độ thấp) Các đối tượng chụp ảnh chủ yếu là người da trắng (khoảng 90%), da đen (8%) và người châu Á (2%) Các bức ảnh được lưu dưới định dạng TIFF với độ phân giải 300×400 điểm ảnh Các yếu tố nhiễu chủ yếu trong đó bao gồm mắt nhắm, độ phân giải thấp, phản
Quá trình chuẩn hóa độ sáng nhằm mục đích loại bỏ sự chênh lệch độ sáng giữa các ảnh khác nhau, làm cho ảnh rõ nét hơn, qua đó giúp cho hệ thống thu được ảnh chứa đầy đủ các thông tin đặc trưng cấu trúc khuôn mặt người Các phương pháp được đề xuất để thực hiện chuẩn hóa độ sáng có thể được chia làm ba nhóm chính:
- Các phương pháp cân bằng ánh sáng ảnh mặt người [34], [59]
- Các phương pháp loại bỏ cường độ sáng, chỉ giữ lại các đặc trưng mang tính cấu trúc của khuôn mặt [80], [84]
- Các phương pháp thực hiện bù sáng trên các ảnh khuôn mặt màu, trong đó thông tin màu của ảnh khuôn mặt người được phân chia thành ba kênh màu RGB khác nhau [86]
Quá trình trích xuất các đặc trưng hữu ích từ các ảnh khuôn mặt có tầm quan
Trang 35trọng rất lớn đối với các hệ thống nhận dạng khuôn mặt Các phương pháp trích xuất đặc trưng được đề xuất trong những năm gần đây có thể được phân thành hai nhóm chính là các phương pháp toàn cục và các phương pháp cục bộ
Quá trình phân loại có mục đích so sánh các đặc trưng của hình ảnh khuôn mặt cần định danh với các đặc điểm trong các khuôn mẫu trong CSDLcủa hệ thống, sau
đó đưa ra các quyết định dựa trên các chỉ số đánh giá mức độ tương đồng Đối với các hệ thống nhận dạng khuôn mặt, các phân loại nhị phân [15], [16] thường được sử dụng hoạt động dựa trên các điểm đánh giá, trong đó đầu vào của các phân loại này
là chỉ số điểm tương đồng (khoảng cách Euclid, độ tương tự cô-sin) của hai véc-tơ đặc trưng cần so sánh
1.2.2 Tiền xử lý ảnh tròng mắt
Thông thường, các ảnh tròng mắt sẽ chứa cả những chi tiết ảnh không cần thiết như mí mắt, lông mi, võng mạc, con ngươi và một số phần diện tích da mặt khác Ngoài ra, dưới ảnh hưởng các các yếu tố khoảng cách chụp ảnh, vị trí nguồn sáng cũng có thể gây biến động về kích thước và hình dáng của khu vực tròng mắt trong ảnh Do đó, sau khi có được các ảnh nguyên bản chụp tròng mắt từ giai đoạn trước, một số bước tiền xử lý cần thiết sẽ được thực hiện trên các bức ảnh đó để tách ra các đặc trưng của tròng mắt Để đảm bảo tính đồng nhất khi thực thi các thuật toán, chỉ một khu vực chứa các thông tin nhận dạng quan trọng nhất của tròng mắt được tách
ra và chuẩn hóa theo hình dạng và kích thước cố định từ trước [30] Giai đoạn xử lý ảnh có thể được chia thành ba bước chính như sau:
1.2.2.1 Quản lý chất lượng
Chất lượng các ảnh tròng mắt có vai trò quan trọng do hiệu quả hoạt động của
cả hệ thống nhận dạng có thể bị ảnh hưởng bởi yếu tố các ảnh đầu vào có chất lượng thấp Bước quản lý chất lượng được đề xuất cho hai mục đích chính là phát hiện các ảnh kém chất lượng và sử dụng một thông số điểm chất lượng trong giai đoạn so sánh sau này để cải thiện hiệu quả hoạt động [26] Các tiêu chuẩn đặc trưng cùng các phương pháp định lượng tương ứng để mô tả đặc tính và đánh giá chất lượng các ảnh tròng mắt được trình bày theo chuẩn ISO/IEC 29794-6:2015 [41]
Trang 36Các thành phần cơ bản trong ảnh tròng mắt thường bao gồm các phần như trong Hình 1.8: lông mi (1), ánh sáng phản xạ (2, 3), mí mắt (4) và con ngươi (5) Nhìn chung, các ảnh tròng mắt thường có độ sáng không đồng nhất và độ tương phản thấp Những yếu tố gây nhiễu có thể xuất hiện do ảnh hưởng của cường độ và vị trí các nguồn ánh sáng Do đó các giải pháp cải thiện chất lượng ảnh cần được áp dụng nhằm giảm thiểu các ảnh hưởng của nhiễu
Hình 1.8 Các yếu tố nhiễu trong ảnh đầu vào
1.2.2.2 Phân đoạn
Phân đoạn hay còn được gọi là định vị sẽ xác định vị trí của tròng mắt và tách
nó ra khỏi các cấu trúc lân cận xung quanh như là võng mạc, con ngươi, mí mắt, lông
mi Vị trí của các đường bao trong và bao ngoài của tròng mắt, thường được nhắc đến như là đường bao con ngươi và đường bao rìa, có thể được biểu diễn bằng một số cách khác nhau Cách tiếp cận trực quan nhất chính là xem xét hai đường bao trên như là một hình vòng tròn Phương pháp phân đoạn bằng toán tử vi tích phân Daugman [57] được sử dụng rất rộng rãi để xác định hình vòng tròn trong đó giá trị của các điểm ảnh thay đổi nhiều nhất theo hướng bán kính Một lựa chọn phổ biến khác cho mục đích phân đoạn là sử dụng biến đổi hình tròn Hough [50] Thay vì được coi như là một hình đĩa tròn, các đường bao tròng mắt còn có thể được biểu diễn theo
mô hình đường bao động [67] Một trong những cách tiếp cận đầu tiên sử dụng kỹ thuật này được đề xuất trong [66] Ngoài ra, một số đề xuất xấp xỉ hóa tương ứng cũng được đưa ra nhằm giải quyết bài toán phân đoạn như là sử dụng toán tử Daugman cho các đường bao động kết hợp với các hệ số mở rộng Fourier [39] hoặc
sử dụng khoảng cách trắc địa cho các đường bao động [73]
Trang 37Khu vực tròng mắt trong ảnh đầu vào được định vị bằng cách xác định các điểm cạnh, sau đó các đường biên được hình thành dưới dạng một đường bao kín hình tròn Trong thực tế, con ngươi mắt luôn là khu vực ảnh tối nhất trong phần nhãn
cầu, do đó chúng ta có thể sử dụng phân tích histogram trên ảnh đầu vào I để thực
hiện định vị phần ảnh đó Bằng cách thiết lập một giá trị ngưỡng tại điểm cực tiểu lớn hơn và tiệm cận tới giá trị cực đại của mức cường độ sáng thấp nhất, khu vực ảnh con ngươi có thể được xác định một cách tương đối chính xác Các thành phần có kích thước nhỏ sẽ được loại bỏ bằng các bộ lọc theo từng vùng con để từ đó nhận được ảnh I Các vị trí tâm và giá trị bán kính của đường bao phía trong tròng mắt được B
xác định thông qua phương pháp biến đổi đường tròn giới hạn Hough (RCHT) [50] cho các điểm biên của ảnh I B
Hình 1.9 Kết quả định vị tròng mắt
Chúng ta có thể áp dụng phương pháp RCHT cho tất cả các điểm ảnh ở biên của khu vực ảnh hình vuông với vị trí trung tâm như trên để nhận được đường bao tròn phía ngoài của khu vực ảnh tròng mắt Phần diện tích ảnh tròng mắt chúng ta quan tâm chính là phần phân vùng ảnh được giới hạn bởi hai đường bao tròng phía trong và phía ngoài của tròng mắt như trong Hình 1.9
1.2.2.3 Chuẩn hóa
Như phân tích ở trên, chúng ta đã biết rằng do nhiều nguyên nhân khác nhau như sự thay đổi cường độ nguồn chiếu sáng, góc nghiêng của ảnh tròng mắt, v.v , hình dạng của con ngươi mắt có thể như bị biến dạng, giãn nở Do đó thường các ảnh tròng mắt sẽ không đồng nhất và có kích thước khác nhau Quá trình chuẩn hóa được
áp dụng để biến đổi phân vùng ảnh tròng mắt đã được định vị từ các ảnh đầu vào về một định dạng kích thước không đổi chọn trước Cụ thể, phân vùng ảnh tròng mắt từ dạng vòng tròn sẽ được ánh xạ về dạng một hình tứ giác, hay nói cách khác các điểm
Trang 38ảnh trong phân vùng ảnh tròng mắt dạng hình tròn sẽ được ánh xạ sang một hệ tọa độ hai chiều khác Cụ thể hơn, quá trình chuẩn hóa sẽ ánh xạ phần ảnh tròng mắt hình tròn từ hệ tọa độ Carter vào trong một hệ tọa độ cực Kết quả sau ánh xạ là một cấu trúc hình chữ nhật với các kích thước đã được xác định sẵn từ trước để tránh các biến đổi của kích thước và tính cân đối ban đầu của các đặc trưng
Sau chuẩn hóa, các hình dạng mẫu được chuyển đổi từ hệ tọa độ Cartersian ban đầu I x y( , ) sang một hệ tọa độ cực chuẩn hóa tương ứngI r( , ) Mối liên hệ giữa các hệ tọa độ trên được mô tả trong các công thức ánh xạ dưới đây:
Hình 1.10 Kết quả chuẩn hóa phân vùng ảnh tròng mắt
Phân vùng ảnh tròng mắt hình tứ giác với hướng tâm r và góc thu được sau các phép ánh xạ theo các công thức trên và được chuẩn hóa sẽ có dạng như trong Hình 1.10
1.3 Các phép biến đổi số trong xử lý ảnh
Trong xử lý ảnh sinh trắc học, mục tiêu của các phép biến đổi là xây dựng một cách biểu diễn hiệu quả của nội dung tín hiệu, thông thường dưới dạng một tập hợp các hệ số Một phương pháp biểu diễn một cách hiệu quả có thể giúp cho xử lý dữ liệu ảnh như khử nhiễu, nén và giải nén được thực hiện một cách hiệu quả Biến đổi Fourier và các biến thể của nó như biến đổi cô-sin rời rạc DCT là một trong những biến đổi phổ biến nhất để biểu diễn thưa dữ liệu trên một miền tần số Một hạn chế lớn của các phép biến đổi Fourier là chúng không thể hiện được mối liên hệ tương
Trang 39ứng giữa các tần số với tọa độ không gian Các biến đổi Wavelet được đề xuất để khắc phục hạn chế trên bằng cách chia tín hiệu thành các dải tần khác nhau và mỗi dải tần sẽ được phân tích một cách cục bộ Từ các Wavelet, chúng ta có thể tạo thành nhiều tập hợp các hệ số trong đó mỗi tập hợp chứa những thông tin của miền không gian liên quan đến từng dải tần Các phép biến đổi Wavelet đa số hoạt động theo cơ chế không thích ứng và không phụ thuộc vào nội dung của tín hiệu Trong không gian 2D hoặc nhiều chiều hơn, các Wavelet được phân chia theo dạng các hình vuông hoặc hình chữ nhật với kích thước khác nhau Tuy nhiên cách phân chia như vậy dẫn đến những hạn chế về khả năng lựa chọn có hướng cho các Wavelet Biến đổi Curvelet
và các dạng biến đổi có hướng khác sẽ cho phép định hướng cho các dải tần số khác nhau trong miền tần số
1.3.1 Các biến đổi không thích nghi
1.3.1.1 Biểu diễn trên miền thời gian-tần số
Biến đổi Fourier tiêu chuẩn thường thích hợp để sử dụng cho nghiên cứu về các thuộc tính không phụ thuộc vào thời gian Tuy nhiên, trong rất nhiều các ứng dụng chúng ta sẽ cần biết các tính chất của tín hiệu phụ thuộc cục bộ vào thời gian Biến đổi Fourier thời gian ngắn (STFT) nhân hàm số cần biến đổi với một cửa sổ khác 0 trong một khoảng thời gian ngắn để nhận được các thông tin về tần số của vùng tín hiệu đó Biến đổi Gabor là một trường hợp đặc biệt của STFT sử dụng hàm cửa sổ Gauss:
với x( ) là tín hiệu, t và là các chỉ số thời gian và tần số của biểu diễn thời gian-tần
số Thông tin tham khảo mở rộng về các biểu diễn trên miền thời gian-tần số có thể tìm thấy trong các công bố như [60]
Một trong những hạn chế quan trọng của biến đổi Gabor và STFT là kích thước bậc cố định của các cửa sổ Các Wavelet được đề xuất như là các hàm số cung cấp một phương pháp có hệ thống để phân chia dữ liệu thành các miền tần số khác nhau, sau đó nhân từng miền với một cửa sổ khuếch đại tương ứng Việc phân chia các nội dung tần số sẽ phụ thuộc vào khoảng tần số Các băng tần cao hơn được ghép cặp với
Trang 40các cửa sổ kích thước lớn Các biến đổi Wavelet của một tín hiệu x t( ) trong miền 1D
có thể được mô tả bằng công thức sau:
với a và b tương ứng là các tham số tỉ lệ và dịch chuyển, là hàm số Wavelet
1.3.1.2 Biến đổi Wavelet hai chiều
Các hệ số Wavelet của một hình ảnh đầu vào được tính toán bằng các ứng dụng các bộ lọc băng thấp và băng cao trong miền không gian 1D Các tổ hợp giá trị
L và H trong mỗi hình vuông đại diện cho các bộ lọc được sử dụng để tạo thành các
hệ số Giá trị đầu tiên trong mỗi tổ hợp tương ứng với bộ lọc cho các cột, giá trị thứ hai tương ứng với bộ lọc cho các hàng Thành phần thu được sau lọc băng thấp tại mỗi mức tỉ lệ được sử dụng như là cơ sở cho các vòng tính toán tiếp theo Các phần
dư thừa được loại bỏ bằng cách thu hẹp mẫu các hệ số đã được lọc theo tỉ số bằng 2
Để đảm bảo khả năng khôi phục tốt từ các hệ số được sinh ra ở trên, các bộ lọc được thiết kế sao cho đáp ứng được một số tính chất toán học riêng [52] Biểu diễn Wavelet cho phép một dạng lựa chọn có hướng như được mô tả trong Hình 1.11
Trong mảng nghiên cứu lý thuyết về Wavelet đã có nhiều phiên bản khác nhau của các thuật toán trên được đề xuất, ví dụ như biến đổi Wavelet phức theo cây đối ngẫu DTCWT [71]
Hình 1.11 Phân giải Wavelet nhị nguyên và khả năng lựa chọn hướng