1. Trang chủ
  2. » Tất cả

Tìm hiểu đề tài nhận dạng mống mắt

12 45 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nhận dạng mống mắt
Người hướng dẫn Lê Hoàng Thái
Trường học Học viện Công Nghệ Bưu Chính Viễn Thông tại Thành phố Hồ Chí Minh
Chuyên ngành Xử lý ảnh
Thể loại Báo cáo cá nhân
Thành phố Thành phố Hồ Chí Minh
Định dạng
Số trang 12
Dung lượng 502,66 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG CƠ SỞ TẠI THÀNH PHỐ HỒ CHÍ MINH KHOA CÔNG NGHỆ THÔNG TIN II BÁO CÁO CÁ NHÂN Tìm hiểu đề tài Nhận dạng mống mắt Môn Xử lý ảnh Giảng viên hướng dẫn Lê Hoàng Thái[.]

Trang 1

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG CƠ SỞ TẠI

THÀNH PHỐ HỒ CHÍ MINH

KHOA CÔNG NGHỆ THÔNG TIN II

BÁO CÁO CÁ NHÂN

Tìm hiểu đề tài

Nhận dạng mống mắt

Môn: Xử lý ảnh Giảng viên hướng dẫn: Lê Hoàng Thái

Trang 2

LỜI MỞ ĐẦU

Trong 15 năm qua, tính năng nhận dạng mống mắt đã phát triển nhanh chóng từ lần đầu tiên trình diễn trực tiếp và bằng sáng chế phương pháp thực tế đầu tiên, cho một lĩnh vực chính phát triển sinh trắc học với một số lượng lớn các nhà nghiên cứu tích cực trong cả hai học viện và ngành công nghiệp Cho đến nay, khoảng 50 triệu người trên toàn thế giới đã đăng ký vào hệ thống nhận dạng mống mắt sử dụng thuật toán của tác giả Nhưng cái khác các hệ thống cũng đang được phát triển, trình diễn và thử nghiệm trong các cuộc thi do Chính phủ phản hồi với kết quả tốt; và chắc chắn rằng trong trong tương lai sẽ tồn tại một trạng thái cân bằng sống động của các phương pháp đa dạng và các sản phẩm khả thi có sẵn để triển khai, thậm chí có thể tương tác với nhau Vì thế, qua đây em muốn giới thiệu chi tiết hơn về công nghệ sinh trắc “nhận dạng mống mắt”

để cho mọi người có thể thấy được sự phát triển không ngừng của nó trong cả hiện tại

và tương lai

Em xin chân thành cảm ơn thầy và các bạn đã nhiệt tình giúp đỡ và tạo điều kiện

để em có thể thực hiện được đề tài này

MỤC LỤC

PHẦN I: TỔNG QUAN VẤN ĐỀ 1

1.1 Giới thiệu 1

1.2 Sơ lược về lịch sử 1

1.2.1 Nỗ lực thương mại hóa (1993-2006) 1

1.2.2 Bước đột phá cho sự phát triển 2

PHẦN II: NGUYÊN LÝ HOẠT ĐỘNG 3

2.1 Quy trình nhận dạng mống mắt 3

2.2 Điều cần biết về mống mắt 3

2.2.1 Sử dụng chuỗi Fouries 4

2.2.2 Lượng giác dựa trên Fourier và Hiệu chỉnh cho ngắm nhìn Off-Axis 4

PHẦN III: SUY LUẬN LOGIC VÀ THUẬT TOÁN 6

3.1 Phát hiện và loại trừ lông mi bằng thống kê sự suy luận 6

3.2 Quy tắc chuẩn hóa điểm thay thế 6

3.3 Tương thích với các ứng dụng quy mô lớn 7

PHẦN IV: KẾT LUẬN 9 TÀI LIỆU THAM KHẢO

Trang 3

PHẦN I: TỔNG QUAN VẤN ĐỀ

1.1 Giới thiệu

Công nghệ nhận dạng mống mắt (Iris Recognition) là phương pháp sinh trắc học sử dụng thuật toán hình ảnh để nhận dạng một người nào đó dựa vào cấu trúc phức tạp và độc nhất của mống mắt, thậm chí ngay cả khi họ đang đeo kính hoặc sử dụng áp tròng từ một khoảng cách nhất định Nhiều quốc gia trên thế giới

đã áp dụng công nghệ này trong nhận diện công dân hay xác thực hộ chiếu

Nhận diện mống mắt đã trở thành một trong những cách xác thực nhân khẩu được sử dụng phổ biến tại nhiều quốc gia trên thế giới và gần đây, công nghệ này còn được một số gã khổng lồ công nghệ tích hợp trên các thiết bị cao cấp nhất của mình

1.2 Sơ lược về lịch sử

Năm 1936, bác sỹ nhãn khoa Frank Burch đã đề xuất khái niệm nhận dạng bằng mống mắt Tuy nhiên phải đến năm 1985, Giáo sư Leonard Florn tại Đại học New York cùng Giáo sư Aran Safir tại Đại học Connecticut mới được cấp bằng sáng chế liên quan đến “Công nghệ nhận diện mống mắt” Thuật toán nhận diện mống mắt đầu tiên được viết bởi Tiến sĩ John Daugman làm việc tại Đại học Harvard Ông được cấp bằng sáng chế vào năm 1991 Nhờ các sáng chế đó, thử nghiệm nhận diện mống mắt được thực hiện bởi Cơ quan phòng thủ nguyên tử (DNA) của Mỹ vào năm 1995 đã thành công tốt đẹp

1.2.1 Nỗ lực thương mại hóa (1993-2006)

Các thuật toán vẫn được sử dụng, các phương pháp vẫn tồn tại rộng rãi cho đến ngày nay trong công nghệ này, chẳng hạn như mã hóa wavelet Gabor đa tỷ lệ, mã hóa nhị phân dựa trên giao nhau 0, bit Exclusive-OR logic so sánh vectơ và các chỉ số tương tự khoảng cách Hamming

Tranh chấp về các điều khoản cấp phép với một số đối tác của chính công ty, đặc biệt là các đối tác thành công hơn, leo thang thành một loạt các vụ kiện Cuối cùng, các công ty nhỏ đã sử dụng hết các nguồn tài trợ của mình cả khi kiện tụng tích cực và về các bài tập xây dựng lại thương hiệu đã cố gắng mô tả các thuật toán là có được phát triển nội bộ, công ty

đã trở thành kẻ thù của những người mà nó cần nhất như bạn bè và đã sụp

đổ

Trang 4

1.2.2 Bước đột phá cho sự phát triển

Nghiên cứu và phát triển công nghệ “nhận dạng mống mắt” ngày nay đang được mở rộng nhanh chóng tại hàng chục trường đại học và các địa điểm nghiên cứu công nghiệp Niềm đam mê đối với công nghệ và tiềm năng của nó là mạnh mẽ, cũng như mức độ đổi mới để đáp ứng với những thách thức không thể phủ nhận của nó, đặc biệt là liên quan đến chụp ảnh

Trong đó có những sự bứt phá vượt bậc thúc đẩy năng lượng sáng tạo này là:

• Bằng chứng xuất hiện trong các thử nghiệm cho thấy “nhận dạng mống

mắt” dường như là sinh trắc học với hiệu suất tốt nhất, về độ chính xác

của cơ sở dữ liệu lớn và tốc độ tìm kiếm

• Luật pháp ở một số quốc gia đối với các chương trình quốc gia liên quan đến sinh trắc học chứng minh thư hoặc sinh trắc học thay thế hộ chiếu trong việc vượt biên tự động

• Đánh giá thử thách Iris của NIST (“quy mô lớn”) dựa trên hình ảnh từ

240 Môn học; Cơ sở dữ liệu đào tạo của nó đã được tải về bởi 42 nhóm nghiên cứu

• Tiêu chuẩn định dạng trao đổi dữ liệu sinh trắc học và cơ sở dữ liệu về mống mắt hình ảnh để phát triển và thử nghiệm thuật toán

• Nhiều hội thảo quốc tế và sách bao gồm chủ đề này

• Chủ nghĩa vị lai và các bộ phim nổi tiếng, từ James Bond đến báo cáo về người thiểu số

• Biểu tượng văn hóa gắn liền với mắt (“Cửa sổ tâm hồn” - ý nghĩa tình cảm của giao tiếp bằng mắt và giao tiếp qua ánh mắt)

• Niềm vui trí tuệ khi giải quyết các vấn đề đa lĩnh vực kết hợp toán học,

lý thuyết thông tin, thị giác máy tính, thống kê, sinh học, công thái học, lý thuyết quyết định và tính ngẫu nhiên xảy ra một cách tự nhiên của con người

Trang 5

PHẦN II: NGUYÊN LÝ HOẠT ĐỘNG

2.1 Quy trình nhận dạng mống mắt

Quá trình nhận dạng mống mắt được thực hiện bằng cách sử dụng máy chiếu

bước sóng nhìn thấy được hoặc tia cận hồng ngoại vào mắt người để ghi lại các chi tiết và cấu trúc phức tạp của mống mắt Khi máy quét chiếu vào mắt, máy tính sẽ xác định các vị trí gồm đồng tử, mống mắt , lông mi, mí mắt, qua đó tìm ra các tham số như tần số, biên độ, phi Máy tính sẽ phân tích các thông số này và biên dịch thành các dòng lệnh thành mẫu kỹ thuật số Mẫu được mã hóa kỹ thuật số bởi thuật toán và các phép thống kê sẽ cho phép nhận dạng một người hay là ai đó đang đóng giả người

đó Sau khi biên dịch máy tính sẽ tiếp tục sử dụng thuật toán để so sánh mẫu đang quét với mẫu được lưu trữ trên cơ sở dữ liệu với tốc độ khoảng một triệu mẫu mỗi giây, cùng sai số cực thấp

2.2 Điều cần biết về mống mắt

Điều tự nhiên là bắt đầu bằng cách nghĩ về mống mắt như một hình khuyên Chẳng bao lâu người ta phát hiện ra rằng ranh giới bên trong và bên ngoài thường không đồng tâm Một đơn giản giải pháp sau đó là tạo ra một hệ tọa độ giả cực không đồng tâm để lập bản đồ mống mắt, thư giãn giả định rằng mống mắt và đồng tử có chung một trung tâm chung và chỉ yêu cầu rằng học sinh được chứa đầy đủ bên trong mống mắt “Hệ tọa độ giả cực kép” là cơ sở về nhận dạng mống mắt Nhưng ngay sau đó người ta cũng phát hiện ra rằng thường thì ranh giới đồng tử không phải là hình tròn, và thường thì ranh giới bên ngoài mống mắt là không tròn Hiệu suất trong nhận dạng mống mắt được cải thiện đáng kể bằng cách thư giãn cả hai giả định đó, thay thế chúng bằng các phương pháp kỷ luật hơn để phát hiện trung thực và mô hình hóa các ranh giới đó bất kể hình dạng của chúng và xác định hệ tọa độ linh hoạt và tổng quát trên cơ sở của chúng

Bởi vì ranh giới bên ngoài mống mắt thường bị mí mắt che khuất một phần,

và ranh giới bên trong mống mắt có thể bị che khuất một phần bởi phản xạ từ ánh sáng, và đôi khi cả hai ranh giới cũng do phản xạ từ kính đeo mắt, nó là cần thiết

để phù hợp với các đường viền linh hoạt có thể chịu được sự gián đoạn và tiếp tục quỹ đạo trên cơ sở nguyên tắc, bằng cách nào đó được thúc đẩy bởi dữ liệu tồn tại ở những nơi khác Một hạn chế nữa là cả bên trong và bên ngoài các mô

hình biên phải tạo thành các đường cong khép kín Mục tiêu cuối cùng là áp đặt

một hạn chế về sự thông suốt, dựa trên độ tin cậy của bất kỳ bằng chứng nào cho

độ cong không mịn

Trang 6

2.2.1 Sử dụng chuỗi Fouries

Một cách tuyệt vời để đạt được tất cả các mục tiêu này là mô tả ranh giới bên trong và bên ngoài mống mắt dưới dạng “đường viền hoạt động” dựa trên sự rời rạc mở rộng chuỗi Fourier của dữ liệu đường bao Bằng cách

sử dụng các thành phần Fourier có tần số là bội số nguyên của 1 / (2π), đóng, trực giao và tính đầy đủ được đảm bảo Lựa chọn số lượng thành phần tần số cho phép kiểm soát mức độ trơn tru được áp đặt và độ trung thực của phép tính gần đúng Về bản chất, cắt bớt chuỗi Fourier rời rạc sau một số điều khoản nhất định sẽ dẫn đến việc lọc ranh giới thông qua dữ liệu thấp có độ cong trong mô hình đường bao hoạt động

Hình 1: Các đường viền chủ động tăng cường phân đoạn mống mắt, vì chúng

cho phép tạo ra các ranh giới không theo chu kỳ và cho phép các hệ thống tọa độ linh hoạt Hộp ở bên trái hiển thị bản đồ độ cong cho ranh giới bên trong và bên ngoài mống mắt, điều này sẽ phẳng và thẳng nếu chúng là hình tròn Đây là ranh giới bên ngoài (ô phía trên) là đặc biệt không tròn Các đường cong chấm trong hộp và trên mống mắt là chuỗi Fourier xấp xỉ

Hình 2: So với mức người ta muốn áp đặt các ràng buộc như vậy như giữ

cho mô hình đơn giản và có độ cong chiều thấp (đạt được bằng giảm M, ví

dụ M = 1 thực thi mô hình vòng tròn) Do đó, số M của hệ số Fourier được kích hoạt là một đặc điểm kỹ thuật cho số bậc tự do trong mô hình hình dạng

2.2.2 Lượng giác dựa trên Fourier và Hiệu chỉnh cho ngắm nhìn Off-Axis

Một hạn chế của các máy ảnh nhận dạng mống mắt hiện tại là chúng yêu cầu một trục hình ảnh của một con mắt, thường đạt được thông qua cái

Trang 7

có thể được gọi là “điểm dừng và giao diện nhìn chính diện ”trong đó người dùng phải căn chỉnh trục quang học của mình với máy ảnh trục quang học Điều này không linh hoạt hoặc lỏng lẻo nhưng nó có thể Hơn nữa, đôi khi các máy ảnh tiêu chuẩn thu được hình ảnh mà giả định trên trục không thật

Hình thái mắt thay đổi về màng cứng có thể nhìn thấy được và tình trạng tắc mí mắt không chắc rằng có thể hỗ trợ ước tính chính xác, ít nhất là khi chỉ có một mắt được chụp ảnh; Mặc dù nó phải là lưu ý rằng con người

có kỹ năng rất ấn tượng bằng cách nào đó trong việc giám sát từng hướng nhìn của người khác Trong trường hợp không giải được bí ẩn đó, một cách tiếp cận thay thế hiển nhiên sẽ là giả định rằng một hình ảnh trực quan của mống mắt nên để lộ một con ngươi tròn Do đó phát hiện tính elip của đồng

tử cho biết thu nhận hình ảnh ngoài trục và do đó, ước tính độ giãn dài và hướng của hình elip đó sẽ mang lại hai tham số về độ lệch hướng nhìn, Modulo π hướng Phương pháp ước tính ánh nhìn này (và do đó điều chỉnh cho hình ảnh ngoài trục) sử dụng một cách tiếp cận mới có thể được gọi là

“dựa trên Fourier lượng giác ”

+ Chuỗi Fourier mở rộng của tọa độ X và Y là ranh giới đồng tử được phát hiện có chứa hình dạng thông tin bóp méo liên quan đến cái nhìn lệch lạc, trong các mối quan hệ giữa hệ số thực và hệ số ảo của thuật ngữ tần số thấp nhất thì mỗi chúng đều được mở rộng đồng loạt

+ Để cho X(t) và Y(t) là các vectơ tọa độ được tham số hóa bởi ranh giới đồng tử, nên biên độ của t là từ 0 đến 2π trong một chu kỳ quanh đường cong kín này Thông suốt trong trường hợp đồng tử hình tròn có bán kính A, lấy gốc là tâm để đơn giản, các hàm này chỉ là X(t) = A cos (t) và Y(t) = A sin (t) Trong trường hợp ánh nhìn lệch dọc theo trục chính và giả sử khoảng cách máy ảnh lớn so với đường kính mống mắt và có sự kéo dài đơn giản dọc theo trục chính, các hàm này trở thành: X(t) = A cos (t) và Y(t) = B sin (t), với A ≠ B Cuối cùng, nếu độ lệch của ánh nhìn không dọc theo trục chính nhưng thay vì theo hướng θ, thì các hàm này có dạng tổng quát hơn cho một hình elip có hướng:

(hình 3)

Trang 8

PHẦN III: SUY LUẬN LOGIC VÀ THUẬT TOÁN

3.1 Phát hiện và loại trừ lông mi bằng thống kê sự suy luận

Suy luận và loại trừ những khả năng ít xảy ra thì IrisCode có thể xử lý được bằng các phương pháp ước tính thống kê phụ thuộc chủ yếu vào việc xác định xem sự phân

bố của các pixel mống mắt có đa phương thức hay không Nếu đuôi dưới của biểu đồ pixel mống mắt hỗ trợ giả thuyết về sự kết hợp đa phương thức, thì một ngưỡng thích hợp có thể được tính toán và các pixel bên ngoài nó có thể không ảnh hưởng đến IrisCode

(hình 4) Hình 4: Suy luận thống kê về lông mi từ biểu đồ pixel mống mắt và xác định ngưỡng để loại trừ lông mi (được dán nhãn màu trắng) khỏi ảnh hưởng mật mã

IrisCode

➔Trong hình này, những lông mi được phát hiện này nằm trong mống mắt và

bây giờ đã được đánh dấu là pixel màu trắng Vị trí của họ được ghi lại trong một mảng mặt nạ ngăn chúng ảnh hưởng đến bất kỳ dữ liệu nào mã hóa kết cấu mống mắt Chương trình con phát hiện lông mi này thực thi trong vòng chưa đầy 1 mili giây

3.2 Quy tắc chuẩn hóa điểm thay thế

Nhận dạng mống mắt hoạt động bằng cách thực hiện kiểm tra tính độc lập thống

kê giữa hai mã IrisCodes, để quyết định xem chúng phát sinh từ cùng một hoặc từ tròng đen khác nhau

+ Các vùng của mống mắt bị che khuất bởi mí mắt, hoặc lông mi, hoặc bởi phản xạ từ kính đeo mắt, hoặc có độ tương phản thấp hoặc tỷ lệ tín hiệu trên nhiễu kém, được phát hiện bởi các thuật toán xử lý hình ảnh và ngăn ảnh hưởng đến việc so sánh mống mắt, thông qua các chức năng mặt nạ Trong khi bản thân các bit IrisCode chứa dữ liệu pha được độc quyền (N) để phát hiện sự bất đồng và từ đó xác định sự giống nhau giữa hai mống mắt, các bit được xem xét đầu tiên được chọn bởi ANDing (∩) mỗi cặp với các chức năng mặt nạ liên quan của cả hai tròng mắt để đảm bảo tính hợp lệ và ý nghĩa của chúng Định mức (|| ||) của vectơ bit kết quả và của các vectơ mặt

Trang 9

nạ AND sau đó được đo để tính toán một Hamming thô khoảng cách HDraw, dưới dạng phần nhỏ của các bit có ý nghĩa không đồng nhất giữa hai mống mắt có hai vectơ bit

mã pha được ký hiệu là {codeA, codeB} và có vectơ bit mặt nạ được ký hiệu là

{maskA, maskB}

:

(hình 5)

Một lựa chọn tự nhiên cho quy tắc chuẩn hóa điểm là chia tỷ lệ lại tất cả các độ lệch từ 0,5 khoảng cách Hamming theo tỷ lệ với căn bậc hai của số bit được so sánh khi đạt được điểm số đó Nguyên nhân đối với quy tắc như vậy là độ lệch chuẩn dự kiến trong phân phối kết quả của thử nghiệm Bernoulli là σ = √𝑝𝑞/𝑛2 trong đó p và

q là tương ứng xác suất kết quả (cả hai trên danh nghĩa là 0,5 trong trường hợp này)

Do đó, mức độ tin cậy của quyết định có thể được duy trì bất kể có bao nhiêu bit n thực sự được so sánh, bằng cách ánh xạ mỗi HDraw đưa khoảng cách Hamming về một, cho điểm HDnorm bằng cách sử dụng quy tắc chia lại tỷ lệ, chẳng hạn như:

(hình 6)

3.3 Tương thích với các ứng dụng quy mô lớn

Dạng hàm nhị thức mô tả rất tốt việc phân phối điểm số tương tự được chuẩn hóa

để so sánh giữa các mẫu mống mắt khác nhau là chìa khóa mức độ mạnh mẽ của các thuật toán này trong các ứng dụng tìm kiếm quy mô lớn Các đuôi của nhị thức giảm

đi cực kỳ nhanh chóng, vì sự thống trị xu hướng trung tâm gây ra bởi các thuật ngữ giai thừa trong hàm

(hình 7) Giảm nhanh chóng đuôi rất quan trọng đối với một sinh trắc học để tồn tại trong số lượng lớn các cơ hội ràng buộc để tạo kết hợp sai mà không thực sự tạo ra bất kỳ sự sai sót nào, khi được áp dụng trong một chế độ 'tất cả chống lại tất cả' để tìm kiếm kết quả trùng khớp hoặc nhiều danh tính, như là dự tính trong một số dự án thẻ ID quốc gia ở Anh và ở Châu Âu

Trang 10

(hình 8)

→Tỷ lệ đối sánh sai với chuẩn hóa điểm HDnorm: Phụ thuộc vào tiêu chí ngưỡng quyết định (dựa trên 200 tỷ so sánh, cơ sở dữ liệu UAE)

 Kết quả phân tích: Các giá trị tích lũy (ở các ngưỡng khác nhau) việc phân phối

điểm số tương tự đã chuẩn hóa cho các tròng mắt khác nhau được so sánh ở nhiều mức độ tương đối, hiển thị tỷ lệ đối sánh sai trong số 200 tỷ mẫu so sánh mống mắt nếu chính sách quyết định nhận dạng sử dụng các ngưỡng đó Các tỷ lệ này

là được cung cấp trong hình 8 Mặc dù giá trị nhỏ nhất được quan sát là gần 0,26

bảng đã được mở rộng xuống 0,22 bằng cách sử dụng tích lũy lý thuyết phân phối

giá trị cực đoan của nhiều mẫu từ nhị thức (hình 7), để suy về mặt lý thuyết tỷ lệ

đối sánh sai dự kiến để có quyết định cụ thể Kết hợp sai này tỷ lệ, cho dù quan sát hay lý thuyết, cũng đóng vai trò là mức độ tin cậy có thể được liên kết với chất

lượng trận đấu nhất định bằng cách sử dụng chuẩn hóa điểm số quy tắc (hình 6)

Trong phân tích này, chỉ một mắt duy nhất được cho là xuất hiện Theo giả định

về sự độc lập giữa IrisCodes mắt trái và mắt phải, được hỗ trợ mạnh mẽ bởi dữ liệu có sẵn, các mức độ tin cậy có thể được nhân với nhau cho các kết quả phù hợp thu được bằng cả hai mắt Một phương pháp cho phép mã IrisC được lập chỉ xảy ra bởi các va chạm của chúng với các chuỗi con, do đó thay thế tìm kiếm toàn diện gần như ngay lập tức tìm được địa chỉ trực tiếp tới IrisCodes

Ngày đăng: 24/02/2023, 12:54

TỪ KHÓA LIÊN QUAN

w