1. Trang chủ
  2. » Luận Văn - Báo Cáo

Hệ thống sinh trắc sử dụng nhận dạng mống mắt

89 25 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 89
Dung lượng 3,65 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Trong luận văn này, một phương pháp nhận dạng mống mắt dựa trên sự phân tích dữ liệu mống mắt dùng EMD được đưa ra, tín hiệu dữ liệu mống mắt được phân hủy thành nhiều IMFs Intrinsic Mod

Trang 2

CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI TRƯỜNG ĐẠI HỌC BÁCH KHOA –ĐHQG -HCM

Cán bộ hướng dẫn khoa học: PGS.TS DƯƠNG HOÀI NGHĨA

(Ghi rõ họ, tên, học hàm, học vị và chữ ký) Cán bộ chấm nhận xét 1:

(Ghi rõ họ, tên, học hàm, học vị và chữ ký) Cán bộ chấm nhận xét 2:

(Ghi rõ họ, tên, học hàm, học vị và chữ ký) Luận văn thạc sĩ được bảo vệ tại Trường Đại học Bách Khoa, ĐHQG Tp HCM ngày tháng 07 năm 2013 Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm: (Ghi rõ họ, tên, học hàm, học vị của Hội đồng chấm bảo vệ luận văn thạc sĩ) 1

2

3

4

5

Xác nhận của Chủ tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý chuyên ngành sau khi luận văn đã được sửa chữa (nếu có) CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA…………

Trang 3

ĐẠI HỌC QUỐC GIA TP.HCM

TRƯỜNG ĐẠI HỌC BÁCH KHOA

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM

Độc lập - Tự do - Hạnh phúc

NHIỆM VỤ LUẬN VĂN THẠC SĨ

Họ tên học viên: LÊ TUẤN NHÃ MSHV: 11150093

Ngày, tháng, năm sinh: 15-08-1987 Nơi sinh: Đồng Nai

Chuyên ngành: TỰ ĐỘNG HÓA KHÓA : 2011

I TÊN ĐỀ TÀI: HỆ THỐNG SINH TRẮC SỬ DỤNG NHẬN DẠNG MỐNG MẮT

II NHIỆM VỤ VÀ NỘI DUNG:

 Tìm hiểu quá trình xây dựng hệ thống sinh trắc sử dụng nhận dạng mống mắt

 Xây dựng hệ thống sinh trắc sử dụng nhận dạng mống mắt

III NGÀY GIAO NHIỆM VỤ :

IV NGÀY HOÀN THÀNH NHIỆM VỤ:

V CÁN BỘ HƯỚNG DẪN : PGS.TS DƯƠNG HOÀI NGHĨA

Tp HCM, ngày tháng 06 năm 2013 CÁN BỘ HƯỚNG DẪN (Họ tên và chữ ký) CHỦ NHIỆM BỘ MÔN ĐÀO TẠO (Họ tên và chữ ký) PGS.TS DƯƠNG HOÀI NGHĨA TRƯỞNG KHOA….………

(Họ tên và chữ ký)

Trang 4

LỜI CẢM ƠN

Để hoàn thành tốt luận văn này, tôi xin chân thành cảm ơn quý thầy cô và gia đình

đã dạy dỗ, động viên và giúp đỡ tôi trong suốt quá trình học tập

Đặc biệt, tôi xin chân thành cảm ơn Thầy Dương Hoài Nghĩa đã nhiệt tình hướng

dẫn, định hướng cho tôi trong suốt thời gian thực hiện luận văn này

Tôi xin chân thành cảm ơn các Thầy Cô trong trường Đại Học Bách Khoa TP Hồ

Chí Minh nói chung và các Thầy Cô trong Khoa Tự Động Hóa nói riêng đã trang bị

cho tôi những kiến thức quý báu để hoàn thành tốt luận văn này

Cuối cùng, xin cảm ơn các anh chị trong lớp Tự Động Hóa khoá 2011 đã giúp đỡ tôi trong thời gian học tập

Người thực hiện luận văn

Lê Tuấn Nhã

Trang 5

TÓM TẮT LUẬN VĂN THẠC SỸ

Nhận dạng mống mắt là một trong những phương pháp hiệu quả của nhận dạng sinh trắc học, trong khi đó Empirical mode decomposition (EMD) là một kỹ thuật hiệu quả cho phân tích tín hiệu không tuyến tính, không ổn định Trong luận văn này, một phương pháp nhận dạng mống mắt dựa trên sự phân tích dữ liệu mống mắt dùng EMD được đưa

ra, tín hiệu dữ liệu mống mắt được phân hủy thành nhiều IMFs (Intrinsic Mode Functions) và r (phần còn lại), sau đó một hay nhiều IMFs và r phù hợp cho nhận dạng sẽ được chọn làm vector mẫu dữ liệu IMFs và r phù hợp đại diện cho thông tin quan trọng của ảnh mống mắt, vì vậy chúng đóng góp nhiều cho quá trình nhận dạng Kinh nghiệm cho thấy rắng việc chọn IMFs và r có thể giảm bớt nhiễu và trích mẫu dữ liệu mống mắt hiệu quả và phương pháp này có thể đạt kết quả tuyệt vời Ở trong đề tài này, ba kỹ thuật

so sánh dữ liệu được sử dụng Kinh nghiệm cũng cho thấy rằng ba kỹ thuật này cho kết quả gần như nhau Theo đó, luận văn này chứng minh sự khả thi cho việc nhận dạng mống mắt khi dùng EMD để trích dữ liệu mống mắt

Trang 6

ABSTRACT

Iris recognition is one of effective methods for the biometrics recognition, while Empirical mode decomposition (EMD) is an effective technique for non-linear, non-stationary signal analysis In this thesis, an iris recognition method based on an improved feature extraction approach is proposed, in which iris signal is decomposed into several Intrinsic Mode Functions (IMFs) and residual (r) by EMD first, and then one or several IMFs and residual suitable for recognition are taken as a feature vector The suitable IMFs and residual represent the most important information of iris images, so that they give more contributions to the recognition The experiments show that the chosen IMFs and residual can reduce noise interference and extract the iris features effectively and the proposed algorithm can achieve an excellent performance In this thesis, three different similarity measures are used Experimental results show that three metrics have all achieved promising and similar performance Therefore, the proposed method demonstrates to be feasible for iris recognition and EMD is suitable for feature extraction

Trang 7

MỤC LỤC

CHƯƠNG 1: TỔNG QUAN

1 Tính cấp thiết của luận văn 10

2 Tìm hiểu về mống mắt 11

3 Hệ thống nhận dạng mống mắt của Daughman 12

4 Phương pháp nghiên cứu của đề tài 13

5 Một số công trình nghiên cứu trên thế giới 15

6 Tóm tắt nội dung các chương 15

CHƯƠNG 2: THUẬT TOÁN XÂY DỰNG HỆ THỐNG SINH TRẮC SỬ DỤNG NHẬN DẠNG MỐNG MẮT 1 Xác định đường bao đồng tử và đường bao mống mắt 17

1.1 Phương pháp xác định biên dùng lọc canny 17

1.2 Xác định tâm và bán kính đường bao đồng tử và đường bao mống mắt dùng biến đổi vòng tròn Hough 24

2 Chuẩn hóa dữ liệu mống mắt thành dạng hình chữ nhật 28

3 Trích mẫu dữ liệu dùng empirical mode decomposition 32

4 Áp dụng EMD để trích mẫu dữ liệu mống mắt 34

4.1 Phương pháp 1 34

4.2 Phương pháp 2 36

5 So sánh dữ liệu 41

CHƯƠNG 3: KẾT QUẢ ĐẠT ĐƯỢC 1 Phần cứng 43

1.1 Thiết bị chiếu sáng 43

1.2 Thiết bị chụp ảnh mống mắt 44

1.3 Vị trí để đặt mắt vào 46

1.4 Thiết bị chụp ảnh chân dung của người dùng 46

Trang 8

1.5 Thiết bị chắn ánh sáng 48

1.6 Toàn bộ hệ thống 48

2 Phần mềm 51

2.1 Giao diện GUI matlab 51

2.2 Quá trình thực hiện nhận dạng 52

3 Kết quả và đánh giá 57

3.1 Kết quả 57

3.2 Đánh giá kết quả 57

CHƯƠNG 4: HẠN CHẾ VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI 1 Hạn chế 58

2 Hướng phát triển của đề tài 58

TÀI LIỆU THAM KHẢO 59

PHỤ LỤC 62

LÝ LỊCH TRÍCH NGANG 88

Danh mục các hình vẽ, đồ thị, bảng biểu

Hình 1 Hình ảnh nhìn từ phía trước của mống mắt

Hình 2 Hệ thống nhận dạng mống mắt của Daugman

Hình 3 Đạo hàm gauss theo hai hướng x và y

Hình 4 Ảnh sau làm trơn ảnh dùng bộ lọc Gauss và nhân ảnh xoắn hai mặt nạ H x

H y

Hình 5 Ảnh sau khi đưa về độ lớn trong khoảng (0-1)

Hình 6 Hình mô tả 1 trong 2 điểm biên lân cận

Hình 7 Ảnh sau khi loại bỏ một số điểm dư thừa

Hình 8 Ảnh sau khi áp dụng ngưỡng

Hình 9 Kết quả đạt được sau khi xử lý bằng lọc canny

Trang 9

Hình 10 Đường tròn cần để xác định tâm

Hình 11 Tâm được xác định

Hình 12 Ảnh minh họa các tọa độ (p x,p y) trên vòng tròn

Hình 13 Đường bao mống mắt được xác định khi dùng phương pháp Hough

Hình 17 Kết quả thu được sau khi chuẩn hóa và làm nổi bật ảnh (enhance)

Hình 18 Đường bao trên, đường bao dưới của dữ liệu data(t) và giá trị trung bình của hai đường này

Hình 24 So sánh các IMF với dữ liệu ban đầu

Hình 25 (a) và (c) là kết quả phân hủy EMD cho hai ảnh của cùng một người, (b)

và (d) là kết quả phân hủy EMD cho hai ảnh của hai người khác nhau

Hình 26 Điện trở và đèn led để chiếu sáng trước vào sau khi lắp chóa

Hình 27 Vị trí đặt thiết bị chiếu sáng

Hình 28 Webcam dùng để chụp ảnh mống mắt

Hình 29 Vị trí đặt webcam để chụp ảnh mống mắt

Hình 30 Vị trí đặt mắt vào

Trang 10

Hình 31 Điện thoại dùng để chụp lại ảnh chân dung của người dùng

Hình 32 Vị trí đặt thiết bị chụp ảnh chân dung

Hình 33 Hộp đen để chắn ánh sáng

Hình 34 Toàn bộ hệ thống

Hình 35 Giao diện GUI viết bằng matlab

Hình 36 Giao diện sau khi nhấn start portrait để chuẩn bị chụp lại ảnh chân dung người dùng

Hình 37 Giao diện sau khi nhấn Getportrait để lấy ảnh chân dung của người dùng Hình 38 Giao diện GUI sau khi nhấn Start Camera để lấy dữ liệu mống mắt của người dùng

Hình 39 Dữ liệu mống mắt của người dùng sau khi được phân tích, từ trên xuống theo thứ tự là ảnh sau khi phân đoạn, ảnh sau khi chuẩn hóa, dữ liệu bit nhi phân

lưu vào kho dữ liệu và dùng để so sánh dữ liệu cần nhận dạng

Hình 40 Giao diện sau khi nhận dạng chính xác người dùng

Hình 41 Giao diện sau khi nhận dạng người dùng chưa lưu vào kho dữ liệu

Trang 11

Chương 1

TỔNG QUAN

1.1 Tính cấp thiết của luận văn:

Nhận dạng con người là một lĩnh vực không còn mới trong cuộc sống ngày nay Tuy nhiên, khi công nghệ và các dịch vụ ngày phát triển trong thế giới hiện đại, các hoạt động và giao dịch của con người tăng lên nhanh chóng, khi đó nhận dạng cá nhân một cách nhanh chóng và đáng tin cậy là điều bắt buộc Ví dụ như hệ thống kiểm tra hộ chiếu, đăng nhập máy tính, máy rút tiền tự động và các giao dịch ủy quyền, kiểm soát truy cập

cơ sở, và hệ thống an ninh nói chung Tất cả các nỗ lực trong lĩnh vực nhận dạng này đều hướng đến những mục đích chung về tốc độ, độ tin cậy và sự tự động hóa

Việc sử dụng những dấu hiệu phân biệt sinh trắc học cho mục đích nhận dạng đòi hỏi một nhân tố đặc biệt, duy nhất cho mỗi cá nhân và nó có thể dễ dàng xử lý được, và không thay đổi theo thời gian Các đặc điểm sinh trắc học như chữ ký, hình ảnh, dấu vân tay, giọng nói và các kiểu mạch máu võng mạc, tất cả đều có hạn chế đáng kể Mặc dù chữ ký và hình ảnh có giá rẻ và dễ dàng để có được và lưu trữ, tuy nhiên chúng thì không thể để dùng để nhận dạng tự động với một sự đảm bảo, và chúng có thể dễ dàng để giả mạo Đồ thị sóng âm điện tử ghi lại rất nhạy cảm với những thay đổi trong giọng nói của một người, ngoài ra giọng nói có thể thay đổi và giả mạo được Dấu vân tay hoặc dấu bàn tay đòi hỏi tiếp xúc vật lý, và chúng cũng có thể được làm giả, và dễ bị xước bởi tác động

Mống mắt con người là đặc tính tốt nhất có thể dùng để nhận dạng và xác thực một người khi so sánh với các đặc điểm sinh trắc học khác như vân tay, gương mặt, giọng nói và chữ ký Nó kết hợp tất cả các đặc điểm mà một sinh trắc học tối ưu nên có Hoa văn trên mống mắt là độc nhất trên mỗi người và thậm chí có sự khác biệt tồn tại giữa hai người sinh đôi Trong cùng thời gian, mống mắt có những đặc điểm khác nhau giữa mắt phải và trái trên cùng một người Hơn nữa, các đặc điểm trên mống mắt rất ổn định và không thay đổi theo th ời gian Ngoài ra, các thiết bị được sử dụng để lưu lại các đặc tính của mống mắt là một máy ảnh Điều này sẽ rất thuận tiện cho hầu hết người sử dụng Hơn nữa, các hoa văn trên mống mắt là loại sinh trắc học an toàn bởi vì nó không thể làm giả được

Chính những đặc điểm trên làm cho hệ thống nhận dạng mống mắt trở thành một

hệ thống nhận dạng dễ dàng đáp ứng các nhu cầu về tốc độ, độ tin cậy và sự tự động hóa

Trang 12

Trong đề tài này, chúng ta sẽ thử nghiệm, thực hiện, và quan trọng nhất, tìm cơ sở lý thuyết để xây dựng một hệ thống nhận dạng mống mắt, một hệ thống hoàn toàn tự động

có thể đáp ứng được tất cả các nhu cầu để nhận dạng con người trong xã hội hiện đại ngày nay

1.2 Tìm hiểu về mống mắt:

Mống mắt là một màng tròn mỏng, nằm giữa giác mạc và thủy tinh thể của mắt người Hình ảnh phía trước của mống mắt được thể hiện như trong hình 1 Một lỗ tròn chính giữa màng mống mắt màu đen được gọi là đồng tử Các chức năng của mống mắt

là để kiểm soát lượng ánh sáng đi xuyên qua đồng tử, và điều này được thực hiện bằng cơ thắt và cơ giãn của mắt Đường kính trung bình của mống mắt là 12 mm, và kích thước đồng tử có thể thay đổi từ 10% đến 80% của đường kính mống mắt

Mống mắt bao gồm một số lớp, thấp nhất là lớp biểu mô, trong đó có các tế bào sắc tố dày đặc Lớp đệm nằm trên lớp biểu mô, và có chứa các mạch máu, tế bào sắc tố

và hai cơ mống mắt Mật độ sắc tố mô đệm xác định màu sắc của mống mắt Bề mặt có thể nhìn thấy bên ngoài của mống mắt nhiều lớp có chứa hai vùng, thường khác nhau trong màu sắc Một khu vực bên ngoài đồng tử và một khu vực bên trong đồng tử, cấu tạo khu vực bên ngoài đồng tử được chia theo các vân, hiện lên như là một kiểu zigzag

Hình 1 Hình ảnh nhìn từ phía trước của mống mắt

Đặc điểm trên mống mắt được hình thành bắt đầu trong tháng thứ ba của phôi thai Kiểu mẫu độc nhất trên bề mặt của mống mắt được hình thành trong suốt năm đầu tiên của con người, và sắc tố của các chất nền tạo ra trong vài năm đầu tiên Đặc thù các kiểu mẫu độc nhất của mống mắt là ngẫu nhiên và không liên quan đến bất kỳ yếu tố di truyền

Mống mắt

Đồng tử

Mí mắt

Màng cứng Vân mống mắt

Trang 13

nào Đặc điểm duy nhất đó là phụ thuộc vào di truyền là các sắc tố của mống mắt, mà quyết định màu sắc của chính nó Do tính chất biểu sinh của các mẫu mống mắt, hai mắt của một cá nhân có chứa kiểu mống mắt hoàn toàn độc lập, và cặp song sinh giống hệt nhau không có tương quan kiểu mống mắt

1.3 Hệ thống nhận dạng mống mắt của Daugman:

John Daugman là nhà vật lý học và là giáo sư xử lý ảnh và nhận dạng mẫu tại phòng nghiên cứu đại học Cambridge Ông là người đi tiên phong trong lĩnh vực nhận dạng mống mắt, đặc biệt là phát triển dùng lọc Gabor wavelet trong quá trình nhận dạng mống mắt, đây cũng là cơ sở lý thuyết của tất cả các hệ thống nhận dạng mống mắt có giá trị thương mại hiện nay

Trang 14

Mã hóa thông tin: chuyển dữ liệu ở dạng ma trận hình chữ nhật về dạng nhị phân dùng lọc gabor

So sánh với cơ sở dữ liệu: dùng phương pháp Hamming Distance để so sánh dữ liệu

1.4 Phương Pháp Nghiên Cứu của đề tài:

Phương pháp nghiên cứu của đề tài bao gồm các bước được xây dựng tương tự như trong hệ thống nhận dạng mống mắt của Daugman, và vấn đề mấu chốt trong hệ thống của Daugman chính là dùng lọc Gabor lấy mẫu dữ liệu mống mắt để đưa vào nhận dạng Thay vì dùng lọc Gabor, đề tài này sẽ dùng một phương pháp mới được nghiên cứu gần đây là Empirical Mode Decomposition (EMD) để lấy mẫu dữ liệu mống mắt, phương pháp này cũng là một phương pháp hiệu quả để nhận dạng các đặc điểm sinh trắc học khác như giọng nói, chữ ký, vân tay, nhận dạng khuôn mặt, và nhận dạng mẫu nói chung…EMD là một kỹ thuật phân hủy nhiều lớp cho các tín hiệu dữ liệu không tuyến tính và không ổn định Nó có thể phân tích bất kỳ tín hiệu dữ liệu nào thành các IMFs (intrinsic mode functions) khác nhau và r (residual) chính là phần còn lại của dữ liệu ban đầu sau khi loại trừ đi các IMF, mỗi IMF và r đại diện cho một kiểu đặc trưng của tín hiệu dữ liệu ban đầu Phương pháp EMD được sử dụng như bộ lọc tần số cho nhận dạng mống mắt, các IMF và r sẽ được chọn thích hợp và dùng làm mẫu dữ liệu dùng để nhận dạng

Hệ thống thực hiện theo quy trình sau:

Trang 15

Thu lại hình ảnh mống mắt

Phát hiện các điểm biên dùng lọc Canny

Tìm tâm và bán kính của mống mắt và đồng tử dùng phương pháp Hough Circle

Chuẩn hóa và trích dữ liệu mẫu

Trang 16

1.5 Một số công trình nghiên cứu trên thế giới:

Mặc dù những hệ thống đầu tiên đã được đề xuất trước đó, nó vẫn không thực hiện được cho đến đầu những năm chín mươi nhà nghiên cứu thuộc đại học Cambridge, John Daugman, triển khai thực hiện một hệ thống nhận dạng mống mắt tự động Hệ thống của Daugman được cấp bằng sáng chế và các quyền lợi và hiện nay là chủ sở hữu các công ty công nghệ Iridian Mặc dù hệ thống Daugman là thành công nhất và tốt nhất được biết đến, nhiều hệ thống khác vẫn được phát triển Đáng chú ý nhất bao gồm các hệ thống của Wildes et al., phân tích dữ liệu mống mắt thành bốn mẫu dữ liệu khác nhau dùng phương pháp Laplacian pyramid Tiếp theo là hệ thống của Boles và Boashash, phương pháp của hệ thống này là tính điểm zero-crossing của biến đổi wavelet 1-D trong những phân tích khác nhau của vòng tròn đồng tâm trong ảnh mống mắt Thứ ba là hệ thống dùng phương pháp L.Ma được dùng để phân tích sự biến đổi cường độ dữ liệu và lấy mẫu dùng Gaussian-Hermite và dyadic wavelet Cuối cùng là hệ thống của Lim et al.,

và Noh et al., các thuật toán của Lim et al được sử dụng trong hệ thống nhận dạng mống mắt được phát triển bởi các công ty Evermedia và Senex Ngoài ra, thuật toán của Noh et

al được sử dụng trong hệ thống „IRIS2000‟, được bán bởi IriTech Những thiết bị này là riêng biệt đối với hệ thống Daugman

Hệ thống của Daugman đã được thử nghiệm dưới nhiều nghiên cứu, tất cả các báo cáo với tỷ lệ thất bại là không Hệ thống Daugman được khẳng định có thể nhận dạng hoàn hảo một cá nhân, và có thể cho cho hàng triệu cá nhân Hệ thống nguyên mẫu bởi Wildes et al cũng báo cáo hiệu suất hoàn hảo với 520 hình ảnh mống mắt[7], và hệ thống của Lim et al đạt được công nhận tỷ lệ 98,4% với một cơ sở dữ liệu của khoảng 6.000 hình ảnh mắt

Tất cả các phương pháp trên đều dùng những đặc điểm của ảnh mống mắt để thực hiện nhận dạng mống mắt, khác với các phương pháp trên, phương pháp EMD của chúng

ta là một kỹ thuật mới dùng EMD như một bộ lọc tần số tín hiệu thấp để phân tích ảnh mống mắt

1.6 Tóm tắt nội dung các chương:

Chương 1: Giới thiệu tổng quan về hệ thống nhận dạng mống mắt, các nghiên

cứu trên thế giới về hệ thống nhận dạng mống mắt, và phương pháp nghiên cứu trong đề tài

Chương 2: Trong chương này sẽ chỉ ra các thuật toán quan trọng để xây dựng hệ

thống nhận dạng mống mắt, bao gồm phân đoạn ảnh mống mắt, chuẩn hóa ảnh mống

Trang 17

mắt, và dùng phương pháp Empirical Mode Decomposition (EMD) để trích mẫu dữ liệu mống mắt và chuyển về dữ liệu dạng nhị phân

Chương 3: Chương này sẽ trình bày chi tiết phần cứng, phần mềm được xây

dựng và kết quả thu được của đề tài

Chương 4: Chương này sẽ trình bày những hạn chế và hướng phát triển của đề

tài

Trang 18

Chương 2:

THUẬT TOÁN XÂY DỰNG HỆ THỐNG SINH TRẮC SỬ

DỤNG NHẬN DẠNG MỐNG MẮT

1 Xác định đường bao đồng tử và đường bao mống mắt:

1.1 Phương pháp xác định biên dùng lọc canny:

Biên là vấn đề quan trọng trong trích chọn đặc điểm nhằm tiến tới xác định các đặc điểm ảnh Cho đến nay chưa có định nghĩa chính xác về biên, trong mỗi ứng dụng người ta đưa ra các độ đo khác nhau về biên, một trong các độ đo đó là độ đo về sự thay đổi đột ngột về cấp xám Ví dụ: Đối với ảnh đen trắng, một điểm được gọi là điểm biên nếu nó là điểm đen có ít nhất một điểm trắng bên cạnh Tập hợp các điểm biên tạo nên biên hay đường bao của đối tượng Người ta chia làm hai phương pháp phát hiện biên cơ bản:

1 Phát hiện biên trực tiếp: là các phương pháp phát hiện biên dựa vào sự thay đổi mức xám sử dụng các kỹ thuật thay đổi theo hướng

2 Phát hiện biên gián tiếp

Kỹ thuật phát hiện biên bằng phương pháp canny là phương pháp dò biên trực tiếp rất hiệu quả áp dụng cho loại ảnh nhiễu Phương pháp này do John Canny ở phòng thí nghiệm MIT khởi xướng năm 1986 Bộ tách biên Canny là bộ tách biên mạnh nhất cung cấp bởi hàm edge Canny xây dựng phương pháp dựa theo ba ràng buộc:

- Mức lỗi: có ý nghĩa là một phương pháp phát hiện biên chỉ và phải tìm tất cả các biên, không biên nào được tìm bị lỗi

- Định vị: điều này nói đến độ chênh lệch cấp xám giữa các điểm trên cùng một biên phải càng nhỏ càng tốt

- Hiệu suất: là làm sao cho khi tách biên không được nhận ra nhiều biên trong khi chỉ có một biên tồn tại

Canny đã giả thiết rằng nhiễu trong ảnh tuân theo phân bố Gauss và đồng thời ông cũng cho rằng một phương pháp phát hiện biên thực chất là một bộ lọc nhân chập có khả năng làm mịn nhiễu và định vị được cạnh Vấn đề là làm sao để có một bộ lọc tối ưu nhất Ba ràng buộc trên được cụ thể hóa thành lý thuyết toán học:

Trang 19

2 0

( ) ( )

( )

w

w w

w w w w

2

' ( ) ( )

 Các bước tiến hành phương pháp canny :

Bước 1: Làm trơn ảnh bằng cách nhân chập với bộ lọc Gauss Sau khi tiến hành nhân chập chúng ta có đầu ra là dữ liệu ảnh S đã được nhân chập

Trang 20

Bước 2: Lấy đạo hàm bậc nhất của kết quả ở bước 1

Ta có: ∇S = ∇(g * I) = (∇g ) * I

Như vậy, kết quả ảnh bước hai chính là sự tổng hợp của đạo hàm của Gauss theo hướng x nhân với ảnh I và đạo hàm của Gauss theo hướng y nhân với ảnh I Nghĩa là ta có thể đạo hàm hàm Gauss theo hai hướng rồi mới tiến hành nhân xoắn với ảnh thay vì nhân xoắn ảnh với hàm Gauss rồi mới đạo hàm Có thể minh hoạ như sau đạo hàm hàm Gauss theo hai hướng x và y như sau:

Hình 3 Đạo hàm gauss theo hai hướng x và y

Như vậy cách thức thực hiện bước thứ hai như sau:

Sau khi tiến hành nhân xoắn ảnh I với bộ lọc Gauss ở bước 1 ta có một ảnh mới S được làm trơn Tiến hành thực hiện bước hai bằng cách lấy đạo hàm ảnh mới đó theo hai hướng x và y rồi tổng hợp kết quả lại Như đã biết, phương pháp Gradient là phương pháp dò biên cục bộ dựa vào cực đại của đạo hàm, đó chính là phương pháp đạo hàm bậc nhất Chính vì vậy ta có thể thực hiện việc đạo hàm ở bước 2 bằng cách nhân ảnh kết quả

Trang 21

S ở bước 1 với các mặt nạ trong phương pháp Gradient dựa theo các toán tử như Sobel, Pixel , Difference Ở đây ta tiến hành nhân xoắn ảnh S với hai mặt nạ theo hai hướng x và

Với f (x,y) chính là độ lớn của ảnh tại pixel (x,y)

Ta tiến hành tổng hợp hai kết quả đó để cho ra kết quả cuối cùng S':

  

Với θ là hướng của đường biên

Trang 22

Hình ảnh sau khi nhân xoắn ảnh S với hai mặt nạ H xH y:

Hình 4 Ảnh sau làm trơn ảnh dùng bộ lọc Gauss và nhân ảnh xoắn hai mặt nạ H x và

y

H

Bước 3: Chuyển ảnh từ độ lớn trong khoảng (0-255) về ảnh độ lớn trong (0-1) để làm nổi màu đen của ảnh lên (adjgamma)

Làm nổi ảnh bằng cách lấy giá trị độ lớn ảnh tại các vị trí pixel (x,y) trừ đi giá trị độ lớn

bé nhất của ảnh sau đó đem chia cho độ lớn ảnh lớn nhất sau đó dùng hàm gamma

function để làm nổi ảnh lên, cuối cùng ta được ảnh S‟ được làm nổi ảnh như sau:

Hình 5 Ảnh sau khi đưa về độ lớn trong khoảng (0-1)

Trang 23

Bước 4: loại bỏ một số điểm dư thừa: (Non-maximum suppression)

Đối với mỗi điểm ảnh trên ảnh S‟ ta tiến hành so sánh giá trị của điểm đó với giá trị của hai điểm lân cận điểm đó Hai điểm lân cận này là hai điểm nằm trên đường thẳng chứa

hướng của đường biên θ Công thức tính hướng của đường biên θ nằm ở bước trên

Tại mỗi điểm ảnh ta tiến hành tính toán hướng của đường biên, sau đó so sánh kết quả đó tìm ra hai điểm biên lân cận

So sánh giá trị điểm ảnh đang xét với hai điểm biên trên: Nếu điểm ảnh này là lớn nhất thì giữ lại điểm biên này (đánh dấu điểm biên này), ngược lại nếu nó nhỏ hơn một trong hai điểm biên lân cận thì điểm biên này bị loại đi (cho giá trị điểm biên này bằng 0)

Ta được kết quả ảnh sau khi đã loại đi một số điểm biên không phù hợp, lúc này số lượng biên trên ảnh nhìn thấy sẽ ít đi Điều này đặc biệt có giá trị tốt để loại bỏ một số biên dư thừa đặc biệt với ảnh có nhiều nhiễu

Cách xác định 2 điểm biên này như sau:

Cho  là góc hướng đường biên, r là khoảng cách từ vị trí pixel cần so sánh đến vị trí điểm biên

Hình 6 Hình mô tả 1 trong 2 điểm biên lân cận

C r

Trang 24

Sau khi tiến hành bước 3 ta tiến hành áp dụng ngưỡng: sử dụng hai ngưỡng, ngưỡng cao

Th và ngưỡng thấp Tl Những điểm biên được đánh dấu (không bị loại) ta tiếp tục tiến hành áp dụng ngưỡng cao và ngưỡng thấp:

- Xét điểm ảnh I tại vị trí (x,y)

- So sánh I(x,y) với hai ngưỡng Th và Tl

+ Nếu I(x,y) ≥ Th: đánh dấu và giữ lại điểm biên này (đặt giá trị bằng 1)

+ Nếu I(x,y) < Tl: Loại bỏ điểm biên này (đặt giá trị bằng 0)

+ Nếu Tl ≤ I(x,y) < Th: ta tiến hành so sánh giá trị I(x,y) với giá trị của 8 điểm lân cận : Nếu một trong 8 điểm lân cận có giá trị > Th: Tiến hành đánh dấu và giữ lại điểm biên này Ngược lại: Loại bỏ điểm biên này (đặt giá trị bằng 0)

Trang 25

Hình 8 Ảnh sau khi áp dụng ngưỡng

Kết quả tách biên mống mắt sau khi sử dụng phương pháp tách biên Canny:

Hình 9 Kết quả đạt được sau khi xử lý bằng lọc canny

1.2 Xác định tâm và bán kính đường bao đồng tử và đường bao mống mắt dùng biến đổi vòng tròn Hough:

Thuật toán Hough Circle Transform (HCT) được dùng để tìm đường tròn (gồm tâm và bán kính) trong hình cho trước

Phương trình đường tròn:

x=a+Rcos

y=b+Rsin

Trang 26

trong đó (x,y) là các điểm trên đường tròn có tâm (a,b) và bán kính R và  là góc quay từ 0

0 đến 3600

Từ các điểm (x,y) trên đường tròn ta chọn làm tâm lần lượt vẽ các đường tròn với bán kính khác nhau từ 0 đến R Ta xét tất cả các điểm nằm trên tất cả các vòng tròn này, ta chú ý một đặc điểm rằng có một vị trí sẽ có nhiều điểm được lặp lại nhiều nhất (các điểm này nằm trên các vòng tròn bán kính từ 0 đến R) đó chính là tâm của vòng tròn

Trang 27

Trường hợp 2: Không biết bán kính R

Trong trường hợp này ta cũng làm tương tự như trên nhưng thay vì với R=R A ta phải vẽ tất cả các đường tròn từ R=0, R=1, R=2… cho tới khi tìm được các điểm tại tọa độ (a,b) lặp lại nhiều nhất

Tóm lại, các bước để tìm tâm và bán kính theo Hough Circle Transform:

1 Load một ảnh

2 Phát hiện các đường biên theo phương pháp xác định biên Canny

3 Với mỗi điểm trên đường biên, ta sẽ chọn làm tâm đường tròn từ đó ta sẽ vẽ các đường tròn có bán kính thay đổi từ R=0…

Cách vẽ đường tròn từ mỗi điểm biên từ tâm ( ,c c x y) có bán kính r:

Cho x là 1 vector, x=1: r, và y thỏa mãn điều kiện sau:

 chính là tọa độ các điểm quét hết đường màu tím trên hình 12

Từ đó suy ra ta được vector p x và vector p y như sau:

x

p =c y+[x -x -x x]

y

p =c x+[y y -y -y]

Trang 28

Tọa độ theo thứ tự lần lượt các điểm (p xi,p yi) trong 2 vector p x và vector p y như trên sẽ

là tọa độ tất cả các điểm nằm trên đường tròn có tâm ( ,c c x y) và bán kính r

Hình 12 Ảnh minh họa các tọa độ ( p x , p y ) trên vòng tròn

4 Từ mỗi điểm trên các đường tròn trên, ta lập một dãy số bao gồm các điểm trùng nhau từ các điểm trên các đường tròn có cùng một bán kính, vị trí nào có các điểm trùng nhau nhiều nhất đó chính là tâm của vòn tròn cần tìm, và bán kính chính là bán kính của các đường tròn có cùng bán kính mà chứa các điểm trùng nhau trên

Trang 29

2 Chuẩn hóa dữ liệu mống mắt thành dạng hình chữ nhật:

Ta có thuật toán mã hóa như sau:

- Ban đầu =0, r=0 ta có điểm I(0,0) trên ảnh mống mắt sẽ được chuyển sang tương ứng với với thành phần (r,)=(0,0) trên ma trận hình chữ nhật

- Tiếp theo tăng  lên 1 độ ta được thành phần (0,1), cuối cùng =360 độ ta được thành phần (0,N) Ta được hàng ngang đầu tiên của ma trận hình chữ nhật

- Tiếp tục như vậy cho đến khi kết thức, kết thúc khi r=R (bán kính iris) và = 360

độ

Đây là trường hợp đường bao iris và con ngươi đồng tâm:

Trang 30

Hình 15 Các vòng tròn điểm để chuẩn hóa khi đường bao mống mắt và đồng tử đồng

Trang 31

Hình 16 Các vòng tròn điểm để chuẩn hóa khi đường bao mống mắt và đồng tử không

Trang 32

Hình 17 Kết quả thu được sau khi chuẩn hóa và làm nổi bật ảnh (enhance)

Trang 33

3 Trích mẫu dữ liệu dùng empirical mode decomposition:

 Empirical mode decomposition (EMD):

Empirical mode decomposition (EMD) là kỹ thuật phân hủy nhiều lớp và phù hợp

để phân tích tín hiệu không tuyến tính và tín hiệu không ổn định

Với EMD bất cứ dữ liệu phức tạp nào sẽ được phân hủy thành các dữ liệu IMFs (intrinsic mode functions), mỗi IMF thỏa mãn hai điều kiện sau:

- Số điểm không và số điểm cực trị của tín hiệu là bằng nhau hoặc khác nhau tối đa

là một

- Local mean của đường bao xác định bởi các điểm cực đại và các điểm cực tiểu là bằng không

Hình 18 Đường bao trên, đường bao dưới của dữ liệu data(t) và giá trị trung bình

của hai đường này

Quá trình xác định IMFs từ chuỗi dữ liệu z(t) (gọi làh0) (đường xanh dương trên hình (18)) được xác định như sau:

1 Xác định tất cả các giá trị cực đại và cực tiểu của z(t)

2 Xác định đường bao trên s1(đường xanh lá cây trên của hình(18)) và bao dưới s2

(đường xanh lá cây dưới của hình(18)) trên cơ sở các giá trị cực trị của z(t) bởi nội suy spline (cubic spline interpolation) để đường bao nối các điểm cực trị thành đường spline ( dùng lệnh spline trong code matlab)

3 Tính giá trị trung bình của đường bao trên và bao dưới (đường màu đỏ của

Trang 34

Hình 19: Giá trị h1

5 Kiểm tra h1:

- Nếu h1 thỏa mãn hai điều kiện trên để trở thành IMF, một IMF được nhận được

từ h1, và z(t) được thay thế bởi residual r(t)=z(t)-h1

- Nếu h1 không phải là IMF thì thay thế z(t) bằng h1

6 Lặp lại bước 1 đến bước 5 cho đến khi residual thỏa mãn tiêu chuẩn dừng phân hủy: khi residual là một hàm đơn điệu (monotonic function)

7 Lặp lại các bước từ 1) đến 6) tại bước lặp thứ k ta xác định được các chuỗi

1( ), 2( ), , k( )

lại của z(t)):

1 ( ) ( )

( )

k

i k i

Tiêu chuẩn 1: (được đề xuất bởi Huang (1998))

Khi SD nhỏ hơn một giá trị xác định (chọn là 0.01) thì h1 là IMF, với SD:

2 1

Trang 35

4 Áp dụng EMD để trích mẫu dữ liệu mống mắt:

4.1 Phương pháp 1:

1) Xác định miền thuận lợi để xử lý (region of interest hay còn gọi là ROI):

Hình ảnh mống mắt sau khi đƣợc chuẩn hóa:

Trang 36

3) Phân hủy vector V thành IMFs bởi EMD:

Áp dụng empirical mode decomposition (EMD) cho V ta đƣợc IMF1IMF m và thành phần còn lại gọi là residual r m Mỗi IMF đƣợc xem nhƣ là một vector mẫu dữ liệu

và đƣợc đặt tên thành V i i( 1, 2, , )m

Hình 21 Các IMFs thu được sau khi áp dụng EMD cho tín hiệu V

4) Thành lập vector mẫu mới (vector mẫu cuối cùng để đƣa về ma trận nhị phân dùng để nhận dạng):

Vector mẫu dữ liệu đƣợc tính nhƣ sau:

k i i

Trang 38

4) Thành lập mẫu dữ liệu mới để nhận dạng:

Áp dụng EMD cho dữ liệu V N ta đƣợc:

1 2( , , , , )

m m m m m

j n

Với m

R là đại diện cho residual thứ m kết quả phân hủy EMD cho V (chính là giá của N

của V trừ cho m IMFs), N m

Trang 39

Hình 23 Các IMF thu được sau khi áp dụng linear re-scaling và EMD cho tín hiệu

original (c1 đến c6 là các IMF, c7 là residual)

Trang 40

Hình 24 So sánh các IMF với dữ liệu ban đầu

Ngày đăng: 28/01/2021, 22:43

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w