Hầu hết các đặc trưng được trích rút đều khác biệt với các đặc trưng dùng khi so sánh; do đó, việc trích rút các đặc trưng cần được thực hiện 2 lân khi áp dụng lược đô này vào bât kỳ một
Trang 2-H à N ộ i - 2008
Trang 31 Nam e of the project:
Applying hashing algorithms for fingerprint image authentication
Project serial number: QC.06.10
2 Project leader: Ms Thu Dao Minh.
3 M ain results:
3.1 Scientific results:
> We present a new robust indexing scheme that’s able to fasten the fingerprint recognition process and propose a hasshing scheme for facial image recognition
> Published paper:
Thi Hoi Le & The Duy Bui (2008) A fast and distortion tolerant
hashing fingerprint image authentication In: Proceedings o f CỈSIS 2008,
Advances in Computing Series, Springer Verlag
3.2 Applications:
> Biometric recognition system
3.3 Training results:
s 02 student from K49C has finished their Bachelor thesis and
conferred the degree
3.4 Enhancem ent:
s To advance professional knowledge in image processing.
REPORT ON MAIN RESULTS OF PROJECT QC.06.12
Trang 4MỤC LỤC * •
1 Giới thiêu
2 Phương pháp băm với vân ta y
2.1 Mã sửa lỗ i
2.2 Đặc trưng thứ cap của dẩu vân tay
2.3 Đẻ xuất mã sữa lỗi đối với điểm đặc trưng dâu vân ta> 2.4 Lược dồ băm dựa trên từ mã ^
2.4.1 Đề xuất 5
2.4.2 Phản tích lỉ 2.4,3 Thực nghiệm 3 Phương pháp băm vói ảnh mặt người 3.1 So khớp trực tiếp
3.2 Vec-tơhóa
3.3 So khớp
3.4 Ket quả thực nghiệm
1:
13 14 14
Trang 5DANH MỤC BẢNG BIẺU, HÌNH VẼ
Hình 1 Đ ặc trưng vân vụn (minutiae) của m ột dấu vân t a y 7
Hình 2 Đặc trưng th ứ cấp c ủ a M , T rong đó rlữ và rti là khoảng cách E uclidean giữa vân vụn M t và các hàng x ó m của nó là N 0 v à N ị ạ>k là sai phân về hư ớn g giữa M t và N k trong đó k nhận giá trị 0 hoặc 1 ô biểu diễn góc n h ọ n giữa đoạn thẳng M ị N 0 và M IN ] [1 5] 7
Hình 3: C hia nhỏ m ộ t bức ản h thành các k h ố i 14
Hình 4 Kết quả thực n ghiệm băm ảnh trong nhận dạng khuôn m ặ t 15
Bảng 1 chỉ số CIP với thuật toán của chúng t ô i 12
Trang 6- 01 bài báo tại hội nghị quốc tế: Thi Hoi Le & The Duy Bui (2008) A
fast and distortion tolerant hashing fingerprint image authentication In:
Proceedings o f CISIS 2008, Advances in Computing Series, Springer
3.4 Kẽt quả nâng cao tiềm lực khoa học (nâng cao trình đò cán bô và
tăng cường trang thiết bị cho dơn vị):
- Nâng cao năng lực chuyên môn cua cán hộ bộ môn về các lĩnh Vực xử lý
Trang 7REPORT ON MAIN RESULTS OF PROJECT QC.06.12
1 Nam e o f the project:
Applying hashing algorithms for fingerprint image authentication
Project serial number: QC.06.10
2 Project leader: Ms Thu Dao Minh.
3 M ain results:
3.1 Scientific results:
> We present a new robust indexing scheme that’s able to fasten the fingerprint recognition process and propose a hasshing scheme for facial image recognition
> Published paper:
Thi Hoi Le & The Duy Bui (2008) A fast and distortion tolerant
hashing fingerprint image authentication In: Proceedings o f CISIS 2008,
Advances in Computing Series, Springer Verlag
3.2 Applications:
> Biometric recognition system
3.3 Training results:
s 02 student from K49C has finished their Bachelor thesis and
conferred the degree
3.4 Enhancem ent:
s To advance professional knowledge in image processing.
Trang 81 Giới thiệu
Củng với sự mở rộng của thế 2.ĨỚÌ sổ thì xác thực cá nhân mọt cach tin cạy đa trơ thành mối quan tâm lớn trong những hoạt động giao tiêp giữa con ngu OI va may tính Chứng minh thư điện tử, thương mại điện tử và truy cập mạng máy tinh đeu là những lĩnh vực mà trong đó các thông tin về định danh người dùng la vo cung quan trọng Các phương pháp an ninh sử dụng mật khẩu hay thẻ từ đã đuọc dùng nhiêu
để truy cập đến các tài nguvên trong xã hội thực và và xã hội ảo Du rai pho dụng song những phương pháp này vẫn chưa đảm bảo vê mặt an ninh Tệ hơn nũa là chúng có thể bị chia sẻ hay đảnh cắp một cách dễ dàng Mật khâu và các sô PIN thậm chí còn có thổ bị đánh cấp thông qua các thiết bị điện tử Hon thê nữa, chúng không phân biệt được đâu là người dùng được định danh vả đâu là kẻ giả mạo lừa đào Các biện pháp sinh trắc học như dấu tay, khuôn mặt và giọng nói cho ta cách xác thực cá nhân tin cậy và còn giúp giải quyết vấn đề trên, các biện pháp này ngày càng thu hút sự quan tâm cùa chính phủ và người dân
Mặc dù dã có nhiêu kêt quả quan trọng trone việc xây dựng các hệ thông định danh dấu sinh trắc học, vẫn còn có nhiều vấn đề cầnnghiên cứu để tăng cường hiệu quả của hệ thống Nhận dạng sinh trắc học tự động là quá trình đòi hỏi rất nhiều tính toán, nhất là với một cơ sở dữ liệu lớn Thiểu phương pháp đánh chỉ số sinh trắc hoc hiệu quả, ta sẽ phải so sánh toàn bộ một mẫu sinh trắc học được yêu cầu vói toàn bộ các mẫu sinh trắc học khác trong co sở dữ liệu, đây là điều rất cần tránh trong thực
tê Tuy nhiên, không giông như hệ thống mật khẩu, trong đó các mật khẩu được so khớp tuyệt đôi nhăm định danh một cá thể nào đó, với hệ thống nhận dạng sinh irắc học ta chỉ có thể so sánh gần đủng để tìm ra thông tin định danh cá thể với mức độ tin cậy nhất định do các mẫu sinh trắc học mỗi lần thu nhận lại có sự sai khác nhất định với những lần trước Như vậy, ta cần có một số cơ chế chấp nhận lỗi mà vẫn không làm giảm tính an ninh của hệ thống
Có 2 lựa chọn công nghệ để giảm thiểu lượng so sánh trone các hệ thống định danh sinh trào học để có thể giàm thiểu đươc thời gian hồi đáp của một tiến trình nhận dạng: kv Thuât phân lớp và kv thuật đánh chi mục
Vơi cái hệ thong 5ử dụnc ván tay cac ky thuật phản lớp truyền thốne ([5] [16]) cố rãne ph.T dâu tay thanh 5 lòp: Vong phải (R) vòng trái (ĩ ), von? xoắn ốc (W)
Trang 9vòng cung (A) và Tented Arch (T) Do sự phân bố tự nhiên không đồng đều nên số lượng các lớp không lớn và các dẩu tay trong thực tê của môi lóp cũng không đêu nhau: trên 90% dấu tay thuộc về 3 lớp đầu [18] Điều này dẫn tới kết quà là không thể giảm không gian tìm kiếm xuống một cách hợp lý những hệ thống như vậy Kỹ thuật đánh chỉ mục thực hiện tốt hơn kỹ thuật phân lớp vấn đề định kích cỡ không gian cần để tìm kiếm Các thuật toán đánh chỉ mục dấu vân tay chọn tất cả những ứng viên cần thiết và sắp xếp chúng theo sự tuơng đồng với đàu vào so sánh Gần đây, nhiều thuật toán đánh chỉ mục đã được đề xuất A.K.Jain [13] sử dụng các đặc trưng quanh điểm lõi của một ảnh lọc Gabor để nhận chỉ mục Mặc dù cách tiếp cận này phải dùng đến các thông tin toàn thể (điểm lõi) nhưng khả năng nhận đúng chỉ một lõi là bị hạn chế Trong [2], kỹ thuật này dùng điểm đơn (SP) để ưóc lưọng độ
ưu tiên tìm kiếm và nhờ đó không gian tìm kiếm giảm xuống 4% trên toàn bộ tập dữ liệu Tuy nhiên việc tìm ra điểm đơn không phải đơn giản Một số dấu vân tay thậm chí còn không có điểm đơn và tình trạng nhập nhằng khi xác định điểm đơn là khá lớn [18] Bên cạnh đó, còn có nhiều yếu tố nữa làm hỏng chỉ số dấu vân tay trong các phương pháp khác R.Cappelli đã đề xuất một cách tiếp cận mới gần đạt được
sự hợp lý trong khi thực hiện và thời gian nhận dạng Germain và cộng sự [10] sử dụng bộ ba các vân vụn trong phần đánh chì mục J.D Boer [3] lại tích hợp các đặc trưng đa dạng (trường hướng, FingerCode và bộ ba minutiae - các đầu mút của các đường vân tay) Hầu hết đều thực hiện đánh chỉ mục sau khi thay thế các đặc trưng này bỏi một số đặc trưng khác Hầu hết các đặc trưng được trích rút đều khác biệt với các đặc trưng dùng khi so sánh; do đó, việc trích rút các đặc trưng cần được thực hiện 2 lân khi áp dụng lược đô này vào bât kỳ một hệ thống vân tay nào đã có
từ trước đến nay Han nữa, kết quả so sánh không chỉ bị ảnh hưởng bởi các lỗi sinh
ra trong quả trình đánh chì mục mà còn do tiến trình trích rút đặc trưng phụ
Một điểm mẩu chốt là làm sao để thuật toán đánh chỉ mục trở nên mạnh mẽ hơn, nhận diện được cả những mẫu sinh trác học bị biến dạng Có 2 dạng biến dạng: biến dạng do dịch chuyển và biến dạng hệ thống Trong hầu hét các lược đồ đánh chỉ sổ, các biến dạng do dịch chuyển có thể xử lý được bằng cách đánh chỉ số trên các đặc trưng bất biến Tuy nhiên, cách làm này sẽ phức tạp hơn với trường hợp dữ liệu sinh trãc học Vì nguôn dữ liệu sinh trẳc học cực kỳ đa dạng nên 2 mẫu không thể có cùng kích cỡ hay hướng Kết quả là trong một mẫu, một sổ đặc trưng có thể bị mất
và các tập đặc trưng sẽ không còn hợp lệ nữa Đây là vấn đề rắc rối trong cả thuật toán so sánh và thuật toán đánh chỉ mục
Trang 10„ : , I nhuc những vấr
đặc trưng, chúng tôi định lưu các thuộc tinh dung thứ loi trong khau so sanh d’;
đề xuất ờ [15] Nói cách khác, mỗi cập đặc trưng sẽ được so sánh cùng nhauchúng cùng chia sẻ một giá trị băm như nhau trong lược đo cua chung toi Hơnjnữa, để làm giảm số cặp so sánh, chúng tôi có thê sử dụng mọt lược đo bam ngnhiên để làm giảm các trùng lặp ở đầu ra Sau đó chúng toi cung đe xuat R)phương pháp bãm ảnh để áp dụng với bài toán nhận dạng khuon mạt
2 P h ư ơ n g p h áp băm với vân tay
2.1 Mã sửa lỗi
Cho trước độ đo d, ta có thể xác định các mã sửa lỗi trong không gian tương ỦI
K Một mã là một tập con c = {w, WK) c M Tập c còn được gọi là kho
(codebook), các thành phần K của tập này chính là các từ mã Khoảng cách (nil
nhất) của một mã là khoảng cách d nhỏ nhất giữa 2 từ mã phân biệt (phụ thuộc Vỉ
độ đo đ) Cho trước một kho mã c , ta có thể xác dinh một cặp hàm (c , D) Hà:
mã hóa c là một bản đồ xen kẽ các phàn tử của những miền xác định có độ lớn
với các phân tử của c Hàm mã hóa D ánh xạ mỗi w e M thành một ảnh pre-imaạ
c ' f WA ] thuộc từ mã wt để khoảng cách J[w ,w t ]Ia tối thiểu Phạm vi sửa lỗi có bai
kính lớn nhât là ( đê với mọi phân tử M/ trong M ta chỉ có một từ mã trong vùng bi
hiệu tắt chuẩn trong lý thuyết mã hóa là bộ (M K j )
2.2 Đặc trưng thứ cấp của dấu vân tay
r>
Trang 11Hình 1 Đặc tru-ng vân vụn (minutiae) của một dấu vãn tay
Mỗi đặc trưng thứ cấp của đấu vân tay là một vectơ có 5 thành phần (xem hình 1)
Với mỗi vân vụn (minutiae) M ịix^ y^O ị) và 2 hàng xóm gần nhất là N a (x„0,y n0,ỡn0)
và Nị (x ị,y„Ị,ỡ„Ị), đặc trưng thứ 2 được cấu thành nên nhờ việc định dạng vectơ
s (/'ũ, r 1,ípiũJ<7}íi,áí) mà trong đó rtữ và r t là những khoảng cách Euclidean giữa vân vụn trung tâm M và các hàng xóm của nó là N0 và N ] (plk là sai phân về hướng giữa M, và Nk , trong đó k nhận giá trị 0 hoặc 1 ốt biểu diễn góc nhọn giữa đoạn thẳng M ịNũ và MịNị.
H ình 2 Đ ặ c tr u n g th ứ cấ p cùa M T r o n g đ ó r:ũ và Tj là k h o ả n g cá ch E u c lid e a n giữ a vân yụ n M vâ
các h àn g xóm củ a nó là N ữ và (p k là sai p hân về h iró n g g iũ a M và N k tro n g đó k n h ận giá trị
0 hoặc 1 Ố' biếu d iễn g ó c n họn giữ a đ oạn th ẳ n g M N ữ và M N [ [16].
Lưu ý rằng N0 và A', là 2 hàng xóm gần nhất của vân vụn trung tâm M, và chúng
được đưa ra không phải nhờ khoảng cách Euclidean của mình nhưng chủng phải thỏa mãn bất đẳng thức:
Trang 12Trong đề tài này, chủng tôi đề xuất một lược đồ băm cỏ thể khắc phục những vấn đề tồn đọng đã nêu ơ trên Đầu tiên chúng tôi trình bày phương pháp xử lý vân tay với việc đưa ra một định nghĩa về từ mã (codeword) của điểm đặc trưng dâu vân tay và một lược đồ bãm sẽ thực thì trên các từ mã này Đẻ thu được các mã tự từ các điểm đặc trưng, chúng tôi định lưu các thuộc tính dung thứ lỗi trong khâu so sánh được
dề xuất ờ [15] Nói cách khác, mỗi cập đặc trưng sẽ được so sánh cùng nhau vả chúng cùng chia sẻ một giá trị bãm như nhau trong lược đồ cùa chúng tôi Hon thế nữa, để làm giảm só cặp so sánh, chúng tôi có thể sử dụng một lược dô bãm na,ẫu nhiên để làm giàm các trùng lặp ờ đầu ra Sau đó chúng tôi cũng đề xuât một phương pháp băm ảnh để áp dụng với bài toán nhận dạns khuôn mặt
2.1 Mả sừa lỗi
Cho trước dộ đo d , ta có thê xác định các mã sữa lỗi trong không gian tương úng
K Môt mã là một tập con c = ■» ,11, Ị c M Tập c còn được gọi là lcho mã
(c.ơdebook), các thành phần K cùa tập nay chính là các từ mã Khoảng cách (nhỏ
nhất) cùa một mã là khoảng cách d nhỏ nhất giữa 2 từ mã phân biệt (phụ thuộc vào
dộ đo d) Cho trước một kho mã c , ta có thể xác dinh một cặp hám (C ,D ) Hàm
mã hóa c là một bản đô xen kẽ các phần từ của nhữne miền xác định có độ lởn K
VỚI các phân tử của c Ham mã hóa D ả nh xạ môi w F M thảnh một ảnh pre-imaíỊS
c [wk] thuộc từ mã » đẻ khoảng cách d[w,wt ] là tối thiểu Phạm vi sửa lỗi có bán
kính lớn nhãt là / đê với mọi phân tù vv trong M ta chì cù một từ mã trong vùng hán
hiệu tăt chuẩn trong lý thuyết mã hóa là bộ ( M K t )
2.2 Đặc trưng thứ cấp của dấu vân tay
6
Trang 13Hình 1 Đặc trung vân vụn (minutiae) cùa một dấu vân tay
Mỗi đặc trưng thử cấp của dấu vân tay là một vectơ có 5 thành phần (xem hình 1)
Với mỗi vân vụn (minutiae) M ^ x ^ y ^ G ị) vả 2 hàng xóm gần nhất là N 0 (xn0,y n0,ỡnũ)
vụn trung tâm M và các hàng xóm của nó là N0 và Nị ẹ tk là sai phân về hướng giữa M ' và Nk , trong đó k nhận giá trị 0 hoặc 1 ỗ biểu diễn góc nhọn giữa đoạn thẳng M Nữ và M iN ].
V / / \ ô
H ình 2 Đ ặ c tr u n g th ú cấ p của M r T ro n g đó r 0 và r.j là k h o ả n g cá ch E u clid ea n giữ a ván yụ n M và
các h à n g xóm của nỏ là N0 và N ị <pik là sai phân về huóm g g iũ a M và Nk tr o n g đó k n hận giá trị
0 h o ặ c 1 Ỗ biêu d iễn gó c n họn giữ a đ oạn th a n g M Nc và A/,A': [16],
Lưu ý ràne Nữ và iV, là 2 hàng xóm gần nhất của vân vụn trung tâm M và chúng
được đưa ra không phải nhờ khoảng cách Euclidean của mình nhưng chúng phải thỏa mãn bất đẳng thức:
Trang 14NữM txNịM' >0
No là vân vụn thứ nhất và N] là vân vụn thứ cấp được thu nhận trong quay một góc
Z A ' , V / , V ,
p ịr ,,<D ,e ) tương hợp với , , 0 ( i ; | , nếu qt thuộc vùng dung sai của
p Bởi vậy các hàm ngưởng cho trước Thldr {.), Thỉdệ (.), và 7hldg(.),
\răJ - r ư \<Th!dr (r„.), \ệư - ệ J < T h l d ệ (ậiy) và \ e , , < Thldg (ớ,y ) Lưu ý ràng
các ngưỡng này không phải là các giá trị được xác định trước nhưng ta hoàn toàn có
thể điều chinh được theo r„ và ry,
Trong tài liệu này ta coi đặc trưng dấu vân tay thử cấp như một điêm đặc trưng
2.3 Đề xuất mã sửa lỗi đối với điểm đặc trưng dấu vân tay
Hau hết các lược đồ sửa lỗi đều lưu ý đến khoảng cách Hamming và dùng đại lượng này để chinh một thông điệp ờ mức bít (ví dụ như các bit kiểm tra parity, lược đó
mô phòng CRC, .) Bởi vậy chúng tôi định nghĩa một hàm sửa lỗi mới cũng nhu
từ mã của điểm đặc trưng dấu vân tay Cụ thể, ở đây chúng tôi chi đề xuất một hàm
mã hóa giông quá trình giải mã những đặc trưng khòng cân thiêt
Định nghĩa 1: Cho x e R ũ , và c ( x ) là hàm mã hóa cùa lược đồ sửa lỗi với các khoảng chữa lỗi là t Ta định nghĩa C(x) = (ợ ( x - / ) I ợ (x) lợ (>: + /)] trong đó q(x) lí hàm lượng từ của X với bước lượng tử là t Ta gọi tập xuất của c ( x ) ịc, ,,c c,„)lí
tập từ mã của X và CI = q{x) là tư mã gần nhất cùa X hay nói tất là từ mã cùa X
X ) • < í , thì từ m ã c u a y là c = q ( y ) sẽ trở t h à n h m ộ t t h à n h p h ầ n tro n g tập từ mã
của X
Ta ^ thè chứne minh bổ đC ỉ mõt cach de dàn,? n h à các phép biến đói đai sổ
Trang 15Theo cách của mình, chúng tôi sinh một tập từ mã cho tất cả các điểm đặc trưng vân tay mẫu q và chỉ sinh từ mã cho tất cả các điểm truy vấn p Theo bô đê 1 và định
nghiã về 2 điểm đặc trưng tương xứng, ta có thể thấy ràng nểu p và q là các điểm
đặc trưng tương ứng của hai phiên bản xuất phát từ cùng một dấu vân tay thì từ mã
của q sẽ là một thành phần trong tập từ mã cùa p
2.4 Lược đồ băm dựa trên từ mã
Chúng tôi xin trình bày một lược đồ tạo băm đấu tay dựa trên từ mã của điểm đặc trưng Ý tưởng chính là: đầu tiên, “chuẩn hóa” các điểm đặc trưng lỗi thành từ mã, sau đó dùng từ mã này làm đàu vào của một hàm băm ngẫu nhiên, hàm này có thể phân rải tập đầu vào và đảm bảo rằng khả năng đụng độ của 2 điểm'đặc trưng có liên quan mật thiết đến khoảng cách giữa các cặp tọa độ tương ứng của chúng (đã được đưa ra trong định nghĩa về 2 điểm đặc trưng tương xứng)
2.4.1 Đ ề x u ấ t
Mô tả chung Đầu tiên, chủng tôi giải thích tại sao dùng và dùng như thế nào một hàm băm ngẫu nhiên để bảo đảm ràng nó sẽ có những tính chất chịu lỗi và chịu xung đột Thứ hai, chúng tôi xin trình bày việc sử dụng hàm băm để xây dựng một lược đồ băm các điểm đặc trưng của dấu vân tay
Các đặc trưng dấu vân tay đã lưu trữ trong cơ sở dữ liệu được xác định là rất lớn Bởi vậy, chúng tôi muốn thiết kế một hàm băm dành cho các tập đầu vào lớn, nó không chắc là các thành phần xung đột Có một cách đạt đưọc tính chất này là sinh ham băm ngẫu nhiên hơn Trong bài báo này, chúng tôi có được tính chất này như sau Đầu tiên, hoán vị các bit thông điệp và thông điệp kết quả sẽ được chia ra thành nhiều khối có kích thước bang nhau Ta tính toán các khối băm này (dùng hàm nén như SHA) và sau đó nối lại, sử dụng làm đầu vào chuỗi móc nối của tập con từ cac khối, các tập con này đủ nhỏ và khác biệt nhau Ý tường cơ bản là với bất cứ tập đầu vào cho sẵn nào, thuật toán này sẽ phân tán các dữ liệu vào trong phạm vi của hàm để đầu ra theo xác suất sẽ được phân bố ngẫu nhiên hơn
Để đảm bảo tính chịu lỗi, hàm băm sẽ thực hiện trên từ mã (đối với các điểm truy vấn) và tập từ mã (đổi với các điểm mẫu) thay vì trên bản thân điểm đặc trưng Chúng tôi đi từ định nghĩa về các điểm đặc trưng thứ cẩp (xem phẩn 2.2) và bổ đề 1
Trang 16đó là đ iể m truv v ấ n y v a đ iể m m ẫ u X là t ư ơ n g x ứ n g n ê u v à c h ì n ê u tù m ã cu a V là
m ột thành phần trong tập từ m ã cùa X
Đặc tả chính xác Chunẹ tôi thiết đặt lược đồ băm như sau:
1 Chọn các chiều ngẫu nhiên từ (1-2 D): bằng cách này, chủng tôi điêu
chình sự cân bằng giữa xung đột của các giả trị băm và không gian cơ sỏ' dừ liệu của mình
2 Chọn một khoảng cách sửa lỗi và độ đo thích hợp /^cho những chiêu đà chọn
Với mỗi điểm mẫu p :
1 Sinh tập từ mã cho p đ Các giá trị này được ánh xạ sang các xâu nhị phân.
2 Các xâu nhị phân trone tập từ mã của những chiều đã chọn lại được nối VÓI
dã chọn
3 Hoán vị mt và biêu diễn lại dại lượng này dưới dạng các khối có kích thước
băng nhau Với mỗi đại lượng m :
các khôi Biểu diễn lại các tập con s như một xâu chuỗi của các khối.
c Trả lại sh = sỉị \ sh
4 T ôn tại tôi đa ú giá trị băm cùa từng p Các giá trị này được lưu trong cùng
một bảng bãm cũng như những giá trị phân tách
Với điểm truy vẩn q :
1 Tinh giá trị từ mã gần nhất cho toàn bộ các chiều đã chọn của q Sau đỏ ánh
xạ giá trị này thành một xâu nhị phân
2 Các xâu nhị phân tương ứng với các chiều đã chọn lại được xâu chuỗi lại
3 Thực hiện bước 3 và 4 giông điêm mẫu Lưu ý răng chỉ có một xâu nhị phân
tương ứng với điêm truy vấn q
4 T ra lại tât cà cac điêm có cùng giá trị băm định danh với q
Voi đánh gia tru> ván hãm hám do chung tôi đưa ra sẽ trả vê tất cả các tương xứng tiêm r.inr Voi tàt t điêm đặc trưn.c truy vấn Vì the mỗi dấu vân tay truy vẩn được
10
Trang 17xem như một tập các điêm, giả lập một đánh giá truy vân đa điêm Đê thực hiện được điều này một cách hiệu quả, chúng tôi sử dụng một khung chỉ mục như Ke[17], trong đó, chúng tôi giữ hai cấu trúc chi mục bổ trợ - bảng file (File Table - K.T) và bảng điểm khóa (Keypoint Table - KT) - để ánh xạ các điểm đặc trưng vào dấu vân tương ứng với chúng; một đầu vào trong KT bao gồm chì mục File (vị trí chỉ mục của KT) và thông tin về điểm đặc trưng.
Các dấu vân mẫu có những điểm có cùng giá trị băm đồng nhất (các xung đột) với một phiên bản truy vấn được xếp hạng nhờ lượng điểm tương tự Chỉ có các mẩu N được chọn để nhận dạng dấu vân tay truy vẩn nhờ so sánh Bởi vậy, không gian tìm kiếm đã giảm đáng kể, Tiến trình chọn lựa ứng viên yêu cầu chỉ trả một giá tính toán tuyến tính để có thể áp dụng truy vẩn tương tác online trên các tập ảnh lớn.2.4.2 P h â n tích
1) Độ phức tạp về không gian
Đẻ nhận dạng đấu vân tay tự động, chúng tôi phải định ra một bộ lưu trữ cực lớn
các giá trị băm cùa dấu vân tay mẫu Giả sử sổ điểm đặc trưng D chiều được rút ra
từ phiên bản mẫu là N V ở i L chiều đã chọn, không gian tổng cần thêm cho một mẫu là ũ ị ứ N Ỵ
Do vậy, lưcrc đồ băm cần một cấu trúc dữ liệu có kích cỡ đa thức cho phép đạt tới thời gian sub-linear của các hàng xóm gần như sẽ chỉ ra ở phần dưới
2) Độ phức tập về thời gian
Trên dấu vân tay truy vấn Y có N điểm đặc trưng, chúng tôi phải
lượng tử, các hàm này cần độ phức tạp thời gian là hằng số
- Tính giá trị băm với độ phức tạp 0 { t i m e ( f Dx )}trong đó / l à hàm băm và
t ỉ m e ( f , x ) là thời gian mà hàm / cần với đầu vào làx
- Tính điểm tương tự của các mẫu, các mẫu này có điểm chung giá trị đồng nhất
vói cùng dấu tay truy vấn, có độ phức tạp thời gian là O( B N) trong đó B là
kích thưó'C bucket của bảng băm
Trang 18Bởi thể nên lượng khóa sẽ là OịB.N + time( / , x))
2.4.3 T h ự c nghiệm
Chúng tôi đánh giá phương pháp nàv bàng cách kiêm thử trên co sỏ dũ iiệu FVC2004 [19] có 300 bức ảnh, cứ 3 bức chụp một dẩu vân tay, có 100 dâu vân tay khác nhau Cơ sở DBI A lưu mẫu vân tay từng phần với các kích thước khác nhau Các bức ảnh nay được thu nhận nhờ một cám biên quang có dộ phân giải là 500dpi, kết quả cho ra là các ảnh có kích thước 300x200 pixel vói 8 bit câp xám Sử dụng mẫu gốc đầy đù để xây dựng cơ sở dữ liệu, trong đó đê nguyên 7 dâu đê băm
Chúng tôi sử dụng thuật toán trích rút đặc trưng nhu đã mô tả trong tài liệu [15] trong hệ thống của mình Tuy nhiên, các tác giả không đề cập chi tiểt dến việc xác định ngưỡng của độ dung lỗi ra sao Bới vậy, trong thực nghiệm này, chúng tôi giả
thiêt khoảng cách sửa lôi t là cô định với tât cả các điêin đặc trưng dâu vân tav Giả
định nàv sẽ khiến cho việc thực nghiệm không, đạt tới trạng thái tốt nhất để thuật toán tương xứntỉ tổ chức 2 điểm đặc trưng thành “tương xúng”, thuật toán này đã đề xuất trong [15] có the sẽ không có cùng giá trị băm trong thực nghiệir của chúng tôi
Chủng tôi cũng sừ dụng khoảng cách Euclidean eiữa các chiều tưcmg ứng cua vectư đặc trưng trong hàm bãm lượng tử
Bảng I cho thấy Correct Index Power (CIP) được xác dinh nhờ tỷ lệ các truy vấn được đánh chỉ mục một cách chính xác, các truv vấn này dựa trên tỷ lệ ^iả thiết cần được tìm trong bước xác minh Mặc dù thử nghiệm của chúne tôi không đạt mức hoàn hảo, lược đồ vẫn đạt kết quả CIP tốt Có thể dễ dàng thấy tỷ lệ tìm kiếm lứn hơn cho kết quả tôt hơn Điêu này cho thây răng thử nghiệm hoàn hảo có thể nâng cao kêt quả thực hiện
Bảng 1 chì số CIP với thuật toán cùa chúng tôi
i n d i r e c t In d ex 1 RowV » ' V * r ậ i-J&' fi*ứerSearch
Trang 193 P h ư ơ n g p h áp b ă m với ản h m ặ t n g ư ờ i
Trong phần này, chúng tôi trình bày phương pháp của chúng tôi để giải quyết bài toán định danh thông qua ảnh mặt Đối với ảnh mặt, chúng tôi sử dụng các đặc trưng SIFT [20] và thuật toán băm Local Sensitive Hashing (LSH) [1] ứ n g dụng thuật toán băm LSH vào việc nhận dạng mặt hoàn toàn hợp lý vì sổ chiều của vec-tơ đặc trưng được trích chọn là khá cao
Phương pháp cùa chúng tôi được tiến hành trong hai giai đoạn: Vec-tơ hóa và so khớp
3.1 So khớp trực tiếp
Phương pháp thường đùng với các đặc trưng để tìm đủng ảnh mặt là so khớp trực tiếp các đặc trưng này Phương pháp này cũng có thể áp dụng ngay với các đặc trưng SIFT và chọn ảnh mặt nào có số lưọng đặc trưng khớp nhất Tuy nhiên phương pháp này đòi hỏi lượng tính toán nhiều, đặc biệt khi dữ liệu lớn
3.2 Vec-tơ hóa
Khi ghép các đặc trưng SIFT lại với nhau, chúng ta được một vec-tơ Các vec-tơ này của các khuôn mặt khác nhau, có sổ chiều khác nhau do số điểm đặc trưng thu được là khác nhau Tuy nhiên để có thể dùng các đặc trưng này với thuật toán LSH, chúng ta phải chuẩn hóa số chiều của vec-tơ đặc trưng Chúng tôi-chuẩn hóa số chiều này bằng cách chia nhỏ ảnh khuôn mặt ra thành các khối với một lưới cố định rồi lẩy giá trị trung bình của các đặc trưng SIFT cho mỗi khối Như vậy ta thu được một vec-tơ đặc trưng thứ cấp với số chiều cố định để có thể áp dụng vào thuật toán LSH
Trang 20B8B- ' 19«
S i L - 'ịj 11
i s a i t f SHI
i l l i f j s f s iiiiihitiidB
v illg B d llĨÌHBmBKÌí
3.4 Kết quả thực nghiệm
Trong quá trình thực nghiệm, các thông số SIFT được khời tạo đúng, như đề xuất cùa Lowe [20] Ngưỡng DoG dược đặt là 0.0075 Giá trị D, dùng để loại bỏ những đặc trưng ứng viên có dộ tương phản thấp, được đặt là 0.008 Chúng tôi sừ dụn£ phiên bản E2LSH, được cài đặt bởi Alexandr Andoni Các tham số của LSH đều là giá trị mặc định
Cơ sỡ dữ liệu thực nghiệm là YaleB Cơ sở dữ liệu nảy tập trung vào sự khác biệt
vê màu săc và biểu lộ khuôn mặt Cơ sở dữ liệu này gồm 20 đối tượne 3 ảnh cho môi đôi tượng được lưu lại 70 ảnh khác của 20 đổi tượng này dùng để kiểm thử
Giai đoạn kiêm thử được thực hiện với sồ lượng ứng viên k khác nhau Hình 4 cho lha} kei qua thực nghiệm là độ chính xác với các k khác nhau và các cách lấy mẫu
được khôi lượng tinh toán mà vẫn giữ được độ chính xác
14
Trang 21hệ thống định danh không bị ảnh hưởng do tiến trình của chúnẹ tôi co hẹp không gian lại Chúng tôi cũng đã trình bày một lược đồ bãm ngẫu nhiên có khả năng giảm bót các xung đột đâu ra cho một tập đâu vào lớn Thực nghiệm cũng chỉ ra rằng lược đồ của chúng tôi có thê giảm đáng kể lượne công việc phải thực hiện đối với
Trang 22trạng thái tương ửne với điểm đặc trưng Đe hệ thống thêm hiệu quả và để tãng CIP lên ngưởng xáp xi 100%, chúne tôi sẽ xây dựng một quá trình thực thi với những lựa chọn tôi ưu về tham số khoảng cách sửa lỗi và thực hiện các thử nghiệm trên nhiêu tập dữ liệu biến dạng hơn Với ảnh khuôn mặt, phương pháp băm ảnh cũne hứa hẹn mang lại hiệu quả mà vẫn giữ được độ chính xác cao.
16
Trang 23TÀI LIỆU THAM KHẢO*
[]] Alexandr Andoni and Piotr Indyk, "Near-Optimal Hashing Algorithms for Near Neighbor Problem in High Dimensions" in Proceedings o f the Symposium on Foundations o f Computer Science (FOCS'06), 2006
[2] Bazen A M and Sabih H Gerez (2003) Fingerprint matching by thin-plate spline modeling o f elastic deformations Pattern Recognition, issue 36, pages 1859-1867
[3] Bazen A M., Verwaaijen G T B, Garez s H., Veelunturf L p J., and B J van der Zwaag (2000) A correlation-based fingerprint verification system ProRJSC2000 Workshops on Circuits, Systems and Signal Processing
[4] Boer J., Bazen A., and Cerez s (2001) Indexing fingerprint database based on multiple features ProRISC 2001 Workshop on Circuits, Systems and Singal Processing
[5] Brown L (1992) A survey o f image registration techniques ACM Computing Surveys
[6] Cappelli R., Lumini A., Maio D., and Maltoni D (1999) Fingerprint Classification by Directional Image Partitioning IEEE Trans, on PAMI, volume
21, issue 5, pages 402-421
[7] Cappelli R., Maio D., and Maltoni D (2000) Indexing fingerprint databases for efficicent 1 : n matching Sixth Int.Conf on Control, Automation, Robotics and Vision, Singapore
fingerprints using distortion-invariant phase-only filter SPIE, Photonic devices and algorithms for computer, volume 3805, pages 162-170 (20)
[9] Fingerprint verification competition, http://bias.csr.unibo.iưfvc2002/
transformation parameter clustering IEEE Computational Science and Eng., volume 4, issue 4, pages: 42-49
Hall
minutiae texture features (2001) International Conference on Image Processing pages 282-285
Trang 24[13] Anil Jain, Salil Prabhakar, Lin Hong, and Sharath Pankanti Filterbank-based
846-859
filterbank for fingerprint representation and matching Computer Vision and Pattern Recognition IEEE Computer Society Conference, volume 2, pages 187- 193
and matching of partial fingerprint recognition systems SPIE, pages 39-50
fingerprint recognition system Pattern Recognition, volume 38, issue 10, pages 1672-1684
Recognition, volume 18, issue 3 pa^es 389-404
duplicate and sub-ima&e retrieval system MM International Conference on Multimedia, pages 869-876
usine minutiae detail and delaunay triangle 3rd International Symposium on Voronoi Diagrams in Science and Engineering (ISVD'06), pages 217-223
International Journal of Computer Vision, 60 2, pp 91-1 10, 2004
Third Fingerprint Verification Competition", Proc International Conference on Biometric Authentication (ICBAÌ, pp 1-7, Hong Kong, July 2004
matching Indian Conference on Computer Vision, Graphics and Image Processing, pages 503-508
(2003) Guide to Biometrics Springer Verlag
Trang 25HANOI - 2008