Trên thế giới hiện nay phương thức xác thực phổ biến vẫn là sử dụng các ký tự làm mật khẩu và xu hướng đặt mật khẩu của người dùng có thể là sở thích, tên một nhân vật nổi tiếng ưa thích
Trang 1Luận văn
Vấn đề xác thực người dùng và tầm quan trọng
của nó
Trang 2CHƯƠNG I: GIỚI THIỆU KHÁI QUÁT VỀ XÁC THỰC
1.1 Định nghĩa xác thực
Xác thực (tiếng anh: Authentication = thật hoặc chính cống) là một hành động nhằm thiết lập hoặc chứng thực một cái gì đó (hoặc một người nào đó) đáng tin cậy, có nghĩa là những lời khai báo do người đó đưa ra hoặc về vật đó
là sự thật Xác thực một đối tượng còn có nghĩa là công nhận nguồn gốc của đối tượng, trong khi, xác thực một người thường bao gồm việc thẩm tra nhận dạng của họ Việc xác thực thường phụ thuộc vào một hoặc nhiều nhân tố xác thực để minh chứng cụ thể
Xác thực là đặc biệt quan trọng để cho sự hoạt động của hệ thống được an toàn Hệ thống luôn luôn trước tiên xác thực một thực thể khi nó cố thử thiết lập
sự liên lạc Khi đó nét nhận dạng của thực thể được dùng để xác định sự truy nhập của nó như một đặc quyền hoặc để đạt được sự sẵn sàng phục vụ Suốt quá trình thực hiện giao thức xác thực, hai bên luôn luôn trao đổi bí mật chung, mà
nó sẽ được dùng để đưa đến sự bảo mật và toàn vẹn
1.2 Vấn đề xác thực người dùng và tầm quan trọng của nó
Hệ thống xác thực người dùng đóng vai trò hết sức to lớn trong việc bảo mật thông tin của người dùng trong thời kì hiện đại hoá ngày nay Các bạn đã bao giờ đặt ra câu hỏi nếu không có hệ thống xác thực người dùng thì làm sao giữ an toàn được những thông tin bí mật hoặc làm sao quản lý được các bí mật trong kinh doanh, thương mại và tài khoản ở ngân hàng hoặc những nguồn tài nguyên được chia sẻ ở trên mạng từ một máy chủ?
Với tên và mật khẩu chính xác bạn có thể truy cập vào các tệp tin, thư điện
tử, tài khoản của bạn ở ngân hàng hay những thông tin cá nhân của bạn…Mà bạn không muốn một người dùng nào khác biết được Vì vậy có thể nói lợi ích
do hệ thống này mang lại là rất lớn đối với cuôc sống hiện đại ngày nay Nhưng các hệ thống xác thực người dùng hiện nay cũng gặp phải không ít những vấn đề khó khăn:
Mật khẩu của bạn có thể bị đánh cắp bởi những người dùng trên mạng internet Những hacker có rất nhiều công cụ để có thể lấy được mật khẩu của
Trang 3bạn Do đó đối với hệ thống xác thực người dùng để đảm bảo an toàn thì người dùng phải thay đổi mật khẩu thường xuyên, do đó sẽ làm cho người dùng khó nhớ
Trên thế giới hiện nay phương thức xác thực phổ biến vẫn là sử dụng các
ký tự làm mật khẩu và xu hướng đặt mật khẩu của người dùng có thể là sở thích, tên một nhân vật nổi tiếng ưa thích, hoặc ngày sinh nhật… Sẽ làm cho kẻ tấn công sẽ dự đoán được
Đối với những mật khẩu thông thường thì người dùng có thể mô tả được hoặc ghi lại được vì vậy rất dễ bị lộ
Để giải quyết những vấn đề trên trong tài liệu này chúng tôi tập trung trình bày về một hệ thống xác thực còn khá mới mẻ đối với Việt Nam nhưng yêu cầu đảm bảo thông tin an toàn của hệ thống này là rất cao Đó chính là hệ thống xác thực người dùng bằng sinh trắc học Hệ thống này sẽ được đề cập ở các chương sau
+ Trong sự xác thực một phía, chỉ một phía thực hiện sự xác thực tự bản thân mình khi liên lạc
+ Trong sự xác thực thực thể đồng thời, cả hai bên phải xác thực lẫn nhau
Sự xác thực trách văn bản gốc cung cấp bằng chứng để một đoạn dữ liệu, cũng như một thư điện tử, trong thực tế được tạo bởi người sử dụng chính thức
Trang 4người dùng, và hệ thống xác thực cần phải dựa vào mật khẩu ngắn để kiểm tra nhận dạng của người dùng Điện thoại và thiết bị không kêu (dumb terminals) là những ví dụ về hạ tầng không có khả năng này
Nếu một người truy nhập đến một thiết bị thông minh, ví như máy tính hoặc Smart card, bằng bất cứ cách nào, hệ thống xác thực hứa hẹn một giao thức xác thực tỉ mỉ hơn với thiết bị kiểm tra nét nhận dạng của người truy nhập Các giao thức này có thể thúc đẩy các phép toán mật mã tổng hợp và dùng khóa mật
mã dài để phá vỡ nhiều dạng tấn công thông tin
+ Giao thức thử thách và trả lời : Giao thức thử thách và trả lời cho phép người truy nhập tự xác thực mình với hệ thống bằng cách chứng minh hiểu biết của mình về giá trị mật mã bí mật mà không yêu cầu người truy nhập tiết lộ bí mật Hệ thống xác thực đưa ra cho người truy nhập một số được tạo ra một cách
ngẫu nhiên được gọi là thử thách Người truy nhập nhập số thử thách và giá trị
mật để hàm mật mã tính ra câu trả lời Hệ thống xác thực nét nhận dạng của người truy nhập nếu câu trả lời là giá trị mong đợi Bởi vì thử thách là một số ngẫu nhiên, giao thức thử thách – trả lời cung cấp một lá chắn có hiệu quả chống lại sự tấn công lặp lại
Hình 1.1: Mô hình quá trình xác thực người dùng
Hầu hết các hệ thống xác thực người dùng hiện nay người dùng muốn đăng nhập đều phải nhập tên và mật khẩu Trong đó tên và mật khẩu là do người dùng tạo ra Tên và mật khẩu của người dùng sẽ được hệ thống mã hoá và lưu vào cơ
sở dữ liệu Mật khẩu của người dùng phải được các hệ thống xác thực mã hoá để
Trang 5đảm bảo an toàn bằng những thuật toán mã hoá khác nhau Đặc biệt là các hệ thống máy tính mật khẩu của người dùng phải được mã hoá bằng những thuật toán đặc biệt, ví dụ như hệ điều hành Linux hay Unix sử dụng các thuật toán DES, MD5, hay Blowfish để mã hoá mật khẩu thành hàm băm trước khi lưu vào
cơ sở dữ liệu, hay WindowNT sử dụng MD4 và DES để mã hoã mật khẩu Khi đăng nhập vào hệ thống thì người dùng phải nhập lại tên và mật khẩu mà người dùng đã đăng kí Hệ thống sẽ so sánh tên và mật khẩu mà người dùng nhập với mật khẩu đã đăng kí Nếu đúng người dùng đăng nhập thành công, ngược lại người dùng sẽ phải đăng nhập lại Hệ thống sẽ từ chối nếu sau một vài lần đăng nhập không thành công Hình vẽ 1.1 mô tả quá trình xác thực người dùng
Trên thế giới hiện nay các hệ thống xác thực người dùng phổ biến vẫn là sử dụng các kí tự làm mật khẩu ví dụ như các hệ thống thư điện tử của yahoo hoặc gmail, ATM…
Hinh 1.2: Hệ thống xác thực người dùng của Gmail
+ Giao thức mật khẩu được chuyển đổi : Trong giao thức này, người truy nhập chế biến mật khẩu của mình qua hàm băm rồi gửi kết quả tới hệ thống xác thực Hệ thống so sánh giá trị băm với giá trị băm chính xác của mình và xác thực nét nhận dạng của người sử dụng nếu hai giá trị như nhau Nếu hệ thống lưu giữ mật khẩu thay vì giá trị băm của chúng, hệ thống sẽ tính giá trị băm của mật khẩu trước khi đưa ra so sánh Giao thức mật khẩu được chuyển đổi thể hiện mật khẩu dưới dạng hiện, nên nó dễ bị tổn thương trước sự tấn công lặp lại + Giao thức mật khẩu sử dụng một lần : Giao thức mật khẩu sử dụng một lần là một dạng quan trọng của giao thức mật khẩu được chuyển đổi để che chắn
Trang 6chống lại sự tấn công lặp lại được thực hiện bởi kẻ nghe trộm Giao thức này
yêu cầu người truy nhập và hệ thống xác thực chia một số bí mật nhỏ n Người truy nhập băm mật khẩu của mình n lần để tạo ra mật khẩu sử dụng một lần và
xác thực người truy nhập nếu hai kết quả là như nhau Trên cơ sở của sự xác
thực thành công, cả hai bên giảm lượng n Một kẻ trộm không thể thực hiện việc
tấn công lặp lại bởi vì mật khẩu sử dụng một lần tiếp theo là khác và nó không thể xác định từ giá trị trước đó Trong giao thức này, cần phải thay đổi mật khẩu
của người dùng và lập lại n khi n tiến tới 0
+ Giao thức chứng chỉ số : Giao thức chứng chỉ số là một dạng của giao thức thử thách – trả lời mà ở đó giá trị mật mã bí mật là một khóa riêng và hệ thống xác thực dùng khóa công khai tương ứng với khóa riêng để xác thực câu trả lời
+ Giao thức nhận dạng sinh trắc học: Khi người dùng đăng nhập mật khẩu của người dùng sẽ được so sánh với mật khẩu đã lưu trong cơ sở dữ liệu thông qua mạng máy tính Nếu đúng quá trình xác thực thành công Giao thức này có
độ bảo mật cao
1.5 Các phương thức về xác thực
Phần này sẽ trình bày chi tiết về các phương thức xác thực truyền thống đó là: Giới thiệu xác thực theo thẻ, xác thực dựa theo nhân trắc quan và xác thực dựa trên ý thức Qua đó đưa ra ưu, nhược điểm cũng như ứng dụng của các phuơng thức của các hệ thống trong thực tế
1.5.1 Xác thực theo thẻ
Xác thực theo thẻ, là công nghệ để xác thực người dùng muốn đăng nhập vào một hệ thống, mạng hay máy chủ, được sử dụng khá phổ biến hiện nay trên thế giới cũng như ở Việt Nam Ví dụ như : key card, bank card, smart card, ATM card… Mật khẩu mà người dùng phải nhớ đó là số PIN Xác thực người dùng bằng thẻ là giải pháp mang tính kinh tế cho các tổ chức Mỗi một người dùng sẽ có thẻ riêng, với lần đầu tiên dùng thẻ hệ thống sẽ sinh ngẫu nhiên cho người dùng số PIN Trên mỗi thẻ sẽ lưu một seed duy nhất (key) và key này cũng được lưu trên cơ sỏ dữ liệu của server Key này sẽ được mã hoá bằng những thuật toán mã hoá như: DES, 3DES, AES 128-bit hoặc 192-bit và 256-bit Khi người dùng đăng nhập vào hệ thống phải đưa thẻ vào thiết bị nhập thẻ
Trang 7sau đó nhập số PIN nếu đúng thì người dùng sẽ đăng nhập thành công, nếu sai người dùng sẽ phải thực hiện lại quá trình trên Thông thường sau mười lần liên tục người dùng đăng nhập không thành công hệ thống sẽ khoá tài khoàn của người dùng Mật khẩu của người dùng là số PIN, người dùng có thể thay đổi mật khẩu bất cứ lúc nào với độ dài mật khẩu do người dùng lựa chọn Mật khẩu có thể là các kí tự, số Người dùng tránh đặt những mật khẩu quá dễ nhớ
Hệ thống xác thực sử dụng công nghệ này yêu cầu phải có các thiết bị vật
lý dùng để đọc thẻ và phải được kết nối với hệ thống máy tính để quản lý, đặt ở nhiều nơi thuận tiện cho người dùng sử dụng Dưới đây là một số hình ảnh về thẻ mà người dùng sử dụng :
Trang 8phải có thẻ mới có thể tấn công được Bởi vì hệ thống sử dụng các thiết bị vật lí
để đọc thẻ, cả thẻ và các thiết bị vật lí này có giá rất đắt, hơn nữa các thiết bị này cần phải sử dụng nhiều trên một phạm vi rộng nên chi phí cho hệ thống xác thực người dùng bằng thẻ là tốn kém Ở nước ta xác thực người dùng theo thẻ chỉ mới xuất hiện ở các ngân hàng, bằng việc sử dụng các thẻ ATM Hình ảnh dưới đây mô tả thiết bị đọc thẻ và thẻ của hệ thống xác thực người dùng sử dụng thẻ :
Hình 1.4: Thiết bị đọc thẻ của hệ thống xác thực người dùng
Mật khẩu của người dùng là số PIN, chỉ người dùng biết và thay đổi được, mặc dù rất khó nhớ nhưng vẫn có thể đánh cắp được Vì những lí do trên mà hệ thống xác thực người dùng bằng thẻ bây giờ vẫn chưa sử dụng rộng rãi ngoài khu vực ngân hàng
1.5.2 Xác thực dựa theo tri thức
Xác thực dựa theo tri thức là phương thức sử dụng rộng rãi nhất hiện nay trên thế giớ Đây là phương thức đã rất quen thuộc với người dùng Phương thức này bao gồm cả sử dụng mật khẩu bằng dãy các kí tự và hình ảnh Nhưng sử dụng mật khẩu là các kí tự thì đang được phổ biến và rộng rãi hơn Đối với hệ thống sử dụng mật khẩu là dãy các kí tự thì buộc người dùng phải nhớ, dãy các
kí tự đó là một dãy các số, kí tự và một vài kí tự đặc biệt…Khi lần đầu đăng kí vào hệ thống người dùng sẽ phải tạo mật khẩu cho mình, mật khẩu mà người dùng đặt là một dãy các kí tự mà người dùng bắt buộc phải nhớ Mật khẩu của
Trang 9người dùng sẽ được hệ thống mã hoã và lưu vào cơ sở dữ liệu trên máy chủ Sau
đó để đăng nhập vào hệ thống thì người dùng phải nhập tên và mật khẩu Mật khẩu mà người dùng nhập vào sẽ được mã hoá sau đó so sánh với mật khẩu đã
có trong cơ sở dữ liệu ứng với tên của người dùng Nếu đúng thì người dùng sẽ đăng nhập được vào hệ thống Tên của người mỗi người dùng là khác nhau Nếu nhập sai thì người dùng phải đăng nhập lại Quá trình này sẽ chỉ lập lại một vài lần Có một số hệ thống còn yêu cầu mật khẩu phải dài trên 6 hoặc 8 kí tự để hệ thống được an toàn hơn, ví dụ như một số hệ thống thư điện tử của Yahoo hay Hotmail
Nhưng với hệ thống này không cần phải sử dụng các thiết bị vật lý như hệ thống xác thực người dùng dựa theo nhân trắc quan nên rất tiết kiệm về mặt kinh
tế Do đó hệ thống này đã và đang sử dụng rất phổ biến trên thế giới cũng như ở Việt Nam Và có thể thích hợp với mọi ứng dụng, Web, và mọi thiết bị (PCs, PDA…) Hình ảnh dưới đây mô tả hệ thống xác thực người dùng dựa theo ý thức:
Hình 1.5: Hệ thống xác thực người dùng của Yahoo mail
Đối với những hệ thống mà mật khẩu là dãy kí tự thì rất dễ bị tấn công và
dễ dự đoán được mật khẩu của người dùng Vì mật khẩu mà nguời dùng sử dụng thường được đặt dựa trên các thói quen hằng ngày, các sở thích, hoặc cũng có thể là tên của những nhân vật nổi tiếng mà họ yêu thích… Hơn nữa mật khẩu
Trang 10dạng kí tự thì rất dễ miêu tả, tiết lộ với người khác hay ghi lại được Các hacker lại có rất nhiều công cụ hoặc có thể dùng từ điển dò mật khẩu để có thể crack được mật khẩu của người dùng… Do đó tài khoản của người dùng sẽ dễ bị người khác tấn công Để hạn chế được sự tấn công của kẻ xấu thì người dùng phải tạo được mật khẩu có tính an toàn cao, tránh sử dụng các từ quá dễ nhớ để làm mật khẩu như là: millionair, football, darling’s name, số điện thoại, ngày sinh nhật… theo như các khuyến cáo và phải thay đổi mật khẩu định kì Nhưng như vậy sẽ khó nhớ đối với người dùng
1.5.3 Xác thực dựa theo nhân trắc quan
Hình 1.6: Kiến trúc chung của hệ thống xác thực người dùng dựa theo sinh trắc học
Xác thực dựa theo nhân trắc quan là phương thức sử dụng công nghệ như nhận dạng vân tay, võng mạc, khuôn mặt, giọng nói, loại máu, những chi tiết sinh học nhỏ trên cở thể người dùng… Hệ thống sẽ kiểm tra những đặc điểm sinh học duy nhất của nguời dùng để xác định nguời dùng đó là ai bằng cách sử dụng dấu vân tay hay âm thanh …của người dùng làm mật khẩu Do đó mật khẩu không dễ dàng thay đổi được Mật khẩu được mã hoã dưới dạng hàm băm bằng hệ thống PKCs và được lưu ở một nơi khác Khi người dùng đăng nhập mật khẩu của người dùng sẽ được so sánh với mật khẩu đã lưu trong cơ sở dữ liệu thông qua mạng máy tính Nếu đúng quá trình xác thực thành công Nó chỉ
Trang 11được sử dụng ở một ở một số ít hệ thống Đặc biệt là ở các hệ thống xác thực của công ty hay tổ chức lớn Bởi vì phương thức này sử dụng những đặc điểm nhận dạng sinh học duy nhất mà người dùng có và người dùng biết nên độ an toàn của hệ thống rất cao Hình vẽ 1.6 mô tả kiến trúc của một hệ thống xác thực người dùng dựa theo nhân trắc quan
Trên thực tế, đôi khi phải kết hợp nhiều phương pháp xác thực để đảm bảo tính an toàn đến một mức độ nào đó, bởi mỗi phương pháp xác thực đều có những ưu và nhược điểm riêng xét cụ thể như sau:
+ Xác thực bằng mật khẩu có nhược điểm lớn nhất là người dùng thường chọn mật khẩu dễ nhớ, do vậy dễ đoán, nên dễ bị tấn công
+ Phương pháp nhận dạng sinh học thì đòi hỏi phải dựa trên hạ tầng thông tin tốt
Các số đo sinh học cung cấp sự đảm bảo cho nét nhận dạng của người truy nhập đặt cơ sở trên các đặc trưng số đo vật lý, hình dáng và nhận dạng Các số
đo sinh học thường được dùng kết hợp với các nguyên lý xác thực khác để đem đến một mức đảm bảo lớn hơn cho nhận dạng của người truy nhập Ví dụ, một
hệ thống xác thực việc vào một tòa nhà, yêu cầu người làm ấn ngón tay cái lên mặt kính, chuyển sổ lao động qua khe và nhập PIN Sau đây là danh sách các số
đo vật lý theo thứ tự hiệu quả giảm dần:
+ Retina pattern (Mẫu võng mạc): Thiết bị dò mẫu duy nhất của mạch máu trong mô võng mạc một người để xác định nét nhận dạng của người đó
+ Fingerprint (Dấu ngón tay, dấu điểm chỉ): Thiết bị sử dụng mẫu duy nhất của vân ngón tay để kiểm tra nét nhận dạng của người đó
+ Handprint (Dạng bàn tay): Thiết bị kiểm tra các số đo hình học duy nhất của bàn tay người để xác định nét nhận dạng của người đó
+ Voice pattern (Mẫu giọng nói): Thiết bị khai thác mẫu phát âm, giọng
nói, ngữ âm hoặc ngôn ngữ của tiếng nói của một người để kiểm tra nét nhận dạng của người đó
+ Signature (Chữ ký): Thiết bị kiểm tra mẫu duy nhất và các đặc trưng của chữ ký bằng tay của một người để xác định nét nhận dạng của người đó
Trang 12Trong các số đo sinh học được nêu trên thì giải pháp xác thực mới được đưa ra để áp dụng cho Ngân Hàng Công Thương Việt Nam là phương pháp xác thực vân tay
- Các phương thức sinh trắc nhận dạng vân tay:
Đối sánh 1:1: Xác định “Một người có đúng là anh ta hay không” bằng cách đối sánh vân tay của một người với vân tay lưu trữ tương ứng của người đó trong Cơ sở dữ liệu để xác định nhân thân của người đó so với hồ sơ lưu trong
Cơ sở dữ liệu
Đối sánh tra cứu 1:N: Tìm kiếm bằng cách đối sánh vân tay của một người với các vân tay lưu trữ trong Cơ sở dữ liệu vân tay để xác định được danh sách những người giống nhất với người cần xác định nhân thân
Trang 13CHƯƠNG II: XÁC THỰC VÂN TAY 2.1 Sự cần thiết của xác thực bằng sinh trắc
Xác thực sinh trắc đề cập đến việc sử dụng các đặc tính hành vi và thể chất (ví dụ: vân tay, gương mặt, giọng nói…) có tính chất khác biệt để xác thực một người một cách tự động
Trong các tổ chức, cơ sở hành chính, khoa học…luôn có nhu cầu kiểm tra
và trả lời các câu hỏi: “một người có được quyền vào và sử dụng các thiết bị hay không”, “một cá nhân có quyền truy cập thông tin mật”…
Người ta nhận thấy các đặc trưng sinh trắc không thể dễ dàng bị thay thế, chia sẻ hay giả mạo , chúng được xem là đáng tin cậy hơn trong nhận dạng một người so với các phương pháp dựa vào thẻ bài truyền thống (ví dụ dùng chìa khóa…), phương pháp dựa vào trí thức (ví dụ dùng mật khẩu)
Xác thực sinh trắc ngày càng cung cấp mức độ an toàn cao hơn, tính hiệu quả cao hơn, và càng thuận tiện cho người dùng Vì vậy, các hệ thống sinh trắc đang được triển khai và thử nghiệm ngày càng nhiều trong các khu vực quản lý thuộc chính phủ (chứng minh thư, bằng lái xe…), khu vực dân sinh (thẻ thông minh, đăng nhập mạng máy tính, …)
Nhiều công nghệ sinh trắc đã và đang được phát triển, một số chúng đang được sử dụng trong các ứng dụng thực tế Các đặc trưng sinh trắc thường được
sử dụng là vân tay, gương mặt, mống mắt, tiếng nói Mỗi đặc trưng sinh trắc có điểm mạnh và điểm yếu riêng, nên việc sử dụng đặc trưng sinh trắc cụ thể là tùy thuộc vào yêu cầu của mỗi ứng dụng nhất định Các đặc trưng sinh trắc có thể được so sánh dựa vào các yếu tố sau: tính phổ biến, tính phân biệt, tính ổn định, tính thu thập, hiệu quả, tính chấp nhận Vân tay - được biết tới với tính phân biệt (tính chất cá nhân) và ổn định theo thời gian là đặc trưng sinh trắc được sử dụng rộng rãi nhất
2.2 Lịch sử của vân tay
Trên các mẫu khảo cổ học và các mẫu vật lịch sử, người ta đã tìm thấy nhiều mẫu vân tay Điều này cung cấp bằng chứng rõ ràng là người xưa đã nhận
ra tính cá nhân của vân tay, nhưng không xuất hiện bất kì cơ sở khoa học nào
Trang 14Mãi đến thế kỉ 16 các kĩ thuật vân tay khoa học hiện đại mới xuất hiện và từ đó các lí thuyết và chương trình mô tả, xác thực vân tay mới phát triển mau chóng:
Hình 2.1: Một số bằng chứng vân tay tìm được thời xưa
Năm 1964:Nehemiah Grew nhà sinh thái học thực vật xuất bản những trang sách đầu tiên các nghiên cứu có tính hệ thống của ông về vân tay
Năm 1788: Mayer đã mô tả chi tiết thông tin giải phẫu của vân tay để đặc tính hóa, nhận dạng các đặc tính vân tay
Năm 1809, Thomas Bewick bắt đầu sử dụng vân tay của mình như là biểu tượng đăng kí thương mại – đã tạo ra một cột mốc quan trọng trong nghiên cứu khoa học về nhận dạng vân tay
Năm 1880: Henrry Fauld đã đưa ra giả thuyết khoa học khẳng định tính cá nhân của vân tay dựa vào các nhận thức kinh nghiệm
Trang 15Năm 1888, Ngài Francis Galton giới thiệu các đặc trưng chi tiết phục vụ cho đối sánh vân tay
Đầu thế kỉ 20, cấu trúc của vân tay mới được mô tả một cách khá đầy đủ Các nguyên lý sinh học của vân tay được tổng kết như sau:
a Biểu bì vân có các đặc tính khác nhau trên các vân tay khác nhau
b Cấu hình vân tay có sự thay đổi trên từng cá nhân, nhưng sự thay đổi nhỏ này vẫn cho phép phân loại một cách có hệ thống các vân tay
c Các chi tiết và cấu hình của mỗi đường vân là ổn định và không thay đổi Nguyên lý a) là cơ sở cho nhận dạng vân tay, nguyên lý b) là cơ sở để tiến hành phân loại vân tay
Cũng từ đầu thế kỉ 20, nhận dạng vân tay chính thức được chấp nhận như một phương pháp nhận dạng cá nhân có giá trị và trở thành chuẩn trong pháp luật Ví dụ, năm 1924 FBI đã thiết lập một cơ sở dữ liệu có 810000 thẻ vân tay Phân loại vân tay
Dấu vân tay được sử dụng rộng rãi để nhận dạng cá nhân, để hội chẩn những chứng bệnh do di truyền và phát hiện tiềm năng của con người Ở Mỹ có nhiều hệ thống phân loại và xử lí thông tin vân tay Tuy nhiên, có thể phân loại vân tay theo ba kiểu chính: xoáy tròn, móc và vòm Ngoài ra, mỗi kiểu còn được phân theo độ nghiêng: 0, 45, 90 và 135 độ
Trang 16
Vân móc Vân móc đôi Vân móc ngược Vân móc xuôi
Vân móc bẹp
Vân sóng Vân sóng thần Vân móc liên sóng Vân sóng cồn
Hình 2.2: Một số mẫu vân tay
Việc sử dụng dấu vân tay để nhận dạng được áp dụng rộng rãi trong đời
sống của các nước công nghiệp phát triển Dấu vân tay không những được sử
dụng trong lĩnh vực hình sự mà còn được sử dụng trong việc xác nhận nhân thân
của cá nhân khi truy cập mạng hoặc mở khoá; một số ngân hàng đã bắt đầu
thanh toán thẻ ATM sử dụng máy đọc vân tay
2.3 Phân tích và biểu diễn vân tay
2.3.1 Phân tích cấu trúc vân tay
Khi ấn ngón tay vào một bề mặt trơn, một vân tay được sao chép lại từ lớp
biểu bì da Cấu trúc dễ nhận thấy nhất của vân tay là các vân lồi và vân lõm;
trong ảnh vân tay, vân lồi có màu tối trong khi vân lõm có màu sáng Vân lồi có
trúc bên dưới của vân, khi da mọc lại sẽ khôi phục lại đúng cấu trúc này
Trang 17Vân lồi và vân lõm thường chạy song song với nhau; chúng có thể rẽ thành hai nhánh, hoặc kết thúc Ở mức độ tổng thể, các mẫu vân tay thể hiện các vùng vân khác nhau mà ở đó các đường vân có hình dạng khác biệt Những vùng này (gọi là các vùng đơn) có thể được phân loại thành các dạng: loop, delta và whorl
vùng loop đối diện nhau
Vài thuật toán đối sánh vân tay căn lề ảnh vân tay theo một điểm trung tâm gọi là điểm nhân Henrry (1900) đã định nghĩa điểm nhân là “điểm nằm về phía bắc nhất của đường vân nằm trong cùng nhất” Thực tế, điểm nhân là điểm trung tâm của vùng loop nằm về phía bắc nhất Nếu vân tay không chứa các vùng loop hay whorl thì điểm nhân là điểm mà tại đó độ cong của đường vân là lớn nhất Định nghĩa các vùng đơn thường được sử dụng để phân loại vân tay, với mục đích làm đơn giản hóa các quá trình tìm kiếm
Ở mức độ cục bộ, chúng ta tìm kiếm các đặc tính quan trọng, gọi là các chi
tiết Các chi tiết mô tả cách mà các vân bị đứt quãng Ví dụ vân có thể đi tới
điểm kết thúc, hay rẽ thành hai nhánh… Ngài Francis Galton (1822-1911) là người đầu tiên phân loại chi tiết và khẳng định chúng không thay đổi trong suốt cuộc đời một cá nhân Viện các chuẩn quốc gia Mĩ đề nghị phân loại chi tiết theo bốn loại gồm: điểm kết thúc, điểm rẽ hai, điểm rẽ ba, và điểm không xác định Trong khi đó mô hình chi tiết của cục điều tra liên bang Mĩ chỉ có hai loại chi tiết là điểm kết thúc và điểm rẽ hai Mỗi chi tiết được đặc trưng bởi phân lớp,
hệ tọa độ xy, góc tạo bởi tiếp tuyến của đường vân tại chi tiết và trục ngang Trong các ảnh vân tay, các điểm kết thúc và rẽ hai có thể tráo đổi cho nhau
và ở cùng vị trí, ở ảnh âm bản điểm kết thúc xuất hiện như là điểm rẽ hai và ngược lại
Ở các ảnh vân tay có độ phân giải cao (trên 1000dpi), chúng ta có thể xác
chân lông (số lượng, vị trí, hình dạng) có sự khác biệt rất cao, nhưng ít kĩ thuật đối sánh sử dụng các lỗ chân lông bởi vì để xử lý hình ảnh các lỗ chân lông đòi hỏi các ảnh có độ phân giải cao và chất lượng tốt
Trang 182.3.2 Biểu diễn hình ảnh vân tay
Hầu hết các thuật toán phân loại và nhận dạng vân tay yêu cầu giai đoạn trích chọn đặc trưng để xác định các đặc trưng nổi bật
Hình ảnh vân tay thường được biểu diễn như là một bề mặt hai chiều Kí hiệu I là ảnh vân tay cấp xám với cấp xám g I[x, y] là cấp xám của điểm ảnh [x, y] Kí hiệu z = S (x, y) là bề mặt rời rạc tương ứng với ảnh I: S (x, y) = I[x, y] Bằng cách chọn các điểm ảnh màu sáng có cấp xám là 0, và các điểm ảnh có màu tối có cấp xám là g-1, thì các đường vân (xuất hiện có màu tối trong I) tương ứng với bề mặt vân lồi còn khoảng không gian giữa các vân lồi (có màu sáng) tương ứng là bề mặt vân lõm
Hình 2 3: Bề mặt S của một vùng vân tay
2.3.3 Các hệ thống xác thực
Một hệ thống sinh trắc cơ bản là một hệ thống nhận dạng mẫu để nhận ra một người bằng cách quyết định tính xác thực của một đặc tính sinh học hay hành vi thuộc về người đó Trong thiết kế một hệ thống sinh trắc, một vấn đề quan trọng đặt ra là xác định cách một người được nhận dạng Một hệ thống sinh
trắc có thể là một hệ thống kiểm tra hay một hệ thống nhận dạng
+ Hệ thống kiểm tra: là hệ thống xác thực một người bằng cách so sánh đặc
tính sinh trắc của người này với mẫu sinh trắc của chính người đó đã được lưu
trữ trước trong hệ thống
Trang 19tác với hệ thống Ví dụ ở ngân hàng điện tử, là trường hợp có phối hợp kẻ mạo danh phải đăng nhập hệ thống để sử dụng tài khoản, còn ở hệ thống không phối hợp trong kiểm tra hộ chiếu đi máy bay, những kẻ khủng bố có thể bị phát hiện khi sử dụng hộ chiếu
+ Công khai và bí mật: hệ thống là công khai nếu người sử dụng biết mình đang được xác thực bởi hệ thống, còn khi người sử dụng không biết mình đang được xác thực bởi hệ thống thì hệ thống là bí mật
người dùng sử dụng hệ thống sinh trắc Ví dụ, ứng dụng đăng nhập máy tính là một hệ thống sinh trắc thường xuyên bởi vì ứng dụng này được sử dụng đều đặn, còn ứng dụng làm bằng lái xe là hệ thống không thường xuyên do mỗi bằng lái
xe chỉ được làm mới sau vài năm
hiện bởi con người thì dữ liệu sinh trắc sẽ được thu thập khi có sự hướng dẫn, quản lý bởi một người
+ Môi trường điều hành chuẩn hay phi chuẩn: Môi trường điều hành là chuẩn nếu hệ thống được hoạt động trong môi trường được điều khiển (các yếu
tố nhiệt độ, độ ẩm…)
sử dụng hệ thống sinh trắc là khách hàng hay nhân viên của tổ chức triển khai hệ thống
sinh trắc của một người với các ứng dụng khác, còn ứng dụng đóng phải sử dụng các mẫu sinh trắc thích hợp dành riêng
Trang 202.3.4 So sánh các đặc trưng sinh trắc
Một đặc tính sinh học hoặc hành vi của con người có thể được sử dụng như
là một đặc trưng sinh trắc trong nhận dạng một người nếu nó có các yêu cầu sau:
+ Tính phân biệt: hai người khác nhau thì đặc trưng sinh trắc này phải khác nhau
thời gian (tương ứng với hạng mục đối sánh nhất định)
+ Tính thu thập: nghĩa là đặc trưng này có thể đo được và lượng hóa
nguyên cần thiết để đạt được tốc độ và độ chính xác mong muốn; các nhân tố môi trường và hoạt động ảnh hưởng đến tốc độ và độ chính xác trong nhận dạng + Tính chấp nhận: mọi người vui lòng chấp nhận các đặc trưng sinh trắc trong đời sống hàng ngày của họ
Trang 21Một số đặc tính của vân tay
+ Tính ổn định vĩnh viễn và tính cá thể của vân tay là những cơ sở nền tảng cho bộ môn khoa học nghiên cứu về sinh trắc nhận dạng vân tay
+ Tính ổn định: Các vân tay (Fingerprint ridges) được hình thành khi thai nhi đạt tới tháng thứ ba hoặc thứ tư Các vân tay bao gồm các đặc trưng cá nhân, trong đó bao gồm các điểm kết của các đường nổi (ridge endings), các điểm phân nhánh (bifurcations) và các chấm (dots) Sau khi sinh ra, các vân tay của trẻ sơ sinh phát triển dần đều về mọi hướng và vẫn giữ nguyên tỷ lệ quan hệ giữa các điểm đặc trưng cá nhân không đổi trong suốt cuộc đời
+ Hầu như tất cả mọi người đều có vân tay: Về nguyên tắc thì tất cả mọi người đều có vân tay Đôi khi do bệnh về da một số người có thể mất vân tay vĩnh viễn hoặc trong một thời gian (do kỳ xoá hoặc bị trày da) và bởi vậy có thể không nhận dạng được bằng vân tay Tỷ lệ này thường chỉ ở mức từ khoảng 1-5% tổng số dân tuỳ thuộc vào thiết bị lấy vân tay, phần mềm phân tích nhận dạng vân tay và trình độ nghiệp vụ của cán bộ phân tích
Đặc trưng của vân tay (minutia) là các điểm kết và các điểm phân nhánh của các đường vân nổi (ridges) của vân tay Đó là các đặc điểm biểu thị tính
“riêng nhất cá thể” ("uniqueness")
2.3.5 Các loại lỗi của hệ thống sinh trắc
Đối sánh trong một hệ thống nhận dạng vân tay dựa vào điểm đối sánh s
(không mất tính tổng quát, chúng ta giả sử giá trị của điểm này nằm trong [0, 1]) Điểm đối sánh được dùng để lượng hóa độ tương tự giữa biểu diễn của đầu vào và biểu diễn của mẫu cơ sở dữ liệu Điểm này càng có giá trị gần 1 thì khả năng cả hai vân tay đều của cùng một ngón tay càng cao, ngược lại điểm này càng có giá trị gần 0 thì khả năng hai vân tay là của hai ngón tay khác nhau càng lớn
Quyết định của hệ thống được điều khiển bởi ngưỡng t Với điểm s của hai
vân tay:
tay)
Trang 22+ nếu s ≤ t: kết luận là cặp không so khớp (nghĩa là hai vân tay đến từ hai ngón tay khác nhau)
Một hệ thống kiểm tra chấp nhận hai lỗi sau đây:
cùng một ngón tay (ta gọi là so khớp sai)
ngón tay khác nhau (ta gọi là không - so khớp sai)
Hai lỗi trên tương ứng còn được gọi là chấp nhận sai và từ chối sa Bởi vì
kẻ giả mạo có thể được chấp nhận sử dụng thiết bị hay hệ thống…nếu có sự so khớp sai, và người có đủ thẩm quyền đăng nhập, sử dụng thiết bị hay hệ thống lại bị từ chối nếu xảy ra sự không so khớp sa Chúng ta lượng hóa hai lỗi trên
bằng các đại lượng: tỉ lệ chấp nhận sai và tỉ lệ từ chối sai
Chúng ta sẽ đi sâu hơn vào các lỗi trong những hệ thống kiểm tra và trong các hệ thống nhận dạng
2.3.6 Các lỗi của hệ thống kiểm tra
Kí hiệu T là mẫu sinh trắc của một người đã được lưu trữ, I là biểu diễn sinh trắc đầu vào cần được kiểm tra Các giả thuyết đặt ra là:
Tương ứng với các giả thuyết là các kết luận:
Đối sánh trong kiểm tra T và I sử dụng độ tương tự s (T, I) Nếu s nhỏ hơn
Từ các giả thuyết trên, chúng ta định nghĩa hai loại lỗi trong một hệ thống kiểm tra:
Trang 23Khi đó, tỉ lệ đối sánh sai (FMR) là xác suất của lỗi loại I, tỉ lệ không đối sánh sai (FNMR) là xác suất của lỗi loại II:
Để đánh giá tính chính xác của một hệ thống sinh trắc chúng ta phải thống
kê các điểm đối sánh s của các cặp vân tay của cùng một ngón tay (phân bố p
(s|H 1 đúng)-thường được gọi là phân bố chân chính) và điểm đối sánh s của các
phân bố giả mạo)
Trong hình vẽ FMR là phần trăm các cặp giả mạo có điểm đối sánh lớn hơn
hay bằng t và FNMR là phần trăm các cặp chân chính có điểm đối sánh nhỏ hơn
t
Trang 24Thực tế, cả FMR và FNMR đều là hàm của ngưỡng hệ thống t nên chúng ta
có thể viết chúng là FMR (t) và FNMR (t) Nếu t giảm thì hệ thống sẽ bỏ qua nhiều lỗi và FMR (t) sẽ tăng, ngược lại khi tăng t để cho hệ thống an toàn hơn thì FNMR (t) sẽ tăng tương ứng Người thiết kế hệ thống kiểm tra thường không biết trước hệ thống của mình sẽ ứng dụng ở lĩnh vực nào, vì vậy họ báo cáo hiệu năng hệ thống ở tất cả các điểm hoạt động (ngưỡng t) bằng cách xây dựng
đường cong đặc tính hoạt động Đường cong này biểu diễn các giá trị FNMR và
FMR ở theo ngưỡng hệ thống t
Bên cạnh các phân bố và đồ thị trên, một vài chỉ số khác được dùng để đánh giá tính chính xác của một hệ thống kiểm tra
Trong thực tế, do chúng ta có một số hữu hạn các cặp vân để so sánh và do sự lượng tự hóa giá trị nên EER không tồn tạ Vì vậy thay vì đưa ra một giá trị đơn duy nhất, người ta đưa ra một khoảng Mặc dù EER là một chỉ số quan trọng, nhưng các hệ thống kiểm tra vân tay ít khi hoạt động ở ngưỡng tương ứng với EER mà hoạt động ở các ngưỡng có FMR thấp
+ ZeroFNMR là giá trị FMR nhỏ nhất mà tại đó không xảy ra không-đối sánh sai
+ ZeroFMR là giá trị FNMR nhỏ nhất mà tại đó không xảy ra đối sánh sai
thể tự động thu thập đặc trưng sinh trắc khi đặc trưng sinh trắc được đưa vào bộ cảm biến
không được xử lý bởi hệ thống
được xử lý hoặc đối sánh với một mẫu sinh trắc có giá trị, bởi các biểu diễn sinh trắc không đủ chất lượng
Trang 25Hình 2.6: Đánh giá thuật toán kiểm tra vân tay trong cuộc thi nhận dạng vân tay 2002 (FVC2002) a) các phân bố chân chính và giả mạo được tính trên 2800 cặp chân chính và 4950 cặp giả mạo b)FMR (t) và FNMR (t) được tính từ các phân bố ở a c) đường cong ROC dẫn xuất từ FMR (t) và FNMR (t) ở b)
Hình 2.7: Một ví dụ của đồ thị FMR (t) và FNMR (t), với các điểm
tương ứng là EER, ZeroFNMR và ZeroFMR
ZeroFNMR
ZeroFMR EER
Trang 262.4 Đối sánh vân tay
2.4.1 Đặt vấn đề
Một thuật toán đối sánh vân tay so sánh hai vân tay cho trước và trả về độ tương tự (không làm mất tính tổng quát, có giá trị giữa 0 và 1) hoặc một quyết định hai ngôi (khớp hoặc không khớp) Không làm mất tính tổng quát, từ đây về sau chúng ta kí hiệu biểu diễn của vân tay có được qua quá trình tuyển chọn như
là mẫu (T) và biểu diễn của vân tay được đối sánh như là đầu vào (I) Trong trường hợp không có giai đoạn trích chọn đặc trưng, biểu diễn vân tay đồng nhất với chính ảnh cấp xám vân tay Chúng ta kí hiệu cả ảnh vân tay và các vector đặc trưng ảnh (như các chi tiết) là T và I
Trích chọn đặc trưng vân tay và các thuật toán đối sánh khá giống nhau cho các bài toán nhận dạng và kiểm tra vân tay Bởi vì bài toán nhận dạng vân tay (tìm kiếm một vân tay đầu vào trong một cơ sở dữ liệu có N vân tay) có thể được thực hiện như là thực hiện tuần tự đối sánh một - một (kiểm tra) giữa các cặp vân tay Sự phân loại vân tay và các kĩ thuật đánh chỉ số thường được sử dụng để tăng tốc độ tìm kiếm trong các bài toán nhận dạng vân tay
Đối sánh hai ảnh vân tay là một bài toán cực kì khó, chủ yếu do sự thay đổi dấu in của cùng một vân tay Các yếu tố chính làm các dấu in khác nhau được tổng kết dưới đây:
+ Sự đổi chỗ: một ngón tay có thể đặt ở các vị trí khác nhau trên bộ cảm biến làm tịnh tiến ảnh vân tay Một ngón tay thay đổi chỉ 2mm làm tịnh tiến khoảng 40 điểm ảnh trong cùng một vân tay được quét ở độ phân giải 500dpi + Sự quay: cùng một vân tay có thể quay ở các góc khác nhau trên bề mặt
bộ cảm biến Mặc dù bộ hướng dẫn ngón tay được gắn trên các máy quét thương mại, nhưng trong thực tế tồn tại sự quay không cố ý lên tới +-20 độ theo chiều dọc
+ Sự chồng chéo từng phần: sự đổi chỗ và sự quay vân tay thường làm cho một phần vân tay bị đổ ra ngoài vùng nhìn thấy của bộ cảm biến, kết quả là xuất hiện sự chồng chéo giữa các vùng cận cạnh của mẫu vân và các vân tay đầu vào + Sự nhiễu phi tuyến: liên quan đến việc ánh xạ hình ảnh ba chiều sang hình ảnh hai chiều trên bề mặt bộ cảm biến Ánh xạ này gây ra nhiễu phi tuyến
Trang 27trong việc đọc vân tay do sự mềm dẻo của ngón tay Thông thường, các thuật toán đối sánh vân tay không quan tâm đến các đặc tính như ánh xạ, và xem một ảnh vân tay là không bị nhiễu bằng cách cho rằng: ảnh vân tay được cung cấp khi người dùng đặt đúng vị trí ngón tay:
- Tiếp cận ngón tay vuông góc với bộ cảm biến
- Khi ngón tay chạm bề mặt bộ cảm biến, người dùng không ấn mạnh hay xoắn ngón tay
Do sự mềm dẻo của bề mặt da, các phần lực không vuông góc với bề mặt
bộ cảm biến gây ra các nhiễu không tuyến tính (nén lại hay kéo dãn ra) trong quá trình lấy vân Nhiễu làm mất khả năng đối sánh các vân tay như là các mẫu cứng
+ Điều kiện áp lực và da: cấu trúc các vân của một vân tay có thể thu được chính xác nếu như phần ngón tay được lấy ảnh tiếp xúc đúng quy cách với bề mặt bộ cảm biến Một số điều kiện như áp lực ngón tay, ngón tay khô, bệnh ngoài da, ướt, bẩn, độ ẩm không khí – gây ra sự tiếp xúc không đúng quy cách
Hệ quả là, ảnh vân tay lấy được rất nhiễu và mức độ các nhiễu này phụ thuộc vào mức độ các nguyên nhân nêu trên
Hình 2.8: Các dấu vân tay thu được của cùng một ngón tay không đối sánh được với nhau do nhiễu phi tuyến ở cặp đầu tiên
và do các điều kiện da ở cặp thứ hai bên dưới
Trang 28+ Các lỗi trích chọn đặc trưng: các thuật toán trích chọn đặc trưng là không hoàn hảo và thường có các lỗi số đo Các lỗi có thể tạo ra ở trong bất kì giai đoạn nào trong quá trình trích chọn đặc trưng (chẳng hạn: ước lượng ảnh hướng
và tần suất, phát hiện số lượng, dạng, vị trí các vùng đơn, phân đoạn vùng vân tay từ nền…)
Cặp ảnh trong hình 2.8 thể hiện tính thay đổi cao có thể đặc tính hóa hai vết hằn khác nhau của cùng một ngón tay
Các ảnh vân tay từ các ngón tay khác nhau có thể xuất hiện khá giống nhau (tính thay đổi thấp), đặc biệt trong bối cảnh cấu trúc tổng thể (vị trí các vùng đơn, hướng vân cục bộ…) Mặc dù khả năng một lượng lớn các chi tiết từ các vết
ấn của hai vân tay khác nhau có thể so khớp là cực kì nhỏ, những người đối sánh vân tay hướng tới việc sử dụng các phép căn chỉnh tốt nhất Họ thường xuyên có
ý định khai báo các cặp chi tiết so khớp thậm chí ngay cả khi chúng không trùng khớp hoàn hảo
Một lượng lớn các thuật toán đối sánh vân tự động đã được đề nghị trong các tài liệu nhận dạng mẫu Hầu hết các thuật toán này không gặp khó khăn trong đối sánh các ảnh vân tay chất lượng tốt Nhưng trong đối sánh vân tay tồn tại thách thức ở các ảnh chất lượng thấp và vấn đề đối sánh từng vùng vân tay Trong trường hợp hệ thống trợ giúp con người AFIS, một thuật toán kiểm tra chất lượng được sử dụng để chỉ lấy và chèn vào cơ sở dữ liệu các ảnh vân tay tốt Hơn nữa, quá trình xử lý các mẫu vân khó có thể được quản lý Dù sao, sự can thiệp là không thể trong các hệ thống nhận dạng trực tuyến tự động - những
hệ thống này đang có nhu cầu ngày càng tăng trong các ứng dụng thương mại Thống kê các lỗi không đối sánh sai xuất hiện nhiều trong các thuật toán đối sánh tham dự vào FVC2000 (Fingerprint verification competition http://bias csr unibo it/fvc2002) cho thấy hầu hết các lỗi được tạo ra trên 15-20% các ảnh vân tay chất lượng kém Nói một cách khác, 20% mẫu trong cơ sở dữ liệu chịu trách nhiệm cho khoảng 80% các lỗi không - đối sánh sai Vài cải tiến trong công nghệ nhận dạng vân tay được chứng minh sau đó hai năm ở FVC2002, nơi
mà vài thuật toán được đưa ra đối sánh đúng nhiều ảnh vân tay chất lượng kém Tuy vậy vẫn có nhu cầu tiếp tục phát triển các hệ thống mạnh có khả năng làm việc với các ảnh vân tay chất lượng kém