Nhận dạng khuôn mặt người l{ một công nghệ được ứng dụng rộng r~i trong đời sống hằng ng{y của con người như c|c hệ thống gi|m s|t, quản lý v{o ra, tìm kiếm thông tin một người nổi tiếng
Trang 2ĐẠI HỌC QUỐC GIA H[ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
ĐỖ THỊ HỒNG LĨNH
NHẬN DẠNG KHUÔN MẶT NGƯỜI VÀ ỨNG DỤNG TRONG BẢO TOÀN
THÔNG TIN
Ng{nh: Công nghệ thông tin
Chuyên ng{nh: Hệ thống thông tin
M~ số: 60480104
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS: TRỊNH NHẬT TIẾN
Hà Nội, 2014
Trang 3Lời cảm ơn
Trước hết, tôi xin gửi lời cảm ơn sâu sắc nhất đến PGS.TS Trịnh Nhật Tiến, người đã tận tình hướng dẫn tôi trong suốt quá trình thực hiện luận văn tốt nghiệp
Tôi xin cảm ơn trường Đại học Công Nghệ - Đại học Quốc gia Hà Nội và các thầy cô giáo đã giảng dạy tôi trong suốt thời gian học tập tại trường, tạo điều kiện, giúp đỡ tôi hoàn thiện luận văn này Xin cảm ơn gia đình, bạn bè, đồng nghiệp đã luôn động viên giúp đỡ tôi trong thời gian học tập và hoàn thành luận văn
Trong quá trình nghiên cứu, thực hiện, mặc dù đã cố gắng, nỗ lực để hoàn thiện, luận văn của tôi cũng không tránh khỏi những thiếu sót và hạn chế Kính mong nhận được sự đóng góp của thầy cô và các bạn
Tôi xin chân thành cảm ơn!
Học viên
Đỗ Thị Hồng Lĩnh
Trang 4Lời cam đoan
Tôi xin cam đoan nội dung đề tài “ Nhận dạng khuôn mặt người và ứng
dụng trongbảo toàn thông tin”được trình bày trong luận văn này do tôi thực
hiện dưới sự hướng dẫn của PGS.TS.Trịnh Nhật Tiến
Tất cả những tham khảo từ các nghiên cứu liên quan đều được nêu nguồn gốc một cách rõ ràng từ danh mục tài liệu tham khảo của luận văn Trong luận văn, không có việc sao chép tài liệu, công trình nghiên cứu của người khác mà không chỉ rõ về tài liệu tham khảo
Hà Nội, ngày tháng năm 2014
Tác giả
Đỗ Thị Hồng Lĩnh
Trang 5MỤC LỤC
DANH MỤC HÌNH VẼ 7
MỞ ĐẦU 8
Chương 1 CƠ SỞ KHOA HỌC VÀ THỰC TIỄN CỦA VẤN ĐỀ NHẬN DẠNG MẶT NGƯỜI 9
1.1 TỔNG QUAN VỀ SINH TRẮC HỌC 9
1.1.1 Vân tay (Fingerprint) 10
1.1.2 Đường chỉ tay (Palm lines) 11
1.1.3 Võng mạc mắt (retina biometrics) 12
1.1.4 Giọng nói 12
1.1.5 Nhận dạng mặt người (Face recognition) 13
1.1.6 DNA (Dioxyribo Nucleic Acid) 14
1.2 HỆ THỐNG NHẬN DẠNG MẶT NGƯỜI 14
1.2.1 Bài toán nhận dạng mặt người và những khó khăn 14
1.2.1.1 Bài toán nhận dạng mặt người 14
1.2.1.2 Những khó khăn của nhận dạng khuôn mặt 15
1.2.2 Các ứng dụng liên quan đến nhận dạng mặt người 16
1.2.3 Tổng quan kiến trúc hệ thống nhận dạng khuôn mặt 17
1.2.3.1 Phát hiện khuôn mặt 17
1.2.3.2 Trích chọn đặc trưng 19
1.2.3.3 Nhận dạng khuôn mặt 21
Chương 2: PHƯƠNG PHÁP NHẬN DẠNG MẶT NGƯỜI 23
2.1 PHÁT HIỆN KHUÔN MẶT 23
2.1.1 Đặc trưng HAAR-LIKE 23
2.1.2 Adaboosting 26
2.1.3 Giải thuật Viola-Jones 27
2.2 NHẬN DẠNG MẶT NGƯỜI 30
2.2.1 Phương pháp phân tích thành phần chính (PCA: Principal Component Analysis ) 30
2.2.2 Nhận dạng khuôn mặt theo phương pháp EIGENFACE 33
2.2.3 Khoảng cách Euclid 35
Chương 3: NHẬN DẠNG MẶT NGƯỜI VÀ VẤN ĐỀ AN TOÀN THÔNG TIN 36
3.1 Vấn đề an toàn thông tin 36
3.2 Nhận dạng mặt người trong bảo đảm an toàn thông tin 38
Trang 63.3 Đề xuất hướng giải quyết và phạm vi ứng dụng của đề tài 39
Chương 4: CHƯƠNG TRÌNH THỬ NGHIỆM 41
4.1 Sơ lược về EmguCV 41
4.2 Các bước chính trong hệ thống nhận dạng mặt người 42
4.3 Phân tích hệ thống 43
4.4 Kết quả chạy chương trình 45
KẾT LUẬN 50
TÀI LIỆU THAM KHẢO 51
Trang 7DANH MỤC HÌNH VẼ
Hình 1.1: Các đặc trưng sinh trắc của con người 9
Hình 1.2: Bài toán nhận dạng mặt người 15
Hình 1.3: Kiến trúc hệ thống nhận dạng mặt người 17
Hình 1.4: Hiệu năng giải thuật PCA theo số lượng đặc trưng trích rút 20
Hình 1.5: Giải thuật trích chọn đặc trưng 21
Hình 2.1: 4 đặt trưng Haar-like cơ bản 23
Hình 2.2: Các đặc trưng mở rộng của các đặc trưng Haar-like cơ sở 24
Hình 2.3: Cách tính Integral Image của ảnh 25
Hình 2.4: Ví dụ cách tính nhanh các giá trị mức xám của vùng D trên ảnh 25
Hình 2.5: Mô hình phân tầng kết hợp các bộ phân loại yếu để xác định khuôn mặt 27
Hình 2.6 : Hệ thống xác định vị trí khuôn mặt người (Face detection system) 28
Hình 2.7: Minh họa PCA: tìm các trục tọa độ mới sao cho dữ liệu có độ biến thiên cao nhất 31
Hình 4.1 : Cấu trúc cơ bản của OpenCV 42
Hình 4.2: Chức năng nhận dạng của hệ thống 43
Trang 8MỞ ĐẦU
Khi bạn đăng nhập máy tính, sử dụng thẻ ATM, xuất nhập cảnh khi đi máy bay, sử dụng thẻ tín dụng, khi bạn vào các khu vực đòi hỏi an ninh cao, bạn cần phải xác thực nhận dạng Xác thực nhận dạng là để kiểm tra bạn có phải là người mà bạn khai báo hay không
Các phương pháp xác thực truyền thống bao gồm mật khẩu và các loại thẻ định danh như chứng minh thư, thẻ ATM… Điều bất lợi khi bạn sử dụng các phương pháp xác thực truyền thống là bạn có thể quên mật khẩu, bạn có thể đánh mất chứng minh thư, đánh mất thẻ tín dụng,… dẫn đến việc bạn không thể đăng nhập để truy cập vào các tài nguyên cá nhân của bạn và các kho tài liệu mật của bạn Ngoài ra còn có các nguy cơ nguy hiểm khác nữa là
vô tình các thông tin bảo mật của bạn lại rơi vào tay của người khác, họ sử dụng thông tin mật của bạn vào các mục đích bất lợi cho bạn và cho mọi người
Vấn đề cấp bách đứng hàng đầu hiện nay về công nghệ là nâng cao tính bảo mật Hàng ngày, hàng giờ vẫn luôn xảy ra các vấn đề đánh cắp thông tin mật và các tài khoản ngân hàng … Để hạn chế các vấn đề này, vấn đề bảo mật
về sinh trắc học đang được sự quan tâm của nhiều người trong các lĩnh vực cần mức độ bảo mật an toàn cao cũng như tính thuận tiện của nó khi xác thực nhận dạng chủ thể trong đời sống xã hội cũng như trong các lĩnh vực quốc phòng, an ninh
Với nhu cầu bảo mật ngày càng cao của các ứng dụng truy nhập, kiểm soát vào ra … tôi quyết định chọn đề tài nhận dạng khuôn mặt người và ứng dụng trong bảo toàn thông tin để thực hiện luậnvăn tốt nghiệp của mình
Trang 9Chương 1.CƠ SỞ KHOA HỌC VÀ THỰC TIỄN CỦA VẤN ĐỀ NHẬN DẠNG
MẶT NGƯỜI
1.1 TỔNG QUAN VỀ SINH TRẮC HỌC
Sinh trắc học hay Công nghệ sinh trắc học (thuật ngữ khoa học:
Biometric) l{ công nghệ sử dụng những thuộc tính vật lý, đặc điểm sinh học riêng của mỗi c| nh}n như v}n tay, mống mắt, khuôn mặt để nhận diện
Mỗi người có một đặc điểm sinh học duy nhất Dữ liệu sinh trắc học của từng c| nh}n với đặc điểm khuôn mặt, ảnh chụp võng mạc, giọng nói sẽ được kết hợp với nhau bằng phần mềm để tạo ra mật khẩu d{nh cho những giao dịch điện tử, phương thức đó l{ “công nghệ sinh trắc đa nh}n tố”
Hình 1.1: C|c đặc trưng sinh trắc của con người
Những thiết bị điện tử có khả năng sử dụng dữ liệu sinh trắc học trong
Trang 10thời gian thực để bảo vệ thông tin bí mật của con người Con người sẽ không phải tạo, lưu giữ hay ghi nhớ mật khẩu d{nh cho thư điện tử, thẻ ng}n h{ng Chính phủ một số nước đ~ thực hiện việc thắt chặt an ninh v{ quản lý hộ chiếu bằng c|ch thử nghiệm công nghệ sinh trắc học H~ng Cross Match Technologies thiết kế ứng dụng x|c thực sinh trắc học dùng công nghệ nhận diện gương mặt để lấy được đối tượng từ một đ|m đông
Tại Mỹ, thẻ tín dụng sắp tới kỳ trở th{nh đồ cổ, trong c|c chuỗi siêu thị Thrifway, kh|ch h{ng trả tiền mua h{ng bằng ngón tay…Theo c|c nh{ nghiên cứu của IBM, trong tương lai không xa con người có thể bước tới một m|y rút tiền tự động v{ đọc tên hoặc nhìn v{o một cảm biến nhỏ xíu để rút tiền Nếu cảm biến nhận ra những đặc điểm duy nhất trong võng mạc của kh|ch h{ng, nó sẽ cho phép người đó giao dịch Hiện nay đ~ có trên 100 quốc gia sử dụng hộ chiếu điện tử bằng công nghệ nhận dạng v}n tay Sử dụng v}n tay được đ|nh gi| l{ một giải ph|p bảo mật hữu hiệu v{ x|c nhận nh}n th}n chính x|c
Nhận dạng khuôn mặt người l{ một công nghệ được ứng dụng rộng r~i trong đời sống hằng ng{y của con người như c|c hệ thống gi|m s|t, quản lý v{o ra, tìm kiếm thông tin một người nổi tiếng, Có rất nhiều phương ph|p nhận dạng khuôn mặt để n}ng cao hiệu suất tuy nhiên dù ít hay nhiều những phương ph|p n{y đang vấp phải những thử th|ch về độ s|ng, hướng nghiêng, kích thước ảnh, hay ảnh hưởng của tham số môi trường
Nhận dạng khuôn mặt l{ một th|ch thức lớn, vì vậy, nó đ~ thu hút c|c nh{ nghiên cứu từ c|c lĩnh vực kh|c nhau như: t}m lý học, nhận dạng mẫu, mạng tế b{o thần kinh, thị gi|c m|y tính, đồ họa m|y tính …
Để tìm hiểu kỹ về vấn đề n{y, ta tìm hiểu về một số công nghệ đ~ được
sử dụng phổ biến hiện nay:
1.1.1 Vân tay (Fingerprint)
Trang 11Đầu thế kỷ XIX, ph|t hiện khoa học thừa nhận hai tính năng quan trọng: Thứ nhất l{ hai kiểu v}n tay kh|c nhau dẫn đến có 2 người kh|c nhau C|c dấu v}n tay rất hiếm khi có 2 người trùng v}n tay Theo kết quả đó dấu v}n tay được đưa v{o nhận dạng tội phạm khi họ phạm tội để lại dấu v}n tay Những năm 60 của thế kỷ 20, vì m|y tính có khả năng xử lý đồ họa với độ chính x|c cao nên con người bắt đầu nghiên cứu về dấu v}n tay trong vấn đề bảo mật Hệ thống nhận dạng v}n tay tự động AFIS Zai thực hiện c|c nghiên cứu ph|p luật v{ ứng dụng
Một hệ thống sinh trắc học tốt yêu cầu phải đạt tốc độ xử lý nhanh chóng v{ hiệu quả trong thời gian thực thi để ho{n th{nh qu| trình nhận dạng Tất cả c|c hệ thống sinh trắc học bao gồm c|c qu| trình xử lý: thu nhận, giải m~, so s|nh v{ kết hợp Dấu v}n tay đảm nhận việc xử lý, nó bao gồm c|c công đoạn chụp lại ảnh dấu v}n tay, xử lý hình ảnh dấu v}n tay, khai th|c c|c tính năng để so s|nh sau đó kết hợp lại với nhau để đưa ra thông tin Thuận lợi của việc sử dụng dấu v}n tay l{ nó đ|ng tin cậy v{ dễ d{ng được chấp nhận Bạn chỉ cần bỏ ra một khoảng thời gian rất ngắn để có được hình ảnh về dấu v}n tay với một thiết bị lấy dấu v}n tay, nhiều nghiên cứu cho thấy rằng tất cả c|c công nghệ nhận dạng sinh trắc học thì dấu v}n tay hầu như không cấu th{nh h{nh vi x}m phạm cơ thể con người như c|c phương tiện công nghệ kh|c
1.1.2 Đường chỉ tay (Palm lines)
Hầu hết tất cả mọi người đều có c|c khuôn hình b{ntay kh|c nhau, v{ hình dạng b{n tay của con người sau khi đạt đến một độ tuổi nhất định thì nó
sẽ không còn thay đổi đ|ng kể nữa Khi người dùng đặt b{n tay lên trên m|y đọc, b{n tay đó sẽ được chụp lại ảnh không gian 3 chiều từ trên xuống Tiếp theo, độ d{i v{ hình dạng c|c đốt trên c|c ngón tay được m|y đọc đo đạc Theo số liệu được sử dụng để x|c định những người kh|c nhau, công nghệ đọc b{n tay có thể được chia th{nh 3 lĩnh vực sau: Ứng dụng của lòng
Trang 12b{n tay, hình d|ng mạch b{n tay v{ ph}n tích hình học ngón tay Lập ra những nét đặc trưng kh|c nhau của c|c bức ảnh l{ kh| đơn giản, không sản sinh thiết lập ra một số lượng lớn c|c dữ liệu Tuy nhiên, với một số lượng đ|ng kể của c|c bản ghi, hình học b{n tay có thể sẽ không ph}n biệt giữa c|c con người với nhau bởi vì c|c đặc điểm trên lòng b{n tay của con người tương tự lẫn nhau (Nó không giống nhau nhưng nó tương tự nhau nên dẫn đến khó ph}n biệt.) Do đó, việc sử dụng x|c thực bằng phương ph|p sinh trắc học so s|nh giữa c|c b{n tay hình học không thể có được mức độ chính x|c cao nhất
dữ liệu camera vừa chụp với dữ liệu mẫu đ~ có sẵn trong dữ liệu
Võng mạc l{ một lớp c|c mạch m|u ở phía sau của mắt Quét võng mạc được thực hiện bởi một cường độ |nh s|ng hồng ngoại thấp để chụp lại c|c đặc điểm của võng mạc Một khu vực được gọi l{ bề mặt, nằm ở trung t}m của võng mạc, được quét v{ c|c mô hình mạch m|u được chụp lại Sinh trắc học võng mạc được xem l{ sinh trắc học tốt nhất Tuy nhiên, mặc dù kỹ thuật n{y có độ chính x|c cao nhưng kỹ thuật n{y vẫn được cho l{ bất tiện v{ dễ bị x}m nhập V{ như vậy, rất khó được chấp nhận chung bởi người dùng cuối M|y quét võng mạc đòi hỏi c| nh}n con người phải đứng yên trong khi nó đang đọc thông tin võng mạc Mắt v{ m|y quét võng mạc không có hiệu quả đối với người bị khiếm thị v{ những người bị đục thủy tinh thể
1.1.4 Giọng nói
Trang 13X|c nhận giọng nói l{ x|c nhận khoa học của một người dựa trên đặc điểm giọng nói của họ Tính năng duy nhất của giọng nói của một người được số hóa v{ so s|nh với dữ liệu mẫu m{ người đó đ~ được ghi lại từ trước
“voiceprint” (ghi lại bằng đồ thị sóng }m) được lưu trữ trong cơ sở dữ liệu
để x|c minh danh tính Nó kh|c với nhận dạng giọng nói bởi vì công nghệ không công nhận lời nói từ chính nó Thay v{o đó, nó nhận ra người nói c|c
từ bằng c|ch ph}n tích đặc điểm duy nhất, chẳng hạn như tần số giữa c|c ngữ }m học
Công nghệ nhận dạng giọng nói có thể l{m cho người nói điều khiển truy cập v{o dịch vụ một c|ch có giới hạn, ví dụ truy cập từ điện tho{i đến ng}n h{ng, c|c dịch vụ cơ sở dữ liệu, shopping hoặc thư thoại, v{ truy cập v{o c|c thiết bị bảo mật
Trong khi nhận dạng giọng nói được công nhận l{ thuận tiện thì nó lại không đ|ng tin cậy do những rủi ro mạo danh, truy cập từ xa v{ có độ chính x|c kém Một người bị cảm lạnh hoặc viêm thanh quản có thể có vấn đề khi
sử dụng hệ thống nhận dạng giọng nói Hệ thống có thể sẽ không thừa nhận giọng nói đó v{ từ chối l{ sai thông tin
1.1.5 Nhận dạng mặt người (Face recognition)
Hệ thống nhận diện khuôn mặt x|c định một c| nh}n bằng c|ch ph}n tích hình ảnh, khuôn mẫu v{ đ|nh dấu c|c điểm đặc trưng trên gương mặt
Có hai phương ph|p cơ bản để xử lý dữ liệu: video v{ hình ảnh nhiệt Tiêu chuẩn kỹ thuật video l{ dựa v{o hình ảnh chụp khuôn mặt của m|y camera
Kỹ thuật hình ảnh nhiệt ph}n tích mô hình nhiệt ph|t sinh của c|c mạch m|u dưới lớp da mặt
Sự hấp dẫn của hệ thống sinh trắc học n{y l{ có thể hoạt động “hands = free” (không sử dụng tay), dẫn đến hạn chế số lượng tường t|c giữa người v{ m|y móc Tuy nhiên, hệ thống n{y không đ|ng tin cậy v{ m|y móc thì rất đắt tiền Ví dụ, nó sẽ không ph}n biệt được c|c cặp sinh đôi v{ sinh ba giống
Trang 14nhau, Không nhận ra người sử dụng sau khi họ cắt tóc v{ không nhận ra người thay đổi từ đeo kính th{nh không đeo kính
1.1.6 DNA (Dioxyribo Nucleic Acid)
Thuật ngữ "DNA" viết tắt của Dioxyribo Nucleic Acid DNA được tìm thấy trong mọi tế b{o của mọi sinh vật, v{ nó chứa c|c thông tin thực hiện c|c hoạt động của tế b{o Kể từ khi ph}n tích được cấu trúc DNA của mỗi người l{ ho{n to{n l{ độc nhất vô nhị, DNA được ph}n tích một c|ch rất chính x|c để chứng minh việc nhận dạng Do thử nghiệm rộng r~i v{ yêu cầu thuận lợi về công nghệtiên tiến, tuy nó không phải l{ c|ch khoa học nhất để tiết kiệm chi phí sinh trắc học, nhưng khi x|c định l{ cần thiết phải l{m thì phương ph|p n{y l{ đ|ng tin cậy nhất
1.2.HỆ THỐNG NHẬN DẠNG MẶT NGƯỜI
1.2.1 Bài toán nhận dạng mặt người và những khó khăn
1.2.1.1 Bài toán nhận dạng mặt người
Hệ thống nhận dạng mặt người l{ một hệ thống nhận v{o l{ một ảnh hoặc một đoạn video (một chuỗi c|c ảnh) Qua xử lý tính to|n hệ thống x|c định được vị trí mặt người trong ảnh (nếu có) v{ x|c định l{ người n{o trong số những người hệ thống đ~ được biết (qua qu| trình học) hoặc l{ người lạ
Trang 15Hình 1.2: B{i to|n nhận dạng mặt người
1.2.1.2 Những khó khăn của nhận dạng khuôn mặt
Khó khăn của b{i to|n nhận dạng mặt người có thể kể như sau:
1/ Tư thế, góc chụp: Ảnh chụp khuôn mặt có thể thay đổi rất nhiều bởi vì góc chụp giữa camera v{ khuôn mặt Chẳng hạn như: chụp thẳng, chụp xéo bên tr|i 450hay xéo bên phải 450, chụp từ trên xuống, chụp từ dưới lên, v.v ), với c|c tư thế kh|c nhau, c|c th{nh phần trên khuôn mặt như mắt, mũi, miệng có thể bị khuất một phần hoặc thậm chí khuất hết
2/ Sự xuất hiện hoặc thiếu một số th{nh phần của khuôn mặt: C|c đặc trưng như: r}u mép, r}u h{m, mắt kính, v.v…, có thể xuất hiện hoặc không, vấn đề n{y l{m cho b{i to|n c{ng trở nên khó hơn rất nhiều
3/ Sự biểu cảm của khuôn mặt: Biểu cảm của khuôn mặt người có thể l{m ảnh hưởng đ|ng kể lên c|c thông số của khuôn mặt Chẳng hạn, cùng một khuôn mặt một người, nhưng có thể sẽ rất kh|c khi họ cười hoặc sợ h~i,v.v 4/ Sự che khuất: Khuôn mặt có thể bị che khuất bởi c|c đối tượng kh|c hoặc c|c khuôn mặt kh|c
Trang 165/ Hướng của ảnh: C|c ảnh của khuôn mặt có thể biến đổi rất nhiều với c|c góc quay kh|c nhau của trục camera, chẳng hạnchụp với trục m|y ảnh nghiêng l{m cho khuôn mặt bị nghiêng so với trục của ảnh
6/ Điều kiện của ảnh: Ảnh được chụp trong c|c điều kiện kh|c nhau về: chiếu s|ng, về tính chất camera (m|y kỹ thuật số, m|y hồng ngoại,v.v ), ảnh hưởng rất nhiều đến chất lượng ảnh khuôn mặt
1.2.2 Các ứng dụng liên quan đến nhận dạng mặt người
B{i to|n nhận dạng mặt người có thể |p dụng rộng r~i trong nhiều ứng dụng thực tế kh|c nhau Đó chính l{ lý do m{ b{i to|n n{y hấp dẫn rất nhiều nhóm nghiên cứu trong thời gian d{i C|c ứng dụng liên quan đến nhận dạng mặt người có thể kể như:
- Hệ thống ph|t hiện tội phạm: camera được đặt tại một số điểm công cộng như: siêu thị, nh{ s|ch, trạm xe buýt, s}n bay,v.v Khi ph|t hiện được
sự xuất hiện của c|c đối tượng l{ tội phạm, hệ thống sẽ gởi thông điệp về cho trung t}m xử lý
- Hệ thống theo dõi nh}n sự trong một đơn vị: gi|m s|t giờ ra v{o của từng nh}n viên v{ chấm công
- Hệ thống giao tiếp người m|y: thay thế việc tương t|c giữa người v{ m|y theo những c|ch truyền thống như: b{n phím, chuột,v.v Thay v{o đó l{
sử dụng c|c giao tiếp trực quan: biểu cảm khuôn mặt, dấu hiệu, cử chỉ bằng tay (visual input, visual interaction)
- Hệ thống tìm kiếm thông tin trên ảnh, video dựa trên nội dung (chỉ mục theo người) Chẳng hạn như: kênh truyền hình CNN có một kho dữ liệu video tin tức kh| lớn cần tìm kiếm nhanh những đoạn video n{o có G Bush hoặc Bin Laden
- Các thệ thống bảo mật dựa trên thông tin trắc sinh học: mặt người, vân tay,v.v thay vì xác nhận mật khẩu, khóa,v.v
Trang 171.2.3 Tổng quan kiến trúc hệ thống nhận dạng khuôn mặt
Hệ thống nhận dạng mặt người l{ hệ thống được thiết kế để tìm thông tin của một người Kỹ thuật nhận dạng l{ kiểm tra sự phù hợp dựa trên phép
so s|nh một – nhiều, cụ thể l{ tìm ra một người l{ ai trong số những người đ~ được lưu trữ trong hệ thống dựa v{o thông tin khuôn mặt
Đầu v{o của một hệ thống nhận dạng khuôn mặt l{ một hình ảnh hay một đoạn băng Video Đầu ra l{ một x|c định hay x|c minh của đối tượng xuất hiện trong hình ảnh hoặc đoạn băng Video đó Một số hướng tiếp cận định nghĩa một hệ thống nhận dạng khuôn mặt gồm ba bước xử lý: ph|t hiện khuôn mặt, trích rút đặc trưng v{ nhận dạng khuôn mặt
Hình 1.3: Kiến trúc hệ thống nhận dạng mặt người
Ph|t hiện khuôn mặt người( Face Detection) l{ một kỹ thuật m|y tính
để x|c định vị trí v{ kích thước của c|c khuôn mặt người trong c|c ảnh bất
kỳ Kỹ thuật n{y nhận biết c|c đặc trưng của khuôn mặt v{ bỏ qua những thứ kh|c như: tòa nh{, c}y cối, cơ thể
Trích rút đặc trưng l{ trích chọn c|c đặc tính đặc trưng cho khuôn mặt người từ dữ liệu v{o Những đặc trưng n{y có thể l{ c|c vùng trên khuôn mặt, c|c biến thể, góc cạnh, hay độ đo (như khoảng c|ch hai mắt…)
Bước cuối cùng l{ nhận dạng khuôn mặt Trong chức năng nhận dạng
hệ thống sẽ thông b|o danh tính của đối tượng từ một cơ sở dữ liệu Giai đoạn n{y liên quan đến phương ph|p so s|nh, giải thuật ph}n lớp, độ đo chính x|c
1.2.3.1 Phát hiện khuôn mặt
Phát hiện khuôn
mặt (Face detection)
Trích rút đặc trưng (Face extraction)
Nhận dạng khuôn mặt (Face recognition)
Trang 18Ng{y nay, một số ứng dụng nhận dạng khuôn mặt có thể không cần bước ph|t hiện khuôn mặt Khi đó những ảnh khuôn mặt được lưu trữ trong
cơ sở dữ liệu đ~ được chuẩn hóa
Ví dụ như hệ thống dữ liệu lưu trữ hồ sơ tội phạm của cơ quan an ninh, nếu có một vụ |n m{ cảnh s|t đ~ có được hộ chiếu hay chứng minh thư của tội phạm thì việc nhận diện sẽ không cần bước ph|t hiện khuôn mặt vì ảnh đầu v{o đ~ chuẩn hóa Tuy nhiên, thông thường thì những hình ảnh đầu v{o của hệ thống thị gi|c m|y tính thường chứa cả khuôn mặt v{ những đối tượng kh|c nên bước ph|t hiện khuôn mặt l{ rất cần thiết Đặc biệt l{ hệ thống video gi|m s|t phải bao gồm ph|t hiện khuôn mặt, theo dõi khuôn mặt, nhận dạng khuôn mặt
Có nhiều nghiên cứu tìm phương ph|p x|c định khuôn mặt người, từ ảnh x|m đến ng{y nay l{ ảnh m{u Dựa v{o tính chất của c|c phương ph|p x|c định
khuôn mặt người trên ảnh C|c phương ph|p n{y được chia l{m bốn [9] hướng tiếp cận chính Ngo{i bốn hướng n{y, nhiều nghiên cứu có khi liên quan đến không những một hướng tiếp cận m{ có liên quan nhiều hơn một hướng chính:
-Hướng tiếp cận dựa trên tri thức: M~ hóa c|c hiểu biết của con người
về c|c loại khuôn mặt người th{nh c|c luật Thông thường c|c luật mô tả quan hệ của c|c đặc trưng
- Hướng tiếp cận dựa trên đặc trưng không thay đổi: Mục tiêu c|c thuật to|n đi tìm c|c đặc trưng mô tả cấu trúc khuôn mặt người m{ c|c đặc trưng n{y sẽ không thay đổi khi tư thế khuôn mặt, vị trí đặt thiết bị thu hình hoặc điều kiện |nh s|ng thay đổi
- Hướng tiếp cận dựa trên so khớp mẫu: Dùng c|c mẫu chuẩn của khuôn mặt người (c|c mẫu n{y được chọn lựa v{ lưu trữ) để mô tả cho
Trang 19khuôn mặt người hay c|c đặc trưng khuôn mặt (c|c mẫu n{y phải chọn l{m sao cho t|ch biệt nhau theo tiêu chuẩn m{ c|c t|c giả định ra để so s|nh) C|c mối tương quan giữa dữ liệu ảnh đưa v{o v{ c|c mẫu dùng để x|c định khuôn mặt người
- Hướng tiếp cận dựa trên diện mạo: Tr|i ngược hẳn với so khớp mẫu, c|c mô hình (hay c|c mẫu) được học từ một tập ảnh huấn luyện trước đó Sau đó hệ thống (mô hình) sẽ x|c định khuôn mặt người Hay một số t|c giả còn gọi hướng tiếp cận n{y l{ hướng tiếp cận theo phương ph|p học
1.2.3.2 Trích chọn đặc trưng
Con người chúng ta có thể nhận diện khuôn mặt khi chúng ta được 5 tuổi Đó l{ một qu| trình xử lý tự động, riêng biệt trong bộ n~o người Con người có thể nhận ra người quen ngay cả khi họ đội mũ hoặc đeo kính, thậm chí họ vừa để r}u Chúng ta có thể nhận ra ảnh cưới của ông b{ mình khi họ mới 23 tuổi một c|ch dễ d{ng Những xử lý n{y l{ bình thường đối với con người, nhưng lại l{ th|ch thức đối với m{y tính Thực sự thì vấn đề cốt lõi của nhận dạng khuôn mặt l{ trích rút những thông tin từ bức ảnh Qu| trình trích rút đặc trưng được định nghĩa như l{ thủ tục trích ra những thông tin liên quan, quan trọng từ một bức ảnh khuôn mặt Những thông tin n{y phải có gi| trị
Trang 20sử dụng cho bước x|c định đối tượng sau n{y vói một tỉ lệ sai số chấp nhận
được
Hình 1.4: Hiệu năng giải thuật PCAtheo số lượng đặc trưng trích rút Qu| trình trích chọn đặc trưng cũng phải đảm bảo hiệu năng về thời gian tính to|n v{ khả năng lưu trữ của m{y tính.Đầu ra của nó phải phù hợp với bước ph}n lớp sau n{y Trích rút đặc trưng bao gồm c|c bước: Giảm số chiều, trích đặc trưng, chọn lọc đặc trưng Giảm số chiều l{ một nhiệm vụ quan trọng trong bất cứ một hệ thống nhận dạng mẫu n{o.Hiệu năng của một bộ ph}n lớp phụ thuộc v{o số lượng ảnh mẫu, số đặc trưng v{ độ phức tạp của bộ ph}n lớp Tỷ lệ lỗi của một bộ ph}n lớp có thể không tăng khi số lượng c|c đặc trưng tăng Tuy nhiên, khi thêm đặc trưng có thể l{m giảm hiệu năng của giải thuật ph}n lớp.Điều n{y có thể xảy ra khi số lượng mẫu học nhỏ hơn so với số lượng đặc trưng.Một c|ch để giải quyết vấn đề n{y l{
số lượng mẫu học cho một lớp gấp 10 lần số đặc trưng Do đó việc giữ số lượng đặc trưng nhỏ nhất có thể l{ rất quan trọng.Giảm số đặc trưng bộ ph}n lớp sẽ nhanh hơn v{ sử dụng ít bộ nhớ hơn.Hơn nữa, một bộ đặc trưng lớn
có thể g}y lỗi khi những chứa những đặc trưng không cần thiết, dư thừa.Số
Số lượng đặc trưng
Trang 21lượng đặc trưng phải được lựa chọn thật cẩn thận.Qu| ít hoặc qu| nhiều đặc trưng thừa có thể ảnh hưởng đến độ chính x|c của hệ thống nhận dạng
C|c phương ph|p trích rút đặc trưng sử dụng trong nhận dạng khuôn mặt người:
Phương ph|p Ph}n tích th{nh phần chính (PCA: principal component analysis)
Kernel PCA
Weighted PCA
Ph}n tích sự kh|c biệt tuyến tính (LDA: Linear Discriminant Analysis
)
Semi-supervised Discriminant Analysis (SDA)
Idenpendent Component Analysis(ICA)
Phương ph|p dựa trên mạng Nơ ron
Mutidinmensional Scaling (MDS)
Self-oganizing map(SOM)
Active shape Models(ASM)
Active appearance Models(AAM)
Discrete cosine Transform(DCT)
Trang 22tích th{nh phần chính (PCA), một cột mốc mới trong ng{nh công nghệ nhận diện khuôn mặt
Có hai phương ph|p nhận dạng mặt người phổ biến hiện nay l{ nhận dạng dựa trên đặc trưng của c|c phần tử trên khuôn mặt như biển đổi Sóng Wavelet (Gabor Wavelet) v{ Mạng Nơron (Neural Network), Support Vector Machine (SVN),… v{ nhận dạng dựa trên xét tổng thể to{n khuôn mặt như phương ph|p Ph}n tích th{nh phần chính (Principal Component Analysis – PCA), phương ph|p Ph}n tích sự kh|c biệt tuyến tính (Linear Discriminant Analysis – LDA), phương ph|p Ph}n tích đặc điểm vùng (Local Feature Analysis – LFA)
Trang 23Chương 2: PHƯƠNG PHÁP NHẬN DẠNG MẶT NGƯỜI
2.1 PHÁT HIỆN KHUÔN MẶT
B{i to|n x|c định khuôn mặt người (Face detection) l{ một kỹ thuật m|y tính để x|c định c|c vị trí v{ c|c kích thước của khuôn mặt trong ảnh bất kỳ (ảnh kỹ thuật số) Kỹ thuật n{y nhận biết c|c đặt trưng khuôn mặt v{
bỏ qua những thứ kh|c như: to{ nh{, c}y cối, cơ thể
Chương trình x|c định vị trí khuôn mặt người trong b{i viết n{y sử dụng hướng tiếp cận dựa trên mạo, sử dụng bộ ph}n loại mạnh AdaBoost l{
sự kết hợp của c|c bộ ph}n loại yếu dựa trên c|c đặt trưng Haar-like để x|c định khuôn mặt
2.1.1 Đặc trưng HAAR-LIKE
Đặc trưng HAAR-LIKE do Viola v{ Jones công bố, gồm 4 đặc trưng cơ bản để x|c định khuôn mặt người Mỗi đặc trưng Haar–like l{ sự kết hợp của hai hay ba hình chữ nhật "trắng" hay "đen" như trong hình sau:
Hình 2.1: 4 đặt trưng Haar-like cơ bản
Để sử dụng c|c đặc trưng n{y v{o việc x|c định khuôn mặt người, 4 đặc trưng Haar-like cơ bản được mở rộng ra, v{ được chia l{m 3 tập đặc trưng như sau:
1 Đặc trưng cạnh (edge features):
2 Đặc trưng đường (line features):
Trang 243 Đặc trưng xung quanh t}m (center-surround features):
Hình 2.2: C|c đặc trưng mở rộng của c|c đặc trưng Haar-like cơ sở Dùng c|c đặc trưng trên, ta có thể tính được gi| trị của đặc trưng Haar-like l{ sự chênh lệch giữa tổng của c|c pixel của c|c vùng đen v{ c|c vùng trắng như trong công thức sau:
f(x) = Tổngvùng đen(c|c mức x|m của pixel) - Tổngvùng trắng(c|c mức x|m của pixel)
Sử dụng gi| trị n{y, so s|nh với c|c gi| trị của c|c gi| trị pixel thô, c|c đặc trưng Haar-like có thể tăng/giảm sự thay đổi in-class/out-of-class (bên trong hay bên ngo{i lớp khuôn mặt người), do đó sẽ l{m cho bộ ph}n loại dễ hơn
Như vậy ta có thể thấy rằng, để tính c|c gi| trị của đặc trưng Haar-like,
ta phải tính tổng của c|c vùng pixel trên ảnh Nhưng để tính to|n c|c gi| trị của c|c đặc trưng Haar-like cho tất cả c|c vị trí trên ảnh đòi hỏi chi phí tính to|n kh| lớn, không đ|p ứng được cho c|c ứng dụng đòi hỏi tính run-time
Do đó Viola v{ Jones đưa ra một kh|i niệm gọi l{ Integral Image, l{ một mảng
2 chiều với kích thước bằng với kích của ảnh cần tính c|c đặc trưng Haar-like, với mỗi phần tử của mảng n{y được tính bằng c|ch tính tổng của điểm ảnh phía trên (dòng-1) v{ bên tr|i (cột-1) của nó Bắt đầu từ vị trí trên, bên tr|i đến vị trí dưới, phải của ảnh, việc tính to|n n{y đơn thuần chỉ đựa trên phép cộng số nguyên đơn giản, do đó tốc độ thực hiện rất nhanh
Trang 25Hình 2.3: C|ch tính Integral Image của ảnh Sau khi đ~ tính được Integral Image, việc tính tổng c|c gi| trị mức x|m của một vùng bất kỳ n{o đó trên ảnh thực hiện rất đơn giản theo c|ch sau:
Giả sử ta cần tính tổng c|c gi| trị mức x|m của vùng D như trong hình
4, ta có thể tính như sau:
D = A + B + C + D – (A+B) – (A+C) + A
Với A + B + C + D chính l{ gi| trị tại điểm P4 trên Integral Image, tương tự như vậy A+B l{ gi| trị tại điểm P2, A+C l{ gi| trị tại điểm P3, v{ A l{ gi| trị tại điểm P1 Vậy ta có thể viết lại biểu thức tính D ở trên như sau:
Hình 2.4: Ví dụ c|ch tính nhanh c|c gi| trị mức x|m của vùng D trên ảnh Tiếp theo, để chọn c|c đặc trưng Haar-like dùng cho việc thiết lập ngưỡng, Viola v{ Jones sử dụng một phương ph|p m|y học được gọi l{
AdaBoost AdaBoost sẽ kết hợp c|c bộ ph}n loại yếu để tạo th{nh một bộ ph}n loại mạnh Với bộ ph}n loại yếu chỉ cho ra c}u trả lời chính x|c chỉ hơn viện đo|n một c|ch ngẫn nhiên một chút, còn bộ ph}n loại mạnh có thể đưa
ra c}u trả lời chính x|c trên 60%
Trang 26Trên hình l{ một đặc trưng haar-like trên vùng mắt, b}y giờ nếu có h{ng trăm đặc trưng như vậy trên h{ng trăm bức ảnh huấn luyện thì sao? Ta
sẽ được một ph}n lớp, tập hợp của rất nhiều ph}n lớp n{y sẽ cho ta x|c định vùng chứa khuôn mặt
2.1.2 Adaboosting
AdaBoost l{ một bộ ph}n loại mạnh phi tuyến phức dựa trên hướng tiếp cận boosting được Freund v{ Schapire đưa ra v{o năm 1995 [2]
Adaboost cũng hoạt động trên nguyên tắc kết hợp tuyến tính c|c weak
classifiers để hình th{nh một strong classifier
L{ một cải tiến của tiếp cận boosting, AdaBoost sử dụng thêm kh|i niệm trọng số (weight) để đ|nh dấu c|c mẫu khó nhận dạng Trong qu| trình huấn luyện, cứ mỗi weak classifiers được x}y dựng, thuật to|n sẽ tiến h{nh cập nhật lại trọng số để chuẩn bị cho việc x}y dựng weak classifier kế tiếp: tăng trọng số của c|c mẫu bị nhận dạng sai v{ giảm trọng số của c|c mẫu được nhận dạng đúng bởi weak classifier vừa x}y dựng Bằng c|ch n{y weak classifer sau có thể tập trung v{o c|c mẫu m{ c|c weak classifiers trước nó l{m chưa tốt Sau cùng, c|c weak classifers sẽ được kết hợp tùy theo mức độ tốt của chúng để tạo nên strong classifier
Viola v{ Jones dùng AdaBoost kết hợp c|c bộ ph}n loại yếu sử dụng c|c đặc trưng Haar-like theo mô hình ph}n tầng (cascade) như sau: