Dưới đây là một số bài toán có liên quan tới nhận dạng mặt người: - Phát hiện đường biên của mặt người trong một ảnh chụp toàn cảnh nào đó tách đang sử dụng chỉ có thể thực hiện trên các
Trang 1đại học quốc gia hà nội khoa công nghệ
Vũ Đình Hoàng
Nhận dạng ảnh mặt người trong điều kiện ánh sáng thay đổi
Ngành: Công nghệ thông tin
Cán bộ hướng dẫn: TS Hà Quang Thụy
TS Nguyễn Thanh Tùng
Hà nội 2002
Trang 2Mục lục
lời nói đầu 3
chương 1 Tổng quan về nhận dạng ảnh mặt người 5
1.1 Bài toán nhận dạng ảnh mặt người 5
1.1.1 Bài toán và các yêu cầu nhận dạng 5
1.1.2 Giải quyết bài toán từ quan điểm của lý thuyết nhận dạng 8
1.2 giải quyết vấn đề trong bài toán nhận dạng ảnh mặt người 9
1.2.1 Thu nhận dữ liệu 10
1.2.2 Biểu diễn đối tượng 12
1.2.3 Lập luận kết quả 14
1.3 hệ thống kỹ thuật nhận dạng ảnh mặt người 14
1.3.1 Qui trình công nghệ xử lý thông tin 15
1.3.2 Các vấn đề trong triển khai thực tế 16
1.3.3 Các ứng dụng điển hình 17
chương 2 nhận dạng ảnh mặt người trong điều kiện ánh sáng thay đổi 19
2.1 Phân tích các yếu tố ảnh hưởng đến quá trình nhận dạng 19
2.1.1 ánh sáng 19
2.1.2 Các thay đổi hình học 19
2.1.3 Sai số do hệ thống 20
2.2 Các kỹ thuật giải quyết 20
2.2.1 Đưa các thông tin về điều kiện môi trường vào mô tả đối tượng 20
2.2.2 Cách giải quyết dựa trên kỹ thuật khoảng cách tiếp xúc 24
2.2.3 Kết hợp các cách biểu diễn đối tượng khác nhau 26
Chương 3 thuật toán nhận dạng trong điều kiện ánh sáng thay đổi 32
3.1 Thuật toán so sánh khuôn mẫu dựa theo khoảng cách tiếp xúc .32
3.2 Thuật toán so sánh điểm đặc trưng dựa theo khoảng cách tiếp xúc 35
3.3 Kết hợp hai thuật toán so sánh trên 37
Trang 3KÕt luËn 39 Tµi liÖu tham kh¶o 40
Trang 4lời nói đầu
Nhận dạng mặt người bằng mắt là một phương thức thông dụng rất hiệu quả và đạt
độ chính xác cao ngay cả trong trường hợp có các thay đổi lớn bởi các tác nhân kích thích trực quan do các điều kiện quan sát, diễn cảm, lão hóa và các tiêu khiển như kính hoặc các thay đổi kiểu tóc Tuy nhiên việc xây dựng các hệ thống tự động thực hiện nhiệm vụ nhận dạng này thông qua ảnh là rất khó khăn vì gặp phải các biến đổi quan trọng trong quá trình
định dạng ảnh
Dưới đây là một số bài toán có liên quan tới nhận dạng mặt người:
- Phát hiện đường biên của mặt người trong một ảnh chụp toàn cảnh nào đó (tách
đang sử dụng chỉ có thể thực hiện trên các cở sở dữ liệu ảnh hạn chế trong giới hạn về cỡ, tuổi, giới tính, và/hoặc chủng tộc và tuy nhiên, nhận dạng mặt tự động được thừa nhận là tốt trong các môi trường được điều khiển
Khoá luận "Nhận dạng mặt người trong điều kiện ánh sáng thay đổi" có nội dung khảo sát một số phương pháp và kỹ thuật trong lĩnh vực nhận dạng ảnh, được chia thành ba chương:
Chương 1 "Tổng quan về nhận dạng ảnh mặt người" trình bày một cách tổng quan
về các nhiệm vụ của hệ thống nhận dạng mặt: Mô tả bài toán, cách giải quyết bài toán theo quan điểm của lý thuyết nhận dạng và các hệ thống triển khai thực tế Nội dung của chương được chia làm 3 phần Phần thứ nhất mô tả bài toán nhận dạng ảnh mặt người, trình bày các điều kiện bài toán, các yêu cầu nhận dạng và giải quyết bài toán theo quan
điểm của nhận dạng Phần thứ hai giải quyết các vấn đề trong bài toán nhận dạng, đưa ra các quy trình mà một hệ thống nhận dạng tuân theo Phần thứ ba mô tả hệ thống kỹ thuật trong bài toán nhận dạng ảnh mặt người, trình bày các quy trình xử lý thông tin, các vấn đề triển khai thực tế và các ứng dụng điển hình
Chương 2 "Phân tích các yếu tố ảnh hưởng đến quá trình nhận dạng và các cách tiếp cận để giải quyết bài toán." trình bày các yếu tố ảnh hưởng đến nhận dạng ảnh và hai cách
Trang 5tiếp cận nhằm giải quyết bài toán Khóa luận xem xét cách tiếp cận dựa trên khuôn mẫu, cách tiếp cận dựa trên điểm đặc trưng và kết hợp cả hai cách tiếp cận này để thu được kết quả tốt nhất
Chương 3 "Một số thuật toán giải quyết bài toán dựa trên hai cách tiếp cận nhận dạng ảnh mặt" Chương này trình bày các thuật toán nhận dạng một ảnh dựa trên thuật toán khoảng cách tiếp xúc
Phần kết luận nêu tóm tắt lại nội dung chính được đề cập đến trong khóa luận, một
số kết quả và khiếm khuyết của khóa luận và định ra phương hướng nghiên cứu tiếp theo
Phần tài liệu tham khảo trình bày các tài liệu nghiên cứu gần đây của một số tác giả nước ngoài Mỗi tài liệu đều nêu được khía cạnh nào đó của nội dung đang nghiên cứu
Do thời gian và trình độ còn hạn chế, việc triển khai thuật toán nhận dạng ảnh mặt người trong các điều kiện thay đổi của ánh sáng còn ở mức độ nhất định và chưa được cài
đặt trong thực tế Hy vọng rằng nếu thời gian và củng cố thêm sự hiểu biết tôi sẽ tiến hành nghiên cứu sâu hơn về vấn đề này
Trang 6- Trong y học: Nhận dạng mặt người tự động có thể hữu ích trong việc nghiên cứu
hệ thống thần kinh, sự phản ứng tâm lý của bệnh nhân
Để xây dựng một hệ thống nhận dạng mặt người tự động, trước hết cần xem xét các khái niệm và bài toán liên quan trong hệ thống nói trên
1.1 Bài toán nhận dạng ảnh mặt người
Trong bài toán nhận dạng ảnh mặt người cần quan tâm đến các yếu tố ngoại cảnh tác động đến quá trình và quan tâm đến các cách tiếp cận để giải quyết bài toán nhận dạng sao cho hệ thống nhận dạng là bền vững với các yếu tố tác động đến quá trình nhận dạng Trước hết một số khái niệm được giải thích như dưới đây:
- ảnh mặt người: Một ảnh chụp mặt của một người nào đó đang có trong hệ thống,
- Lớp ảnh mặt người: Do ảnh chụp mặt người phụ thuộc vào điều kiện ngoại cảnh và nội tâm của người đó khi chụp ảnh nên với mỗi một người, hệ thống cần có một tập hợp
ảnh mặt của cùng một người đó song thể hiện được nhiều trạng thái khác nhau Chúng ta gọi tập hợp đó là tập ảnh mẫu của người đó Khi nói đến một lớp ảnh mặt người là nói đến tập ảnh mẫu của cùng một người
1.1.1 bài toán và các yêu cầu nhận dạng
Bài toán nhận dạng ảnh mặt người có thể được phát biểu như sau: Cho trước một tập
hữu hạn (nhóm người), danh tính và các thông tin tùy thân có thể được biết trước, x là ảnh
mặt người cần nhận dạng thì bài toán thực hiện theo các nhiệm vụ như sau:
- Xác định danh tính của người trong ảnh khi đã biết người đó thuộc vào nhóm người đã biết Đây chính là bài toán phân loại N lớp
- Xác định xem người trong ảnh thuộc vào nhóm người cho trước hay không
Trang 7- Giả thiết rằng người trong ảnh là một người thuộc nhóm người biết trước, cần kiểm tra xem giả thiết đó có đúng không
- Nhận dạng đầy đủ tức là trước tiên ta xem người trong ảnh có thuộc nhóm người cho trước hay không, sau đó xác định xem ảnh đó là của người nào trong nhóm
Trước hết cần làm rõ khái niệm ảnh được quản lý trong hệ thống nhận dạng ảnh Hệ thống quản lý ảnh quan tâm tới hai yếu tố sau đây:
- Đặc trưng ảnh của đối tượng được quản lý Theo lý thuyết nhận dạng ảnh, mỗi một loại ảnh đối tượng có một số đặc trưng nào đó chẳng hạn như nhận dạng mặt người thì có
các loại đặc trưng hiểu mặt: trái xoan, chữ điền, tỷ lệ khoảng cách hai mắt hoặc nhận dạng chữ cái là số thành phần liên thông viết nên chữ cái đó Các đặc trưng này được
phân thành hai loại: các đại lượng bất biến (không bị thay đổi trong mọi thao tác với ảnh)
- Yếu tố tác động của môi trường vào ảnh khi chụp ảnh chụp của một đối tượng phụ thuộc vào môi trường chụp ảnh (ánh sáng, góc chụp ) vì vậy để nhận dạng ảnh cần tính đến tác động của môi trường đối với ảnh chụp Các ảnh hưởng môi trường mạnh nhất
đó là ánh sáng, góc chụp (yếu tố hình học) Để hệ thống nhận dạng ảnh hoạt động tốt cần biểu diễn được sự tác động nói trên tới ảnh Giải pháp đầu tiên được nghĩ đến là cần nắm bắt được "toàn bộ" các điều kiện môi trường là không thể thực thi được vì khả năng vô hạn
về tác động của môi trường đối với ảnh chụp Một hệ thống rất khó thực hiện tốt nếu như không gian hoạt động là quá lớn (đưa quá nhiều ảnh hưởng môi trường) hoặc quá bé (đưa quá ít điều kiện môi trường) Điều đó buộc chúng ta phải tạo ra một không gian đủ để hệ thống có thể hoạt động Vì vậy, con người thường chọn ra những đặc trưng cơ bản nhất của môi trường tác động vào ảnh chụp với miền giá trị hạn chế để tập hợp ảnh nắm bắt là nằm
động vào ảnh chụp
Kết hợp một đối tượng cùng
với một điều kiện môi trường cụ thể
thì tạo ra một ảnh của một đối tượng
được thể hiện thông qua một vector
Trang 8Hình 1 mô tả không gian biểu diễn ảnh và vị trị một đối tượng trong không gian đó
Đối tượng quan sát là đối tượng x bao gồm các hướng biểu hiện các đặc điểm của
đối tượng x Nếu đối tượng x càng nhiều đặc điểm thì số chiều của không gian trên càng
Đối với bài toán nhận dạng, đối tượng nhận dạng là kết quả của một quá trình quan sát Cụ thể trong bài toán nhận dạng này, hệ thống được thực hiện qua các quá trình như: thu giữ ảnh, biểu diễn ảnh và cuối cùng là lập luận ảnh đã biểu diễn để thu được kết quả mong muốn Bài toán nhận dạng được trình bày như sau:
trình hay một đối tượng đang nghiên cứu nào đó
nghiên cứu và các tập Ci (i=1 n) được gọi là các lớp
nhiệm vụ này đòi hỏi phải có thuật toán tốt nhất nào đó và thuật toán được xác định bằng
Như vậy ta nhận thấy bài toán nhận dạng bao gồm các vấn đề cần được giải quyết sau đây:
- Thu được kết quả quan sát
- Xác định thuật toán nhận dạng tốt nhất
Thông thường từng đối tượng nhận dạng cho phép chúng ta xác định được không
Tuy nhiên trong bài toán nhận dạng ảnh mặt người rất khó có thể biểu diễn được đối tượng tại vì các đại diện thu được trong các điều kiện khác nhau đối với mặt của một người như:
độ tuổi làm biến đổi sắc thái mặt, ánh sáng tác động, diễn cảm của mặt, góc chụp ảnh mặt, tóc, kính và các yếu tố khác có thể ảnh hưởng đến sự trích ra các mẫu Các ảnh thu được còn phải trải qua các quá trình biến đổi như sự quay, sự co dãn và các dịch chuyển Các yếu tố tác động trên không dễ dàng chuẩn hóa để đưa vào không gian biểu diễn mà trong
đó sự mô tả các lớp là tách biệt
Trang 9Các nhiệm vụ trong nhận dạng ảnh mặt người được minh họa như hình sau:
Trong các hình minh hoạ trên cho thấy không gian biểu diễn ảnh được phân chia thành các vùng khác nhau, mỗi vùng biểu diễn một đối tượng nhận dạng Các đường kẻ trên không gian biểu diễn ảnh cho ta được các luật phân loại ảnh Quan sát ảnh ta thấy ảnh biểu diễn 3 người khác nhau và mối người ứng với một ký hiệu khác nhau Hình trên cho biết một hệ thống nhận dạng ảnh phải thực hiện được đầy đủ các vấn đề đặt ra trong quá trình nhận dạng
1.1.2 Giải quyết bài toán từ quan điểm của lý thuyết nhận
dạng
Phân lớp không gian biểu diễn ảnh
Bài toán này là một bài toán phân loại N lớp tương ứng với tập các lớp đã có:
được giải quyết bởi biểu diễn dữ liệu của từng lớp và ứng dụng một trong nhiều kỹ thuật
phân loại mẫu Khả năng xảy ra sai số phân loại một mặt x được giảm tới mức tối thiểu bởi
) (
) ( ) ( ) (
x p
C P C x p x C
p(x) là mật độ tuyệt đối, p(x⏐C k ) là mật độ xác suất phụ thuộc lớp và P(C k ) là xác
suất tiên nghiệm đối với lớp Ck Vì p(x) là giống nhau đối với mọi lớp nên nó không được
định giá để làm tăng xác suất hậu nghiệm Do đó, một cách tiếp cận tới nhiệm vụ phân loại
Hình 1.2 Chia không gian ảnh thành các vùng khác nhau, các vùng biểu hiện của 3 người khác nhau và biểu hiện của mỗi một ảnh tương ứng với một nhiệm vụ trên.
Trang 10Xác minh danh tính của một người cho trước theo nghĩa là kiểm tra xem người đó có thuộc một lớp ảnh mặt người đã biết hay không
Sự xác minh này có thể được xem xét như một bài toán phân loại 2 lớp Giả sử đã có hai lớp C0 và C1 tương ứng với các trường hợp danh tính đó là đúng hoặc là sai Để làm
) (
) ( ) ( ) (
0
1 1 0
C P
C P C x p C
x
được yêu cầu
Xác định người trong ảnh có thuộc nhóm người cho trước hay không
Đối với bài toán này có hai cách giải quyết đó là:
Cách thứ nhất: Giải quyết như một bài toán phân loại 2 lớp C0 và C1 với lớp C0 đại diện cho một tập tất cả các lớp trong nhóm còn C1 đại diện cho không gian không chứa lớp
đối tượng nhận dạng có thuộc trong lớp C0 này hay không, ngược lại thì đối tượng nằm trong lớp C1
Cách thứ hai: Một cách tiếp cận khác bao gồm việc xây dựng một trình xác định danh tính đối với mỗi một người trong S Nhiệm vụ này được thực hiện bởi việc đưa ra N
sự xác minh danh tính tương ứng với N lần kiểm tra đối tượng x có thuộc một lớp nào đó
hay không Nếu không thuộc vào lớp nào thì kết luận không xác định được người đó, ngược lại thì xác minh được ảnh đó
Sự nhận dạng đầy đủ
Nhiệm vụ này phải thực hiện đầy đủ các nhiệm vụ ở trên, trước tiên phải phân định
được các danh tính của đối tượng nhận dạng (phân loại các lớp) và sau đó xác định xem
đối tượng đó là thuộc về lớp nào trong các lớp thu được Nhiệm vụ này được thực hiện bởi
sự liên kết N trình xác minh danh tính, tương tự như cách tiếp cận xác định đối tượng là thuộc về lớp nào trong nhóm S
1.2 giải quyết vấn đề trong bài toán nhận dạng ảnh mặt người
Các vấn đề quan trọng trong nhận dạng ảnh mặt người được thể hiện như sau:
Sự thu nhận (Acquisition): đâu là các nhân tố quan trọng trong cách thu thập thông tin mặt người?
Trang 11Sự biểu diễn (Representation): cách biểu diễn các nhân tố thu được trong quá trình thu nhận các thông tin về ảnh
Sự lập luận (Reasoning): cách mà một hệ thống nhận dạng mặt có thể làm để so sánh các mặt người nhằm đạt hiệu quả nhất
Mỗi từ các mục con dưới đây trình bày chi tiết ba vấn đề đã được nêu trên đây
1.2.1 Thu nhận dữ liệu
Các vấn đề quan trọng trong nhận dạng ảnh mặt người được thể hiện như sau:
Sự thu nhận (Acquisition): đâu là các nhân tố quan trọng trong cách thu thập thông tin mặt người?
Sự biểu diễn (Representation): cách biểu diễn các nhân tố thu được trong quá trình thu nhận các thông tin về ảnh
Sự lập luận (Reasoning): cách mà một hệ thống nhận dạng mặt có thể làm để so sánh các mặt người nhằm đạt hiệu quả nhất
Mỗi từ các mục con dưới đây trình bày chi tiết ba vấn đề đã được nêu trên đây
1.2.2 Thu nhận dữ liệu
Phần này xem xét cách mà dữ liệu gốc được thu nhận trước khi các vấn đề của sự biểu diễn được thực hiện Câu hỏi đặt ra là: Có bao nhiêu kiểu ảnh mặt là cần thiết và kiểu
đó là gì? Có bao nhiêu kiểu thay đổi sẽ được mô tả trong các ảnh và các kiểu đó là gì?
Trong vấn đề về bắt giữ dữ liệu ta cần chú ý tới các vấn đề như là xây dựng được cơ
sở dữ liệu ảnh, trình phát hiện mặt, phân đoạn và chuẩn hoá ảnh Mục đích của việc xây dựng một cơ sở dữ liệu ảnh là nhằm phục vụ cho việc phân tích thuật toán và cho việc kiểm
Đối
đoạn
Phát hiện mặt
Chuẩn hoá
DataBase
Trang 12nghiệm hệ thống ngoài ra cơ sở dữ liệu còn được khai thác trong các hệ thống nhận dạng Mô tả vấn đề bắt giữ dữ liệu biểu diễn trong hình 1.3
Việc xây dựng cơ sở dữ liệu phải thoả mãn được sự biểu diễn các biến thể của môi trường Ngoài ra cơ sở dữ liệu phải thể hiện được sự mô tả các thông tin về bề mặt, các diễn cảm của mặt và các ảnh hưởng của điều kiện bên ngoài tác động đến quá trình nhận dạng Các hệ thống nhận dạng chúng không thể thực hiện được trên các dữ liệu lớn, chúng chỉ có thể thực hiện trên cơ sở dữ liệu hữu hạn Với bài toán nhận dạng ảnh mặt người, yêu cầu cơ sở dữ liệu phải lưu trữ được các thông tin quan trọng của mặt như: mắt, mũi, mồm, các thông tin có liên quan khác và phải loại bỏ được các thông tin không cần thiết Thay vào việc lưu trữ toàn bộ ảnh mặt của người nào đó ta thiết lập một cơ sở dữ liệu chuẩn mà
nó chỉ lưu các thông tin quan trọng của mặt người mà thôi Cơ sở dữ liệu chuẩn này cho ta hai lợi ích đó là: giúp cho hệ thống thực hiện một cách dễ dàng và giảm tối thiểu không gian lưu trữ dữ liệu Các cơ sở dữ liệu chuẩn hay được dùng ngày nay đó là: ORL – cơ sở dữ liệu này được phát triển tại phòng thí nghiệm nghiên cứu Olivetti nước Anh, nó thỏa mãn các sự biến đổi như hình dáng, ánh sáng và diễn cảm của mặt Cơ sở dữ liệu thứ hai
đó là FERET được phát triển bởi phòng thí nghiệm nghiên cứu quân sự Mỹ
Sự phân loại giữa ảnh mặt với ảnh nền là rất khó bởi vì sự đa dạng trong các lớp mặt (nòi giống, các diễn cảm mặt, kiểu tóc, trang điểm, kính, ria mép, ) Tương tự như vậy trong việc định vị các đặc điểm của mặt cũng là rất khó bởi vì mỗi một người có một khuôn mặt khác nhau Hơn nữa, có nhiều ảnh hưởng khác tới ảnh như sự chiếu sáng và hướng chụp
Với mặt của con người các thông tin quan trọng về bề mặt sẽ được lưu trữ trong cơ
sở dữ liệu Các thông tin đó có thể là các đặc điểm cấu thành lên bề mặt con người như: hai mắt, mũi và mồm Để thu được các thông tin cần thiết từ một ảnh gốc, hệ thống thực hiện các quá trình phân đoạn ảnh thành các vùng con và mục tiêu của quá trình phân đoạn này nhằm loại bỏ được các vùng thông tin không cần thiết Trong ảnh mặt người, các phần không cần thiết có ảnh hưởng rất nhiều đến quá trình thu thập thông tin đó là các vùng của tóc, ảnh nền, và các thay đổi về hình học của ảnh mặt người
Dựa vào các thông tin của bề mặt và tiến hành phân đoạn ảnh mặt Việc phân đoạn giúp cho quá trình phát hiện mặt được tốt hơn tại vì ảnh nền có rất nhiều yếu tố khác tác
động trên ảnh Do đó phải phân được các vùng khác nhau của ảnh, các vùng trở nên cô lập
và mỗi vùng miêu tả một số đặc trưng của ảnh Tương ứng với các vùng có thể hình thành nên các ảnh mặt Tiếp sau quá trình phân đoạn ảnh là quá trình phát hiện mặt thông qua các vùng thu được của quá trình phân đoạn
Trang 13Có rất nhiều phương pháp đã và đang được sử dụng trong việc phát hiện mặt ở đây, tôi xin giới thiệu 3 cách tiếp cận giải quyết bài toán Thứ nhất: cách tiếp cận từ dưới lên, cách này sử dụng các ràng buộc hình học dựa trên điểm đặc trưng Các đặc điểm của bề mặt được hiển thị bằng cách sử dụng bộ lọc sau đó các đặc điểm được kết hợp với nhau để tạo thành một mặt dự tuyển Cách thứ hai: phát hiện mặt bất biến trong phép quay và co giãn, các mặt dự tuyển được phát hiện bằng cách gom các vùng với nhau cho đến khi độ sắc nét xấp xỉ hình ellipsis Cách thứ ba: hầu hết các thuật toán phát hiện mặt sử dụng việc tìm kiếm nhiều mức với sự phân loại kích thước cố định
Hầu hết các kỹ thuật nhận dạng mẫu đã sử dụng các lược đồ phát hiện nhiều mức cho việc phát hiện mặt Cách tiếp cận dễ dàng hơn đó là sử dụng quy tắc quyết định dựa trên cường độ ảnh của các ảnh dự tuyển từ sự biểu diễn nhiều mức của ảnh nhập vào Ngoài ra còn có các kỹ thuật khác trong việc phát hiện mặt như: các mô hình Gaussian ứng dụng trên một không gian con các thành phần chính, ứng dụng máy vector cũng thành công trong việc phát hiện mặt trong ảnh nền phức tạp và hệ thống dựa trên mạng Neural đã
sử dụng thành công trong việc phát hiện mặt và bất biến với phép quay
Việc phát hiện mặt có thể được giải quyết bằng sự phân loại hai lớp đó là: lớp ảnh mặt và lớp ảnh nền Sự phân loại giữa lớp ảnh mặt và các đối tượng ảnh nền là rất khó bởi vì các sự biến đổi trong các mặt ảnh hưởng đến quá trình phát hiện mặt người (các ảnh hưởng như: quan điểm về chủng tộc, các diễn cảm bề mặt, kiểu tóc, cặp kính…) Tương tự như vậy, việc xác định vị trí các đặc điểm cũng rất khó vì sự thay đổi giữa các cá nhân (chủng tộc, các kiểu cấu thành, các diễn cảm mặt…) cũng khác nhau
Sau khi thu được ảnh trong một ảnh nền hệ thống tiến hành chuẩn hoá ảnh, thông thường việc chuẩn hóa được thực hiện trên các giá trị mức độ xám Đối với bề mặt của con người thì việc chuẩn hóa thường dựa vào vị trí của hai mắt hoặc là mũi hoặc là mồm
Các ảnh mặt sau khi chuẩn hoá được lưu trữ trong cơ sở dữ liệu và kết quả này được
sử dụng cho các quá trình tiếp theo có sử dụng kết quả bắt giữ được này
1.2.3 Biểu diễn đối tượng
Đối với một hệ thống nhận dạng ảnh mặt người để thực hiện có hiệu quả, thì hệ thống phải tách và trích ra các điểm đặc trưng trong dữ liệu nhập vào và từ đó biểu diễn các đặc trưng của mặt người hiệu quả nhất Các phần tử của sự biểu diễn có thể được tạo nên trong nhiều cách khác nhau, và nó phụ thuộc vào nhiệm vụ mà cách tiếp cận nào là thích hợp nhất
Trang 14Vấn đề quan trọng của quá trình biểu diễn dữ liệu là làm giảm kích thước của ảnh bằng cách loại bỏ hầu hết các thông tin không cần thiết trong ảnh gốc, làm giảm độ thô của ảnh
Một số cách sử dụng phổ biến hiện nay trong quá trình tách và trích được các điểm
đặc trưng của ảnh dữ liệu như: cách tiếp cận dựa trên đặc điểm, cách tiếp cận dựa trên khuôn mẫu, phân tích các thành phần chính và thông qua các bộ lọc
Cách tiếp cận dựa trên đặc điểm nhằm phát hiện và đo đạc các điểm nổi bật của bề mặt, sử dụng khoảng cách hình học và góc giữa các đặc điểm chính của bề mặt như là: hai mắt, mũi, mồm và nhằm mục đích phân loại các mặt trong đó các phần tử dựa trên mối quan hệ vị trí và các kích cỡ của chúng Với cách tiếp cận dựa trên khuôn mẫu sử dụng thông tin xác đáng của điểm ảnh như là mức độ xám gốc hoặc xử lý các khía cạnh nổi bật của dữ liệu Khuôn mẫu có thể là toàn bộ ảnh hoặc là các vùng tương ứng với các vị trí của
đặc điểm (vị trí của hai mắt hoặc mồm) Nói chung với cách tiếp cận này chỉ cho ta được một số đặc điểm của đối tượng, nó không đủ để có thể ứng dụng trong thực tế nhưng đối với sự hiệu chỉnh hình học hoặc bộ lọc thì có thể cải tiến được các kết quả này
Cách tiếp cận phân tích các thành phần chính: cách tiếp cận này có thể trích ra được thông tin quan trọng nhất được trình bày bằng cách thống kê đối với một tập các ảnh như
là một tập các vector riêng Các vector riêng có thể được đánh giá như là tập các điểm đặc trưng chung và định rõ được các đặc điểm thay đổi của ảnh trong cơ sở dữ liệu Mỗi ảnh
được biểu diễn một cách chính xác qua một sự liên kết tuyến tính của những vector riêng này Để quyết định kích thước của không gian mặt chúng ta dựa vào số các vector riêng
Kỹ thuật này phân tích các đặc điểm của ảnh, thu thập các thông tin quan trọng và loại bỏ
được các thông tin dư thừa không cần thiết cho hệ thống nhận dạng Do đó nó có thể tìm
được sự biểu diễn tối ưu kích thước của ảnh nhưng kỹ thuật này có thể hữu ích đối với việc xây dựng lại cấu trúc ảnh hơn là đối với việc nhận dạng Hơn nữa, phương thức mặt riêng (vector riêng) là không bất biến với sự thay đổi hình học của ảnh như là sự co giãn, dịch chuyển hoặc phép quay trong dữ liệu gốc
Cách tiếp cận tiêp theo là sử dụng bộ lọc: hệ thống cho ảnh đi qua bộ lọc và qua bộ
Trang 15lọc đó các thông tin đặc trưng quan trọng sẽ được thu lại và làm giảm không gian lưu trữ
ảnh Kết quả là ta thu được các thông tin quan trọng của ảnh Có thể mô tả như hình 1.4 trên đây
Hình trên cho thấy khi cho qua bộ lọc các thông tin dư thừa sẽ bị loại bỏ chỉ để lại các thông tin quan trọng tạo nên ảnh mặt
Nói tóm lại: các cách tiếp cận trên nhằm mục đích phân loại được các điểm đặc trưng và biểu diễn chúng sau đó thực hiện việc tối ưu các thông tin đó sao cho kích thước không gian lưu trữ điểm đặc trưng là nhỏ nhất
1.2.4 Lập luận kết quả
Hệ thống so sánh hai ảnh với nhau sao cho có hiệu quả nhất, sụ phù hợp của hai ảnh
được tính bằng cách như: sử dụng cách tiếp khoảng cách tiếp xúc và sử dụng các ngưỡng
để đánh giá
Trong không gian mặt hệ thống so sánh khoảng cách từ một mặt cần tìm đến một tập hợp các mặt, kết quả là ta thu được tập các số đo Nếu một trong tập các số đo thỏa mãn yêu cầu về khoảng cách nhận dạng thì đó chính là mặt mà chúng ta cần tìm Các khoảng cách chuẩn được sử dụng: khoảng cách Euclidean hoặc khoảng cách Mahalanobits (đối với không gian vector riêng)
Bên cạnh việc sử dụng các khoảng cách để đánh giá sự phù hợp của hai ảnh, chúng
ta còn có thể sử dụng các ngưỡng để đánh giá mức độ chính xác của một số cách tiếp cận khác Tỷ số nhận dạng sai của các cách tiếp cận khác nhau không thể vượt quá một ngưỡng nào đó Nếu vượt quá thì kết luận hai mặt đó không phù hợp còn ngược lai thì hai mặt là phù hợp và ta tiến hành đánh giá nhận dạng chúng
1.3 hệ thống kỹ thuật nhận dạng ảnh mặt người
Nhận dạng ảnh mặt đã được nghiên cứu trong nhiều năm và đang được ứng dụng trong thực tế như là: các hệ thống bảo mật, sự xác định tội phạm và hỗ trợ các hệ thống nhận dạng giọng nói Nhận dạng mặt rất quan trọng đối với con người bởi vì bề mặt đóng một vai trò lớn trong giao tiếp với cộng đồng, các biểu hiện của tình cảm, cảm xúc, suy nghĩ và cảm nghĩ
Hệ thống nhận dạng ảnh mặt tự động có thể được chia thành các phần như: quy trình công nghệ xử lý thông tin, các vấn đề triển khai trong thực tế và các ứng dụng điển hình
Trang 161.3.1 Qui trình công nghệ xử lý thông tin
Quy trình thiết kế một hệ thống nhận dạng ảnh mặt tự động là một quá trình xử lý
đa giai đoạn Những giai đoạn này về cơ bản là các bước giống nhau Các giai đoạn có thể
được mô tả như sau:
Bước 1: Giai đoạn cảm biến
Các nghiên cứu được đưa ra để xác định tác nhân đem lại các thuộc tính của đối tượng (cỡ, hình dáng, màu sắc, kết cấu, …) Các giá trị và các mối quan hệ giữa các thuộc tính của đối tượng được sử dụng để biểu thị đặc điểm của một đối tượng trong cách thức của một vector mẫu Phạm vi giá trị của thuộc tính được hiểu như là độ lớn của không gian Một vấn đề quan trọng là độ chính xác của sự xuất hiện khung cảnh thực được thu bởi vector mẫu như thế nào Các vấn đề nhiễu trong ảnh phải dưới mức độ cho phép và không làm mất thông tin chủ yếu
Các thông tin của đối tượng được biểu diễn như thế nào trong vào giai đoạn cảm biến này và kết quả thu được của giai đoạn nàylà các kết quả đo thông tin của đối tượng, kết quả đo này được đưa vào giai đoạn tiền xử lý để thực hiện việc loại bỏ nhiễu, nâng cao khía cạnh chắc chắn của ảnh…
Bước 2: Giai đoạn tiền xử lý
Giai đoạn tiền xử lý được thực hiện để loại bỏ nhiễu, nâng cao khía cạnh chắc chắn của ảnh, và gây ra các thay đổi khác làm đơn giản hóa các bước xử lý ở mức độ cao hơn
Kết quả đo tín hiệu
Giai đoạn tiền xử lý
Nhóm mẫu
Xử lý thông tin khung cảnh
Hình 1.5 Quá trình nhận dạng mẫu
Trang 17Để ngăn ngừa sự loại ra các cạnh của ảnh đã tồn tại hoặc đưa ra các cạnh lỗi, thao tác tiêu biểu được sử dụng đó là: tách ngưỡng và làm mịn Tách ngưỡng biến đổi một ảnh cấp độ xám thành một ảnh nhị phân, trong đó mỗi một điểm có thể là đen hoặc trắng Làm mịn
ảnh được dùng để làm giảm nhiễu, để nâng cao sự lựa chọn các điểm đặc trưng của ảnh, và
để làm giảm các chi tiết ảnh không mong muốn Do đó, ảnh được phân chia thành các đối tượng cô lập nhau Kết quả là thu được không gian điểm đặc trưng và nó giúp cho giai
đoạn trích chọn điểm đặc trưng được thực hiện
Bước 3: Trích chọn điểm đặc trưng
Sau khi có được không gian điểm đặc trưng, hệ thống tiến hành trích chọn các điểm
đặc trưng của đối tượng trong không gian đó Việc trích ra các đặc trưng của đối tượng thông qua nhiều cách khác nhau nhưng ý nghĩa chính của nó vần là phải sử dụng một bộ lọc để loại bỏ các thông tin không cần thiết và giữ lại được các thông tin quan trọng Các
điểm đặc trưng của đối tượng được lọc và kết quả đó giúp cho quá trình nhận dạng thuận tiện Quá trình lọc này có thể thống kê thành các thuộc tính như: màu sắc, kết cấu, cường
độ, khoảng cách, chuyển động… Các điểm đặc trưng hình thành nên không gian biểu diễn
điểm đặc trưng Kết quả của không gian biểu diễn giúp cho quá trình phân loại các điểm
đặc trưng được tốt hơn
Bước 4: Giai đoạn phân loại
Tiến hành phân loại không gian biểu diễn điểm đặc trưng để thu được các thông tin mẫu bằng cách sử dụng các giá trị điểm đặc trưng đã chọn Kết quả là các đối tượng hoặc các lớp mẫu biểu thị đặc điểm được học bởi các miêu tả sự hình thành mẫu chung, các chuẩn phân loại, hoặc các hàm quyết định
Bước 5: Trình xử lý thông tin khung cảnh
Trình xử lý khung cảnh làm tăng độ chính xác của nhận dạng bởi việc cung cấp thông tin thích hợp có liên quan đến môi trường xung quanh đối tượng (bằng cách làm phù hợp các đặc điểm của đối tượng với các mô hình đã được lưu trữ, hoặc bằng cách phân loại dựa trên tiêu chuẩn phân loại)
1.3.2 Các vấn đề trong triển khai thực tế
Thành công của một ứng dụng nhận dạng mặt thường phụ thuộc vào cách mà các thông tin (dấu hiệu) được mô tả Sự thụ thuộc vào ứng dụng, sự biểu diễn thích hợp sẽ được thực hiện để tạo ra quá trình biểu diễn thông tin mà các thông tin là xác đáng nhất được nhấn mạnh cho ứng dụng Hai ràng buộc đáng chú ý đó là:
- Kích thước của trình phân loại mà được liên kết với số liên thông trong mạng Neural
Trang 18- Số tập các ví dụ đào tạo (cỡ của tập dữ liệu)
Các quyết định phải được đưa ra để làm giảm cỡ của vector mẫu mà được mô tả trong mạng Neural Thông thường kích thước của các vector mẫu phụ thuộc vào miền của quang phổ mà quá trình thu ảnh gặp phải Kích thước của các vector mẫu có thể được giảm bằng cách sử dụng một số mối quan hệ giữa các vùng quang phổ với nhau
Sự thay đổi sóng là một kỹ thuật phổ biến khác được sử dụng trong quá trình biểu diễn ảnh, ở đó một dấu hiệu nhất thời được biểu diễn trong giới hạn của hàm cơ sở:
số j là các vị trí biểu thị thời gian của nhân, và chỉ số k là sự chia của nhân Sau đó sự thay
Nhiệm vụ thứ nhất: tìm một mặt trong một ảnh giống như là việc đăng ký mặt
hoặc việc xác định vị trí của mặt Nhiệm vụ này phụ thuộc vào các nhân tố sau:
+ Điều khiển màu sắc và ảnh nền
+ Các ảnh màu hoặc đơn màu và các ảnh tĩnh hoặc các ảnh video
Nếu ánh sáng ảnh nền được điều khiển thì việc xác định các mặt là dễ dàng Do đó,
sự phụ thuộc vào điều khiển thông qua các nhân tố sẽ dẫn đến việc xác định vị trí của mặt
có thể là một bài toán dễ hoặc một bài toán khó Do ảnh hưởng của các yếu tố và các loại
ảnh nên việc tìm mặt cũng trở nên khó khăn hơn Sự biến đổi của ánh sáng cũng như sự biến đổi của ảnh cơ sở đều ảnh hưởng rất lớn đến quá trình tìm kiếm mặt
Nhiệm vụ thứ hai: sự nhận dạng và sự xác minh mặt là hai kiểu của bài toán nhận
dạng mặt, cụ thể là bài toán nhận dạng và bài toán xác minh mặt Trong bài toán xác minh mặt người ta phải kiểm tra mặt đã cho là của ai và do đó việc kiểm tra này làm phù hợp đặc tính của ảnh đối với một mô hình đơn Trong bài toán nhận dạng mặt, đây là bài toán tìm
sự phù hợp nhất của một ảnh chưa biết dựa vào một cơ sở dữ liệu các mẫu mặt hoặc là định
rõ nó không phù hợp với bất kỳ ảnh nào đó trong cơ sở dữ liệu Điều quan trọng trong thực
tế đó là sự khác nhau của hai bài toán này về tốc độ: nói chung, nếu ta có N người trong
Trang 19một cơ sở dữ liệu thì quá trình nhận dạng sẽ chậm hơn N lần so với quá trình xác minh Tại vì quá trình nhận dạng phải so sánh N lần còn quá trình xác minh chỉ phải so sánh một lần
Các cơ sở dữ liệu đã và đang được phát triển
Phòng thí nghiệm nghiên cứu Olivetti (Olivetti Research Laboratory – ORL) ở Anh
đã phát triển một cơ sở dữ liệu mặt mà có thể cung cấp như một điểm chuẩn tốt đối với sự kiểm tra một hệ thống nhận dạng mặt
Cơ sở dữ liệu ảnh mặt FERET được phát triển tại Mỹ Cơ sở dữ liệu này được kiểm tra bởi phòng thí nghiệm nghiên cứu quân đội Mỹ
Hình dưới đây mô tả một cơ sở dữ liệu ảnh, trong đó các ảnh biến đổi theo các điều kiện của ánh sáng:
Hình 1.6 Biểu diễn các ảnh theo các điều kiện thay đổi của ánh sáng
Trang 20chương 2 nhận dạng ảnh mặt người trong điều kiện ánh sáng
Trong các mục dưới đây, các yếu tố ảnh hưởng đến hệ thống nhận dạng ảnh tự động
được phân tích và một số giải pháp khắc phục được giới thiệu
2.1.1 ánh sáng
Các yếu tố của môi trường ảnh hưởng tới quá trình nhận dạng mặt như: các yếu tố
về ánh sáng, các thiết bị thu nhận ảnh và khung cảnh mà ảnh được thu nhận ánh sáng làm biến đổi mức độ xám của ảnh và cường độ các điểm ảnh do đó nó làm cho ảnh hoàn toàn biến đổi qua các vùng khác nhau và các yếu tố đó làm cho hệ thống nhận dạng rất khó có thể nhận dạng ảnh một cách chính xác Để khắc phục vấn đề đó đòi hỏi phải đưa ra cho hệ thống một số kỹ thuật để loại bỏ các hạn chế đó ánh sáng làm thay đổi hoàn toàn các dấu hiệu của ảnh, ngoài ra ánh sáng còn tạo nên các lớp bóng của chính đối tượng nhận dạng hoặc tạo nên các sự che lấp của bản thân nó
2.1.2 Các thay đổi hình học
Bên cạnh các yếu tố môi trường ảnh hưởng tới quá trình nhận dạng, hệ thống còn chịu ảnh hưởng của các yếu tố hình học như: sự quay, sự dịch chuyển và sự co giãn… Các yếu tố này ảnh hưởng rất nhiều đến hệ thống nhận dạng tại vì ảnh hưởng của nó làm thay
đổi cấu trúc của ảnh, thay đổi hướng chụp, góc chụp và thay đổi kích thước của ảnh