HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG CƠ SỞ TẠI THÀNH PHỐ HỒ CHÍ MINH BÀI BÁO CÁO Môn Xử lý ảnh Đề tài Giảng viên Lê Thái Hoàng NHẬN DIỆN KHUÔNMẶT 1 Giới thiệu Các hệ thống nhận diện khuôn mặt mạnh[.]
Trang 2HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
CƠ SỞ TẠI THÀNH PHỐ HỒ CHÍ MINH
BÀI BÁO CÁO Môn: Xử lý ảnh
Đề tài
Giảng viên: Lê Thái Hoàng
NHẬN DIỆN KHUÔN MẶT
Trang 31 Giới thiệu
Các hệ thống nhận diện khuôn mặt mạnh mẽ đang có nhu cầu lớn để giúp chống tội phạm và khủng bố Các ứng dụng khác bao gồm cung cấp xác thực người dùng để truy cập kiểm soát không gian vật lý và không gian ảo để giúp an ninh cao hơn Tuy nhiên vấn đề xác định một người bằng cách lấy hình ảnh khuôn mặt đầu vào và đối sánh với những hình ảnh đã biết trong cơ sở dữ liệu vẫn là một thử thách rất khó khăn.Điều này là do sự thay đổi của khuôn mặt con người trong các hoạt động khác nhau của điều kiện như chiếu sáng , xoay, biểu cảm, chế độ xem camera điểm, lão hóa, trang điểm và kính mắt Thông thường, những điều kiện khác nhau rất nhiều ảnh hưởng đến hiệu suất hệ thống nhận diện khuôn mặt, đặc biệt là khi hệ thống cần khớp với cơ sở dữ liệu quy mô lớn Hiệu suất thấp này trên nhận dạng khuôn mặt ngăn không cho các hệ thống được triển khai rộng rãi trong các thiết bị thực(mặc dù nhiều hệ thống đã được triển khai, việc sự dụng và độ chính xác của chúng được giới hạn trong cá tính huống cụ thể) trong đó các lỗi như tỷ lệ nhận dạng sai và tỷ
lệ tự chối sai (FRR) được xem xét nâng cao FAR là xác suất hệ thống chấp nhận sai một người không được ủy quyền trong khi FRR là xác suất
hệ thống từ chối sai một người được ủy quyền
2 Thuật toán trong nhận diện khuôn mặt
2.1 PCA
PCA ( principle components analysis) là thuật toán tìm không gian con tuyến tính sai số bình phương tối thiểu ánh xạ từ không gian dữ liệu N chiều ban đầu vào không gian đặc trưng M chiều Eigenfaces đạt được giảm kích thước bằng sử dụng ký tự riêng M của ma trận hiệp phương sai tương ứng với giá trị lướn nhất giá trị riêng Các giá trị vector cơ sở tối đa hóa tổng phương sai của dữ liệu dự kiến ( tức là tập hợp vector cơ
sở mô tả tốt nhất dữ liệu )
PCA là thuật toán sử dụng để tạo ra hình ảnh từ những hình ảnh ban đầu
WPCA = argwmax WTSTW = [w1w2… wm]
W: là các giá trị tối đa hóa hàm mục tiêu
ST: biểu thi ma trận phân tán tổng chứa các hiệp phương sai pixel của dữ liệu mặt
PCA tốt cho việc biểu diễn dữ liệu nhưng không nhất thiết phải phân biệt giai cấp
2.2 Linear Discriminant Analysis (LDA) và Fisherfaces
Phân tích phân biệt tuyến tính(LDA) phù hợp để tìm các phép chiếu phân biệt tốt nhất các tầng lớp khác nhau Nó thực hiện điều này bằng cách tìm
Trang 4kiếm các vector chiếu tối ưu để tối đa hóa tỷ lệ giữa các lớp phân tán và lớp phân tán trong lớp ( tức là tối đa hóa sự phân tách lớp trong không gian đa chiều Các vector cơ sở tối ưu của LDA có thể được ký hiệu là
Trong đó SB và SW chỉ ra ma trận phân tán giữa lớp và ma trận phân tán trong lớp tương ứng Thông thường khi xử lý hình ảnh khuôn mặt(và hầu hết các hình ảnh khác dựa trên vấn đề nhận dạng mẫu) số lượng hình ảnh tạo ra nhỏ hơn số lượng pixel (hoặc kích thước tương đương của dữ liệu),
do đó ma trận phân tán bên trong lớp SW là số it gây ra vấn đề cho LDA
Để giải quyết vấn đề này trước tiên thực hiện PCA để giảm kích thước của giữ liệu để khác phục sự cố ma trận đơn này và sau đó áp dụng LDA trong không gian con PCA chiều thấp hơn này Cải thiện kết quả công nhận đã được hiển thị bằng phương pháp này so với PCA truyền thống Các vector chiếu từ fisherfaces là những người tối đa hóa chức năng mực tiêu sau:
2.3 Các biến thể Linear Discriminant Analysis (LDA Vairables)
LDA trực tiếp tạo ra các thiệt bị định vị bằng cách sử dụng các kỹ thuật đường chéo đồng thời Không giống như các phương pháp tiếp cận LDA khacsm DLDA đồng thời gạch chéo ma trận phân tán giữa các lớp trước
và sau đó chéo hóa ma trận phân tán bên trong lớp
2.4 Independent Component Analysis (ICA)
Phân tích thần phần độc lập (ICA) tìm kiếm một cơ sở không trực giao để các đối tượng được chuyển đổi độc lập về mặt thống kê, trong khi PCA tìm thấy cơ sở trực giao cho hình ảnh khuôn mặt vì vậy chuyển đổi các đối tượng không có mối liên hệ với nhau Các hình ảnh cơ bản được phát triển bởi PCA chỉ phụ thuộc vào số liệu thống kê bậc hai ICA khái quát khái niệm của PCA để mô hình các mối quan hệ thống kê bậc cao Động lực ban đầu vì sự phân hủy này xuất phát từ nhu cầu tách các luồng âm thanh thành nguồn độc lập mà không có kiến thức trước về quá trình trộn
2.5 Local Feature Analysis (LFA)
LFA xây dựng một họ các bộ phát hiện tính tương quan cục bộ dựa trên phân rã eigen-subspace Một bước lựa chọn hoặc tách biệt tọa ra một tập hợp con có tương quan và được lập chỉ mục theo các đối tượng để định nghĩa không gian con quan tâm Đại diện cha cung cấp khả năng chống lại sự thay đổi do những thay đổi trong các vùng cục bộ của các đổi tượng Các tính năng được sử dụng trong phương pháp LFA ít nhạy cảm hơn với những thay đổi về độ chiếu sáng và đễ dàng hơn để ước tính các vòng quay Thuật toán LFA được sử dụng làm thuật toán tổng hợp chính trong FaceIt, là một trong những nhận dạng khuôn mặt thương mại hệ thống .2.6 Elastic Bunch Graph Matching (EBGM)
Trang 5EBGM xây dựng kiến trúc liên kết động bằng cách sử dụng đồ thị hình ảnh để tái tạo các khuôn mặt riêng lẻ đã gửi Biểu đồ hình ảnh đại diện cho hình ảnh khuôn mặt là một cấu trúc hình học bao gồm các nút khác nhau được nối với nhau bằng các cạnh Các nút là nằm ở các điểm mốc trên khuôn mặt như đồng tử và khóe miệng Một tập hợp các training images được biểu diễn bằng chùm đồ thị hình ảnh tương ứng các hính ảnh đó Một tập hợp các Gabor phức tạp hệ số wavelet(hoặc phản lực Gabor) được sử dụng như các đặc trưng cục bộ tại mỗi nút Các Gabor này chứa thông tin về nhiều hướng và tần số cho mỗi nút Khi thực hiện nhận dạng khuôn mặt trên một hình ảnh khuôn mặt mới, mỗi biểu đồ trong training được khớp với hình ảnh và kết quả phù hợp nhất cho biết danh tính của con người
2.7 Neural Networks (NN) and Support Vector Machines (SVM)
Neural Networks và Support Vector Machines thường được sử dụng trong không gian đặc trưng chiều thấp do tính toán phức tạp của xử lý liên quan đến việc sử dụng dữ liệu khuôn mặt nhiều chiều Các phương pháp tiếp cận mạng nơ-ron đã được khám phá rộng rãi để biểu diễn đặc điểm và nhận diện khuôn mặt Tuy nhiên, khi số lượng người được thử nghiệm tăng lên, NN đòi hỏi gánh nặng tính toán theo cấp số nhân Sự kết hợp của nhiều bộ phân loại mạng nơ-ron đã cải thiện hiệu suất tổng thể của nhận dạng khuôn mặt Một hệ thống nhận diện khuôn mặt sử dụng các phương pháp không gian thần kinh lai và không gian điện tử kép Tuy nhiên, nói chung người ta không biết chính xác neural mạng đã được học được hoặc nó sẽ hoạt động như thế nào và thường là một lượng đáng kể
dữ liệu đào tạo là cần thiết để tổng quát hóa tốt, thường đòi hỏi một lượng lớn đào tạo ngoại tuyến SVM đã được áp dụng thành công để nhận dạng đối tượng, bằng cách sử dụng hạt nhân ánh xạ dữ liệu lên không gian đối tượng có chiều cao hơn SVM tìm thấy siêu phẳng tối đa hóa biên độ phân tách để giảm thiểu rủi ro phân loại sai không chỉ đối với các mẫu đào tạo, mà còn cho phép nó để đạt được khả năng tổng quát hóa tốt hơn cho dữ liệu không nhìn thấy
2.8 Tensorfaces
Hình ảnh khuôn mặt có vẻ ngoài khác nhau do nhiều yếu tố như khác nhau giữa các người, thay đổi tư thế, điều kiện ánh sáng và nét mặt
Phương pháp tensorfaces được đề xuất để mô hình hóa các mặt ngoài bằng khung đa tuyến Tensor là phần mở rộng bậc cao hơn ma trận, cho phép xây dựng các mô hình đa tuyến để phân tích nhiều các yếu tố của các biến thể trên khuôn mặt Lathauwer và cộng sự đề xuất giá trị phan hủy số ít(HOSVD) để phân hủy tensor, đó là một phần mở rộng của phân
rã giá trị số ít cho ma trận phân hủy.Vasilescu và cộng sự đưa ra ý tưởng
về sự phân hủy tensor thành khu vực thị giác máy tính và tensorfaces được đề xuất, một phần mở rộng cung cấp cao hơn của phương thức
eigenfaces Bằng cách phân tích tensor bao gồm các hình ảnh đào tạo, cơ
Trang 6sở của từng yếu tố khuôn mặt( biểu cảm, tư thếm v.v.) trong hình ảnh có thể lấy được
2.9 Manifolds
Tìm hiểu sự giống nhau giữa các điểm dữ liệu là một trong những khài niệm chính cho phân tích hình ảnh khuôn mặt Trong công trình trước đây về phân tích hình ảnh khuôn mặt bàng phương pháp học đa tạp, nó chỉ ra rằng hình ảnh khuôn mặt nằm trên khuôn mặt đàn ông Ngoài ra nó chỉ ra rằng sự biến đổi của một số yếu tố trên khuôn mặt chẳng hàn như
tư thế hoặc biểu cảm khác nhau tạo nên một biểu cảm phụ trong cấu trúc đống góp Vì vậy, rất hữu ích khi phát hiện và phân tích cấu trúc đa tạp không cơ bản trong việc phân bố các mẫu hình ảnh khuôn mặt Các
phương pháp truyền thống như PCA và LDA thường chỉ nhìn thấy cấu trúc euclid , vì vậy họ không thể phát hiện ra cấu trúc cơ bản nếu dữ liệu nằm trên nhiều thứ khác nhau Việc phân tích các đa tạp cho thấy các đặc điểm của phân bổ dữ liệu và có thể được áp dụng để giảm kích thước Trong nhiều vấn đề phân loại trong thế giới thực, địa phương cấu trúc đa tạp quan trọng hơn trong cấu trúc euclid toàn cục.Do đó các kỹ thuạt học tập đa tạp thường sử dụng thông tin kề giữa mẫu dữ liệu để bảo toàn cấu trúc đa tạp toàn cục
2.10 Kernel methods
Do sự thay đổi lớn trong hình ảnh khuôn mặt người, các phương pháp không gian con tuyến tính có thể không nắm bắt được sự tuyến tính trong biểu diễn hình ảnh khuôn mặt Kết quả là, các thuật toán PCA và LDA đã được mở rộng để biểu diễn các ánh xạ phi tuyến tính trong không gian chiều cao hơn Tính toán và lưu trữ các tính năng mới trong không gian chiều không gian này trở nên kém hơn Vì vậy, Kernal method sử dụng cho hiệu quả tính toán vì nó cho phép chúng ta có được các sản phẩm bên trong cần thiết trong không gian đặc trưng có chiều cao hơn mà không tính toán ánh xạ đặc trưng chiều cao hơn
3 Databases
Có một số cơ sỡ dữ liệu khuôn mặt có sẵn công khai cho cộng đồng nghiên cứu sử dụng để phát triển thuật toán, cung cấp một điểm tiêu chuẩn khi báo cáo kết quả Các cơ sở dữ liệu khác nhau được thu thập để giải quyết một loại thách thức hoặc các biến thể khác nhau
3.1 Face Recognition Grand Challenge (FRGC) databas e
Face Recognition Grand Challenge do NIST tiến hành là nhằm mục đích đánh giá khách quan và có hệ thống các thuật toán nhận dạng khuôn mặt trong các điều kiện thử thách khác nhau Đồng thời mục tiêu của FRGC
là thúc đẩy các nhà nghiên cứu phát triển các nhịp điệu thuật toán nhận dạng khuôn măt thế hệ tiếp theo có thể giảm tỷ lệ lỗi trong các hệ thống nhận diện khuôn mặt theo thứ tự cường độ so với kết quả kiểm tra nhà cung cấp nhận dạng khuôn mặt (FRVT) năm 2002 Các dữ liệu FRGC
Trang 7được phân vùng thành ba tập dữ liệu: một tập hợp huấn luyện chung người ta có thể sử dụng để đào tạo hệ thống nhận dạng khuôn mặt( nếu sử dụng PCA, bộ này là được sử dụng để tạo không gian con PCA) tập hợp mục tiêu( đây là những hình ảnh thu được trong các điều kiện được kiểm soát) và bộ đầu dò (bộ thử nghiệm) được thử nghiệm trong các điều kiện không được kiểm soát Tập hợp đào tạo chung FRGC chứa 12,776 hình ảnh( từ 222 đối tượng) được chụp dưới ảnh sáng có kiểm soát và không kiểm soát Bộ thư viện chứa 16.028 hình ảnh (từ 446 chủ đề, với một số trùng lặp với các đối tượng trong general training) dưới sự điều khiển ảo
có kiểm soát trong khi tập hợp thăm dò chứa 8.014 hình ảnh( từ 466 đối tượng) dưới sự chiếu sáng không kiểm soát Ma trận tương đồng về điểm phù hợp giữa mục tiêu và bộ thăm dò được tính toán và báo cáo cho NIST dưới dạng ma trận tương tự 16, 028 x 8,014
3.2 FERET database
Trước FRGC, NIST đã tổ chức cơ sở dữ liệu FERET và đánh giá giao thức để tạo điều kiện phát triển các hệ thống nhận dạng khuôn mặt thương mại Cơ sở dữ liệu FERET được thiết kế để đo lượng hiệu suất của khuôn mặt các thuật toán nhận dạng trên cơ sở dữ liệu lớn trong cài đặt thực tế.Chương trình FERET cung cấp một cơ sở dữ liệu lớn về hình ảnh khuôn mặt được chụp từ 1.199 khuôn mặt riêng lẻ và được thu thập trong môt khoảng thời gian nhất định để hỗ trợ thuật toán phát triển và đánh giá Cơ sở dữ liệu FERET bao gồm 14.126 hình ảnh trong tổng bộ 1.564 bộ(1.199 bộ gốc và 365 bộ trùng lặp) Đối vớ mục đích phát triển,
503 bộ hình ảnh đã được phát hành cho các nhà nghiên cứu, và phần còn lại các bộ đã được cô lập
3.3 Pose Illumination Expression (PIE) database
Cơ sở dữ liệu PIE chứa 41.368 hình ảnh khuôn mặt của 68 người Các hình ảnh được thu thập qua các tư thế khác nhau, dưới các ánh sáng khác nhau và các biểu cảm khuôn mặt khác nhau Đầu tiên trong phòng CMU 3D, hình ảnh của mỗi người được chụp dưới 13 tuổi các tư thế khác nhau,
43 điều kiện ánh sáng khác nhau và 4 loại áp lực khuôn mặt Đặc biệt, đã thu được 43 điều kiện chiếu sáng khác nhau chỉ với 21 lần nhấp nháy, vì hình ảnh được chụp cả khi có và không bật đèn nền xung quanh Ngoài ra, mỗi người có bốn kiểu biểu cảm Cơ sở dữ liệu PIE đã được sử dụng rộng rãi để phân tích hình ảnh khuôn mặt dưới ánh sáng khác nhau và tư thế và
để đánh giá sự phát triển của khuôn mặt các thuật toán nhận dạng để xử
lý các biến dạng đó
3.4 AR Database
Cơ sở dữ liệu khuôn mặt AR được tạo bởi trung tâm thị giác máy tính (CVC) Nó chứa hơn 4000 hình ảnh màu tương ứng với khuôn mặt của
126 người Những hình ảnh có được là tư thế nhìn trực diện với các biểu cảm khuôn mặt khác nhau, ánh sáng tình trạng và các dấu vết cắn( chẳng hạn như những người đeo kính râm và quàng khăn) làm cho cơ sở dữ liệu
Trang 8này thành một trong những cơ sở dữ liệu phổ biến hơn để thử nghiệm các thuật toán nhận dạng khuôn mặt khi có hiện tượng khớp cắn
3.5 Yale Face Database
Cơ sở dữ liệu Yale chứa 165 hình ảnh tỷ lệ xám ở định dạng GIF la 15 cá nhân Có 11 hình ảnh cho mỗi chủ đềm một hình ảnh cho mỗi biến thể, chẳng hạn như nét mặt khác nhau, ánh sáng trung tâm, đeo kính, vui vẻ, ánh sáng trái… Cơ sở dữ liệu khuôn mặt Yale chứa 5760 ảnh nguồn sáng duy nhất của 10 đối tượng được nhìn thấy trong 576 điều kiện Đối với mọi chủ đề cụ thể, một hình ảnh có ánh sáng xung quanh cũng được chụp
4 Tensorfaces
Phương pháp Tensorfaces là một phương pháp mới để phân tích diện mạo khuôn mặt các yếu tố như thay đổi tư thế, điều kiện ánh sáng và khuôn mặt Các phương pháp Tensorfaces truyền thống sử dụng địa số đa tuyến cho phép chúng tôi phân tách các yếu tố khuôn mặt này từ một từ một tập training cụ thể, nhưng nó có những khó khăn phân tích các yếu tố của hình ảnh thử nghiệm không rõ hoặc chưa được đào tạo Do đó, các phương pháp phân tích nhân tử cho hình ảnh kiểm tra có đa được đề xuất
4.1 Multilinear Analysis of Training Images
Khi một tập training có ba yếu tố trên khuôn mặt, chẳng hạn như danh tính của mọi người, điều kiện ánh sáng và kiểu dáng, một trong những cách chung để phân tích tập training là xây dựng hệ thống truyền ma trận Npixel x (Npeople x Nlight x Npose) trong đó các hình ảnh Dtrain được vector hóa dưới dạng cột Ở đây Npixel được định nghĩa là số pixel trong một hình ảnh, Npeople là số người, Nlight là số lượng điều kiện ánh sáng
và Npose là số kiểu tư thế trong tập training Bằng cách sử dụng SVD, ma trận đại diện cho tập training được phân tách thành hai cơ sở trực giao và các giá trị đơn lẻ :
Dtrain = UpixelSVT
Upixel : là cơ sở của không gian cột
V : là cơ sở của hàng không gian Dtrain
Bởi HOSVD, cùng một tập hợp đào tạo có thể được phân tích trong nhiều chi tiết hơn:
Dtrain = UpixelSVTZ(Upeoplex Ulight x Upose)T
trong đó x đại diện cho sản phẩm Kronecker.Phân tích hình ảnh khuôn mặt này sử dụng HOSVD được gọi là Tensorfaces Ma trận Npeople x Npeople Upeople trải dài không gian của các tham số người, ma trận Nlight
x N light Ulightkéo dài không gian của các thông số tư thế, ma trận Npose
x N pose Upose kéo dài không gian của các thông số tư thế HOSVD có thể được biểu diễn bằng hai dạng; một là sử dụng tensor và nhân tensor
Trang 9trong khi cái kia sử dụng ma trận và các sản phẩm của Kroneker Bằng tương tự của việc phân hủy các hình ảnh đào tạo, một hình ảnh có thể được phân hủy vào các loại yếu tố giống nhau, bất kể nó nằm trong tập hợp đào tạo hay không phải:
d = UpixelZ(xpeople ⊗ xlight⊗ xpose)T Trong trường hợp training images của người thứ i, điều kiện chiếu sáng thứ j và tư thế thứ k, thì thông số nhận dạng của người đó x people là hàng thứ i của ma trận Upeople vì vector Npeople x 1xpeople là cột thứ
i Vì lý do tương tự , tham số chiều sáng xlight của training image là hàng thứ j của ma trận Ulight và xpose là hàng thứ k của ma trận Upose Các tham số của tất cả các yếu tố cho training images có thể dễ dáng tính toán bằng phân tích đa tuyến của tập training Nó cũng dễ dàng tính toán tham số xpeople của một hình ảnh thử nghiệm khi nó là hình ảnh duy nhất có tham số không xác định và tất cả các tham số khácđược biết hoặc ước tính bởi các kỹ thuật khác Tuy nhiên, nó gặp khi lấy các tham số xpeople xlight xpose khi tất cả các tham số đều không xác định cho một hình ảnh thử nghiệm Đặc biệt nếu untrained image có tư thế hoặc điều kiện ánh sáng chưa được train, thì việc lấy được ba thông số của ba yếu tố
sẽ khó hơn Do đó, mục tiêu của việc phân tích nhân tử trong quá trình thử nghiệm là giải quyết cho tất cả
4.2 Multilinear Analysis of Testing Images
Để phân tích dữ liệu các hình ảnh thử nghiệm có tư thế hoặc điều kiện ánh sáng Phương pháp thừa số hóa mới được đề xuất dựa trên công trình trước đó Theo phương pháp này, tất cả các yếu tố có thể được ước tính đồng thời mà không giả định tiên nghiệm hoặc kiến thức về hình ảnh thu được Hơn nữa, phương pháp đề xuất có thể áp dụng ngay cả khi hình ảnh thử nghiệm có ánh sáng chưa qua đào tạo điều kiện hoặc tư thế Trong phương pháp được đề xuất, để có được các tham số yếu tố, để có được các tham số yếu tố, trước tiên, nó chỉ ra rằng bài toán thừa số hóa tensor
có thể được xây dựng dưới dạng tối thiểu bài toán bình phương với một ràng buộc bình đẳng bậc hai
Trong đó dtestlà một hình ảnh kiểm tra đã cho và x = xpeople x xlight x xpose Mục đích là tìm ^x giá trị tối ưu của x để giảm thiểu khoảng cách giữa hình ảnh thử nghiệm và hình ảnh được tái tạo bằng các tham số ước tính Tiếp theo, ^x thu được bằng các kỹ thuật tối ưu hóa số được xác định rõ cho phép chúng ta có được các trên khuôn mặt đồng thời trong ^x được ước lượng bằng phương pháp chiếu, là phương pháp tối ưu hóa tôt hơn só với phương pháp của newton để giải quyết vấn đề Sau khi nhận được ^x, đó là sản phẩm Kronecker của các yếu tố trộn, nó được phân
Trang 10hủy thành từng yếu tố xpeople, xlight, xpose theo phương pháp nguồn cao cấp hơn
Tổng hợp và nhận dạng khuôn mặt là những ứng dụng chính của quá trình ion hóa hệ số tensor, và kết quả sử dụng cơ sở dữ liệu khuôn mặt Yale B có thể tìm thấy trong [52] Cơ sở dữ liệu chứa 10 người và mỗi người có 65 điều kiện ánh sáng khác nhau và 9 tư thế Hai loại mô hình đa tuyến đã được xây dựng và đã thử nghiệm: một là mô hình song tuyến với hai yếu tố bao gồm con người và điều kiện ánh sáng, và mô hình kia là mô đình ba tuyến với 3 yếu tố bao gồm người, điều kiện ánh sáng và tư thế khác nhau Chọn sự thay đổi ánh sáng đã bị loại bỏ vì hình ảnh trong điều kiện ánh sáng quá tối nên nó khó khai thác thông tin từ chúng Tiếp theo, mỗi mẫu thứ năm được thêm vào tập traning Đối với
mô hình song tuyến, 11 điều kiện ánh sáng của 10 điểm phụ được sử dụng để training, trong đó 44 điều kiện ánh sáng khác được sử dụng để thử nghiệm không có sự chồng chéo giữa hai tập con Đối với mô hình ba tuyến, điều kiện ánh sáng giống nhau với mô hình song tuyến trên cho cả hai training và test Ngoài ra, ba tư thế được sử dụng để training trong khi
6 tư thế khác được dùng để test Ở đây, ba tử thế để đào tạo và tư thế 0,6
và 8 của cơ sở dữ liệu khuôn mặt Yale; tư thế 0 là tư thế trực diện và tư thế 6 và 8 được chụp từ hai độ lớn nhất của máy ảnh quang học trục
5 Active Appearance Models for Face Recognition
An Active Appearance Models for Face Recognition (AAM) là môt mô hình thống kê để giải thích (trong trường hợp này) hình ảnh khuôn mặt với các thông số đã biết Nó bao gồm mô hình hình dạng và mô hình