Để giải quyết vấn trên tôi xin xuất ra phương pháp phát hiện khuôn mặt sử d ng phương pháp Viola jone face detection, trích chọn ặc trưng sử d ng phương pháp Weber local Descriptor và kế
Trang 1
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN THỊ THUỶ
PHƯƠNG PHÁP NHẬN DẠNG KHUÔN MẶT NGƯỜI
VÀ ỨNG DỤNG TRONG QUẢN LÝ NHÂN SỰ
Ngành: Khoa học máy tính Chuyên Ngành: Khoa học máy tính
Trang 2
LỜI CAM ĐOAN
Luận văn thạc sĩ tài “Nhận dạng khuôn mặt người và ứng d ng trong quản l
nh n s là công trình cá nh n tôi Các nội dung nghiên cứu và kết quả trình bày trong
lu n văn này là trung th c và rõ ràng Các tài liệu tham khảo ược trích dẫn ầy ủ và
ghi rõ nguồn gốc
Tác giả luận văn k và ghi rõ họ tên
Trang 3
MỤC LỤC
LỜI CAM ĐOAN i
MỤC LỤC iii
DANH MỤC HÌNH VẼ, ĐỒ THỊ v
DANH MỤC CÁC TỪ VIẾT TẮT vii
PHẦN MỞ ĐẦU 1
1 L do chọn tài 1
2 M c ích nghiên cứu của luận văn, ối tượng, phạm vi nghiên cứu M c ích của luận văn: 1
3 Nội dung lu n văn 2
CHƯƠNG 1: BÀI TOÁN NHẬN ĐỐI TƯỢNG NHẬN DẠNG KHUÔN MẶT 3
1.1 Tổng quan và các khái niệm liên quan ến nhận dạng khuôn mặt 3
1.1.1 Hệ thống sinh trắc học 3
1.1.2 Hệ thống nhận dạng khuôn mặt 3
1.1.3 Hệ thống xác minh hay xác th c khuôn mặt là gì 3
1.1.4 Những thách thức trong bài toán nhận dạng khuôn mặt 4
1.2 Tổng quan v các ứng d ng tương tác người máy liên quan tới khuôn mặt 4 1.3 Hướng tiếp cận chính trong lĩnh v c nhận dạng khuôn mặt 4
1.3.1 Các công trình nghiên cứu v Phương pháp nhận dạng và kiểm chứng chất lượng cho một hệ thống nhận dạng khuôn mặt 4
1.3.2 Hướng tiếp cận của luận văn 7
CHƯƠNG 2: CÁC KỸ THUẬT CHO NHẬN DẠNG KHUÔN MẶT 8
I Học máy 8
1.1 Phương pháp Deep Learning (CNN) 8
1.2 Phương pháp truy n thống 8
II Các kỹ thuật sử d ng trong nhận dạng khuôn mặt 9
Trang 4
2.1 Phát hiện khuôn mặt (Viola Jone Face detection) 9
2.2 Trích chọn ặc trưng Weber local Descripor- WLD 12
2.3 Giới thiệu phương pháp ph n tích thành phần chính PCA 15
2.3.1 Giới thiệu phương pháp PCA 15
2.3.2 Đặc trưng PCA 19
2.3.3 Phương pháp ph n tích thành phần chính(PCA) 19
2.3.4 Các bước th c hiện trích chọn ặc trưng PCA 21
2.4 Học máy hộ trợ vestor SVM 23
2.4.1 Cơ sở l thuyết 23
2.4.2 SVM tuyến tính 23
2.4.3 SVM Phi Tuyến tính 25
CHƯƠNG 3: ỨNG DỤNG CÁC KỸ THUẬT TRONG NHẬN DẠNG KHUÔN MẶT 30
3.1 Phát hiện khuôn mặt (Viola Jone Face Detection) 30
3.2 Trích chọn ặc trưng (WLD) 30
3.3 Ph n tích thành phần chính PCA và nhận dạng/ph n lớp SVM 31
3.4 Mô tả dữ liệu 32
3.4.1 Thu nhập dữ liệu 32
3.4.2 iểu diễn dữ liệu khuôn mặt trong máy tính 34
3.4.3 Dữ liệu huấn luyện 35
3.5 Kết quả th c nghiệm 35
3.6 Ứng d ng trong quản l nh n s 37
3.6.1 Mô hình nhận dạng trong quản l nh n s 37
3.6.2 Giao diện màn hình chức năng nhận dạng 38
3.6.3 Giao diện màn hình chức năng quản l bộ phận 39
3.6.4 Giao diện màn hình chức năng quản l phòng ban 40
3.6.5 Giao diện màn hình chức năng quản l nh n s 41
Trang 5
DANH MỤC HÌNH VẼ, ĐỒ THỊ
Hình 0.1 So sách tác v nhận dạng khuôn mặt và xác minh khuôn mặt 3
Hình 0.2 Mô phỏng nhận dạng khuôn mặt 7
Hình 0.3 Haar Features sử d ng trong Violo Jones 9
Hình 0.4 Applying on a give image 9
Hình 0.5 Ví d v Haar features 91
Hình 0.6 Ví d ảnh Integral 91
Hình 0.7 Ảnh ví d tính Ô pixcel 92
Hình 0.8 Các bước loại khuôn mặt hay không 93
Hình 0.9 Kết quả phát hiện khuôn mặt 93
Hình 0.10 Tính kích thích sai khác 95
Hình 0.11 Ảnh trên là ảnh gốc, ảnh thứ 2 là ảnh trích chọn ặc trưng 95
Hình 0.12 Minh họa v tính toán của WLD 96
Hình 0.13 L a chọn các tr c toạ ộ mới ể biểu diễn dữ liệu [11] 178
Hình 0.14 Siêu măt ph n cách tuyến tính cho trường hợp ph n cách ược và k Hiệu các support vestor chính là các diểm ược bao bằng vi n tròn 242
Hình 0.15 ảnh, trong H, với hình vuông [1,-1] €R2 dưới ánh xạ ϴ 27
Hình 0.16 c y nhị ph n: Cấu trúc c y nhị ph n với số lớp bằng số mũ của 2 Phải: số mũ không bằng số mũ của 2 29
Hình 0.17 Mô hình quá trình tạo các ặc trưng mặt 31
Hình 0.18 Mô hình sử d ng trong nhận dạng khuôn mặt 31
Hình 0.19 Mô hình quá trình tạo các ặc trưng mặt 312
Hình 0.20 ảnh ban ầu ược biểu diễn theo các trọng số và eigenface 323
Hình 0.21 Ví d v ảnh của một người trong Yale face Database 334
Hình 0.22 Ảnh 12 khuôn mặt người ược ánh thứ t từ 1 ến 12 334
Hình 0.23 Kích thước chuẩn hóa của một mẫu khuôn mặt trong học tập 345
Hình 0.24 Một phần của tập ảnh luyện 356
Trang 6
Hình 0.25 Một phần của tập ảnh thử nghiệm 356
Hình 0.26 Bảng 1.1 Bảng Th c nghiệm nhận dạng số lượng ảnh 367
Hình 0.27 kết quả th c nghiệm so với chỉ sử d ng PCA 367
Hình 0.28 Mô hình nhận dạng ở cửa ra vào tại cơ quan 378
Trang 7
DANH MỤC CÁC TỪ VIẾT TẮT
Trang 8
PHẦN MỞ ĐẦU
1 Lý do chọn đề tài
Nhận dạng khuôn mặt là một trong những lĩnh v c mới của xử l ảnh Và
ngày nay nhận dạng ược sử d ng rộng rãi trong nhi u lĩnh v c của ời sống
như nhận dạng trong lĩnh v c thương mại, hay phát hiện trong lĩnh v c an ninh,
hay trong xử l video, hình ảnh Một trong những ứng d ng tiểu biểu nhận dạng
ang sử d ng phổ biến hiện này trong nhận dạng khuôn mặt người là ứng d ng
trong iện thoại di ộng c thể như IphoneX và Sangsung ang sử d ng
Hiện nay có rất nhi u các Phương pháp nhận dạng khác nhau ược x y
d ng ể nhận dạng một người c thể trong thế giới th c ta có thể nói tới một số
phương pháp như: học máy và học s u.Tuy nhiên hai phương pháp này lại có
nhược iểm lớn là phải x y d ng một tập cơ sở dữ liệu lớn và ồng thời việc xử
l dữ liệu lớn òi hỏi phải nhanh và chính xác Vậy nên hai phương pháp trên sẽ
mất thời gian ể nhận dạng nhiệm v ặt ra là nghiên cứu và x y d ng một
chương trình sử d ng Phương pháp nhận dạng có ộ chính xác cao mà khối
lượng và thời gian tính toán lại ít
Để giải quyết vấn trên tôi xin xuất ra phương pháp phát hiện khuôn
mặt sử d ng phương pháp Viola jone face detection, trích chọn ặc trưng sử
d ng phương pháp Weber local Descriptor và kết hợp ph n tích thành phần
chính sử d ng phương pháp PCA và học máy vestor (SVM) ể nhận dạng
khuôn mặt
2 Mục đích nghiên cứu của luận văn, đối tƣợng, phạm vi nghiên cứu Mục
đích của luận văn:
Nghiên cứu tài này nhằm m c ích tìm hiểu bài toán nhận dạng khuôn
mặt, từ ó x y d ng các hệ thống ứng d ng trong th c tiễn như: iểm danh,
giám sát người ra vào, an ninh trong s n bay
Đối tƣợng và phạm vi áp dụng:
Trang 9
Đ tài tập trung tìm hiểu một số phương pháp nhận dạng khuôn mặt người
phổ biến hiện nay và ưa ra phương án nhận dạng cho bài toán nhận dạng khuôn
mặt người
Để đặt được mục tiêu trên đề tài tập trung tìm hiểu các nội dung sau:
- Tìm hiểu phương pháp phát hiện khuôn mặt sử d ng phương pháp Viola
Jones Face Detection
- Trích chọn ặc trưng sử d ng phương pháp Weber Local Description
- Phương pháp ph n tích thành phần chính
- Phương pháp học máy vestor (SVM)
3 Nội dung luân văn
Luận văn này gồm 3 chương, c thể như sau:
Chương 1: BÀI TOÁN NHẬN ĐỐI TƯỢNG NHẬN DẠNG KHUÔN
MẶT
Giới thiệu các cách thức nhận dạng khuôn mặt người, vì sao nên nhận
dạng người bằng khuôn mặt, tầm quan trọng của bài toán trong th c tiễn, một số
ứng d ng th c tiễn của bài toán nhận dạng khuôn mặt
Chương 2: CÁC KỸ THUẬT CHO NHẬN DẠNG KHUÔN MẶT
Giới thiệu v 4 phương pháp sử d ng nhận dạng khuôn mặt ược sử d ng
trong luận văn là phương pháp phát hiện khuôn mặt( Viola Jone Face
Detection), phương pháp trích chọn ặc trưng (WLD), ph n tích thành phần
chính (PCA) và máy vector hỗ trợ (SVM)
Chương 3: ỨNG DỤNG CÁC KỸ THUẬT TRONG NHẬN DẠNG
KHUÔN MẶT
Đưa ra mô hình x y d ng bài toán nhận dạng khuôn mặt người, các bước
th c hiện và ánh giá thử nghiệm
Trang 10Hệ thống sinh trắc học là một hệ thống ược thiết kế ể xác minh và nhận
dạng một người d a vào những ặc trưng sinh học duy nhất của người ó
1.1.2 Hệ thống nhận dạng khuôn mặt
Hệ thống nhận dạng khuôn mặt là một hệ thống ược thiết kế ể tìm
thông tin của một người Kĩ thuật nhận dạng là kiểm tra s phù hợp d a trên
phép so sánh một-nhi u c thể là tìm ra một người là ai trong số những người ã
ược lưu trữ trong hệ thống d a vào thông tin khuôn mặt
1.1.3 Hệ thống xác minh hay xác thực khuôn mặt là gì
Hệ thống xác minh/xác th c khuôn mặt là một hệ thống ược thiết kế ể
xác minh thông tin của một người Kĩ thuật xác minh là kiểm tra s phù hợp trên
phép so sánh một-một c thể là ối chiếu thông tin mới nhận v một người với
thông tin ã lưu trữ v người này có khớp hay không d a trên thông tin khuôn
mặt
Trang 11
1.1.4 Những thách thức trong bài toán nhận dạng khuôn mặt
Những biến ổi quá lớn giữa các ảnh khuôn mặt khác nhau từ một người
cần nhận dạng gồm trạng thái cảm xúc trên khuôn mặt, ánh sáng, và các thay ổi
vị trí của khuôn Giới hạn v số ảnh cần thiết cho việc nhận dạng, tập học không
thể bao quát ược tất cả các biến ổi có thể có trên khuôn mặt của một người
cần nhận dạng trong thế giới th c
1.2 Tổng quan về các ứng dụng tương tác người máy liên quan tới khuôn
mặt
Từ những năm 1990 trở lại y, chúng ta ã chứng kiến s phát triển như
vũ bão của các ngành công nghiệp, ặc biệc là ngành công nghiệp chế tạo iện
tử.Tuy nhiên hiện nay các thiết bị iện tử cao cấp như máy ảnh số, camera kĩ
thuậtsố,vànhi u sản phẩm khác dường như chỉ phù hợp cho các phòng thí
nghiệm, các công ty sản xuất kinh doanh, thương mại, tài chính, ng n hàng,
Trong thời gian không xa từ 3 ến 10 năm nữa, chi phí cho các thiết bị này sẽ
giảm áng kể Khi ó sẽ mở ra nhi u hướng nghiên cứu v thị giác máy tính,
ồng thời sẽ có nhi u ứng d ng trong giao tiếp giữa người với máy tính mà
trong ó hệ thống nhận dạng mặt người óng một vai trò không nhỏ Dưới y
chúng tôi liệt kê một số ứng d ng
Các ứng d ng chuyên biệt trong ngành hàng không
Ứng d ng sử d ng trong nhà thông minh,…
1.3 Hướng tiếp cận chính trong lĩnh vực nhận dạng khuôn mặt
1.3.1 Các công trình nghiên cứu về Phương pháp nhận dạng và kiểm
chứng chất lượng cho một hệ thống nhận dạng khuôn mặt
ài toán nhận dạng khuôn mặt cần xác ịnh hai vấn chính: dùng thông
tin nào ể nhận dạng: ch n mày, cặp mắt, mũi, môi, tai, hay kết hợp các thông
tin trên.Và dùng phương pháp nào ể huấn luyện cho máy nhận dạng dùng
nguồn thông tin ó Nhận dạng khuôn mặt trên máy tính ã trãi qua nhi u bước
thăng trầm với các kết quả như sau:
Trang 12
Wenyi Zhao, Arvindh Krishnaswamy, Rama Chellappa, Danie L.Swets,
ohn Weng (1998)[1] sử d ng phương pháp PCA (ph n tích thành phần
chính) kết hợp LDA (ph n tích ộc lập tuyến tính) ước 1, chiếu ảnh
khuôn mặt từ không gian ảnh thô sang không gian các không gian khuôn
mặt (Mỗi lớp khuôn mặt ược nhận dạng sẽ ược mô hình hóa bằng một
không gian khuôn mặt) dùng PCA ước 2, sử d ng phương pháp LDA
ể tạo bộ ph n loại tuyến tính có khả năng ph n lớp các lớp khuôn mặt
Emmanuel Viennet và Francoise Fogelman Soulie (1998),[3] sử d ng
phương pháp mạng neural nh n tạo ể xử l và nhận dạng khuôn mặt
Antonio J.Colmenarez và Thomas S.Huang (1998),[4] sử d ng kỹ thuật
học thị giác và phù hợp mẫu 2-D Ông quan niệm bài toán dò tìm khuôn
mặt là thao tác ph n loại khuôn mặt trong ó khuôn mặt thuộc v một
lớp và các ối tượng khác thuộc v lớp còn lại bằng cách ước lượng mô
hình xác suất cho mỗi lớp, và việc dò tìm sử d ng luật quyết ịnh
Maximum-likelihood
Kazunori Okada, Johannes Steffens, Thomas Maurer, Hai Hong, Egor
Elagin, Hartmut Neven, and Christoph (1998),[5] nhận dạng khuôn mặt
d a vào sóng Gabor và phương pháp phù hợp ồ thị bó Với tưởng
dùng ồ thị ể biểu diễn khuôn mặt, ảnh khuôn mặt ược ánh dấu tại
các vị trí ã ược xác ịnh trước trên khuôn mặt, gọi các vị trí này chính
là các vị trí chuẩn Khi th c hiện thao tác so khớp ồ thị với một ảnh,
các iểm chuẩn (Jets) sẽ trích ra từ ảnh và so sánh các iểm chuẩn này
với tất cả các iểm chuẩn tương ứng trong các ồ thị khác nhau, và ồ
thị nào phù hợp nhất với ảnh sẽ ược chọn
aback Moghaddam và Alex Pentland (1998) [6], ưa ra phương pháp
phù hợp thị giác tr c tiếp từ các ảnh cần sử d ng cho m c ích nhận
dạng khuôn mặt và dùng ộ o xác suất ể tính ộ tương t
Trang 13tính huống theo d ịnh là thông tin rất quan trọng, từ ó nhận ược mô
tả ầy ủ hơn v khuôn mặt cho m1 c ích thu thập mẫu và nhận dạng
Jeffrey Huang, Chengjun Liu, và Harry Wechsler (1998)[8], xuất
thuật toán căn cứ trên tính tiến hóa (Evolutionary computation) và di
truy n (Genetic) cho các tác v nhận dạng khuôn mặt Đối với cách tiếp
cận này, hai mắt sẽ ược dò tìm trước tiên và thông tin này ược xem là
vết ể quan sát khuôn mặt, trình xử l dò tiếp mắt bằng cách sử d ng
một thuật toán lai ể kết hợp thao tác học và tiến hóa trong quá trình
học
Daniel graham và Nigel M Allinson (1998)[9], sử d ng phương pháp
ược gọi là tạo bản sao không gian ặc trưng ể biểu diễn và nhận dạng
hướng di chuyển của khuôn mặt
Oi in Sun, Chian Prong Lam và Jian Kang Wu (1998)[10], sử d ng
phương pháp tìm vùng hai ch n mày, hai mắt, mũi, miệng và cằm Ảnh
khuôn mặt thẳng ban ầu ược chiếu theo chi u ngang ể tìm các giá trị
iểm ảnh thỏa ngưỡng cho trước, ồ thị biểu diễn theo tr c ngang sẽ
ịnh vị vị trí biên trên và biên dưới của hình chữ nhật bao các ặc trưng
c c bộ khuôn mặt Tương t với chi u ứng ể tìm ra ường biên bên
trái và phải cho các vùng ặc trưng
Ara V.Nefian và Monson H.Hayes III (1998)[12] trình bày hướng tiếp
cận theo mô hình mô hình Markov ẩn (HMM) trong ó ảnh mẫu khuôn
mặt ược lượng hóa thành chuỗi quan sát trên khuôn mặt theo quan
niệm d a trên thứ t xuất hiện các ặc trưng khuôn mặt {hai ch n mày,
hai lông mi, mũi, miệng, cằm} Trong chuỗi quan sát ó, mỗi quan sát
lại là một vector nhi u chi u và mỗi vector quan sát này ược sử d ng
ể ặc trưng cho mỗi trạng thái trong chuỗi trạng trạng thái của HMM
Mỗi người ược ước lượng bằng một mô hình của HMM
Trang 14
Guodong Guo, stan Z.LI, Kap luk chan(17 january 2001), dùng phương
pháp SVM ể nhận dạng khuôn mặt Sử d ng chiến lược kết hợp nhi u
bộ phận loại nhị ph n ể x y d ng bộ ph n loại SVM a lớp
1.3.2 Hướng tiếp cận của luận văn
Trong tài này chúng tôi sử d ng phương pháp Phát hiện khuôn mặt sử
d ng phương pháp Viola Jone Face Detection, Trích chọn ặc trưng sử d ng
phương pháp Weber Local Descripor, ph n tích thành phần chính và phương
pháp ph n lớp SVM ể nhận dạng
Sơ ồ hệ thống nhận dạng khuôn mặt ược minh họa trong hình sau:
Hình 0.2 Mô hình nhận dạng khuôn mặt người
Trang 15
CHƯƠNG 2: CÁC KỸ THUẬT CHO NHẬN DẠNG KHUÔN MẶT
I Học máy
1.1 Phương pháp Deep Learning (CNN)
CNN là một trong những mô hình deep learning tiên tiến giúp x y d ng
hệ thống thông minh với ộ chính xác cao trong xử l ảnh CNN ược sử d ng
nhi u trong các bài toán nhận dạng object trong ảnh Tuy nhiên phương pháp
này lại có nhược iểm lớn là phải x y d ng một tập cơ sở dữ liệu lớn (mỗi tập
dữ liệu huấn luyện phải sử d ng ít nhất 1000 nhãn mới mang lại hiệu quả cao)
và ồng thời việc xử l dữ liệu lớn òi hỏi phải nhanh và chính xác
Mạng CNN là là một tập hợp các lớp Convolution chồng lên nhau và sử
d ng các hàm nonlinear activation như ReLU và tanh ể kích hoạt các trọng số
trong các node Mỗi một lớp sau khi thông qua các hàm kích hoạt sẽ tạo ra các
thông tin trừu tượng hơn cho các lớp tiếp theo Mỗi một lớp sau khi thông qua
các hàm kích hoạt sẽ tạo ra các thông tin trừu tượng hơn cho các lớp tiếp theo
Trong mô hình mạng truy n ngược (feedforward neural network) thì mỗi neural
ầu vào (input node) cho mỗi neural ầu ra trong các lớp tiếp theo Mô hình này
gọi là mạng kết nối ầy ủ (fully connected layer) hay mạng toàn vẹn (affine
layer) Còn trong mô hình CNNs thì ngược lại Các layer liên kết ược với nhau
thông qua cơ chế convolution Layer tiếp theo là kết quả convolution từ layer
trước ó, nhờ vậy mà ta có ược các kết nối c c bộ Như vậy mỗi neuron ở lớp
kế tiếp sinh ra từ kết quả của filter áp ặt lên một vùng ảnh c c bộ của neuron
trước ó
1.2 Phương pháp truyền thống
PCA và SVM: Phương pháp PCA giảm bớt số thành phần không cần
thiết tạo ra hiệu quả tính toán nhanh mà vẫn ảm bảo ược ộ chính xác Sau khi
PCA ưa ra ược các ặc trưng tốt sẽ dùng SVM ể ph n lớp và nhận khuôn
mặt
Trang 16
II Các kỹ thuật sử dụng trong nhận dạng khuôn mặt
2.1 Phát hiện khuôn mặt (Viola Jone Face detection)
- Haar features: tưởng : ộ sáng tối của các vùng trên gương mặt là khác
nhau Ví d : vùng mắt tối hơn vùng má, vùng mũi sáng hơn vùng hai bên
- Kết quả của mỗi ặc trưng ược tính bằng hiệu của tổng các pixel trong
mi n ô trắng trừ i tổng các pixel trong mi n ô en
Hình 0.3 Haar Features sử dụng trong Viola Jones (Nguồn: bài báo Viola Jone face detection)
Hình 0.4 Applying on a give image (Nguồn: bài báo Viola Jone face detection)
Thuật toán viola jones sử d ng cửa sổ 24x24 ể ánh giá các ặc trưng
của ảnh Nếu xem xét tất cả các tham số của các ặc trưng, ta tính ược khoảng
160.000+ ặc trưng cho mỗi cửa sổ
Trang 17
Hình 0.5 Ví dụng về các haar features (Nguồn: Bài báo Viola Jone face detection)
- Integral Image: giá trị ở pixel (x, y) là tổng của các pixel ở trên và bên
trái (x,y) Cho phép tính tổng của các pixel trong bất kì hình chữ nhật chỉ với 4
giá trị ở 4 góc
Hình 0.6 Ví dụ ảnh Integral
Trang 18
Hình 0.7 Ảnh Ví dụ tính 1 ô pixcel
Trong các pixels: D=1 + 4 – (2+3) = A + (A + B +C + D)- (A+C + B) = D
- Có rất nhi u ặc trưng ược lấy ra từ 1 cửa sổ nhưng chỉ có 1 số ít là hữu
d ng trong việc nhận diện khuôn mặt
- Sử d ng thuật toán adaboost ể tìm những ặc trưng tốt nhất Sau ó các
ặc trưng này ược gán cho các trọng số ể tạo nên hàm ánh giá quyết ịnh
xem một cửa sổ có là khuôn mặt hay không Mỗi ặc trưng chọn nếu chúng ít
nhất thể hiện tốt hơn oán ngẫu nhiên (phát hiện nhi u hơn một nửa)
- Các ặc trưng ược gọi là các bộ ph n lớp yếu Chúng ược tổ hợp tuyến
tính ể tạo ra một bộ ph n lớp mạnh
Strong clasifier Weak classifier
- Mặc dù một ảnh có thể chứa một hoặc nhi u khuôn mặt nhưng số lượng
vật không phải khuôn mặt vẫn lớn hơn rất nhi u => thuật toán nên tập trung vào
việc bỏ những vật không phải khuôn mặt một cách nhanh chóng
- Một bộ ph n lớp cascade (cascade classifier) ược sử d ng tất cả các ặc
trưng ược nhóm vào vài stage Mỗi stage gồm một số các ặc trưng
Trang 19
- Mỗi stage ược sử d ng ể xác ịnh một cửa số có phải là khuôn mặt
hay không
Hình 0.8 các bước loại khuôn mặt hay không
Hình 0.9 Kết quả Phát hiện khuôn mặt (Nguồn: bài báo Viola Jone Face Detection)
2.2 Trích chọn đặc trưng Weber local Descripor- WLD
Weber local Description (WLD): việc nhận thức của con người v một vật
mẫu không chỉ ph thuộc vào s thay ổi của một kích thích ( m thanh, ánh
sáng…) mà còn ph thuộc vào cường ộ gốc của kích thích WLD gồm 2 thành
Trang 20phần chính: differential excitation và gradient orientation của ảnh và x y d ng
histogram d a trên thành phần ó
- Different excitations
Sử d ng s khác nhau v cường ộ giữa pixel hiện tại và các hàng
xóm ể miêu tả s thay ổi của pixel hiện tại => mô phỏng quá
trình nhận dạng mẫucủa con người
Ic: cường ộ của pixel hiện tại
Ii: cường ộ của pixel l n cận I = (0,1,…p-1) p: số pixel l n cận
Để ơn giản, các giá trị của Ɵ ược lượng tử hoá v T hướng trước
khi lượng t giá trị Ɵ ược ưa v [0, II]
Trang 21
Hình 0.10 Tính kích thích sai khác (Nguồn WLD, tác giả Jie Chen, Member, IEEE,
Shiguang Shan, Member, IEEE, Chu He, Guoying Zhao, Matti Pietikäinen, Senior
Member, IEEE, Xilin Chen, Senior Member, IEEE, Wen Gao, Fellow, IEEE)
Hình 0.11 ảnh trên là ảnh gốc ảnh thứ 2 là gốc trích chọn đặc trƣng (Nguồn WLD, tác giả
Jie Chen, Member, IEEE, Shiguang Shan, Member, IEEE, Chu He, Guoying Zhao, Matti
Pietikäinen, Senior Member, IEEE, Xilin Chen, Senior Member, IEEE, Wen Gao, Fellow,
IEEE)
- WLD histogram
Phần 0, 5: biến ổi của tần số cao
Phần 1, 4: biến ổi của tần số trung bình
Phần 2, 3: biến ổi của tần số thấp
Trang 22Hình 0.12 Minh họa về tính toán của WLD ( Nguồn WLD, tác giả Jie Chen, Member, IEEE,
Shiguang Shan, Member, IEEE, Chu He, Guoying Zhao, Matti Pietikäinen, Senior Member,
IEEE, Xilin Chen, Senior Member, IEEE, Wen Gao, Fellow, IEEE)
2.3 Giới thiệu phương pháp phân tích thành phần chính PCA
2.3.1 Giới thiệu phương pháp PCA
Phương pháp trích chọn ặc trưng ược phát minh năm 1901 bởi Karl
Pearson,và ược phát triển một cách ộc lập bởi Hotelling (1933) Hiện nay nó
ược sử d ng như một công c ể ph n tích dữ liệu nghiên cứu và th c hiện các
mô hình d oán PCA còn bao gồm cả việc tính toán ph n tích các giá trị ặc
trưng của một ma trận tương quan dữ liệu hay ph n tính các giá trị ơn của ma
trận dữ liệu thường sau khi tính trung bình dữ liệu của mỗi thuộc tính [11],[15]
Trang 23trúc bên trong của dữ liệu Nếu một tập dữ liệu a biến ược xem xét như tập
các tọa ộ trong một không gian dữ liệu nhi u chi u (mỗi tr c biểu diễn một
biến) thì phương pháp PCA cung cấp cho chúng ta một bức ảnh ít chi u, một cái
bóng của vật thể khi quan sát từ chính những ặc trưng cơ bản nhất của vật thể
ó
M c tiêu của phương pháp PCA là th c hiện giảm số chi u nhưng vẫn
ảm bảo tối a s ph n tán dữ liệu Có thể nói phương pháp trích chọn ặc trong
tìm cách giữ lại những thành phần thống kê quan trọng nhất của tập dữ liệu ban
ầu
Giả sử ta cần giảm số chi u của dữ liệu từ N chi u xuống còn K (K<N)
chi u nghĩa là ta cần tìm một ánh xạ từ không gian N chi u sang không gian K
chi u
Trong vấn ang xét của luận văn này, PCA là một thuật toán ược sử
d ng ể tạo ra một ảnh mới từ ảnh ban ầu Ảnh mới này có kích thước nhỏ hơn
rất nhi u so với ảnh ầu vào và vẫn mang những ặc trưng cơ bản nhất của ảnh
cần nhận dạng Phương pháp PCA không cần quan t m ến việc tìm ra các ặc
iểm c thể của th c thể cần nhận dạng và mối quan hệ giữa các ặc iểm ó
Tất cả các chi tiết của th c thể u ược thể hiện ở ảnh mới ược tạo ra từ PCA
Bản chất của PCA là tìm ra một không gian mới theo hướng biến thiên
mạnh nhất của một tập hợp các vector trong không gian cho trước Ở không gian
mới, ta hi vọng rằng việc ph n loại sẽ cho ta bộ dữ liệu tốt hơn so với bộ dữ liệu
trong không gian ban ầu
Ví d : giả sử tập dữ liệu ban ầu ược quan sát trong không gian ba chi u
như hình bên trái Rõ ràng ba tr c này (các tr c có tên Databases, Data minning,
Language trong hình 3) không biểu diễn ược tốt nhất mức ộ biến thiên của dữ
liệu Phương pháp PCA sẽ tìm hệ tr c tọa ộ mới (là hệ tr c không có tên trong
hình bên trái) ể biểu diễn tốt nhất mức ộ biến thiên của dữ liệu Sau khi tìm
ược không gian mới, dữ liệu sẽ ược chuyển sang không gian này ể ược biểu
diễn như trong hình bên phải Rõ ràng hình bên phải chỉ cần hai tr c tọa ộ
Trang 24nhưng biểu diễn tốt hơn ộ biến thiên của dữ liệu so với hệ tr c toạ ộ chi u ban
ầu
Một ưu iểm của PCA là các tr c toạ ộ mới trong không gian luôn ảm
bảo tr c giao từng ôi một mặc dù trong không gian ban ầu các tr c có thể
không tr c giao với nhau
Hình 0.13 Lụa chọn các trục toạ độ mới để biểu diễn dữ liệu
Xem tập mẫu gồm K vestors trong không gian M chi u [5], [17]:
={
,… =
{
Trang 25
Bằng cách sử d ng M vectors cơ sở ta có thể biểu diễn mỗi quan sát Đi u
này cũng úng khi ta chọn cơ sở gồm M-vectors tr c giao ược thể hiện trong
2.2
Trong th c tế chúng ta không thể ưa tất cả các cơ sở M-chi u do nhi u l
do khác nhau như M quá lớn hay có chứa một số thông tin không quan trọng Vì
vậy chúng ta chuyển sang không gian có số chi u nhỏ hơn là N chi u Khi ó
ược gọi là cắt (truncated) khi có nhận ít nhất vestor cơ sở hơn Vậy ta
thể hiện O trong cơ sở nhỏ hơn với sai số
Để sai số xấp xỉ bé nhất thì phải chọn là N vestor riêng có nghĩa nhất
của S thoả mãn công thức:
∑ ‖ ̃ ‖ = ∑ ‖ ̃ ‖ ≥ - ∑ ∑
(2.12)
Khi ta chon N-vestor riêng và sai số xấp xỉ là nhỏ nhất và bằng tổng M-N
trị riêng bé nhất của S thì ta ược:
Trang 26
S = ∑ = [ , ][ ]= O (2.14)
Do S là ối xứng nửa xác ịnh riêng nên những vector riêng là tr c giao
i u này ảm bảo cơ sở tối ưu là tr c giao
Như vậy cơ sở mới ược x y d ng từ cơ sở quan sát ban ầu theo phương
trình:
̃ = (2.15)
Như ta biết phép biến ổi tr c giao không làm thay ổi Trace-Vết của ma
trận mà phép biến ổi cơ sở này giữ lại K-vectors riêng ứng với K-trị riêng lớn
nhất Nghĩa là s ph n bố các mẫu trong tập dữ liệu mới thu ược luôn là lớn
nhất
Theo các kết quả nghiên cứu thông thường ta chọn K sao cho
∑ ≥ nguong(e.g, 0.90or0.95) (2.17)
Với là các trị riêng của ma trận hiệp phương sai và
Tóm lại, phương pháp PCA ánh xạ một vector từ không gian M chi u
xuống không gian N chi u sẽ i tìm các giá trị riêng và vector riêng của ma trận
hiệp phương sai C của tập mẫu và giữ lại N vector riêng tương ứng với N giá trị
riêng lớn nhất làm cơ sở cho không gian N chi u này
2.3.2 Đặc trưng PCA
M c tiêu của phương pháp PCA là “giảm số chi u của 1 tập vector sao
cho vẫn ảm bảo ược “tối a thông tin quan trọng nhất phương pháp PCA sẽ
giữ lại K thuộc tính “mới từ M các thuộc tính ban ầu (K<M)
2.3.3 Phương pháp phân tích thành phần chính(PCA)
2.3.3.1 Vector riêng
Xét một toán tử tuyến tính f trong không gian Rn với các vector cơ sở :