Tìm hiểu các đặc trưng sinh trắc ảnh khuôn mặt, nghiên cứu ứng dụng của phép biến đổi KL và phân tích thành các thành phần chính PCA trong trích chọn đặc trưng khuôn mặt
Trang 1VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
- -
BÀI TẬP LỚN MÔN XỬ LÝ ẢNH
ĐỀ TÀI:
Tìm hiểu các đặc trưng sinh trắc ảnh khuôn mặt, nghiên cứu ứng dụng của phép biến đổi KL và phân tích thành các thành phần
chính PCA trong trích chọn đặc trưng khuôn mặt
Giảng viên hướng dẫn : PGS.TS Nguyễn Thị Hoàng Lan
Sinh viên thực hiện : Nguyễn Văn Thành
Lớp: Hệ thống thông tin và truyền thông – KSCLC-K52
Hà Nội, 12/2011
Trang 2MỤC LỤC
LỜI NÓI ĐẦU 3
I ĐẶC TRƯNG SINH TRẮC ẢNH KHUÔN MẶT 4
II NGHIÊN CỨU ỨNG DỤNG CỦA PHÉP BIẾN ĐỔI KL 7
1 Phép biến đổi KL 7
2 Ứng dụng của phép biến đổi KL 9
III PHÂN TÍCH THÀNH CÁC THÀNH PHẦN CHÍNH PCA TRONG TRÍCH CHỌN ĐẶC TRƯNG KHUÔN MẶT 14
1 Phép biến đổi PCA 14
2 Phân tích thành chính PCA trong trích chọn đặc trưng khuôn mặt 14
2.1 Tính toán các vector riêng 14
2.2 Biểu diễn khuôn mặt theo cơ sở tìm được 17
IV KẾT LUẬN 18
TÀI LIỆU THAM KHẢO 19
Trang 3LỜI NÓI ĐẦU
“Xử lý ảnh” là môn học quan trọng đối với sinh viên ngành công nghệ thông tin Đây là môn học khó đối với hầu hết nhiều sinh viên do yêu cầu kiến thức về toán và xác suất
Với mục tiêu có thêm kiến thức cơ bản trong lĩnh vực về xử lý ảnh, em chọn
đề tài “Tìm hiểu các đặc trưng sinh trắc ảnh khuôn mặt, nghiên cứu ứng
dụng của phép biến đổi KL và phân tích thành các thành phần chính PCA trong trích chọn đặc trưng khuôn mặt” Qua bài tập lớn, em đã có thêm được
cái nhìn chung về hệ thống nhận dạng khuôn mặt, các đặc trưng sinh trắc khuôn mặt giúp phát hiện và trích rút được các đặc trưng cho việc nhận dạng Đồng thời em được củng cố thêm về kiến thức toán và xác suất thông kê, có được hiểu biết tốt hơn về ứng dụng của kiến thức cơ bản trong các bài toán thực tế
Dù rất cố gắng trong việc tìm hiểu tài liệu, nhưng do thiếu sót về kiến thức cơ bản, hạn chế tầm hiểu biết mà bài báo cáo còn rất nhiều thiếu khuyết Kính mong nhận được những ý kiến góp ý để em hoàn thiện hơn
Nhân dịp này, em xin gửi lời cảm ơn chân thành tới PGS.TS Nguyễn Thị Hoàng Lan đã nhiệt tình hướng dẫn góp ý giúp em hoàn thành báo cáo môn học
này
Em xin chân thành cảm ơn!
Hà Nội, ngày 12 tháng 12 năm 2011
Trang 4I ĐẶC TRƯNG SINH TRẮC ẢNH KHUÔN MẶT
Các đặc trưng khuôn mặt bao gồm:
- Đặc trưng hình học: cấu trúc, hình dạng và các thành phần trên khuôn mặt: miệng, mắt, mũi, lông mày Khoảng cách giữa mắt, mũi, miêng và hàm; đường bao các hốc mắt; các cạnh của miệng; vị trí của mũi, hai mắt và các vùng xung quanh.Các thành phần khuôn mặt được trích rút để hình thành vector đặc trưng biểu diễn hình học khuôn mặt
Trang 5Hình 1.1 Minh họa đặc trưng hình học của khuôn mặt
- Đặc trưng về diện mạo biểu diễn sự thay đổi vẻ bề ngoài: kết cấu da như các nếp nhăn trên khuôn mặt; biểu đồ nhiệt của khuôn mặt: các mẫu nhiệt khuôn mặt là duy nhất với mỗi người và đặc trưng về nụ cười Các đặc trưng về diện mạo có thể được trích rút trên cả khuôn mặt hoặc phần nào đó trên khuôn mặt
-
Trang 6Hình 1.2 Minh họa đặc trưng về diện mạo khuôn mặt
Trang 7II NGHIÊN CỨU ỨNG DỤNG CỦA PHÉP BIẾN ĐỔI KL
1 Phép biến đổi KL
Xét không gian mẫu S = {x} gồm n vector dữ liệu mẫu
Trong đó x là vector các biến ngẫu nhiên N chiều:
x = [ x 1 x 2 … x N ] T Phép biến đổi KL đối với các vector x được định nghĩa như sau:
y = W T x (1.1) Trong đó x = [ x 1 x 2 … x N ] T , y = [ y 1 y 2 … y M ] T và ma trận W là ma trận phép biến đổi
với kích thước NxM (M ≤ N) có dạng:
MN M
N T
i T
w w
w w
w W
1
1 11
Ta định nghĩa ma trận hiệp tương quan của các vector x:
[C]x = E[xx T] (1.2)
Ma trận tương quan được ước lượng từ n mẫu trong không gian dữ liệu quan sát được xác định bởi biểu thức:
n
i
T i i
x x x n
C
1
1
Phép biến đổi KL là bài toán tìm một ma trận biến đổi W thỏa mãn (1.1)
Mỗi cột
iN
i i
w
w
1
của W là vector cơ sở trực giao của không gian mới hay:
1 T
k
j w
w nếu j = k (1.3)
Trang 8Vì vậy mỗi phần tử yi của y sẽ được tính:
N iN i
i
T i
y 1 1 2 2 (1.4)
Do wi là các vector cơ sở trực giao theo (1.3) nên W là ma trận trực chuẩn thỏa mãn:
W T W = I = WW T (I là ma trận đơn vị) (1.5)
Từ đó: W T = W -1 và ta có dạng biến đổi ngược của (1.1):
x = Wy (1.6) Đặt C y là ma trận đường chéo mong muốn của vector biến ngẫu nhiên y:
C y =
N
0
1
Trong đó các phần tử đường chéo là các phương sai của dữ liệu được biến đổi
Ma trận đường chéo này có thể tính toàn từ ma trận hiệp tương quan gốc như sau:
C y = T
yy
E = T T T
x W x W
E = EW T xx T W = W T C x W
Hay WC y= C x W (1.7)
Cy là ma trận đường chéo nên biểu thức (1.7) được đưa về sạng
C x w i = i w i (1.8)
Từ (1.8) ta thấy λi và wi là cặp giá trị riêng và vector riêng của ma trận tương quan C x trong biểu thức (1.2) Hay các cột wi của ma trận W là các vector riêng của ma trận C x
Để đảm bảo W là trực chuẩn cần áp dụng trực giao và chuẩn hóa Gram-Schmidt với
các vector riêng tìm được
Như vậy, phép biến đổi KL chính là tìm các vector riêng wi ứng với M giá trị riêng lớn nhất của ma trận hiệp tương quan của các vector ngẫu nhiên quan sát được Phép biển đổi KL là cách tối ưu nhằm giảm thứ nguyên từ không gian dữ liệu có số chiều lớn
Trang 9thành không gian mới có số chiều bé hơn rất nhiều với sai số là bé nhất nằm ở các vector riêng ứng với các giá trị riêng nhỏ nhất
2 Ứng dụng của phép biến đổi KL
Hình 2.1 biểu diễn một ảnh đa mức xám kích thước 512 x 512 với giá trị mức xám của mỗi điểm ảnh được biểu diễn bằng 8 bit (giá trị trong [0 – 255]) Giá trị mức xám của các điểm ảnh kề nhau có xu hướng tương tự nhau Hình 2.2 minh họa giá trị mức xám của các cặp điểm ảnh liền kề
Hình 2.1 Ảnh đa mức xám kích thước 512 x 512 Trong hình 2.2, mỗi chấm biểu diễn một điểm ảnh trong bức ảnh hình 2.1 với hoành độ x là giá trị của điểm ảnh đó và tung độ y là giá trị của điểm ảnh liền kề bên phải nó.Từ đồ thị, ta thấy quan hệ x = y thể hiện độ tương quan mạnh giữa các điểm ảnh liền kề Chia bức ảnh thành các khối 1x2 rời nhau như hình 2.3, chúng ta biểu diễn
Trang 10một bức ảnh thành tập các vector 2 chiều xi Phân bố giá trị mức xám của mỗi thành phần được vẽ như hình 2.4 Chúng ta thấy rằng phân bố mức xám của mỗi thành phần tương đối rộng và phủ hầu hết dải 0 – 255 Hơn nữa, hai phân bố này khá giống với phân bố chung của mỗi điểm ảnh trong bức ảnh hình 2.1
Hình 2.2 Đồ thị biểu diễn các cặp giá trị mức xám của các điểm ảnh
Trang 11Hình 2.3 Chia bức ảnh ban đầu thành các khối điểm ảnh 1 x 2
Trang 12Hình 2.4 Phân bố giá trị mức xám của mỗi thành phần trong các khối
Bây giờ, chúng ta quay phân bố trong hình 2.2 đi một góc 45o Kết quả trong hình 2.5 cho thấy, hai thành phần mới không tương quan nghĩa là biết giá trị của thành phần thứ nhất sẽ không giúp ta xác định được giá trị của thành phần thứ hai Phân bố của hai thành phần mới được vẽ như hình 2.6 Thành phần thứ nhất vẫn khá giống với phân bố trước, tức là phân bố rộng, trải hầu hết khoảng giá trị Tuy nhiên thành phần thứ hai thì khác, nó hẹp hơn rất nhiều và giá trị đỉnh tại 0 Do nó có khoảng biến đổi nhỏ hơn nhiều nên chúng ta cần ít số bit để mã hóa giá trị của nó Vì vậy, chúng ta có thể giảm
số bit cần thiết để mã hóa một một ảnh khi giải tương quan
Hình 2.5 Đồ thị các cặp mức xám khi quay 45o
Trang 13Hình 2.6 Phân bố mức xám của hai thành phần khi xoay tương ứng với hình 2.5 Hầu hết các bức ảnh đều chứa sự tương quan ngẫu nhiên về dữ liệu do đó dẫn đến
sự dư thừa dữ liệu Phép biến đổi KL loại bỏ được sự dư thừa dữ liệu nhờ việc giải tương quan dữ liệu và giảm số chiều vì vậy ảnh có thể được lưu trữ hiệu quả hơn Đó
là ứng dụng của phép biển đổi KL
Trang 14III PHÂN TÍCH THÀNH CÁC THÀNH PHẦN CHÍNH PCA TRONG
TRÍCH CHỌN ĐẶC TRƯNG KHUÔN MẶT
1 Phép biến đổi PCA
Tương tự như phép biến đổi KL, ta có không gian dữ liệu quan sát S = {x} gồm n
vector dữ liệu mẫu N chiều Dữ liệu thô tồn tại sự tương quan ngẫu nhiên giữa các thành phần do đó có sự dư thừa dữ liệu Ý tưởng của phép biến đổi PCA là phân tích
dữ liệu thành các thành phần không tương quan (gọi là các thành phần chính) để giảm
độ dư thừa dữ liệu
Phép biến đổi PCA được định nghĩa như sau:u Tx (2.1)
Trong đó x = [ x 1 x 2 … x N ] T , u = [ u 1 u 2 … u N ] T – các thành phần thứ i và j không tương quan trong không gian mới
Và ma trận Ψ là ma trận phép biến đổi với kích thước N2 có dạng:
NN N
N T
i T
v
1
1 11
(2.2)
Ở đó v i là các vector riêng tương ứng với ma trận hiệp phương sai của các x quan sát được
x x
E
Trong đó
N
1
n
k ik
1
2 Phân tích thành chính PCA trong trích chọn đặc trưng khuôn mặt
2.1 Tính toán các vector riêng
Giả sử chúng ta một tập luyện gồm M bức ảnh khuôn mặt I 1 , I 2 …I M Các bức ảnh này có cùng kích thước và đã được chỉnh tâm
Trang 15Chúng ta biểu diễn mỗi bức ảnh I i kích thước NxN bằng một vector có kích thước N2 chiều
Bước 1: Tính vector trung bình
Trang 16Bước 2: Tính i i với i = 1, 2…N2
Bước 3: Tính ma trân hiệp phương sai C của các vector quan sát:
T M
i
T i
M
1
1
(ma trận C có kích thước N2xN2) (2.4)
Trong đó A12 M (kích thước N2xM)
Bước 4: Tìm các vector riêng u i của ma trận hiệp phương sai C hay của AA T
Tuy nhiên kích thước của ma trận này là N2xN2 quá lớn nên việc tìm vector riêng của ma trận này là không khả thi
Chúng ta xem xét ma trận ATA có kích thước MxM
Tìm các vector riêng v i của ma trận A T A, ta có:
i i i
T
v Av
A (2.5)
Quan hệ giữa u i và v i :
i i i i
i i
T i
i i T
Av CAv
Av Av
AA v
Av
Từ đó suy ra u i = Av i
Vì vậy, AA T
và A T A có cùng các giá trị riêng và các vector riêng của chúng quan hệ với nhau theo u i = Av i
Chú ý: - A T A có thể có M giá trị riêng và vector riêng
- AA T có thể có N2 giá trị riêng và vector riêng
- M giá trị riêng của A T A cùng với các vector riêng tương ứng với M giá trị riêng lớn nhất của AA T
Trang 17Sau đó tính M vector riêng ứng với M giá trị riêng lớn nhất của AAT: u i = Av i đồng
thời chuẩn hóa vector u i sao cho u i 1
Bước 5: Chọn K vector riêng ứng với K giá trị riêng lớn nhất
2.2 Biểu diễn khuôn mặt theo cơ sở tìm được
Mỗi vector biểu diễn khuôn mặt (trừ đi vector trung bình) i trong tập luyện có thể được biểu diễn bằng một tổ hợp tuyến tính của K giá trị riêng tính ở trên
j
j j
i mean w u
1
ˆ
i=1,2…M
T j
j u
w chính là thành phần chính thứ j trong không gian mới
Và u j gọi là các ảnh riêng
Mỗi ảnh được chuẩn hóa trong tập luyện sẽ được biểu diễn trong cở sở này bởi vector:
i K
i i
i
w
w w
2 1
trong đó i = 1, 2… M
Trang 18IV KẾT LUẬN
Như vậy, em đã trình bày về các đặc trưng sinh trắc ảnh khuôn mặt, gồm các đặc trưng hình học và các đặc trưng về diện mạo khuôn mặt, cùng với đó là lý thuyết và ứng dụng của phép biến đổi KL và phân tích thành các thành phần chính PCA trong trích chọn đặc trưng khuôn mặt
Phép biến đổi KL ứng dụng trong bài toán giảm số chiều của không gian dữ liệu số lớn thành không gian có số chiều nhỏ hơn nhằm giảm giá tính toán và tăng hiệu quả của các kỹ thuật trong xử lý ảnh Trong khi PCA giải tương tương quan dữ liệu và phân tích thành các thành phần chính ứng dụng trong trích chọn đặc trưng khuôn mặt
Trang 19TÀI LIỆU THAM KHẢO
[1] Bài giảng môn Xử lý ảnh – PGS.TS Nguyễn Hoàng Lan – Đại học Bách Khoa
Hà Nội, 2010
[2] Digital Image Processing – William K Pratt- Wiley, 2007
[3] Fundamental of Image Processing – Ian T Young et al., 1998
[4] Principal Component Analysis – I.T.Jolliffe – Springer, 2002
[5] R.D Dony “Karhunen-Lòeve Transform” - The Transform and Data Compression Handbook, 2001