1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nhận dạng khuôn mặt người và ứng dụng trong quản lý nhân sự

49 182 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 49
Dung lượng 1,72 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Luận văn đã cho thấy việc sử dụng Viola Jone Face detection, Weber local descriptor, PCA và SVM trong việc nhận dạng khuôn mặt người. Kết quả đã cho thấy độ chính xác nhận dạng tương đối cao. Luận văn đã cho thấy việc sử dụng Viola Jone Face detection, Weber local descriptor, PCA và SVM trong việc nhận dạng khuôn mặt người. Kết quả đã cho thấy độ chính xác nhận dạng tương đối cao.

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

NGUYỄN THỊ THUỶ

PHƯƠNG PHÁP NHẬN DẠNG KHUÔN MẶT NGƯỜI

VÀ ỨNG DỤNG TRONG QUẢN LÝ NHÂN SỰ

Ngành: Khoa học máy tính Chuyên Ngành: Khoa học máy tính

Mã Số: 8480101.01

LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC:

Ts Nguyễn Văn Vinh

HÀ NỘI-NĂM 2018

Trang 2

LỜI CAM ĐOAN

Luận văn thạc sĩ đề tài “Nhận dạng khuôn mặt người và ứng dụng trong quản ly nhân sự” là công trình cá nhân tôi Các nội dung nghiên cứu và kết quả trình bày trong luân văn này là trung thực và rõ ràng Các tài liệu tham khảo được trích dẫn đầy đủ và ghi rõ nguồn gốc.

Tác giả luận văn ky và ghi rõ họ tên

MỤC LỤC

Trang 3

DANH MỤC HÌNH VẼ, ĐỒ THỊ

DANH MỤC CÁC TỪ VIẾT TẮT

PCA Principal Component Analysis

Trang 4

SVM Support Vector Machine

WLD Weber Local Description

CNN Convolutional Neural Network

Trang 5

PHẦN MỞ ĐẦU

1. Lý do chọn đề tài

Nhận dạng khuôn mặt là một trong những lĩnh vực mới của xử ly ảnh Vàngày nay nhận dạng được sử dụng rộng rãi trong nhiều lĩnh vực của đời sốngnhư nhận dạng trong lĩnh vực thương mại, hay phát hiện trong lĩnh vực an ninh,hay trong xử ly video, hình ảnh Một trong những ứng dụng tiểu biểu nhận dạngđang sử dụng phổ biến hiện này trong nhận dạng khuôn mặt người là ứng dụngtrong điện thoại di động cụ thể như IphoneX và Sangsung đang sử dụng

Hiện nay có rất nhiều các Phương pháp nhận dạng khác nhau được xâydựng để nhận dạng một người cụ thể trong thế giới thực ta có thể nói tới một sốphương pháp như: học máy và học sâu.Tuy nhiên hai phương pháp này lại cónhược điểm lớn là phải xây dựng một tập cơ sở dữ liệu lớn và đồng thời việc xử

ly dữ liệu lớn đòi hỏi phải nhanh và chính xác Vậy nên hai phương pháp trên sẽmất thời gian để nhận dạng nhiệm vụ đặt ra là nghiên cứu và xây dựng mộtchương trình sử dụng Phương pháp nhận dạng có độ chính xác cao mà khốilượng và thời gian tính toán lại ít

Để giải quyết vấn đề trên tôi xin đề xuất ra phương pháp phát hiện khuônmặt sử dụng phương pháp Viola jone face detection, trích chọn đặc trưng sửdụng phương pháp Weber local Descriptor và kết hợp phân tích thành phầnchính sử dụng phương pháp PCA và học máy vestor (SVM) để nhận dạngkhuôn mặt

2. Mục đích nghiên cứu của luận văn, đối tượng, phạm vi nghiên cứu Mục đích của luận văn:

Nghiên cứu đề tài này nhằm mục đích tìm hiểu bài toán nhận dạng khuônmặt, từ đó xây dựng các hệ thống ứng dụng trong thực tiễn như: điểm danh,giám sát người ra vào, an ninh trong sân bay

Đối tượng và phạm vi áp dụng:

Trang 6

Đề tài tập trung tìm hiểu một số phương pháp nhận dạng khuôn mặt ngườiphổ biến hiện nay và đưa ra phương án nhận dạng cho bài toán nhận dạng khuônmặt người.

Để đặt được mục tiêu trên đề tài tập trung tìm hiểu các nội dung sau:

- Tìm hiểu phương pháp phát hiện khuôn mặt sử dụng phương pháp Viola JonesFace Detection

- Trích chọn đặc trưng sử dụng phương pháp Weber Local Description

- Phương pháp phân tích thành phần chính

- Phương pháp học máy vestor (SVM)

3. Nội dung luân văn

Luận văn này gồm 3 chương, cụ thể như sau:

Chương 1: BÀI TOÁN NHẬN ĐỐI TƯỢNG NHẬN DẠNG KHUÔN MẶT

Giới thiệu các cách thức nhận dạng khuôn mặt người, vì sao nên nhậndạng người bằng khuôn mặt, tầm quan trọng của bài toán trong thực tiễn, một sốứng dụng thực tiễn của bài toán nhận dạng khuôn mặt

Chương 2: CÁC KỸ THUẬT CHO NHẬN DẠNG KHUÔN MẶT

Giới thiệu về 4 phương pháp sử dụng nhận dạng khuôn mặt được sử dụngtrong luận văn là phương pháp phát hiện khuôn mặt( Viola Jone Face Detection),phương pháp trích chọn đặc trưng (WLD), phân tích thành phần chính (PCA) vàmáy vector hỗ trợ (SVM)

Chương 3: ỨNG DỤNG CÁC KỸ THUẬT TRONG NHẬN DẠNG KHUÔN MẶT

Đưa ra mô hình xây dựng bài toán nhận dạng khuôn mặt người, các bướcthực hiện và đánh giá thử nghiệm

CHƯƠNG 1: BÀI TOÁN NHẬN ĐỐI TƯỢNG NHẬN DẠNG

KHUÔN MẶT

1.1 Tổng quan và các khái niệm liên quan đến nhận dạng khuôn mặt

1.1.1 Hệ thống sinh trắc học

Trang 7

Hệ thống sinh trắc học là một hệ thống được thiết kế để xác minh và nhậndạng một người dựa vào những đặc trưng sinh học duy nhất của người đó.

1.1.2 Hệ thống nhận dạng khuôn mặt

Hệ thống nhận dạng khuôn mặt là một hệ thống được thiết kế để tìmthông tin của một người Kĩ thuật nhận dạng là kiểm tra sự phù hợp dựa trênphép so sánh một-nhiều cụ thể là tìm ra một người là ai trong số những người đãđược lưu trữ trong hệ thống dựa vào thông tin khuôn mặt

1.1.3 Hệ thống xác minh hay xác thực khuôn mặt là gì

Hệ thống xác minh/xác thực khuôn mặt là một hệ thống được thiết kế đểxác minh thông tin của một người Kĩ thuật xác minh là kiểm tra sự phù hợp trênphép so sánh một-một cụ thể là đối chiếu thông tin mới nhận về một người vớithông tin đã lưu trữ về người này có khớp hay không dựa trên thông tin khuônmặt

Hình 0.1 So sách tác vụ nhận dạng khuôn mặt và xác minh khuôn mặt

1.1.4 Những thách thức trong bài toán nhận dạng khuôn mặt

Những biến đổi quá lớn giữa các ảnh khuôn mặt khác nhau từ một ngườicần nhận dạng gồm trạng thái cảm xúc trên khuôn mặt, ánh sáng, và các thay đổi

vị trí của khuôn Giới hạn về số ảnh cần thiết cho việc nhận dạng, tập học không

Trang 8

thể bao quát được tất cả các biến đổi có thể có trên khuôn mặt của một ngườicần nhận dạng trong thế giới thực.

1.2 Tổng quan về các ứng dụng tương tác người máy liên quan tới khuôn mặt

Từ những năm 1990 trở lại đây, chúng ta đã chứng kiến sự phát triển như

vũ bão của các ngành công nghiệp, đặc biệc là ngành công nghiệp chế tạo điệntử.Tuy nhiên hiện nay các thiết bị điện tử cao cấp như máy ảnh số, camera kĩthuậtsố,vànhiều sản phẩm khác dường như chỉ phù hợp cho các phòng thínghiệm, các công ty sản xuất kinh doanh, thương mại, tài chính, ngân hàng, Trong thời gian không xa từ 3 đến 10 năm nữa, chi phí cho các thiết bị này sẽgiảm đáng kể Khi đó sẽ mở ra nhiều hướng nghiên cứu về thị giác máy tính,đồng thời sẽ có nhiều ứng dụng trong giao tiếp giữa người với máy tính màtrong đó hệ thống nhận dạng mặt người đóng một vai trò không nhỏ Dưới đâychúng tôi liệt kê một số ứng dụng

• Các ứng dụng chuyên biệt trong ngành hàng không

• Ứng dụng sử dụng trong nhà thông minh,…

1.3 Hướng tiếp cận chính trong lĩnh vực nhận dạng khuôn mặt

1.3.1 Các công trình nghiên cứu về Phương pháp nhận dạng và kiểm chứng chất

lượng cho một hệ thống nhận dạng khuôn mặt

Bài toán nhận dạng khuôn mặt cần xác định hai vấn đề chính: dùng thôngtin nào để nhận dạng: chân mày, cặp mắt, mũi, môi, tai, hay kết hợp các thôngtin trên.Và dùng phương pháp nào để huấn luyện cho máy nhận dạng dùngnguồn thông tin đó Nhận dạng khuôn mặt trên máy tính đã trãi qua nhiều bướcthăng trầm với các kết quả như sau:

 Wenyi Zhao, Arvindh Krishnaswamy, Rama Chellappa, Danie L.Swets,ohn Weng (1998)[1] sử dụng phương pháp PCA (phân tích thành phầnchính) kết hợp LDA (phân tích độc lập tuyến tính) Bước 1, chiếu ảnhkhuôn mặt từ không gian ảnh thô sang không gian các không gian khuônmặt (Mỗi lớp khuôn mặt được nhận dạng sẽ được mô hình hóa bằng mộtkhông gian khuôn mặt) dùng PCA Bước 2, sử dụng phương pháp LDA

để tạo bộ phân loại tuyến tính có khả năng phân lớp các lớp khuôn mặt

Trang 9

 Emmanuel Viennet và Francoise Fogelman Soulie (1998),[3] sử dụngphương pháp mạng neural nhân tạo để xử ly và nhận dạng khuôn mặt

 Antonio J.Colmenarez và Thomas S.Huang (1998),[4] sử dụng kỹ thuậthọc thị giác và phù hợp mẫu 2-D Ông quan niệm bài toán dò tìm khuônmặt là thao tác phân loại khuôn mặt trong đó khuôn mặt thuộc về mộtlớp và các đối tượng khác thuộc về lớp còn lại bằng cách ước lượng môhình xác suất cho mỗi lớp, và việc dò tìm sử dụng luật quyết địnhMaximum-likelihood

 Kazunori Okada, Johannes Steffens, Thomas Maurer, Hai Hong, EgorElagin, Hartmut Neven, and Christoph (1998),[5] nhận dạng khuôn mặtdựa vào sóng Gabor và phương pháp phù hợp đồ thị bó Với y tưởngdùng đồ thị để biểu diễn khuôn mặt, ảnh khuôn mặt được đánh dấu tạicác vị trí đã được xác định trước trên khuôn mặt, gọi các vị trí này chính

là các vị trí chuẩn Khi thực hiện thao tác so khớp đồ thị với một ảnh,các điểm chuẩn (Jets) sẽ trích ra từ ảnh và so sánh các điểm chuẩn nàyvới tất cả các điểm chuẩn tương ứng trong các đồ thị khác nhau, và đồthị nào phù hợp nhất với ảnh sẽ được chọn

 Baback Moghaddam và Alex Pentland (1998) [6], đưa ra phương phápphù hợp thị giác trực tiếp từ các ảnh cần sử dụng cho mục đích nhậndạng khuôn mặt và dùng độ đo xác suất để tính độ tương tự

 Massimo Tistaelli và Enrico Grosso (1998) [7], đưa ra kỹ thuật thị giácđộng Vì khả năng quan sát các chuyển động của khuôn mặt và xử ly cáctính huống theo dự định là thông tin rất quan trọng, từ đó nhận được môtả đầy đủ hơn về khuôn mặt cho m1ục đích thu thập mẫu và nhận dạng

 Jeffrey Huang, Chengjun Liu, và Harry Wechsler (1998)[8], đề xuấtthuật toán căn cứ trên tính tiến hóa (Evolutionary computation) và ditruyền (Genetic) cho các tác vụ nhận dạng khuôn mặt Đối với cách tiếpcận này, hai mắt sẽ được dò tìm trước tiên và thông tin này được xem làvết để quan sát khuôn mặt, trình xử ly dò tiếp mắt bằng cách sử dụng

Trang 10

một thuật toán lai để kết hợp thao tác học và tiến hóa trong quá trìnhhọc

 Daniel Bgraham và Nigel M Allinson (1998)[9], sử dụng phương phápđược gọi là tạo bản sao không gian đặc trưng để biểu diễn và nhận dạnghướng di chuyển của khuôn mặt

 Oi Bin Sun, Chian Prong Lam và Jian Kang Wu (1998)[10], sử dụngphương pháp tìm vùng hai chân mày, hai mắt, mũi, miệng và cằm Ảnhkhuôn mặt thẳng ban đầu được chiếu theo chiều ngang để tìm các giá trịđiểm ảnh thỏa ngưỡng cho trước, đồ thị biểu diễn theo trục ngang sẽđịnh vị vị trí biên trên và biên dưới của hình chữ nhật bao các đặc trưngcục bộ khuôn mặt Tương tự với chiều đứng để tìm ra đường biên bêntrái và phải cho các vùng đặc trưng

 Ara V.Nefian và Monson H.Hayes III (1998)[12] trình bày hướng tiếpcận theo mô hình mô hình Markov ẩn (HMM) trong đó ảnh mẫu khuônmặt được lượng hóa thành chuỗi quan sát trên khuôn mặt theo quanniệm dựa trên thứ tự xuất hiện các đặc trưng khuôn mặt {hai chân mày,hai lông mi, mũi, miệng, cằm} Trong chuỗi quan sát đó, mỗi quan sátlại là một vector nhiều chiều và mỗi vector quan sát này được sử dụng

để đặc trưng cho mỗi trạng thái trong chuỗi trạng trạng thái của HMM.Mỗi người được ước lượng bằng một mô hình của HMM

 Guodong Guo, stan Z.LI, Kap luk chan(17 january 2001), dùng phươngpháp SVM để nhận dạng khuôn mặt Sử dụng chiến lược kết hợp nhiều

bộ phận loại nhị phân để xây dựng bộ phân loại SVM đa lớp

1.3.2 Hướng tiếp cận của luận văn

Trong đề tài này chúng tôi sử dụng phương pháp Phát hiện khuôn mặt sửdụng phương pháp Viola Jone Face Detection, Trích chọn đặc trưng sử dụngphương pháp Weber Local Descripor, phân tích thành phần chính và phươngpháp phân lớp SVM để nhận dạng

Sơ đồ hệ thống nhận dạng khuôn mặt được minh họa trong hình sau:

Trang 11

Hình 0.2 Mô hình nhận dạng khuôn mặt người

Trang 12

CHƯƠNG 2: CÁC KỸ THUẬT CHO NHẬN DẠNG KHUÔN MẶT

I. Học máy

1.1. Phương pháp Deep Learning (CNN)

CNN là một trong những mô hình deep learning tiên tiến giúp xây dựng

hệ thống thông minh với độ chính xác cao trong xử ly ảnh CNN được sử dụngnhiều trong các bài toán nhận dạng object trong ảnh Tuy nhiên phương phápnày lại có nhược điểm lớn là phải xây dựng một tập cơ sở dữ liệu lớn (mỗi tập

dữ liệu huấn luyện phải sử dụng ít nhất 1000 nhãn mới mang lại hiệu quả cao)

và đồng thời việc xử ly dữ liệu lớn đòi hỏi phải nhanh và chính xác

Mạng CNN là là một tập hợp các lớp Convolution chồng lên nhau và sửdụng các hàm nonlinear activation như ReLU và tanh để kích hoạt các trọng sốtrong các node Mỗi một lớp sau khi thông qua các hàm kích hoạt sẽ tạo ra cácthông tin trừu tượng hơn cho các lớp tiếp theo Mỗi một lớp sau khi thông quacác hàm kích hoạt sẽ tạo ra các thông tin trừu tượng hơn cho các lớp tiếp theo.Trong mô hình mạng truyền ngược (feedforward neural network) thì mỗi neuralđầu vào (input node) cho mỗi neural đầu ra trong các lớp tiếp theo Mô hình nàygọi là mạng kết nối đầy đủ (fully connected layer) hay mạng toàn vẹn (affinelayer) Còn trong mô hình CNNs thì ngược lại Các layer liên kết được với nhauthông qua cơ chế convolution Layer tiếp theo là kết quả convolution từ layertrước đó, nhờ vậy mà ta có được các kết nối cục bộ Như vậy mỗi neuron ở lớp

kế tiếp sinh ra từ kết quả của filter áp đặt lên một vùng ảnh cục bộ của neurontrước đó

1.2. Phương pháp truyền thống

PCA và SVM: Phương pháp PCA giảm bớt số thành phần không cần thiếttạo ra hiệu quả tính toán nhanh mà vẫn đảm bảo được độ chính xác Sau khiPCA đưa ra được các đặc trưng tốt sẽ dùng SVM để phân lớp và nhận khuônmặt

II. Các kỹ thuật sử dụng trong nhận dạng khuôn mặt

2.1. Phát hiện khuôn mặt (Viola Jone Face detection)

Trang 13

- Haar features: y tưởng : độ sáng tối của các vùng trên gương mặt là khácnhau Ví dụ: vùng mắt tối hơn vùng má, vùng mũi sáng hơn vùng hai bên

- Kết quả của mỗi đặc trưng được tính bằng hiệu của tổng các pixel trongmiền ô trắng trừ đi tổng các pixel trong miền ô đen

Hình 0.3 Haar Features sử dụng trong Viola Jones (Nguồn: bài báo Viola Jone face detection)

Hình 0.4 Applying on a give image (Nguồn: bài báo Viola Jone face detection)

Thuật toán viola jones sử dụng cửa sổ 24x24 để đánh giá các đặc trưngcủa ảnh Nếu xem xét tất cả các tham số của các đặc trưng, ta tính được khoảng160.000+ đặc trưng cho mỗi cửa sổ

Trang 14

Hình 0.5 Ví dụng về các haar features (Nguồn: Bài báo Viola Jone face detection)

- Integral Image: giá trị ở pixel (x, y) là tổng của các pixel ở trên và bêntrái (x,y) Cho phép tính tổng của các pixel trong bất kì hình chữ nhật chỉ với 4giá trị ở 4 góc

Hình 0.6 Ví dụ ảnh Integral

Trang 15

Hình 0.7 Ảnh Ví dụ tính 1 ô pixcel

Trong các pixels: D=1 + 4 – (2+3) = A + (A + B +C + D)- (A+C + B) = D

- Có rất nhiều đặc trưng được lấy ra từ 1 cửa sổ nhưng chỉ có 1 số ít là hữudụng trong việc nhận diện khuôn mặt

- Sử dụng thuật toán adaboost để tìm những đặc trưng tốt nhất Sau đó cácđặc trưng này được gán cho các trọng số để tạo nên hàm đánh giá quyết địnhxem một cửa sổ có là khuôn mặt hay không Mỗi đặc trưng chọn nếu chúng ítnhất thể hiện tốt hơn đoán ngẫu nhiên (phát hiện nhiều hơn một nửa)

- Các đặc trưng được gọi là các bộ phân lớp yếu Chúng được tổ hợp tuyếntính để tạo ra một bộ phân lớp mạnh

F(x) = (x) +(x) +(x)

Strong clasifier Weak classifier

- Mặc dù một ảnh có thể chứa một hoặc nhiều khuôn mặt nhưng số lượng

vật không phải khuôn mặt vẫn lớn hơn rất nhiều => thuật toán nên tập trung vàoviệc bỏ những vật không phải khuôn mặt một cách nhanh chóng

- Một bộ phân lớp cascade (cascade classifier) được sử dụng tất cả các đặctrưng được nhóm vào vài stage Mỗi stage gồm một số các đặc trưng

- Mỗi stage được sử dụng để xác định một cửa số có phải là khuôn mặthay không

Trang 16

Hình 0.8 các bước loại khuôn mặt hay không

Hình 0.9 Kết quả Phát hiện khuôn mặt (Nguồn: bài báo Viola Jone Face Detection)

2.2. Trích chọn đặc trưng Weber local Descripor- WLD

Weber local Description (WLD): việc nhận thức của con người về một vậtmẫu không chỉ phụ thuộc vào sự thay đổi của một kích thích (âm thanh, ánhsáng…) mà còn phụ thuộc vào cường độ gốc của kích thích WLD gồm 2 thànhphần chính: differential excitation và gradient orientation của ảnh và xây dựnghistogram dựa trên thành phần đó

- Different excitations

Trang 17

 Sử dụng sự khác nhau về cường độ giữa pixel hiện tại và các hàngxóm để miêu tả sự thay đổi của pixel hiện tại => mô phỏng quátrình nhận dạng mẫucủa con người.

 Ic: cường độ của pixel hiện tại

 Ii: cường độ của pixel lân cận I = (0,1,…p-1) p: số pixel lân cận

 Sự khác nhau giữa thành phần tử tâm và lân cận

Trang 18

Hình 0.11 ảnh trên là ảnh gốc ảnh thứ 2 là gốc trích chọn đặc trưng (Nguồn WLD, tác giả Jie Chen, Member, IEEE, Shiguang Shan, Member, IEEE, Chu He, Guoying Zhao, Matti Pietikäinen, Senior Member, IEEE, Xilin Chen, Senior Member, IEEE, Wen Gao, Fellow,

IEEE)

- WLD histogram

 Phần 0, 5: biến đổi của tần số cao

 Phần 1, 4: biến đổi của tần số trung bình

 Phần 2, 3: biến đổi của tần số thấp

 Mỗi phần có những vài trò khác nhau trong từng nhiệm vụ phânlớp cần đánh giá trọng số cho từng phần

 Một cách phổ biến là tính tỉ lệ nhận dạng cho từng phần R={} = /

Trang 19

Hình 0.12 Minh họa về tính toán của WLD ( Nguồn WLD, tác giả Jie Chen, Member, IEEE, Shiguang Shan, Member, IEEE, Chu He, Guoying Zhao, Matti Pietikäinen, Senior Member,

IEEE, Xilin Chen, Senior Member, IEEE, Wen Gao, Fellow, IEEE)

2.3. Giới thiệu phương pháp phân tích thành phần chính PCA

2.3.1. Giới thiệu phương pháp PCA

Phương pháp trích chọn đặc trưng được phát minh năm 1901 bởi KarlPearson,và được phát triển một cách độc lập bởi Hotelling (1933) Hiện nay nóđược sử dụng như một công cụ để phân tích dữ liệu nghiên cứu và thực hiện các

mô hình dự đoán PCA còn bao gồm cả việc tính toán phân tích các giá trị đặctrưng của một ma trận tương quan dữ liệu hay phân tính các giá trị đơn của matrận dữ liệu thường sau khi tính trung bình dữ liệu của mỗi thuộc tính [11],[15].PCA là phương pháp đơn giản nhất phân tích đa biến dựa trên các vector đặctrưng Thông thường hoạt động của nó có thể được hiểu nhằm khám phá ra cấutrúc bên trong của dữ liệu Nếu một tập dữ liệu đa biến được xem xét như tậpcác tọa độ trong một không gian dữ liệu nhiều chiều (mỗi trục biểu diễn mộtbiến) thì phương pháp PCA cung cấp cho chúng ta một bức ảnh ít chiều, một cáibóng của vật thể khi quan sát từ chính những đặc trưng cơ bản nhất của vật thể

đó

Trang 20

Mục tiêu của phương pháp PCA là thực hiện giảm số chiều nhưng vẫnđảm bảo tối đa sự phân tán dữ liệu Có thể nói phương pháp trích chọn đặc trongtìm cách giữ lại những thành phần thống kê quan trọng nhất của tập dữ liệu banđầu

Giả sử ta cần giảm số chiều của dữ liệu từ N chiều xuống còn K (K<N)chiều nghĩa là ta cần tìm một ánh xạ từ không gian N chiều sang không gian Kchiều

Trong vấn đề đang xét của luận văn này, PCA là một thuật toán được sửdụng để tạo ra một ảnh mới từ ảnh ban đầu Ảnh mới này có kích thước nhỏ hơnrất nhiều so với ảnh đầu vào và vẫn mang những đặc trưng cơ bản nhất của ảnhcần nhận dạng Phương pháp PCA không cần quan tâm đến việc tìm ra các đặcđiểm cụ thể của thực thể cần nhận dạng và mối quan hệ giữa các đặc điểm đó.Tất cả các chi tiết của thực thể đều được thể hiện ở ảnh mới được tạo ra từ PCA

Bản chất của PCA là tìm ra một không gian mới theo hướng biến thiênmạnh nhất của một tập hợp các vector trong không gian cho trước Ở không gianmới, ta hi vọng rằng việc phân loại sẽ cho ta bộ dữ liệu tốt hơn so với bộ dữ liệutrong không gian ban đầu

Ví dụ: giả sử tập dữ liệu ban đầu được quan sát trong không gian ba chiềunhư hình bên trái Rõ ràng ba trục này (các trục có tên Databases, Data minning,Language trong hình 3) không biểu diễn được tốt nhất mức độ biến thiên của dữliệu Phương pháp PCA sẽ tìm hệ trục tọa độ mới (là hệ trục không có tên tronghình bên trái) để biểu diễn tốt nhất mức độ biến thiên của dữ liệu Sau khi tìmđược không gian mới, dữ liệu sẽ được chuyển sang không gian này để được biểudiễn như trong hình bên phải Rõ ràng hình bên phải chỉ cần hai trục tọa độnhưng biểu diễn tốt hơn độ biến thiên của dữ liệu so với hệ trục toạ độ chiều banđầu

Một ưu điểm của PCA là các trục toạ độ mới trong không gian luôn đảmbảo trực giao từng đôi một mặc dù trong không gian ban đầu các trục có thểkhông trục giao với nhau

Trang 21

Hình 0.13 Lụa chọn các trục toạ độ mới để biểu diễn dữ liệu

Xem tập mẫu gồm K vestors trong không gian M chiều [5], [17]:O= { , ,…,…} (2.1)

Giả sử cơ sở của không gian tập mẫu là:

= { ,, … } (2.2)

Ta có:

=,… = (2.3)Trong đó là thành phần thứ m của vestor Mỗi có thể viết dưới dạng:

= + + …+ (2.4)Như vậy mỗi phần tử của tập mẫu bây giờ như là một vestor trong hệ cơ

sở

Bằng cách sử dụng M vectors cơ sở ta có thể biểu diễn mỗi quan sát Điềunày cũng đúng khi ta chọn cơ sở gồm M-vectors trực giao được thể hiện trong2.2

Trong thực tế chúng ta không thể đưa tất cả các cơ sở M-chiều do nhiều ly

do khác nhau như M quá lớn hay có chứa một số thông tin không quan trọng Vìvậy chúng ta chuyển sang không gian có số chiều nhỏ hơn là N chiều Khi đótập mẫu là:

O = {, , …,,…} (2.5)

ở đây chúng ta quan tâm đến việc tìm một cơ sở trực giao ON)

Trang 22

Theo các kết quả nghiên cứu thông thường ta chọn K sao cho.

≥ nguong(e.g, 0.90or0.95) (2.17)

Với là các trị riêng của ma trận hiệp phương sai và

Trang 23

Tóm lại, phương pháp PCA ánh xạ một vector từ không gian M chiềuxuống không gian N chiều sẽ đi tìm các giá trị riêng và vector riêng của ma trậnhiệp phương sai C của tập mẫu và giữ lại N vector riêng tương ứng với N giá trịriêng lớn nhất làm cơ sở cho không gian N chiều này.

2.3.2. Đặc trưng PCA

Mục tiêu của phương pháp PCA là “giảm số chiều” của 1 tập vector saocho vẫn đảm bảo được “tối đa thông tin quan trọng nhất” phương pháp PCA sẽgiữ lại K thuộc tính “mới” từ M các thuộc tính ban đầu (K<M)

2.3.3. Phương pháp phân tích thành phần chính(PCA)

2.3.3.1. Vector riêng

Xét một toán tử tuyến tính f trong không gian Rn với các vector cơ sở :

Ei=[0…1…0]T ( với giá trị 1 nằm tại vị trí thứ i)Toán tử tuyến tính này sẽ được

biểu diễn bởi một ma trận vuông T kích thước nxn Một đại lượng vô hướng λ

được gọi là trị riêng của toán tử f, hay ma trận T, nếu tìm được một vector x,x≠0, sao cho

F(x)=λ(x) Hay T*x=λx

Vector x khi đó được gọi là vector riêng của f, hay T, ứng với trị riêng λ

Ma trận Tvới kích thước nxn trên đây sẽ có tối đa n trị riêng và n vector riêngtương ứng Một ma trận T khả nghịch đảo sẽ có đủ n trị riêng (kể cả trị riêngbội) và n vector riêng tương ứng

2.3.3.1. Kì vọng và ma trận hiệp phương sai.

Ma trận T (biểu diễn trong không gian Rn với các vector cơ sở ei nêu trên)

được gọi là chéo hóa được nếu tồn tại một cơ sở trong không gian Rn sao cho

ma trận T biểu diễn trong cơ sở đó có dạng chéo (các phần tử ngoài đường chéobằng 0).Ví dụ: Khảo sát trên không gian R5 với ma trận chéo 5×5

Giả sử C là ma trận các vector cơ sở mới được biểu diễn trong cơ sở {ei}

Ở đây, ma trận T được chuyển từ cơ sở {ei} sang cơ sở mới nên ma trận chuyểnđổi cơ sở từ {ei} sang C cũng là C Nếu T chéo hóa được tức là tồn tại ma trận C

2.3.3.2

Trang 24

khả nghịch (tức là C tạo được một cơ sở trong Rn) sao cho :Tc=CaTCNếu ta có C là một ma trận có các cột là các vestor cơ sở đã được chuẩn hóa củakhông gian Rn thì CT=C-1, khi đó ta có thể viết: Tc = CT TC.

- Phương sai: là trung bình cộng của bình phương khoảng cách từ mỗi điểmtới kỳ vọng Phương sai càng nhỏ thì các điểm dữ liệu

- Càng gần với kỳ vọng, tức các điểm dữ liệu càng giống nhau Phương saicàng lớn thì ta nói dữ liệu càng có tính phân tán

S= –X) =

- Kỳ vọng:

ẍ =

Ví dụ kì vọng và phương sai:

Hình 0.14 Ví dụ về kỳ vọng và phương sai a) Trong không gian 1 chiều b) Không gian 2 chiều

mà hai chiều không tương quan Trong trường hợp này, ma trận

hiệp phương sai là ma trận đường chéo với hai phần tử trên đường chéo

là σ1,σ2σ1,σ2, đây cũng chính là hai trị riêng của ma trận hiệp phương sai và làphương sai của mỗi chiều dữ liệu c) Dữ liệu trong không gian hai chiều cótương quan Theo mỗi chiều, ta có thể tính được kỳ vọng và phương sai Phươngsai càng lớn thì dữ liệu trong chiều đó càng phân tán Trong ví dụ này, dữ liệutheo chiều thứ hai phân tán nhiều hơn so so với chiều thứ nhất

2.3.4. Các bước thực hiện trích chọn đặc trưng PCA

Ngày đăng: 24/11/2019, 14:08

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[3] Baback Moghaddam and Alex Pentland (1998), Beyond Linear Eigenspaces:Bayesian Matching for Face Recognition, Face Recognition from Theory and Applications, MIT Media Laboratory, 20 Ames St. Cambridge, MA 02139, USA, pp. 230-243 Sách, tạp chí
Tiêu đề: Face Recognition fromTheory and Applications
Tác giả: Baback Moghaddam and Alex Pentland
Năm: 1998
[4] Jie Chen, Member, IEEE, Shiguang Shan, Member, IEEE, Chu He, Guoying Zhao, Matti Pietikọinen, Senior Member, IEEE, Xilin Chen, Senior Member, IEEE, Wen Gao, Fellow, IEEE, WLD: A Robust Local Image Descriptor [5] Alaa Eleyan and Hasan Demirel, PCA and LDA based Neural Networks forHuman Face Recognition, Eastern Mediterranean University, Northern Cyprus Sách, tạp chí
Tiêu đề: PCA and LDA based Neural Networks for"Human Face Recognition
[7] Daniel Bgraham và Nigel M Allinson (1998), Characterising Virtual Eigensignatures for General Purpose Face Recognition, Face Recognition from Theory and Applications, Image Engineering and Neural Computing Group, Department of Electrical Engineering and Electronics, University of Manchester Institute of Science and Technology. Manchester M60 1QD, UK, pp. 446-456 Sách, tạp chí
Tiêu đề: Face Recognitionfrom Theory and Applications, Image Engineering and Neural ComputingGroup
Tác giả: Daniel Bgraham và Nigel M Allinson
Năm: 1998
[8] Emmanuel Viennet and Francoise Fogelman Soulie (1998), Connectionists Methods for Human face Rrocessing, Face Recognition from Theory and Applications, University Paris 13, 93430 Villetaneuse, France, pp. 124- 156 Sách, tạp chí
Tiêu đề: Face Recognition from Theoryand Applications
Tác giả: Emmanuel Viennet and Francoise Fogelman Soulie
Năm: 1998
[9] Guodong Guo, Stan Z.Li, Kap Luk Chan (2001), Learning Similarity for Texture Image Retrieval, School of EEE, Nanyang, Technological University Nanyang Avenue, Singapore Sách, tạp chí
Tiêu đề: School of EEE
Tác giả: Guodong Guo, Stan Z.Li, Kap Luk Chan
Năm: 2001
[10] Bernd Heisele, Purdy Ho and Tomaso Poggio, Face Recognition with Support Vector Machines: Global versus Component-based Approach, Massachusetts Institute of Technology Center for Biological and Computational Learning Cambridge, MA 02142 Sách, tạp chí
Tiêu đề: Face Recognition withSupport Vector Machines: Global versus Component-based Approach
[11] H. Moon, P.J. Phillips, Computational and Performance aspects of PCAbased Face Recognition Algorithms, Perception, Vol. 30, 2001, pp.303-321 Sách, tạp chí
Tiêu đề: Perception
[12] Jeffrey Huang, Chengjun Liu, and Harry Wechsler, Eye Detection and Face Recognition Using Evolutionary Computation, Face Recognition from Theoryand Applications, Department of Computer Science, George Mason University, pp. 348-377 Sách, tạp chí
Tiêu đề: Face Recognition fromTheoryand Applications, Department of Computer Science
[13] Kazunori Okada, Johannes Steffens, Thomas Maurer, Hai Hong, Egor Elagin, Hartmut Neven, and Christoph (1998), Computer Science Department and Center for Neural Engineering, Face Recognition from Theory and Applications, University of Southrn California Los Angeles, USA, pp. 186-205 Sách, tạp chí
Tiêu đề: Face Recognition fromTheory and Applications
Tác giả: Kazunori Okada, Johannes Steffens, Thomas Maurer, Hai Hong, Egor Elagin, Hartmut Neven, and Christoph
Năm: 1998
[14] K. Jonsson, J. Matas, J. Kittler, Y.P. Li, Learning Support Vectors for Face Verification and Recognition, Proc. of the IEEE International Conference onAutomatic Face and Gesture Recognition, 26-30 March 2000, Grenoble, France, pp. 208-213 Sách, tạp chí
Tiêu đề: Proc. of the IEEE International ConferenceonAutomatic Face and Gesture Recognition
[15] M.A. Turk, A.P. Pentland, Face Recognition Using Eigenfaces, Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, Maui, Hawaii, USA, 3-6 June 1991, pp. 586-591 [16] M.Kirby and L.Sirovich, Application of the karhunen-loeve procedure for the characterization of human faces, IEEE Pattern Analysis and Machine Intelligence, vol.12, no. 1, 1990, pp.103-108 Sách, tạp chí
Tiêu đề: Proceedings of the IEEE Conference on Computer Vision and PatternRecognition", Maui, Hawaii, USA, 3-6 June 1991, pp. 586-591[16] M.Kirby and L.Sirovich, Application of the karhunen-loeve procedurefor the characterization of human faces, "IEEE Pattern Analysis andMachine Intelligence
[17] M. Turk, A. Pentland, Eigenfaces for Recognition, Journal of Cognitive Neurosicence, Vol. 3, No. 1, 1991, pp. 71 -86 Sách, tạp chí
Tiêu đề: Journal of CognitiveNeurosicence
[18] Rabia Jafri and Hamid R. Arabnia, A Survey of Face Recognition Techniques, Journal of Information Processing Systems, Vol.5, No.2, June 2009, pp. 44-68. [19] Setiawan Hadi, Iping Supriana Suwardi, and Farid Wazdi, Technology of Face Recognition for Security System, Mathematics Department. UNPAD, Jl. Dipati Ukur 35 Bandung Sách, tạp chí
Tiêu đề: Journal of Information Processing Systems", Vol.5, No.2, June2009, pp. 44-68. [19] Setiawan Hadi, Iping Supriana Suwardi, and FaridWazdi, "Technology of Face Recognition for Security System
[20] Steven W.Smith (1999), Chapter 27: Data compression, The Scientist and Engineer’s Guide to Digital Signal Processing, California Technical Publishing San Diego, California, pp. 481 -502 Sách, tạp chí
Tiêu đề: Chapter 27: Data compression
Tác giả: Steven W.Smith
Năm: 1999
[22] Wenyi Zhao, Arvindh Krishnaswamy, Rama Chellappa, Danie L.Swets, John Weng (1998), Discriminant Analysis of Principal Components for Face Recognition, Face Recognition from Theory and Applications, Centrer for Automation Research, University of Maryland, pp. 73-85 Sách, tạp chí
Tiêu đề: Face Recognition from Theory and Applications
Tác giả: Wenyi Zhao, Arvindh Krishnaswamy, Rama Chellappa, Danie L.Swets, John Weng
Năm: 1998

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w