Xuất phát từ t nh ứng dụng cao của phương pháp giảm chiều dữ liệu PCA và bài toán nhận dạng khuôn mặt nên tôi chọn đề tài: “Nghiên cứu thuật toán PCA ứng dụng trong nhận dạng khuôn mặt”.
Trang 1TRƯỜNG ĐẠI HỌC VINH
NGUYỄN THỊ LAM
LUẬN VĂN THẠC SỸ Chuyên ngành: Công nghệ thông tin
Trang 2LỜI CẢM ƠN
Trước tiên, tôi xin bày tỏ lòng biết ơn chân thành nhất tới TS Trần Xuân Sang đã tận tình hướng dẫn, ch bảo trong suốt suốt quá trình thực hiện đề tài Tôi xin k nh gửi lời cảm ơn sâu sắc tới quý Thầy Cô trong Viện kỹ thuật và công nghệ trường Đại học Vinh đã truyền đạt kiến thức quý báu cho em trong 2 năm vừa qua Xin gửi lời cảm ơn đến Ban giám hiệu trường THPT Qu nh Lưu 2
và các đ ng nghiệp đã tạo điều kiện thuận l i, đ ng viên tôi trong quá trình học tập và nghiên cứu
Tôi xin chân thành cảm ơn gia đình, bạn bè, các thành viên trong lớp Cao học K24 công nghệ thông tin đã luôn bên cạnh, giúp đỡ và đ ng viên tôi trong suốt thời qua
gh g h g
Tác giả luận văn
Nguyễn Th Lam
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này là công trình học tập và nghiên cứu do tự bản thân thực hiện và là sản phẩm của riêng tôi Các số liệu và tài liệu trong luận văn là trung thực, các thông tin đƣ c sử dụng trong luận văn là có ngu n gốc và
Trang 4MỤC LỤC
LỜI CẢM ƠN 3
LỜI CAM ĐOAN 4
MỤC LỤC 5
DANH MỤC CÁC TỪ VIẾT TẮT 7
MỞ ĐẦU 8
1 Sự cần thiết của vấn đề nghiên cứu 8
2 Mục tiêu nghiên cứu 8
2.1 Mục tiêu tổng quát 8
2.2 Mục tiêu cụ thể 8
3 Đối tư ng và phạm vi nghiên cứu 9
3.1 Đối tư ng nghiên cứu 9
3.2 Phạm vi nghiên cứu 9
4 N i dung nghiên cứu 9
CHƯƠNG 1 TỔNG QUAN VỀ NHẬN DẠNG KHUÔN MẶT 10
1.1 Giới thiệu bài toán nhận dạng khuôn mặt 10
1.1.1 Nhận dạng khuôn mặt 10
1.1.2 Các ứng dụng của nhận dạng khuôn mặt 11
1.1.3 Các thách thức trong nhận dạng khuôn mặt 13
1.2 M t số thuật toán thường sử dụng trong nhận dạng khuôn mặt 14
1.2.1 Elastic Bunch Graph Matching 14
1.2.2 Linear Discriminate Analysis 16
1.2.3 Principal Component Analysis: 17
1.3 Tổng quan về tình hình nghiên cứu 18
Trang 51.3.1 Tình hình nghiên cứu trong nước 18
1.3.2 Tình hình nghiên cứu ngoài nước 19
CHƯƠNG 2 THUẬT TOÁN PCA VÀ ỨNG DỤNG TRONG NHẬN DẠNG KHUÔN MẶT 20
2.1 Thuật toán PCA 20
2.1.1 Giới thiệu 20
2.1.2 Thuật toán PCA 21
2.2 Nhận dạng khuôn mặt bằng thuật toán PCA 23
2.2.1 Chuẩn hóa dữ liệu 23
2.2.2 Tr ch chọn đặc trưng dùng PCA 24
2.2.3 Nhận dạng 26
2.2.4 V dụ bằng số 28
CHƯƠNG 3 THỬ NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ 34
3.1 Dữ liệu thử nghiệm 34
3.2.Các bước thực hiện 35
3.2.1 Chuẩn hóa dữ liệu 35
3.2.2 Tr ch chọn đặc trưng 35
3.2.3 Thực hiện nhận dạng 39
3.3 Đánh giá kết quả 40
KẾT LUẬN 41
TÀI LIỆU THAM KHẢO 42
Trang 6DANH MỤC CÁC TỪ VIẾT TẮT
Trang 7PH N MỞ Đ U
1 Sự cần thiết của vấn đề nghiên cứu
Ngày nay, học máy không còn là khái niệm xa lạ, nó đã ngày càng trở nên phổ biến Học máy là m t nhánh của tr tuệ nhân tạo mà mục tiêu là cho ph p máy t nh học theo cách riêng, nó có thể nhanh chóng và tự đ ng tạo ra các mô hình với khả năng phân t ch dữ liệu lớn hơn, phức tạp hơn cũng như cung cấp các kết quả nhanh và ch nh xác, đưa ra những dự đoán có giá tr cao từ đó có thể có các quyết đ nh tốt hơn và các hành đ ng thông minh mà không cần sự can thiệp của con người M t trong những kỹ thuật quan trọng trong học máy ch nh là giảm chiều dữ liệu Dimensionality Reduction vì trên thực tế nếu ta làm việc trực tiếp trên dữ liệu có số chiều lớn s gặp rất nhiều khó khăn cả về lưu trữ và
t nh toán Do đó, việc giảm số chiều dữ liệu là m t bước quan trọng trong nhiều bài toán và PCA ch nh là m t phương pháp đơn giản đư c lựa chọn trong các thuật toán nhằm giảm chiều dữ liệu
Hiện nay, trên thế giới đã có những hệ thống cho ph p tự đ ng nhận dạng
đư c khuôn mặt để áp dụng trong các vấn đề về bảo mật thông tin, tìm kiếm đối
tư ng Xuất phát từ t nh ứng dụng cao của phương pháp giảm chiều dữ liệu PCA
và bài toán nhận dạng khuôn mặt nên tôi chọn đề tài: “Nghiên cứu thuật toán PCA ứng dụng trong nhận dạng khuôn mặt”
2 Mục tiêu nghiên cứu
2.1 Mục tiêu tổng quát
Nghiên cứu thuật toán PCA ứng dụng trong bài toán nhận dạng khuôn mặt
2.2 Mục tiêu cụ thể
Đề tài tập trung vào 3 mục tiêu ch nh sau:
i Nghiên cứu tổng quan về bài toán nhận dạng khuôn mặt
ii Nghiên cứu thuật toán PCA
Trang 8(iii) Ứng dụng thuật toán PCA vào nhận dạng khuôn mặt
3 Đối tượng và phạm vi nghiên cứu
3.1 Đối tượng nghiên cứu
a Nghiên cứu lý thuyết
- Nghiên cứu các tài liệu về bài toán nhận dạng khuôn mặt
- Nghiên cứu tài liệu về thuật toán PCA
b Nghiên cứu thực nghiệm
- Tìm hiểu b dữ liệu ảnh khuôn mặt
- Cài đặt thử nghiệm thuật toán PCA cho bài toán nhận dạng khuôn mặt
3.2 Phạm vi nghiên cứu
Luận văn tập trung nghiên cứu thuật toán PCA ứng dụng trong nhận dạng khuôn mặt
4 Nội dung nghiên cứu
- Nghiên cứu tổng quan về nhận dạng khuôn mặt
- Nghiên cứu phương pháptrích chọn đặc trưng PCA
- Cài đặt thử nghiệm thuật toán PCA cho bài toán nhận dạng khuôn mặt
Trang 9CHƯƠNG 1 TỔNG QUAN VỀ NHẬN DẠNG KHUÔN MẶT 1.1 Giới thiệu bài toán nhận dạng khuôn mặt
1.1.1 Nhận dạng khuôn mặt
Nhận dạng khuôn mặt là m t lĩnh vực nghiên cứu thú v đối với nhiều người Công nghệ nhận dạng khuôn mặt là m t ứng dụng mà máy t nh s tự đ ng xác đ nh hoặc nhận dạng m t người nào đó thông qua ảnh khuôn mặt hoặc khung hình video trong m t đoạn video
Bài toán nhận dạng khuôn mặt là m t trong những bài toán đư c con người quan tâm nhất hiện nay, nó đư c áp dụng mạnh m trong nhiều lĩnh vực khác nhau của đời sống xã h i, đặc biệt trong những lĩnh vực công nghệ cao đòi hỏi sự đảm bảo về an ninh, bảo mật m t cách chắc chắn và chuẩn xác Chính vì thế bài toán nhận dạng khuôn mặt cho đến nay vẫn luôn là bài toán nóng hổi và hấp dẫn, có sức hút lớn đối với con người trong lĩnh vực tr tuệ nhân tạo
Có nhiều phương pháp trong nhận dạng khuôn mặt đã tập trung vào việc phát hiện các t nh năng riêng biệt như mắt, miệng, mũi, cằm, đầu,… và xác đ nh
m t số kiểu khuôn mặt bằng v tr , k ch thước, cũng như mối quan hệ Kết quả nhận dạng của nhiều hệ thống cũng rất khác nhau, tùy thu c vào dữ liệu kiểm thử M t phương pháp rất nổi tiếng và đư c sử dụng phổ biến để nhận dạng khuôn mặt là eigen bao g m eigenvalue, eigenvector nhằm tìm ra không gian con, phương pháp này gọi là phân t ch thành phần ch nh (Principal Component Analysis đóng vai trò rất quan trọng trong lĩnh vực th giác máy t nh
Có hai phương pháp tiếp cận với nhận dạng khuôn mặt đó là: Nhận dạng dựa trên đặc trưng của các phần tử trên khuôn mặt (Feature Based Face Recognition , và nhận dạng dựa trên xét tổng thể toàn khuôn mặt (Appearance Based Face Recognition) Với bài toán nhận dạng khuôn mặt thường sử dụng m t số thuật toán thông dụng như: Phân t ch thành phần ch nh, phân t ch phân lớp tuyến t nh, phương pháp đ th đàn h i,…
Trang 10Các yếu tố thường làm ảnh hưởng tới kết quả nhận dạng là: ánh sáng, khoảng cách của đối tư ng so với camera, cảm xúc biểu cảm trên khuôn mặt, tư thế của đối tư ng, trang phục của đối tư ng,…
1.1.2 Các ứng dụng của nhận dạng khuôn mặt
Từ hơn m t thập k qua, vấn đề nhận dạng khuôn mặt luôn đư c quan tâm nghiên cứu, xây dựng các hệ thống, các chương trình nhận dạng nhằm ứng dụng trong đời sống hàng ngày với nhiều lĩnh vực khác nhau
Hãng Apple nhân d p k niệm 10 năm chiếc iPhone đầu tiên có mặt trên
th trường, công nghệ nhận dạng khuôn mặt - Face ID đã đư c t ch h p vào
IPhone X, với khả năng chiếu 20.000 điểm sáng lên gương mặt, và các điểm sáng này s đư c chụp lại bởi camera h ng ngoại để dựng lên mô hình gương mặt đó dưới dạng Vector nên đ bảo mật ở mức đ rất cao Theo Apple, xác suất m t người lạ mặt có thể mở khóa điện thoại của bạn ch vỏn vẹn 1 phần triệu[5]
Tại Trung Quốc du khách tới th trấn Wuzhen, s không phải mua v nhờ
hệ thống kiểm soát bằng công nghệ nhận diện khuôn mặt tại cổng và công nghệ
này còn đư c áp dụng cho việc thanh toán hóa đơn của khách hàng Tại Macao,
khách hàng muốn rút tiền mặt từ máy ATM s đư c yêu cầu nhìn thẳng vào camera trong 6 giây để phần mềm nhận dạng khuôn mặt kiểm tra và đối chiếu Cách thức này giúp tăng cường an ninh ngân hàng, đ ng thời ngăn chặn nạn rửa tiền tại đây[5]
Tại các sân bay của Mỹ, hệ thống nhận diện khuôn mặt đư c sử dụng để xác đ nh danh t nh tất cả những người sở hữu visa khi họ rời khỏi quốc gia nhằm tránh trường h p hành khách nhập cảnh bất h p pháp
Cuối tháng 8/2017, cảnh sát Đức đã lắp đặt camera áp dụng công nghệ nhận diện khuôn mặt tại sân bay Berlin để giúp phát hiện các đối tư ng nằm trong danh sách b theo dõi và tình nghi khủng bố Sân bay Changi của Singapore s áp dụng công nghệ này tại ga mới đư c khánh thành vào cuối tháng 10/2017 Australia cũng đang đầu tư mạnh cho công nghệ nhận dạng khuôn mặt tại tất cả sân bay quốc tế của nước này [5]
Ngoài những ứng dụng tiêu biểu ấy ta còn phải kể đến các ứng dụng rất gần gũi và thú v của nhận dạng mặt như: dùng để điểm danh học sinh, sinh viên
Trang 11tránh tình trạng bỏ tiết, bỏ học; phân t ch chuyển đ ng mắt và biểu hiện khuôn mặt để nhận biết tình trạng tập trung hay không của học sinh, sinh viên; dùng nhận dạng khuôn mặt để phát hiện các chứng bệnh lạ; Snapchat đảm bảo quyền riêng tư trong m i bức ảnh của người dùng, tự đ ng tag tên trên facebook, dùng
để bảo mật cho điện thoại thông minh như oppo f5,…
Trung tâm nghiên cứu và phát triển của FPT Telecom, đang ứng dụng công nghệ nhận diện khuôn mặttrong dự án Workforce Attendance để điểm danh, chấm công nhân viên tại các trung tâm, phòng ban của công ty Quá trình nhận diện khuôn mặt đư c thực hiện trên máy chủ của công ty, và phần mềm vẫn h
tr hoạt đ ng offline khi có sự cố về mạng Dữ liệu luôn đư c đ ng b tập trung
về máy chủ để lưu trữ và backup Dự án đang đư c triển khai sử dụng cho hơn
13 trung tâm và phòng ban với hơn 2000 nhân viên của FPT Telecom[4]
Ngoài những ứng dụng đã hoạt đ ng còn có các ứng dụng lớn đang đư c triển khai như:hệ thống nhận diện khuôn mặt do hãng NEC phát triển, là hệ thống
đư c đánh giás là sự kiện ứng dụng công nghệ nhận diện khuôn mặt quy mô lớn nhất từ trước tới nay phục vụ Olympic 2020 tại Tokyo nhằm s h tr cho công tác an ninh, giúp loại bỏ các vấn đề như giả mạo hoặc đánh cắp thẻ ra vào
Australia đang có kế hoạch dùng công nghệ nhận dạng khuôn mặt tại các sân bay đểthay thế cho h chiếu trong vòng 2 đến 3 năm tới, thẻ hành khách nhập
cư s đư c loại bỏ và các quầy thông tin có nhân viên s đư c thay thế bởi các khoang điện tử tự đ ng.Hay tại Dubai thiết kế đường hầm nhận diện khuôn mặt đầu tiên trên thế giới Sân bay quốc tế Dubai đưa ra phương pháp hoàn toàn mới
để kiểm tra hành khách bằng cách đi qua m t h cá ảo có gắn camera nhận diện khuôn mặt.Dự án đang đư c phát triển với sự c ng tác của hãng hàng không Emirates Các lối đi ảo này dự kiến s đư c lắp đặt lần đầu tiên tại nhà đón khách
số 3 vào mùa hè năm 2018,các trạm khác s đư c áp dụng công nghệ cho đến năm 2020[7]
Những ứng dụng của thuật toán nhận diện khuôn mặt trong tương lai kỹ thuật số là vô bờ bến Hiện nay, ngày càng nhiều người sử dụng các phần mềm nhận diện mặt để bảo mật cho điện thoại: ch khi nhận ra đó là khuôn mặt chủ nhân thì điện thoại mới mở khóa Nhiều văn phòng hiện đại cũng đã chuyển từ
Trang 12các loại thẻ đeo rườm rà sang việc nhận diện khuôn mặt để kiểm soát ra vào Cảnh sát thì có thể dựa vào các thuật toán này để tìm đúng nghi phạm b truy nã trong hàng trăm nghìn khuôn mặt xuất hiện trên các máy quay an ninh Trong thí nghiệm lớn Labeled Faces in the Wild LFW đư c thực hiện năm 2007, khi đó mới có 13.000 hình ảnh của 5.000 người Khi đó, t lệ nhận diện ch nh xác của hầu hết các thuật toán là trên 95% Những công ty tư nhân như Google đã thử nghiệm thuật toán của họ dựa vào kho dữ liệu 500 triệu bức ảnh của 10 triệu người.Và không ch Mỹ quyết liệt trong công nghệ này, thuật toán FaceN của công ty Nga N-TechLab không thua kém FaceNet là bao, dù b dữ liệu của họ
“ch ” là 18 triệu bức ảnh của 200.000 người Thuật toán SIAT MMLab của m t công ty Trung Quốc dưới quyền ch đạo của giáo sư Yu Qiao Kiều Vũ thu c Viện công nghệ tiên tiến Thâm Quyến cũng cho kết quả tốt [9]
Điểm qua những ứng dụng trên, chúng ta thấy rằng nhận dạng khuôn mặt có tác đ ng không hề nhỏ đối với các hoạt đ ng của đời sống con người,
giúp cho hoạt đ ng của con người trở lên tiện ch và hiệu quả hơn
1.1.3 Các thách thức trong nhận dạng khuôn mặt
Hiện nay, bên cạnh những ứng dụng hữu ch to lớn mà nhận dạng mặt mang lại thì trong bài toán này cũng còn t n tại m t số vấn đề mà các nhà nghiên cứu vẫn chưa tìm ra phương pháp tốt để giải quyết như:
- Ảnh có hướng thay đổi: đối với các ảnh có hướng thay đổi các ảnh >45
đ , không phải ch nh diện thì kết quả nhận dạng còn khá thấp[3]
- Ảnh có đ phân giải thấp: kết quả nghiên cứu về các ảnh có đ phân giải thấp như những ảnh thu đư c từ các camera giám sát còn chưa nhiều vì những ảnh này có chất lư ng k m, khó cho kết quả khả quan [3]
- Dữ liêu video: mặc dù hiện nay thông tin mặt người trong các dữ liệu video là rất nhiều nhưngphần lớn các phương pháp nhận dạng làm việc với ảnh tĩnh tr ch xuất từ dữ liệu video, có rất t phương pháp tốt tận dụng ưu thế của dữ liệu video
- Các hệ thống lớn: các cơ sở dữ liệu ảnh mặt đư c test bởi các nhà nghiên cứu còn khá nhỏ so với thực tế như cơ sở dữ liệu ảnh mặt của cảnh sát của m t nước có thể chứa từ hàng triệu tới hơn 1 t ảnh …[3]
Trang 13- Ảnh thay đổi theo thời gian: khả năng nhận dạng ảnh mặt thay đổi theo thời gian vẫn là m t vấn đề khó kể cả đối với khả năng nhận dạng của con người
- Ảnh thiếu ánh sáng: là m t trong những thách thức lớn nhất của nhận dạng mặt, chưa có phương pháp tốt cho các ảnh chụp ở điều kiện thiếu ánh sáng [3]
Với tốc đ phát triển mạnh m như hiện nay, chúng ta có thể tin tưởng rằng trong tương lai không xa những thách thức này của bài toán nhận dạng khuôn mặt s đư c giải quyết tốt
1.2 Một số thuật toán thường sử dụng trong nhận dạng khuôn mặt
1.2.1 Elastic Bunch Graph Matching
Thuật toán EBGM là m t phương pháp dựa trên t nh năng cho vấn đề nhận dạng khuôn mặt Các t nh năng trên khuôn mặt đư c sử dụng đư c gọi là điểm tin cậy Hình ảnh đư c biểu diễn bên trong bằng thuật toán sử dụng thông tin phổ của các vùng xung quanh các t nh năng này, thu đư c sau khi xoay các phần của hình ảnh với m t tập h p các g n sóng Gabor với k ch thước, hướng và pha khác nhau Các kết quả của sự liên kết cho m t v tr cụ thể gọi là Gabor Jet sau đó đư c thu thập cho tất cả các điểm Fiducial trên m t hình ảnh nhất đ nh và
đư c tổng h p cùng với các tọa đ t nh năng trong biểu đ khuôn mặt của hình ảnh đó Sau khi áp dụng quy trình này cho tất cả các hình ảnh trong tập huấn luyện, tất cả các biểu đ mặt kết quả đư c nối vào m t cấu trúc giống như ch ng gọi là biểu đ bó khuôn mặt Đây là mô hình của tất cả các cá nhân mà hệ thống
có thể xác đ nh Khả năng cục b hóa t nh năng tự đ ng là m t trong những ưu điểm ch nh của thuật toán EBGM Sau khi biểu đ khuôn mặt đã đư c xây dựng,
nó đư c so sánh với tất cả các thành viên của biểu đ bó khuôn mặt để xác đ nh kết quả phù h p nhất theo m t ch số tương tự đã cho [10] Các bước đư c tóm tắt như sau:
- Bước 1: Xây dựng biểu đ khuôn mặt
Xác đ nh thủ công các v tr nút điểm tin cậy trên khuôn mặt dễ dàng để cục bố hóa, chẳng hạn như các góc của mắt hoặc miệng, trung tâm của mắt, đầu
Trang 14của tiếng n, m t số điểm trên phác thảo, xác đ nh các cạnh giữa các nút, tạo thành biểu đ mặt đầu tiên
- Bước 2: Xây dựng biểu đ bó khuôn mặt
Nối tất cả các biểu đ khuôn mặt xây dựng đư c vào m t cấu trúc tạo thành biểu đ bó khuôn mặt
- Bước 3: Xây dựng thư viện mô hình biểu đ
Vì bây giờ chúng ta có m t biểu đ bó cung cấp đủ chất lư ng trong việc tìm kiếm các v tr nút trong m t khuôn mặt mới, chúng ta có thể xử lý hoàn toàn các hình ảnh còn lại m t cách tự đ ng
- Bước 4: Xây dựng đ th thăm dò
Giả sử đưa ra m t hình ảnh mới và s tìm thấy người đư c mô tả trong thư viện Đầu tiên chúng ta cần tạo m t biểu đ cho hình ảnh thăm dò Quá trình này hoạt đ ng ch nh xác như đối với các hình ảnh mô hình
- Bước 5: So sánh với tất cả các đ th mô hình
Đ th hình ảnh đư c so sánh với tất cả các đ th mô hình, dẫn đến các giá tr tương tự nhau Đây là cơ sở của quyết đ nh công nhận
- Bước 6: Công nhận
Để nhận biết rõ ràng là biểu đ mô hình có đ tương tự cao nhất với biểu
đ hình ảnh là ứng cử viên đư c công nhận Tuy nhiên, nếu giá tr tương tự tốt nhất là tương đối thấp, hệ thống có thể quyết đ nh rằng người trên hình ảnh thăm
dò không có trong thư viện mô hình nào cả; và nếu có nhiều hơn m t giá tr tương tự rất cao, hệ thống có thể quyết đ nh rằng người đó có nhiều khả năng nhất trong phòng trưng bày mô hình nhưng có m t số ứng cử viên có thể Ch khi điểm tương đ ng cao nhất là cao và điểm tiếp theo thấp thì hệ thống có thể nhận diện khuôn mặt trên hình ảnh thăm dò với đ tin cậy cao [10]
Trang 15[10]
1.2.2 Linear Discriminate Analysis
Phương pháp phân t ch lớp tuyến t nh LDA là m t phương pháp giảm chiều dữ liệu cho bài toán phân lớp Ý tưởng cơ bản của LDA là tìm m t không gian mới với số chiều nhỏ hơn không gian ban đầu sao cho hình chiếu của các điểm trong cùng m t lớp lên không gian mới này là gần nhau trong khi hình chiếu của các điểm của các lớp khác nhau là khác nhau V dụ bài toán phân lớp đối với 2 lớp như hình sau:
2: [1]
Nội dung thuật toán
Trong phương pháp LDA thường dùng sự phân bố ngoại và sự phân bố
n i làm tiêu ch để phân lớp Ma trận phân bố n i đư c t nh theo công thức:
Trang 16Sw= ∑ ∑ ( )( ) (1.1) Trong đó:
Trong đó là giá tr trung bình của tất cả các lớp
Không gian mới của LDA đƣ c hình thành từ tập vector W W1, W2, …,Wd] thỏa mãn:
W=argmax= |
Ma trận phân bố n i biểu diễn sự phân bố gần nhau của các ảnh trong các lớp còn ma trận phân bố ngoại s mô tả sự tách biệt của các lớp Khi các ảnh chiếu lên các vector của W, các ảnh s đƣ c phân bố gần nhau trong m i lớp và
s tách biệt giữa các lớp
Trong nhận dạng khuôn mặt, LDA dựa trên m t ph p chiếu tuyến t nh từ không gian hình ảnh vào m t chiều không gian thấp hơn bằng cách tối đa giữa các lớp tán xạ và giảm thiểu phân tán trong lớp Muốn xác đ nh m t hình ảnh kiểm tra đầu vào, hình ảnh thử nghiệm chiếu đƣ c so sánh với từng mẫu dự kiến
đào tạo, và hình ảnh kiểm tra đƣ c xác đ nh là hình ảnh đào tạo gần nhất
1.2.3 Principal Component Analysis:
PCA là m t thuật toán làm giảm số chiều của dữ liệu bằng cách đi tìm m t không gian mới sao cho thông tin của dữ liệu chủ yếu tập trung ở m t vài tọa đ , phần còn lại ch mang m t lƣ ng nhỏ thông tin Không gian mới này có số chiều nhỏ hơn số chiều của không gian cũ và trên m i trục tọa đ , đ biến thiên của dữ liệu là lớn nhất có thể, các trục tọa đ trong không gian mới luôn trực giao đôi
m t với nhau, mặc dù trong không gian ban đầu các trục có thể không trực giao
Trang 17Trong không gian mới các liên kết tiềm ẩn của dữ liệu có thể đư c khám phá, mà nếu đặt trong không gian cũ thì khó phát hiện vì những liên kết này không thể hiện rõ
Phương pháp PCA có ưu điểm là có thể tìm đư c các đặc t nh tiêu biểu của đối tư ng mà không cần phải xác đ nh các thành phần và mối quan hệ giữa chúng, thuật toán thực hiện tốt đối với các ảnh có đ phân giải cao và có khả năng kết h p với m t số thuật toán khác để nâng cao hiệu quả nhận dạng.Tuy nhiên, PCA cũng t n tại như c điểm như: nhạy với nhiễu, và vì PCA phân loại theo chiều phân bố lớn nhất của dữ liệu mà trong m t số trường h p thì chiều phân bố lớn nhất không phải lúc nào cũng đạt hiệu quả nhất V dụ dễ thấy nhất thể hiện trong hình 1, ta thấy khi chiếu dữ liệu lên d1 chiều phân bố lớn của dữ liệu thì m t số điểm của 2 lớp s b ch ng lấn lên nhau trong khi nếu chiếu dữ liệu lên d2 chiều gần với các thành phần phụ thì việc phân lớp rõ ràng, hiệu quả hơn
Quan sát hình sau chúng ta thấy rõ hơn ý tưởng của PCA :
3 [6]
1.3 Tổng quan về tình hình nghiên cứu
1.3.1 Tình hình nghiên cứu trong nước
Hiện nay, ở Việt Nam có khá nhiều nghiên cứu về thuật toán PCA, về nhận dạng khuôn mặt hoặc cả hai Trong đó phải kể đến sản phẩm đạt giải nhất
cu c thi “Sáng tạo trẻ Bách khoa 2017” có tên là “Hệ thống nhận dạng khuôn
Trang 18mặt BKFace”, nhận diện khuôn mặt ch nh xác 96% của các bạn sinh viênkhoa Công nghệ thông tin, ĐH Bách khoa Hà N i: Trần Trung Hiếu, Lê Trần Bảo Cương và Nguyễn Tiến Thạo Ngoài ra còn có nhiều công trình nghiên cứu là các luận văn, luận án về thuật toán PCA ứng dụng trong nhận dạng ảnh, nhận dạng chữ ký tay, nhận dạng biển số xe,…và các bài báo khoa học
1.3.2 Tình hình nghiên cứu ngoài nước
Trên thế giới có rất nhiều nghiên cứu về lĩnh vực này và đư c ứng dụng khá r ng rãi M t số tác phẩm hay thường đư c dùng làm tài liệu tham khảo của các tác giả nước ngoài như “Face Recognition using Principle Component Analysis” của Kyungnam Kim thu c University of Maryland College park, hay tác giả M.G.Kresimir Delac với “PCA and LDA based Neural Networks for Human Face Recognition”,…
Các hãng công nghệ lớn như Microsft, Google, Facebook, Oppo, Apple,… cũng đã ứng dụng nhận diện khuôn mặt vào các sản phẩm của họ Nhiều nghiên cứu thực nghiệm đư c triển khai trên thế giới như quản lý du khách, tài khoản thẻ ATM ở Trung Quốc, quản lý khách ở sân bay Đức, Australia, quản lý an ninh tại Mỹ,…
Trang 19CHƯƠNG 2 THUẬT TOÁN PCA VÀ ỨNG DỤNG TRONG NHẬN DẠNG KHUÔN MẶT 2.1 Thuật toán PCA
2.1.1 Giới thiệu
M t số khái niệm toán học sử dụng trong thuật toán PCA:
Kỳ vọng và phương sai:
+ K vọng: là trung bình c ng của toàn b các giá tr dữ liệu;
Phương sai: là trung bình c ng của bình phương khoảng cách từ m i điểm tới
k vọng, là đ đo mức đ biến thiên của m t biến ngẫu nhiên
V dụ: Cho M giá tr x1, x2, …, xM thì k vọng và phương sai của b dữ liệu này lần lư t là:
Ma trận hiệp phương sai:
+ Hiệp phương sai là đ đo sự biến thiên cùng nhau của hai biến ngẫu nhiên
Ma trận hiệp phương sai: là ma trận mà các phần tử là hiệp phương sai
∑(
̅)( ̅) ̂ ̂
Trong đó ̂ đư c tạo bằng cách trừ m i c t của X đi ̅
Ma trận hiệp phương sai là m t ma trận đối xứng nửa xác đ nh dương, mọi phần tử trên đường ch o là các số không âm, chúng cũng ch nh là các phương sai của từng chiều dữ liệu
Trị riêng và vector riêng:
Trang 20Giả sử A Cm x m là ma trận vuông cấp m
Đa thức đặc trưng của ma trận A là: PA( )= det(A- ), nghiệm của đa thức này
là giá tr riêng của ma trận A
Vector u Cm gọi là vector riêng ứng với tr riêng C nếu Au= u
Các tính chất của vectơ riêng:
- Ch các ma trận vuông n x n mới có vectơ riêng.
- Không phải mọi ma trận vuông đều có vectơ riêng.
- Nếu 1 ma trận vuông n x n có vectơ riêng thì s có n vectơ riêng.
- Nếu nhân vectơ riêng với 1 số thì kết quả sau khi nhân với ma trận chuyển đổi, vectơ kết quả vẫn là vectơ ban đầu
- Tất cả các vectơ riêng của 1 ma trận đều trực giao với nhau
2.1.2 Thuật toán PCA
Như ta đã biết, mục tiêu của PCA là tìm m t không gian mới với số chiều nhỏ hơn không gian cũ Các trục tọa đ trong không gian mới đư c xây dựng sao cho trên m i trục tọa đ thìđ biến thiên của dữ liệu là lớn nhất Phương pháp PCA s biễu diễn dữ liệu đa chiều lên m t không gian có cơ sở trực giao, có nghĩa là khi ta xem m i cơ sở trong không gian mới là m t biến thì hình ảnh của
dữ liệu gốc trong không gian mới này s đư c biểu diễn thông qua các biến đ c lập Phương pháp PCA s tìm không gian mới với tiêu ch cố gắng phản ánh
đư c càng nhiều thông tin gốc càng tốt, điều này đư c thể hiện trong khái niệm phương sai mà ta đã tìm hiểu trong mục trước Và do các biến trong không gian mới là đ c lập nên ta có thể t nh toán đư c t lệ giải th ch phương sai của từng biến mới đối với dữ liệu, điều này cho ph p ta cân nhắc việc ch dùng số t các biến để giải th ch dữ liệu Việc giảm số chiều của dữ liệu s giúp chúng ta thực hiện các ph p t nh toán đơn giản và thuận tiện hơn mà vẫn giữ đư c bản chất của
nó
Cho ma trận X g m M điểm dữ liệu, n i dung của thuật toán PCA bao g m các bước sau: