1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Báo cáo xử lý ảnh, mặt

12 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nhận Diện Khuôn Mặt
Tác giả Phạm Phong Pôn
Người hướng dẫn PGS. TS. Lê Hoàng Thái
Trường học Học viện Công nghệ Bưu chính Viễn thông Cơ sở tại Thành phố Hồ Chí Minh
Chuyên ngành Công nghệ Thông tin
Thể loại Báo cáo xử lý ảnh, mặt
Năm xuất bản 2023
Thành phố Thành phố Hồ Chí Minh
Định dạng
Số trang 12
Dung lượng 634,74 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Nhận diện khuôn mặt thông minh là các giải pháp sử dụng trí thông minh nhân tạoAL để phát hiện khuôn mặt từ hình ảnh hoặc video được ghi nhận bởi camera, so khớp với các hình ảnh khuôn m

Trang 1

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

CƠ SỞ TẠI THÀNH PHỐ HỒ CHÍ MINH

KHOA CÔNG NGHỆ THÔNG TIN II

MÔN HỌC: XỬ LÝ ẢNH

ĐỀ TÀI : NHẬN DIỆN KHUÔN MẶT

Giảng viên hướng dẫn : PGS TS Lê Hoàng Thái

Thực hiện báo cáo : Phạm Phong Pôn- N18DCCN145

Lớp: D18CQCN01-N

Trang 2

I:MỞ ĐẦU

I Giới Thiệu:

Một số công nghệ sinh trắc học đang được nhen nhóm phát triển, trong

đó có “Nhận diện khuôn mặt” Theo đó, sự xuất hiện của công nghệ này làm dấy lên làn sóng quan tâm

cũng như phản ứng rất lớn Chúng ta cùng tìm hiểu vấn đề này ngay sau

đây Với trí tuệ nhân tạo, nhận dạng khuôn mặt chắc chắn là công nghệ kỹ

thuật số có ý nghĩa rất lớn đối với các công ty, tổ chức - và đặc biệt là các

chính phủ Nhận diện khuôn mặt thông minh là các giải pháp sử dụng trí thông minh

nhân tạo(AL) để phát hiện khuôn mặt từ hình ảnh hoặc video được ghi

nhận bởi camera, so khớp với các hình ảnh khuôn mặt có sẵn trong cơ sở

dữ liệu khuôn mặt được lưu trước đó Những năm gần đây việc ứng dụng trí tuệ nhân tạo (AL) trong các ngành

đã trở nên phổ biến và dần thay thế con người để phục vụ cuộc sống tốt

hơn.Hiện tại ứng dụng công nghệ nhận diện trong các giải pháp trong các

giải pháp trong thực tế ngày càng nhiều hơn Trong thực tế, quá trình nhận diện bao gồm 2 quá trình chính là Face

Detection (Tạm gọi là Phát hiện khuôn mặt) và Face Recognization

(Nhận diện khuôn mặt) Mỗi quá trình lại sử dụng những thuật toán khác

nhau

1) Face Detection: Đây là quá trình phát hiện khuôn mặt trong ảnh Các

máy ảnh, camera smartphone hiện tại đều có chức năng này

2) Face Recognition: Đây mới là quá trình “nhận diện khuôn mặt” Từ

kết quả của phase trước, ta đã có các khuôn mặt trong ảnh Các khuôn

mặt này sẽ lần lượt được so sánh với các khuôn mặt đã có trong cơ sở

Trang 3

dữ liệu để tìm khuôn mặt giống nhất Và sau đây chúng ta hãy đi sâu vào “NHẬN DIỆN KHUÔN MẶT”

II Phát Hiện Khuôn Mặt

Có khá nhiều cách để phát hiện khuôn mặt: Thông qua màu sắc, cử động

hoặc qua góc cạnh trong ảnh, Tuy nhiên, thuật toán được sử dụng phổ

biến nhất hiện nay là Viola-Jones (Thư viện OpenCV hỗ trợ nhận diện

khuôn mặt theo thuật toán này) Thuật toán này ở chỗ nó không chỉ nhận diện được khuôn mặt mà còn có

thể nhận diện được đồ vậy, hình dạng Cơ chế của nó khá đơn giản:

 Tạo ra một frame hình vuông, lần lượt di chuyển frame này khắp

tấm ảnh gốc

 Mỗi khi frame di chuyển, kiểm tra xem khu vực trong frame có

phải là khuôn mặt hay đồ vật hay không (Bằng cách kiểm tra các vùng

sáng tối trong frame)

 Sau khi di chuyển hết tấm ảnh, tăng kích cỡ frame lên và quét lại từ

đầu

 Dừng thuật toán khi frame đủ lớn

Nghe đơn giản vậy, nhưng đi sâu vào nghiên cứu các bạn sẽ thấy nó khá

rắc rối với các thuật ngữ như: Haar Feature, Adaboost Training Hệ thống

phải được train với vài ngàn đến vài chục ngàn tấm ảnh để tìm ra đặc

điểm của khuôn mặt người Tóm lại, dữ liệu đầu vào của quá trình này là một tấm ảnh Dữ liệu đầu ra

là vị trí và kích cỡ của các khuôn mặt trong ảnh Phương pháp nhận diện khuôn mặt Viola-Jones được sử dụng.Phương

pháp phát hiện đối tượng Viola-jones được đề xuất bởi Paul Viola và

Michael Jones năm 2001 Phương pháp này có tác động nhiều nhất trong

những năm 2000 và được gọi là đối tượng đầu tiên khung phát hiện để

Trang 4

cung cấp khả năng phát hiện đối tượng có liên quan có thể chạy trong

thời gian thực Viola-Jones yêu cầu toàn cảnh trực diện các mặt thẳng

đứng Ở cấp độ cao, phương thức đọc đầu vào hình ảnh với một cửa sổ

tìm kiếm các đặc điểm khuôn mặt người Khi nào đủ các tính năng được

tìm thấy, sau đó loại cửa sổ này của hình ảnh được báo cáo là một khuôn

mặt Để mang lại kích thước khác nhau mặt, cửa sổ phải được thu nhỏ và

quá trình này được lặp lại Đối với mỗi tỷ lệ cửa sổ liên quan đến thông

qua phương pháp riêng của các thang đo khác Phương pháp này xảy ra là

khá tốn thời gian do tính toán kích thước hình ảnh khác nhau Để giảm số

lượng các tính năng mỗi cửa sổ phải kiểm tra và mỗi cửa sổ được chuyển

qua các cấp độ Các cấp độ đầu tiên bao gồm ít tính năng hơn để kiểm tra

và dễ dàng vượt qua hơn nhiều nhưng các cấp độ sau sẽ có nhiều hơn

các tính năng và yêu cầu cao hơn Ở mỗi cấp độ, đánh giá các tính năng

cho các cấp đó được thu thập và liệu nếu giá trị đã thu thập không vượt

qua ngưỡng, mức là không thành công và cửa sổ này sẽ không được nhận

dạng là một khuôn mặt Các Phương pháp nhận diện khuôn mặt Viola- Jones được chia thành ba các phần (Hình ảnh tích phân, học bộ phân loại

với AdaBoost và cấu trúc tầng có chủ ý) giúp có thể xây dựng một nhận

diện khuôn mặt thành công có thể được sử dụng trong thời gian thực ứng

dụng

III Ảnh tích hợp

1 Định nghĩa ảnh tích hợp( Integral image)

Như đã trình bày ở phần trên, số lượng đặc trưng Haar-like là rất nhiều và khối

Trang 5

lượng tính toán giá trị các đặc trưng này là rất lớn Vì vậy ảnh tích hợp được đưa ra nhằm tính toán nhanh chóng các đặc trưng, giảm thời gian xử lý

Ảnh tích hợp được định nghĩa theo công thức:

Giá trị của ảnh tích hợp tại vị trí (x,y) là tổng các điểm ảnh thuộc hình chữ nhật xác định bởi góc trái trên là (0,0) và góc phải dưới (x,y)

Trên thực tế khi chuyển một ảnh thành ảnh tích hợp ta dùng công thức truy hồi sau:

Ví dụ chuyển một ảnh 3x3 có giá trị xám như bên dưới thành ảnh tích hợp:

Trang 6

Sau khi chuyển ảnh cần nhận dạng thành ảnh tích hợp, viêc tính toán giá trị các đặc trưng Haar-like sẽ rất đơn giản

2 Áp dụng tính toán đặc trưng Haar-like

Để tính giá trị đặc trưng Haar-like,ta phải tính được tổng giá trị điểm ảnh trong một vùng hình chữ nhật trên ảnh Ví dụ như vùng D trong hình vẽ:

Với :A,B,C,D là tổng giá trị các điểm ảnh trong từng vùng

P1,P2,P3,P4 là giá trị của ảnh tích hợp tại 4 đỉnh của D

Nếu như là ảnh xám bình thường thì để tính D ta phải tính tổng tất cả các giá

trị điểm ảnh trong D, miền D càng lớn thì số phép cộng càng nhiều Nhưng với ảnh tích hợp dù miền D có kích thước như thế nào thì D cũng chỉ cần tính thông qua 4 giá

trị tại 4 đỉnh

Ta có: P1 = A, P2 = A + B, P3 = A + C, P4 = A + B + C + D

Suy ra:

P1+ P4–P2–P3= A + (A + B + C + D) – (A + B) – (A + C) = D

Vậy ta có: D = P1 + P4 – P2 – P3

Khi áp dụng vào tính toán các giá trị đặc trưng ta có thể thấy:

Đặc trưng hai hình chữ nhật(đặc trưng cạnh) được tính thông qua 6 giá trị điểm ảnh tích hợp

Trang 7

Đặc trưng ba hình chữ nhật(đặc trưng đường) và đặc trưng tâm-xung quanh

được tính thông qua 8 giá trị điểm ảnh tích hợp

Đặc trưng 4 hình chữ nhật(đặc trưng chéo) được tính thông qua 9 giá trị điểm ảnh tích hợp

Trong khi đó nếu tính như định nghĩa thì các giá trị cần tính toán lên tới hàng trăm Điều này làm tăng tốc độ xử lý một cách đáng kể

3 AdaBoost

AdaBoost là một phương pháp thúc đẩy học máy có khả năng

tìm một giả thuyết có độ chính xác cao bằng cách kết hợp nhiều

mỗi giả thuyết tuần với độ chính xác trung bình AdaBoost

phương pháp này thường được xem là bước đầu tiên đi thẳng vào

các phương pháp thúc đẩy thực tế

4 Cấu Trúc Tầng

Việc phân loại các bộ phân loại phức tạp hơn dần dần đạt được

tỷ lệ phát hiện thậm chí tốt hơn Khái niệm về Viola-Jones phương pháp

nhận diện khuôn mặt là quét máy dò thường xuyên bằng cùng một hình

ảnh mỗi lần với một kích thước mới Bất kể một hình ảnh phải chứa một

hoặc nhiều khuôn mặt, không có nghi ngờ gì rằng một lượng lớn cửa sổ

phụ được đánh giá quá lớn có thể vẫn không phải là khuôn mặt Bộ phân

loại Cascade bao gồm mỗi cấp có chứa một bộ phân loại mạnh Trách

nhiệm của mỗi cấp độ để đánh giá xem một cửa sổ phụ nhất định có thực

sự là không mặt hoặc có thể là một khuôn mặt Việc triển khai có 22

cấp độ với các cấp độ đầu chứa ít tính năng hơn và sau đó các cấp có

chứa các tính năng chi tiết chuyên sâu hơn Thông thường, các cấp độ đầu

Trang 8

được thông qua thường xuyên hơn với các cấp độ sau đòi hỏi nhiều hơn

III.Trích Xuất Đặc Trưng

“Khai thác tính năng liên quan đến việc giảm lượng tài nguyên cần thiết

để mô tả một lượng lớn dữ liệu Đặc tính trích xuất từ dữ liệu đã cho là một vấn đề quan trọng đối với ứng dụng thành công máy học Trong công việc này PCA và LDA được sử dụng làm tính năng trích xuất và thứ nguyên phương pháp giảm từ các hình ảnh khuôn mặt ban đầu PCA và LDA tạo ra các vectơ đặc trưng theo một chiều giảm.”

1) Phân Tích Thành Phần(PCA)

Phân tích thành phần chính (PCA) là một trong những các phương pháp quan trọng được sử dụng trong nhận dạng mẫu và nén PCA là trích xuất tính năng và thứ nguyên phương pháp khử PCA là một phương pháp

thống kê phổ biến sử dụng cách tiếp cận toàn diện để tìm các mẫu ở chiều cao dữ liệu Mục đích của PCA bắt nguồn từ thông tin cách tiếp cận lý thuyết, chia nhỏ hình ảnh khuôn mặt thành tập hợp các hình ảnh tính năng đặc trưng được gọi là Eigenfaces mà được sử dụng để đại diện cho cả khuôn mặt hiện có và khuôn mặt mới Trong PCA phương pháp, ma trận hình ảnh khuôn mặt 2 chiều phải là chuyển thành vectơ 1 chiều 1 chiều vectơ có thể là vectơ hàng hoặc vectơ cột Kết quả là, biểu diễn hình ảnh dẫn đến một không gian nhiều chiều Phương pháp PCA Các bước như sau:

Trang 9

a Tập hợp huấn luyện của tổng số M hình ảnh được sử dụng để tính

toán Trung bình có nghĩa như thể hiện trong phương trình dưới đây:

b Hình ảnh ban đầu sẽ bị trừ khỏi mức Trung bình được trình bày như thể hiện trong phương trình dưới đây:

c Tính toán ma trận phương sai như được hiển thị trong phương trình

dưới đây:

d Tính Eigenvalues và Eigenvector của Ma trận hiệp phương sai

e Sắp xếp và chọn các giá trị Eigen tốt nhất Cao nhất Các Eigenvalues thuộc một nhóm Eigenvectors được chọn,M Eigenvectors này mô tả

các Eigenfaces Cho rằng mới các khuôn mặt gặp phải, các

Eigenfaces có thể được cập nhật hoặc tính toán lại cho phù hợp

f Chiếu các mẫu đào tạo lên Eigenface

2) Phân Biết Phân Biệt Tuyến Tính(LDA)

Phân tích phân biệt tuyến tính (LDA) còn được gọi là Phương pháp mặt

cá được sử dụng để khắc phục nhược điểm PCA của nó ứng dụng được

lưu giữ trong cơ sở dữ liệu hình ảnh nhỏ Nó đạt được bởi chiếu hình ảnh lên không gian Eigenface bằng PCA sau khi triển khai LDA thuần túy trên nó để phân loại Eigenface dữ liệu chiếu không gian LDA tìm kiếm các vectơ đó trong không gian bên dưới phân biệt đối xử tốt nhất giữa các lớp Các hình ảnh nhóm LDA của cùng một lớp và tách các hình ảnh của các lớp khác nhau Về mặt toán học, hai thước đo được xác định (ma trận

Trang 10

phân tán bên trong lớp và giữa ma trận phân tán lớp) Đối với tất cả các mẫu của tất cả các lớp, sự phân tán giữa các lớp ma trận SB và ma trận phân tán bên trong lớp SW được xác định như được hiển thị trong các phương trình dưới đây:

Ở đâu là mẫu của lớp n, là giá trị trung bình của lớp n, N là số lớp, là số mẫu trong lớp n và u là giá trị trung bình của tất cả các lớp Sau đó không gian con cho LDA được bao trùm bởi một tập các vectơ

W=[W1,W2,W3, ,WM ]

Mục tiêu là để tối đa hóa sự đo lường giữa các lớp trong khi giảm thiểu các biện pháp trong lớp Hình 5 cho thấy khi tối đa hóa tỷ lệ giữa phương sai lớp trong phương sai lớp sẽ tìm thấy sự phân tách lớp tốt Để làm điều này chúng tôi tối đa hóa tỷ lệ để chứng minh rằng nếu

SW không phải là ma trận số ít Ma trận phân tán lớp với biểu thị cách hình ảnh khuôn mặt được phân phối chặt chẽ với các lớp trong và ma trận phân tán giữa các lớp mô tả cách các lớp cách xa nhau Khi hình ảnh khuôn mặt được chiếu vào vectơ phân biệt W Hình ảnh khuôn mặt phải được phân phối chặt chẽ với các lớp trong và phải được tách biệt giữa các lớp càng nhiều càng tốt Nói cách khác, những vectơ phân biệt thu nhỏ mẫu số và cực đại tử số

IV ĐO KHOẢNG CÁCH

Sau khi các tính năng được trích xuất và chọn bằng PCA LDA, bước tiếp theo là đo khoảng cách giữa các hình ảnh Hầu hết các phương pháp nhận dạng khuôn mặt từ thập kỷ trước đều giúp quyết định theo số đo khoảng cách Khoảng cách giữa hai hình ảnh là một mối quan tâm chính trong nhận dạng hình ảnh và thị giác máy tính Bước cuối cùng của nhận dạng khuôn mặt là đo khoảng cách giữa hai ảnh Hình ảnh giống nhau là

khoảng cách giữa các vectơ của hai ảnh Các khoảng cách giữa các biểu

Trang 11

diễn không gian đối tượng được sử dụng làm cơ sở cho các quyết định công nhận Cách này hay cách khác, đo khoảng cách có tác động lớn

trong nhận dạng khuôn mặt khu vực Phương pháp đo khoảng cách được

sử dụng trong nhiều lĩnh vực như tài chính, khai thác dữ liệu, nhận dạng giọng nói và tín hiệu giải mã Khoảng cách Euclide được sử dụng để đo khoảng cách giữa các hình ảnh Khoảng cách Euclide được định nghĩa là đường thẳng khoảng cách

đường thẳng giữa hai điểm, kiểm tra gốc của sự khác biệt bình phương giữa các tọa độ của một cặp đối tượng Khoảng cách Euclide có thể được tính bằng phương trình phía dưới:

Nếu không có căn bậc hai, chúng ta có thể có được Bình phương Đo

khoảng cách Euclid (SED) Tiêu chuẩn Khoảng cách Euclide có thể được bình phương để đặt trọng lượng lớn dần lên các vật ở xa nhau Trong

trường hợp này, phương trình trở thành như hình dưới đây:

V TỔNG KẾT:

Trong phân tích này, ba cơ sở dữ liệu (MUCT, Face94, và

Nhận mặt) được sử dụng để đánh giá hiệu suất của hệ thống Trong

Cơ sở dữ liệu MUCT, 8 cá nhân với 1 đến 3 đào tạo và thử nghiệm

hình ảnh cho mỗi cá nhân được sử dụng Trong khi, trong Face94 và

Cơ sở dữ liệu nhận mặt , 8 cá nhân được đào tạo từ 1 đến 4 và hình ảnh thử nghiệm cho mỗi cá nhân được sử dụng Mô phỏng của phương pháp

đề xuất đã được thực hiện bằng MATLAB gói phần mềm Phân tích cho thấy rằng việc tăng số lượng hình ảnh đào tạo sẽ tăng tỷ lệ nhận dạng Phương pháp Viola-Jones được sử dụng để phát hiện khuôn mặt trên mỗi

cơ sở dữ liệu Phương pháp này đạt được tỷ lệ phát hiện cao và tất cả hình ảnh được phát hiện và cắt trong ba cơ sở dữ liệu Nhân vật 6 hiển thị phát

Trang 12

hiện và cắt ảnh mẫu bằng phương pháp Viola Jones

Ngày đăng: 11/10/2022, 17:31

HÌNH ẢNH LIÊN QUAN

Giá trị của ảnh tích hợp tại vị trí (x,y) là tổng các điểm ảnh thuộc hình chữ nhật xác định bởi góc trái trên là (0,0) và góc phải dưới (x,y) - Báo cáo xử lý ảnh, mặt
i á trị của ảnh tích hợp tại vị trí (x,y) là tổng các điểm ảnh thuộc hình chữ nhật xác định bởi góc trái trên là (0,0) và góc phải dưới (x,y) (Trang 5)
Đặc trưng hai hình chữ nhật(đặc trưng cạnh) được tính thơng qua 6 giá trị điểm ảnh tích hợp - Báo cáo xử lý ảnh, mặt
c trưng hai hình chữ nhật(đặc trưng cạnh) được tính thơng qua 6 giá trị điểm ảnh tích hợp (Trang 6)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

  • Đang cập nhật ...

TÀI LIỆU LIÊN QUAN

w